CN111465688A - 羧酸酯酶催化剂 - Google Patents

羧酸酯酶催化剂 Download PDF

Info

Publication number
CN111465688A
CN111465688A CN201880080941.7A CN201880080941A CN111465688A CN 111465688 A CN111465688 A CN 111465688A CN 201880080941 A CN201880080941 A CN 201880080941A CN 111465688 A CN111465688 A CN 111465688A
Authority
CN
China
Prior art keywords
residue
carboxylesterase
group
polypeptide
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880080941.7A
Other languages
English (en)
Inventor
K.K.布朗
B.M.多尔
D.E.富尔斯特
K.J.霍尼克尔
L.S.乔丹
J.P.莫里森
N.V.普洛特尼科夫
M.肖伯
R.沃拉德里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GlaxoSmithKline Intellectual Property Development Ltd
Original Assignee
GlaxoSmithKline Intellectual Property Development Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GlaxoSmithKline Intellectual Property Development Ltd filed Critical GlaxoSmithKline Intellectual Property Development Ltd
Publication of CN111465688A publication Critical patent/CN111465688A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/165Heterorings having nitrogen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/01001Carboxylesterase (3.1.1.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开内容提供了具有催化酰胺键形成的能力的工程化羧酸酯酶。还提供了编码羧酸酯酶的多核苷酸、能够表达工程化羧酸酯酶的宿主细胞、以及使用工程化羧酸酯酶制备商业上有价值的酰胺的方法。还提供了使用工程化羧酸酯酶制备的酰胺。

Description

羧酸酯酶催化剂
发明领域
本公开内容涉及改善的羧酸酯酶生物催化剂和使用该生物催化剂制备酰胺的方法。
发明背景
酰胺键形成是有机合成中最常遇到的反应之一,并且酰胺通常在活性药物成分、生物活性分子、合成聚合物、肽和蛋白质中发现。诺华生物医学研究所(NovartisInstitute for BioMedical Research)的一项研究发现,在过去40年中,酰胺键形成和相关的酰化化学成分占药物合成中进行的所有化学反应的21.3%(Schneider,et al.,J.Med.Chem.59,4385-4402,2016)。酰胺合成的传统方法使用羧酸和胺底物,并需要化学计量的偶联剂。当反应通过高反应性的活化中间体进行时,可发生不想要的副反应,从而导致形成不想要的副产物,例如尿素。较差的原子经济性和产生的大量(含金属的且经常有毒的)废物导致昂贵的酰胺形成方法。传统酰胺合成方法的其他缺点包括缺乏对映选择性和化学选择性、使用爆炸性或毒性偶联剂、以及需要保护反应物中存在的其他官能团。
已经开发出化学催化方法,其消除对化学计量偶联试剂的需求,从而提高原子经济性并减少产生的废物量(综述于Pattabiraman and Bode,Nature,480,471-479,2011和de Figueiredo,et al.,Chemical Reviews,12029-12122,2016)。硼酸催化代表了化学酰胺化的最古老方法,其中通过芳基硼酸酯的瞬时羧酸活化实现酰胺催化形成。但是,除了底物范围有限和经常需要高温之外,这些方法遭受极差的溶剂耐受性,这限制了它们的较广泛应用。最近的研究包括使用金属催化的酰胺化,其中金属盐充当路易斯酸,用于羧酸的瞬时活化以支持酰胺化。迄今为止,这些研究遭受与硼酸酯催化相同的许多缺点,需要高温,催化剂负载以及有限的溶剂范围和底物耐受性。还研究了使用N-杂环卡宾类(NHC)或金属催化剂的基于氧化还原的方法,该方法能够将醇、醛、酮或腈氧化转化为相应的酰胺类。不幸的是,金属催化剂和NHC催化剂两者是昂贵的,它们本身具有相当的毒性,经常需要有害的助溶剂,并且通常遭受差的官能团耐受性。
脂肪酶已被用作生物催化剂,以通过直接活化,然后将酯原料与胺偶联,从而在有机溶剂中产生酰胺键。有利地,这些酶通常是高度对映选择性且耐热的(对于综述,参见Gotor,BioorgMed Chem,7,2189-2197,1999)。然而,目前大多数研究的脂肪酶似乎具有较窄的底物特异性,此外,必须在干燥的有机溶剂中使用以防止不想要的水解。此种特异性问题在叔酰胺的合成中尤为明显,其中显示了很少的酶具有甚至边缘的活性(在van Pelt,Green,Chem.13,1791-1798,2011中研究)。
为了克服此类限制,通常,采用定向进化的方法,其中以高通量的方式表达和研究酶变体。但是,这些酶通常源自假单胞菌(Pseudomonas)或芽孢杆菌属(Bacillus)菌株,并且不能在存在稳健的遗传操作技术的实验室菌株如大肠杆菌(E.coli)或酿酒酵母(S.cerevisiae)中轻易表达。另外,由于细胞裂解物的高水含量和并行干燥数百个反应的技术挑战,对干燥溶剂和分子筛的需求使得定向进化极具挑战性。
附图简述
图1显示了编码野生型羧酸酯酶,酸热脂环酸杆菌(A.acidocaldarius)酯酶2,经大肠杆菌密码子优化的多核苷酸序列(SEQ ID NO:1)相对于编码下表3提及并且在以下序列表中显示的工程化羧酸酯酶的每种多核苷酸序列(SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123和125)的序列比对。所有这些公开的多核苷酸序列彼此是95-99%相同的。
图2显示了源自野生型羧酸酯酶,酸热脂环酸杆菌酯酶2的多肽序列(SEQ ID NO:2)与下表3提及并且在以下序列表中显示的每种工程化多肽羧酸酯酶序列(SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124和126)的序列比对。所有这些公开的多肽序列彼此是95-99%相同的。
发明概述
鉴于现有技术的局限性,我们从高度耐热的野生型羧酸酯酶,酸热脂环酸杆菌酯酶2(SEQ ID NO:2)开发了一系列突变体,其中此类突变的酶相对于野生型酶拥有超过785,000倍改善的酰胺化活性。由于此种急剧改变的活性,这些突变体酶对水和醇具有相当大的耐受性,从而能够从简单的酯和胺前体大规模直接合成酰胺。此种直接合成的策略使酰胺的合成缩短1-2个化学步骤,减少有机溶剂的使用,并消除化学计量活化剂的使用,共同代表了对化学现有技术的极大改善。
本公开内容提供了多肽、编码该多肽的多核苷酸以及使用该多肽的方法,特别是用于在存在1-异丙基哌嗪(“胺底物”)的情况下将
Figure BDA0002539317960000031
唑-5-羧酸乙酯“(酯底物”)生物催化转化为(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000032
唑-5-基)甲酮“(产物”)。本公开内容还提供了多肽、编码该多肽的多核苷酸以及使用该多肽的方法,特别是用于在存在顺-2,6-二甲基吗啉(胺底物)的情况下,将
Figure BDA0002539317960000033
唑-5-羧酸乙酯(“酯底物”)酯底物生物催化转化为((2S,6R)-2,6-二甲基吗啉代)(
Figure BDA0002539317960000034
唑-5-基)甲酮(另一种产物)。产物是用于治疗慢性阻塞性肺疾病(COPD)的开发中感兴趣的药物的起始材料。特别地,产物可用于合成磷酸肌醇(phosphoinositide)3-激酶δ抑制剂(PI3Kδ抑制剂),其是用于治疗炎症、自身免疫性疾病和癌症的一类药物。本发明的组合物也可用作其他类型药物的起始材料。
如表3中证明,虽然野生型多肽,羧酸酯酶,酸热脂环酸杆菌酯酶2(SEQ ID NO:2)仅以非常低的效率(<1%的底物转化为产物)作用于酯底物,但本公开内容的工程化羧酸酯酶(EC 3.1.1)能够在存在胺底物的情况下将酯底物容易地转化为产物。因此,一方面,本公开内容涉及改善的羧酸酯酶,其能够在存在1-异丙基哌嗪(“胺底物”)的情况下以下述水平将酯底物
Figure BDA0002539317960000035
唑-5-羧酸乙酯转化为产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000036
唑-5-基)甲酮,所述水平通过分析技术(例如HPLC-UV吸光度)通过约0.1%的转化可测量。
在一些实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4所示的氨基酸序列或其功能片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的氨基酸序列,且其中改善的羧酸酯酶氨基酸序列包括以下特征:与X198对应的残基选自:非极性残基、芳香族残基和脂肪族残基。在下面的详细描述以及权利要求书中提供了用于选择可以在规定的残基位置上存在的各种氨基酸残基的指南。
在一些实施方案中,改善的羧酸酯酶多肽包含对应于SEQID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124或126所示的氨基酸序列的氨基酸序列。
在一些实施方案中,改善的羧酸酯酶多肽由SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124或126所示的氨基酸序列组成。
在一些实施方案中,本公开内容提供了包含SEQ ID NO:122所示的氨基酸序列的羧酸酯酶多肽。在另一个实施方案中,本公开内容提供了编码SEQ ID NO:122所示的羧酸酯酶多肽序列的多核苷酸序列。在又一个实施方案中,本公开内容提供了编码羧酸酯酶多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:121所示的多核苷酸序列。在又一个实施方案中,编码羧酸酯酶多肽的多核苷酸由SEQ ID NO:121所示的多核苷酸序列组成。
在另一方面,改善的羧酸酯酶多肽可用于制备酰胺的方法中,其中将组分组合,包含:(a)R1-COOR2形式的酯,其中R1选自:具有0至3个烷基取代基的sp3碳;和芳香环,和R2选自:甲基;乙基;和1-6个碳的烷基链;(b)胺底物;(c)改善的羧酸酯酶多肽,其包含与SEQ IDNO:4所示的氨基酸序列或其功能片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的氨基酸序列,其中所述羧酸酯酶多肽氨基酸序列包括以下特征:与SEQ ID NO:4中的X198对应的残基选自:非极性残基、芳香族残基和脂肪族残基;和(d)溶剂。
发明详述
本公开内容提供了高效的生物催化剂,其能够介导涉及某些酰胺基受体的酰胺化的转化,例如式III化合物的合成。生物催化剂是工程化的酰胺化多肽,其可在式II的胺底物1-(异丙基哌嗪)存在下将式I的底物
Figure BDA0002539317960000053
唑5-羧酸乙酯(“酯底物”)转化为式III的产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000052
唑5-基)甲酮(“产物”):
Figure BDA0002539317960000051
在某些实施方案中,工程化羧酸酯酶源自酸热脂环酸杆菌酯酶2的天然存在的羧酸酯酶,其是通过酰基酶中间胺的形成和拆分催化酯水解的羧酸酯酶。SEQ ID NO:4的羧酸酯酶与源自野生型羧酸酯酶的天然存在的酶,酸热脂环酸杆菌酯酶2(SEQ ID NO:2)的不同之处在于,在第X198位残基处的谷氨酸(E)被亮氨酸(L)取代,并且对酯底物
Figure BDA0002539317960000054
唑5-羧酸乙酯(式I)具有可测量的活性。已经对SEQ ID NO:4的羧酸酯酶进行了工程化改造,以介导在胺底物,例如1-异丙基哌嗪(式II)的存在下式I.的酯底物向式III的产物的有效转化。转化可以在温和的条件下(30℃以高%转化)进行,使得该方法适用于大量生产式III和式V的酰胺。
缩写和定义
出于本文描述的目的,用于遗传编码的氨基酸的缩写是常规的,并且如下表1所示:
表1
Figure BDA0002539317960000061
当使用三字母缩写时,除非明确在前面加上“L”或“D”,或者从使用缩写的上下文中清楚得知,否则氨基酸可以是关于α-碳(Cα)的L-或D-构型。例如,尽管“Ala”表示丙氨酸而不指定关于碳原子的构型,但是“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸,“a”表示D-丙氨酸。当肽序列以单字母或三字母缩写(或它们的混合物)的串形式显示时,该序列按照惯例在N→C方向上显示。
除非另外特别定义,否则本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义。因此,以下术语旨在具有以下含义。本文提及的所有美国专利和公布的美国专利申请,包括在此类专利和专利申请中公开的所有序列,均明确地通过引用并入。
“酸副产物”或“水解副产物”是指由羧酸酯酶引起的酯底物与水反应产生的羧酸。酸副产物是通式(3)的分子,其中R3为–H。上文描述了R1
Figure BDA0002539317960000071
“酸性氨基酸或残基”是指当氨基酸包含在肽或多肽中时表现出pK值小于约6的侧链的亲水性氨基酸或残基。由于失去氢离子,酸性氨基酸通常在生理pH下具有带负电的侧链。在遗传上,编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
“烷基”旨在包括直链或支链构型的指定长度的烷基。示例性的烷基是甲基、乙基、丙基、异丙基、丁基、仲丁基、叔丁基、戊基、异戊基、己基、异己基等。烷基是未被取代的或被1-3个独立地选自以下的基团取代:卤素、羟基、羧基、氨基羰基、氨基、C1-4烷氧基和C1-4烷基硫基。
“酰胺”意指含有连接至氮原子的羰基的官能团。酰胺还指任何含有酰胺官能团的化合物。酰胺源自羧酸和胺。
“酰胺化物”或“酰胺化”意指从含羰基的化合物形成酰胺官能团,通常源自羧酸和胺官能团的反应,但在此也从酯和胺官能团形成。
“胺”意指包含sp3-杂化氮原子的官能团。胺还指任何含有胺官能团的化合物。
“胺底物”是指能够在羧酸酯酶的作用下置换酯底物的醇侧链,从而产生酰胺产物的氨基化合物。胺底物是通式(5)的分子,其中当独立地考虑时,R3和R4各自为未被取代或被至少一个酶促非抑制基团取代的烷基或芳基。当一起考虑时,R3和R4可形成未被取代、取代或稠合于其他环的环。可用于本发明的典型的胺底物包括但不限于环状哌嗪基或吗啉代部分,以及伯胺或芳香族胺。在本公开内容的上下文中,胺底物尤其包括式II的化合物,1-异丙基哌嗪和式IV的化合物,顺-2,6-二甲基吗啉。
Figure BDA0002539317960000081
如本文公开的多肽的上下文中使用的“氨基酸”或“残基”是指在序列位置处的特定单体(例如,P5表示在SEQ ID NO:2的第5位处的“氨基酸”或“残基”是脯氨酸。)
“氨基酸差异”或“残基差异”是指当与参考序列相比时在多肽序列的规定位置处的残基的变化。有时将存在特定氨基酸或氨基酸变化(“残基差异”)的多肽序列位置描述为“Xn”或“位置n”,其中n是指相对于参考序列的残基位置。
例如,参考序列具有丝氨酸的位置X8处的残基差异是指位置X8处的残基变为除丝氨酸以外的任何残基。如本文所公开的,酶可以包括相对于参考序列的一个或多个残基差异,其中多个残基差异通常由相对于参考序列进行改变的指定位置的列表指示(例如,“与SEQ ID NO:4相比在以下残基位置处的一个或多个残基差异:X27、X30、X35、X37、X57、X75、X103、X185、X207、X208、X271、X286或X296”)。
特定的取代突变,即用不同的指定残基替换参考序列中的特定残基,可以用常规符号“X(数字)Y”表示,其中X是参考序列中残基的单字母标识符,“数字”是参考序列中的残基位置,并且Y是工程化序列中残基取代的单字母标识符。
“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。
“芳香族氨基酸或残基”是指具有包含至少一个芳香族或杂芳香族环的侧链的亲水或疏水性氨基酸或残基。遗传编码的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管由于其杂芳香族氮原子L-His(H)的pKa,它有时被分类为碱性残基或芳香族残基,因为其侧链包含杂芳香族环,本文中组氨酸被分类为亲水性残基或“受约束的残基”(见下文)。
“芳基”意指芳香族基团,包括苯基和萘基。“芳基”是未取代的或被1-5个独立地选自氟、羟基、三氟甲基、氨基、C1-4烷基和C1-4烷氧基的取代基取代。
“碱基氨基酸或残基”是指当氨基酸包含在肽或多肽中时具有表现出大于约6的pKa值的侧链的亲水性氨基酸或残基。由于与水合氢离子缔合,碱性氨基酸通常在生理pH下具有带正电的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
“羧酸酯酶”用于指具有将酯底物(1)的侧链与供体化合物(2)的侧链相互转化,将酯底物(1)转化为其相应的酯产物(3)和酯侧链的游离醇形式(4)的酶促能力的多肽。
Figure BDA0002539317960000091
“密码子优化的”是指编码蛋白质的多核苷酸的密码子至在特定生物体中优先使用的那些密码子的改变,从而使编码的蛋白质在目的生物体中有效表达。尽管遗传密码是简并性的,因为大多数氨基酸由几个密码子表示,称为“同义词”或“同义”密码子,但众所周知,特定生物体的密码子选择是非随机的,并且偏向于特定的密码子三联体。就给定的基因、共同功能或祖先的基因、高表达的蛋白质相对于低拷贝数的蛋白质、以及生物体基因组的总蛋白编码区而言,该密码子选择偏倚可能更高。在一些实施方案中,可以对编码羧酸酯酶的多核苷酸进行密码子优化,以从选择用于表达的宿主生物体中最佳生成。
“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中可将序列与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中为了两个序列的最佳比对,比较窗中的序列部分与参考序列(其不包括添加或缺失)相比可包含20%或更少的添加或缺失(即缺口)。比较窗可以长于20个连续的残基,并且任选地包含30、40、50、100或更长的窗。
“保守的”氨基酸取代或突变是指具有相似侧链的残基的互换性,因此通常涉及用相同或相似定义的氨基酸类别内的氨基酸取代多肽中的氨基酸。然而,如本文所用,在某些实施方案中,保守突变不包括从亲水性至亲水性,疏水性至疏水性,含羟基至含羟基或小至小残基的取代,相反,保守突变可以是脂肪族至脂肪族、非极性至非极性、极性至极性、酸性至酸性、碱性至碱性、芳香族至芳香族、或受约束的残基至受约束的残基的取代。此外,如本文所用,A、V、L或I可以保守地突变为另一个脂肪族残基或另一个非极性残基。下表2显示了示例性的保守取代。
表2
Figure BDA0002539317960000101
“受约束的氨基酸或残基”是指具有受约束的几何形状的氨基酸或残基。在本文中,受约束的残基包括L-Pro(P)和L-His(H)。组氨酸具有受约束的几何形状,因为它具有相对较小的咪唑环。脯氨酸具有受约束的几何形状,因为它也具有五元环。
本文定义“控制序列”以包括对于表达本公开内容的多核苷酸和/或多肽而言必需或有利的所有组分。每个控制序列对于目的多核苷酸可以是天然的或外来的。此类控制序列包括但不限于前导物、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。
“转化”是指底物向相应产物的酶促转化。
当在给定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”,“参考”或“相对于”是指当给定氨基酸或多核苷酸序列与参考序列进行比较时,规定参考序列的残基的编号。换言之,给定聚合物的残基数目或残基位置是相对于参考序列指定的,而不是通过非参考序列的给定氨基酸或多核苷酸序列内残基的实际数字位置来指定。例如,通过引入缺口以优化两个序列之间的残基匹配,可以将给定的氨基酸序列,例如工程化羧酸酯酶的氨基酸序列与参考序列比对。在这些情况下,尽管存在缺口,但是给定氨基酸或多核苷酸序列中的残基编号是相对于其已比对的参考序列进行的。
“半胱氨酸”或L-Cys(C)是不常见的,因为它可以与其他L-Cys(C)氨基酸或其他含硫烷基或巯基的氨基酸形成二硫桥。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫桥的巯基部分的其他氨基酸。L-Cys(C)(和其他具有含有-SH的侧链的氨基酸)以还原的游离-SH或氧化的二硫键桥接形式存在于肽中的能力影响L-Cys(C)是否对肽贡献净的疏水性或亲水性特征。虽然L-Cys(C)根据Eisenberg(Eisenberg等人,1984,同上)的归一化共有量表表现出0.29的疏水性,但是应当理解,出于本公开的目的,L-Cys(C)被分类为其自身的独特组。
“缺失”是指通过从参考多肽中除去一个或多个氨基酸来修饰多肽。缺失可包括除去1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、构成多肽的氨基酸总数的多达10%、氨基酸总数的多达20%、或氨基酸总数的多达30%,而保留酶促活性和/或保留工程化羧酸酯酶的改善特性。缺失可以针对多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包含连续的区段或可以是不连续的。
如本文在工程化酶的上下文中所使用的“源自”鉴定工程化所基于的起源酶和/或编码此类酶的基因。例如,通过突变SEQ ID NO:2的羧酸酯酶获得SEQ ID NO:4的工程化羧酸酯酶。因此,该SEQ ID NO:4的工程化羧酸酯酶“源自”SEQ ID NO:2的多肽。
如本文所用,“工程化羧酸酯酶”是指通过随机诱变过程,然后选择具有特定性质的突变体,或通过有意将特定氨基酸变化引入蛋白质序列,经由将新的氨基酸插入其参考序列,缺失其参考序列中存在的氨基酸或将其参考序列中的氨基酸突变成备选氨基酸而已经系统性修饰的羧酸酯酶型蛋白质。
“酯”意指含有与氧原子连接的羰基的官能团,该氧原子又与碳原子连接。酯还指任何含有酯官能团的化合物。酯源自羧酸和醇。
“酯底物”具体是指与工程化羧酸酯酶反应的含有酯的式(1)的化合物。
在本公开内容的联系中,酯底物尤其包括式I的化合物,
Figure BDA0002539317960000122
唑-5-羧酸乙酯。
Figure BDA0002539317960000121
如本文所用,“片段”是指具有氨基末端和/或羧基末端缺失,但是其中剩余氨基酸序列与序列中相应位置相同的多肽。片段可以长至少14个氨基酸,长至少20个氨基酸,长至少50个氨基酸或更长,并且全长羧酸酯酶多肽,例如,SEQ ID NO:4的多肽的多达70%、80%、90%、95%、98%和99%或更多。
在本文中可互换使用的“功能片段”或“生物活性片段”是指具有氨基末端和/或羧基末端缺失和/或内部缺失,但其中剩余的氨基酸序列的多肽与同其比较的序列(例如,本发明的全长工程化褐色嗜热裂孢菌(T.fusca)酶)中的相应位置相同并且基本上保留全长多肽的所有活性的多肽。
“卤素”旨在包括卤素原子、氟、氯、溴和碘。
“异源”多核苷酸是指通过实验室技术引入宿主细胞的任何多核苷酸,包括从宿主细胞中取出,进行实验室操作,然后再引入宿主细胞中的多核苷酸。
“杂交严格性”涉及核酸杂交中的杂交条件,例如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后进行变化但较高严格性的洗涤。术语“中等严格杂交”是指允许靶DNA结合互补核酸的条件,该互补核酸与靶DNA具有约60%的同一性,优选地,约75%的同一性,约85%的同一性,或与靶多核苷酸具有大于约90%的同一性。示例性的中等严格条件是等同于在42℃在50%甲酰胺、5x Denhart溶液、5x盐水-磷酸钠-EDTA(SSPE)、0.2%十二烷基硫酸钠(SDS)中杂交,接着在0.2×SSPE,0.2%SDS中于42℃洗涤的条件。“高严格性杂交”通常是指如在定义的多核苷酸序列的溶液条件下确定的热解链温度Tm的约10℃以下的条件。在一些实施方案中,高严格性条件是指仅允许在65℃在0.018M NaCl中形成稳定杂交物的那些核酸序列杂交的条件。(即,如果杂交物在65℃在0.018M NaCl中不稳定,那么它将在高严格性条件下不稳定,如本文涵盖)。可以通过例如等同于在42℃的50%甲酰胺、5xDenhart溶液、5xSSPE、0.2%SDS的条件中的杂交,然后在0.1xSSPE和0.1%SDS中于65℃洗涤提供高严格性条件。另一种高严格性条件是在等同于在65℃在含有0.1%(w:v)SDS的5XSSC中杂交的条件中杂交,并在65℃在含有0.1%SDS的0.1x SSC中洗涤。在上面引用的参考文献中描述了其他高严格性杂交条件以及中等严格条件。
“亲水性氨基酸或残基”是指根据Eisenberg et al.,1984,J.Mol.Biol.179:125-142的归一化共有疏水性量表,具有表现出小于零的疏水性的侧链的氨基酸或残基。遗传编码的亲水氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。“疏水性氨基酸或残基”是指根据Eisenberg et al.,1984,J.Mol.Biol.179:125-142的归一化疏水性量表,具有表现出大于零的疏水性的侧链的氨基酸或残基。在遗传上,编码的疏水氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
“含羟基的氨基酸或残基”是指含有羟基(-OH)部分的氨基酸。遗传编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
“改善的酶特性”是指与参考酶中发现的特性相比,对于特定目的变得更好或更期望的任何酶特性。对于本文所述的工程化羧酸酯酶多肽,通常与野生型羧酸酯酶进行比较,尽管在一些实施方案中,参考羧酸酯酶可以是另一种改善的工程化羧酸酯酶。可以改善的酶特性包括但不限于酶活性(其可以按照一段时间内底物的转化百分比表示)、热稳定性、溶剂稳定性、pH活性概况、辅酶需求、对抑制剂的不应性(例如,产物抑制)、立体特异性和抑制酸副产物的产生。
“增加的酶活性”或“增加的活性”是指工程化酶的改善的特性,其可以通过与参考酶相比,比活性(例如,产物产量/时间/重量蛋白)的增加或底物至产物的转化百分比(例如,在指定的时间段内使用指定量的羧酸酯酶的底物起始量到产物的转化百分比)的增加来表示。实施例中提供了确定酶活性的示例性方法。可影响与酶活性有关的任何特性,包括Km、Vmax或kcat的经典酶特性,其变化可以导致酶活性增加。酶活性的改善可以是相应的野生型或工程化酶的酶活性的约1.5倍至天然存在的酶(例如,羧酸酯酶)或衍生出表现出增加的活性的酶的另一种工程化酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、1000倍、10,000倍、100,000倍、500,000倍、785,000倍或更多的酶活性。在具体的实施方案中,本公开内容的工程化羧酸酯酶表现出范围为亲本羧酸酯酶(即,衍生出它们的野生型或工程化羧酸酯酶)的酶活性的1.5至50倍,1.5至100倍或更高的改善的酶活性。本领域技术人员应理解,任何酶的活性都是受扩散限制的,以致催化转换速率不能超过包括任何必需的辅酶在内的底物的扩散速率。扩散限度的理论最大值通常为约108至109(M-1s-1)。因此,羧酸酯酶的酶活性的任何改善将具有与羧酸酯酶作用的底物的扩散速率有关的上限。可以通过用于测量羧酸酯酶的任何一种标准测定法,例如底物或产物浓度的变化,或胺底物浓度的变化来测定羧酸酯酶的活性。如本文进一步详细描述的,使用限定的酶制剂、在设定条件下的限定测定法和一种或多种限定的底物进行酶活性的比较。通常,当比较细胞裂解液中的酶时,测定细胞数和测定的蛋白质量,以及使用相同的表达系统和相同的宿主细胞以最小化宿主细胞产生并存在于裂解物中的酶量的变化。
“插入”是指通过向参考多肽添加一个或多个氨基酸来修饰多肽。在一些实施方案中,改善的工程化羧酸酯酶包括将一个或多个氨基酸插入天然存在的羧酸酯酶多肽中,以及将一个或多个氨基酸插入其他改善的羧酸酯酶多肽中。插入可以在多肽的内部部分中,或者对羧基或氨基末端进行。如本文所用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或被天然多肽中的一个或多个氨基酸分隔。
“分离的多肽”是指与天然伴随它的其他污染物,例如蛋白质、脂质和多核苷酸基本上分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如宿主细胞或体外合成)中除去或纯化的多肽。改善的羧酸酯酶可以存在于细胞内,存在于细胞培养基中或以各种形式制备,例如裂解物或分离的制剂。因此,在一些实施方案中,改善的羧酸酯酶可以是分离的多肽。
“非保守取代”是指多肽中的氨基酸被具有显著不同的侧链特性的氨基酸取代或突变。非保守取代可以使用上面列出的定义的基团之间而不是内部的氨基酸。在一个实施方案中,非保守突变影响:(a)在取代(例如,用脯氨酸取代甘氨酸)区域中的肽主链的结构;(b)电荷或疏水性;或(c)侧链体积。
“非极性氨基酸”或“非极性残基”是指疏水性氨基酸或残基,其具有在生理pH下不带电荷的侧链,并且具有如下的键,其中由两个原子共同共享的一对电子通常由两个原子中的每个原子均等地保持(即,侧链不是极性的)。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
“转化百分比”是指在指定条件下一段时间内转化为产物的底物百分比。因此,例如,羧酸酯酶多肽的“酶活性”或“活性”可以表示为底物向产物的“转化百分比”。
本文使用“序列同一性百分比”、“同一性百分比”和“百分比相同”来指多核苷酸序列或多肽序列之间的比较,并通过在比较窗中比较两个最佳比对的序列来确定,其中比较窗中的多核苷酸或多肽序列的部分与参考序列相比可包含添加或缺失(即缺口),以使两个序列最佳比对。如下计算百分比:通过测定两个序列中出现相同核酸碱基或氨基酸残基的位置数或将核酸碱基或氨基酸残基在具有缺口的情况下比对以产生匹配位置的数目,用匹配位置的数目除以比较窗中的位置总数,并且将结果乘以100以产生序列同一性的百分比。使用BLAST和BLAST 2.0算法(参见例如Altschul,et al.,1990,J.Mol.Biol.215:403-410和Altschul,et al.,1977,Nucleic Acids Res.3389-3402)进行最佳比对和序列同一性百分比的测定。可通过国家生物技术信息中心网站公开获得进行BLAST分析的软件。
简言之,BLAST分析涉及首先通过鉴定查询序列中长度W的短词来鉴定高评分序列对(HSP),所述短词当与数据库序列中相同长度的词比对时匹配或满足一些正值阈值T得分。T称为邻近词得分阈值(Altschul等人,同上)。这些最初的邻近词命中作用为启动搜索以查找包含它们的较长HSP的种子。然后将词命中沿着每个序列在两个方向上延伸,直到可以增加累积比对得分。对于核苷酸序列,使用参数M(一对匹配残基的奖励得分;始终>0)和N(错配残基的罚分得分;始终<0)来计算累积分数。对于氨基酸序列,使用评分矩阵来计算累积得分。在以下情况下停止词命中在每个方向上的延伸:累积比对得分自其最大实现值减少数量X;由于一个或多个负评分残基比对的累积,累积得分变为零以下;或到达任一序列的末尾。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用11的词长度(W),10的期望(E),M=5,N=-4以及两条链的比较作为默认。对于氨基酸序列,BLASTP程序使用3的词长度(W),10的期望(E)和BLOSUM62评分矩阵作为默认值(参见Henikoff and Henikoff,1989,Proc Natl Acad Sci USA89:10915)。
许多其他算法是可用的,它们在提供两个序列的同一性百分比方面与BLAST相似发挥功能。可以例如通过Smith and Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法,通过Needleman and Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法,通过Pearson and Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444的相似性寻找方法,通过这些算法的计算机化实现(GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或通过目视检查(一般参见Current Protocols in Molecular Biology,F.M.Ausubel,et al.编,Current Protocols,Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.之间的合资,(1995增补)(Ausubel))进行用于比较的序列的最佳比对。此外,使用提供的默认参数,可以使用GCG威斯康星州软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序确定序列比对和序列同一性百分比。
“pH稳定的”是指与未处理的酶相比在暴露于低或高pH(例如4.5-6或8-12)一段时间(例如,0.5-24小时)后维持相似活性(大于例如60%至80%)的多肽。
“极性氨基酸或残基”是指具有在生理pH下不带电荷的侧链,但具有至少一个键的亲水性氨基酸或残基,在所述键中由两个原子共同共享的一对电子通过原子之一更紧密地保持在一起。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
“优选的、最佳的、高密码子选择偏爱密码子”可互换地是指在蛋白质编码区域中以比编码相同氨基酸的其他密码子更高的频率使用的密码子。可以根据单个基因、一组具有共同功能或起源的基因、高度表达的基因中的密码子选择、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白质编码区中的密码子频率或其组合来确定优选的密码子。频率随基因表达水平增加的密码子通常是表达的最佳密码子。已知多种方法来确定特定生物体中的密码子频率(例如,密码子选择、相对同义密码子选择)和密码子偏爱,包括多变量分析,例如使用聚类分析或对应性分析,以及基因中使用的密码子的有效数目(参见GCG CodonPreference,Genetics Computer Group Wisconsin Package;CodonW,John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics 14:372-73;Stenico,et al.,1994,Nucleic Acids Res.222437-46;Wright,F.,1990,Gene 87:23-29)。密码子选择表可用于不断增长的生物体列表(例如,参见Wada,et al.,1992,NucleicAcids Res.20:2111-2118;Nakamura,et al.,2000,Nucl.Acids Res.28:292;Duret,etal.,同上;Henaut and Danchin,“Escherichia coli and Salmonella,”1996,Neidhardt,et al.编.,ASM Press,Washington D.C.,p.2047-2066)。用于获得密码子选择的数据来源可以依赖于任何能够编码蛋白质的可用核苷酸序列。这些数据集包括实际上已知编码表达蛋白质(例如,完整的蛋白质编码序列-CDS)、表达序列标签(EST)或基因组序列的预测编码区)的核酸序列(参见例如Mount,D.,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari,et al..,1997,Comput.Appl.Biosci.13:263-270)。
“蛋白质”、“多肽”和“肽”在本文中可互换使用,表示通过酰胺键共价连接的至少两个氨基酸的聚合物,无论长度或翻译后修饰(例如糖基化、磷酸化、脂化、肉豆蔻化、泛素化等)。该定义中包括D-和L-氨基酸,以及D-和L-氨基酸的混合物。
“参考序列”是指与另一个(例如,改变的)序列比较的限定序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列是至少20个核苷酸或氨基酸残基的长度,至少25个残基的长度,至少50个残基的长度或核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即完整序列的一部分),并且(2)可以进一步包含两个序列之间有差异的序列,所以通常通过在比较窗内比较两个多核苷酸的序列以鉴定和比较序列相似性的局部区域来进行两个(或更多个)多核苷酸或多肽之间的序列比较。
术语“参考序列”并不旨在限于野生型序列,并且可以包括工程化或改变的序列。例如,在一些实施方案中,“参考序列”可以是先前工程化或改变的氨基酸序列。例如,“在X12位置处具有甘氨酸残基的基于SEQ ID NO:2的参考序列”是指在X12处具有甘氨酸残基的与SEQ ID NO:2对应的参考序列(SEQ ID NO:2的未改变形式在X12处具有天冬氨酸)。
“小氨基酸”或“小残基”是指具有侧链的氨基酸或残基,该侧链由总共三个或更少的碳和/或杂原子(不包括α-碳和氢)构成。根据上述定义,小氨基酸或残基可进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
“溶剂稳定的”或“溶剂稳定性”是指与未处理的酶相比在暴露于不同浓度(例如5-99%)的溶剂(例如异丙醇、二甲基亚砜、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚、乙腈等)达一段时间(例如0.5-24小时)后维持相似活性(大于例如60%至80%)的多肽。
“基本上的同一性”是指与参考序列相比在至少20个残基位置的比较窗内,通常在至少30-50个残基的窗内具有至少80、81、82、83、84、85、86、87、88、89、90、91、91、93、94、95、96、97、98、99%或更高的百分比序列同一性的多核苷酸或多肽序列,其中通过比较参考序列与包含在比较窗中总计参考序列的20%或更少的缺失或添加的序列计算序列同一性的百分比。在应用于多肽的具体实施方案中,术语“基本上的同一性”是指当两个多肽序列例如通过使用默认缺口权重的GAP或BESTFIT程序最佳比对时,共享至少80%的序列同一性,优选至少89%的序列同一性,至少95%的序列同一性或更多(例如99%的序列同一性)。优选地,不相同的残基位置相差保守氨基酸取代。
“基本上纯的多肽”是指其中多肽种类是存在的主要种类的组合物(即,以摩尔或重量计,它比组合物中的任何其他个别大分子种类更丰富),并且当以摩尔或%重量计目标种类占存在的大分子种类的至少约50%时通常是基本上纯化的组合物。通常,以摩尔或%重量计,基本上纯的羧酸酯酶组合物将占组合物中存在的所有大分子种类的约60%或更多,约70%或更多,约80%或更多,约90%或更多,约95%或更多,约96%或更多,约97%或更多,约98%或更多或约99%或更多。在一些实施方案中,将目标种类纯化至基本均质(即,不能通过常规检测方法在组合物中检测到污染种类),其中组合物基本上由单一大分子种类组成。认为溶剂种类和元素离子种类不是大分子种类。在一些实施方案中,分离的改善的羧酸酯酶多肽是基本上纯的多肽组合物。
如本文所用,“底物”是指由含有酯(1)、胺(5)或醇(2)的化合物组成的羧酸酯酶反应性化合物。在本公开内容的上下文中,用于羧酸酯酶的底物尤其包括式I的化合物和式II的化合物,如本文进一步所述。
“热稳定的”或“热稳定性”可互换使用,是指与未处理的酶相比当暴露于一组温度条件(例如40-80℃)一段时间(例如0.5-24小时)时对失活具有抗性,因此在暴露于升高的温度后仍保留一定水平的残留活性(例如,超过60%至80%)的多肽。
如本文所用,“溶剂稳定的”是指与未处理的酶相比多肽在暴露于变化的浓度(例如5-99%)的溶剂(例如异丙醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)一段时间(例如0.5-24小时)后维持相似活性(大于例如60%至80%)的能力。
具体实施方式
在本文的实施方案中,与野生型羧酸酯酶,酸热脂环酸杆菌酯酶2(SEQ ID NO:2)相比,在存在胺底物1-异丙基哌嗪的情况下,工程化羧酸酯酶在其将酯底物
Figure BDA0002539317960000191
唑-5-羧酸乙酯转化为产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000192
唑-5-基)甲酮的能力上得到改善。羧酸酯酶(包括本文所述的那些)是自立式酶(free-standing enzyme),其缺乏化学辅因子,并且是水溶性酶,其可以配制成溶解酶,固定化到树脂的酶或在存在一种或多种盐的情况下的冻干粉末。
在一些实施方案中,酶活性的改善是相对于另一种工程化羧酸酯酶,例如SEQ IDNO:4的多肽而言。对酯底物的改善的活性可以通过相对于参考酶(例如,野生型,SEQ IDNO:2)在限定的条件下由工程化酶转化为产物的底物量(例如,转化百分比)增加来表明。改善的活性可以包括增加的产物形成速率,导致在限定条件下在限定时间内在存在胺底物的情况下酯底物向产物的转化的增加。活性的增加(例如,增加的转化百分比和/或转化率)也可以通过用较低量的酶将底物转化为相同量产物来表征。产物的量可以通过多种技术来评估,例如,分离反应混合物(例如,通过层析)以及通过UV吸光度或串联质谱法(MS/MS)检测分离的产物(参见例如实施例4)。用于与SEQ ID NO:2的活性进行比较的示例性的限定的反应条件是约40g/L
Figure BDA0002539317960000193
唑-5-羧酸乙酯(酯底物)、44g/L 1-异丙基哌嗪(胺底物)和20g/L的羧酸酯酶多肽,其对应于选自以下的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、or 94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126,其中在存在硫酸钠的情况中制备酶,并在存在甲基异丁基酮(MIBK)中的约10g/L至约20g/L的水的情况下运行,如以下表3所列羧酸酯酶的反应条件描述中所述。用于与某些工程化羧酸酯酶比较的限定反应条件也在表3上列出的羧酸酯酶的描述中以及在实施例7中的相应描述中提供。在一些实施方案中,工程化羧酸酯酶具有限定反应条件下SEQ ID NO:2多肽活性的至少1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、75倍、100倍、150倍、200倍、300倍、400倍、500倍、1000倍、1,500倍、2,000倍、10,000倍、100,000倍、500,000倍、785,000倍或更大。
在一些实施方案中,改善的酶活性也与酶特性的其他改善相关。在一些实施方案中,酶特性的改善是相对于例如在60℃或更高的热稳定性而言。
在一些实施方案中,改善的酶活性与溶剂稳定性的改善相关,例如当以98%(体积/体积)的甲基异丁基酮(MIBK)或叔丁基甲基醚(TBME)运行时。
在一些实施方案中,本公开内容的工程化羧酸酯酶多肽能够在存在胺底物例如1-异丙基哌嗪的情况下以大于SEQ ID NO:2多肽活性的活性将酯底物
Figure BDA0002539317960000201
唑-5-羧酸乙酯转化为产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000202
唑-5-基)甲酮,并且包含与SEQ ID NO:2或其功能性片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的氨基酸序列。
在一些实施方案中,本公开内容的工程化羧酸酯酶多肽能够在存在胺底物例如1-异丙基哌嗪的情况下以大于SEQ ID NO:2多肽的活性将酯底物
Figure BDA0002539317960000203
唑-5-羧酸乙酯转化为产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000204
唑-5-基)甲酮,并且包含与表3中列出的参考序列,例如SEQID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126或其功能性片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同或更多相同的氨基酸序列,如下文进一步所述。
在一些实施方案中,工程化羧酸酯酶多肽包含与羧酸酯酶参考序列相比,具有一个或多个残基差异的氨基酸序列。残基差异可以是非保守取代、保守取代或非保守和保守取代的组合。关于残基差异和残基位置的描述,本文提供的羧酸酯酶可以参考酸热脂环酸杆菌酯酶2的天然存在的羧酸酯酶的氨基酸序列(SEQ ID NO:2),SEQ ID NO:2的羧酸酯酶或工程化羧酸酯酶,例如SEQ ID NO:4的多肽来描述。对于本文中的描述,参考序列中的氨基酸残基位置是从初始甲硫氨酸(M)残基开始(即,M代表残基位置1)在羧酸酯酶中确定的,尽管本领域技术人员将理解,该起始甲硫氨酸残基可以通过生物加工机器除去,例如在宿主细胞或体外翻译系统中,以产生缺乏起始甲硫氨酸残基的成熟蛋白。
在一些实施方案中,残基差异可发生在以下残基位置中的一处或多处:X2、X7、X9、X10、X19、X20、X22、X27、X28、X29、X30、X33、X34、X35、X36、X37、X38、X46、X48、X54、X57、X66、X75、X85、X86、X87、X96、X103、X139、X160、X176、X181、X183、X185、X188、X190、X197、X198、X205、X207、X208、X212、X216、X248、X249、X255、X263、X266、X270、X271、X278、X280、X286、X290和X296。在一些实施方案中,残基差异或其组合与改善的酶特性有关。在一些实施方案中,羧酸酯酶多肽在除了上文列出的以“Xn”表示的那些特定位置外的残基位置处可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13,1-14、1-15、1-16、1-17、1-18、1-19、1-20、1-22、1-24、1-26、1-28、1-30、1-35、1-40、1-45、1-50、1-55、1-60、或1-62个残基差异。在一些实施方案中,差异的数量可以是其它氨基酸残基位置处的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、35、40、45、50、55、60、或62个残基差异。在一些实施方案中,在其他残基位置处的残基差异包括被保守氨基酸残基取代。
在本文的实施方案中,与SEQ ID NO:2相比,在影响羧酸酯酶上的底物结合的残基位置处的残基差异允许容纳结构式(I)的酯底物,下文进一步描述,特别是酯底物、
Figure BDA0002539317960000211
唑-5-羧酸乙酯。不受理论的束缚,至少两个区域,第一底物结合区和第二底物结合区,与酯底物的不同结构元件相互作用。第一结合区包含残基X85、X185、X214、X215和X254,第二结合区包含残基位置X30、X33、X34、X37、X82、X205、X210、X283、X286和X287,而位置X83、X84、X155、X156、X206、X214和X282使两个位点重叠。这些残基通过X射线晶体学测定。因此,本文的羧酸酯酶多肽在包含X30、X33、X34、X37、X85、X185、X205、和X286的残基位置处具有一个或多个残基差异。在一些实施方案中,本文的羧酸酯酶多肽在与底物结合相关的指定残基位置处具有至少两个或更多个或三个或更多个残基差异。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4所示的氨基酸序列至少80%相同的氨基酸序列,其中所述改善的羧酸酯酶氨基酸序列包括以下特征:与X198对应的残基选自:非极性残基、芳香族残基和脂肪族残基。在其他实施方案中,改善的羧酸酯酶多肽包括以下特征:X198选自:F、L、I、Y、和M。在一些实施方案中,改善的羧酸酯酶多肽可包含在与以下对应的以下残基位置处与SEQ ID NO:4的序列相比包含一个或多个残基差异的氨基酸序列:X27、X30、X35、X37、X57、X66、X75、X103、X207、X208、X271 X286、和X296。在下面的详细描述中提供了在指定的残基位置处可以存在的各种氨基酸残基的选择指南。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4所示的氨基酸序列至少80%相同的氨基酸序列,其中氨基酸序列包括至少一个选自以下的特征:与X27对应的残基为受约束的残基;与X30对应的残基是脂肪族残基;与X35对应的残基选自碱性残基和极性残基;与X37对应的残基选自脂肪族残基和极性残基;与X57对应的残基是非极性残基;与X75对应的残基选自碱性残基和极性残基;与X103对应的残基选自非极性和芳香族残基;与X185对应的残基选自脂肪族残基、非极性残基和芳香族残基;与X207对应的残基选自酸性残基和极性残基;与X208对应的残基选自脂肪族残基、碱性残基和极性残基;与X271对应的残基选自酸性残基和极性残基;与X286对应的残基选自脂肪族残基、极性残基和小残基;与X296对应的残基选自脂肪族残基和碱性残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4所示氨基酸序列至少80%相同的氨基酸序列,其中氨基酸序列包括至少一个选自以下的特征:X27是P;X30选自I、L、和V;X35是H;X37选自I、L、T、和V;X57是M;X75是R;X103选自F、M、和W;X185选自F、I、和M;X207是E;X208选自R、L和H;X271是D;X286选自M、V、和G;和X296选自V、L、和R。在一些实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X35选自碱性残基和极性残基;和X185选自极性残基和脂肪族残基。在替代实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X35为H;和X185选自F、I和M。
在一些实施方案中,与SEQ ID NO:24所示的氨基酸序列相比,改善的羧酸酯酶多肽在至少一个选自以下的残基位置包含残基差异:X9、X19、X34、X35、X37、X46、X48、X66、X87、X103、X139、X190、X207、X216、X263、X271、X278和X296。在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括以下特征中的至少一个:与X9对应的残基是芳香族残基;与X19对应的残基选自碱性残基和极性残基;与X34对应的残基选自受约束的残基、酸性残基和极性残基;与X35对应的残基选自极性残基;与X46对应的残基是脂肪族残基;与X48对应的残基是脂肪族残基;与X66对应的残基是脂肪族残基;与X87对应的残基选自脂肪族残基和小残基;与X103对应的残基选自芳香族残基;与X139对应的残基是碱性残基;X190对应的残基是芳香族残基;与X207对应的残基是碱性残基;与X216对应的残基选自芳香族残基、碱性残基和极性残基;与X263对应的残基选自脂肪族残基和极性残基;与X271对应的残基选自酸性残基和极性残基;与X278对应的残基选自脂肪族残基和芳香族残基,并且与X296对应的残基选自脂肪族残基和碱性残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:24所示氨基酸序列至少80%相同的氨基酸序列,其中所述氨基酸序列包括至少一个选自以下的特征:X9是Y;X19是R;X34选自E、N或P;X35是S,X37是T;X46选自I、L或V;X48是L;X66是V;X87是A;X103选自W或F;X139是R;X190是Y;X207是E;X216选自N和W;X263选自T和A;X271是D;X278选自W和L;和X296选自V、L和R。在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,其包括以下特征:X9是芳香族残基,并且X87是脂肪族残基。在替代的实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,其包括以下特征:X9为Y;并且X87是A。
在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列与SEQID NO:54所示的氨基酸序列相比,在选自以下的至少一个残基位置包含残基差异:X20、X28、X29、X30、X33、X34、X188、X216和X286。在替代实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:X20选自脂肪族残基和碱性残基;与X28对应的残基选自酸性残基、极性残基和受约束的残基;与X29对应的残基选自酸性残基和极性残基;与X30对应的残基是脂肪族残基;与X33对应的残基是芳香族残基;与X34对应的残基是小残基;与X188对应的残基选自小残基和芳香族残基;与X216对应的残基是极性残基,和与X286对应的残基选自脂肪族残基、小残基、非极性残基和极性残基。
在一些实施方案中,改善的羧酸酯酶多肽包含SEQ ID NO:54所示的氨基酸序列,其中氨基酸序列包括选自以下的至少一个特定突变:X20选自I和R;以及X28选自D、P和S;X29是D;X30是V;X33是W;X34是G;X188选自G和F;X216是N,并且X286选自S、M、V、G和A。在替代实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X216是极性残基。在其他实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X216是N。
在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列与选自SEQ ID NO:68所示的氨基酸序列相比,在一个选自以下的残基位置处包含残基差异:X10、X20、X22、X28、X30、X33、X36、X37、X46、X66、X75、X103、X197、X263、X266、X280和X290。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:与X10对应的残基是脂肪族残基;与X20对应的残基选自脂肪族残基和碱性残基;与X22对应的残基是芳香族残基;与X28对应的残基选自酸性残基、极性残基和受约束的残基;与X30对应的残基是脂肪族残基;与X33对应的残基是芳香族残基;与X36对应的残基是脂肪族或芳香族残基;与X37对应的残基是芳香族或小残基;与X46对应的残基是碱性残基;与X66对应的残基是极性残基;与X75对应的残基是碱性残基;与X103对应的残基是芳香族残基;与X197对应的残基是脂肪族残基;与X263对应的残基是碱性残基;与X266对应的残基是极性残基;与X280对应的残基选自脂肪族残基和极性残基;和与X290对应的残基选自脂肪族残基和芳香族残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:68所示的氨基酸序列至少80%相同的氨基酸序列,其中氨基酸序列包括至少一个选自以下的特征:X10选自L和M;X20选自I和R;X22是W;X28选自D、P、和S;X30是V;X33是W;X36选自F、I、和M;X37选自G和Y;X46是R;X66是T;X75是R;X103是W;X197是L;X263是R;X266是T;X280选自M和T;和X290选自W和I。在替代实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:X30是脂肪族残基,X33是芳香族残基,X75是碱性残基,和X103是芳香族残基。在又一个实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X30为V;X33是W;X75是R;并且X103是W。
在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列与SEQID NO:68所示的氨基酸序列相比,在一个选自以下的残基位置处包含残基差异:X28、X38、X46、X54、X66、X75、X85、X86、X96、X160、X176、X183、X188、X205、X212、X248、X249、X255、X270、和X286。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:与X28对应的残基选自酸性残基、极性残基、小残基和受约束的残基;与X38对应的残基选自脂肪族残基和碱性残基;与X46对应的残基选自酸性残基和碱性残基;与X54对应的残基选自酸性残基和极性残基;与X66对应的残基是极性残基;与X75对应的残基是碱性残基;与X85对应的残基选自芳香族或碱性残基和小残基;与X86对应的残基是极性残基;与X96对应的残基选自非极性残基和脂肪族残基;与X160对应的残基选自极性残基和受约束的残基;与X176对应的残基选自脂肪族残基、芳香族或碱性残基和非极性残基;与X183对应的残基是非极性残基;与X188对应的残基选自芳香族残基和小残基;与X205对应的残基是芳香族残基;与X212对应的残基是酸性残基;与X248对应的残基是脂肪族残基;与X249对应的残基是芳香族残基;与X255对应的残基是极性残基;与X270对应的残基选自脂肪族残基和极性残基;和与X286对应的残基选自脂肪族残基、非极性残基、小残基和极性残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:68所示氨基酸序列至少80%相同的氨基酸序列,其中所述氨基酸序列包括至少一个选自以下的特征:X28选自C、D、S、H、P、G和R;X38选自E和L;X46选自K、R和Q;X54选自R、Q、和S;X66选自L、T和V;X75是R;X85选自G和H;X86是T;X96选自M和L;X160选自T和P;X176选自M、L和H;X183是Q;X188选自G和F;X205是F;X212是D;X248是V;X249是W;X255是N;X270选自N和L;和X286选自M、V、G、N和S。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,氨基酸序列包括至少一个选自以下的特征:X28是极性残基,X38是碱性残基,和X85是小残基。在又一个实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X28是C;X38是E;并且X85是G。
在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列与SEQID NO:100所示的氨基酸序列相比,在一个选自以下的残基位置处包含残基差异:X7、X22、X36、X38、X46、X54、X66、和X75。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包含至少一个选自以下的特征:与X7对应的残基是脂肪族残基;与X22对应的残基选自脂肪族残基和芳香族残基;与X36对应的残基选自极性残基和非极性残基;与X38对应的残基是芳香族残基;与X46对应的残基选自极性残基和碱性残基;与X54对应的残基选自极性残基和碱性残基;与X66对应的残基是极性残基;并且与X75对应的残基选自碱性残基和非极性残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:100所示的氨基酸序列至少80%相同的氨基酸序列,其中所述氨基酸序列包括至少一个选自以下的特征:X7是L;X22选自W和L;X36选自T和M;X38是W;X46选自K和Q;X54选自S、Q、和K;X66选自G和T;和X75选自M和R。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:X36是极性残基,X38是芳香族残基,和X75是碱性残基。在又一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,其包括以下特征:X36为T;X38是W;并且X75是R。
在其他实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列与SEQID NO:114所示的氨基酸序列相比,在选自以下的一个残基位置处包含一个残基差异:X2、X181和X286。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包含至少一个选自以下的特征:与X2对应的残基选自脂肪族残基、碱性残基、极性残基和芳香族残基;与X181对应的残基是碱性残基;并且与X286对应的残基选自极性残基和非极性残基。
在其他实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:114所示的氨基酸序列至少80%相同的氨基酸序列,其中该氨基酸序列包括至少一个选自以下的特征:X2选自L、Q、R、和H;X181是Q;和X286选自C和S。在另一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,该氨基酸序列包括至少一个选自以下的特征:X286是非极性残基。在另一个实施方案中,改善的羧酸酯酶多肽包含具有以下特征的氨基酸序列:X286是C。
在一些实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126所示的氨基酸序列对应的氨基酸序列。
在另一方面,本公开内容提供了编码每个上述改善的工程化羧酸酯酶多肽的多核苷酸。在一些实施方案中,多核苷酸可以是表达载体的一部分,该表达载体具有一个或多个用于表达羧酸酯酶多肽的控制序列。在替代实施方案中,多核苷酸对应于SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123或125。
在另一方面,本公开内容提供了宿主细胞,其包含编码工程化羧酸酯酶的多核苷酸或能够表达工程化羧酸酯酶的表达载体。在一些实施方案中,宿主细胞可以是细菌宿主细胞,例如大肠杆菌。宿主细胞可以用于表达和分离本文所述的工程化羧酸酯酶,或者,它们可以直接用于酯底物向产物的转化。在一些实施方案中,全细胞、粗提取物、分离的多肽或纯化的多肽形式的工程化酰胺可以个别使用,或作为不同工程化酰胺的组合使用。
技术人员将理解,在产生酶时,具体地,取决于所使用的细胞系和酶的具体氨基酸序列,可以发生翻译后修饰。例如,此类翻译后修饰可包括某些前导序列的切割、以各种糖基化和磷酸化模式添加各种糖部分、脱酰胺基、氧化、二硫键混杂、异构化,C端赖氨酸裁剪和N端谷氨酰胺环化。本发明包括已经经过或可以已经经历一种或多种翻译后修饰的工程化羧酸酯酶的用途。因此,本发明的工程化羧酸酯酶可以包括已经经历翻译后修饰的酶,诸如本文所述。
脱酰胺是一种主要以约3:1的比例将天冬酰胺(N)转化为异天冬氨酸(异天冬氨酸盐)和天冬氨酸(天冬氨酸盐)(D)的酶促反应。因此,该脱酰胺反应与天冬氨酸(D)异构化为异天冬氨酸有关。天冬酰胺的脱酰胺化和天冬氨酸的异构化均涉及中间琥珀酰亚胺。在较小程度上,谷氨酰胺残基会以类似方式发生脱酰胺化。
氧化可在生产和储存期间发生(即,在存在氧化条件的情况下),并导致蛋白质的共价修饰,其由活性氧类别直接诱导或与氧化应激的次级副产物反应间接诱导。氧化主要发生在甲硫氨酸残基上,但可能发生在色氨酸和游离半胱氨酸残基处。
在生产和基本存储条件下可发生二硫键混杂。在某些情况下,二硫键可能断裂或不正确形成,导致未配对的半胱氨酸残基(-SH)。这些游离的(未配对的)巯基(-SH)可以促进改组。
工程化羧酸酯酶中的N末端谷氨酰胺(Q)和谷氨酸盐(谷氨酸)(E)可能通过环化形成焦谷氨酸(pGlu)。大多数pGlu的形成都发生在制造过程中,但是它可以非酶促地形成,这取决于pH值以及加工和储存条件的温度。
C端赖氨酸裁剪是羧肽酶催化的酶促反应,并且通常在酶中观察到。该过程的变体包括从重组宿主细胞的酶中除去赖氨酸。
在本发明中,已知上述的翻译后修饰和一级氨基酸序列的变化不导致工程化羧酸酯酶的活性的显著变化。
下表3提供了示例性工程化羧酸酯酶多肽,每行列出了两个SEQ ID NO,奇数指编码由偶数提供的氨基酸序列的核苷酸序列。残基差异基于与实施例6中提及的SEQ ID NO:2的参考序列(一种对应于野生型酸热脂环酸杆菌酯酶2的羧酸酯酶)的比较。在活性列中,活性水平增加(即“+”“++”“+++”等)的定义如下:“-”表示底物到产物的小于1`%转化,但不大于0.9%转化(175μL裂解液、100mM酯、100mM异丙基哌嗪、TBME中2%的水);“+”表示SEQ IDNO:2的活性的至少1.1至80倍,但不大于SEQ ID NO:4的活性(175μL裂解物、100mM酯、100mM异丙基哌嗪、2%TBME中的水);“++”表示SEQ ID NO:4的活性的至少1.1至11倍,但不大于SEQ ID NO:18的活性(150μL裂解物、200mM酯、200mM异丙基哌嗪、MIBK中2%的水);“+++”表示SEQ ID NO:18的活性的至少1.1至5倍,但不大于SEQ ID NO:54的活性(120μL裂解物、300mM酯、300mM异丙基哌嗪、MIBK中2%的水);“++++”表示SEQ ID NO:54的活性的至少1.5至2倍,但不大于SEQ ID NO:68的活性(90μL裂解物、300mM酯、300mM异丙基哌嗪、MIBK中2%的水));“+++++”表示SEQ ID NO:68的活性的至少1.1至2.0倍(50μL裂解物、300mM酯、300mM异丙基哌嗪、MIBK中2%的水);“$”表示SEQ ID NO:68的活性的至少1.1至2倍,但不大于SEQID NO:100的活性(50μL裂解物、354mM酯、425mM异丙基哌嗪,MIBK中2%的水);“$$”表示SEQID NO:100的活性的至少1.1至5倍,但不大于SEQ ID NO:114的活性(50μL裂解物、354mM酯、425mM异丙基哌嗪、MIBK中2%的水);“$$$”表示SEQ ID NO:114的活性的至少1.1至2倍(50μL裂解物、354mM酯、354mM异丙基哌嗪、MIBK中2%的水)。在每种情况下,使用装载到多孔冻干和活性筛的可变数量的裂解物中来测定活性,然后在16小时内与记录浓度的底物并且在200μL体积中的记录溶剂系统中反应,如实施例5中所述。
表3
Figure BDA0002539317960000301
Figure BDA0002539317960000311
Figure BDA0002539317960000321
如上所述,在一些实施方案中,改善的羧酸酯酶多肽包含与SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同或更多相同的氨基酸序列。在一些实施方案中,与以SEQ ID NO:2所示的羧酸酯酶相比,改善的羧酸酯酶多肽可具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20、1-22、1-24、1-26、1-28、1-30、1-35、1-40、1-45、1-50、1-55、1-60、或1-62个残基差异。在一些实施方案中,与SEQ ID NO:2相比,残基差异的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、35、40、45、50、55、60、或62个差异。
在一些实施方案中,改善的羧酸酯酶多肽包含与基于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、8%、或99%相同的氨基酸序列,条件是与SEQ ID NO:2相比,改善的羧酸酯酶氨基酸序列包含表3中所列的任一多肽序列中所含的一组残基差异中的任何一种。在一些实施方案中,与参考序列相比,改善的羧酸酯酶多肽可以在其他氨基酸残基位置处另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55、1-60、或1-62个残基差异。在一些实施方案中,差异的数量可以是其它残基位置处的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55、或62个残基差异。在一些实施方案中,在其他残基位置处的残基差异包括被保守氨基酸残基取代。
在一些实施方案中,能够在水饱和的MIBK中在存在胺底物的情况下将酯底物5-
Figure BDA0002539317960000331
唑5-羧酸乙酯转化为可通过HPLC-UV在230nm检测到的产物水平的改善的羧酸酯酶多肽包含选自以下序列的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:2的多肽的2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、1000倍、10,000倍、100,000倍、500,000倍、785,000倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:2的多肽的50至100倍或更大的活性将酯底物转化为产物,并包含对应于SEQ ID NO:16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的氨基酸序列。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:24的多肽约1.1至5倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:24的多肽的约1.1至5倍或更大的活性将酯底物转化为产物,并且包含对应于SEQ IDNO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的序列的氨基酸序列。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:54的多肽约1.1至5倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:54的多肽的约1.1至5倍或更大的活性将酯底物转化为产物,并且包含对应于SEQ IDNO:56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的序列的氨基酸序列。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:68的多肽约1.1至6倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:68的多肽的约1.1至5倍或更大的活性将酯底物转化为产物,并且包含对应于SEQ IDNO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的序列的氨基酸序列。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:100的多肽约1.1至5倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:100的多肽的约1.7倍或更大的活性将酯底物转化为产物,并且包含对应于SEQ IDNO:108、110、112、114、116、118、120、122、124、或126的序列的氨基酸序列。
在一些实施方案中,工程化羧酸酯酶多肽能够以SEQ ID NO:114的多肽约1.1至2倍或更大的活性将酯底物转化为产物。在一些实施方案中,工程化羧酸酯酶多肽能够以SEQID NO:114的多肽的约1.1至5倍或更大的活性将酯底物转化为产物,并且包含对应于SEQID NO:122、124、或126的序列的氨基酸序列。
在一些实施方案中,改善的工程化羧酸酯酶多肽可以在本文所述的工程化羧酸酯酶多肽的特定氨基酸残基处包含缺失。因此,对于本公开内容的羧酸酯酶多肽的每个实施方案,缺失可以包含一个或多个氨基酸,2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、羧酸酯酶多肽的氨基酸总数的多达5%、氨基酸总数的多达10%、氨基酸总数的多达20%、或氨基酸总数的多达30%,只要维持羧酸酯酶活性的功能活性。在一些实施方案中,缺失可包含多达1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55、1-60、或1-62个氨基酸残基。在一些实施方案中,缺失的数目可以高达1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55、60、或62个氨基酸。如本文所述,本公开内容的羧酸酯酶多肽可以呈融合多肽的形式,其中羧酸酯酶多肽与其他多肽融合,诸如例如但不限于,抗体标签(例如,myc表位)、纯化序列(例如,用于结合金属的His标签)和细胞定位信号(例如,分泌信号)。因此,羧酸酯酶多肽可以与其他多肽融合或不融合使用。
本文所述的多肽不限于遗传编码的氨基酸。除遗传编码的氨基酸外,本文所述的多肽可全部或部分包含天然存在的和/或合成非编码氨基酸。可以构成本文描述的多肽的某些通常遇到的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩丙氨酸(bAla);噻吩丙氨酸(tAla);呋喃丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);同色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(styrylkalanine)(sAla);蒽基丙氨酸(authrylalanine)(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天门冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA),氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu),高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);同半胱氨酸(hCys);高丝氨酸(hSer);羟脯氨酸(Hyp)和高脯氨酸(hPro)。可以构成本文描述的多肽的其他非编码氨基酸对本领域技术人员而言是显而易见的(参见,例如Fasman,1989,CRC Practical Handbook of Biochemistry and Molecular Biology,CRC Press,Boca Raton,FL,at pp.3-70及其中引用的参考文献中提供的各种氨基酸)。这些氨基酸可以是L或D构型。
本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以包含在本文所述的多肽中。在这种情况下属于芳香族类别的此类受保护氨基酸的非限制性实例包括(括号中列出的保护基),但不限于:Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶亚磺酰基(nitropyridinesulfenyl))、Glu(δ-苄基酯)、Gln(吨基(xanthyl))、Asn(N-δ-吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文所述的多肽的在构象上受约束的非编码氨基酸包括但不限于N-甲基氨基酸(L构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro);和1-氨基环戊烷-3-羧酸。
如上所述,可以靶向引入天然存在的多肽中以产生工程化羧酸酯酶的各种修饰,以影响酶的特定性质,例如活性、对其底物的特异性和热稳定性等。
在另一方面,本公开内容提供了编码改善的羧酸酯酶多肽的多核苷酸。多核苷酸可以可操作地连接至一个或多个控制基因表达的异源调节序列,以创建能够表达羧酸酯酶多肽的重组多核苷酸。可以将含有编码工程化羧酸酯酶的异源多核苷酸的表达构建体引入合适的宿主细胞中以表达相应的羧酸酯酶多肽。
由于对应于各种氨基酸的密码子的知识,因此蛋白质序列的可获得性提供了所有能够编码主题物的多核苷酸的描述。遗传密码的简并性(其中相同的氨基酸由替代密码子或同义密码子编码)允许制备非常大量的核酸,所有这些核酸都编码本文公开的改善的羧酸酯酶多肽。因此,已经鉴定出特定的氨基酸序列,本领域技术人员可以通过以不改变蛋白质的氨基酸序列的方式简单地修饰一个或多个密码子的序列来制备任何数量的不同核酸。就这点而言,本公开内容具体地考虑了可以通过基于可能的密码子选择来选择组合而制备的多核苷酸的每种可能的变化,并且所有此类变化都被认为是针对本文所公开的任何多肽,包括表3中呈现的氨基酸序列而具体公开的。
在一些实施方案中,可以选择和/或工程化改造多核苷酸以包含密码子,所述密码子被选择以适合在其中产生蛋白质的宿主细胞。例如,细菌中使用的优选密码子用于在细菌中表达基因;酵母中使用的优选密码子用于在酵母中表达;并且哺乳动物中使用的优选密码子用于在哺乳动物细胞中表达。由于并非所有密码子都需要被替换以优化羧酸酯酶的密码子选择(例如,因为天然序列可以具有优选的密码子,并且因为使用优选的密码子可以并非所有氨基酸残基都需要),因此编码羧酸酯酶多肽的密码子优化的多核苷酸可以含有全长编码区的密码子位置的约40%、50%、60%、70%、80%或大于90%的优选密码子。
在一些实施方案中,多核苷酸编码包含与SEQ ID NO:4的参考序列或其功能片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的氨基酸序列的羧酸酯酶多肽,其中多肽能够在存在胺底物的情况下以与源自酸热脂环酸杆菌酯酶2的SEQ ID NO:2的羧酸酯酶的活性相比改善的活性转化酯底物。
在一些实施方案中,多核苷酸编码羧酸酯酶,该羧酸酯酶包含与多肽具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的氨基酸序列,所述多肽包含对应于SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的氨基酸序列或其功能性片段,其中多肽在存在胺底物1-异丙基哌嗪的情况下将酯底物
Figure BDA0002539317960000381
唑5-羧酸乙酯转化为产物(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000382
唑-5-基)甲酮中具有至少一种改善的特性。在一些实施方案中,编码的羧酸酯酶多肽具有等于或大于SEQ ID NO:2的多肽的活性。
在一些实施方案中,多核苷酸编码羧酸酯酶多肽,其包含与基于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的参考序列或其功能性片段至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列,条件是与SEQ ID NO:2相比,改善的羧酸酯酶氨基酸序列包含表3列出的任何一种多肽序列中包含的一组残基差异中的任何一个。
在一些实施方案中,编码改善的羧酸酯酶多肽的多核苷酸选自SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123或125。
在一些实施方案中,多核苷酸能够在高度严格的条件下与包含SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、或125或其互补物的多核苷酸杂交,其中高度严格杂交的多核苷酸编码羧酸酯酶多肽,该羧酸酯酶多肽能够以等于或大于SEQ ID NO:2的多肽的活性在存在胺底物的情况下转化为产物。
在一些实施方案中,多核苷酸编码本文所述的多肽,但是与编码本文所述的工程化羧酸酯酶的参考多核苷酸在核苷酸水平上具有约80%或更多的序列同一性,约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸选自SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、或125。
在一些实施方案中,羧酸酯酶多肽包含SEQ ID NO:122所示的氨基酸序列。在另一个实施方案中,本公开内容提供了编码SEQ ID NO:122所示的羧酸酯酶多肽序列的多核苷酸序列。在一个实施方案中,本公开内容提供了编码羧酸酯酶多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:121所示的多核苷酸序列。在又一个实施方案中,羧酸酯酶多肽由SEQID NO:122所示的多肽序列组成。在另一个实施方案中,羧酸酯酶多肽由SEQ ID NO:122的残基2-310组成。
可以使用本领域技术人员通常使用的方法来制备改善的羧酸酯酶和编码此类多肽的多核苷酸。如上所述,WO02/057411(参见SEQ ID NO:10)中可获得衍生出亲本序列SEQID NO:2的天然存在的氨基酸序列和编码野生型羧酸酯酶,酸热脂环酸杆菌酯酶2的相应多核苷酸。在一些实施方案中,亲本多核苷酸序列经过密码子优化以增强羧酸酯酶在规定宿主细胞中的表达。可以通过使编码天然存在的羧酸酯酶的多核苷酸经历诱变和/或定向进化方法来获得工程化羧酸酯酶。如Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767;和美国专利6,537,746中所述,一种示例性的定向进化技术是诱变和/或DNA改组。
可以使用的其他定向进化程序尤其包括:交错延伸过程(StEP)、体外重组(Zhao,et al.,1998,Nat.Biotechnol.16:258–261)、诱变PCR(Caldwell,et al.,1994,PCRMethods Appl.3:S136-S140)和盒式诱变(Black,et al.,1996,ProcNatl Acad Sci USA93:3525-3529)。在以下参考文献中也描述了可用于本文目的的诱变和定向进化技术:Ling,et al.,1997,“Approaches to DNA mutagenesis:an overview,”Anal.Biochem.254(2):157-78;Dale,et al.,1996,“Oligonucleotide-directed random mutagenesisusing the phosphorothioate method,”Methods Mol.Biol.57:369-74;Smith,1985,“Invitro mutagenesis,”Ann.Rev.Genet.19:423-462;Botstein,et al.,1985,“Strategiesand applications of in vitro mutagenesis,”Science 229:1193-1201;Carter,1986,“Site-directed mutagenesis,”Biochem.J.237:1-7;Kramer,et al.,1984,“PointMismatch Repair,”Cell 38:879-887;Wells,et al.,1985,“Cassette mutagenesis:anefficient method for generation of multiple mutations at defined sites,”Gene34:315-323;Minshull,et al.,1999,“Protein evolution by molecular breeding,”Curr Opin Chem Biol 3:284-290;Christians,et al.,1999,“Directed evolution ofthymidine kinase for AZT phosphorylation using DNA family shuffling,”NatureBiotech17:259-264;Crameri,et al.,1998,“DNA shuffling of a family of genesfrom diverse species accelerates directed evolution,”Nature 391:288-291;Crameri,et al.,1997,“Molecular evolution of an arsenate detoxificationpathway by DNA shuffling,”Nature Biotech 15:436-438;Zhang,et al.,1997,“Directed evolution of an effective fructosidase from a galactosidase by DNAshuffling and screening,”Proc Natl Acad Sci USA 94:45-4-4509;Crameri,et al.,1996,“Improved green fluorescent protein by molecular evolution using DNAshuffling,’Nature Biotech 14:315-319;和Stemmer,1994,“Rapid evolution of aprotein in vitro by DNA shuffling,”Nature 370:389-391。
在一些实施方案中,对诱变处理后获得的克隆筛选具有期望的改善的酶特性的羧酸酯酶。可以使用标准技术从表达文库中测量羧酸酯酶活性,例如分离产物(例如,通过HPLC)和通过测量分离的底物和产物的UV吸光度和/或通过使用串联质谱法(例如MS/MS)检测来检测产物。示例性测定法在下面的实施例4中描述。每单位时间的期望产物的增加速率指示了在固定量的裂解物(或由其制成的冻干粉末)中羧酸酯酶多肽的相对(酶)活性。当期望的改善的酶特性是热稳定性时,可以在使酶制剂经受限定的温度并测量热处理后剩余的酶活性的量之后测量酶活性。然后分离含有编码期望羧酸酯酶的多核苷酸的克隆,测序以鉴定核苷酸序列变化(如果有的话),并用于在宿主细胞中表达该酶。
在本领域公知的其他实施方案中,酶可以在遗传上多样化,而维持其靶活性,例如通过中性漂移技术。
在已知工程化多肽的序列的情况下,可以根据已知的合成方法通过标准固相方法制备编码酶的多核苷酸。在一些实施方案中,可以个别合成多达约100个碱基的片段,然后连接(例如,通过酶或化学连接方法,或聚合酶介导的方法)以形成任何期望的连续序列。例如,本发明的多核苷酸和寡核苷酸可以使用例如Beaucage,et al.,1981,Tet Lett 22:1859-69描述的经典亚磷酰胺方法,或例如Matthes,et al.,1984,EMBO J.3:801-05描述的方法,通过化学合成来制备,因为它通常在自动化合成方法中实施。根据亚磷酰胺方法,例如在自动DNA合成仪中合成寡核苷酸,纯化,退火,连接并在合适的载体中克隆。另外,基本上任何核酸都可以从多种商业来源,The Great American Gene Company,Ramona,CA,ExpressGen Inc,Chicago,IL,Operon Technologies Inc,Alameda,CA等中的任一种获得。
可以使用任何一种或多种熟知的蛋白质纯化技术,尤其包括溶菌酶处理、超声处理、过滤、盐析、超速离心和层析从细胞和/或培养基中回收宿主细胞中表达的工程化羧酸酯酶。用于从细菌例如大肠杆菌中裂解和高效提取蛋白质的合适溶液可从Sigma-Aldrichof St.Louis,MO以商品名CelLytic BTM商购获得。
用于分离羧酸酯酶多肽的层析技术尤其包括反相层析、高效液相层析、离子交换层析、凝胶电泳和亲和层析。纯化特定酶的条件将部分取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员而言是显而易见的。在一些实施方案中,工程化羧酸酯酶可以表达为具有纯化标签的融合蛋白,例如对金属具有亲和力的His标签,或与抗体结合的抗体标签,例如myc表位标签。
在一些实施方案中,亲和力技术可用于分离改善的羧酸酯酶。对于亲和层析纯化,可以使用任何特异性结合羧酸酯酶多肽的抗体。为了产生抗体,可以通过注射工程化多肽来免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。多肽可通过侧链官能团或连接于侧链官能团的接头而连接至合适的载体,例如BSA。根据宿主物种,可以使用各种佐剂来增强免疫应答,包括但不限于弗氏(完全和不完全)、矿物凝胶如氢氧化铝、表面活性物质如溶血卵磷脂、pluronic多元醇、聚阴离子、肽、油乳剂、钥孔虫戚血蓝蛋白、二硝基苯酚和潜在有用的人类佐剂,例如BCG(卡介苗)和小棒杆菌(Corynebacterium parvum)。
另一方面,本文所述的改善的羧酸酯酶多肽可用于在存在胺底物的情况下酰胺化某些酰胺基受体(例如酯底物)的方法。
在一些实施方案中,改善的羧酸酯酶可以用于制备酰胺的方法中,其中将组分组合,其含有:
(a)R1-COOR2形式的酯,其中R1选自:具有0至3个烷基取代基的sp3碳;和芳香族环,并且R2选自:甲基;乙基;和1-6个碳的烷基链;
(b)胺底物;
(c)改善的羧酸酯酶多肽,和
(d)溶剂。
在一个实施方案中,溶剂是有机溶剂,其相对于约0.5%(体积/体积)至约3%(体积/体积)量的酯底物包含多达3摩尔当量的水。
在方法的一些实施方案中,改善的羧酸酯酶选自:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124和126。
在其他实施方案中,改善的羧酸酯酶多肽可用于制备酰胺分子的方法中,其中将组分组合,其含有:(a)R1-COOR2形式的酯底物,其中R1选自:具有0至3个烷基取代基的sp3碳;和芳香族环,并且R2选自:甲基;乙基;和1-6个碳的烷基链;(b)胺底物;(c)上述的改善的羧酸酯酶多肽;和(d)溶剂。在方法的另一个实施方案中,使用有机溶剂。在一个实施方案中,有机溶剂选自:甲苯;2-甲基四氢呋喃;四氢呋喃;二甲基乙酰胺;甲基异丁基酮(MIBK);二氯甲烷;叔丁基甲基醚;环戊基甲基醚;甲基环己烷;二氯甲烷;乙腈;甲乙酮;乙酸异丙酯;乙醇;异丙醇;乙酸乙酯;庚烷;xathane;和2-甲基四氢呋喃(2-Me-THF);和水。在又一个实施方案中,有机溶剂相对于约0.5%(体积/体积)至约3%(体积/体积)量的酯底物包含多达3摩尔当量的水。在方法的另一个实施方案中,步骤(c)中的羧酸酯酶多肽是在盐的存在下制备的,以在反应过程中稳定其物理形式。在另一个实施方案中,加入盐作为另外的反应组分。在方法的一个实施方案中,酯为具有下式的
Figure BDA0002539317960000437
唑-5-羧酸乙酯:
Figure BDA0002539317960000436
胺底物是具有下式的1-异丙基哌嗪:
Figure BDA0002539317960000431
并且胺是具有下式的(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000438
唑-5-基)甲酮:
Figure BDA0002539317960000432
在此方法的又一个实施方案中,酯是具有下式的
Figure BDA0002539317960000439
唑-5-羧酸乙酯:
Figure BDA0002539317960000433
并且胺底物是具有下式的顺-2,6-二甲基吗啉:
Figure BDA0002539317960000434
并且胺是具有下式的((2S,6R)-2,6-二甲基吗啉代)(
Figure BDA00025393179600004310
唑-5-基)甲酮:
Figure BDA0002539317960000435
在另一个实施方案中,方法中的该反应包含:约50g/L的
Figure BDA00025393179600004311
唑-5-羧酸乙酯、44g/L的1-异丙基哌嗪和约25g/L的羧酸酯酶多肽,其对应于以下氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108 110、112、114、116、118、120、122、124、或126,其中羧酸酯酶是在存在硫酸钠的情况下制备的,并在存在MIBK中的约10g/L至约20g/L水的情况下运行。
在一些实施方案中,本发明是使用改善的羧酸酯酶通过这些方法制备的酰胺。在另一个实施方案中,本发明是酰胺,4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000443
唑-5-基)甲酮,其具有下式:
Figure BDA0002539317960000441
其中式III.的酰胺通过上述方法制备。
在替代实施方案中,本发明是酰胺,((2S,6R)-2,6-二甲基吗啉代)(
Figure BDA0002539317960000444
唑-5-基)甲酮,其具有下式:
Figure BDA0002539317960000442
其中式V.的酰胺是通过上述方法制备的。
式I的化合物(Astatech,AS-23210)、式II的化合物(Oakwood Products Inc,OAK-008910)和式IV的化合物(Oakwood Products Inc,OAK-091224)购自商业供应商。
在一些实施方案中,方法包括在合适的反应条件下,在存在胺底物的情况下,使酯底物,
Figure BDA0002539317960000445
唑-5-羧酸乙酯与改善的羧酸酯酶接触或温育,从而以SEQ ID NO:2的转化率和/或活性的约50至约785,000倍或更高的转化率和/或活性将酯底物转化为产物,(4-异丙基哌嗪-1-基)(
Figure BDA0002539317960000451
唑-5-基)甲酮。示例性多肽包含对应于SEQ ID NO:16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、或126的氨基酸序列。
在上述方法的一些实施方案中,用于进行该方法的反应溶剂选自甲基异丁基酮(MIBK)、甲苯、叔丁基甲基醚(TBME)或2-甲基四氢呋喃(2-Me-THF)。
在以上方法的一些实施方案中,用于反应的酶制剂包括选自磷酸钾(KPi)、硫酸钾或硫酸钠之一的盐。
在一些实施方案中,用于进行该方法的反应条件可以包括约15℃的温度至约30℃的温度。在一实施方案中,该方法中使用的胺底物可以是手性胺或非手性胺。非手性胺底物的优点是其反应不限于特定的立体异构体,因此需要较少的胺底物。可以使用各种合适的胺底物,包括例如但不限于1-异丙基哌嗪和顺-2,6-二甲基吗啉。在一些实施方案中,可以使用其他胺底物,尤其包括α-苯乙胺(也称为1-苯基乙胺)及其对映异构体(S)-1-苯基乙胺和(R)-1-苯基乙胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸一钠、L-天冬氨酸、L-赖氨酸、L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺、1,6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄基胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢萘、2-氨基四氢萘、2-氨基-5-甲氧基四氢萘和1-氨基茚满,并在可能的情况下包括(R)和(S)单一异构体两者。
在一些实施方案中,转化酯底物,
Figure BDA0002539317960000452
唑-5-羧酸乙酯的方法包括在存在43mL/L 1-异丙基哌嗪的情况下在约30℃的温度使约36mL/L的酯底物与MIBK中的约20g/L的本文所述的羧酸酯酶接触,其中至少80%、85%、90%、92%、94%、96%或98%或更多的酯底物在24小时内转化为产物。在一些实施方案中,能够进行前述反应的羧酸酯酶多肽包含对应于SEQID NO:122的氨基酸序列。
在一些实施方案中,以上方法可进一步包括从反应溶剂中分离结构式III的化合物或结构式V.的化合物的步骤。
本文还提供了羧酸酯酶和底物/产物的组合物。在一些实施方案中,组合物可以包含式III.的化合物或化合物V.的化合物以及本公开内容的改善的羧酸酯酶。
任何一种或多种改善的工程化羧酸酯酶可以是组合物的一部分。
实施例
在下面的代表性实施例中显示了本公开内容的各种特征和实施方案,实施例旨在示例性而非限制性的。
实施例1:酸热脂环酸杆菌酯酶2野生型羧酸酯酶基因的获取和表达载体的构建
基于羧酸酯酶,酸热脂环酸杆菌酯酶2的报道的氨基酸序列(SEQ ID NO:2)以及在美国专利申请2008/0248539的实施例1中描述的密码子优化算法,设计了羧酸酯酶(CE)编码基因,以便在大肠杆菌中表达。分开合成寡核苷酸,然后使用通常由42个核苷酸构成的寡核苷酸连接。然后在lac启动子的控制下将该基因克隆到表达载体pCK110900(如美国申请2006/195947的图3中描述,两者通过引用完整并入本文用于所有目的)中。该表达载体还包含P15a复制起点和氯霉素抗性基因。使用标准方法将所得质粒转化到大肠杆菌W3110中。经密码子优化的基因和编码的多肽分别在表3和下面的序列表中以SEQ ID NO:1和2列出。
同样地,将表3中列出的编码本公开内容的工程化羧酸酯酶的基因(SEQ ID NO:3-94)克隆到载体pCK110900中以在大肠杆菌W3110中表达。
实施例2:羧酸酯酶粉末的生产-摇瓶程序
将含有编码目的羧酸酯酶的质粒的大肠杆菌的单个微生物菌落接种到含有30μg/mL氯霉素和1%葡萄糖的50mL Luria Bertoni肉汤中。使细胞在30℃的培养箱中以250rpm摇动培养过夜(至少16小时)。将培养物稀释到含有30μg/mL氯霉素的1000mL Terrific肉汤中,以给出0.2的大致OD600,并在30℃以250rpm摇动培养。当培养物的OD600为0.6至0.8时,通过添加异丙基β-D-硫代半乳糖苷(IPTG)至终浓度1mM来诱导羧酸酯酶基因的表达,然后继续温育过夜(至少16小时)。通过离心(3738RCF,20min,4℃)收获细胞,并且弃去上清液。将团粒在-80℃冷冻2小时。然后将团粒解冻并重悬于每克最终团粒质量的3mL硫酸钠缓冲液(由水中的15g/L的无水硫酸钠组成)(例如10g冷冻的团粒悬浮在30mL硫酸钠缓冲液中)。通过离心(15,777RCF,40min,4℃)除去细胞碎片。收集清澈的裂解物上清液,合并,并冻干以提供干燥的粗羧酸酯酶粉末。
实施例3:羧酸酯酶粉的生产-发酵程序
从冷冻机中取出等份的冷冻工作储液(含有具有目的羧酸酯酶基因的大肠杆菌的质粒),并使其在室温解冻。将300μL的该工作储液接种到1L烧瓶中含有30μg/ml的氯霉素和1%的葡萄糖的250ml M9YE肉汤(1.0g/L氯化铵、0.5g/L氯化钠、6.0g/L磷酸一氢二钠、3.0g/L磷酸二氢钾、2.0g/L的Tastone-154酵母提取物、1L/L的去离子水)的一级种子阶段中,并使其在26℃以220rpm摇动的情况下培养。当培养物的OD600为0.5至1.0时,将烧瓶从培养箱中移出并立即用于接种二级种子阶段。
使用在120℃下灭菌40分钟的4L生长培养基(0.88g/L硫酸铵、0.98g/L柠檬酸钠;12.5g/L三水合磷酸氢二钾、6.25g/L磷酸二氢钾、3.3g/L的Springer0251酵母提取物、0.083g/L的柠檬酸铁铵、0.5mL/L的消泡剂和8.3ml/L的微量元素溶液,其含有2g/L的二水合氯化钙、2.2g/L的六水合硫酸锌、0.5g/L一水合硫酸锰、1g/L七水合硫酸亚铜、0.1g/L四水合钼酸铵和0.02g/L四硼酸钠)在台式5L发酵罐中进行二级种子阶段。对发酵罐接种2mlOD 0.5-1.0主要种子,并在30℃,300rpm和0.5vvm的曝气下温育。当培养物的OD600为0.5–1.0OD600时,二级种子立即转移到最终阶段发酵。
使用6L生长培养基(0.88g/L硫酸铵、0.98g/L柠檬酸钠;12.5g/L三水合磷酸氢二钾、6.25g/L磷酸二氢钾、3.3g/L的Springer 0251酵母提取物、0.083g/L的柠檬酸铁铵、0.5mL/L的消泡剂和8.3ml/L的微量元素溶液,其含有2g/L的二水合氯化钙、2.2g/L的六水合硫酸锌、0.5g/L一水合硫酸锰、1g/L七水合硫酸亚铜、0.1g/L四水合钼酸铵和0.02g/L四硼酸钠)在10升发酵罐中以台式规模进行最终阶段发酵,所述生长培养基在121C下灭菌40分钟,并在灭菌后补充有20g/L一水合葡萄糖、0.48g/L氯化铵和0.204g/L七水合硫酸镁。用500ml OD600 0.5–1.0二级种子接种发酵罐,并在30C和1.6vvm曝气下温育。通过300–950rpm的可变速度搅拌将溶解氧控制于30%。通过添加20%v/v氢氧化铵将pH维持于7.0。通过添加含有500g/L一水合葡萄糖、12g/L氯化铵和5.1g/L七水合硫酸镁的进料溶液来维持培养物的生长。
在培养物达到80+/-10的OD600后,通过添加异丙基-β-D-硫代半乳糖苷(IPTG)至终浓度为1mM诱导羧化酸酯酶的表达,并继续再发酵24小时。然后将培养物冷却至8℃并维持于该温度直至收获。通过在4℃在Sorvall RC12BP离心机中以5000G离心40分钟来收集细胞。然后,将收获的细胞团粒在-80℃冷冻,并储存至下游处理和回收,如下所述。
将团粒在-80℃冷冻2小时。然后将团粒解冻并重悬于每克最终团粒质量的3mL硫酸钠缓冲液(由水中的15g/L的无水硫酸钠组成)(例如10g冷冻团粒悬浮在30mL硫酸钠缓冲液中)。重悬后,将细胞通过200um滤网过滤,然后两次以12000psig通过微流化器。通过离心(15,777RCF,40min,4℃)除去细胞碎片。收集清澈的裂解物上清液,合并,并冻干以提供干燥的粗羧酸酯酶粉末。将羧酸酯酶粉末存储在-80℃。
实施例4:用于鉴定能够在水性条件下将酯底物转化为酰胺的酸热脂环酸杆菌酯酶2的变体的高通量分析方法
UPLC法测定酯底物I向酰胺III的转化:使用配备有Agilent Zorbax RRHDEclipse Plus Phenyl-Hexyl柱(3.0x 50mm,1.8μm)的Agilent 1290UPLC以流速2mL/min于柱温60℃,使用水中的5mM NH4Ac(流动相A)和乙腈(流动相B)的梯度测定式I的酯底物(市售,CAS号118994-89-1)向式III酰胺的酶促转化。从A:B的99.9:0.1比率开始,该方法先保持0.25分钟,然后以0.05分钟的梯度至80:20A:B,然后以0.5分钟的梯度至60:40A:B,然后0.1分钟的吹扫梯度至0:100,0:100A:B保持0.2分钟,并且0.1分钟梯度至99.9:0.1A:B,最后99.9:0.1A:B保持0.3分钟。在210和230nm处监测化合物的洗脱,其中酯在0.56min处洗脱,酰胺在0.52min处洗脱,并且反应的酸副产物在0.14min处在溶剂前沿附近以窄峰洗脱。
UPLC法测定式I.的酯底物向式III的酰胺的转化:使用配备有Agilent ZorbaxSB-C18 RRHD柱(3.0x 50mm,1.8μm)的Agilent 1290UPLC以流速2mL/min于柱温60℃,使用水中的0.05%TFA(流动相A)和乙腈中的0.05%TFA(流动相B)的梯度测定式I的酯底物向式III的酰胺的酶促转化。从A:B的99.9:0.10比率开始,该方法先保持0.25分钟,然后以0.0.25分钟梯度至80:20A:B,然后以0.1分钟的梯度至100:0A:B,然后保持0.1分钟,然后以0.1分钟梯度至99.9:0.1A:B,然后保持0.2分钟。用1uL注射体积,在210和230nm处监测化合物的洗脱,其中酯在0.53min处洗脱,酰胺在0.23min处洗脱,并且反应的酸副产物在0.2min处在溶剂前沿附近以窄峰洗脱。
UPLC法测定式I.的酯底物向式V.的酰胺的转化:使用配备有Agilent Zorbax SB-C18柱(3.0x 50mm,1.8μm)的Agilent 1290UPLC以流速1.5mL/min于柱温60℃,使用水中的0.05%TFA(流动相A)和乙腈中的0.05%TFA(流动相B)的梯度测定式I的酯底物向式V的酰胺的酶促转化。从A:B的80:20比率开始,该方法先保持0.9分钟,然后以0.1分钟梯度至0:100A:B,然后以0.1分钟梯度至80:20A:B,然后保持0.4分钟。在210和230nm处监测化合物的洗脱,其中酯在0.5min处洗脱,酰胺在0.39min处洗脱,并且反应的酸副产物在0.14min处在溶剂前沿附近以窄峰洗脱。
实施例5:用于鉴定能够将酯底物转化为酰胺的酸热脂环酸杆菌酯酶2的变体的高通量筛选
使用以下描述的方法诱变按实施例1所述构建的编码酸热脂环酸杆菌酯酶2的基因(SEQ ID NO:2),并使用改变的DNA分子群体转化合适的大肠杆菌宿主菌株。选择并处理抗生素抗性转化体,以鉴定那些表达羧酸酯酶的转化体,所述羧酸酯酶具有在分别存在式(II)或(IV)的胺底物的情况下将式I的酯底物酰胺化成式(III)和(V)的化合物的改善的能力。细胞选择、生长、羧酸酯酶变体酶的诱导表达和细胞团粒的收集如下所述。
使用Q-PIX分子装置机器人菌落挑选器(Genetix USA,Inc.,Boston,MA)将携带编码羧酸酯酶的基因的重组大肠杆菌菌落选入96孔浅孔微量滴定板中,该板在每孔中含180μL LB肉汤、1%葡萄糖和30μg/mL氯霉素(CAM)。使细胞在30℃以200rpm摇动培养过夜。然后,将该培养物的20μL等分试样转移到含有380μLTB肉汤和30μg/mL CAM的96深孔板中。将深孔板在30℃以250rpm摇动温育2-3小时后,通过添加IPTG至终浓度1mM诱导培养细胞内的重组基因表达。然后将板在30℃以250rpm摇动温育18小时。
通过离心(3738RCF,10min,4℃)使细胞沉淀,重悬于200μL裂解缓冲液中,并通过在室温摇动裂解2小时。在冻干筛选条件下,裂解缓冲液含有100mM硫酸钠(14.2g/L)、1mg/mL溶菌酶、500μg/mL多粘菌素B硫酸盐(PMBS)和12.5U/mL Benzonase。在水性筛选条件的情况下,裂解缓冲液由10mM磷酸钾,pH 7.0,1mg/mL溶菌酶和500μg/mL PMBS组成。用透气的尼龙密封垫密封板后,在室温剧烈摇动2小时。通过离心(3738RCF,10分钟,4℃)沉淀细胞碎片,并直接测定清澈的上清液或在4℃储存直至使用。
为了在半水性条件中进行筛选,采用早期工程化羧酸酯酶,将120μL底物溶液等分试样(720mL/L DMSO、90mL/L 200-标准乙醇、19.67mL/L异丙基-哌嗪、23.5mL/L酯底物和8.5mL/L 6N HCl)添加到Costar深孔板的每个孔中,然后使用Biomek FX机器人仪器(Beckman Coulter,Fullerton,CA)添加80μL回收的裂解物上清液。得到的溶液包含100mM酯底物、100mM异丙基-哌嗪、45%DMSO、5%EtOH,最终pH为9.0。在165℃下用铝/聚丙烯层压板热封带将板加热密封4秒钟,然后在50℃摇动过夜(至少16小时)。通过用Biomex FX添加200μL乙腈淬灭反应。将板重新密封,摇动5分钟,然后在3738RCF下离心10分钟。将20μL的底物等分试样转移到含有水中180μL的75%乙腈的浅孔聚丙烯板(Costar#3365)中,密封,摇动10分钟,然后分析,如实施例4所述。
为了在有机条件下进行筛选,采用早期工程化羧酸酯酶,将150μL裂解物上清液等分试样添加到装有1mL玻璃小瓶插入物(S11168,Unchained Labs,Pleasanton,CA)的铝96孔架(F158359,Unchained Labs,Pleasanton,CA)。然后将该设备冻干,缓慢温热至室温,并使用Multidrop Combi试剂分配器(Thermo Scientific,Waltham,MA)装入4μL蒸馏水,然后装入200μL叔丁基甲基醚(tBME)中的有机底物溶液(10.93mL/L异丙基-哌嗪,23.5mL/L酯底物)。然后通过使用Teflon片(S11690-2,Unchained Labs,Pleasanton,CA)将板密封,所述片在两个橡胶垫片(S13086,Unchained Labs,Pleasanton,CA)和金属架盖(F158424,Unchained Labs,Pleasanton,CA)下面分层,通过七个螺丝(C151943-050,UnchainedLabs,Pleasanton,CA)连接。然后,将这些构建物在50℃摇动下温育过夜(至少16小时)。通过用Biomek FX添加200μL异丙醇来淬灭反应,然后密封,摇动10分钟,然后在235RCF下离心2分钟以沉积残留的固体。然后,将200μL样品转移到每孔中含有200μL异丙醇的Costar深孔板中,在165℃用铝/聚丙烯层压板热封带热封4秒钟,摇动10分钟,然后在3738RCF下离心10分钟。将40μL的底物样品转移到含有160μL异丙醇的浅孔聚丙烯板(Costar#3365)中,密封,摇动10分钟,然后分析,如实施例4所述。
为了在有机条件下进行筛选,采用后期工程化羧酸酯酶,将120μL回收的裂解物上清液等分试样添加到装有1mL玻璃小瓶插入物(S11168,Unchained Labs,Pleasanton,CA)的铝96孔架(F158359,Unchained Labs,Pleasanton,CA)。然后将该设备冻干,缓慢温热至室温,并使用Multidrop Combi试剂分配器(Thermo Scientific,Waltham,MA)装入200μL甲基异丁酯(MIBK)中的有机底物溶液(53.2mL/L异丙基-哌嗪,43mL/L酯底物),然后是4μL蒸馏水。然后,通过使用Teflon片(S11690-2,Unchained Labs,Pleasanton,CA)将板密封,所述片在1个橡胶垫片(S13086,Unchained Labs,Pleasanton,CA)和金属架盖(F158424,Unchained Labs,Pleasanton,CA)下面分层,通过5个螺丝(C151943-050,Unchained Labs,Pleasanton,CA)连接。然后,将这些构建物在15℃摇动下温育过夜(至少16小时)。从培养箱中取出反应,并且以235RCF离心。将20μL上清液样品转移到每孔中含有180μL异丙醇(具有5g/L萘)的浅孔聚丙烯板(Costar#3365)中,在165℃用铝/聚丙烯层压板热封带热封4秒钟,摇动10分钟,然后在3738RCF下离心10分钟。将10μL的底物样品转移到含有190μL异丙醇的浅孔聚丙烯板(Costar#3365)中,密封,摇动10分钟,然后分析,如实施例4所述。
实施例6:通过衍生自酸热脂环酸杆菌酯酶2的工程化羧酸酯酶在甲基异丁酯(MIBK)中对式I.的酯底物和式II的胺底物的酰胺化
表3中描述的改善的早期羧酸酯酶在MIBK中按制备规模如下评估。将10mg冻干的酶粉与15μL蒸馏水一起添加到1.5mL HPLC小瓶中。随后,添加485μL底物溶液(42.93mL异丙基哌嗪/L MIBK,36.4mL酯/L MIBK),并将小瓶密封。将反应在Eppendorf Thermomixer C加热的小瓶振荡器上在50℃和850rpm下摇动16小时。通过添加500μL异丙醇淬灭反应。然后将50μL样品转移到含有150μL异丙醇的浅孔聚丙烯板(Costar#3365)中,摇动10分钟,然后在3738RCF下离心10分钟。将10μL底物样品转移至包含190μL异丙醇的浅孔聚丙烯板(Costar#3365)中,密封,摇动10分钟,然后进行分析,如实施例4所述。
表3中描述的改善的后期羧酸酯酶在MIBK中按制备规模如下评估。将11.25mg冻干的酶粉添加到1.5mL HPLC小瓶中。然后,添加750μL底物溶液(53.2mL异丙基哌嗪/L MIBK,43mL酯/L MIBK)以及15μL蒸馏水,并将小瓶密封。将反应在Eppendorf Thermomixer C加热的小瓶振荡器上在15℃和850rpm下摇动16小时。如实施例5的后期工程羧酸酯酶筛选中所述,通过除去20uL来淬灭反应。表3提供了对应于以这种方式测试的羧酸酯酶变体的SEQ IDNO:,以及与酸热脂环酸杆菌酯酶2野生型羧酸酯酶(SEQ ID NO:2)的氨基酸残基差异的数目。
实施例7:酯底物I和胺底物II在甲基异丁酯(MIBK)中的酰胺化是由衍生自酸热脂环酸杆菌酯酶的工程化羧酸酯酶进行的。
以下实施例说明了用于增加酯底物,
Figure BDA0002539317960000522
唑-2-羧酸乙酯,式I化合物和胺底物1-异丙基哌嗪,式II化合物的转化的克级别方法。该方法利用了改善的大规模液体混合的优势,以增加底物向产物的转化率。常规监控可捕获和分离产物的大于70%总产率。
大规模反应过程含有以下反应组分:
Figure BDA0002539317960000521
Figure BDA0002539317960000531
处理。向装有顶置式搅拌器的2L CLR反应器中加入340mL MIBK,并设置为在环境温度下搅拌。然后加入11mL水,然后缓慢加热至30℃。装入14g羧酸酯酶,然后用20mL MIBK洗涤。然后装入23.62g的1-异丙基哌嗪,随后用20mL的MIBK洗涤。最后,加入20g
Figure BDA0002539317960000532
唑2-羧酸乙酯,然后进行最后的20mL MIBK洗涤。16小时后,转化超过90%。
过滤残余固体,并用80mL MIBK洗涤以分离任何吸附的物质。然后,合并洗涤液,并用20mL的10%w/w氯化钠洗涤,搅拌并分离。收集有机相并在真空下浓缩至60mL,然后冷却至15℃,此时开始发生结晶。在10分钟的过程中加入70mL正庚烷,在2小时的过程中使结晶进行完全,然后通过过滤收集结晶物质。将结晶产物用80mL的1:4MIBK:正庚烷洗涤两次,并在50℃下真空干燥。按照产物质量评估,此过程的总收率(w/w)为66%。
实施例8:通过衍生自酸热脂环酸杆菌酯酶的工程化羧酸酯酶在甲基异丁酯(MIBK)中对酯底物I和胺底物IV酰胺化。
使用工程化羧酸酯酶进行小规模反应以产生式Ⅴ的酰胺。将25mg冻干的酶粉与10μL蒸馏水一起添加到1.5mL HPLC小瓶中。随后,加入490μL底物溶液(26.72mL(2S,6R)-2,6-二甲基吗啉/L MIBK,24.27mL酯/L MIBK),并将小瓶密封。将反应在EppendorfThermomixer C加热的小瓶振荡器上在50℃和800rpm下摇动16小时。将每种反应溶液的100μL等分试样加到含有100μL异丙醇的浅孔聚丙烯板(Costar#3365)中,密封,摇动10分钟,然后在3738RCF下离心10分钟。然后,在浅孔聚丙烯板(Costar#3365)中的190μL含25%水的乙腈中稀释10μL的上清液等分试样,密封,然后以850rpm摇动5分钟。如实施例4中所述分析反应。在所有观察到的情况下,酶活性与实施例6和表3中所述的反应紧密匹配。
尽管已经示出和描述了各种具体实施方案,但是应当理解,可以在不脱离本发明的精神和范围的情况下进行各种改变。
序列表
>S00032511
SEQ ID NO:1
类型:DNA,生物体:脂环酸杆菌(ALICYCLOBACILLUS)
ACIDOCALDARIUSATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCGAAGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00039799
SEQ ID NO:3
类型:DNA,生物体:人工序列
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00039972
SEQ ID NO:5
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCATTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00039989
SEQ ID NO:7
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCTATGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00040129
SEQ ID NO:9
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCTTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00040188
SEQ ID NO:11
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCGGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCATGGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00044917
SEQ ID NO:13
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAGCAGTTTCGTTCACAGCAATCACTGTTGCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAGAGCATGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAATTTTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00044931
SEQ ID NO:15
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAGCAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAGGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00044943
SEQ ID NO:17
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTGCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCGGGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACGCATGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCCTCGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00045046
SEQ ID NO:19
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTCCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGACCGGAAGGTGTTGAACCACCATATCCGGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAGAGCATGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAGGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00045575
SEQ ID NO:21
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00047040
SEQ ID NO:23
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCACCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCATGACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAGAGGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCGTCGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00048311
SEQ ID NO:25
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCCCGCAACAGTTGCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGTCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCATTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGGGGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00048430
SEQ ID NO:27
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAGTCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGATGCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCCATGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAAGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGGGGTTCTATTCTCTGAGCCCAGGCGCAACCAGAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00048441
SEQ ID NO:29
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCCGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAAGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGGGGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00048480
SEQ ID NO:31
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCCGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCATTGAGAATGCGGAGGGTTACCTGTTAACCGGTGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAAGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGGGGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00048593
SEQ ID NO:33
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAATCACTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGTCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCCGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTCCACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGTGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTGATGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGGGGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00052854
SEQ ID NO:35
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGACCCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00053124
SEQ ID NO:37
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAAAGCCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAACTGCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00053286
SEQ ID NO:39
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCACGTCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGAACCACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTGATGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCCGTGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00053297
SEQ ID NO:41
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGGAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTGATGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00053319
SEQ ID NO:43
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCACGTCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGGAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGTGGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTGATGTGGAGATCGAGAACTTCCAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCCGTGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00053506
SEQ ID NO:45
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGAACCACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGTGGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCCAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCCGTGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00054201
SEQ ID NO:47
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAACAAGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACGTGCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGTTGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATTATGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAGAAGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTACCGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00054685
SEQ ID NO:49
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGGAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGTGGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTCGTGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00054833
SEQ ID NO:51
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGAACCACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCCGTGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00054853
SEQ ID NO:53
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00058614
SEQ ID NO:55
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGAGTTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059197
SEQ ID NO:57
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGGTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059305
SEQ ID NO:59
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGGAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059320
SEQ ID NO:61
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTTTGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059754
SEQ ID NO:63
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTATTCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059759
SEQ ID NO:65
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCATTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00059902
SEQ ID NO:67
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00060141
SEQ ID NO:69
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAAGATTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00060676
SEQ ID NO:71
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCAGGTCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00060772
SEQ ID NO:73
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTAGTCAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTGACCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00066575
SEQ ID NO:75
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTGCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGGTTCGTTCACAACAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTCTTCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00067402
SEQ ID NO:77
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTGCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACATTGGTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATACGATTCATGGCTTCGCGCAGTTTTATTCTATTAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00067403
SEQ ID NO:79
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACATGGGTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATATGATTCATGGCTTCGCGCAGTTCTATTCTATTAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00067700
SEQ ID NO:81
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATATGCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACTTGGGTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTAATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068003
SEQ ID NO:83
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTAGTCAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTACGATCCAGCACATCCACCAGCAAGTATTCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGTAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068079
SEQ ID NO:85
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTAGTCAGTTTCGTTCACAGCAACATCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCGGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTACGATCCAGCACATCCACCAGCAAGTCTTCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGTAAACTTTACGCTGAAGCCCTGACCAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068124
SEQ ID NO:87
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTAGTCAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTCTTCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGTAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068512
SEQ ID NO:89
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCCGACTACAAGCACTTAAGCGCTCAACAAGTTCGTTCATGGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGGGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGATATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAAGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068639
SEQ ID NO:91
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCATTGACTACAAGCACTTAAGCGCTCAACAAGTTCGTTCATGGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCCGCGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACACGCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAATGGGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGATATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTAGAGCCCTGAACAAAGCGGGCGTTAAAGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00068752
SEQ ID NO:93
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTGGAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGGGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCGGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTATTAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00176502
SEQ ID NO:95
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCAAAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACACCGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGAACTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00176595
SEQ ID NO:97
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCAAAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACACCGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGAGCTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00176980
SEQ ID NO:99
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACCTGTTTGAACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00177019
SEQ ID NO:101
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAAAGCCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCTGCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGACCGCGGGTGACCTGGAAACGCATGATCCGATGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCCGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCCAGCCCTTTACTGGTTTTGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACTTTTTAACCGGAGGCATGATGGATTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGAACGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCCTGAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGAGCTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00177053
SEQ ID NO:103
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTCAACAGTTTCGTTCACAGCAAAGCCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCTGCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTTGGACCGCGGGTGACCTGGAAACGCATGATCCGATGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACTTTTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCTGGCAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGAGCTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00177175
SEQ ID NO:105
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACCTGTTTCCACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGCGTCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGTGCACTGGTTTACTACCATGGTGGCGGTTGGGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATGGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACTTTTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAGTGGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187023
SEQ ID NO:107
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGCTTCAATATGTGCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACCTGTTTGAACCAGTTAAGAAAGAACCGGTCGCTGAAGTTCGCGAATTCGACATGGACCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTCGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTGGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187052
SEQ ID NO:109
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTGCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACCTGTTTGAACCAGTTAAGAAAGAACCGGTCAAAGAAGTTCGCGAATTCGACATGGACCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTCGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187266
SEQ ID NO:111
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGCAGCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACACGCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187283
SEQ ID NO:113
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGCGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187324
SEQ ID NO:115
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTGGAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACATGTTTTGGCCAGTTAAGAAAGAACCGGTCGCCGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGCGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00187421
SEQ ID NO:117
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATATGGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00188542
SEQ ID NO:119
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACCTGTTTGAACCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCCAGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCACAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00207145
SEQ ID NO:121
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGCGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGTGTTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00208699
SEQ ID NO:123
类型:DNA,生物体:人工
ATGTTGTTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGCGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCTGATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00209368
SEQ ID NO:125
类型:DNA,生物体:人工
ATGCCATTAGATCCTGTGATTCAATATGTCCTCGATCAACTGAACCGTATGCCAGCCCCTGACTACAAGCACTTAAGCGCTTGCCAGTTTCGTTCACAGCAACACACGTTTTGGCCAGTTAAGAAAGAACCGGTCGCAGAAGTTCGCGAATTCGACATGGATCTGCCGGGCCGTACCCTGAAAGTCCGTATGTACCGCCCGGAAGGTGTTGAACCACCATATCGCGCACTGGTTTACTACCATGGTGGCGGTGGCGTTGCGGGTGACCTGGAAACGCATGATCCGGTGTGTCGTGTGTTGGCGAAAGATGGACGCGCAGTGGTGTTTAGCGTTGACTACCGTCTGGCACCAGAACACAAGTTTCCAGCGGCAGTTGAAGACGCGTATGATGCACTGCAATGGATTGCAGAACGTGCAGCCGATTTCCATCTTGATCCAGCACGCATTGCAGTTGGCGGCGATTCAGCAGGCGGCAACCTGGCGGCCGTGACTAGTATTCTGGCGAAAGAACGTGGTGGTCCAGCAATTGCGTTTCAACTGCAAATCTATCCCTTTACTGGTTATGATCCAGCACATCCACCAGCAAGTATCCTTGAGAATGCGGAGGGTTACCTGTTAACCGGAGGCATGATGCTGTGGTTTCGTAATCAGTACCTGAACAGCCTTGAGGAACTGACTCACCCATGGTTTAGTCCAGTGCTGTACCCGGATCTTAGCGGTTTACCACCGGCGTACATTGCAACCGCACAGTACGATCCCCTGCGCGATGTCGGCAAACTTTACGCTGAAGCCCTGAACAAAGCGGGCGTTAAGGTGGAGATCGAGAACTTCGAGGATCTGATTCATGGCTTCGCGCAGTTCTATTCTCTGAGCCCAGGCGCAACCAAAGCACTGGTACGTATTGCCGAGAAACTGCGCGATGCGTTGGCG
>S00032511
SEQ ID NO:2
类型:PROTEIN,生物体:酸热脂环酸杆菌MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIEENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00039799
SEQ ID NO:4
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00039972
SEQ ID NO:6
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIIENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00039989
SEQ ID NO:8
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIYENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00040129
SEQ ID NO:10
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIFENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00040188
SEQ ID NO:12
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIMENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00044917
SEQ ID NO:14
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLLPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLEHGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00044931
SEQ ID NO:16
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00044943
SEQ ID NO:18
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLLPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTHGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATLALVRIAEKLRDALA
>S00045046
SEQ ID NO:20
类型:PRT,生物体:人工序列MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLEHGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00045575
SEQ ID NO:22
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00047040
SEQ ID NO:24
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPMTGYDPAHPPASILENAEGYLLEGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATVALVRIAEKLRDALA
>S00048311
SEQ ID NO:26
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSPQQLRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIIENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAGFYSLSPGATKALVRIAEKLRDALA
>S00048430
SEQ ID NO:28
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPMRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASILENAEGYLLTHGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAGFYSLSPGATRALVRIAEKLRDALA
>S00048441
SEQ ID NO:30
类型:PRT,生物体:人工序列MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAGFYSLSPGATKALVRIAEKLRDALA
>S00048480
SEQ ID NO:32
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASIIENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAGFYSLSPGATKALVRIAEKLRDALA
>S00048593
SEQ ID NO:34
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPSTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVDVEIENFEDLIHGFAGFYSLSPGATKALVRIAEKLRDALA
>S00052854
SEQ ID NO:36
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLTPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00053124
SEQ ID NO:38
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAELREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00053286
SEQ ID NO:40
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPRPDYKHLSAQQFRSQNHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVDVEIENFEDLIHGFAQFYSLSPGATRALVRIAEKLRDALA
>S00053297
SEQ ID NO:42
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQEHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVDVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00053319
SEQ ID NO:44
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPRPDYKHLSAQQFRSQEHLFPPVKKEPVVEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVDVEIENFQDLIHGFAQFYSLSPGATRALVRIAEKLRDALA
>S00053506
SEQ ID NO:46
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQNHLFPPVKKEPVVEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFQDLIHGFAQFYSLSPGATRALVRIAEKLRDALA
>S00054201
SEQ ID NO:48
类型:PRT,生物体:人工序列
MPLDPVIQQVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYVPEGVEPPYPALVYYHGGGWVVGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDYAHPPASILENAEGYLLEGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYATALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00054685
SEQ ID NO:50
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQEHLFPPVKKEPVVEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERRADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00054833
SEQ ID NO:52
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQNHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATRALVRIAEKLRDALA
>S00054853
SEQ ID NO:54
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00058614
SEQ ID NO:56
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFASFYSLSPGATKALVRIAEKLRDALA
>S00059197
SEQ ID NO:58
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQVRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00059305
SEQ ID NO:60
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQEHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00059320
SEQ ID NO:62
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGFDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00059754
SEQ ID NO:64
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRIQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00059759
SEQ ID NO:66
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAIDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00059902
SEQ ID NO:68
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00060141
SEQ ID NO:70
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQDFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00060676
SEQ ID NO:72
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSGQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00060772
SEQ ID NO:74
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSASQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRDQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00066575
SEQ ID NO:76
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQVRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASLLENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00067402
SEQ ID NO:78
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHIGPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDTIHGFAQFYSISPGATKALVRIAEKLRDALA
>S00067403
SEQ ID NO:80
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHMGPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDMIHGFAQFYSISPGATKALVRIAEKLRDALA
>S00067700
SEQ ID NO:82
类型:PRT,生物体:人工序列
MPLDPVIQYMLDQLNRMPAPDYKHLSAQQFRSQQHLGPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068003
SEQ ID NO:84
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSASQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068079
SEQ ID NO:86
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSASQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASLLENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALTKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068124
SEQ ID NO:88
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSASQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASLLENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068512
SEQ ID NO:90
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQVRSWQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGWVAGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068639
SEQ ID NO:92
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAIDYKHLSAQQVRSWQHLFPPVKKEPVREVREFDMDLPGRTLKVRMYTPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKWGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYARALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00068752
SEQ ID NO:94
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDWKHLSAQQFRSQQHLFPPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSISPGATKALVRIAEKLRDALA
>S00176502
SEQ ID NO:96
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVKEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNTAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFANFYSLSPGATKALVRIAEKLRDALA
>S00176595
SEQ ID NO:98
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQHLFPPVKKEPVKEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNTAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFASFYSLSPGATKALVRIAEKLRDALA
>S00176980
SEQ ID NO:100
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHLFEPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00177019
SEQ ID NO:102
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYLPEGVEPPYPALVYYHGGGWTAGDLETHDPMCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNPAAVTSILAKERGGPAIAFQLLIQPFTGFDPAHPPASILENAEGYFLTGGMMDWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLNDVGKLYAEALNKAGLKVEIENFEDLIHGFASFYSLSPGATKALVRIAEKLRDALA
>S00177053
SEQ ID NO:104
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSAQQFRSQQSLFPPVKKEPVAEVREFDMDLPGRTLKVRMYLPEGVEPPYPALVYYHGGGWTAGDLETHDPMCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYFLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATWQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFASFYSLSPGATKALVRIAEKLRDALA
>S00177175
SEQ ID NO:106
类型:PRT,生物体:人工序列MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHLFPPVKKEPVAEVREFDMRLPGRTLKVRMYRPEGVEPPYRALVYYHGGGWVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAMAFQLLIYPFTGYDPAHPPASILENAEGYFLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIAVAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187023
SEQ ID NO:108
类型:PRT,生物体:人工序列
MPLDPVLQYVLDQLNRMPAPDYKHLSACQFRSQQHLFEPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187052
SEQ ID NO:110
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHLFEPVKKEPVKEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187266
SEQ ID NO:112
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMQLPGRTLKVRMYTPEGVEPPYPALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187283
SEQ ID NO:114
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187324
SEQ ID NO:116
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDWKHLSACQFRSQQHMFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00187421
SEQ ID NO:118
类型:PRT,生物体:人工序列MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYMALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00188542
SEQ ID NO:120
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHLFEPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYPALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00207145
SEQ ID NO:122
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFACFYSLSPGATKALVRIAEKLRDALA
>S00208699
SEQ ID NO:124
类型:PRT,生物体:人工序列
MLLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLLIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
>S00209368
SEQ ID NO:126
类型:PRT,生物体:人工序列
MPLDPVIQYVLDQLNRMPAPDYKHLSACQFRSQQHTFWPVKKEPVAEVREFDMDLPGRTLKVRMYRPEGVEPPYRALVYYHGGGGVAGDLETHDPVCRVLAKDGRAVVFSVDYRLAPEHKFPAAVEDAYDALQWIAERAADFHLDPARIAVGGDSAGGNLAAVTSILAKERGGPAIAFQLQIYPFTGYDPAHPPASILENAEGYLLTGGMMLWFRNQYLNSLEELTHPWFSPVLYPDLSGLPPAYIATAQYDPLRDVGKLYAEALNKAGVKVEIENFEDLIHGFAQFYSLSPGATKALVRIAEKLRDALA
序列表
<110> GlaxoSmithKline Intellectual Property Development Limited
Codexis, Inc.
<120> 羧酸酯酶催化剂
<130> PU66395
<140> 尚未分配
<141> 2018-12-13
<150> US 62/598181
<151> 2017-12-13
<160> 126
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 940
<212> DNA
<213> 脂环酸杆菌
<400> 1
acdcadarus atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat 60
gccagcccct gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt 120
tccaccagtt aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg 180
ccgtaccctg aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact 240
ggtttactac catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg 300
tcgtgtgttg gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc 360
agaacacaag tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga 420
acgtgcagcc gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg 480
cggcaacctg gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc 540
gtttcaactg ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat 600
cgaagagaat gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca 660
gtacctgaac agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga 720
tcttagcggt ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt 780
cggcaaactt tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt 840
cgaggatctg attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc 900
actggtacgt attgccgaga aactgcgcga tgcgttggcg 940
<210> 2
<211> 310
<212> PRT
<213> 酸热脂环酸杆菌
<400> 2
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Glu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 3
<211> 934
<212> DNA
<213> 多核苷酸序列
<220>
<221> misc_feature
<222> 3
<223> n = A,T,C或G
<220>
<221> misc_feature
<222> 3
<223> n = A,T,C或G
<400> 3
suncatgcca ttagatcctg tgattcaaca agtcctcgat caactgaacc gtatgccagc 60
ccctgactac aagcacttaa gcgctcaaca gtttcgttca cagcaatcac tgtttccacc 120
agttaagaaa gaaccggtcg cagaagttcg cgaattcgac atggatctgc cgggccgtac 180
cctgaaagtc cgtatgtacc gtccggaagg tgttgaacca ccatatccag cactggttta 240
ctaccatggt ggcggttggg ttgttggtga cctggaaacg catgatccgg tgtgtcgtgt 300
gttggcgaaa gatggacgcg cagtggtgtt tagcgttgac taccgtctgg caccagaaca 360
caagtttcca gcggcagttg aagacgcgta tgatgcactg caatggattg cagaacgtgc 420
agccgatttc catcttgatc cagcacgcat tgcagttggc ggcgattcag caggcggcaa 480
cctggcggcc gtgactagta ttctggcgaa agaacgtggt ggtccagcaa ttgcgtttca 540
actgctgatc tatccctcca ctggttatga tccagcacat ccaccagcaa gtatccttga 600
gaatgcggag ggttacctgt taaccggagg catgatgctg tggtttcgtg accagtacct 660
gaacagcctt gaggaactga ctcacccatg gtttagtcca gtgctgtacc cggatcttag 720
cggtttacca ccggcgtaca ttgcaaccgc acagtacgat cccctgcgcg atgtcggcaa 780
actttacgct gaagccctga acaaagcggg cgttaaggtg gagatcgaga acttcgagga 840
tctgattcat ggcttcgcgc agttctattc tctgagccca ggcgcaacca aagcactggt 900
acgtattgcc gagaaactgc gcgatgcgtt ggcg 934
<210> 4
<211> 310
<212> PRT
<213> 多肽序列
<400> 4
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 5
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 5
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat cattgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 6
<211> 310
<212> PRT
<213> 多肽序列
<400> 6
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Ile Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 7
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 7
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat ctatgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 8
<211> 310
<212> PRT
<213> 多肽序列
<400> 8
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Tyr Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 9
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 9
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat ctttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 10
<211> 310
<212> PRT
<213> 多肽序列
<400> 10
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Phe Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 11
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 11
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cggcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat catggagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 12
<211> 310
<212> PRT
<213> 多肽序列
<400> 12
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Met Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 13
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 13
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcagcagttt cgttcacagc aatcactgtt gccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaga gcatggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcaatt ttattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 14
<211> 310
<212> PRT
<213> 多肽序列
<400> 14
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Leu Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Glu His
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 15
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 15
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcagcagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaggc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 16
<211> 310
<212> PRT
<213> 多肽序列
<400> 16
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 17
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 17
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt gccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atcgggcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac gcatggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccctcgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 18
<211> 310
<212> PRT
<213> 多肽序列
<400> 18
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Leu Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr His
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Leu Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 19
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 19
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt cccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgacc ggaaggtgtt gaaccaccat atccggcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaga gcatggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaggc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 20
<211> 310
<212> PRT
<213> 多肽序列
<400> 20
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Glu His
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 21
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 21
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 22
<211> 310
<212> PRT
<213> 多肽序列
<400> 22
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 23
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 23
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcacct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc ccatgactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaga gggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccgtcgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 24
<211> 310
<212> PRT
<213> 多肽序列
<400> 24
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Met Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Glu Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Val Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 25
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 25
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagccc gcaacagttg cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg tcgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat cattgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcggggtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 26
<211> 310
<212> PRT
<213> 多肽序列
<400> 26
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Pro Gln Gln Leu Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Ile Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gly Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 27
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 27
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc agtcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccgat gcgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac ccatggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaagtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcggggtt ctattctctg agcccaggcg caaccagagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 28
<211> 310
<212> PRT
<213> 多肽序列
<400> 28
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Met Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr His
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gly Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Arg Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 29
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 29
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccgccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgccgcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaagtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcggggtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 30
<211> 310
<212> PRT
<213> 多肽序列
<400> 30
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gly Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 31
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 31
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccgccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgccgcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat cattgagaat 600
gcggagggtt acctgttaac cggtggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaagtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcggggtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 32
<211> 310
<212> PRT
<213> 多肽序列
<400> 32
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Ile Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gly Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 33
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 33
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aatcactgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgtcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgccgcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctccactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggtggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt gatgtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcggggtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 34
<211> 310
<212> PRT
<213> 多肽序列
<400> 34
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Ser Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Asp Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gly Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 35
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 35
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgac cccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 36
<211> 310
<212> PRT
<213> 多肽序列
<400> 36
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Thr Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 37
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 37
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aaagcctgtt tccaccagtt 120
aagaaagaac cggtcgcaga actgcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 38
<211> 310
<212> PRT
<213> 多肽序列
<400> 38
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Leu
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 39
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 39
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccacgtcct 60
gactacaagc acttaagcgc tcaacagttt cgttcacaga accacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt gatgtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caacccgtgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 40
<211> 310
<212> PRT
<213> 多肽序列
<400> 40
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Arg Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Asn His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Asp Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Arg Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 41
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 41
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagg aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt gatgtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 42
<211> 310
<212> PRT
<213> 多肽序列
<400> 42
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Glu His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Asp Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 43
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 43
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccacgtcct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagg aacacctgtt tccaccagtt 120
aagaaagaac cggtcgtgga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt gatgtggaga tcgagaactt ccaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caacccgtgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 44
<211> 310
<212> PRT
<213> 多肽序列
<400> 44
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Arg Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Glu His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Val Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Asp Val
260 265 270
Glu Ile Glu Asn Phe Gln Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Arg Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 45
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 45
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacaga accacctgtt tccaccagtt 120
aagaaagaac cggtcgtgga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt ccaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caacccgtgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 46
<211> 310
<212> PRT
<213> 多肽序列
<400> 46
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Asn His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Val Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Gln Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Arg Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 47
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 47
atgccattag atcctgtgat tcaacaagtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtacgtgcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgt tggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgattat gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaga aggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctaccg ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 48
<211> 310
<212> PRT
<213> 多肽序列
<400> 48
Met Pro Leu Asp Pro Val Ile Gln Gln Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Val Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Val Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Tyr Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Glu Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Thr Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 49
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 49
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagg aacacctgtt tccaccagtt 120
aagaaagaac cggtcgtgga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtcgtgcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 50
<211> 310
<212> PRT
<213> 多肽序列
<400> 50
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Glu His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Val Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Arg Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 51
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 51
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacaga accacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caacccgtgc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 52
<211> 310
<212> PRT
<213> 多肽序列
<400> 52
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Asn His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Arg Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 53
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 53
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 54
<211> 310
<212> PRT
<213> 多肽序列
<400> 54
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 55
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 55
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgagttt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 56
<211> 310
<212> PRT
<213> 多肽序列
<400> 56
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Ser Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 57
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 57
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacaggtt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 58
<211> 310
<212> PRT
<213> 多肽序列
<400> 58
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Val Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 59
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 59
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagg aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 60
<211> 310
<212> PRT
<213> 多肽序列
<400> 60
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Glu His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 61
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 61
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttttgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 62
<211> 310
<212> PRT
<213> 多肽序列
<400> 62
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Phe Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 63
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 63
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtattca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 64
<211> 310
<212> PRT
<213> 多肽序列
<400> 64
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Ile Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 65
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 65
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagccatt 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 66
<211> 310
<212> PRT
<213> 多肽序列
<400> 66
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Ile Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 67
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 67
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 68
<211> 310
<212> PRT
<213> 多肽序列
<400> 68
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 69
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 69
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaagatttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 70
<211> 310
<212> PRT
<213> 多肽序列
<400> 70
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Asp Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 71
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 71
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcaggtc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 72
<211> 310
<212> PRT
<213> 多肽序列
<400> 72
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gly Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 73
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 73
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tagtcagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtgacca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 74
<211> 310
<212> PRT
<213> 多肽序列
<400> 74
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Ser Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asp Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 75
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 75
atgccattag atcctgtgat tcaatatgtg ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacaggtt cgttcacaac aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtct tcttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 76
<211> 310
<212> PRT
<213> 多肽序列
<400> 76
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Val Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Leu Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 77
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 77
atgccattag atcctgtgat tcaatatgtg ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacattgg tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatacg 840
attcatggct tcgcgcagtt ttattctatt agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 78
<211> 310
<212> PRT
<213> 多肽序列
<400> 78
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Ile Gly Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Thr Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Ile Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 79
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 79
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacatggg tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatatg 840
attcatggct tcgcgcagtt ctattctatt agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 80
<211> 310
<212> PRT
<213> 多肽序列
<400> 80
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Met Gly Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Met Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Ile Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 81
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 81
atgccattag atcctgtgat tcaatatatg ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacttggg tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatcta 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 82
<211> 310
<212> PRT
<213> 多肽序列
<400> 82
Met Pro Leu Asp Pro Val Ile Gln Tyr Met Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Gly Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 83
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 83
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tagtcagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttacgatcca gcacatccac cagcaagtat tcttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggtaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 84
<211> 310
<212> PRT
<213> 多肽序列
<400> 84
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Ser Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 85
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 85
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tagtcagttt cgttcacagc aacatctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcggg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttacgatcca gcacatccac cagcaagtct tcttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggtaaactt 780
tacgctgaag ccctgaccaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 86
<211> 310
<212> PRT
<213> 多肽序列
<400> 86
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Ser Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Leu Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Thr Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 87
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 87
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tagtcagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtct tcttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggtaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 88
<211> 310
<212> PRT
<213> 多肽序列
<400> 88
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Ser Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Leu Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 89
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 89
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagccccc 60
gactacaagc acttaagcgc tcaacaagtt cgttcatggc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgggcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg atatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaagtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 90
<211> 310
<212> PRT
<213> 多肽序列
<400> 90
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Val Arg Ser
20 25 30
Trp Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 91
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 91
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagccatt 60
gactacaagc acttaagcgc tcaacaagtt cgttcatggc aacacctgtt tccaccagtt 120
aagaaagaac cggtccgcga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtacacgcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaatggg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg atatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctagag ccctgaacaa agcgggcgtt aaagtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 92
<211> 310
<212> PRT
<213> 多肽序列
<400> 92
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Ile Asp Tyr Lys His Leu Ser Ala Gln Gln Val Arg Ser
20 25 30
Trp Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Arg Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Thr Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Trp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Arg Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 93
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 93
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactggaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgggcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcggg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctatt agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 94
<211> 310
<212> PRT
<213> 多肽序列
<400> 94
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Trp Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Ile Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 95
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 95
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcaaaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacacc 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgaactt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 96
<211> 310
<212> PRT
<213> 多肽序列
<400> 96
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Lys Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Thr
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Asn Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 97
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 97
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcaaaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacacc 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgagctt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 98
<211> 310
<212> PRT
<213> 多肽序列
<400> 98
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Lys Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Thr
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Ser Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 99
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 99
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacctgtt tgaaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 100
<211> 310
<212> PRT
<213> 多肽序列
<400> 100
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Glu Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 101
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 101
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aaagcctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtacctgcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttggaccgc gggtgacctg gaaacgcatg atccgatgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacccg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatccagc cctttactgg ttttgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt actttttaac cggaggcatg atggattggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgaacgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcctg aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgagctt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 102
<211> 310
<212> PRT
<213> 多肽序列
<400> 102
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Leu Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Thr Ala Gly Asp Leu Glu Thr His Asp Pro Met
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Pro
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Gln Pro Phe Thr Gly Phe Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Phe Leu Thr Gly
195 200 205
Gly Met Met Asp Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Asn Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Leu Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Ser Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 103
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 103
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc tcaacagttt cgttcacagc aaagcctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtacctgcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gttggaccgc gggtgacctg gaaacgcatg atccgatgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt actttttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aacctggcag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgagctt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 104
<211> 310
<212> PRT
<213> 多肽序列
<400> 104
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Gln Gln Phe Arg Ser
20 25 30
Gln Gln Ser Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Leu Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Thr Ala Gly Asp Leu Glu Thr His Asp Pro Met
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Phe Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Trp Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Ser Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 105
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 105
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacctgtt tccaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgc gtctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgtgcact ggtttactac 240
catggtggcg gttgggttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaatggc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt actttttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc agtggcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 106
<211> 310
<212> PRT
<213> 多肽序列
<400> 106
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Pro Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Arg Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Trp Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Met
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Phe Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Val Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 107
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 107
atgccattag atcctgtgct tcaatatgtg ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacctgtt tgaaccagtt 120
aagaaagaac cggtcgctga agttcgcgaa ttcgacatgg acctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctc 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat cctggagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 108
<211> 310
<212> PRT
<213> 多肽序列
<400> 108
Met Pro Leu Asp Pro Val Leu Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Glu Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 109
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 109
atgccattag atcctgtgat tcaatatgtg ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacctgtt tgaaccagtt 120
aagaaagaac cggtcaaaga agttcgcgaa ttcgacatgg acctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctc 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 110
<211> 310
<212> PRT
<213> 多核苷酸序列
<400> 110
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Glu Pro Val Lys Lys Glu Pro Val Lys Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 111
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 111
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgc agctgccggg ccgtaccctg 180
aaagtccgta tgtacacgcc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 112
<211> 310
<212> PRT
<213> 多肽序列
<400> 112
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Gln Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Thr Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 113
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 113
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgcgcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 114
<211> 310
<212> PRT
<213> 多肽序列
<400> 114
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 115
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 115
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactggaagc acttaagcgc ttgccagttt cgttcacagc aacacatgtt ttggccagtt 120
aagaaagaac cggtcgccga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgcgcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 116
<211> 310
<212> PRT
<213> 多肽序列
<400> 116
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Trp Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Met Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 117
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 117
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atatggcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 118
<211> 310
<212> PRT
<213> 多肽序列
<400> 118
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Met Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 119
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 119
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacctgtt tgaaccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atccagcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcacagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 120
<211> 310
<212> PRT
<213> 多肽序列
<400> 120
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Leu Phe Glu Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Pro Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 121
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 121
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgcgcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgtgttt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 122
<211> 310
<212> PRT
<213> 多肽序列
<400> 122
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Cys Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 123
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 123
atgttgttag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgcgcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
ctgatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 124
<211> 310
<212> PRT
<213> 多肽序列
<400> 124
Met Leu Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Leu Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310
<210> 125
<211> 930
<212> DNA
<213> 多核苷酸序列
<400> 125
atgccattag atcctgtgat tcaatatgtc ctcgatcaac tgaaccgtat gccagcccct 60
gactacaagc acttaagcgc ttgccagttt cgttcacagc aacacacgtt ttggccagtt 120
aagaaagaac cggtcgcaga agttcgcgaa ttcgacatgg atctgccggg ccgtaccctg 180
aaagtccgta tgtaccgccc ggaaggtgtt gaaccaccat atcgcgcact ggtttactac 240
catggtggcg gtggcgttgc gggtgacctg gaaacgcatg atccggtgtg tcgtgtgttg 300
gcgaaagatg gacgcgcagt ggtgtttagc gttgactacc gtctggcacc agaacacaag 360
tttccagcgg cagttgaaga cgcgtatgat gcactgcaat ggattgcaga acgtgcagcc 420
gatttccatc ttgatccagc acgcattgca gttggcggcg attcagcagg cggcaacctg 480
gcggccgtga ctagtattct ggcgaaagaa cgtggtggtc cagcaattgc gtttcaactg 540
caaatctatc cctttactgg ttatgatcca gcacatccac cagcaagtat ccttgagaat 600
gcggagggtt acctgttaac cggaggcatg atgctgtggt ttcgtaatca gtacctgaac 660
agccttgagg aactgactca cccatggttt agtccagtgc tgtacccgga tcttagcggt 720
ttaccaccgg cgtacattgc aaccgcacag tacgatcccc tgcgcgatgt cggcaaactt 780
tacgctgaag ccctgaacaa agcgggcgtt aaggtggaga tcgagaactt cgaggatctg 840
attcatggct tcgcgcagtt ctattctctg agcccaggcg caaccaaagc actggtacgt 900
attgccgaga aactgcgcga tgcgttggcg 930
<210> 126
<211> 310
<212> PRT
<213> 多肽序列
<400> 126
Met Pro Leu Asp Pro Val Ile Gln Tyr Val Leu Asp Gln Leu Asn Arg
1 5 10 15
Met Pro Ala Pro Asp Tyr Lys His Leu Ser Ala Cys Gln Phe Arg Ser
20 25 30
Gln Gln His Thr Phe Trp Pro Val Lys Lys Glu Pro Val Ala Glu Val
35 40 45
Arg Glu Phe Asp Met Asp Leu Pro Gly Arg Thr Leu Lys Val Arg Met
50 55 60
Tyr Arg Pro Glu Gly Val Glu Pro Pro Tyr Arg Ala Leu Val Tyr Tyr
65 70 75 80
His Gly Gly Gly Gly Val Ala Gly Asp Leu Glu Thr His Asp Pro Val
85 90 95
Cys Arg Val Leu Ala Lys Asp Gly Arg Ala Val Val Phe Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu His Lys Phe Pro Ala Ala Val Glu Asp Ala
115 120 125
Tyr Asp Ala Leu Gln Trp Ile Ala Glu Arg Ala Ala Asp Phe His Leu
130 135 140
Asp Pro Ala Arg Ile Ala Val Gly Gly Asp Ser Ala Gly Gly Asn Leu
145 150 155 160
Ala Ala Val Thr Ser Ile Leu Ala Lys Glu Arg Gly Gly Pro Ala Ile
165 170 175
Ala Phe Gln Leu Gln Ile Tyr Pro Phe Thr Gly Tyr Asp Pro Ala His
180 185 190
Pro Pro Ala Ser Ile Leu Glu Asn Ala Glu Gly Tyr Leu Leu Thr Gly
195 200 205
Gly Met Met Leu Trp Phe Arg Asn Gln Tyr Leu Asn Ser Leu Glu Glu
210 215 220
Leu Thr His Pro Trp Phe Ser Pro Val Leu Tyr Pro Asp Leu Ser Gly
225 230 235 240
Leu Pro Pro Ala Tyr Ile Ala Thr Ala Gln Tyr Asp Pro Leu Arg Asp
245 250 255
Val Gly Lys Leu Tyr Ala Glu Ala Leu Asn Lys Ala Gly Val Lys Val
260 265 270
Glu Ile Glu Asn Phe Glu Asp Leu Ile His Gly Phe Ala Gln Phe Tyr
275 280 285
Ser Leu Ser Pro Gly Ala Thr Lys Ala Leu Val Arg Ile Ala Glu Lys
290 295 300
Leu Arg Asp Ala Leu Ala
305 310

Claims (52)

1.羧酸酯酶多肽,其包含与SEQ ID NO:4所示的氨基酸序列或其功能片段至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的氨基酸序列,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:与SEQ IDNO:4中的X198对应的残基选自:非极性残基、芳香族残基和脂肪族残基。
2.如权利要求1所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X198选自:F、L、I、Y和M。
3.如权利要求1或2所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列与SEQID NO:4所示的氨基酸序列相比,在选自以下的至少一个残基位置处包含残基差异:X27、X30、X35、X37、X57、X75、X103、X185、X207、X208、X271、X286和X296。
4.如权利要求1、2或3所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一种选自以下的特征:
与X27对应的残基是受约束的残基;
与X30对应的残基是脂肪族残基;
与X35对应的残基选自碱性残基和极性残基;
与X37对应的残基选自脂肪族残基和极性残基;
与X57对应的残基是非极性残基;
与X75对应的残基选自碱性残基和极性残基;
与X103对应的残基选自脂肪族残基和芳香族残基;
与X185对应的残基选自非极性残基、脂肪族残基和芳香族残基;
与X207对应的残基选自酸性残基和极性残基;
与X208对应的残基选自脂肪族残基、碱性残基和极性残基;
与X271对应的残基选自酸性残基和极性残基;
与X286对应的残基选自非极性残基、脂肪族残基、极性残基和小残基;和
与X296对应的残基选自脂肪族残基和碱性残基。
5.如权利要求3或4所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:X27是P;X30选自I、L和V;X35是H;X37选自I、L、T和V;X57是M;X75是R;X103选自F、M和W;X185选自F、I和M;X207是E;X208选自R、L和H;X271是D;X286选自M、V和G;和X296选自V、L和R。
6.如权利要求3或4所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X35选自碱性残基和极性残基;并且X185选自极性残基和脂肪族残基。
7.如权利要求3、4、5或6所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X35是H;并且X185选自F、I和M。
8.如权利要求1所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列与SEQ IDNO:24所示的氨基酸序列相比,在选自以下的至少一个残基位置处包含残基差异:X9、X19、X34、X35、X37、X46、X48、X66、X87、X103、X139、X190、X207、X216、X263、X271、X278和X296。
9.如权利要求8所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征中的至少一个:
与X9对应的残基是芳香族残基;
与X19对应的残基选自碱性残基和极性残基;
与X34对应的残基选自受约束的残基、酸性残基和极性残基;
与X35对应的残基选自极性残基;
与X46对应的残基是脂肪族残基;
与X48对应的残基是脂肪族残基;
与X66对应的残基是脂肪族残基;
与X87对应的残基选自脂肪族残基和小残基;
与X103对应的残基选自芳香族残基;
与X139对应的残基是碱性残基;
与X190对应的残基是芳香族残基;
与X207对应的残基是碱性残基;
与X216对应的残基选自芳香族残基、碱性残基和极性残基;
与X263对应的残基选自脂肪族残基和极性残基;
与X271对应的残基选自酸性残基和极性残基;
与X278对应的残基选自脂肪族残基和芳香族残基,
与X296对应的残基选自脂肪族残基和碱性残基。
10.如权利要求8或9所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征中的至少一个:X9是Y;X19是R;X34选自E、N和P;X35是S,X37是T;X46选自I、L和V;X48是L;X66是V;X87是A;X103选自W和F;X139是R;X190是Y;X207是E;X216选自N和W;X263选自T和A;X271是D;X278选自W和L;和X296选自V,L和R。
11.如权利要求8或9所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X9是芳香族残基,并且X87是脂肪族残基。
12.如权利要求8、9、10或11所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X9是Y;并且X87是A。
13.如权利要求1所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列与SEQ IDNO:54所示的氨基酸序列相比,在选自以下的至少一个残基位置处包含残基差异:X20、X28、X29、X30、X33、X34、X188、X216和X286。
14.如权利要求13所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:
与X20对应的残基选自脂肪族残基和碱性残基;
与X28对应的残基选自酸性残基、极性残基和受约束的残基。
与X29对应的残基选自酸性残基和极性残基;
与X30对应的残基是脂肪族残基;
与X33对应的残基是芳香族残基;
与X34对应的残基是小残基;
与X188对应的残基选自小残基和芳香族残基;
与X216对应的残基是极性残基;和
与X286对应的残基选自脂肪族残基、小残基、非极性残基和极性残基。
15.如权利要求12、13或14所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:X20选自I和R;X28选自D、P和S;X29是D;X30是V;X33是W;X34是G;X188选自G和F;X216是N;和X286选自S、M、V、G和A。
16.如权利要求13或14所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X216是极性残基。
17.如权利要求13、14、15或16所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X216是N。
18.如权利要求1所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列与SEQ IDNO:68所示的氨基酸序列相比,在选自以下的至少一个残基位置处包含残基差异:X10、X20、X22、X28、X30、X33、X36、X37、X46、X66、X75、X103、X197、X263、X266、X280和X290。
19.如权利要求18所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:
与X10对应的残基是脂肪族残基;
与X20对应的残基选自脂肪族残基和碱性残基;
与X22对应的残基是芳香族残基;
与X28对应的残基选自酸性残基、极性残基和受约束的残基;
与X30对应的残基是脂肪族残基;
与X33对应的残基是芳香族残基;
与X36对应的残基是脂肪族或芳香族残基;
与X37对应的残基是芳香族或小残基;
与X46对应的残基是碱性残基;
与X66对应的残基是极性残基;
与X75对应的残基是碱性残基;
与X103对应的残基是芳香族残基;
与X197对应的残基是脂肪族残基;
与X263对应的残基是碱性残基;
与X266对应的残基是极性残基;
与X280对应的残基选自脂肪族残基和极性残基;和
与X290对应的残基选自脂肪族残基和芳香族残基。
20.如权利要求18或19所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:X10选自L和M;X20选自I和R;X22是W;X28选自D、P和S;X30是V;X33是W;X36选自F、I和M;X37选自G和Y;X46是R;X66是T;X75是R;X103是W;X197是L;X263是R;X266是T;X280选自M和T;和X290选自W和I。
21.如权利要求18或19所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:X30是脂肪族残基,X33是芳香族残基,X75是碱性残基,和X103是芳香族残基。
22.如权利要求18、19、20或21所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括以下特征:X30是V;X33是W;X75是R;并且X103是W。
23.如权利要求1所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列与SEQ IDNO:68所示的氨基酸序列相比,在选自以下的至少一个残基位置处包含残基差异:X28、X38、X46、X54、X66、X75、X85、X86、X96、X160、X176、X183、X188、X205、X212、X248、X249、X255、X270和X286。
24.如权利要求23所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包含至少一个选自以下的特征:
与X28对应的残基选自酸性残基、极性残基、小残基和受约束的残基;
与X38对应的残基选自脂肪族残基和碱性残基;
与X46对应的残基选自酸性残基和碱性残基;
与X54对应的残基选自酸性残基和极性残基;
与X66对应的残基是极性残基;
与X75对应的残基是碱性残基;
与X85对应的残基选自芳香族或碱性残基和小残基;
与X86对应的残基是极性残基;
与X96对应的残基选自非极性残基和脂肪族残基;
与X160对应的残基选自极性残基和受约束的残基;
与X176对应的残基选自脂肪族残基、芳香族或碱性残基和非极性残基;
与X183对应的残基是非极性残基;
与X188对应的残基选自芳香族残基和小残基;
与X205对应的残基是芳香族残基;
与X212对应的残基是酸性残基;
与X248对应的残基是脂肪族残基;
与X249对应的残基是芳香族残基;
与X255对应的残基是极性残基;
与X270对应的残基选自脂肪族残基和极性残基;和
与X286对应的残基选自脂肪族残基、非极性残基、小残基和极性残基。
25.如权利要求23或24所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽的氨基酸序列包括至少一个选自以下的特征:X28选自C、D、S、H、P、G和R;X38选自E和L;X46选自K、R和Q;X54选自R、Q和S;X66选自L、T和V;X75是R;X85选自G和H;X86是T;X96选自M和L;X160选自T和P;X176选自M、L和H;X183是Q;X188选自G和F;X205是F;X212是D;X248是V;X249是W;X255是N;X270选自N和L;和X286选自M、V、G、N和S。
26.如权利要求23、24或25所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽包含氨基酸序列,其包括至少一个选自以下的特征:X28是极性残基,X38是碱性残基,和X85是小残基。
27.如权利要求23、24、25或26所述的羧酸酯酶多肽,其中所述多肽包含氨基酸序列,其包括以下特征:X28是C;X38是E;并且X85是G。
28.羧酸酯酶多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:100所示的氨基酸序列相比,在选自以下的一个残基位置处包含残基差异:X7、X22、X36、X38、X46、X54、X66和X75。
29.如权利要求28所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽包含氨基酸序列,所述氨基酸序列包括至少一个选自以下的特征:
与X7对应的残基是脂肪族残基;
与X22对应的残基选自脂肪族残基和芳香族残基;
与X36对应的残基选自极性残基和非极性残基;
与X38对应的残基是芳香族残基;
与X46对应的残基选自极性残基和碱性残基;
与X54对应的残基选自极性残基和碱性残基;
与X66对应的残基是极性残基;和
与X75对应的残基选自碱性残基和非极性残基。
30.如权利要求28或29所述的羧酸酯酶多肽,其中所述氨基酸序列包括至少一个选自以下的特征:X7是L;和X22选自W和L;X36选自T和M;X38是W;X46选自K和Q;X54选自S、Q和K;X66选自G和T;和X75选自M和R。
31.如权利要求28、29或30所述的羧酸酯酶多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包括至少一个选自以下的特征:X36是极性残基,X38是芳香族残基,和X75是碱性残基;在又一个实施方案中,改善的羧酸酯酶多肽包含氨基酸序列,其包括以下特征:X36是T;X38是W;并且X75是R。
32.如权利要求1所述的羧酸酯酶多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列与SEQ ID NO:114所示的氨基酸序列相比,在选自以下的一个残基位置处包含残基差异:X2、X181和X286。
33.如权利要求32所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽包含氨基酸序列,所述氨基酸序列包括至少一个选自以下的特征:与X2对应的残基选自脂肪族残基、碱性残基、极性残基和芳香族残基;与X181对应的残基是碱性残基;和与X286对应的残基选自极性残基和非极性残基。
34.如权利要求32或33所述的羧酸酯酶多肽,其中所述氨基酸序列包括至少一个选自以下的特征:X2选自L、Q、R和H;X181是Q;和X286选自C和S。
35.如权利要求32、33或34所述的羧酸酯酶多肽,所述羧酸酯酶多肽包含氨基酸序列,所述氨基酸序列包括至少一个选自以下的特征:X286是非极性残基。
36.如权利要求32、33、34或35所述的羧酸酯酶多肽,其中所述羧酸酯酶多肽包含氨基酸序列,其包括以下特征:X286是C。
37.如权利要求1所述的羧酸酯酶多肽,其中所述氨基酸序列对应于以下中任一项所示的氨基酸序列:SEQ ID NO:122、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、124或126。
38.羧酸酯酶多肽,其包含SEQ ID NO:122所示的氨基酸序列。
39.多核苷酸,其编码前述权利要求中任一项所述的多肽。
40.组合物,其包含至少一种如权利要求1-39中任一项所述的工程化羧酸酯酶。
41.如权利要求39所述的多核苷酸,其中所述多核苷酸对应于以下所示的任一种核苷酸序列:SEQ ID NO:121、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、123或125。
42.多核苷酸序列,其编码SEQ ID NO:122所示的羧酸酯酶多肽序列。
43.编码羧酸酯酶多肽的多核苷酸,其中所述多核苷酸包含SEQ ID NO:121所示的多核苷酸序列。
44.用于制备酰胺的方法,其中将组分组合,所述组分含有:
(a)R1-COOR2形式的酯底物,其中R1选自:具有0至3个烷基取代基的sp3碳;和芳香环,并且R2选自:甲基;乙基;和1-6个碳的烷基链;
(b)胺底物;
(c)如权利要求1至38中任一项所述的羧酸酯酶多肽;和
(d)溶剂。
45.如权利要求44所述的方法,其中在存在盐的情况下制备步骤(c)中的羧酸酯酶多肽。
46.如权利要求45所述的方法,其中所述盐选自:硫酸钠、硫酸钾、硫酸锂、磷酸钠和磷酸钾。
47.如权利要求44所述的方法,其中所述溶剂是选自以下的有机溶剂和水:甲苯;2-甲基四氢呋喃;四氢呋喃;二甲基乙酰胺;甲基异丁基酮(MIBK);二氯甲烷;叔丁基甲基醚;环戊基甲基醚;甲基环己烷;二氯甲烷;乙腈;甲乙酮;乙酸异丙酯;乙醇;异丙醇;乙酸乙酯;庚烷;xathane;和2-甲基四氢呋喃(2-Me-THF)。
48.如权利要求44、45、46或47所述的方法,其中相对于约0.5%(体积/体积)至约3%(体积/体积)量的所述酯底物,所述有机溶剂含有多达3摩尔当量的水。
49.如权利要求44、45、46、47或48所述的方法,其中所述酯底物是口恶唑5-羧酸乙酯,其具有下式:
Figure FDA0002539317950000081
所述胺底物是1-异丙基哌嗪,其具有下式:
Figure FDA0002539317950000091
并且所述酰胺是(4-异丙基哌嗪-1-基)(口恶唑-5基)甲酮,其具有下式:
Figure FDA0002539317950000092
50.如权利要求44、45、46、47、48或49所述的方法,其中所述酯底物是口恶唑5-羧酸乙酯,其具有下式:
Figure FDA0002539317950000093
所述胺底物是顺-2,6-二甲基吗啉,其具有下式:
Figure FDA0002539317950000094
并且所述酰胺是((2S,6R)-2,6-二甲基吗啉代)(口恶唑-5-基)甲酮,其具有下式:
Figure FDA0002539317950000095
51.如权利要求44所述的方法,其中所述反应包含:约40g/L口恶唑5-羧酸乙酯、约44g/L 1-异丙基哌嗪和约20g/L羧酸酯酶多肽,所述羧酸酯酶多肽对应于选自以下的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124和126,其中所述羧酸酯酶多肽在存在硫酸钠的情况下制备,并且在存在MIBK中的约10g/L至约20g/L水的情况下运行。
52.酰胺,其通过如权利要求44、45、46、47、48、49、50或51所述的方法制备。
CN201880080941.7A 2017-12-13 2018-12-13 羧酸酯酶催化剂 Pending CN111465688A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762598181P 2017-12-13 2017-12-13
US62/598,181 2017-12-13
PCT/IB2018/060042 WO2019116311A1 (en) 2017-12-13 2018-12-13 Carboxyesterase biocatalysts

Publications (1)

Publication Number Publication Date
CN111465688A true CN111465688A (zh) 2020-07-28

Family

ID=65139044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880080941.7A Pending CN111465688A (zh) 2017-12-13 2018-12-13 羧酸酯酶催化剂

Country Status (7)

Country Link
US (2) US11535833B2 (zh)
EP (1) EP3724324A1 (zh)
JP (2) JP7401435B2 (zh)
CN (1) CN111465688A (zh)
BR (1) BR112020011881A2 (zh)
CA (1) CA3085261A1 (zh)
WO (1) WO2019116311A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023521972A (ja) * 2020-04-10 2023-05-26 コデクシス, インコーポレイテッド 速度論的光学分割のためのカルボキシエステラーゼポリペプチド
CN115896065B (zh) * 2022-09-06 2023-08-11 江南大学 一种立体选择性羧酯酶、编码基因、载体及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004026871A1 (en) * 2002-09-17 2004-04-01 Eli Lilly And Company Novel pyrazolopyridine derivatves as pharmaceutical agents
WO2010111622A2 (en) * 2009-03-27 2010-09-30 Codexis, Inc. Amidases and methods of their use
CN106754818A (zh) * 2016-12-02 2017-05-31 华南理工大学 一种耐热酯酶突变体及其制备方法和应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
EP1036198B1 (en) 1997-12-08 2012-09-26 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
WO2002057411A2 (en) 2000-12-01 2002-07-25 Diversa Corporation Hydrolase enzymes and their use in kinetic resolution
BRPI0408157B8 (pt) * 2003-03-07 2021-05-25 Dsm Food Specialties B V ácido nucléico recombinante, polipeptídeo recombinante com atividade lipase, célula transformada, métodos empregando os mesmos e composição
CA2533838A1 (en) 2003-08-11 2005-02-24 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
US20090297495A1 (en) 2005-03-08 2009-12-03 Verenium Corporation Hydrolases, nucleic acids encoding them and methods for improving paper strength
WO2007092314A2 (en) * 2006-02-02 2007-08-16 Verenium Corporation Esterases and related nucleic acids and methods
KR20090083900A (ko) 2006-10-02 2009-08-04 코덱시스, 인코포레이티드 입체이성질체적으로 순수한 스타틴 및 이의 합성 중간체 제조용 조성물 및 제조 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004026871A1 (en) * 2002-09-17 2004-04-01 Eli Lilly And Company Novel pyrazolopyridine derivatves as pharmaceutical agents
WO2010111622A2 (en) * 2009-03-27 2010-09-30 Codexis, Inc. Amidases and methods of their use
CN106754818A (zh) * 2016-12-02 2017-05-31 华南理工大学 一种耐热酯酶突变体及其制备方法和应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
无: "WP_012812080.1" *
无: "WP_076345770.1" *

Also Published As

Publication number Publication date
US20230193227A1 (en) 2023-06-22
WO2019116311A1 (en) 2019-06-20
US11535833B2 (en) 2022-12-27
CA3085261A1 (en) 2019-06-20
US20210115417A1 (en) 2021-04-22
JP7401435B2 (ja) 2023-12-19
BR112020011881A2 (pt) 2020-11-24
JP2021506258A (ja) 2021-02-22
JP2023153961A (ja) 2023-10-18
EP3724324A1 (en) 2020-10-21

Similar Documents

Publication Publication Date Title
CN102884178B (zh) 拉唑化合物的合成
CN110592058B (zh) 苏氨酸醛缩酶、其编码基因和在屈昔多巴生物合成中的应用
US20230193227A1 (en) Carboxyesterase biocatalysts
CN113151201B (zh) 高热稳定性高活性异丁香酚单加氧酶突变体及其应用
CN112626057B (zh) 一种嵌合型植物腈水解酶突变体、编码基因及其应用
CN108795893B (zh) 一种氨基酸脱氢酶突变体及其制备方法和应用
CN111411095B (zh) 一种重组(R)-ω-转氨酶及其突变体和应用
JP5516664B2 (ja) N−アセチル−(R,S)−β−アミノ酸アシラーゼ遺伝子
CN111518783B (zh) 重组(R)-ω-转氨酶、突变体及其在制备西他列汀中的应用
CN109072215A (zh) 一种头孢菌素c酰化酶突变体及其应用
CN111100851B (zh) 醇脱氢酶突变体及其在手性双芳基醇化合物合成中的应用
CN115109770B (zh) 苯甲醛裂解酶突变体及在制备1,4-二羟基-2-丁酮中的应用
CN114277020B (zh) 一种腈水解酶突变体、工程菌及其应用
CN105950595B (zh) (-)-γ-内酰胺酶、基因、突变体、载体及其制备与应用
CN111699250B (zh) 用于酰胺偶联的羧酸酯酶多肽
CN109182286B (zh) 一种改进的氰基还原酶及其在合成3-氯吡嗪-2甲胺中的应用
JP5119783B2 (ja) N−アセチル−(R,S)−β−アミノ酸アシラーゼ遺伝子
CN114736882B (zh) 一种单胺氧化酶及其应用
CN114657167B (zh) 一种脱羧酶及5-羟色胺的制备方法
CN112852770B (zh) 醇脱氢酶突变体及其在高效不对称还原制备手性双芳基醇化合物中的应用
WO2006008872A1 (ja) L体アミノ酸アミド不斉加水分解酵素及びそれをコードするdna
CN116515782A (zh) 一种胺脱氢酶突变体及其在手性胺醇化合物合成中的应用
CN116732009A (zh) 一种重组二肽酶突变体及其在l-肌肽生产中的应用
CN111876435A (zh) 一种海洋嗜热胶原蛋白酶a69及其编码基因与应用
CN117264935A (zh) 一种苯丙氨酸解氨酶突变体及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination