CN110191958A - 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法 - Google Patents

生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法 Download PDF

Info

Publication number
CN110191958A
CN110191958A CN201780083960.0A CN201780083960A CN110191958A CN 110191958 A CN110191958 A CN 110191958A CN 201780083960 A CN201780083960 A CN 201780083960A CN 110191958 A CN110191958 A CN 110191958A
Authority
CN
China
Prior art keywords
leu
ser
gly
val
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780083960.0A
Other languages
English (en)
Other versions
CN110191958B (zh
Inventor
辻千寻
三原康博
中野祥吾
本山智晴
伊藤创平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN110191958A publication Critical patent/CN110191958A/zh
Application granted granted Critical
Publication of CN110191958B publication Critical patent/CN110191958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0075Heparin; Heparan sulfate; Derivatives thereof, e.g. heparosan; Purification or extraction methods thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03017Heparosan-N-sulfate-glucuronate 5-epimerase (5.1.3.17)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Materials Engineering (AREA)
  • Polymers & Plastics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了生产具有经异构化的己糖醛酸残基的肝素前体(heparosan)化合物的方法以及以改善的C5‑差向异构化效率生产硫酸乙酰肝素的方法。具体地,本发明提供了生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法,所述方法包括在存在选自由以下(A)至(F)组成的组的蛋白质的情况下,从肝素前体化合物生产所述具有经异构化的己糖醛酸残基的肝素前体化合物:(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D‑葡糖醛酸基C5‑差向异构酶活性;(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D‑葡糖醛酸基C5‑差向异构酶活性;(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D‑葡糖醛酸基C5‑差向异构酶活性;和(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D‑葡糖醛酸基C5‑差向异构酶活性。

Description

生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法
技术领域
本发明涉及生产具有经异构化的己糖醛酸残基的肝素前体(heparosan)化合物的方法和生产硫酸乙酰肝素的方法。
背景技术
肝素是一种硫酸乙酰肝素并具有抗凝血活性的化合物。动物来源的肝素在质量控制方面存在问题。并且已经研究生产和开发质量控制的非动物来源的肝素。生产非动物来源的肝素的方法的实例包括通过对使用微生物生产的肝素前体进行诸如硫酸化和异构化的反应来生产肝素的方法(专利文献1和2,非专利文献1至3)。
肝素前体是由葡糖醛酸(GlcA)残基和N-乙酰-D-葡糖胺(GlcNAc)残基组成的二糖的重复结构[→4)-β-D-GlcA-(1→4)-α-D-GlcNAc-(1→]组成的多糖。肝素具有以下结构,其中肝素前体中的一部分D-葡糖醛酸残基异构化为α-L-艾杜糖醛酸(IdoA),其是差向异构体。因此,为了从肝素前体生产硫酸乙酰肝素如肝素,需要使部分己糖醛酸残基异构化的反应,即,使部分D-葡糖醛酸残基异构化为α-L-艾杜糖醛酸的反应(C5-差向异构化反应)。C5-差向异构化反应包括使用D-葡糖醛酸基C5-差向异构酶的酶促规程。作为C5-差向异构酶,迄今已报道了哺乳动物来源的C5-差向异构酶的利用(专利文献1至3,非专利文献1至3)。另外,还鉴定了催化C5-差向异构化反应的海洋细菌来源的蛋白质(非专利文献4)。然而,它们都没有足够的C-5差向异构化活性。有必要获得更有效的酶。
现有技术参考文献
专利文献
专利文献1:美国专利号8,227,449
专利文献2:美国专利申请公开号2012-322114
专利文献3:WO 02/46379A
非专利文献
非专利文献1:Lindahl U.et al.(2005)J Med Chem 48(2):349-352
非专利文献2:Zhang Z.et al.(2008)Journal of the American ChemicalSociety 130(39):12998-13007
非专利文献3:Chen J,et al.,J Biol Chem.2005Dec 30;280(52):42817-25.
非专利文献4:John R,et al.,J Biol Chem.2013Aug 23;288(34):24332-9.
发明概述
本发明要解决的问题
本发明的目的是提供生产硫酸乙酰肝素的有效方法。
解决问题的手段
作为广泛研究的结果,本发明人已发现,使用与源自斑马鱼的D-葡糖醛酸基C5-差向异构酶具有80%或更高序列同源性的一系列蛋白质(见表4)可以有效地进行生产硫酸乙酰肝素所需的C5-差向异构化,并完成了本发明。
即,本发明如下所述。
[1]生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法,所述方法包括在存在选自由以下(A)至(F)组成的组的蛋白质的情况下,从肝素前体化合物生产所述具有经异构化的己糖醛酸残基的肝素前体化合物:
(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;
(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;
(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性。
[2]根据[1]的方法,
其中所述蛋白质(B)是(B')包含与SEQ ID NO:2的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质,和
其中所述蛋白质(E)是(E')包含与SEQ ID NO:5的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质。
[3]根据[1]或[2]的方法,其中所述蛋白质是选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
[4]根据[1]至[3]中任一项的方法,其中所述蛋白质源自斑马鱼。
[5]根据[1]至[4]中任一项的方法,其中在存在生产所述蛋白质的经转化的微生物或其提取物的情况下,生产所述具有经异构化的己糖醛酸残基的肝素前体化合物。
[6]根据[5]的方法,其中所述经转化的微生物是包含表达单元的宿主细胞,所述表达单元包含选自由以下(a)至(j)组成的组的多核苷酸和与其可操作地连接的启动子:
(a)多核苷酸,其包含SEQ ID NO:1的核苷酸序列;
(b)多核苷酸,其包含与SEQ ID NO:1的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(c)多核苷酸,其在严格条件下与由与SEQ ID NO:1的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(d)多核苷酸,其包含SEQ ID NO:3的核苷酸序列;
(e)多核苷酸,其包含与SEQ ID NO:3的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(f)多核苷酸,其在严格条件下与由与SEQ ID NO:3的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(g)多核苷酸,其包含SEQ ID NO:4的核苷酸序列;
(h)多核苷酸,其包含与SEQ ID NO:4的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(i)多核苷酸,其在严格条件下与由与SEQ ID NO:4的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j)选自由(a)至(i)组成的组的多核苷酸的简并突变体。
[7]根据[6]的方法,
其中所述多核苷酸(b)是(b')包含与SEQ ID NO:1的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸,
其中所述多核苷酸(e)是(e')包含与SEQ ID NO:3的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸,并且
其中所述多核苷酸(h)是(h')包含与SEQ ID NO:4的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸。
[8]根据[6]或[7]的方法,其中所述多核苷酸是选自由以下(e1)至(j1)组成的组的多核苷酸:
(e1)多核苷酸,其包含选自由SEQ ID NO:55、58、61、64和67组成的组的核苷酸序列;
(e2)多核苷酸,其包含与选自由SEQ ID NO:58、61、64和67组成的组的核苷酸序列具有95%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j1)多核苷酸(e1)或(e2)的简并突变体。
[9]根据[6]至[8]中任一项的方法,其中所述经转化的微生物是属于埃希氏菌属的细菌。
[10]根据[9]的方法,其中所述经转化的微生物是大肠杆菌。
[11]根据[1]至[10]中任一项的方法,其中所述肝素前体化合物是经N-硫酸化的肝素前体。
[12]根据[1]至[11]中任一项的方法,其中所述肝素前体化合物是低分子化的肝素前体。
[13]生产硫酸乙酰肝素的方法,
所述方法包括对肝素前体进行处理以生产硫酸乙酰肝素,所述处理包括己糖醛酸残基的C5-差向异构化、己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的N-去乙酰化、α-D-葡糖胺残基的N-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化,
其中在存在选自以下(A)至(F)的蛋白质的情况下进行所述C5-差向异构化:
(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;
(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有80%或更高同一性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;
(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有80%或更高同一性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性。
[14]根据[13]的方法,
其中所述蛋白质(B)是(B')包含与SEQ ID NO:2的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质,和
其中所述蛋白质(E)是(E')包含与SEQ ID NO:5的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质。
[15]根据[13]或[14]的方法,其中所述蛋白质选自由以下(E1)至(F1)组成的组:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
[16]根据[13]至[15]中任一项的方法,其中所述处理进一步包括低分子化肝素前体。
[17]选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
附图简要说明
图1显示了编码源自斑马鱼的天然存在的D-葡糖醛酸基C5-差向异构酶的全长核苷酸序列(GenBank登录号:AY388517.1,SEQ ID NO:1)。该图中框内的序列显示了编码部分氨基酸序列(SEQ ID NO:2中的Gly70至Asn585:SEQ ID NO:5)的天然存在的核苷酸序列(SEQ ID NO:3)。
图2显示了源自斑马鱼的天然存在的D-葡糖醛酸基C5-差向异构酶的全长氨基酸序列(GenBank登录号:AY388517.1,SEQ ID NO:2)。该图中框内的序列(从Gly70至Asn585的部分氨基酸序列)对应于SEQ ID NO:5(参见实施例2)。
图3显示了编码来自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(SEQ ID NO:5)的密码子优化的核苷酸序列(SEQ ID NO:4)(参见实施例2)。
具体实施方式
本发明提供了生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法。本发明的方法包括在存在选自由以下(A)至(F)组成的组的蛋白质的情况下,从肝素前体化合物生产所述具有经异构化的己糖醛酸残基的肝素前体化合物:
(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;
(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;
(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性。
本发明中使用的蛋白质可以是选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
本发明中的“肝素前体化合物”包括肝素前体和肝素前体衍生物。可以例如通过利用具有生产肝素前体能力的微生物的发酵方法生产肝素前体(例如WO2015/050184)。
本发明中的“肝素衍生物”是指具有一个或多个(例如,1、2、3、4、5或6个)选自以下由(1)至(6)组成的组的修饰的肝素前体:
(1)低分子化;
(2)肝素前体中α-D-葡糖胺残基的N-乙酰基的N-去乙酰化(例如,部分N-去乙酰化);
(3)肝素前体中α-D-葡糖胺残基的氨基的N-硫酸化;
(4)肝素前体中的己糖醛酸残基的位置2处的羟基的硫酸化(2-O-硫酸化);
(5)α-D-葡糖胺残基的位置3处的羟基的硫酸化(3-O-硫酸化);和
(6)α-D-葡糖胺残基的位置6处的羟基的硫酸化(6-O-硫酸化)。
此类衍生物可以通过利用α-D-葡糖胺残基的N-去乙酰化、低分子化、α-D-葡糖胺残基的N-硫酸化、己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化来获得,如下所述。
在一个实施方案中,肝素前体化合物可以是经N-硫酸化的肝素前体。经N-硫酸化的肝素前体可以通过例如对肝素前体进行N-去乙酰化(优选地部分N-去乙酰化)和N-硫酸化来获得,如下所述。
在另一个实施方案中,肝素前体化合物可以是小分子肝素前体化合物。小分子肝素前体化合物可以通过例如对肝素前体进行低分子化的处理来获得,如下所述。
在优选的实施方案中,肝素前体化合物可以是经N-硫酸化的小分子肝素前体。经N-硫酸化的小分子肝素前体可以通过例如对肝素前体化合物进行N-去乙酰化(优选地部分N-去乙酰化)、分解成低分子和N-硫酸化的处理来获得,如下所述。
在本发明中,术语“己糖醛酸(HexA)”用作β-D-葡糖醛酸(GlcA)和α-L-艾杜糖醛酸(IdoA)的包括性术语。除非另有说明,术语“己糖醛酸(HexA)”,即术语“β-D-葡糖醛酸(GlcA)”和“α-L-艾杜糖醛酸(IdoA)”包括根据本发明的方法的实施方案的所有可能的衍生物。除非另有说明,术语“α-D-葡糖胺”包括根据本发明的方法的实施方案的所有可能的衍生物。在具有C-4和C-5之间双键的HexA残基中,不区分IdoA残基和GlcA残基。因此,当计算鉴定多糖如本发明的多糖的每个参数时,除非另有说明,否则认为此类HexA残基是对应于HexA残基但既不对应于IdoA残基也不对应于GlcA残基的残基。
在本发明中,“具有经异构化的己糖醛酸残基的肝素前体化合物”是具有葡糖醛酸(GlcA)残基的一部分异构化为艾杜糖醛酸(IdoA)残基的化合物。葡糖醛酸(GlcA)残基异构化为艾杜糖醛酸(IdoA)残基称为“C5-差向异构化”。“D-葡糖醛酸基C5-差向异构酶活性”是可以催化葡糖醛酸(GlcA)残基异构化为艾杜糖醛酸(IdoA)残基(C5-差向异构化)的活性。C5-差向异构化的反应条件可以由本领域技术人员适当地配置。作为C5-差向异构化的反应条件,可以参考先前报道的条件(Chen J,et al.,"Enzymatic redesigning ofbiologically active heparan sulfate."J.Biol.Chem.2005Dec 30;280(52):42817-25)。具体地,C5-差向异构化的反应条件包括例如实施例中描述的条件。C5-差向异构化的程度(即差向异构化比率)可以例如通过二糖分析确认。也就是说,差向异构化比率可以计算为当对多糖进行二糖分析时具有IdoA残基的二糖单元的量相对于具有IdoA残基或GlcA残基的二糖单元的总量的百分比(摩尔比率)。
SEQ ID NO:5的氨基酸序列对应于SEQ ID NO:2的氨基酸序列的部分氨基酸序列(Gly70至Asn585)并且具有包括膜锚定位点的氨基酸序列(Met1至Gly69)的缺失。SEQ IDNO:56、59、62、65和68的氨基酸序列是通过修饰SEQ ID NO:5的氨基酸序列获得的氨基酸序列。
在蛋白质(B)或(E)中,与SEQ ID NO:2或5的氨基酸序列的同源性百分比可以为80%或更高、81%或更高、82%或更高、83%或更高、84%或更高、85%或更高、86%或更高、87%或更高、88%或更高、89%或更高、90%或更高、91%或更高、92%或更高、93%或更高、94%或更高、95%或更高、96%或更高、97%或更高、98%或更高或99%或更高。在蛋白质(E2)中,与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列的同源性百分比可以为95%或更高、96%或更高、97%或更高、98%或更高、99%或更高或99.5%或更高。上文所述的氨基酸序列和下文所述的核苷酸序列的同源性(即同一性或相似性)可以例如使用Karlin和Altscchul的算法BLAST(Pro.Natl.Acad.Sci.USA,90,5873(1993))和Pearson的FASTA(Methods Enzymol.,183,63(1990))来确定。基于此算法BLAST,已开发称为BLASTP和BLASTN的程序(见http://www.ncbi.nlm.nih.gov)并且可以使用这些程序在默认设置下计算同源性。对于同源性,可以使用例如当相似性以百分比计算时的值,所述值采用Lipman-Pearson方法,使用Genetyx Corporation的GENETYX Ver.7.0.9软件,使用ORF中编码的全长多肽部分,具有待比较的单位大小(Unit Size to Compare)=2的设置。或者,同源性可以是通过在NEEDLE程序(J.Mol.Biol.1970;48:443-453)搜索中的默认设置中通过使用参数(缺口罚分=10,延伸罚分=0.5以及矩阵=EBLOSUM62)获得的值(同一性)。在通过这些计算所得的同源性百分比的值中,可以使用最低值。对于同源性百分比,优选使用同一性百分比。
在蛋白质(C)、(F)或(F1)中,可以通过选自由氨基酸残基的缺失、取代、添加和插入组成的组的一个、两个、三个或四个突变修饰一个或几个氨基酸残基。可以将氨基酸残基的突变引入氨基酸序列中的一个区域或多个不同区域中。术语“一个或几个氨基酸残基”是指不会显著损害蛋白质的活性的氨基酸残基的数量。在蛋白质(C)和(F)中,术语“一个或几个”表示以下的数量,例如1至120,优选地1至110,更优选地1至100、1至90、1至80、1至75、1至70、1至60、1至50、1至40、1至30、1至25、1至20、1至10或1至5(例如1、2、3、4或5)。在蛋白质(F1)中,术语“一个或几个”表示以下的数量,例如1至25、1至20、1至10或1至5(例如1、2、3、4或5)。
选自由(A)至(F)和(E1)至(F1)组成的组的蛋白质具有D-葡糖醛酸基C5-差向异构酶活性,从而具有以下特性,即在具有经异构化的己糖醛酸残基的肝素前体化合物的具体生产中可以是优异的。当在特定条件下测量活性时,蛋白质(B)和(C)以及蛋白质(E)和(F)以及蛋白质(E2)和(F1)优选基于蛋白质(A)的活性以及基于蛋白质(D)的活性以及基于蛋白质(E1)的活性具有60%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、94%或更多、96%或更多、98%或更多的活性,或者分别具有与蛋白质(A)以及蛋白质(D)以及蛋白质(E1)相同或更高的活性。此类测量的特定条件的实例包括以下条件,其中将表达目标蛋白质的微生物的30%无细胞提取溶液(超声和离心微生物细胞后获得的上清液)添加到反应溶液(2mg/mL经N-硫酸化的肝素前体,50mM MES(pH7.0),1mM氯化钙)并且混合物在37℃反应30分钟或12小时。
只要可以维持目标特征,可以将突变引入蛋白质(B)、(C)、(E)、(F)、(E2)和(F1)的催化结构域内的部分和除催化结构域以外的部分。可以引入可以维持目标特征的突变的氨基酸残基的位置对于本领域技术人员是显而易见的。具体地,本领域技术人员可以1)比较具有相似类型特征的多种蛋白质的氨基酸序列,2)明晰相对保守的区域和相对非保守的区域,以及3)分别从相对保守的区域和相对非保守的区域预测可以对功能起重要作用的区域和不能对功能起重要作用的区域,并因此可以识别结构和功能相关性。因此,本领域技术人员可以确定可以在本发明中使用的蛋白质的氨基酸序列中引入突变的氨基酸残基的位置。
当氨基酸残基通过取代突变时,氨基酸残基的取代可以是保守取代。如本文所用,术语“保守取代”是指用具有相似侧链的氨基酸残基取代特定氨基酸残基。具有相似侧链的氨基酸残基的家族是本领域熟知的。家族的实例包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸和组氨酸),具有酸性侧链的氨基酸(例如天冬氨酸和谷氨酸),具有不带电荷的极性侧链的氨基酸(例如天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸和半胱氨酸),具有非极性侧链的氨基酸(例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸和色氨酸),具有β-位分支侧链的氨基酸(例如苏氨酸、缬氨酸和异亮氨酸),具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸),具有含羟基(例如醇和酚)侧链的氨基酸(例如丝氨酸、苏氨酸和酪氨酸),和具有含硫侧链的氨基酸(例如半胱氨酸和甲硫氨酸)。氨基酸的保守取代可以优选地是天冬氨酸和谷氨酸之间的取代,精氨酸、赖氨酸和组氨酸之间的取代,色氨酸和苯丙氨酸之间的取代,苯丙氨酸和缬氨酸之间的取代,亮氨酸、异亮氨酸和丙氨酸之间的取代,以及甘氨酸和丙氨酸之间的取代。
另外,本发明中使用的蛋白质可以是经由肽键与异源部分连接的融合蛋白。异源部分的实例包括促进目标蛋白纯化的肽组分(例如,标签部分如组氨酸标签和Strep标签II;蛋白质如谷胱甘肽-S-转移酶、麦芽糖结合蛋白及其突变体,其用于纯化目标蛋白),改善目标蛋白的溶解度的肽组分(例如,Nus-标签),作为伴侣蛋白起作用的肽组分(例如,触发因子),具有其他功能的肽组分(例如,全长蛋白质或其部分)和接头。
本发明中使用的蛋白质的实例包括源自斑马鱼的蛋白质,其天然存在的同源物和人工制备的突变体蛋白质。例如,突变体蛋白质可以通过将突变引入到编码目标蛋白的DNA中并使用获得的突变体DNA产生突变体蛋白质来获得。用于引入突变的方法的实例包括定点诱变和随机突变引入处理(例如,用突变剂和紫外线照射处理)。
在一个实施方案中,本发明的方法可以使用本发明中使用的蛋白质本身进行。对于在本发明中使用的蛋白质,可以使用天然蛋白质或重组蛋白质。重组蛋白质可以通过例如使用无细胞载体或从产生本发明中使用的蛋白质的微生物获得。本发明中使用的蛋白质可以用作未纯化的、粗略纯化的或纯化的蛋白质。在反应中这些蛋白质可以用作固定化的蛋白质,其固定化至固相。
本发明中使用的蛋白质通过已知方法分离,并根据情况进一步纯化,由此获得目标蛋白。生产蛋白质的微生物优选是经转化的微生物。当使用经转化的微生物时,获得目标蛋白作为无活性的目标蛋白聚集体,即蛋白质包涵体,其可以通过适当的方法激活。激活后,可以通过已知方法分离和纯化激活的蛋白质来获得目标蛋白。
用于培养微生物的培养基是已知的;碳源、氮源、维生素源等可以添加到营养培养基如LB培养基或基本培养基如M9培养基中。根据宿主,经转化的微生物通常在16℃至42℃,优选25℃至37℃下培养5小时至168小时,优选8小时至72小时。可以根据宿主进行振荡培养和静置培养两者;可以根据需要进行搅拌和通风。当放线菌用作表达宿主时,可以适当地使用可以用于生产目标蛋白的条件。当诱导型启动子用于表达目标蛋白时,也可以使用添加到培养基的启动子诱导物进行培养。
生产的目标蛋白可以通过已知的盐析,沉降如等电沉降和溶剂沉降,使用分子量差异的方法如透析、超滤和凝胶过滤,使用特定亲和力的方法如离子交换色谱法,使用疏水程度差异的方法,如疏水色谱和反相色谱、亲和色谱、SDS聚丙烯酰胺电泳、等电聚焦或其组合从经转化的微生物的提取物纯化并分离。当目标蛋白经以分泌方式表达时,通过离心等从通过培养经转化的微生物获得的培养液中除去细菌以获得含有目标蛋白的培养上清液。目标蛋白也可以从该培养的上清液纯化和分离。
在经转化的微生物的培养结束后,例如将通过离心收集的细菌悬浮在细菌压碎缓冲液(20mM至100mM的Tris-HCl(pH 8.0)和5mM的EDTA)中,并进行超声压碎约10分钟,由此可以破碎细菌。细菌破碎也可以用添加到培养液中的溶剂如甲苯进行。将该破碎处理溶液以12,000rpm离心10分钟,由此可以对上清液进行上述纯化操作。离心后的沉降物可以用氯化胍、尿素等溶解,以根据需要进一步纯化。当目标蛋白经以分泌方式表达时,在经转化的微生物的培养结束后,将培养液以12,000rpm离心10分钟,由此可以对上清液进行上述纯化操作。
具体地,目标蛋白的纯化可以例如如下进行。在宿主的培养结束后,将硫酸铵(2.8M)添加到培养上清液或细胞提取物进行沉降分级,并进一步进行操作如CM SephadexC-50或DEAE-Sephadex A-50离子交换柱层析或辛基-琼脂糖(Octyl-Sepharose)CL-4B或苯基-琼脂糖(Phenyl-Sepharose)CL-4B柱层析,由此可以将目标蛋白纯化至对其进行聚丙烯酰胺凝胶电泳时在凝胶上显示单一条带的程度。
可以通过测量D-葡糖醛酸基C5-差向异构酶活性来评估所得目标蛋白质的活性(例如,参见实施例)。
在另一个实施方案中,本发明的方法可以在存在经转化的微生物或其提取物的情况下进行,所述微生物生产本发明中使用的蛋白质。
对于生产本发明中使用的蛋白质的微生物的提取物,可以使用含有目标蛋白并通过任何方法处理的处理溶液。处理的实例包括上述分离和纯化中提及的方法和能够杀死微生物的杀微生物处理方法。对于杀微生物处理方法,可以使用能够杀死微生物的任何方法;其实例包括热处理、酸处理、碱处理、表面活性剂处理和有机溶剂处理。
在优选的实施方案中,经转化的微生物是包含表达单元的宿主细胞,所述表达单元包含选自由以下(a)至(j)组成的组的多核苷酸和与其可操作地连接的启动子:
(a)多核苷酸,其包含SEQ ID NO:1的核苷酸序列;
(b)多核苷酸,其包含与SEQ ID NO:1的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(c)多核苷酸,其在严格条件下与由与SEQ ID NO:1的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(d)多核苷酸,其包含SEQ ID NO:3的核苷酸序列;
(e)多核苷酸,其包含与SEQ ID NO:3的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(f)多核苷酸,其在严格条件下与由与SEQ ID NO:3的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(g)多核苷酸,其包含SEQ ID NO:4的核苷酸序列;
(h)多核苷酸,其包含与SEQ ID NO:4的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(i)多核苷酸,其在严格条件下与由与SEQ ID NO:4的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j)选自由(a)至(i)组成的组的多核苷酸的简并突变体。
本发明中使用的多核苷酸可以是选自由以下(e1)至(j1)组成的组的多核苷酸:
(e1)多核苷酸,其包含选自由SEQ ID NO:55、58、61、64和67组成的组的核苷酸序列;
(e2)多核苷酸,其包含与选自由SEQ ID NO:58、61、64和67组成的组的核苷酸序列具有95%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j1)多核苷酸(e1)或(e2)的简并突变体。
上述多核苷酸(a)至(j)和(e1)至(j1)可以是DNA或RNA,并且优选是DNA。SEQ IDNO:1的核苷酸序列编码SEQ ID NO:2的氨基酸序列。SEQ ID NO:3和4的核苷酸序列编码SEQID NO:5的氨基酸序列。SEQ ID NO:1的核苷酸序列是编码源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的天然存在的全长核苷酸序列(GenBank:AY388517.1)。SEQ ID NO:3是SEQ IDNO:1的核苷酸序列的部分序列,并且对应于从Gly70至Asn585的序列。SEQ ID NO:4的核苷酸序列是SEQ ID NO:3的核苷酸序列的简并突变体。SEQ ID NO:55、58、61、64和67的核苷酸序列分别编码SEQ ID NO:56、59、62、65和68的氨基酸序列。
在上述多核苷酸(b)、(e)或(h)中,核苷酸序列与SEQ ID NO:1、3或4的核苷酸序列的同源性%可以是80%或更多、81%或更多、82%或更多、83%或更多、84%或更多、85%或更多、86%或更多、87%或更多、88%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多或99%或更多。在上述多核苷酸(e2)中,与选自由SEQ ID NO:58、61、64和67组成的组的核苷酸序列的同源性%可以是95%或更多、96%或更多、97%或更多、98%或更多、99%或更多或99.5%或更多。
多核苷酸(c)、(f)或(i)中的术语“严格条件”是指其中形成所谓的特异性杂交体,而不形成非特异性杂交体的条件。严格条件的实例包括在约45℃下在6×SSC(氯化钠/柠檬酸钠)中杂交,随后在50℃至65℃下在0.2×SSC和0.1%SDS中洗涤一次或两次或更多次。
在多核苷酸(j)和(j1)中,术语“简并变体”是指多核苷酸突变体,其中变异之前的多核苷酸中的编码特定氨基酸残基的至少一个密码子已经变成编码相同氨基酸残基的另一个密码子。该简并变体是基于沉默突变的突变体,并且由简并变体编码的蛋白质与由变异之前的多核苷酸编码的蛋白质相同。
简并变体优选是其中密码子已经改变的多核苷酸突变体,以适应将要引入简并变体的宿主细胞的密码子使用频率。当基因由异源宿主细胞(例如微生物)表达时,由于密码子使用频率的差异,相应的tRNA分子种类未得以充分供应,这可能导致翻译效率降低和/或翻译不正确(例如,翻译停止)。例如,在大肠杆菌中,表1中列出的低频密码子是已知的。
表1.大肠杆菌中的低频密码子
氨基酸残基 密码子 低频密码子
Arg AGG/AGA/CGG/CGA/CGU/CGC AGG/AGA/CGG/CGA
Gly GGG/GGA/GGU/GGC GGA
Ile AUA/AUU/AUC AUA
Leu UUG/UUA/CUG/CUA/CUU/CUC CUA
Pro CCG/CCA/CCU/CCC CCC
鉴于这些情况,本发明可以使用适应于下述宿主细胞(例如微生物)的密码子使用频率的简并变体。在本发明的简并变体中,例如,编码一种或多种选自由精氨酸残基、甘氨酸残基、异亮氨酸残基、亮氨酸残基和脯氨酸残基组成的组的氨基酸残基的密码子可以得以改变。更具体地,在本发明的简并变体中,选自由低频密码子组成的组的一种或多种密码子(例如,AGG、AGA、CGG、CGA、GGA、AUA、CUA和CCC)可以得以改变。简并变体可以优选地含有选自下述组中的一种或多种(例如,一种、两种、三种、四种或五种)密码子的改变:
i)将选自由编码Arg的四种密码子(AGG、AGA、CGG和CGA)组成的组的至少一种密码子改变为编码Arg的另一密码子(CGU或CGC);
ii)将编码Gly的一种密码子(GGA)改变为另一密码子(GGG、GGU或GGC);
iii)将编码Ile的一种密码子(AUA)改变为另一密码子(AUU或AUC);
iv)将编码Leu的一种密码子(CUA)改变为另一密码子(UUG、UUA、CUG、CUU或CUC);和
v)将编码Pro的一种密码子(CCC)改变为另一密码子(CCG、CCA或CCU)。
当本发明的简并变体是RNA时,应如上所述使用核苷酸残基“U”,而当本发明的简并变体是DNA时,应使用“T”代替核苷酸残基“U”。适应于宿主细胞的密码子使用频率的核苷酸残基的突变数量(只要在突变之前和之后相同的蛋白质得以编码,其不限于特定数量)例如是1至400、1至300、1至200或1至100。
通过使用本领域已知的技术,可以基于任何宿主细胞的类型和基因组序列信息容易地鉴定低频密码子。因此,简并变体可以含有低频密码子改变为非低频密码子(例如,高频密码子)。考虑不仅低频密码子而且还有对生产菌株的基因组GC含量的适应性的因素设计突变体的方法是已知的(Alan Villalobos et al.,Gene Designer:a syntheticbiology tool for constructing artificial DNA segments,BMCBioinformatics.2006Jun 6;7:285.);可以使用此类方法。因此,可以根据可以引入突变体的任何宿主细胞(例如,下述微生物)的类型适当地制备上述突变体。
术语“表达单元”是指含有待表达为蛋白质的特定多核苷酸和可操作地连接于其上的启动子并且能够转录多核苷酸并最终产生由多核苷酸编码的蛋白质的最小单位。表达单元可以进一步含有元件如终止子、核糖体结合位点和耐药基因。表达单元可以是DNA或RNA,并优选是DNA。
表达单元相对于宿主细胞可以是同源的或异源的,并且优选是异源表达单元。术语“异源表达单元”意指表达单元相对于宿主细胞是异源的。因此,在本发明中,表达单元中含有的至少一种元件相对于宿主细胞是异源的。相对于宿主细胞异源的表达单元中含有的元件的实例包括上述元件。异源表达单元中含有的编码目标蛋白的多核苷酸和启动子之一或两者优选相对于宿主细胞是异源的。因此,在本发明中,编码目标蛋白和启动子的多核苷之一或两者源于宿主细胞以外的活体(例如,原核生物或真核生物、微生物、昆虫、植物,或动物如哺乳动物)或病毒或者是人工合成的。或者,编码目标蛋白的多核苷酸相对于宿主细胞可以是异源的。目标蛋白优选相对于宿主细胞是异源的。
异源表达单元中含有的启动子不限于特定的启动子,只要在宿主细胞中它可以表达由与其下游连接的多核苷酸编码的蛋白质。例如,启动子相对于宿主细胞可以是同源的或异源的。例如,可以使用通常用于生产重组蛋白的组成型或诱导型启动子。此类启动子的实例包括PhoA启动子、PhoC启动子、T7启动子、T5启动子、T3启动子、lac启动子、trp启动子、trc启动子、tac启动子、PR启动子、PL启动子、SP6启动子、阿拉伯糖诱导型启动子,冷激启动子和四环素诱导型启动子。可以优选使用在宿主细胞中具有强转录活性的启动子。在宿主细胞中具有强转录活性的启动子的实例包括在宿主细胞中高表达的基因的启动子和源自病毒的启动子。
在本发明中用作经转化的微生物的宿主细胞的实例包括各种微生物,包括属于埃希氏菌属的细菌(例如大肠杆菌)、放线菌和棒状细菌。在本发明中用作宿主细胞的大肠杆菌包括经常通常用于克隆和表达异源蛋白质的菌株如HB101、MC1061、JM109、CJ236和MV1184。在本发明中用作宿主细胞的放线菌包括经常通常用于表达异源蛋白质如浅青紫链霉菌(S.lividans)TK24和天蓝色链霉菌A3(2)的菌株。在本发明中用作宿主细胞的棒状细菌是需氧革兰氏阳性杆菌,其包括目前合并到棒状杆菌属中的细菌,尽管通常已被分类为短杆菌属(Int.J.Syst.Bacteriol.,41,255(1981))并且还包括属于短杆菌属的细菌,其与棒状杆菌属非常密切相关。使用棒状细菌的优点包括当目标蛋白以分泌方式产生时简化和省略其纯化过程的能力,因为细胞外分泌的蛋白质的量本质上远小于霉菌、酵母和属于芽孢杆菌属的细菌,其已被认为适合于蛋白质分泌;减少由细菌成分、不纯的酶等引起的杂质和副反应的能力,因为当使用以分泌方式产生的酶进行酶反应时,培养上清液可以用作酶源;培养基的成本、培养的方法和培养生产力优异,因为其在含有糖、氨、无机盐等的简单培养基中容易生长。使用Tat系统分泌途径,工业上有用的蛋白质,如异麦芽糖葡聚糖酶和蛋白质谷氨酰胺酶(其是先前已知的Sec系统分泌途径难以以分泌方式产生的蛋白质)也可以有效地分泌(WO 2005/103278)。或者,也可以使用WO 01/23491、WO 02/081694、WO 01/23491等中公开的方法。
本发明中使用的经转化的微生物可以通过本领域已知的任何方法制备。例如,此类表达单元以掺入到宿主细胞的基因组DNA中的形式或未掺入到宿主细胞的基因组DNA中的形式(例如,表达载体的形式)包含在宿主细胞中。包含表达单元的宿主细胞可以通过本领域已知的任何方法(例如,感受态细胞方法和电穿孔方法)通过表达载体转化宿主细胞来获得。当表达载体是引起与宿主细胞的基因组DNA同源重组的整合载体时,可以通过转化将表达单元掺入到宿主细胞的基因组DNA中。相反,当表达载体是不引起与宿主细胞的基因组DNA同源重组的非整合载体时,表达载体不通过转化掺入到宿主细胞的基因组DNA中并且可以作为独立于基因组DNA存在的表达载体保持。或者,可以通过基因组编辑技术(例如,CRISPR/Cas系统和转录激活因子样效应核酸酶(TALEN))将表达单元掺入到宿主细胞的基因组DNA中。
除了上述作为表达单元的最小单元之外,本发明中使用的表达载体可以进一步含有元件如在宿主细胞中起作用的终止子、核糖体结合位点和耐药基因。耐药基因的实例包括针对药物如四环素、氨苄青霉素、卡那霉素、潮霉素和草丁膦的抗性基因。
表达载体可以进一步含有能够与宿主细胞的基因组同源重组以与宿主细胞的基因组DNA同源重组的区域。例如表达载体可以经设计使得其中包含的表达单元位于一对同源区域(例如,与宿主细胞的基因组中的特定序列同源的同源臂loxP和FRT)之间。将要引入表达单元的宿主细胞的基因组区域(同源区域的靶标)(不限于特定区域)可以是在宿主细胞中具有大量表达的基因的基因座。
表达载体可以是质粒、病毒载体、噬菌体或人工染色体。表达载体可以是整合载体或非整合载体。整合载体可以是整个掺入到宿主细胞的基因组中的类型的载体。或者,表达载体可以是仅部分(例如表达单元)掺入宿主细胞的基因组中的类型的载体。此外,表达载体可以是DNA载体或RNA载体(例如,逆转录病毒)。对于表达载体,可以使用通常使用的表达载体。此类表达载体的实例包括pUC(例如pUC19和pUC18)、pSTV、pBR(例如pBR322)、pHSG(例如pHSG299、pHSG298、pHSG399和pHSG398)、RSF(例如RSF1010)、pACYC(例如pACYC177和pACYC184)、pMW(例如pMW119、pMW118、pMW219和pMW218)、pQE(例如pQE30)及其衍生物。当选择棒状杆菌如谷氨酸棒杆菌作为宿主细胞时,可以适合地使用作为高拷贝载体的pPK4等。
如上所述,本发明的方法可以在存在蛋白质本身和/或产生蛋白质的微生物或其处理溶液的情况下,在包括氨基酸或其盐和羧酸或其盐的反应系统中进行。
本发明还提供了生产硫酸乙酰肝素的方法。本发明的方法包括通过对肝素前体进行己糖醛酸残基的C5-差向异构化、己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的N-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化来生成硫酸乙酰肝素。
在生产硫酸乙酰肝素的方法中,C5-差向异构化可以通过如上所述的方法进行。
在生产硫酸乙酰肝素的方法中,肝素前体化合物的N-去乙酰化、己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的N-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化可以通过本领域中熟知的方法进行(例如,美国专利号8,227,449;美国专利申请公开号2012-322114;Lindahl U.et al.(2005)J.Med.Chem.,48(2):349-352;ZhangZ.et al.(2008)Journal of the American Chemical Society,130(39):12998-13007;Chen J,et al.,J.Biol.Chem.,2005Dec 30;280(52):42817-25)。进行这些处理的顺序没有特别限制,只要获得硫酸乙酰肝素即可。进行各处理的顺序可以根据各种条件如进行各处理的规程和用于各处理的酶的底物特异性来适当地设定。上述处理可以同时进行或分开进行。
进行上述处理的代表性顺序的实例包括以下顺序:
1.肝素前体化合物的N-去乙酰化;
2.α-D-葡糖胺残基的N-硫酸化;
3.己糖醛酸残基的C5-差向异构化;和
4.己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化。
也可以并行进行两种或更多种处理。
己糖醛酸的2-O-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化可以以任何顺序进行。代表性顺序的实例包括己糖醛酸的2-O-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化的顺序以及己糖醛酸的2-O-硫酸化、α-D-葡糖胺残基的6-O-硫酸化和α-D-葡糖胺残基的3-O-硫酸化的顺序。也可以并行进行两种或更多种处理。
N-去乙酰化可以使用去乙酰化剂以化学方式进行。N-去乙酰化剂的实例包括碱性物质,例如碱金属盐、碱土金属盐和肼。碱金属盐的实例包括氢氧化钠、氢氧化钾、氢氧化锂、氢氧化铷和氢氧化铯。碱土金属盐的实例包括氢氧化铍、氢氧化镁、氢氧化钙、氢氧化锶和氢氧化钡。
N-去乙酰化优选是部分N-去乙酰化。可以进行N-去乙酰化,使得N-乙酰基的残留率变为以下值。也就是说,N-乙酰基的残留率可以是例如1%或更多、1.5%或更多、3%或更多、5%或更多、7%或更多、9%或更多或11%或更多、50%或更少、45%或更少、40%或更少、35%或更少、33%或更少、30%或更少、25%或更少、20%或更少或17%或更少或其组合。具体地,N-乙酰基的残留率可以是例如1%至33%、7%至33%、7%至30%或11%至17%。例如,7%至30%的N-乙酰基的残留率大约对应于其中N-乙酰基以每6至28个糖残基一个N-乙酰基的比率存在的状态(每3至14个作为二糖单元的单元一个)。另外例如,11%至17%的N-乙酰基的残留率大约对应于其中N-乙酰基以每12至18个糖残基一个N-乙酰基的比率存在的状态(每6至9个作为二糖单元的单元一个)。可以例如通过二糖分析证实N-去乙酰化的程度(即N-乙酰基的残留率)。也就是说,当对多糖进行二糖分析时,N-乙酰基的残留率可以计算为具有N-乙酰化的基团的二糖单元相对于二糖单元的总量的量的百分比(摩尔比率)。
作为利用氢氧化钠的部分N-去乙酰化的条件,例如,可以参考先前报道的条件(Kuberan B.et al.,(2003)"Chemoenzymatic Synthesis of Classical and Non-classical Anticoagulant Heparan Sulfate Polysaccharides."J.Biol.Chem.,278(52):52613-52621.和US2011281820A1)。作为利用肼的部分N-去乙酰化的条件,例如,可以参考先前报道的条件(Glycobiology,10(2000)159-171;Carbohydrate Research,290(1996)87-96;Biochem.J.217(1984)187-197)。
2-O-硫酸化是对肝素前体化合物中的己糖醛酸残基中位置2处的羟基硫酸化的步骤。可以利用2-O-硫酸化酶(2-OST)以酶促方式进行2-O-硫酸化。
N-硫酸化是对肝素前体化合物中的α-D-葡糖胺残基的氨基硫酸化的步骤。可以使用硫酸化试剂以化学方式进行N-硫酸化。硫酸化试剂包括三氧化硫复合物如三氧化硫吡啶复合物(PySO3)和三氧化硫三甲胺复合物(TMASO3)。
6-O-硫酸化是对肝素前体化合物中的α-D-葡糖胺残基的位置6处的羟基硫酸化的步骤。可以利用例如6-O-硫酸化酶(6-OST)以酶促方式进行6-O-硫酸化。6-OST的实例包括6-OST-1、6-OST-2和6-OST-3。也可以通过利用硫酸化试剂以化学方式进行6-O-硫酸化。硫酸化试剂包括三氧化硫复合物如三氧化硫吡啶复合物(PySO3)和三氧化硫三甲胺复合物(TMASO3)。
3-O-硫酸化是对肝素前体化合物中的α-D-葡糖胺残基的位置3处的羟基硫酸化的步骤。可以利用例如3-O-硫酸化酶(3-OST)以酶促方式进行3-O-硫酸化。3-OST的实例包括3-OST-1、3-OST-2、3-OST-3、3-OST-4和3-OST-5。
在本发明的生产硫酸乙酰肝素的方法中,处理可以进一步包括使肝素前体化合物低分子化。
低分子化的顺序没有特别限制,只要获得硫酸乙酰肝素即可。低分子化的顺序可以根据各种条件如低分子化和其他处理的规程和用于处理的酶的底物特异性来适当地设定。低分子化可以与其他处理同时进行或分开进行。代表性地,低分子化可以在肝素前体化合物的N-去乙酰化之后和α-D-葡糖胺残基的N-硫酸化之前进行。
可以使用肝素酶以酶促方式进行低分子化。肝素酶的实例包括肝素酶I、肝素酶II和肝素酶III并且优选肝素酶III。低分子化没有特别限制,只要处理肝素前体使得低分子化后的肝素前体的分子量小于低分子化前的分子量,并且可以进行低分子化使得如使用普鲁兰多糖作为标准的GPC测量的数均分子量(Mn)为1000至150000、优选8000至60000以及重均分子量(Mw)为2000至300000、优选10000至100000。
优选地,使用肝素酶III进行低分子化。“肝素酶III”是指切割糖胺聚糖如肝素前体的经N-硫酸化的或经N-去乙酰化的葡糖胺残基的位点的酶(典型地为EC 4.2.2.8)。在本发明中待使用的肝素酶III没有特别限制,只要其可以优先切割经N-去乙酰化的肝素前体中具有N-乙酰基的葡糖胺残基的位点。“优先切割具有N-乙酰基的葡糖胺残基的位点”是指相比不具有N-乙酰基的葡糖胺残基的位点,更优先切割具有N-乙酰基的葡糖胺残基的位点。“优先切割具有N-乙酰基的葡糖胺残基的位点”可以意指切割具有N-乙酰基的葡糖胺残基的位点但基本上不切割不具有N-乙酰基的葡糖胺残基的位点。“切割葡糖胺残基的位点”是指切割葡糖胺残基与其下游(在还原末端侧)的葡糖醛酸(GlcA)残基之间的α-1,4-糖苷键。
每个步骤的反应溶液中包含的每个步骤的产物可以直接进行后续步骤,或者可以从反应溶液中回收,并然后进行后续步骤。从反应溶液回收每种产物的规程没有特别限制。回收每种产物的规程包括用于分离和纯化化合物的已知技术如膜处理法和沉淀法。可以适当地对每个步骤的产物进行处理如纯化、稀释、浓缩、干燥、溶解和酶的失活,并随后进行后续步骤。可以进行纯化至所期望的程度。可以单独或以适当组合来进行这些处理。
本发明还提供了选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
本发明的蛋白质是源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的变体。当在某些条件下测量活性时,源自斑马鱼的D-葡糖醛酸基C5-差向异构酶具有比源自其他生物体物种的D-葡糖醛酸基C5-差向异构酶更优异的D-葡糖醛酸基C5-差向异构酶活性。此外,当在某些条件下测量活性时,与源自斑马鱼的野生型D-葡糖醛酸基C5-差向异构酶相比,本发明的蛋白质具有相当或改善的D-葡糖醛酸基C5-差向异构酶活性。例如,本发明的蛋白质具有相当(100%)或更高、110%或更高、120%或更高、130%或更高、140%或更高、150%或更高、160%或更高、170%或更高、180%或更高、190%或更高或200%或更高于野生型酶的活性的活性。因此,本发明的蛋白质具有极其优异的D-葡糖醛酸基C5-差向异构酶活性。此类测量的某些条件包括例如以下条件,其中将表达目标蛋白质的微生物的30%无细胞提取溶液(超声和离心微生物细胞后获得的上清液)添加到反应溶液(2mg/mL经N-硫酸化的肝素前体,50mM MES(pH7.0),1mM氯化钙)并且混合物在37℃反应30分钟或12小时。
本发明的蛋白质可以用作高效进行C5-差向异构化反应的酶,因为其具有极其优异的D-葡糖醛酸基C5-差向异构酶活性。例如,本发明的蛋白质可以在从肝素前体生产硫酸乙酰肝素如肝素中用于高效进行C5-差向异构化反应。
本发明的蛋白质可以以上述任何结构或形式提供,只要其具有D-葡糖醛酸基C5-差向异构酶活性即可。也就是说,本发明的蛋白质可以通过肽键以与上述异源部分连接的融合蛋白的结构提供,或者可以以不与上述异源部分连接的蛋白质的结构提供。此外,本发明的蛋白质可以以未经纯化的产物、粗产物或经纯化的蛋白质的形式提供,或者可以以固定化至固相的固相蛋白质的形式提供,并且优选以经纯化的蛋白质的形式提供。本发明的蛋白质可以从培养基、表达本发明的蛋白质的微生物的培养上清液、通过超声微生物细胞的破碎产物,以及超声和离心在微生物细胞后获得的上清液(无细胞提取物)来制备。
实施例
参考实施例更详细地解释本发明,然而,本发明不限于以下实施例。
实施例1:经N-硫酸化的低分子化的肝素前体的制备
(1)肝素前体发酵
使用WO2015/050184的实施例1中描述的肝素前体生产细菌(大肠杆菌BL21(DE3)/pVK9-kfiABCD菌株)和培养条件获得含有肝素前体的培养液。
(2)肝素前体的纯化
通过离心从培养液中收集培养上清液。为了去除培养基成分,使用UF膜用Milli-Q水洗涤1mL的培养上清液,并浓缩至250μL。将500μL的100%乙醇添加到用UF膜浓缩的250μL的溶液中,并通过离心沉淀肝素前体。将所得的沉淀物在空气中干燥以获得肝素前体。另外从剩余的培养上清液中,通过相同的规程纯化肝素前体。获得总共10g的肝素前体。
(3)肝素前体的N-去乙酰化
1)将61mL的肼·H2O和4.7mL的1N硫酸添加到1.22g的肝素前体中,并且在用氮气替换气相后,将混合物加热至100℃并反应4.75小时。
2)在通过冰冷却终止反应后,添加61mL的16%NaCl水溶液和610mL的MeOH,并将混合物离心。去除上清液。将所得的沉淀物在50mL的H2O中溶解,然后使用Amicon UF膜(3kDa)脱盐并浓缩。
3)将两倍体积的H2O和等体积的1M NaHCO3添加到所得的浓缩溶液中,然后滴加0.2M I2/0.4M KI溶液直至呈黄色。随后,滴加肼·H2O以将过多的碘还原为碘离子,然后再次使用Amicon UF膜(3kDa)脱盐并浓缩溶液。将浓缩的溶液在减压下干燥以获得经N-去乙酰化的肝素前体。在获得的经N-去乙酰化的肝素前体中乙酰基的残留率为14.9%(稍后描述)。
(4)经N-去乙酰化的肝素前体的低分子化
(1)肝素酶III的制备
<肝素黄杆菌来源的hepC基因表达质粒的构建>
将源自肝素黄杆菌的编码肝素酶III的hepC基因克隆到pMIV-Pnlp0载体(美国专利申请公开20050196846)中以构建hepC基因表达质粒pMIV-Pnlp0-hepC。pMIV-Pnlp0-ter包括强效的nlp0启动子(Pnlp0)和rrnB终止子,并且可以通过在启动子和终止子之间插入目的基因作为表达单元发挥作用。“Pnlp0”表示源自大肠杆菌K-12的野生型nlpD基因的启动子。
表达质粒的构建的细节如下所示。通过使用引物P1(SEQ ID NO:22)和引物P2(SEQID NO:23)的用来自大肠杆菌MG1655的染色体DNA作为模板的PCR获得包含约300bp的nlpD基因的启动子区域(Pnlp0)的DNA片段。已经在这些引物的每个5'末端设计了限制酶SalI和PaeI的位点。PCR循环如下。首先,95℃3分钟,然后两个循环的95℃60秒、50℃30秒和72℃40秒,随后25个循环的94℃20秒、55℃20秒和72℃15秒,最后72℃5分钟。用SalI和PaeI处理所得的片段,并将其插入到pMIV-5JS(日本专利申请公开号2008-099668)的SalI-PaeI位点中以获得质粒pMIV-Pnlp0。插入到该pMIV-Pnlp0质粒中的Pnlp0启动子的PaeI-SalI片段的核苷酸序列如SEQ ID NO:24中所示。
随后,通过使用引物P3(SEQ ID NO:25)和引物P4(SEQ ID NO:26)的用来自MG1655的染色体DNA作为模板的PCR获得包含约300bp的rrnB基因的终止子区域的DNA片段(SEQ IDNO:27)。已经在这些引物的每个5'末端处设计了限制酶XbaI和BamHI的位点。PCR循环如下。首先,95℃3分钟,然后两个循环的95℃60秒、50℃30秒和72℃40秒,随后25个循环的94℃20秒、59℃20秒和72℃15秒,最后72℃5分钟。用XbaI和BamHI处理所得的片段,并将其插入到pMIV-Pnlp0的XbaI-BamHI位点中以获得质粒pMIV-Pnlp0-ter。
随后,人工合成包含源自肝素黄杆菌(ATCC 13125)(Su H.et.al.,Appl.Environ.Microbiol.,1996,62:2723-2734)的hepC基因的ORF的DNA链。通过使用引物P5(SEQ ID NO:28)和引物P6(SEQ ID NO:29)的用该DNA链作为模板的PCR扩增hepC基因的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶(TaKaRa)进行PCR。PCR循环如下。首先,94℃5分钟,然后30个循环的98℃5秒、55℃10秒和72℃8分钟,最后保持在4℃。另外,通过使用引物7(SEQ ID NO:30)和引物8(SEQ ID NO:31)的寡核苷酸作为引物的用pMIV-Pnlp0作为模板DNA的PCR获得pMIV-Pnlp0的DNA片段。使用PrimeStar聚合酶(TaKaRa)和方案中描述的反应组成来进行PCR。PCR循环如下。首先,94℃5分钟,然后30个循环的98℃5秒、55℃10秒和72℃6分钟,最后保持在4℃。使用In-Fusion(注册商标)HD克隆试剂盒(Clontech)连接所得的两个DNA片段以构建hepC基因表达质粒pMIV-Pnlp0-hepC。克隆的hepC基因的核苷酸序列和由其编码的肝素酶III(HepC)的氨基酸序列分别如SEQ ID NO:32和33中所示。
<表达hepC基因的大肠杆菌BL21(DE3)菌株的构建和肝素酶III酶溶液的制备>
通过电穿孔(细胞:80μL,200Ω,25μF,1.8kV,比色皿:0.1mL)将hepC基因表达质粒pMIV-Pnlp0-hepC导入到大肠杆菌BL21(DE3)菌株(Life Technologies)中以获得大肠杆菌BL21(DE3)/pMIV-Pnlp0-hepC菌株作为肝素酶III生产菌株。该菌株在25μg/mL添加氯霉素的LB培养基中在37℃预培养过夜。随后,将培养液接种到Sakaguchi烧瓶中的300mL LB培养基中,终浓度为2%v/v。在37℃进行振荡培养4小时,然后终止培养。离心后,用0.85%NaCl洗涤微生物细胞两次,并在30mL的50mM HEPES缓冲液(pH 7.0)中悬浮。对悬浮液进行超声破碎以破碎微生物细胞。将经破碎的微生物细胞溶液离心以制备肝素酶III酶溶液作为上清液(无细胞提取液)。
2)通过肝素酶III反应的低分子化
将1g以上(3)中获得的N-乙酰基残留率为14.9%的经N-去乙酰化的肝素前体与2mL的31.3mIU/μL肝素酶III溶液溶解于100mL的含有100mM NaCl和1.5mM CaCl2的Tris缓冲溶液(pH 8.0)中,并且在37℃反应5.3小时。将100mL的16%NaCl水溶液和900mL的EtOH添加到反应溶液中并混合,离心以去除上清液并获得低分子化的经N-去乙酰化的肝素前体。通过使用普鲁兰多糖作为标准的GPC测量通过肝素酶III低分子化后的分子量。结果,数均分子量(Mn)和重均分子量(Mw)分别为9860和15430。
(5)低分子化的经N-去乙酰化的肝素前体的N-硫酸化
1)将1g以上(4)中获得的低分子化的经N-去乙酰化的肝素前体溶解于50mL的MilliQ水中,并将50mL的20mg/mL NaHCO3/20mg/mL三甲胺·SO3的水溶液添加到其中,并且混合物在55℃反应过夜。
2)将1L的EtOH添加到混合物中,然后将其离心去除上清液以获得经N-硫酸化的低分子化的肝素前体。
3)将获得的经N-硫酸化的低分子化的肝素前体溶解于MilliQ水中至500μL,并进行二糖分析以计算相对于N-去乙酰化的肝素前体的产率。规程如下所示。
<二糖分析>
根据先前报道的条件(T.Imanari,et.al.,"High-performance liquidchromatographic analysis of glycosaminoglycan-derived oligosaccharides."J.O.Chromato.A,720,275-293(1996))进行经N-硫酸化的低分子化的肝素前体的二糖分析。也就是说,通过使用肝素酶II和III将经N-硫酸化的低分子化的肝素前体分解成不饱和二糖并通过HPLC分析各分解产物来定量各成分二糖的量。
同样地,进行N-去乙酰化的肝素前体的二糖分析。在N-去乙酰化的肝素前体得以N-硫酸化后进行N-去乙酰化的肝素前体的二糖分析。也就是说,通过N-硫酸化N-去乙酰化的肝素前体,随后使用肝素酶II和III将其分解成不饱和二糖并通过HPLC分析各分解产物来定量各成分二糖的量。以与低分子化的N-去乙酰化的肝素前体的N-硫酸化相同地进行N-去乙酰化的肝素前体的N-硫酸化。
通过以下规程具体进行二糖分析。
1)将0.2U的肝素酶II(Sigma)、0.02至0.03mIU的肝素酶III、5μg的多糖样品和10μL的用于酶促消化的缓冲液(100mM CH3COONa,10mM(CH3COO)2Ca,pH 7.0)混合并用Milli-Q水稀释至100μL的测量体积以用作反应溶液。
2)反应溶液在37℃反应16小时或更长,随后在100℃煮沸2分钟以终止反应。
3)通过0.45μm滤膜去除杂质以获得随后用作二糖分析的样品的溶液。
4)在以下条件下使用具有5μm粒径的Inertsil ODS-3 150mm×2.1mm的柱子进行分析,所述条件为50℃的温度、0.25mL/分钟的流速和230nm的检测波长,并且使用4%乙腈和1.2mM三丁胺作为溶液A以及4%乙腈和0.1M CsCl作为溶液B的洗脱液组成,其中溶液B的梯度为从1至90%。
从各多糖样品产生的成分二糖的量的总和计算产率。也就是说,产率计算为从经N-硫酸化的低分子化的肝素前体产生的二糖的总量相对于从N-去乙酰化的肝素前体产生的二糖的总量的百分比(摩尔比率)。另外,此时,证实了在获得的经N-硫酸化的低分子化的肝素前体中,N-乙酰化产生的99%或更多的氨基被N-硫酸化。
另外,基于从N-去乙酰化的肝素前体产生的各成分二糖的量计算N-去乙酰化的肝素前体中N-乙酰基的残留率。也就是说,乙酰基的残留率计算为具有乙酰基的二糖的量相对于二糖的总量的百分比(摩尔比率)。乙酰基的残留率为14.9%。
实施例2:表达D-葡糖醛酸基C5-差向异构酶(Dlce)的细菌菌株的构建(1)表达源自人的D-葡糖醛酸基C5-差向异构酶(hspDlce)的细菌菌株的构建
通过使用SEQ ID NO:34和SEQ ID NO:35作为引物以pMAL-c2x(SEQ ID NO:2,NewEngland BioLabs)作为模板DNA的PCR获得突变体麦芽糖结合蛋白(MBP*)的C-末端区域DNA片段。在上述PCR中,将限制酶BglII的识别位点加到5'末端,并将限制酶HindIII、BamHI、SacI、XhoI和NotI的限制性位点加到3'末端。用BglII和HindIII切割pMAL-c2x质粒DNA和MBP*的C-末端区域DNA片段,并连接以产生pMAL-MBP*质粒。pMAL-MBP*质粒的核苷酸序列显示在SEQ ID NO:21中。
通过人工基因合成(Thermo Fisher Scientific)制备编码源自人的D-葡糖醛酸基C5-差向异构酶的全长蛋白质的cDNA。使用该cDNA作为模板和PrimeStar聚合酶(TaKaRa)作为聚合酶,根据方案进行PCR扩增(其中30个循环的98℃5秒、55℃10秒和72℃2分钟)以产生包括编码源自人的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly101至Asn617)的核苷酸序列的DNA片段。SEQ ID NO:36和37的组合用作引物。将所得的DNA片段用NotI和XhoI消化,并通过连接反应连接到先前用NotI和XhoI消化的pMAL-MBP*质粒上。用该反应溶液转化大肠杆菌JM109菌株,然后将其施加到含有100μg/mL的氨苄青霉素的LB琼脂培养基上,并在30℃培养过夜。根据已知方法从生长的经转化的微生物的菌落中提取质粒,使用3100遗传分析仪(Applied Biosystems)确认其核苷酸序列,并将具有目标结构的质粒命名为pMAL-MBP*-hspDlce(G101)。用所得的pMAL-MBP*-hspDlce(G101)转化大肠杆菌Origami B(DE3),然后将其施加到含有100μg/mL的氨苄青霉素的LB琼脂培养基上,并得到具有目标质粒的经转化的微生物。将该经转化的微生物命名为大肠杆菌Origami B(DE3)/pMAL-MBP*-hspDlce(G101),并用作表达hspDlce的菌株。插入的片段的核苷酸序列和由其编码的氨基酸序列分别显示在SEQ ID NO:6和SEQ ID NO:7中。
(2)表达源自其他生物体物种的D-葡糖醛酸基C5-差向异构酶的构建细菌菌株
使用pMAL-MBP*作为模板DNA和PrimeStar聚合酶(TaKaRa)作为聚合酶,根据制造商的方案进行PCR扩增(其中30个循环的98℃5秒、55℃10秒和72℃2分钟)以产生pMAL-MBP*的DNA片段。SEQ ID NO:38和39的组合用作引物。
通过人工基因合成(Thermo Fisher Scientific)制备编码以下各项的全长蛋白质的cDNA:源自负鼠的D-葡糖醛酸基C5-差向异构酶、源自鸡的D-葡糖醛酸基C5-差向异构酶、源自蛙的D-葡糖醛酸基C5-差向异构酶、源自斑马鱼的D-葡糖醛酸基C5-差向异构酶、源自海鞘的D-葡糖醛酸基C5-差向异构酶,和源自果蝇的D-葡糖醛酸基C5-差向异构酶和源自秀丽隐杆线虫的D-葡糖醛酸基C5-差向异构酶。通过与(1)中相同的方法使用这些cDNA获得包括编码以下各项的核苷酸序列的DNA片段:源自负鼠的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly100至Asn617)、源自鸡的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly88至Asn605)、源自蛙的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly92至Asn607)、源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly70至Asn585)、源自海鞘的D-葡糖醛酸基C5-差向异构酶的催化位点(Gly92至Asn637)、源自果蝇的D-葡糖醛酸基C5-差向异构酶的催化位点(Y66至Asn614)和源自秀丽隐杆线虫的全长D-葡糖醛酸基C5-差向异构酶。SEQ IDNO:40和41、SEQ ID NO:42和43、SEQ ID NO:44和45、SEQ ID NO:46和47、SEQ ID NO:48和49、SEQ ID NO:50和51以及SEQ ID NO:52和53的组合分别用作引物。使用In-Fusion(注册商标)HD克隆试剂盒(Clontech)连接所得的各个DNA片段和pMAL-MBP*的DNA片段。通过与(1)中相同的方法用该连接溶液转化大肠杆菌JM109菌株以产生pMAL-MBP*-mdoDlce(G100)、pMAL-MBP*-ggaDlce(G88)、pMAL-MBP*-xtrDlce(G92)、pMAL-MBP*-dreDlce(G70)、pMAL-MBP*-cinDlce(K92)、pMAL-MBP*-dmeDlce(Y66)和pMAL-MBP*-celDlce。用所得的质粒各自转化大肠杆菌Origami B(DE3)。将所得的细菌菌株分别命名为大肠杆菌Origami B(DE3)/pMAL-MBP*-mdoDlce(G100)、大肠杆菌Origami B(DE3)/pMAL-MBP*-ggaDlce(G88)、大肠杆菌Origami B(DE3)/pMAL-MBP*-xtrDlce(G92)、大肠杆菌Origami B(DE3)/pMAL-MBP*-dreDlce(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-cinDlce(K92)、大肠杆菌Origami B(DE3)/pMAL-MBP*-dmeDlce(Y66)和大肠杆菌Origami B(DE3)/pMAL-MBP*-celDlce,并将其用作表达源自每个生物体物种的Dlce的细菌菌株。插入的片段的核苷酸序列各自显示在SEQ ID NO:8、10、12、14、16和18中,并且由其编码的氨基酸序列各自显示在SEQ ID NO:9、11、13、15、17和19中。
实施例3:源自每个生物体物种的D-葡糖醛酸基C5-差向异构酶(Dlce)的表达
大肠杆菌Origami B(DE3)/pMAL-MBP*-hspDlce(G101)、大肠杆菌Origami B(DE3)/pMAL-MBP*-mdoDlce(G100)、大肠杆菌Origami B(DE3)/pMAL-MBP*-ggaDlce(G88)、大肠杆菌Origami B(DE3)/pMAL-MBP*-xtrDlce(G92)、大肠杆菌Origami B(DE3)/pMAL-MBP*-dreDlce(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-cinDlce(K92)、大肠杆菌Origami B(DE3)/pMAL-MBP*-dmeDlce(Y66)和大肠杆菌Origami B(DE3)/pMAL-MBP*-celDlce各自接种至含有100μg/mL的氨苄青霉素的LB培养基(1.0%(w/v)蛋白胨、0.5%(w/v)酵母提取物、1.0%(w/v)NaCl)并在37℃预培养过夜。随后,将所得的培养基以1%的终浓度接种至3mL的LB培养基,并在37℃振荡培养3小时。然后,将异丙基-β-D-硫代半乳糖苷(IPTG)(Nacalai Tesque)以0.5mM的终浓度添加到其中,并在22℃继续培养过夜,以在微生物细胞中表达源自各个生物体物种的Dlce。
离心培养基,收集微生物细胞,用洗涤液(20mM Tris-HCl,pH 7.5,200mM NaCl)洗涤一次,并以1/10的培养基的量重悬于洗涤液中。然后,使用Bioraptor(Sonic Bio)通过超声破碎微生物细胞,并以14,000rpm离心20分钟。将所得的上清液用作含有源自各个生物体物种的Dlce的无细胞提取物。
实施例4:通过含有源自各个生物体物种的Dlce的无细胞提取物进行C5-差向异构化反应
(1)C5-差向异构化反应
将含有源自各个生物体物种的Dlce的无细胞提取物以30%的浓度添加至反应溶液(2mg/mL经N-硫酸化的低分子化的肝素前体,50mM MES,pH 7.0,1mM氯化钙)并且混合物在37℃反应30分钟或12小时。作为阴性对照,在将洗涤溶液代替无细胞提取物添加到反应溶液的条件下进行酶促反应。
(2)C5-差向异构化比率的定量
通过使用亚硝酸降解的二糖组成分析定量C5-差向异构化比率。
<试剂>
NaNO2(CAS No.7632-00-0,MW:69.01)
柠檬酸(CAS No.77-92-9,MW:192.1)
2,4-二硝基苯肼(CAS No.119-26-6,MW:198.1),50%含水产品(缩写:DNPH)
<试验溶液>
NaNO2水溶液:将49.5mg的试剂溶解于0.1mL的H2O中。
柠檬酸水溶液:将384.2mg的试剂溶解于0.1mL的H2O中。
<分析规程>
将10μL的反应溶液、20μL的柠檬酸盐缓冲液和10μL的NaNO2水溶液以该顺序添加到1.5mL微管(Eppendorf)中,并在65℃搅拌(1000rpm)混合溶液2小时以产生亚硝酸降解溶液,并在45℃搅拌(1000rpm)混合物2小时以产生衍生化溶液。在以下所示的条件下通过HPLC分析所得的衍生化溶液的组成。
<HPLC分析条件>
柱子:由Sumika Chemical Analysis Service制造的ODS Z-CLUE 3μm,2.0mm×250mm
柱温箱温度:50℃
洗脱液流速:0.3mL/分钟
检测:UV 365nm
注射量:5μL
洗脱液组成:溶液A:50mM NCOONH4(pH 4.5)
溶液B:MeCN
表2 HPLC梯度条件
时间(分钟) 溶液A(%) 溶液B(%)
0.0 90 10
13.0 80 20
27.0 20 80
27.1 90 10
40.0 90 10
(3)结果
从通过HPLC分析获得的GlcA-GlcN(NS)与IdoA-GlcN(NS)的比率计算C5-差向异构化比率,其结果显示在表3中。从30分钟的反应中比较,证明含有MBP*-dreDlce(G70)的无细胞提取物表现出显著更高的C5-差向异构化比率。表中的符号(-)表示未获得数据。
表3 C5-差向异构化比率
实施例5:表达经修饰的D-葡糖醛酸基C5-差向异构酶(Dlce)的细菌菌株的构建
通过人工DNA合成(Thermo Fisher Scientific)制备FcDlce-02、FcDlce-04、FcDlce-05、FcDlce-06和FcDlce-07(其是源自斑马鱼的D-葡糖醛酸基C5-差向异构酶(dreDlce)的变体)中的催化位点(G70至Asn585)的cDNA。表4中显示了野生型和每种变体的全长蛋白质之间的修饰程度(表示使用ClustalW计算的氨基酸序列同源性)。
表4野生型和每种变体的全长蛋白质之间的氨基酸序列同源性(使用ClustalW计算)
使用这些cDNA作为模板以与实施例2中相同的方法获得包括编码以下各项的核苷酸序列的DNA片段:FcDlce-02的催化位点(G70至Asn585)、FcDlce-04的催化位点(G70至Asn585)、FcDlce-05的催化位点(G70至Asn585)、FcDlce-06的催化位点(G70至Asn585)和FcDlce-07的催化位点(G70至Asn585)。SEQ ID NO:69和70、SEQ ID NO:71和47、SEQ ID NO:72和47、SEQ ID NO:46和47或SEQ ID NO:46和47的组合分别用作引物。以与实施例2(2)中相同的方法获得质粒pMAL-MBP*-FcDlce-02(G70)、pMAL-MBP*-FcDlce-04(G70)、pMAL-MBP*-FcDlce-05(G70)、pMAL-MBP*-FcDlce-06(G70)和pMAL-MBP*-FcDlce-07(G70)。用所得的质粒转化大肠杆菌Origami B(DE3)。所得的细菌菌株命名为大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-02(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-04(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-05(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-06(G70)和大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-07(G70),并用作表达经修饰的Dlce的细菌菌株。插入的片段的核苷酸序列分别显示在SEQ ID NO:55、58、61、64和67中,并且由其编码的氨基酸序列显示在SEQ ID NO:56、59、62、65和68中。
实施例6:野生型和经修饰的D-葡糖醛酸基C5-差向异构酶(Dlce)的表达
大肠杆菌Origami B(DE3)/pMAL-MBP*-dreDlce(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-02(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-04(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-05(G70)、大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-06(G70)和大肠杆菌Origami B(DE3)/pMAL-MBP*-FcDlce-07(G70)用于通过与实施例3中相同的方法在微生物细胞中表达野生型和经修饰的Dlce以产生含有Dlce的无细胞提取物。
实施例7:通过含有野生型或经修饰的Dlce的无细胞提取物进行C5-差向异构化反应
以与实施例4中相同的方法进行通过含有野生型或经修饰的Dlce的无细胞提取物的C5-差向异构化反应和C5-差向异构化比率的定量。阴性对照与实施例4中的相同。
从通过HPLC分析获得的GlcA-GlcN(NS)与IdoA-GlcN(NS)的比率计算C5-差向异构化比率,结果显示在表5中。证明了各自含有MBP*-FcDlce-02(G70)、MBP*-FcDlce-04(G70)、MBP*-FcDlce-05(G70)、MBP*-FcDlce-06(G70)和MBP*-FcDlce-07(G70)的无细胞提取物表现出相当于或高于含有MBP*-dreDlce(G70)的无细胞提取物的C5-差向异构化比率的C5-差向异构化比率。
表5 C5-差向异构化比率
[序列表自由文本]
SEQ ID NO:1代表编码源自斑马鱼的D-葡糖醛酸基C5-差向异构酶(GenBank登录号AY388517.1)的天然存在的全长核苷酸序列。
SEQ ID NO:2代表源自斑马鱼的D-葡糖醛酸基C5-差向异构酶(GenBank登录号AY388517.1)的天然存在的全长氨基酸序列。
SEQ ID NO:3代表编码源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(SEQ ID NO:2中的GLY70至Asn585)的天然存在的核苷酸序列。
SEQ ID NO:4代表编码源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(SEQ ID NO:2中的GLY70至Asn585)的密码子优化的核苷酸序列。
SEQ ID NO:5代表源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(SEQ ID NO:2中的GLY70至Asn585)。
SEQ ID NO:6代表编码源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly101至Asn617)的核苷酸序列。
SEQ ID NO:7代表源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly101至Asn617)。
SEQ ID NO:8代表编码源自负鼠的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly100至Asn617)的核苷酸序列。
SEQ ID NO:9代表源自负鼠的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly100至Asn617)。
SEQ ID NO:10代表编码源自鸡的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly88至Asn605)的核苷酸序列。
SEQ ID NO:11代表源自鸡的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly88至Asn605)。
SEQ ID NO:12代表编码源自蛙的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly92至Asn607)的核苷酸序列。
SEQ ID NO:13代表源自蛙的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Gly92至Asn607)。
SEQ ID NO:14代表编码源自海鞘的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(K92至Asn637)的核苷酸序列。
SEQ ID NO:15代表源自海鞘的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(K92至Asn637)。
SEQ ID NO:16代表编码源自果蝇的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Y66至Asn614)的核苷酸序列。
SEQ ID NO:17代表源自果蝇的D-葡糖醛酸基C5-差向异构酶的部分氨基酸序列(Y66至Asn614)。
SEQ ID NO:18代表编码源自秀丽隐杆线虫的D-葡糖醛酸基C5-差向异构酶的全长氨基酸序列的核苷酸序列。
SEQ ID NO:19代表源自秀丽隐杆线虫的D-葡糖醛酸基C5-差向异构酶的全长氨基酸序列。
SEQ ID NO:20代表pMAL-c2x质粒的核苷酸序列。
SEQ ID NO:21代表pMAL-MBP*质粒的核苷酸序列。
SEQ IN NO:22至31代表用于构建实施例1中hepC基因表达质粒的的引物和片段的核苷酸序列。
SEQ ID NO:22代表引物P1的核苷酸序列。
SEQ ID NO:23代表引物P2的核苷酸序列。
SEQ ID NO:24代表Pnlp0启动子的PaeI-SalI片段的核苷酸序列。
SEQ ID NO:25代表引物P3的核苷酸序列。
SEQ ID NO:26代表引物P4的核苷酸序列。
SEQ ID NO:27代表包括约300bp的rrnB基因中的终止子区域(SEQ ID NO:6)的DNA片段的核苷酸序列。
SEQ ID NO:28代表引物P5的核苷酸序列。
SEQ ID NO:29代表引物P6的核苷酸序列。
SEQ ID NO:30代表引物P7的核苷酸序列。
SEQ ID NO:31代表引物P8的核苷酸序列。
SEQ ID NO:32代表实施例1中克隆的hepC基因的核苷酸序列。
SEQ ID NO:33代表由SEQ ID NO:32的核苷酸序列编码的肝素酶III(HepC)的氨基酸序列。
SEQ ID NO:34和35代表实施例2中用于制备MBP*的引物的核苷酸序列。
SEQ ID NO:36和37代表实施例2中用于获取源自人的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:38和39代表实施例2中用于获取pMAL-MBP*的DNA片段的引物的核苷酸序列。
SEQ ID NO:40和41代表实施例2中用于获取源自负鼠的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:42和43代表实施例2中用于获取源自鸡的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:44和45代表实施例2中用于获取源自蛙的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:46和47代表实施例2中用于获取源自斑马鱼的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:48和49代表实施例2中用于获取源自海鞘的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:50和51代表实施例2中用于获取源自果蝇的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID NO:52和53代表实施例2中用于获取源自秀丽隐杆线虫的D-葡糖醛酸基C5-差向异构酶的片段的引物的核苷酸序列。
SEQ ID No:54代表变体FcDlce-02的全长氨基酸序列。
SEQ ID No:55代表编码变体FcDlce-02的部分氨基酸序列Gly70至Asn585的核苷酸序列。
SEQ ID No:56代表变体FcDlce-02的部分氨基酸序列Gly70至Asn585。
SEQ ID No:57代表变体FcDlce-04的全长氨基酸序列。
SEQ ID No:58代表编码变体FcDlce-04的部分氨基酸序列Gly70至Asn585的核苷酸序列。
SEQ ID No:59代表变体FcDlce-04的部分氨基酸序列Gly70至Asn585。
SEQ ID No:60代表变体FcDlce-05的全长氨基酸序列。
SEQ ID No:61代表编码变体FcDlce-05的部分氨基酸序列Gly70至Asn585的核苷酸序列。
SEQ ID No:62代表变体FcDlce-05的部分氨基酸序列Gly70至Asn585。
SEQ ID No:63代表变体FcDlce-06的全长氨基酸序列。
SEQ ID No:64代表编码变体FcDlce-06的部分氨基酸序列Gly70至Asn585的核苷酸序列。
SEQ ID No:65代表变体FcDlce-06的部分氨基酸序列Gly70至Asn585。
SEQ ID No:66代表变体FcDlce-07的全长氨基酸序列。
SEQ ID No:67代表编码变体FcDlce-07的部分氨基酸序列Gly70至Asn585的核苷酸序列7。
SEQ ID No:68代表变体FcDlce-07的部分氨基酸序列Gly70至Asn5857。
SEQ ID NO:69和70代表实施例5中用于获取变体FcDlce-02的片段的引物的核苷酸序列。
SEQ ID No:71代表实施例5中用于获得变体FcDlce-04的片段的引物的核苷酸序列。
SEQ ID No:72代表实施例5中用于获得变体FcDlce-05的片段的引物的核苷酸序列。
序列表
<110> 味之素株式会社
<120> 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法
<130> PAMA-19191
<150> JP 2017-007900
<151> 2017-01-19
<160> 72
<170> PatentIn version 3.5
<210> 1
<211> 1758
<212> DNA
<213> 斑马鱼
<400> 1
atgcgttgtc tggcagccgg tgttcactac aagaccctga tagtgatctg tgctcttctg 60
tctctgctca cggttcttct ttggaacaag tgcacgagtg agaaagcact gcgcttcctg 120
ccccagcacc ctcaacctcc tcccagccct aaaatagaca gccatcctca gcagccccag 180
cccccggaac ctccacctgt agttggcgga gtgcgatatg aagagataga ctgcctgatc 240
aatgacgatg ccaccattaa aggtcgtcgg gaaggcagtg aggtttacat gcctttcagc 300
tggatggaga agtactttga ggtgtacggc aaggtggtgc agtatgatgg ttatgatcgt 360
tttgagtttt cacatagtta ctccaaagta tacgcccaga gagagcagta ccaccccaat 420
ggagtcttca tgtcctttga ggggtataac gtggaggtgc gtgacagagt caagtgcatc 480
agtggagtgg aaggagtacc gttgtccacc cagtggggcc ctcaagggta tttctatgct 540
atccagatag ctcagtatgg cctgagtcat tacagtaaga acctgacaga gcggccacct 600
catgtggagg tgtatgacac ggcggaggag agagacagca ggtccagcgc atggactgtc 660
cctaagggct gctcactcac cagagtatat gacaagacca gagccacatc tgtacgggag 720
ttcagtgctc cagaaaactc agagggtgtc tcacttcctc ttggcaacac taaagatttc 780
atcatctcct ttgacctgaa gtttacatct aatggtagcg tctctgtaat cttggagacc 840
acagagaaag ggccgccatt tgttatccat tacgtcacca ccacccagct cattttgctc 900
aaggatcgtg acatcaccta tggtatcggc cctcggacca catggaccac cgtcacccgt 960
gaccttctca ctgacctacg caaaggcatt ggcctctcca acaccaaagc ggtcaaagct 1020
accaaaacca tgccaaggcg tgttgtaaag ttagtggtgc acggcaccgg gacaatagac 1080
aatatcacaa tctccaccac gtcacatatg gcggcttttt atgccgctag tgactggttg 1140
gtgcgcaacc aggacgagcg tggtggctgg ccgatcatgg tcactcgtaa actcggggag 1200
ggtttccgtg cactggagcc aggttggtat tcggccatgg cacaaggaca agccatgtcc 1260
actttagtgc gtgcctatct aatgacaaaa gatgacaggt acctaaaggc tgccctgcga 1320
gccaccggac cttttaaact gccctcagaa cagcacggtg tcaaagcagt gttcatgaac 1380
aagtatgact ggtatgagga gtaccccaca atccccagct ccttcgtttt gaatggattc 1440
atctattccc tcataggtct gtttgacctg gcgcaaactg cgggtgagaa actcgggcgg 1500
gatgcgggac agctgtacag caagggaatg gagtccttga aagttatgct tcccctgtat 1560
gacacagggt caggcactat ctatgacctg cgccacttta ttttgggcac ggcgcccaat 1620
ttggcccgtt gggactacca cacaacgcac atcaaccagc tccagctgct gggtactatt 1680
gacaactcgc ccatcttcag ggactccgtc aagcgctgga aaagctacct gaaaggaggg 1740
agggctaagc acaattaa 1758
<210> 2
<211> 585
<212> PRT
<213> 斑马鱼
<400> 2
Met Arg Cys Leu Ala Ala Gly Val His Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Leu Ser Leu Leu Thr Val Leu Leu Trp Asn Lys Cys Thr
20 25 30
Ser Glu Lys Ala Leu Arg Phe Leu Pro Gln His Pro Gln Pro Pro Pro
35 40 45
Ser Pro Lys Ile Asp Ser His Pro Gln Gln Pro Gln Pro Pro Glu Pro
50 55 60
Pro Pro Val Val Gly Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Asp Ala Thr Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr
85 90 95
Met Pro Phe Ser Trp Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Val Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Glu Gln Tyr His Pro Asn Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Ala Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala
195 200 205
Glu Glu Arg Asp Ser Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Thr Arg Val Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Glu
225 230 235 240
Phe Ser Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly
260 265 270
Ser Val Ser Val Ile Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Val
275 280 285
Ile His Tyr Val Thr Thr Thr Gln Leu Ile Leu Leu Lys Asp Arg Asp
290 295 300
Ile Thr Tyr Gly Ile Gly Pro Arg Thr Thr Trp Thr Thr Val Thr Arg
305 310 315 320
Asp Leu Leu Thr Asp Leu Arg Lys Gly Ile Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Ala Thr Lys Thr Met Pro Arg Arg Val Val Lys Leu Val
340 345 350
Val His Gly Thr Gly Thr Ile Asp Asn Ile Thr Ile Ser Thr Thr Ser
355 360 365
His Met Ala Ala Phe Tyr Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Arg Ala Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Met Ser Thr Leu Val Arg Ala Tyr Leu Met Thr Lys Asp Asp
420 425 430
Arg Tyr Leu Lys Ala Ala Leu Arg Ala Thr Gly Pro Phe Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Ile Tyr Ser Leu Ile Gly Leu Phe Asp Leu Ala Gln Thr Ala Gly Glu
485 490 495
Lys Leu Gly Arg Asp Ala Gly Gln Leu Tyr Ser Lys Gly Met Glu Ser
500 505 510
Leu Lys Val Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Ile Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile
545 550 555 560
Asp Asn Ser Pro Ile Phe Arg Asp Ser Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 3
<211> 1551
<212> DNA
<213> 斑马鱼
<400> 3
ggagtgcgat atgaagagat agactgcctg atcaatgacg atgccaccat taaaggtcgt 60
cgggaaggca gtgaggttta catgcctttc agctggatgg agaagtactt tgaggtgtac 120
ggcaaggtgg tgcagtatga tggttatgat cgttttgagt tttcacatag ttactccaaa 180
gtatacgccc agagagagca gtaccacccc aatggagtct tcatgtcctt tgaggggtat 240
aacgtggagg tgcgtgacag agtcaagtgc atcagtggag tggaaggagt accgttgtcc 300
acccagtggg gccctcaagg gtatttctat gctatccaga tagctcagta tggcctgagt 360
cattacagta agaacctgac agagcggcca cctcatgtgg aggtgtatga cacggcggag 420
gagagagaca gcaggtccag cgcatggact gtccctaagg gctgctcact caccagagta 480
tatgacaaga ccagagccac atctgtacgg gagttcagtg ctccagaaaa ctcagagggt 540
gtctcacttc ctcttggcaa cactaaagat ttcatcatct cctttgacct gaagtttaca 600
tctaatggta gcgtctctgt aatcttggag accacagaga aagggccgcc atttgttatc 660
cattacgtca ccaccaccca gctcattttg ctcaaggatc gtgacatcac ctatggtatc 720
ggccctcgga ccacatggac caccgtcacc cgtgaccttc tcactgacct acgcaaaggc 780
attggcctct ccaacaccaa agcggtcaaa gctaccaaaa ccatgccaag gcgtgttgta 840
aagttagtgg tgcacggcac cgggacaata gacaatatca caatctccac cacgtcacat 900
atggcggctt tttatgccgc tagtgactgg ttggtgcgca accaggacga gcgtggtggc 960
tggccgatca tggtcactcg taaactcggg gagggtttcc gtgcactgga gccaggttgg 1020
tattcggcca tggcacaagg acaagccatg tccactttag tgcgtgccta tctaatgaca 1080
aaagatgaca ggtacctaaa ggctgccctg cgagccaccg gaccttttaa actgccctca 1140
gaacagcacg gtgtcaaagc agtgttcatg aacaagtatg actggtatga ggagtacccc 1200
acaatcccca gctccttcgt tttgaatgga ttcatctatt ccctcatagg tctgtttgac 1260
ctggcgcaaa ctgcgggtga gaaactcggg cgggatgcgg gacagctgta cagcaaggga 1320
atggagtcct tgaaagttat gcttcccctg tatgacacag ggtcaggcac tatctatgac 1380
ctgcgccact ttattttggg cacggcgccc aatttggccc gttgggacta ccacacaacg 1440
cacatcaacc agctccagct gctgggtact attgacaact cgcccatctt cagggactcc 1500
gtcaagcgct ggaaaagcta cctgaaagga gggagggcta agcacaatta a 1551
<210> 4
<211> 1551
<212> DNA
<213> 斑马鱼
<400> 4
ggcgttcggt atgaagaaat cgactgcttg attaacgacg atgcaaccat caaagggcgc 60
cgcgaaggct ctgaggtgta catgccgttt agctggatgg aaaagtattt cgaagtgtac 120
ggcaaagttg tgcaatacga tggctatgat cgctttgaat tctctcattc atacagcaaa 180
gtgtatgcgc agcgcgagca gtatcatccg aatggtgtct ttatgagctt tgaggggtat 240
aacgtagaag tgcgcgatcg tgtcaaatgt atctccggtg ttgaaggtgt tccgcttagc 300
acccagtggg gtccacaggg ctacttttat gcgattcaga ttgcccagta cggtctgtcg 360
cactattcga agaacttaac cgaacgtccg ccgcatgtgg aggtgtatga tacggcggaa 420
gaacgcgaca gtcgtagttc tgcctggacc gttccaaaag gatgctcact gacccgcgtt 480
tacgacaaaa cccgcgcgac aagcgtccgc gaatttagcg ctccggaaaa tagcgaagga 540
gttagcttac cacttggtaa caccaaagat ttcattatct cctttgacct gaaattcaca 600
agtaatgggt cagtctctgt gattttggag actactgaaa agggaccgcc gtttgtgatc 660
cactatgtca ccacgacgca gttgatcctt ctgaaagatc gtgacattac ctacgggatt 720
ggtccacgca cgacctggac aactgtaacc cgggatctgc tgacggactt acgcaaaggt 780
atcggcctta gcaacacgaa ggcagtaaaa gcaaccaaaa ccatgccgcg ccgtgtggta 840
aaactggtcg tacatggcac gggtaccatt gacaacatca ccattagcac cacgtcccat 900
atggccgcct tttatgccgc gtctgattgg ttggtgcgca atcaggatga acgtggtggc 960
tggccgatta tggtcacccg caaattaggc gagggcttcc gtgccttgga accgggctgg 1020
tattccgcga tggcgcaggg ccaagcgatg tccactctgg tgcgtgccta tctcatgacg 1080
aaagacgatc gttatctgaa agcggcgctg cgtgcaactg gcccttttaa gctgccgtca 1140
gaacagcacg gagtgaaagc ggtgtttatg aacaaatacg attggtacga agagtatccg 1200
acaatcccta gttcctttgt cctgaacggt ttcatctatt cacttattgg cctgtttgat 1260
ctggcacaga ctgctggcga gaaactgggc cgtgatgcgg gtcagctcta cagcaagggg 1320
atggagtctc tgaaagttat gttaccgctc tacgatacag ggtcggggac catctatgat 1380
ctccgccact tcattctggg aacagctccc aatctggcac gttgggatta ccacaccacg 1440
catattaatc agctgcaact gctgggtact atcgataata gtccgatttt ccgcgactcg 1500
gtcaaacgct ggaaatcgta cctgaaaggc ggtcgcgcaa agcataatta a 1551
<210> 5
<211> 516
<212> PRT
<213> 斑马鱼
<400> 5
Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Asp Ala Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr Met Pro Phe Ser Trp
20 25 30
Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Glu Gln Tyr His Pro Asn Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Ala Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala Glu Glu Arg Asp Ser
130 135 140
Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys Ser Leu Thr Arg Val
145 150 155 160
Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Glu Phe Ser Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly Ser Val Ser Val Ile
195 200 205
Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Val Ile His Tyr Val Thr
210 215 220
Thr Thr Gln Leu Ile Leu Leu Lys Asp Arg Asp Ile Thr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Thr Trp Thr Thr Val Thr Arg Asp Leu Leu Thr Asp
245 250 255
Leu Arg Lys Gly Ile Gly Leu Ser Asn Thr Lys Ala Val Lys Ala Thr
260 265 270
Lys Thr Met Pro Arg Arg Val Val Lys Leu Val Val His Gly Thr Gly
275 280 285
Thr Ile Asp Asn Ile Thr Ile Ser Thr Thr Ser His Met Ala Ala Phe
290 295 300
Tyr Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Arg Ala Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Met Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Met Thr Lys Asp Asp Arg Tyr Leu Lys Ala
355 360 365
Ala Leu Arg Ala Thr Gly Pro Phe Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe Ile Tyr Ser Leu Ile
405 410 415
Gly Leu Phe Asp Leu Ala Gln Thr Ala Gly Glu Lys Leu Gly Arg Asp
420 425 430
Ala Gly Gln Leu Tyr Ser Lys Gly Met Glu Ser Leu Lys Val Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Ile Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile Asp Asn Ser Pro Ile
485 490 495
Phe Arg Asp Ser Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 6
<211> 1575
<212> DNA
<213> 人
<400> 6
ggccgcgtct tctggaggcc tgaaatatga agaaattgac tgcctgatca acgatgagca 60
taccattaaa ggtcgtcgtg aaggtaatga agtttttctg ccgtttacct gggtggagaa 120
atactttgat gtttatggta aagtggtgca gtatgatggc tatgatcgtt ttgaatttag 180
ccatagctac agcaaagttt atgcacagcg tgcaccgtat catcctgatg gtgtttttat 240
gagctttgag ggctataatg ttgaagttcg tgatcgcgtt aaatgcatta gcggtgttga 300
aggtgttccg ctgagcaccc agtggggtcc gcagggttat ttctatccga ttcagattgc 360
acagtatggc ctgagccatt atagcaaaaa tctgaccgaa aaaccgcctc acattgaagt 420
ttatgaaacc gcagaagatc gcgacaaaaa caaaccgaat gattggaccg ttccgaaagg 480
ttgttttatg gcaaatgttg cagataaaag ccgcttcacc aatgtgaaac agtttattgc 540
accggaaacc agcgaaggtg ttagcctgca gctgggtaat accaaagatt ttatcattag 600
cttcgatctg aaatttctga ccaatggtag cgttagcgtt gttctggaaa ccaccgaaaa 660
aaatcagctg tttaccatcc attatgtgag caatgcccag ctgattgcat ttaaagaacg 720
cgatatctat tatggcattg gtccgcgtac cagttggagc accgttaccc gtgatctggt 780
taccgatctg cgtaaaggtg ttggtctgag caatacaaaa gcagttaaac cgaccaaaat 840
tatgccgaaa aaagttgttc gtctgatcgc caaaggtaaa ggttttctgg ataacattac 900
cattagcacc accgcacata tggcagcatt ttttgcagca agcgattggc tggttcgtaa 960
ccaggatgaa aaaggtggtt ggccgattat ggttacccgt aaactgggtg aaggttttaa 1020
aagcctggaa ccgggttggt atagcgcaat ggcacagggt caggcaatta gcaccctggt 1080
tcgtgcatat ctgctgacca aagatcatat ttttctgaat agcgcactgc gtgcaaccgc 1140
accgtacaaa tttctgtcag aacagcatgg tgttaaagcc gtgtttatga acaaacacga 1200
ttggtatgaa gaatatccga ccaccccgag cagctttgtt ctgaatggtt ttatgtatag 1260
cctgatcggt ctgtacgacc tgaaagaaac agccggtgaa aaactgggta aagaagcacg 1320
tagcctgtac gaacgtggta tggaaagcct gaaagcaatg ctgccgctgt atgataccgg 1380
tagcggcacc atttatgatc tgcgtcattt tatgctgggt atcgcaccga atctggcacg 1440
ttgggattat cataccaccc atattaatca gctgcaactg ctgagtacca ttgatgaaag 1500
tccggtgttt aaagaatttg tgaaacgctg gaaaagctac ctgaaaggta gccgtgcaaa 1560
acacaattaa ctcga 1575
<210> 7
<211> 517
<212> PRT
<213> 人
<400> 7
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu Pro Phe Thr Trp
20 25 30
Val Glu Lys Tyr Phe Asp Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu Asp Arg Asp Lys
130 135 140
Asn Lys Pro Asn Asp Trp Thr Val Pro Lys Gly Cys Phe Met Ala Asn
145 150 155 160
Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln Phe Ile Ala Pro
165 170 175
Glu Thr Ser Glu Gly Val Ser Leu Gln Leu Gly Asn Thr Lys Asp Phe
180 185 190
Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly Ser Val Ser Val
195 200 205
Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Ile His Tyr Val
210 215 220
Ser Asn Ala Gln Leu Ile Ala Phe Lys Glu Arg Asp Ile Tyr Tyr Gly
225 230 235 240
Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val Thr
245 250 255
Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Pro
260 265 270
Thr Lys Ile Met Pro Lys Lys Val Val Arg Leu Ile Ala Lys Gly Lys
275 280 285
Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala
290 295 300
Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Lys Gly
305 310 315 320
Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Lys Ser
325 330 335
Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile Ser
340 345 350
Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His Ile Phe Leu Asn
355 360 365
Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Phe Leu Ser Glu Gln His
370 375 380
Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp Tyr Glu Glu Tyr
385 390 395 400
Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser Leu
405 410 415
Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly Lys
420 425 430
Glu Ala Arg Ser Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala Met
435 440 445
Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His
450 455 460
Phe Met Leu Gly Ile Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr
465 470 475 480
Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ser Pro
485 490 495
Val Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Ser
500 505 510
Arg Ala Lys His Asn
515
<210> 8
<211> 1554
<212> DNA
<213> 灰短尾负鼠
<400> 8
ggcctgaaat acgaggaaat cgattgtctg attaatgacg agcatacgat aaaaggccgt 60
cgtgaaggga acgaaatttt cctgccgttt acctgggtgg agaaatactt tgaggtgtac 120
ggcaagatgg ttcagtatga tggctatgat cgcttcgaat tttcgcacag ctattcgaaa 180
gtgtatgcgc aacgtgctcc ttaccatccg gacggggtgt tcatgtcctt tgaaggctat 240
aacgttgagg ttcgtgatcg tgttaaatgc atctctggtg ttgagggagt gccgttaagc 300
acccagtggg ggccacaggg ttacttctat ccgattcaga tagcgcaata tggactgtcg 360
cactactcca agaacctgac cgaaaagccg ccgcatattg aagtgtatga aactgcggaa 420
gacaaagaca agcattcacg cccgaatgat tggaccgttc ctaagggttg ctttatgact 480
agcgttgccg acaaatcgcg cttcacgaac gtcaaacagt tcgtggcacc cgaaacgtca 540
gaaggtgtgt cgttacttct tggcaacaca aaggatttca ttattagctt tgatttaaaa 600
ttcctgacga atgggtcagt atccgtagtc ctagaaacca cggagaaaaa tcagctcttt 660
accgtacact atatctcgaa tacgcagtta atcgcattta aagaacgcga catttactat 720
ggcatcggtc cgcgaacatc gtggagcact gtcactcggg atctggtgac ggatttacgc 780
aaaggcgttg gtctcagtaa caccaaggca gtcaagcaga ccaaaattat gccgaaaaaa 840
gtggtacggc tgattgccaa aggcaaaggc tttctggata acatcaccat ctctaccact 900
gcccatatgg cagcgttttt cgctgcaagc cactggttag tgaccaatca agacgaaaaa 960
ggcggatggc cgatcatggt gacgcgcaaa ctgggtgaag gttttcgcgc acttgaacct 1020
ggttggtatt ccgcgatggc tcagggtcag gcgatttcta ccttggttcg cgcatatctc 1080
ttgaccaagg atcatgtctt cttggatagt gcgttgcgag ccaccgcgcc gtacaaattt 1140
ctgtctgaac aacatggcgt gaaagccgtc tttatgaaca agtatgactg gtatgaagag 1200
tatccgacca caccgagcag ttttgtgctg aatggtttca tgtattccct gattggcctc 1260
tatgacctga aagaaacagc tggtgagaaa ctgggaaaag aagcgcgtct gctgtacgaa 1320
cgtggcatgg aaagtttgaa agccatgctc ccactgtacg ataccggtag tggcaccatt 1380
tacgatctgc gtcacttcat gctggggagt gcgccgaatc tggcacgttg ggattatcat 1440
acgactcaca tcaatcagct gcaattgctg agcaccattg atgaagcgcc agtttttcgc 1500
gagttcgtca aacgctggaa aagctacctg aaaggctctc gcgcgaaaca caac 1554
<210> 9
<211> 518
<212> PRT
<213> 灰短尾负鼠
<400> 9
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Asn Glu Ile Phe Leu Pro Phe Thr Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Met Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu Asp Lys Asp Lys
130 135 140
His Ser Arg Pro Asn Asp Trp Thr Val Pro Lys Gly Cys Phe Met Thr
145 150 155 160
Ser Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln Phe Val Ala
165 170 175
Pro Glu Thr Ser Glu Gly Val Ser Leu Leu Leu Gly Asn Thr Lys Asp
180 185 190
Phe Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly Ser Val Ser
195 200 205
Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Val His Tyr
210 215 220
Ile Ser Asn Thr Gln Leu Ile Ala Phe Lys Glu Arg Asp Ile Tyr Tyr
225 230 235 240
Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val
245 250 255
Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys
260 265 270
Gln Thr Lys Ile Met Pro Lys Lys Val Val Arg Leu Ile Ala Lys Gly
275 280 285
Lys Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala
290 295 300
Ala Phe Phe Ala Ala Ser His Trp Leu Val Thr Asn Gln Asp Glu Lys
305 310 315 320
Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Arg
325 330 335
Ala Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile
340 345 350
Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His Val Phe Leu
355 360 365
Asp Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Phe Leu Ser Glu Gln
370 375 380
His Gly Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp Tyr Glu Glu
385 390 395 400
Tyr Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser
405 410 415
Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly
420 425 430
Lys Glu Ala Arg Leu Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala
435 440 445
Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg
450 455 460
His Phe Met Leu Gly Ser Ala Pro Asn Leu Ala Arg Trp Asp Tyr His
465 470 475 480
Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ala
485 490 495
Pro Val Phe Arg Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly
500 505 510
Ser Arg Ala Lys His Asn
515
<210> 10
<211> 1557
<212> DNA
<213> 鸡
<400> 10
ggattgaaat acgaagaaat tgactgcctg attaacgatg aacataccat taagggccgt 60
cgggagggct cggaggtatt cctcccgttt tcatgggtgg aaaagtattt cgaagtgtat 120
ggcaaaattg cccagtatga tggttatgac cgctttgaat ttagccacag ttattcgaaa 180
gtctataccc aacgcgcacc ctaccatcct gatggggtgt ttatgtcgtt tgagggttat 240
aacgtcgaag tacgcgatcg tgtcaaatgc atcagcggcg tagaaggtgt gcccctgagc 300
actcagtggg gtccgcaagg ttacttctac cctatccaga tcgcccagta cggcttgtct 360
cattatagta agaacctgac tgagaaacca ccgcatattg aagtctatga aactgcggaa 420
gaaaaggatc gcggttcccg tgcggcggag tggacagtgc cgaagggctg cagtctgtcc 480
accgtccccg acaaagcgaa atttacctcc gtgaaacact ttgttgcacc agagaatacc 540
gagggcgtat ctctgcagct tgggaatgct cgcgacttta tcatctcctt tgacttaaaa 600
ttggtgacga atggttccat ttctgtggtg ctggaaacga cggaaaagaa ccaactgttc 660
acggtgcact atgtctcaaa tacgcagctc attgcctttc gtgagcgcga tatttactat 720
ggcatcggag cgcgtacgag ttggtcaaca atcacccgtg acctggttac cgatctgcgg 780
aaaggcgtcg ggctgagcaa caccaaagcc gttaaacaaa cgcggattat gccgaagaaa 840
gttgtccgct taatcgcaaa aggacgcggt tttctggaca acgttactat ttccgctaca 900
gcgcatatgg ctgctttctt tgcggcgagt aattggctgg ttcgcaatca ggatgaacgc 960
ggtgggtggc cgattatggt gacccgcaag ttaggagaag gttttcgctc tttggatcca 1020
ggttggtact cggcgatggc ccaaggtcag gcaatttcaa ctctggttcg cgcttatctg 1080
ctgacaaaag aacacgcatt tctgagctct gcccttcgtg ccaccgcgcc ctataaactc 1140
ccgtctgaac agcatggcgt gaaagccgtc tttatgaacc gtcatgattg gtacgaagag 1200
tatcctacgt cgcctagcag tttcgtgttg aatggcttca tgtatagcct gattgggctc 1260
tacgacttaa aagaaaccgc gggcgagaaa cttggcaaag aggcgcgctt actgtacgaa 1320
cgcggtatgg aaagccttaa agcgatgctg ccgttatatg acaccgggtc gggcaccatc 1380
tacgatttgc gccatttcat gctgggcaca gctccgaatc ttgcgcggtg ggattatcac 1440
acgacccaca ttaaccaatt gcagctgctg tcgaccatcg atgaagcccc aatcttcaaa 1500
gagtttgtgc gtcgttggaa aagctactta cgtggtggtc gtgcgaaaca taactaa 1557
<210> 11
<211> 518
<212> PRT
<213> 鸡
<400> 11
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Phe Leu Pro Phe Ser Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Ile Ala Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Thr Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu Glu Lys Asp Arg
130 135 140
Gly Ser Arg Ala Ala Glu Trp Thr Val Pro Lys Gly Cys Ser Leu Ser
145 150 155 160
Thr Val Pro Asp Lys Ala Lys Phe Thr Ser Val Lys His Phe Val Ala
165 170 175
Pro Glu Asn Thr Glu Gly Val Ser Leu Gln Leu Gly Asn Ala Arg Asp
180 185 190
Phe Ile Ile Ser Phe Asp Leu Lys Leu Val Thr Asn Gly Ser Ile Ser
195 200 205
Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Val His Tyr
210 215 220
Val Ser Asn Thr Gln Leu Ile Ala Phe Arg Glu Arg Asp Ile Tyr Tyr
225 230 235 240
Gly Ile Gly Ala Arg Thr Ser Trp Ser Thr Ile Thr Arg Asp Leu Val
245 250 255
Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys
260 265 270
Gln Thr Arg Ile Met Pro Lys Lys Val Val Arg Leu Ile Ala Lys Gly
275 280 285
Arg Gly Phe Leu Asp Asn Val Thr Ile Ser Ala Thr Ala His Met Ala
290 295 300
Ala Phe Phe Ala Ala Ser Asn Trp Leu Val Arg Asn Gln Asp Glu Arg
305 310 315 320
Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Arg
325 330 335
Ser Leu Asp Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile
340 345 350
Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Glu His Ala Phe Leu
355 360 365
Ser Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro Ser Glu Gln
370 375 380
His Gly Val Lys Ala Val Phe Met Asn Arg His Asp Trp Tyr Glu Glu
385 390 395 400
Tyr Pro Thr Ser Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser
405 410 415
Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly
420 425 430
Lys Glu Ala Arg Leu Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala
435 440 445
Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg
450 455 460
His Phe Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His
465 470 475 480
Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ala
485 490 495
Pro Ile Phe Lys Glu Phe Val Arg Arg Trp Lys Ser Tyr Leu Arg Gly
500 505 510
Gly Arg Ala Lys His Asn
515
<210> 12
<211> 1548
<212> DNA
<213> 热带爪蟾
<400> 12
ggtcagaaat acgaagaaat tgattgtatg attaatgaag aacagactgt caggtgtcgc 60
aaagaaggca ccgaagtgta catgccgttt tcgtgggttg agaaatactt tgaagtgtat 120
ggcaaaatcg cccaatatga cggctttgaa cgcttcgagt tctcgcacag ttatagcaaa 180
gtctatgccc aacgtgggcc ctatcatcca gatggcgtgt tcatgagctt tgaaggctac 240
aatgtggaag ttcgtgatcg tgttaagtgc atcagtggcg ttgaaggcgt tccgctgagc 300
actcaatggg gtccgcaggg ctatttctac ccgattcaga ttgcgcagta tggcttatcc 360
cactactcaa aaaacctgac ggaaaaaccc ccgcatgtag aagtatatga gaaagcggat 420
gagaaatccg gagttacggg ggtatggaag attccgaaag gcgctagcgt caccaccgtc 480
tttgattcaa cgaaaaattc gcatgtgaag cattttgttg tcccggagaa cttagaaggg 540
gcgtctttga ccctgggtaa cattaaagac ttcatccttt ctctggatgt gaagttcacc 600
accaacggct ccataagcgt tgtgatggaa accacggaga aaaatcagat cttcaccgtg 660
cactacatta ccaacaccca gctgattgcc tttcgcgatc atgacgtttt ttacggcttg 720
ggtagcagaa cggcatggtc aacgctgaca cgcgatttag tgaccgacct gaagaaaggt 780
gtaggccttt cgaacactaa agcggtcaaa cagaccaaga tcatgccgaa aaaagtggtg 840
cagattgtcc tgaaaggcag tggatacctg gataatgtga cgatttcaac cacagcccat 900
acggcagcct tttttgctgc gagtgattgg ttggtgcgga atcaagacac aaaaggtggt 960
tggccgatca tggtaacgcg aaaactgggt gatggattca aagccctgga acctggctgg 1020
tatagtgcaa tggcgcaagg tcaggcgatt agcacactgg tccgtgcgta tttactcacc 1080
aaggagcaat tctacctcga ttccgctctg cgcgccacag ccccctttaa acttccgagt 1140
gaaaagcacg gtgtcaaagc agtctttatg aacaaatatg attggtatga ggagtatccg 1200
acgacgccat cgagctttgt gctgaatggg ttcatatatg cattactggg cctgtacgat 1260
ctcaaagaaa ccgccggtga gaaacaggga aaagaagcgc gtctcctgta tgaacgcggt 1320
atggagagtt tgcgtgcgat gttacccctg tatgacaccg gttcagggtc tatctatgac 1380
ctgcgccatg ttatgctggg cactgcgcct aatttggctc gttgggacta ccataccact 1440
cacatcaacc agcttcagct ccttgccagc atggatggtt cgccgatctt tcgcgacttc 1500
attcgtcgct ggaagtctta tctgaaaggc gggcgagcaa agcataac 1548
<210> 13
<211> 516
<212> PRT
<213> 热带爪蟾
<400> 13
Gly Gln Lys Tyr Glu Glu Ile Asp Cys Met Ile Asn Glu Glu Gln Thr
1 5 10 15
Val Arg Cys Arg Lys Glu Gly Thr Glu Val Tyr Met Pro Phe Ser Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Ile Ala Gln Tyr Asp Gly
35 40 45
Phe Glu Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Gly Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Val Glu Val Tyr Glu Lys Ala Asp Glu Lys Ser Gly
130 135 140
Val Thr Gly Val Trp Lys Ile Pro Lys Gly Ala Ser Val Thr Thr Val
145 150 155 160
Phe Asp Ser Thr Lys Asn Ser His Val Lys His Phe Val Val Pro Glu
165 170 175
Asn Leu Glu Gly Ala Ser Leu Thr Leu Gly Asn Ile Lys Asp Phe Ile
180 185 190
Leu Ser Leu Asp Val Lys Phe Thr Thr Asn Gly Ser Ile Ser Val Val
195 200 205
Met Glu Thr Thr Glu Lys Asn Gln Ile Phe Thr Val His Tyr Ile Thr
210 215 220
Asn Thr Gln Leu Ile Ala Phe Arg Asp His Asp Val Phe Tyr Gly Leu
225 230 235 240
Gly Ser Arg Thr Ala Trp Ser Thr Leu Thr Arg Asp Leu Val Thr Asp
245 250 255
Leu Lys Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Gln Thr
260 265 270
Lys Ile Met Pro Lys Lys Val Val Gln Ile Val Leu Lys Gly Ser Gly
275 280 285
Tyr Leu Asp Asn Val Thr Ile Ser Thr Thr Ala His Thr Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Thr Lys Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Asp Gly Phe Lys Ala Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Glu Gln Phe Tyr Leu Asp Ser
355 360 365
Ala Leu Arg Ala Thr Ala Pro Phe Lys Leu Pro Ser Glu Lys His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Ile Tyr Ala Leu Leu
405 410 415
Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Gln Gly Lys Glu
420 425 430
Ala Arg Leu Leu Tyr Glu Arg Gly Met Glu Ser Leu Arg Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Ser Ile Tyr Asp Leu Arg His Val
450 455 460
Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Ala Ser Met Asp Gly Ser Pro Ile
485 490 495
Phe Arg Asp Phe Ile Arg Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 14
<211> 1638
<212> DNA
<213> 玻璃海鞘
<400> 14
aaaccgtctg ttagtgccat tgaatgcctg atcaatgatg aagaaacggt acaatgcctc 60
aagagctcag attcaaatgc gcagatctat atgccatttg atttcatcca gaactacttt 120
gatgtctatg gcaaaatgaa gcattatgat ggttacgatc gctttgagtt ccagcagagc 180
aacgcgaaag tggtttacga tccgaaaagc ccgtatacct ataccggggt ctttatgacc 240
tttgactcgt acaacgtcga agcccgtgaa cgggtgaaat gcattagcgg cattaccggg 300
gttccgctga gtacgcaatg gcacattgaa gggtattatt acggcattca gatagcacag 360
ttcggcatgt ctcactatag caaacacatg acacagaaac cgccgaccaa acaagtgtat 420
gaaaacgccg aaggttctgt tcagtcacgg tggagcagct ctaacaaata ctgtctggtt 480
gaaaacgagg aggacaagga acgcaattca cgtgttatca agttttcgac tcctgatagc 540
attcccttgg gtagcggagc ctctttggtg ttgggcaata ccatggaatt tatcctgtct 600
ttcgacctga aaatggtggc gaatggttcg ttgagcgttg tgctggagac gaacgacaaa 660
atgaaacagt acacgattca ttacatcacg aattccctcg ttattgatta tgatttaaag 720
tccaacatct attatggcat tggcccatca cgtacatggc gacatatggc gagagacctt 780
cttaccgatc tgaaaaaagg catcggcttg acgaccaaaa aacaggcgaa aaaggtgcgt 840
attgcaatcc agaaagtgtc ccgtttaatc gtgcgtggtc gtggctacat tgacaacgtg 900
acgctgtcga cgtcggaaca cctgacccag ttctttgatg ctagccaatg gatgtacctg 960
aaccaagata agaaaactgg aggttggaaa aatgacgttg aacgtcgatt ggaaggttat 1020
cccccgattc cagcagggtg gatttcagcg atgggacaag gccaaggtat gtccgtatta 1080
agtcgcgctt atcacgtctt tcatgacccg aagtacattg tcgctctgtc ccatgcatta 1140
cagccgttta cgaaatcctc ggaacaggga ggtgtccgcg caaccttttt gaaaacttat 1200
acttggtatg aggagtatcc gactaaaccg agtagtttcg ttctgaatgg cttcatgtat 1260
tccctgatag gcctctatga ctttaaaagc ctcctggaac atgagtttgg ctttgggagt 1320
aacgaacagc cgccgaaagt gtcgttgcaa atctcgagcg tagatctgcc tgccacctac 1380
aaactggtga aacagcttta ccacgatggt atgacatccc taaaagcgat gctcccctta 1440
tacgatggtg gttctcgcac attctacgat ctgcgccatt tcattctggg gatgccgcct 1500
aatgtggcta ggtgggatta tcataccacc catctctcac aactggtact tctgtattct 1560
gtgagtaatg aacctgtcct aaaaaaatac ttcgataact ggagtggcta tttacgtggc 1620
aaagtcgcga aacataat 1638
<210> 15
<211> 546
<212> PRT
<213> 玻璃海鞘
<400> 15
Lys Pro Ser Val Ser Ala Ile Glu Cys Leu Ile Asn Asp Glu Glu Thr
1 5 10 15
Val Gln Cys Leu Lys Ser Ser Asp Ser Asn Ala Gln Ile Tyr Met Pro
20 25 30
Phe Asp Phe Ile Gln Asn Tyr Phe Asp Val Tyr Gly Lys Met Lys His
35 40 45
Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Gln Gln Ser Asn Ala Lys Val
50 55 60
Val Tyr Asp Pro Lys Ser Pro Tyr Thr Tyr Thr Gly Val Phe Met Thr
65 70 75 80
Phe Asp Ser Tyr Asn Val Glu Ala Arg Glu Arg Val Lys Cys Ile Ser
85 90 95
Gly Ile Thr Gly Val Pro Leu Ser Thr Gln Trp His Ile Glu Gly Tyr
100 105 110
Tyr Tyr Gly Ile Gln Ile Ala Gln Phe Gly Met Ser His Tyr Ser Lys
115 120 125
His Met Thr Gln Lys Pro Pro Thr Lys Gln Val Tyr Glu Asn Ala Glu
130 135 140
Gly Ser Val Gln Ser Arg Trp Ser Ser Ser Asn Lys Tyr Cys Leu Val
145 150 155 160
Glu Asn Glu Glu Asp Lys Glu Arg Asn Ser Arg Val Ile Lys Phe Ser
165 170 175
Thr Pro Asp Ser Ile Pro Leu Gly Ser Gly Ala Ser Leu Val Leu Gly
180 185 190
Asn Thr Met Glu Phe Ile Leu Ser Phe Asp Leu Lys Met Val Ala Asn
195 200 205
Gly Ser Leu Ser Val Val Leu Glu Thr Asn Asp Lys Met Lys Gln Tyr
210 215 220
Thr Ile His Tyr Ile Thr Asn Ser Leu Val Ile Asp Tyr Asp Leu Lys
225 230 235 240
Ser Asn Ile Tyr Tyr Gly Ile Gly Pro Ser Arg Thr Trp Arg His Met
245 250 255
Ala Arg Asp Leu Leu Thr Asp Leu Lys Lys Gly Ile Gly Leu Thr Thr
260 265 270
Lys Lys Gln Ala Lys Lys Val Arg Ile Ala Ile Gln Lys Val Ser Arg
275 280 285
Leu Ile Val Arg Gly Arg Gly Tyr Ile Asp Asn Val Thr Leu Ser Thr
290 295 300
Ser Glu His Leu Thr Gln Phe Phe Asp Ala Ser Gln Trp Met Tyr Leu
305 310 315 320
Asn Gln Asp Lys Lys Thr Gly Gly Trp Lys Asn Asp Val Glu Arg Arg
325 330 335
Leu Glu Gly Tyr Pro Pro Ile Pro Ala Gly Trp Ile Ser Ala Met Gly
340 345 350
Gln Gly Gln Gly Met Ser Val Leu Ser Arg Ala Tyr His Val Phe His
355 360 365
Asp Pro Lys Tyr Ile Val Ala Leu Ser His Ala Leu Gln Pro Phe Thr
370 375 380
Lys Ser Ser Glu Gln Gly Gly Val Arg Ala Thr Phe Leu Lys Thr Tyr
385 390 395 400
Thr Trp Tyr Glu Glu Tyr Pro Thr Lys Pro Ser Ser Phe Val Leu Asn
405 410 415
Gly Phe Met Tyr Ser Leu Ile Gly Leu Tyr Asp Phe Lys Ser Leu Leu
420 425 430
Glu His Glu Phe Gly Phe Gly Ser Asn Glu Gln Pro Pro Lys Val Ser
435 440 445
Leu Gln Ile Ser Ser Val Asp Leu Pro Ala Thr Tyr Lys Leu Val Lys
450 455 460
Gln Leu Tyr His Asp Gly Met Thr Ser Leu Lys Ala Met Leu Pro Leu
465 470 475 480
Tyr Asp Gly Gly Ser Arg Thr Phe Tyr Asp Leu Arg His Phe Ile Leu
485 490 495
Gly Met Pro Pro Asn Val Ala Arg Trp Asp Tyr His Thr Thr His Leu
500 505 510
Ser Gln Leu Val Leu Leu Tyr Ser Val Ser Asn Glu Pro Val Leu Lys
515 520 525
Lys Tyr Phe Asp Asn Trp Ser Gly Tyr Leu Arg Gly Lys Val Ala Lys
530 535 540
His Asn
545
<210> 16
<211> 1646
<212> DNA
<213> 黑腹果蝇
<400> 16
tatatgcgct gtgcagcgtt cagcttttca cccgatttcg tacgccctct tgatcgcagc 60
gcccgtcaat cgagttctgg tggtgaagcg actgccctgc acgatatcga atgctcgatc 120
aatcaggaat ataccgtgca ttgtaagcgc gatgaaaacg ctaacgaagt gtatgtccct 180
tttagcttct tgcggaatta ctttgatgtc tcgggcgccg tatcaactaa ctcaaacgaa 240
gtagcgaaat ttaactgggt ccattctacc gcgaaagtga accttccccg tggcaaatat 300
gacgcacgcg gtgtgtacat gtattttgag aattacaatg ttgaggtacg cgaccgtgtt 360
aaatgcatta gcgctgcgga aggcgttcca gtgtccaccc aatgggagaa acgcggttac 420
ttctacccga cccagattgc acagttcgcc ttgtcacatt atagcaagaa tctgacagaa 480
ccagccccgc gtgtgcgcgt tctggaagat ggtgacggga atcagatgga gtggtctacc 540
ccgaaaacct caaacatgac ccgcatttgg caccacaaat ttaacaccag tgtggttcag 600
ttcgaaacgg caccaggtta tgagggagtc attagcatcg ccctgaacca gaccctggat 660
ctgttactca gcgtggatct tttactggtc accaacagta gcagtttgat gatcacggtt 720
cagaatcggg acactcgcca taactactcc ttacactaca tcccagcgga cttactgctg 780
agtgtgcagg acacaaacat ctactatggg ctgggcggct cggcccttaa caaatggcgc 840
cacattaccc gcgatctgca tattgactta cagaaaggaa ttatgggtga taaacgcagt 900
ccgctcaaaa tccgccgctc tgatctggag gtgatcagca ttggttttct gggcctgggc 960
ttctttgaca atattactct gtccacgtct gatcatctgg cccactttta tgatgctgcg 1020
gagtggtttg tacacaacca ggatcctaaa acgggaggtt ggacaaatcc ggtacgtcgt 1080
tccctgaatg ggtttgctga actgcgtcca ggctggatct ctgccatggg ccagggtcat 1140
gcgatctccg ttttagcgcg tgcttactgg cattcgggtg gggatgaacg ctacctccgc 1200
gcggcagcgg ctgggcttca accgtatcgt gtatattcgc gcgatggagg cgtcctcgcg 1260
caattcatgg acaagttcta ttggtacgaa gaatatccga cgactccgcc cagttatgtt 1320
ctgaacggct ttatctacag cttgctgggc ttgtatgatc ttaatagcac ggccccggga 1380
aagattgctc gtgaggcggg caaactgttt gcacaaggca tgcatagcct gaagaaaatg 1440
ctgttactct tcgacaccgg ttcggggacg tcttatgatt tacgccacct gagcctgggt 1500
gttgcaccca acctcgcacg ttgggactat cacgctaccc atgttaatca gctgttgctg 1560
ctcgcgacga ttgactcgga tccgctgatt gcccagaccg cggaacgctg gaaaggttac 1620
atgtttgtcg tgccaagcat aattaa 1646
<210> 17
<211> 549
<212> PRT
<213> 黑腹果蝇
<400> 17
Tyr Met Arg Cys Ala Ala Phe Ser Phe Ser Pro Asp Phe Val Arg Pro
1 5 10 15
Leu Asp Arg Ser Ala Arg Gln Ser Ser Ser Gly Gly Glu Ala Thr Ala
20 25 30
Leu His Asp Ile Glu Cys Ser Ile Asn Gln Glu Tyr Thr Val His Cys
35 40 45
Lys Arg Asp Glu Asn Ala Asn Glu Val Tyr Val Pro Phe Ser Phe Leu
50 55 60
Arg Asn Tyr Phe Asp Val Ser Gly Ala Val Ser Thr Asn Ser Asn Glu
65 70 75 80
Val Ala Lys Phe Asn Trp Val His Ser Thr Ala Lys Val Asn Leu Pro
85 90 95
Arg Gly Lys Tyr Asp Ala Arg Gly Val Tyr Met Tyr Phe Glu Asn Tyr
100 105 110
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Ala Ala Glu Gly
115 120 125
Val Pro Val Ser Thr Gln Trp Glu Lys Arg Gly Tyr Phe Tyr Pro Thr
130 135 140
Gln Ile Ala Gln Phe Ala Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
145 150 155 160
Pro Ala Pro Arg Val Arg Val Leu Glu Asp Gly Asp Gly Asn Gln Met
165 170 175
Glu Trp Ser Thr Pro Lys Thr Ser Asn Met Thr Arg Ile Trp His His
180 185 190
Lys Phe Asn Thr Ser Val Val Gln Phe Glu Thr Ala Pro Gly Tyr Glu
195 200 205
Gly Val Ile Ser Ile Ala Leu Asn Gln Thr Leu Asp Leu Leu Leu Ser
210 215 220
Val Asp Leu Leu Leu Val Thr Asn Ser Ser Ser Leu Met Ile Thr Val
225 230 235 240
Gln Asn Arg Asp Thr Arg His Asn Tyr Ser Leu His Tyr Ile Pro Ala
245 250 255
Asp Leu Leu Leu Ser Val Gln Asp Thr Asn Ile Tyr Tyr Gly Leu Gly
260 265 270
Gly Ser Ala Leu Asn Lys Trp Arg His Ile Thr Arg Asp Leu His Ile
275 280 285
Asp Leu Gln Lys Gly Ile Met Gly Asp Lys Arg Ser Pro Leu Lys Ile
290 295 300
Arg Arg Ser Asp Leu Glu Val Ile Ser Ile Gly Phe Leu Gly Leu Gly
305 310 315 320
Phe Phe Asp Asn Ile Thr Leu Ser Thr Ser Asp His Leu Ala His Phe
325 330 335
Tyr Asp Ala Ala Glu Trp Phe Val His Asn Gln Asp Pro Lys Thr Gly
340 345 350
Gly Trp Thr Asn Pro Val Arg Arg Ser Leu Asn Gly Phe Ala Glu Leu
355 360 365
Arg Pro Gly Trp Ile Ser Ala Met Gly Gln Gly His Ala Ile Ser Val
370 375 380
Leu Ala Arg Ala Tyr Trp His Ser Gly Gly Asp Glu Arg Tyr Leu Arg
385 390 395 400
Ala Ala Ala Ala Gly Leu Gln Pro Tyr Arg Val Tyr Ser Arg Asp Gly
405 410 415
Gly Val Leu Ala Gln Phe Met Asp Lys Phe Tyr Trp Tyr Glu Glu Tyr
420 425 430
Pro Thr Thr Pro Pro Ser Tyr Val Leu Asn Gly Phe Ile Tyr Ser Leu
435 440 445
Leu Gly Leu Tyr Asp Leu Asn Ser Thr Ala Pro Gly Lys Ile Ala Arg
450 455 460
Glu Ala Gly Lys Leu Phe Ala Gln Gly Met His Ser Leu Lys Lys Met
465 470 475 480
Leu Leu Leu Phe Asp Thr Gly Ser Gly Thr Ser Tyr Asp Leu Arg His
485 490 495
Leu Ser Leu Gly Val Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Ala
500 505 510
Thr His Val Asn Gln Leu Leu Leu Leu Ala Thr Ile Asp Ser Asp Pro
515 520 525
Leu Ile Ala Gln Thr Ala Glu Arg Trp Lys Gly Tyr Met Phe Gly Arg
530 535 540
Arg Ala Lys His Asn
545
<210> 18
<211> 1851
<212> DNA
<213> 秀丽隐杆线虫
<400> 18
atgaaatgct tgcgttggcg gagtaaccgc catcgcatct atcttcttgt ggcatgtggc 60
gccctttttc tgctgaatcg ccatctgact caggaagaat ctcgcatcga tgaagaagac 120
gaggaattaa cccaggtgga cgtcaacgag gatgacaaaa agatagaatg cgaaccacca 180
ggctctatcg aatcgaagtg cattgcggac aacgggaaga gcatgaagtg ctggaaagac 240
gaagaggatg tgtatttccc ggtatcgtat ctgaaaaaac gctttgacat gactggtaaa 300
ctcggcaaag atggtagcac gttcgaactg tatacgtcat acgccaagat gcgtagtccg 360
gatagtacct atgacccgct aggacccttt gggcacttta gcacctactc agttgaaacc 420
cgtgatcgtg tgcgttgtgt cagtgccaaa accgacgttc ccatgtccac acaatgggat 480
ccgatcccgt attattaccc tattcagatt agccagtatg gtctgcaaca ctatagccgt 540
atgaaactgg attcgatctc gaataaatcc gaagcaagcc ccaaagacga tgtcattctg 600
ggagtgaaca gcaaagaatg gaaaggtgct gctggtatgc acgagactac ggaacgcctg 660
ttctttaacg atgagcagat gggcaaagtc gtcaatatct cagccggtgc cgctctggca 720
aatgcgggtg cgtacgtcta cttagacaag tctccggatc tgcacgtgat ttccttcgat 780
tggaaaccgt acgaagcgaa ctccagcttt acagtgctgg ctaaaatgaa acaggatgac 840
ttgctggtcc tgatcaacta cgtttattcg gagggaaacg gtaaatgtgt ctggcaagaa 900
gaagaacgga tttcggatga ctatattgtg cagaaaccga aaaaggatgg ccaggtgtcg 960
tacagttact cctacattgg gaatagcccg attggtgaat ggtcgacagt aacccgcgat 1020
ctcttggtag atgttgcgcg cgcgttgagc tccggagaca atcggaaaaa ggacgataat 1080
gtagtgttac acgcggggga tcttcgcctc gtgagtttag gctttcgtgg cgaactgacc 1140
gtaaaacaga aaatcaccca gcgtagggaa cagcatagcc atgccttcta cgcagcagcc 1200
gattggctag tcaaaaacca gaatgataga ggaggctgga gtgtaccggt tgagcgttcc 1260
atcgcagagc gcaagttggt tctcccgcca ggttggcatt ctgcaatggc gcaaggccat 1320
ggtatttcag tgcttacgcg tgcgtttaaa cactttaatg acgagaaata cctcaaatcc 1380
gctgcgaaag cgcttaagct gttcaaaatc aactcttcag atggtggtgt tcgcggggaa 1440
ttcttcggca atatttggta tgaagaatat ccgaccactc ctggttcttt tgtgttaaat 1500
ggctttctgt acagcctgat tggcctgtat gacctgagcc aattggagct gatgatagat 1560
gagaacgatg aaaccatgcg cgccaaaatc caggaagcgc aagaactgta ttcagctggc 1620
gtgcgttctc tgaaacaatt gctgccactg tatgatacgg gcagtggcac gatctacgat 1680
ctgcgacatg ttgcgttagg tacggcacct aacttagccc gttgggatta tcatgcggtt 1740
catgtttatc tgctgaaatg gattgccggc attgagaagg acgaagtgct cagcaaaacc 1800
gccgatcgat ggattggcta tgcgtacggg aaacgcgcaa aacacaacta a 1851
<210> 19
<211> 616
<212> PRT
<213> 秀丽隐杆线虫
<400> 19
Met Lys Cys Leu Arg Trp Arg Ser Asn Arg His Arg Ile Tyr Leu Leu
1 5 10 15
Val Ala Cys Gly Ala Leu Phe Leu Leu Asn Arg His Leu Thr Gln Glu
20 25 30
Glu Ser Arg Ile Asp Glu Glu Asp Glu Glu Leu Thr Gln Val Asp Val
35 40 45
Asn Glu Asp Asp Lys Lys Ile Glu Cys Glu Pro Pro Gly Ser Ile Glu
50 55 60
Ser Lys Cys Ile Ala Asp Asn Gly Lys Ser Met Lys Cys Trp Lys Asp
65 70 75 80
Glu Glu Asp Val Tyr Phe Pro Val Ser Tyr Leu Lys Lys Arg Phe Asp
85 90 95
Met Thr Gly Lys Leu Gly Lys Asp Gly Ser Thr Phe Glu Leu Tyr Thr
100 105 110
Ser Tyr Ala Lys Met Arg Ser Pro Asp Ser Thr Tyr Asp Pro Leu Gly
115 120 125
Pro Phe Gly His Phe Ser Thr Tyr Ser Val Glu Thr Arg Asp Arg Val
130 135 140
Arg Cys Val Ser Ala Lys Thr Asp Val Pro Met Ser Thr Gln Trp Asp
145 150 155 160
Pro Ile Pro Tyr Tyr Tyr Pro Ile Gln Ile Ser Gln Tyr Gly Leu Gln
165 170 175
His Tyr Ser Arg Met Lys Leu Asp Ser Ile Ser Asn Lys Ser Glu Ala
180 185 190
Ser Pro Lys Asp Asp Val Ile Leu Gly Val Asn Ser Lys Glu Trp Lys
195 200 205
Gly Ala Ala Gly Met His Glu Thr Thr Glu Arg Leu Phe Phe Asn Asp
210 215 220
Glu Gln Met Gly Lys Val Val Asn Ile Ser Ala Gly Ala Ala Leu Ala
225 230 235 240
Asn Ala Gly Ala Tyr Val Tyr Leu Asp Lys Ser Pro Asp Leu His Val
245 250 255
Ile Ser Phe Asp Trp Lys Pro Tyr Glu Ala Asn Ser Ser Phe Thr Val
260 265 270
Leu Ala Lys Met Lys Gln Asp Asp Leu Leu Val Leu Ile Asn Tyr Val
275 280 285
Tyr Ser Glu Gly Asn Gly Lys Cys Val Trp Gln Glu Glu Glu Arg Ile
290 295 300
Ser Asp Asp Tyr Ile Val Gln Lys Pro Lys Lys Asp Gly Gln Val Ser
305 310 315 320
Tyr Ser Tyr Ser Tyr Ile Gly Asn Ser Pro Ile Gly Glu Trp Ser Thr
325 330 335
Val Thr Arg Asp Leu Leu Val Asp Val Ala Arg Ala Leu Ser Ser Gly
340 345 350
Asp Asn Arg Lys Lys Asp Asp Asn Val Val Leu His Ala Gly Asp Leu
355 360 365
Arg Leu Val Ser Leu Gly Phe Arg Gly Glu Leu Thr Val Lys Gln Lys
370 375 380
Ile Thr Gln Arg Arg Glu Gln His Ser His Ala Phe Tyr Ala Ala Ala
385 390 395 400
Asp Trp Leu Val Lys Asn Gln Asn Asp Arg Gly Gly Trp Ser Val Pro
405 410 415
Val Glu Arg Ser Ile Ala Glu Arg Lys Leu Val Leu Pro Pro Gly Trp
420 425 430
His Ser Ala Met Ala Gln Gly His Gly Ile Ser Val Leu Thr Arg Ala
435 440 445
Phe Lys His Phe Asn Asp Glu Lys Tyr Leu Lys Ser Ala Ala Lys Ala
450 455 460
Leu Lys Leu Phe Lys Ile Asn Ser Ser Asp Gly Gly Val Arg Gly Glu
465 470 475 480
Phe Phe Gly Asn Ile Trp Tyr Glu Glu Tyr Pro Thr Thr Pro Gly Ser
485 490 495
Phe Val Leu Asn Gly Phe Leu Tyr Ser Leu Ile Gly Leu Tyr Asp Leu
500 505 510
Ser Gln Leu Glu Leu Met Ile Asp Glu Asn Asp Glu Thr Met Arg Ala
515 520 525
Lys Ile Gln Glu Ala Gln Glu Leu Tyr Ser Ala Gly Val Arg Ser Leu
530 535 540
Lys Gln Leu Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp
545 550 555 560
Leu Arg His Val Ala Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp
565 570 575
Tyr His Ala Val His Val Tyr Leu Leu Lys Trp Ile Ala Gly Ile Glu
580 585 590
Lys Asp Glu Val Leu Ser Lys Thr Ala Asp Arg Trp Ile Gly Tyr Ala
595 600 605
Tyr Gly Lys Arg Ala Lys His Asn
610 615
<210> 20
<211> 6646
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 20
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640
aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700
ggatcctcta gagtcgacct gcaggcaagc ttggcactgg ccgtcgtttt acaacgtcgt 2760
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 2820
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2880
aatggcgaat ggcagcttgg ctgttttggc ggatgagata agattttcag cctgatacag 2940
attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 3000
gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 3060
gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 3120
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 3180
gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 3240
aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 3300
cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 3360
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 3420
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 3480
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3540
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3600
gaacgttctc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3660
gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3720
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3780
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3840
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3900
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3960
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4020
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4080
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4140
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4200
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 4260
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 4320
ccccggttga taatcagaaa agccccaaaa acaggaagat tgtataagca aatatttaaa 4380
ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 4440
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 4500
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 4560
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat 4620
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 4680
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 4740
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4800
ccgccgcgct taatgcgccg ctacagggcg cgtaaaagga tctaggtgaa gatccttttt 4860
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4920
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 4980
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5040
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5100
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5160
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5220
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5280
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5340
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5400
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5460
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5520
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5580
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5640
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5700
gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 5760
caccgcatat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 5820
atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 5880
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5940
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 6000
gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc 6060
cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc 6120
catgttaagg gcggtttttt cctgtttggt cactgatgcc tccgtgtaag ggggatttct 6180
gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 6240
tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 6300
gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 6360
tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 6420
cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 6480
tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 6540
ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 6600
cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gaaatt 6646
<210> 21
<211> 6556
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 21
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgcagcc ctggcggccg cctcgagctc ggatccaagc 2640
ttggcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 2700
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 2760
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcagcttgg ctgttttggc 2820
ggatgagata agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata 2880
aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca 2940
gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac 3000
tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 3060
ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 3120
tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca 3180
aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctctttttgt 3240
ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 3300
cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt 3360
cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 3420
aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 3480
ggtaagatcc ttgagagttt tcgccccgaa gaacgttctc caatgatgag cacttttaaa 3540
gttctgctat gtggcgcggt attatcccgt gttgacgccg ggcaagagca actcggtcgc 3600
cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 3660
acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact 3720
gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 3780
aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 3840
ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 3900
ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 3960
gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 4020
aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 4080
aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 4140
aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa 4200
gtttactcat atatacttta gattgattta ccccggttga taatcagaaa agccccaaaa 4260
acaggaagat tgtataagca aatatttaaa ttgtaaacgt taatattttg ttaaaattcg 4320
cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 4380
cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga 4440
gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg 4500
atggcccact acgtgaacca tcacccaaat caagtttttt ggggtcgagg tgccgtaaag 4560
cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga 4620
acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg 4680
tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg 4740
cgtaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4800
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4860
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4920
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 4980
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 5040
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5100
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5160
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5220
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5280
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5340
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5400
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5460
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5520
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5580
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 5640
tttctcctta cgcatctgtg cggtatttca caccgcatat atggtgcact ctcagtacaa 5700
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 5760
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 5820
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 5880
ttcaccgtca tcaccgaaac gcgcgaggca gctgcggtaa agctcatcag cgtggtcgtg 5940
cagcgattca cagatgtctg cctgttcatc cgcgtccagc tcgttgagtt tctccagaag 6000
cgttaatgtc tggcttctga taaagcgggc catgttaagg gcggtttttt cctgtttggt 6060
cactgatgcc tccgtgtaag ggggatttct gttcatgggg gtaatgatac cgatgaaacg 6120
agagaggatg ctcacgatac gggttactga tgatgaacat gcccggttac tggaacgttg 6180
tgagggtaaa caactggcgg tatggatgcg gcgggaccag agaaaaatca ctcagggtca 6240
atgccagcgc ttcgttaata cagatgtagg tgttccacag ggtagccagc agcatcctgc 6300
gatgcagatc cggaacataa tggtgcaggg cgctgacttc cgcgtttcca gactttacga 6360
aacacggaaa ccgaagacca ttcatgttgt tgctcaggtc gcagacgttt tgcagcagca 6420
gtcgcttcac gttcgctcgc gtatcggtga ttcattctgc taaccagtaa ggcaaccccg 6480
ccagcctagc cgggtcctca acgacaggag cacgatcatg cgcacccgtg gccaggaccc 6540
aacgctgccc gaaatt 6556
<210> 22
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
agctgagtcg acccccagga aaaattggtt aataac 36
<210> 23
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
agctgagcat gcttccaact gcgctaatga cgc 33
<210> 24
<211> 313
<212> DNA
<213> 人工序列
<220>
<223> 片段
<400> 24
gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg 60
taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg 120
ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga 180
ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtatcgt gaacatcttt 240
tccagtgttc agtagggtgc cttgcacggt aattatgtca ctggttatta accaattttt 300
cctgggggtc gac 313
<210> 25
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
agctgatcta gaaaacagaa tttgcctggc ggc 33
<210> 26
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
agctgaggat ccaggaagag tttgtagaaa cgc 33
<210> 27
<211> 369
<212> DNA
<213> 人工序列
<220>
<223> 片段
<400> 27
tctagaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac cccatgccga 60
actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat gcgagagtag 120
ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt 180
atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg agcggatttg 240
aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata aactgccagg 300
catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct acaaactctt 360
cctggatcc 369
<210> 28
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
ttcctggggg tcgacatgac tacgaaaatt tttaa 35
<210> 29
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
attctgtttt ctagactaag gaaccaacac aagct 35
<210> 30
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
gtcgaccccc aggaaaaatt ggttaataac 30
<210> 31
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
tctagaaaac agaatttgcc tggcggcagt 30
<210> 32
<211> 1980
<212> DNA
<213> 肝素黄杆菌
<400> 32
atgactacga aaatttttaa aaggatcatt gtatttgctg taattgccct atcgtcggga 60
aatatacttg cacaaagctc ttccattacc aggaaagatt ttgaccacat caaccttgag 120
tattccggac tggaaaaggt taataaagca gttgctgccg gcaactatga cgatgcggcc 180
aaagcattac tggcatacta cagggaaaaa agtaaggcca gggaacctga tttcagtaat 240
gcagaaaagc ctgccgatat acgccagccc atagataagg ttacgcgtga aatggccgac 300
aaggctttgg tccaccagtt tcaaccgcac aaaggctacg gctattttga ttatggtaaa 360
gacatcaact ggcagatgtg gccggtaaaa gacaatgaag tacgctggca gttgcaccgt 420
gtaaaatggt ggcaggctat ggccctggtt tatcacgcta cgggcgatga aaaatatgca 480
agagaatggg tatatcagta cagcgattgg gccagaaaaa acccattggg cctgtcgcag 540
gataatgata aatttgtgtg gcggcccctt gaagtgtcgg acagggtaca aagtcttccc 600
ccaaccttca gcttatttgt aaactcgcca gcctttaccc cagccttttt aatggaattt 660
ttaaacagtt accaccaaca ggccgattat ttatctacgc attatgccga acagggaaac 720
caccgtttat ttgaagccca acgcaacttg tttgcagggg tatctttccc tgaatttaaa 780
gattcaccaa gatggaggca aaccggcata tcggtgctga acaccgagat caaaaaacag 840
gtttatgccg atgggatgca gtttgaactt tcaccaattt accatgtagc tgccatcgat 900
atcttcttaa aggcctatgg ttctgcaaaa cgagttaacc ttgaaaaaga atttccgcaa 960
tcttatgtac aaactgtaga aaatatgatt atggcgctga tcagtatttc actgccagat 1020
tataacaccc ctatgtttgg agattcatgg attacagata aaaatttcag gatggcacag 1080
tttgccagct gggcccgggt tttcccggca aaccaggcca taaaatattt tgctacagat 1140
ggcaaacaag gtaaggcgcc taacttttta tccaaagcat tgagcaatgc aggcttttat 1200
acgtttagaa gcggatggga taaaaatgca accgttatgg tattaaaagc cagtcctccc 1260
ggagaatttc atgcccagcc ggataacggg acttttgaac tttttataaa gggcagaaac 1320
tttaccccag acgccggggt atttgtgtat agcggcgacg aagccatcat gaaactgcgg 1380
aactggtacc gtcaaacccg catacacagc acgcttacac tcgacaatca aaatatggtc 1440
attaccaaag cccggcaaaa caaatgggaa acaggaaata accttgatgt gcttacctat 1500
accaacccaa gctatccgaa tctggaccat cagcgcagtg tacttttcat caacaaaaaa 1560
tactttctgg tcatcgatag ggcaataggc gaagctaccg gaaacctggg cgtacactgg 1620
cagcttaaag aagacagcaa ccctgttttc gataagacaa agaaccgggt ttacaccact 1680
tacagagatg gtaacaacct gatgatccaa tcgttgaatg cggacaggac cagcctcaat 1740
gaagaagaag gaaaggtatc ttatgtttac aataaggagc tgaaaagacc tgctttcgta 1800
tttgaaaagc ctaaaaagaa tgccggcaca caaaattttg tcagtatagt ttatccatac 1860
gacggccaga aggctccaga gatcagcata cgggaaaaca agggcaatga ttttgagaaa 1920
ggcaagctta atctaaccct taccattaac ggaaaacaac agcttgtgtt ggttccttag 1980
<210> 33
<211> 659
<212> PRT
<213> 肝素黄杆菌
<400> 33
Met Thr Thr Lys Ile Phe Lys Arg Ile Ile Val Phe Ala Val Ile Ala
1 5 10 15
Leu Ser Ser Gly Asn Ile Leu Ala Gln Ser Ser Ser Ile Thr Arg Lys
20 25 30
Asp Phe Asp His Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn
35 40 45
Lys Ala Val Ala Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu
50 55 60
Ala Tyr Tyr Arg Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn
65 70 75 80
Ala Glu Lys Pro Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg
85 90 95
Glu Met Ala Asp Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly
100 105 110
Tyr Gly Tyr Phe Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro
115 120 125
Val Lys Asp Asn Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp
130 135 140
Gln Ala Met Ala Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala
145 150 155 160
Arg Glu Trp Val Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu
165 170 175
Gly Leu Ser Gln Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val
180 185 190
Ser Asp Arg Val Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn
195 200 205
Ser Pro Ala Phe Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr
210 215 220
His Gln Gln Ala Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn
225 230 235 240
His Arg Leu Phe Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe
245 250 255
Pro Glu Phe Lys Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val
260 265 270
Leu Asn Thr Glu Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe
275 280 285
Glu Leu Ser Pro Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys
290 295 300
Ala Tyr Gly Ser Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln
305 310 315 320
Ser Tyr Val Gln Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile
325 330 335
Ser Leu Pro Asp Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr
340 345 350
Asp Lys Asn Phe Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe
355 360 365
Pro Ala Asn Gln Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly
370 375 380
Lys Ala Pro Asn Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr
385 390 395 400
Thr Phe Arg Ser Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys
405 410 415
Ala Ser Pro Pro Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe
420 425 430
Glu Leu Phe Ile Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe
435 440 445
Val Tyr Ser Gly Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg
450 455 460
Gln Thr Arg Ile His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val
465 470 475 480
Ile Thr Lys Ala Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp
485 490 495
Val Leu Thr Tyr Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg
500 505 510
Ser Val Leu Phe Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala
515 520 525
Ile Gly Glu Ala Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu
530 535 540
Asp Ser Asn Pro Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr
545 550 555 560
Tyr Arg Asp Gly Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg
565 570 575
Thr Ser Leu Asn Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys
580 585 590
Glu Leu Lys Arg Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala
595 600 605
Gly Thr Gln Asn Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys
610 615 620
Ala Pro Glu Ile Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys
625 630 635 640
Gly Lys Leu Asn Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val
645 650 655
Leu Val Pro
<210> 34
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
aagcttggca ctggccgtcg ttttacaacg tcgtg 35
<210> 35
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
ggatccgaat tctgaaatcc ttccctcgat cccga 35
<210> 36
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
atagcggccg cgtcttctgg aggcctgaaa tatgaagaaa ttgactgc 48
<210> 37
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
atactcgagt taattgtgtt ttgcacggct a 31
<210> 38
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
tccagaagac gcggccgc 18
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
ctcgagctcg gatccaagct tg 22
<210> 40
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
gccgcgtctt ctggaggcct gaaatacgag gaaatcg 37
<210> 41
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
ggatccgagc tcgagttagt tgtgtttcgc gcgagag 37
<210> 42
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
gccgcgtctt ctggaggatt gaaatacgaa gaaattgact g 41
<210> 43
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
ggatccgagc tcgagttagt tatgtttcgc acgaccacc 39
<210> 44
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
gccgcgtctt ctggaggtca gaaatacgaa gaaattgatt g 41
<210> 45
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
ggatccgagc tcgagttagt tatgctttgc tcgcccg 37
<210> 46
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
gccgcgtctt ctggaggcgt tcggtatgaa gaaatc 36
<210> 47
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
ggatccgagc tcgagttaat tatgctttgc gcgaccg 37
<210> 48
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
gccgcgtctt ctggaaaacc gtctgttagt gccattg 37
<210> 49
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 49
ggatccgagc tcgagttaat tatgtttcgc gactttgcc 39
<210> 50
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 50
gccgcgtctt ctggatatat gcgctgtgca gcg 33
<210> 51
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
ggatccgagc tcgagttaat tatgcttggc acgaccg 37
<210> 52
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
gccgcgtctt ctggaatgaa atgcttgcgt tggc 34
<210> 53
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
ggatccgagc tcgagttagt tgtgttttgc gcgtttcc 38
<210> 54
<211> 585
<212> PRT
<213> 斑马鱼
<400> 54
Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Phe Thr Leu Val Thr Val Leu Leu Trp Asn Arg Cys Ser
20 25 30
Ser Asp Lys Ala Ile Gln Phe Pro Arg Arg Leu Ser Ser Gly Ala Pro
35 40 45
Ser Pro Gln Gln Ser Glu Glu Ala Gln Pro Pro Glu Pro Pro Lys Ala
50 55 60
Pro Pro Val Val Gly Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Glu His Thr Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe
85 90 95
Leu Pro Phe Ser Trp Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Ala Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala
195 200 205
Glu Asp Lys Asp Ser Arg Ser Ala Asp Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Ser Thr Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln
225 230 235 240
Phe Val Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly
260 265 270
Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr
275 280 285
Val His Tyr Val Ser Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp
290 295 300
Ile Tyr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg
305 310 315 320
Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Gln Thr Lys Ile Met Pro Lys Arg Val Val Arg Leu Val
340 345 350
Ala Lys Gly Arg Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala
355 360 365
His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Ile Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His
420 425 430
Ala Phe Leu Ser Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu
485 490 495
Lys Leu Gly Lys Glu Ala Arg Leu Leu Tyr Glu Arg Gly Met Glu Ser
500 505 510
Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile
545 550 555 560
Asp Glu Ser Pro Ile Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 55
<211> 1548
<212> DNA
<213> 斑马鱼
<400> 55
ggcctgaaat acgaggaaat tgactgcctg atcaacgatg agcataccat caaagggcgc 60
cgtgagggga atgaagtgtt tctgccgttc agttgggttg agaaatactt tgaagtttat 120
gggaaagtcg cacagtacga tggttatgat cgttttgaat tttcccatag ctattcaaaa 180
gtgtatgcgc agcgggcgcc gtatcatccc gatggtgtgt ttatgagctt tgaaggttac 240
aatgtggaag tacgtgatcg cgtaaaatgc attagcggtg tagaaggtgt cccgttgagc 300
acccagtggg gtccccaagg ctacttttac ccgattcaga ttgctcagta tgggctttct 360
cactatagta agaatctgac cgaaaagccg ccacacgtgg aagtctatga aacggccgaa 420
gataaagatt cccgctcggc cgattggacc gtaccgaagg gctgctcgtt atcgacggtg 480
gctgacaaaa gccgctttac caatgtgaaa cagtttgtgg cgcctgagaa cagtgaagga 540
gtttccctgc aacttggcaa cactaaagac ttcattatta gcttcgatct caaatttctg 600
acaaatggct ctgtgtccgt tgtgctggaa accactgaaa agaatcagtt attcaccgtg 660
cactatgtta gcaacactca gctgattgcc tttaaagatc gtgatattta ctacggtatt 720
gggccacgga catcatggtc taccgtcacc cgggatcttg tgacggacct ccgtaaaggc 780
gttggcttga gcaacacaaa agcagtcaag cagacgaaaa tcatgccgaa gcgcgttgta 840
cgtctggtag cgaaaggccg tggattcctc gacaatatca ccatctccac cactgctcat 900
atggctgcgt tctttgctgc gtccgattgg ttggtgcgca accaagacga gcgcggaggt 960
tggccgatta tggttacgcg caaactgggt gaaggcttta aaagtcttga acctgggtgg 1020
tattcagcca tggcacaggg ccaggccatt tctacccttg ttcgcgcgta tctgttgacc 1080
aaagatcatg ccttcttaag ttcagcctta cgtgctaccg cgccgtataa actgcctagc 1140
gaacaacatg gcgtgaaagc agtctttatg aacaagcacg attggtacga ggagtacccg 1200
acaactccgt cctcgtttgt gttgaatggc ttcatgtatt cgctgattgg cctgtacgac 1260
ctcaaagaga ctgcgggtga gaaattaggc aaagaagcac gcttactgta cgaacgcggc 1320
atggaaagct taaaagccat gttgccgctg tatgacacgg gttctggtac gatttacgat 1380
ctgcgccatt tcatgctggg cacagcaccc aatctggccc gttgggacta tcacacgacg 1440
cacatcaacc agctgcaact cctgagtacc atcgacgaaa gcccaatctt caaagagttc 1500
gttaaacgct ggaaaagtta tctgaaaggc ggacgcgcca aacataac 1548
<210> 56
<211> 516
<212> PRT
<213> 斑马鱼
<400> 56
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu Pro Phe Ser Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Ala Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala Glu Asp Lys Asp Ser
130 135 140
Arg Ser Ala Asp Trp Thr Val Pro Lys Gly Cys Ser Leu Ser Thr Val
145 150 155 160
Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln Phe Val Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly Ser Val Ser Val Val
195 200 205
Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Val His Tyr Val Ser
210 215 220
Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp Ile Tyr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val Thr Asp
245 250 255
Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Gln Thr
260 265 270
Lys Ile Met Pro Lys Arg Val Val Arg Leu Val Ala Lys Gly Arg Gly
275 280 285
Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Lys Ser Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His Ala Phe Leu Ser Ser
355 360 365
Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys His Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser Leu Ile
405 410 415
Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly Lys Glu
420 425 430
Ala Arg Leu Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ser Pro Ile
485 490 495
Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 57
<211> 585
<212> PRT
<213> 斑马鱼
<400> 57
Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Phe Thr Leu Val Thr Val Leu Leu Trp Asn Arg Cys Ser
20 25 30
Ser Asp Lys Ala Leu Arg Phe Pro Arg Gln His Pro Gln Pro Pro Pro
35 40 45
Ser Pro Lys Ile Asp Ser His Pro Gln Pro Pro Gln Pro Pro Glu Pro
50 55 60
Pro Pro Val Val Gly Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Glu His Thr Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe
85 90 95
Leu Pro Phe Ser Trp Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Ala Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala
195 200 205
Glu Asp Lys Asp Ser Arg Ser Ser Asp Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Ser Thr Val Tyr Asp Lys Ser Arg Phe Thr Asn Val Lys Gln
225 230 235 240
Phe Val Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly
260 265 270
Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr
275 280 285
Val His Tyr Val Ser Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp
290 295 300
Ile Tyr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg
305 310 315 320
Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Gln Thr Lys Ile Met Pro Lys Arg Val Val Arg Leu Val
340 345 350
Ala Lys Gly Arg Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala
355 360 365
His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Ile Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His
420 425 430
Ala Phe Leu Ser Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu
485 490 495
Lys Leu Gly Lys Glu Ala Arg Gln Leu Tyr Glu Arg Gly Met Glu Ser
500 505 510
Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile
545 550 555 560
Asp Glu Ser Pro Ile Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 58
<211> 1548
<212> DNA
<213> 斑马鱼
<400> 58
ggtctgaaat atgaagagat tgactgctta attaacgatg aacacaccat caaaggtcgc 60
cgtgaaggca atgaagtgtt cctgccgttt tcatgggtgg agaaatactt tgaagtgtat 120
ggcaaagttg cgcagtatga tggctatgat cgctttgaat tctcacacag ttacagcaaa 180
gtgtacgctc agcgggcacc ctatcatccc gatggcgtct ttatgtcttt tgaagggtac 240
aatgtggaag tacgcgatcg tgtcaagtgc attagcggtg tcgaaggtgt gcctctgtcg 300
acgcaatggg gcccacaggg ctacttttac ccgattcaga tcgcccaata tggcctgtcg 360
cattatagca agaatctgac cgagaagcca ccccatgtag aggtgtatga aactgcggag 420
gacaaggata gccgcagctc agattggacc gtgccgaaag gctgttctct cagtaccgtc 480
tacgacaaaa gccgcttcac gaatgtgaaa cagtttgtag cccctgaaaa ctctgaaggc 540
gtttcccttc agctggggaa cacaaaagat ttcatcatct cctttgacct gaaatttctt 600
accaacgggt ccgtgagtgt agttctggag actaccgaaa agaaccagct gttcacagtg 660
cattatgtga gcaacacgca gttgattgcg tttaaagatc gcgatattta ctatggtatt 720
ggcccgcgta cgtcatggag tacggtcact cgtgacctcg ttacggatct tcgtaaaggg 780
gttgggctgt cgaacaccaa agcggttaaa cagaccaaaa ttatgccgaa acgcgtcgtt 840
cgcctcgttg cgaaaggacg tggatttctg gataacatca caatctcgac tacagcccat 900
atggctgcgt tctttgcggc atcggactgg ctggtgcgca atcaggatga acgtggtggc 960
tggccaatta tggtcacgcg taagctggga gaaggtttca aaagcttaga gccggggtgg 1020
tacagtgcta tggcccaagg tcaggccatt tccaccctgg ttcgcgccta cttgcttacc 1080
aaggatcatg cgtttctgag ttcggcgtta cgcgcaacgg caccgtataa gctgccgtct 1140
gagcaacatg gtgtaaaagc agtattcatg aacaaacatg attggtatga agaatatccg 1200
accacccctt caagctttgt gttgaatggc ttcatgtatt ccctgatcgg cctgtacgac 1260
ttaaaagaga ctgctggtga gaaactgggc aaggaagccc gtcaattgta cgaacgcggt 1320
atggaatccc tgaaagccat gctcccgttg tacgatacgg gatctggtac catctatgac 1380
ttacgtcact ttatgctggg caccgcaccg aatctggctc gctgggacta tcacacaact 1440
cacatcaacc aattacagct cttgagcacc attgacgaaa gcccaatttt caaagaattc 1500
gtcaaacggt ggaaatctta tctgaaaggc ggtcgcgcaa agcataat 1548
<210> 59
<211> 516
<212> PRT
<213> 斑马鱼
<400> 59
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu Pro Phe Ser Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Ala Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala Glu Asp Lys Asp Ser
130 135 140
Arg Ser Ser Asp Trp Thr Val Pro Lys Gly Cys Ser Leu Ser Thr Val
145 150 155 160
Tyr Asp Lys Ser Arg Phe Thr Asn Val Lys Gln Phe Val Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly Ser Val Ser Val Val
195 200 205
Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Val His Tyr Val Ser
210 215 220
Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp Ile Tyr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val Thr Asp
245 250 255
Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Gln Thr
260 265 270
Lys Ile Met Pro Lys Arg Val Val Arg Leu Val Ala Lys Gly Arg Gly
275 280 285
Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Lys Ser Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His Ala Phe Leu Ser Ser
355 360 365
Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys His Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser Leu Ile
405 410 415
Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly Lys Glu
420 425 430
Ala Arg Gln Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ser Pro Ile
485 490 495
Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 60
<211> 585
<212> PRT
<213> 斑马鱼
<400> 60
Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Phe Thr Leu Leu Thr Val Leu Leu Trp Asn Lys Cys Ser
20 25 30
Ser Asp Lys Ala Leu Arg Phe Leu Pro Gln His Pro Gln Pro Pro Pro
35 40 45
Ser Pro Lys Ile Asp Ser His Pro Gln Gln Pro Gln Pro Pro Glu Pro
50 55 60
Pro Pro Val Val Gly Gly Val Lys Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Glu Ala Thr Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Phe
85 90 95
Leu Pro Phe Ser Trp Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Val Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala
195 200 205
Glu Glu Arg Asp Ser Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Thr Arg Val Tyr Asp Lys Thr Arg Ala Thr Ser Val Lys Gln
225 230 235 240
Phe Ser Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Thr Thr Asn Gly
260 265 270
Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr
275 280 285
Ile His Tyr Val Ser Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp
290 295 300
Ile Thr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg
305 310 315 320
Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Ala Thr Lys Ile Met Pro Lys Arg Val Val Arg Leu Val
340 345 350
Val Lys Gly Thr Gly Phe Ile Asp Asn Ile Thr Ile Ser Thr Thr Ala
355 360 365
His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Met Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp
420 425 430
Arg Phe Leu Lys Ala Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu
485 490 495
Lys Leu Gly Arg Glu Ala Gly Gln Leu Tyr Ser Arg Gly Met Glu Ser
500 505 510
Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile
545 550 555 560
Asp Asn Ser Pro Ile Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 61
<211> 1548
<212> DNA
<213> 斑马鱼
<400> 61
ggcgtcaagt acgaagaaat cgattgcctg attaacgatg aagccaccat caaaggtcgt 60
cgcgaaggct cggaagtgtt tctgccattc agttgggtag agaaatattt tgaagtgtat 120
gggaaagtcg tacagtacga tggctacgat cggtttgagt ttagccacag ctatagcaag 180
gtctatgcgc aacgtgcccc atatcatcca gatggggtgt ttatgtcatt cgaaggctac 240
aatgtggagg tgcgtgatcg tgttaagtgc attagcggcg ttgagggtgt gccgttgtcc 300
acccaatggg gcccacaagg ttacttttac ccgattcaaa tcgcccagta tggcctgtcc 360
cattattcga agaatctgac agagaaaccg ccgcatgttg aggtctacga aactgctgaa 420
gaacgcgatt cacgcagttc tgcttggact gtgccgaaag gttgtagtct gacgcgcgtg 480
tacgataaaa cgcgcgcaac ttctgtcaaa cagtttagcg cacccgaaaa tagcgaaggc 540
gtttcgctgc aactggggaa taccaaggac ttcatcatta gttttgacct caaatttacc 600
accaatggta gtgtgtctgt tgttttggaa accaccgaga agaaccagct ctttaccatt 660
cactatgtct ccaacacaca gttgattgcc ttcaaagatc gggatattac ctatggcatt 720
ggtccgcgca ctagctggag tactgtgacc cgtgacctgg tgactgatct gcggaaaggc 780
gtcggccttt cgaacaccaa agcggtaaaa gcaacgaaaa tcatgccgaa acgtgtggtt 840
cgcctggttg taaaaggtac gggctttatc gacaacatta ccattagcac gacggcgcat 900
atggccgcat tctttgcggc ttccgattgg ctggtacgta accaggatga gcgtggagga 960
tggccgatca tggtgacccg caaattgggc gaaggtttca aatctctgga acctggttgg 1020
tattctgcga tggcgcaggg tcaggctatg tctacgctgg ttcgcgccta tctgctgacc 1080
aaagatgacc gcttcttaaa agccgcttta cgcgcaaccg caccttataa actgccttcg 1140
gagcaacatg gggtgaaagc ggtatttatg aacaaacacg attggtatga ggaatatccg 1200
acaattccga gctcattcgt tctgaacggc ttcatgtact ccctgattgg gctgtatgac 1260
cttaaagaaa cagccggtga aaagttaggc cgtgaagcgg gtcagcttta ctcccgcgga 1320
atggaatcgt taaaagcgat gctgcccctg tacgatacgg gtagcgggac catctacgac 1380
ctccgccatt ttatgctggg aaccgcgccg aatttagcgc gttgggacta tcacacgaca 1440
catattaacc agctccagtt gcttagcacg atcgacaatt cacccatctt caaggaattc 1500
gtcaaacgct ggaaatcata cttaaaaggc ggtcgcgcaa agcataat 1548
<210> 62
<211> 516
<212> PRT
<213> 斑马鱼
<400> 62
Gly Val Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu Ala Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Phe Leu Pro Phe Ser Trp
20 25 30
Val Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Val Glu Val Tyr Glu Thr Ala Glu Glu Arg Asp Ser
130 135 140
Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys Ser Leu Thr Arg Val
145 150 155 160
Tyr Asp Lys Thr Arg Ala Thr Ser Val Lys Gln Phe Ser Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Gln Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Thr Thr Asn Gly Ser Val Ser Val Val
195 200 205
Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Ile His Tyr Val Ser
210 215 220
Asn Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp Ile Thr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val Thr Asp
245 250 255
Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Ala Thr
260 265 270
Lys Ile Met Pro Lys Arg Val Val Arg Leu Val Val Lys Gly Thr Gly
275 280 285
Phe Ile Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Lys Ser Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Met Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp Arg Phe Leu Lys Ala
355 360 365
Ala Leu Arg Ala Thr Ala Pro Tyr Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys His Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser Leu Ile
405 410 415
Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly Arg Glu
420 425 430
Ala Gly Gln Leu Tyr Ser Arg Gly Met Glu Ser Leu Lys Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Asn Ser Pro Ile
485 490 495
Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 63
<211> 585
<212> PRT
<213> 斑马鱼
<400> 63
Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Phe Thr Leu Leu Thr Val Leu Leu Trp Asn Lys Cys Ser
20 25 30
Ser Glu Lys Ala Leu Arg Phe Leu Pro Gln His Pro Gln Pro Pro Pro
35 40 45
Ser Pro Lys Ile Asp Ser His Pro Gln Gln Pro Gln Pro Pro Glu Pro
50 55 60
Pro Pro Val Val Gly Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Glu Ala Thr Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr
85 90 95
Leu Pro Phe Ser Trp Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Val Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Glu Pro Tyr His Pro Asp Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala
195 200 205
Glu Glu Arg Asp Ser Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Thr Arg Val Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Gln
225 230 235 240
Phe Ser Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly
260 265 270
Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Thr
275 280 285
Ile His Tyr Val Thr Thr Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp
290 295 300
Ile Thr Tyr Gly Ile Gly Pro Arg Thr Thr Trp Ser Thr Val Thr Arg
305 310 315 320
Asp Leu Leu Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Ala Thr Lys Ile Met Pro Arg Arg Val Val Arg Leu Val
340 345 350
Val His Gly Thr Gly Phe Ile Asp Asn Ile Thr Ile Ser Thr Thr Ala
355 360 365
His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Arg Ala Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Met Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp
420 425 430
Arg Tyr Leu Lys Ala Ala Leu Arg Ala Thr Gly Pro Tyr Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Ile Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Ala Glu Thr Ala Gly Glu
485 490 495
Lys Leu Gly Arg Glu Ala Gly Gln Leu Tyr Ser Arg Gly Met Glu Ser
500 505 510
Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile
545 550 555 560
Asp Asn Ser Pro Ile Phe Arg Asp Phe Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 64
<211> 1548
<212> DNA
<213> 斑马鱼
<400> 64
ggcgttcggt atgaagaaat cgactgcctg attaacgatg aagcgacgat caaaggacgg 60
cgtgaaggtt ccgaagtgta tctgccgttt agctggatgg aaaagtattt cgaagtctat 120
ggcaaagtcg tacagtacga cggttatgac cgtttcgaat ttagtcactc atattcgaag 180
gtttatgctc agcgtgagcc ctatcatcca gatggtgtgt tcatgtcgtt tgaaggttac 240
aacgtggaag tccgtgatcg tgtcaaatgc atctcaggcg tagaaggtgt gcccttatct 300
acacaatggg gtccgcaggg ttacttctac ccgattcaga tcgcgcaata tgggctgagc 360
cactacagca agaacttgac ggaacgccca cctcatgtag aggtctatga taccgctgag 420
gaacgcgata gtcgctcatc tgcctggacc gtgcccaaag gctgttcgtt aacccgcgtg 480
tatgacaaga cccgcgcgac ctccgttcgc cagttttctg ctccggaaaa ttcggaaggc 540
gttagcttac cgctgggtaa cacgaaagat ttcatcatta gctttgatct caaatttacg 600
agcaatggct ccgttagcgt tgtcctggaa acgaccgaga aaggcccgcc ttttaccatc 660
cactatgtga cgactaccca gctgattgcc ttcaaagatc gcgatattac ctatggtatt 720
ggaccgcgta ctacctggtc cactgttaca cgcgatttgc tcacagatct gcgcaaaggc 780
gttggcctga gcaacactaa agcggtgaaa gcaaccaaga tcatgccgcg tcgtgttgta 840
cggcttgttg tgcatgggac tgggttcatt gacaacatta ccatctctac taccgcccat 900
atggccgcat tctttgcggc aagcgattgg ttagtgcgca atcaggacga acgcggagga 960
tggccgatca tggtaacccg caaacttggg gaaggctttc gtgcactgga accaggctgg 1020
tacagtgcga tggctcaagg tcaagccatg agtaccctgg tccgcgccta tctcctgacg 1080
aaagatgatc gctatctgaa ggccgcactg cgtgcaacag gcccttacaa acttccgtct 1140
gaacaacatg gcgtcaaagc cgtgtttatg aacaaatacg actggtacga agagtatccg 1200
acgattcctt ccagcttcgt gttgaatggc tttatctact cgttaattgg cttgtatgat 1260
ctggcggaaa ctgcgggcga gaaactgggt cgtgaagcgg ggcagctgta cagtcgcggt 1320
atggagtcgc tgaaagcgat gctgccatta tacgacacgg gaagtggcac gatttacgat 1380
ctgcgccact ttatgctggg tacagcgccg aatctcgcac gttgggacta ccataccacc 1440
catattaacc agttgcagct gcttggtacg atcgacaatt caccgatttt ccgcgatttt 1500
gtgaaacggt ggaaatcata tctgaaaggc ggtcgcgcaa agcataat 1548
<210> 65
<211> 516
<212> PRT
<213> 斑马鱼
<400> 65
Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu Ala Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr Leu Pro Phe Ser Trp
20 25 30
Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Glu Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala Glu Glu Arg Asp Ser
130 135 140
Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys Ser Leu Thr Arg Val
145 150 155 160
Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Gln Phe Ser Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly Ser Val Ser Val Val
195 200 205
Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Thr Ile His Tyr Val Thr
210 215 220
Thr Thr Gln Leu Ile Ala Phe Lys Asp Arg Asp Ile Thr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Thr Trp Ser Thr Val Thr Arg Asp Leu Leu Thr Asp
245 250 255
Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Ala Thr
260 265 270
Lys Ile Met Pro Arg Arg Val Val Arg Leu Val Val His Gly Thr Gly
275 280 285
Phe Ile Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Arg Ala Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Met Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp Arg Tyr Leu Lys Ala
355 360 365
Ala Leu Arg Ala Thr Gly Pro Tyr Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe Ile Tyr Ser Leu Ile
405 410 415
Gly Leu Tyr Asp Leu Ala Glu Thr Ala Gly Glu Lys Leu Gly Arg Glu
420 425 430
Ala Gly Gln Leu Tyr Ser Arg Gly Met Glu Ser Leu Lys Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Met Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile Asp Asn Ser Pro Ile
485 490 495
Phe Arg Asp Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 66
<211> 585
<212> PRT
<213> 斑马鱼
<400> 66
Met Arg Cys Leu Ala Ala Arg Val His Tyr Lys Thr Leu Ile Val Ile
1 5 10 15
Cys Ala Leu Leu Ser Leu Leu Thr Val Leu Leu Trp Asn Lys Cys Thr
20 25 30
Ser Glu Lys Ala Leu Arg Phe Leu Pro Gln His Pro Gln Pro Pro Pro
35 40 45
Ser Pro Lys Ile Asp Ser His Pro Gln Gln Pro Gln Pro Pro Glu Pro
50 55 60
Pro Pro Val Val Gly Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile
65 70 75 80
Asn Asp Asp Ala Thr Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr
85 90 95
Leu Pro Phe Ser Trp Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val
100 105 110
Val Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser
115 120 125
Lys Val Tyr Ala Gln Arg Glu Pro Tyr His Pro Asn Gly Val Phe Met
130 135 140
Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile
145 150 155 160
Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly
165 170 175
Tyr Phe Tyr Ala Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser
180 185 190
Lys Asn Leu Thr Glu Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala
195 200 205
Glu Glu Arg Asp Ser Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys
210 215 220
Ser Leu Thr Arg Val Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Glu
225 230 235 240
Phe Ser Ala Pro Glu Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn
245 250 255
Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly
260 265 270
Ser Val Ser Val Ile Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Val
275 280 285
Ile His Tyr Val Thr Thr Thr Gln Leu Ile Leu Phe Lys Asp Arg Asp
290 295 300
Ile Thr Tyr Gly Ile Gly Pro Arg Thr Thr Trp Ser Thr Val Thr Arg
305 310 315 320
Asp Leu Leu Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys
325 330 335
Ala Val Lys Ala Thr Lys Thr Met Pro Arg Arg Val Val Lys Leu Val
340 345 350
Val His Gly Thr Gly Thr Ile Asp Asn Ile Thr Ile Ser Thr Thr Ser
355 360 365
His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln
370 375 380
Asp Glu Arg Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu
385 390 395 400
Gly Phe Arg Ala Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly
405 410 415
Gln Ala Met Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp
420 425 430
Arg Tyr Leu Lys Ala Ala Leu Arg Ala Thr Gly Pro Phe Lys Leu Pro
435 440 445
Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp
450 455 460
Tyr Glu Glu Tyr Pro Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe
465 470 475 480
Ile Tyr Ser Leu Ile Gly Leu Phe Asp Leu Ala Glu Thr Ala Gly Glu
485 490 495
Lys Leu Gly Arg Glu Ala Gly Gln Leu Tyr Ser Lys Gly Met Glu Ser
500 505 510
Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr
515 520 525
Asp Leu Arg His Phe Ile Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp
530 535 540
Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile
545 550 555 560
Asp Asn Ser Pro Ile Phe Arg Asp Ser Val Lys Arg Trp Lys Ser Tyr
565 570 575
Leu Lys Gly Gly Arg Ala Lys His Asn
580 585
<210> 67
<211> 1548
<212> DNA
<213> 斑马鱼
<400> 67
ggcgttcggt atgaagaaat cgattgcctg atcaacgatg acgccaccat caaaggtcgc 60
cgtgaaggca gcgaagttta tctgccgttc agttggatgg agaagtattt tgaagtctac 120
ggcaaagtgg tgcagtatga cggatatgat cgctttgaat tttctcatag ctactccaaa 180
gtgtacgcac aacgtgaacc ttatcaccca aatggcgtgt tcatgagttt tgagggctat 240
aacgtcgagg tgcgcgaccg tgtgaaatgc atctcaggcg ttgagggagt tccgctttca 300
acccaatggg gtccacaagg ttacttttat gccattcaga tcgcacagta tggtttaagc 360
cattactcga agaaccttac ggaacgccct ccgcatgtgg aagtctatga taccgcggaa 420
gaacgcgatt cacgctcgtc ggcttggacg gtgcctaaag gctgtagctt gacgcgcgtt 480
tatgacaaga cacgcgcaac tagtgtacgc gagttttctg cgcctgaaaa ctccgaaggc 540
gtcagtctgc cactgggcaa taccaaagat ttcattatct cctttgacct taaatttacc 600
tccaatggct ctgtttccgt gattctcgaa accaccgaga aaggcccgcc ctttgtaatt 660
cactacgtca ccaccaccca gctgattctg ttcaaagatc gcgatattac gtatggcatt 720
ggaccgcgta ctacgtggtc gacggtaact cgtgacttat tgactgatct tcggaaaggt 780
gtcggcctgt caaacacaaa agcggttaaa gcgaccaaga ccatgccgcg tcgcgtggtt 840
aaactcgtag tacatgggac gggcaccatt gacaacatca ccattagcac gacaagccac 900
atggcggcct tcttcgccgc atctgactgg ctggtacgga atcaggatga acgtggtggc 960
tggccgatca tggttactcg taaactgggt gaagggtttc gtgcattaga accgggctgg 1020
tatagtgcga tggcccaagg tcaggccatg agcaccttag tgcgtgctta tctgctgacg 1080
aaagacgatc ggtacctgaa agcagcttta cgcgccaccg ggccgttcaa attgcccagc 1140
gaacagcatg gtgtcaaagc ggttttcatg aacaagtatg actggtatga agagtaccca 1200
acgattccct cgagctttgt cctgaacggt ttcatttact ctctgattgg cctgtttgat 1260
ctggcggaaa ccgcgggtga aaagctgggt cgtgaggctg gtcagttgta ctcgaaaggg 1320
atggaatccc tgaaggccat gttaccgctg tacgatacag ggtcaggcac catctatgat 1380
ctgcgccatt tcattctggg tactgctccg aatctcgcgc gttgggatta ccatactacg 1440
cacattaacc aactccagct gctgggaaca atcgataata gcccgatctt tcgcgatagc 1500
gtgaaacgct ggaaaagtta cttgaaaggc ggtcgcgcaa agcataat 1548
<210> 68
<211> 516
<212> PRT
<213> 斑马鱼
<400> 68
Gly Val Arg Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Asp Ala Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Ser Glu Val Tyr Leu Pro Phe Ser Trp
20 25 30
Met Glu Lys Tyr Phe Glu Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Glu Pro Tyr His Pro Asn Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Ala Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Arg Pro Pro His Val Glu Val Tyr Asp Thr Ala Glu Glu Arg Asp Ser
130 135 140
Arg Ser Ser Ala Trp Thr Val Pro Lys Gly Cys Ser Leu Thr Arg Val
145 150 155 160
Tyr Asp Lys Thr Arg Ala Thr Ser Val Arg Glu Phe Ser Ala Pro Glu
165 170 175
Asn Ser Glu Gly Val Ser Leu Pro Leu Gly Asn Thr Lys Asp Phe Ile
180 185 190
Ile Ser Phe Asp Leu Lys Phe Thr Ser Asn Gly Ser Val Ser Val Ile
195 200 205
Leu Glu Thr Thr Glu Lys Gly Pro Pro Phe Val Ile His Tyr Val Thr
210 215 220
Thr Thr Gln Leu Ile Leu Phe Lys Asp Arg Asp Ile Thr Tyr Gly Ile
225 230 235 240
Gly Pro Arg Thr Thr Trp Ser Thr Val Thr Arg Asp Leu Leu Thr Asp
245 250 255
Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Ala Thr
260 265 270
Lys Thr Met Pro Arg Arg Val Val Lys Leu Val Val His Gly Thr Gly
275 280 285
Thr Ile Asp Asn Ile Thr Ile Ser Thr Thr Ser His Met Ala Ala Phe
290 295 300
Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Arg Gly Gly
305 310 315 320
Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Arg Ala Leu
325 330 335
Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Met Ser Thr
340 345 350
Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp Asp Arg Tyr Leu Lys Ala
355 360 365
Ala Leu Arg Ala Thr Gly Pro Phe Lys Leu Pro Ser Glu Gln His Gly
370 375 380
Val Lys Ala Val Phe Met Asn Lys Tyr Asp Trp Tyr Glu Glu Tyr Pro
385 390 395 400
Thr Ile Pro Ser Ser Phe Val Leu Asn Gly Phe Ile Tyr Ser Leu Ile
405 410 415
Gly Leu Phe Asp Leu Ala Glu Thr Ala Gly Glu Lys Leu Gly Arg Glu
420 425 430
Ala Gly Gln Leu Tyr Ser Lys Gly Met Glu Ser Leu Lys Ala Met Leu
435 440 445
Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His Phe
450 455 460
Ile Leu Gly Thr Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr Thr
465 470 475 480
His Ile Asn Gln Leu Gln Leu Leu Gly Thr Ile Asp Asn Ser Pro Ile
485 490 495
Phe Arg Asp Ser Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Gly Arg
500 505 510
Ala Lys His Asn
515
<210> 69
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
gccgcgtctt ctggaggcct gaaatacgag gaaat 35
<210> 70
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
ggatccgagc tcgagttagt tatgtttggc gcgtccgc 38
<210> 71
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
gccgcgtctt ctggaggtct gaaatatgaa gagatt 36
<210> 72
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
gccgcgtctt ctggaggcgt caagtacgaa gaaatc 36

Claims (17)

1.生产具有经异构化的己糖醛酸残基的肝素前体(heparosan)化合物的方法,所述方法包括在存在选自由以下(A)至(F)组成的组的蛋白质的情况下,从肝素前体化合物生产所述具有经异构化的己糖醛酸残基的肝素前体化合物:
(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;
(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;
(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有80%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性。
2.根据权利要求1的方法,
其中所述蛋白质(B)是(B')包含与SEQ ID NO:2的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质,和
其中所述蛋白质(E)是(E')包含与SEQ ID NO:5的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质。
3.根据权利要求1或2的方法,其中所述蛋白质是选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
4.根据权利要求1至3中任一项的方法,其中所述蛋白质源自斑马鱼。
5.根据权利要求1至4中任一项的方法,其中在存在生产所述蛋白质的经转化的微生物或其提取物的情况下,生产所述具有经异构化的己糖醛酸残基的肝素前体化合物。
6.根据权利要求5的方法,其中所述经转化的微生物是包含表达单元的宿主细胞,所述表达单元包含选自由以下(a)至(j)组成的组的多核苷酸和与其可操作地连接的启动子:
(a)多核苷酸,其包含SEQ ID NO:1的核苷酸序列;
(b)多核苷酸,其包含与SEQ ID NO:1的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(c)多核苷酸,其在严格条件下与由与SEQ ID NO:1的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(d)多核苷酸,其包含SEQ ID NO:3的核苷酸序列;
(e)多核苷酸,其包含与SEQ ID NO:3的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(f)多核苷酸,其在严格条件下与由与SEQ ID NO:3的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(g)多核苷酸,其包含SEQ ID NO:4的核苷酸序列;
(h)多核苷酸,其包含与SEQ ID NO:4的核苷酸序列具有80%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;
(i)多核苷酸,其在严格条件下与由与SEQ ID NO:4的核苷酸序列互补的核苷酸序列组成的多核苷酸杂交,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j)选自由(a)至(i)组成的组的多核苷酸的简并突变体。
7.根据权利要求6的方法,
其中所述多核苷酸(b)是(b')包含与SEQ ID NO:1的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸,
其中所述多核苷酸(e)是(e')包含与SEQ ID NO:3的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸,并且
其中所述多核苷酸(h)是(h')包含与SEQ ID NO:4的核苷酸序列具有90%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质的多核苷酸。
8.根据权利要求6或7的方法,其中所述多核苷酸是选自由以下(e1)至(j1)组成的组的多核苷酸:
(e1)多核苷酸,其包含选自由SEQ ID NO:55、58、61、64和67组成的组的核苷酸序列;
(e2)多核苷酸,其包含与选自由SEQ ID NO:58、61、64和67组成的组的核苷酸序列具有95%或更高同源性的核苷酸序列,并编码具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质;和
(j1)多核苷酸(e1)或(e2)的简并突变体。
9.根据权利要求6至8中任一项的方法,其中所述经转化的微生物是属于埃希氏菌属的细菌。
10.根据权利要求9的方法,其中所述经转化的微生物是大肠杆菌。
11.根据权利要求1至10中任一项的方法,其中所述肝素前体化合物是经N-硫酸化的肝素前体。
12.根据权利要求1至11中任一项的方法,其中所述肝素前体化合物是低分子化的肝素前体。
13.生产硫酸乙酰肝素的方法,
所述方法包括对肝素前体进行处理以生产硫酸乙酰肝素,所述处理包括己糖醛酸残基的C5-差向异构化、己糖醛酸残基的2-O-硫酸化、α-D-葡糖胺残基的N-去乙酰化、α-D-葡糖胺残基的N-硫酸化、α-D-葡糖胺残基的3-O-硫酸化和α-D-葡糖胺残基的6-O-硫酸化,
其中在存在选自以下(A)至(F)的蛋白质的情况下进行所述C5-差向异构化:
(A)蛋白质,其包含SEQ ID NO:2的氨基酸序列;
(B)蛋白质,其包含与SEQ ID NO:2的氨基酸序列具有80%或更高同一性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(C)蛋白质,其包含在SEQ ID NO:2的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;
(D)蛋白质,其包含SEQ ID NO:5的氨基酸序列;
(E)蛋白质,其包含与SEQ ID NO:5的氨基酸序列具有80%或更高同一性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F)蛋白质,其包含在SEQ ID NO:5的氨基酸序列中缺失、取代、添加或插入一个或几个氨基酸残基而成的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性。
14.根据权利要求13的方法,
其中所述蛋白质(B)是(B')包含与SEQ ID NO:2的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质,和
其中所述蛋白质(E)是(E')包含与SEQ ID NO:5的氨基酸序列具有90%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性的蛋白质。
15.根据权利要求13或14的方法,其中所述蛋白质选自由以下(E1)至(F1)组成的组:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
16.根据权利要求13至15中任一项的方法,其中所述处理进一步包括将肝素前体分解成小分子。
17.选自由以下(E1)至(F1)组成的组的蛋白质:
(E1)蛋白质,其包含选自由SEQ ID NO:56、59、62、65和68组成的组的氨基酸序列;
(E2)蛋白质,其包含与选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列具有95%或更高同源性的氨基酸序列,并具有D-葡糖醛酸基C5-差向异构酶活性;和
(F1)蛋白质,其包含在选自由SEQ ID NO:59、62、65和68组成的组的氨基酸序列中缺失、取代、添加或插入1至25个氨基酸残基而成的氨基酸序列,并且具有D-葡糖醛酸基C5-差向异构酶活性。
CN201780083960.0A 2017-01-19 2017-08-29 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法 Active CN110191958B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017007900 2017-01-19
JP2017-007900 2017-01-19
PCT/JP2017/030998 WO2018135027A1 (ja) 2017-01-19 2017-08-29 ヘキスロン酸残基が異性化されたヘパロサン化合物の製造方法

Publications (2)

Publication Number Publication Date
CN110191958A true CN110191958A (zh) 2019-08-30
CN110191958B CN110191958B (zh) 2024-06-25

Family

ID=62907862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780083960.0A Active CN110191958B (zh) 2017-01-19 2017-08-29 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法

Country Status (5)

Country Link
US (1) US11639513B2 (zh)
EP (1) EP3572522A4 (zh)
JP (1) JP7088026B2 (zh)
CN (1) CN110191958B (zh)
WO (1) WO2018135027A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020209822A1 (en) 2019-01-15 2021-09-09 Optimvia, Llc Engineered aryl sulfate-dependent enzymes
EP3997238A1 (en) 2019-07-09 2022-05-18 Optimvia, LLC Methods for synthesizing anticoagulant polysaccharides

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004017910A2 (en) * 2002-08-23 2004-03-04 Neose Technologies, Inc. Total synthesis of heparin
WO2015050184A1 (ja) * 2013-10-02 2015-04-09 味の素株式会社 ヘパロサン生産細菌及びヘパロサンの製造法
CN105283549A (zh) * 2013-06-12 2016-01-27 生化学工业株式会社 细菌肝素前体-葡萄糖醛酸-5-差向异构酶以及使用其的多糖的制造方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0014579B1 (pt) 1999-09-30 2011-05-31 composição refrigerante.
US8227449B2 (en) 2000-03-30 2012-07-24 Glycores 2000 S.R.L. Glycosaminoglycans derived from K5 polysaccharide having high anticoagulant and antithrombotic activities and process for their preparation
AU2002217174B2 (en) 2000-12-08 2006-06-22 Biotie Therapies Corp. Glucuronyl C5-epimerase, DNA encoding the same and uses thereof
ES2335750T3 (es) 2001-03-30 2010-04-05 Ajinomoto Co., Inc. Metodo de secrecion y de produccion de proteinas.
US7344874B2 (en) 2004-03-04 2008-03-18 Ajinomoto Co., Inc. L-glutamic acid-producing microorganism and a method for producing L-glutamic acid
JP4730302B2 (ja) 2004-04-20 2011-07-20 味の素株式会社 タンパク質の製造法
WO2006124801A2 (en) 2005-05-12 2006-11-23 The University Of North Carolina At Chapel Hill Enzymatic synthesis of sulfated polysaccharides
RU2355763C2 (ru) 2006-09-13 2009-05-20 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Мутантная ацетолактатсинтаза и способ продукции разветвленных l-аминокислот
WO2017115674A1 (ja) * 2015-12-28 2017-07-06 味の素株式会社 抗凝固活性を有するヘパラン硫酸の製造法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004017910A2 (en) * 2002-08-23 2004-03-04 Neose Technologies, Inc. Total synthesis of heparin
CN105283549A (zh) * 2013-06-12 2016-01-27 生化学工业株式会社 细菌肝素前体-葡萄糖醛酸-5-差向异构酶以及使用其的多糖的制造方法
WO2015050184A1 (ja) * 2013-10-02 2015-04-09 味の素株式会社 ヘパロサン生産細菌及びヘパロサンの製造法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NCBI: "ACCESSION NO. 4PW2_A: Chain A, D-glucuronyl C5 Epimerase B", 《PDB DATABASE》 *
YI QIN等: "Structural and Functional Study of D-Glucuronyl C5-epimerase", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *

Also Published As

Publication number Publication date
CN110191958B (zh) 2024-06-25
JPWO2018135027A1 (ja) 2019-11-07
US11639513B2 (en) 2023-05-02
JP7088026B2 (ja) 2022-06-21
US20190338330A1 (en) 2019-11-07
EP3572522A1 (en) 2019-11-27
EP3572522A4 (en) 2020-10-28
WO2018135027A1 (ja) 2018-07-26

Similar Documents

Publication Publication Date Title
CN111065740B (zh) 2-o-硫酸化酶突变体和3-o-硫酸化酶突变体及其使用方法
ES2820429T3 (es) Diversificación de los oligosacáridos de la leche humana (HMO) o sus precursores
Urbanowicz et al. Structural, mutagenic and in silico studies of xyloglucan fucosylation in Arabidopsis thaliana suggest a water‐mediated mechanism
Herlihey et al. The essential protein for bacterial flagella formation FlgJ functions as a β-N-acetylglucosaminidase
MX2013004055A (es) Nuevas fucosiltransferasas y sus aplicaciones.
JP6403839B2 (ja) コプリナス・シネレウス(Coprinus cinereus)由来エンドグリコシダーゼ
Saburi et al. Practical preparation of epilactose produced with cellobiose 2-epimerase from Ruminococcus albus NE1
US11066685B2 (en) Fermentation process for producing monosaccharides in free form from nucleotide-activated sugars
CN108699580B (zh) 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素
CN110191958B (zh) 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法
KR20210126019A (ko) 엔지니어링된 아릴 설페이트-의존 효소
KR20230113685A (ko) 바실러스 세포에서 시알산화된 올리고사카라이드의 생산
Gonçalves et al. Endo-β-d-1, 4-mannanase from Chrysonilia sitophila displays a novel loop arrangement for substrate selectivity
TW202020147A (zh) 使用腸桿菌科(Enterobacteriaceae)之細菌使醇和胺經酶催化性磺醯化之方法
US10745675B2 (en) Modified enzymes for producing increased isomelezitose
CN112996902A (zh) 用于产生苄基异喹啉生物碱(bia)的重组宿主细胞和苄基异喹啉生物碱(bia)的新的制造方法
CN111187785A (zh) 一种短小蛇根草色氨酸脱羧酶基因OpTDC2的克隆表达及应用
JP6993637B2 (ja) フコース含有糖鎖を特異的に切断するエンドグリコシダーゼ
Sumida et al. Genetic and functional diversity of beta-N-acetylgalactosamine residue-targeting glycosidases expanded by deep-sea metagenome
CN108251403B (zh) 一种新型鞘糖脂内切糖苷酶及其基因工程制备方法和应用
KR20190040683A (ko) 클로스트리디움 스터코라리움 유래 엘-람노스 이성화효소 변이체 및 이를 이용한 알룰로스로부터 알로스의 생산 방법
US20210024974A1 (en) High-Throughput Cell-Based Screening Methodology For Evaluating Carbohydrate-Active Enzymes
JP2007312677A (ja) 新規エンドグリコセラミダーゼ
JP6252894B2 (ja) コプリナス・シネレウス(Coprinuscinereus)由来エンドグリコシダーゼ
KR20230063438A (ko) 신규한 한천 분해 세균 유래의 GH50A β­아가레이즈 및 이를 이용한 네오아가로비오스의 생산 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant