CN1140629C - 来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用 - Google Patents

来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用 Download PDF

Info

Publication number
CN1140629C
CN1140629C CNB981257844A CN98125784A CN1140629C CN 1140629 C CN1140629 C CN 1140629C CN B981257844 A CNB981257844 A CN B981257844A CN 98125784 A CN98125784 A CN 98125784A CN 1140629 C CN1140629 C CN 1140629C
Authority
CN
China
Prior art keywords
leu
ala
val
ile
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB981257844A
Other languages
English (en)
Other versions
CN1227870A (zh
Inventor
M����ķ˹
M·波姆佩朱斯
R
J·L·R·多瓦尔
H·佐伊贝尔格
A·基梅内兹
�����շ�������˹��
H·W·赫夫肯
S
M·A·S·加斯尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN1227870A publication Critical patent/CN1227870A/zh
Application granted granted Critical
Publication of CN1140629C publication Critical patent/CN1140629C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1077Pentosyltransferases (2.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1235Diphosphotransferases (2.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P25/00Preparation of compounds containing alloxazine or isoalloxazine nucleus, e.g. riboflavin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Led Devices (AREA)
  • Glass Compositions (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Cosmetics (AREA)

Abstract

来自棉铃腐阿氏酵母的嘌呤生物合成基因用于微生物核黄素合成。

Description

来自棉铃腐阿氏酵母的嘌呤生物合成基因 及在微生物核黄素合成中的应用
本发明涉及来自棉铃腐阿氏酵母(Ashbya gassypii)的嘌呤生物合成基因及在微生物核黄素合成中的应用。
维生素B2,也叫核黄素,是人和动物必需的。维生素B2的缺乏和口及喉部粘膜的炎症,皮褶的骚痒和炎症和类似皮肤损伤,结膜炎,视觉精度的降低和角膜云翳相关。婴儿和儿童可能生长停止和体重降低。维生素B2由此具有经济价值,特别如作为在维生素缺乏时的维生素补充和动物食物的维生素补充。也可用于食物染色,例如蛋黄酱,冰激凌,牛奶冻等。
维生素B2可化学或微生物制备(参见,例如,Kurth等(1996)核黄素,Ullman’s Encyclopedia化学工业,VCH Weinheim)。在化学制备程序中,核黄素,一般,作为多步反应的纯的终产物获得,需使用相对昂贵的起始原料如,例如D-核糖。替代核黄素的化学合成的是利用微生物制备此物质。此时使用的起始材料是可更新的原材料如糖或植物油。通过酵母如阿氏假囊酵母和棉铃腐阿氏酵母发酵制备核黄素是已知的(Merck Index,Windolz等,编Merck&Co.1183页,1983),酵母如,例如念珠菌,毕氏酵母和裂殖酵母,或细菌如,例如杆菌,芽胞梭菌或棒状杆菌也被描述为核黄素生产者。
EP405370描述通过转化来自枯草杆菌的核黄素生物合成基因获得的核黄素高产菌株。其中描述的基因,和其它来自原核的涉及维生素B2生物合成的基因不适合真核如,啤酒酵母和棉铃腐阿氏酵母的重组核黄素制备过程。
DE4420785描述了六个来自棉铃腐阿氏酵母的核黄素生物合成基因,和用这些基因转化的微生物,和利用这些微生物合成核黄素。
通过这些程序可能产生微生物合成核黄素的生产菌株。然而这些生产菌株往往有代谢限制而不能通过插入生物合成基因消除或在某些时候诱导。这样的生产菌株有时不能通过足够的底物以饱和合成中的一些步骤,于是代谢的一些片段的生物合成能力不能被完全开发。
由此期望增强代谢通路的后面部分,以消除代谢瓶颈。这样进一步在核黄素合成能力方面优化用于核黄素微生物合成的微生物(生产菌株)。可以期望分辨复杂代谢的增强部分并以适当方式增强之。
本发明涉及嘌呤生物合成的新蛋白,其基因及微生物核黄素合成中的用途。
嘌呤代谢(综述,参见,例如,Voet,D和Voet,J.G.,1994,Biochemie,VCH Weinheim,743-771页;Zalkin,H和Dixon,J.E.1992,嘌呤核苷酸从头所合成,核酸研究和分子生物学。42卷,259-287页,Academic Press)所有生物形式必需的代谢的一部分。缺陷的嘌呤代谢在人类可能引起严重疾病(例如痛风)。嘌呤代谢更是治疗肿瘤和病毒感染的重要靶点。已发表用于这些目的描述干扰嘌呤代谢的物质的若干文献(综述,例如Christopherson,R.I.和Lyons,S.D.,1990,嘌呤和嘧啶从头所合成的专利抑制剂用作化疗药物。Med.Res.综述10,505-548页。)
研究嘌呤代谢涉及的酶(Smith,J.L.,核苷酸合成中的酶,1995,Curr.Opinion Struct.Biol.5,752-757)目标在于发展新的免疫抑制,抗寄生虫或抗增生药物(Biochem.Soc.Transact.23,877-902页,1995)。这些药物通常并不自然产生嘌呤嘧啶或其衍生物。
本发明涉及具有序列号2的多肽序列或从序列号2通过取代,插入,或删除高达15%氨基酸而获得的多肽序列的蛋白,并具有磷酸核糖焦磷酸合成酶活性。
序列号2描述的序列是来自棉铃腐阿氏酵母KPR1基因(序列号1)的产物。
本发明进一步涉及具有序列号5的多肽序列或从序列号5通过取代,插入,或删除高达10%氨基酸而获得的多肽序列的蛋白,并具有谷氨酰胺-磷酸核糖焦磷酸氨基转移酶活性。
序列号5描述的序列是来自棉铃腐阿氏酵母ADE4基因(序列号3)的产物。
本发明进一步涉及具有序列号8的多肽序列或从序列号8通过取代,插入,或删除高达20%氨基酸而获得的多肽序列的蛋白,并具有IMP脱氢酶活性。
序列号8和9描述的序列是来自棉铃腐阿氏酵母GUA1基因(序列号7)的产物。
本发明进一步涉及具有序列号11的多肽序列或从序列号11通过取代,插入,或删除高达10%氨基酸而获得的多肽序列的蛋白,并具有GMP合成酶活性。
序列号11描述的序列是来自棉铃腐阿氏酵母GUA2基因(序列号10)的产物。
本发明进一步涉及具有序列号13的多肽序列或从序列号13通过取代,插入,或删除高达10%氨基酸而获得的多肽序列的蛋白,并具有磷酸核糖焦磷酸合成酶活性。
序列号13描述的序列是来自棉铃腐阿氏酵母KPR2基因(序列号12)的产物。
这些提到的基因产物可通过基因技术的常规方法修饰,如定点诱变,这样特殊的氨基酸序列被取代,额外插入或删除。氨基酸残基通常(但不绝对)被有相似体积,电荷或亲水性/疏水性的氨基酸残基取代以使基因产物不失去酶特性。特别的,活性中心的氨基酸序列的修饰经常导致酶活性的严重改变。然而,氨基酸序列和其它,次重要位点的修饰经常被耐受。
新蛋白可能
1.就AgKPR1基因的基因产物而言,与序列表中描述的序列相比,最高可达15,优选最高可达10且特别优选最高可达5%的氨基酸修饰。
2.就AgADE4基因的基因产物而言,与序列表中描述的序列相比,最高可达10且特别优选最高可达5%的氨基酸修饰。
3.就AgGUA1基因的基因产物而言,与序列表中描述的序列相比,最高可达20,优选最高可达15,特别优选最高可达10且尤其优选最高可达5%的氨基酸修饰。
4.就AgGUA2基因的基因产物而言,与序列表中描述的序列相比,最高可达10且特别优选最高可达5%的氨基酸修饰。
5.就AgKPR2基因的基因产物而言,与序列表中描述的序列相
比,最高可达10%,优选最高可达7%且特别优选最高可达5%的氨基酸修饰。
优选蛋白是那些具有改变的调节但仍具有相对酶活性的蛋白。许多这样的酶被中间产物或终产物强烈控制活性(反馈抑制)。这导致一旦存在足够终产物酶活性将被限制。
然而,对生产菌株,此经济控制在生理状态常导致超出某一界限的产量提高成为不可能。这种反馈抑制的消除导致不管终产物的浓度如何,酶都保持其活性,并且因此绕过代谢瓶颈。这最终导致核黄素生物合成的显著增加。
优选的新蛋白是那些不再被代谢通路的二级产物(来自酶的产物)抑制的蛋白。特别优选的新蛋白是那些不再被嘌呤生物合成的中间体,特别是嘌呤碱基,嘌呤核苷,嘌呤核苷酸5’-单磷酸酯或嘌呤核苷酸双磷酸酯或嘌呤核苷酸三磷酸酯所抑制的蛋白。特别优选的新蛋白具有以下氨基酸序列的修饰和含有以下修饰的氨基酸序列修饰的组合。
AgKPR1基因产物的氨基酸序列修饰。
7位的亮氨酸为缬氨酸取代
52位的天冬氨酸为组氨酸取代
131位的亮氨酸为异亮氨酸取代
186位的天冬氨酸为组氨酸取代
193位的丙氨酸为缬氨酸取代
196位的组氨酸为谷氨酰胺取代
AgADE4基因产物的氨基酸序列修饰。
310位的天冬氨酸为缬氨酸取代
333位的赖氨酸为丙氨酸取代
417位的丙氨酸为色氨酸取代
本发明的第一方面涉及具有序列号2所示多肽序列或从序列号2通过取代,插入,删除最高可达15%的氨基酸得到的多肽序列的蛋白,且具有磷酸核糖焦磷酸合成酶活性。优选地,它不再受嘌呤生物合成中间产物抑制,特别是嘌呤碱基,嘌呤核苷,嘌呤核苷酸5’单磷酸或嘌呤核苷酸5’-二磷酸或嘌呤核苷酸5’-三磷酸的抑制,它是L131I或H196Q,优选地,其中一个或多个下列氨基酸取代存在:7位的赖氨酸为缬氨酸取代,52位的天冬氨酸为组氨酸取代,133位的亮氨酸为异亮氨酸取代,186位的天冬氨酸为组氨酸取代,193位的丙氨酸为缬氨酸取代或196位的组氨酸为谷氨酰胺取代。
本发明的第二方面,涉及编码本发明的第一方面所述蛋白的核酸序列。
本发明的第三方面,涉及本发明的第二方面所述核酸序列在能产生核黄素的微生物基因工程构建中的应用。
本发明的第四方面涉及通过培养微生物而制备核黄素的方法,其中微生物通过参入编码权利要求1-4和6之任一的蛋白的核苷酸序列而被遗传修饰。优选地,其中微生物是棉铃腐阿氏酵母。优选地,其中所述的遗传修饰包括至少一个如本发明的第二方面所述的核酸序列的至少一个附加的拷贝。优选地,其中遗传修饰产生编码本发明的第一方面所述的蛋白的基因。
图1:
棉铃腐阿氏酵母中Gln-PRPP氨基转移酶的修饰形式酶作为腺嘌呤5’-单磷酸(AMP)和鸟嘌呤5’-单磷酸(GMP)的浓度的函数的活性测定。
WT:Gln-PRPP氨基转移酶
A417W:Gln-PRPP氨基转移酶,417位丙氨酸为色氨酸取代。
K333A:Gln-PRPP氨基转移酶,333位赖氨酸为丙氨酸取代。
D310VK333A:Gln-PRPP氨基转移酶,310位天冬氨酸为缬氨酸取代且333位赖氨酸为丙氨酸取代。
图2:
棉铃腐阿氏酵母中PRPP合成酶和修饰形式酶作为腺嘌呤5’-二磷酸(ADP)的浓度的函数的活性测定。
WT:PRPP合成酶
L131I:PRPP合成酶,131位亮氨酸为异亮氨酸取代
H196Q:PRPP合成酶,196位组氨酸为谷氨酰胺取代
H196Q,L131I:PRPP合成酶,196位组氨酸为谷氨酰胺取代且131位亮氨酸为异亮氨酸取代。
以下实施例描述了新蛋白和核酸的制备及利用其生产具有高核黄素合成的微生物。
实施例1:
从棉铃腐阿氏酵母ATCC10895产生基因组基因库。
来自棉铃腐阿氏酵母的基因组DNA可提高如所述合适的方法制备,例如,WO9703208中。基因组基因文库可从此DNA开始通过合适方法(例如,Sambrook,J等(1989)分子克隆:实验室手册,冷泉港出版或Ausubel,F.M.等(1994)分子生物学方法,John和sons)在任何合适的质粒或粘粒,如,例如,SuperCosl(Stratagene,La Jolla,USA)中构建。
实施例2:
从棉铃腐阿氏酵母ATCC10895中克隆PRPP合成酶基因(AgKPR1)
从棉铃腐阿氏酵母ATCC10895中克隆PRPP合成酶基因(AgKPR1)可以两步实现。第一步,用PCR利用以下寡核苷酸扩增棉铃腐阿氏酵母来自基因组DNA的KPR1基因的特定区域是可能的:
KPR5:  5′-GATGCTAGAGACCGCGGGGTGCAAC-3′
KPR3:  5′-TGTCCGCCATGTCGTCTACAATAATA-3′
用合适方法进行PCR.所得330bpDNA片段可用合适方法克隆入载体pGEMT(promega,madison,USA)并测序。
用此核酸序列作探针用合适方法筛选基因组粘粒基因文库。一个1911bp的PstI-HindIII片段粘粒对此探针给出信号,将其亚克隆入载体pBluescript SK+(Stratagene,La Jolla,USA)。KPR1基因及同来自啤酒酵母的UBC6和UBP9有同源性的完整读码框架定位于此片段。
PRPP合成酶KPR2和假设的来自啤酒酵母的PRPP合成酶KPR4是最相关的酶,同来自棉铃腐阿氏酵母的PRPP合成酶相似性分别达80.2%和79.6%.来自啤酒酵母的KPR2和KPR4基因和来自棉铃腐阿氏酵母的KPR1基因分别有67.6%和67.8%的相似性。来自其它生物的其它酶和基因和来自棉铃腐阿氏酵母的PRPP合成酶基因的KPR1基因更不同。
例如,通过在PAM250加权表或Wilbur-Lipment DNA对比algorthm算法(如所指,例如,在DNAstar提供的MegAlign 3.06程序包中)帮助下的Clustal算法进行序列比较。不可能用所述寡核苷酸对扩增来自啤酒酵母的不同PRPP合成酶基因。
也可能用探针找到基因文库中另外的克隆。此第二克隆显示可能编码PRPP合成酶的基因。此基因称作AgKPR2并与AgKPR1明显不同。AgKPR2在氨基酸水平和AgKPR1有66%的一致。AgKPR2基因(序列号12)与Swissport数据库中所有蛋白比较。此蛋白显示的最大相似性(88%一致和95%相似)是和来自啤酒酵母的KPR3基因产物。AgKPR1基因的产物产生棉铃腐阿氏酵母中PRPP合成酶活性的主要部分。破坏棉铃腐阿氏酵母的AgKPR1基因(类似的破坏其它棉铃腐阿氏酵母基因在实施例6-8中描述)导致酶活性的显著降低:22U/mg蛋白取代为3U/mg蛋白。见实施例13的分析。实施例11,13和15涉及AgKPR1基因,但这些类型的研究也可用于AgKPR2。
实施例3:
从棉铃腐阿氏酵母ATCC10895中克隆谷氨酰胺-PRPP氨基转移酶基因(AgADE4)
从棉铃腐阿氏酵母ATCC10895中克隆谷氨酰胺-PRPP氨基转移酶基因(AgADE4)可以两步实现。第一步,用PCR利用以下寡核苷酸扩增棉铃腐阿氏酵母来自基因组DNA的AgADE4基因的特定区域是可能的:
AgADE4A:5′-ATATCTTGATGAAGACGTTCACCGT-3′
AgADE4B:5′-GATAATGACGGCTTGGCCGGGAAGA-3′
用合适方法进行PCR。所得360bpDNA片段可用合适方法克隆入载体pGEMT(promega,madison,USA)并测序。
用此合适序列作探针用合适方法筛选基因组粘粒基因文库。一个5369bp的HindIII片段粘粒对此探针给出信号,将其亚克隆入载体pBluescript SK+(Stratagene,La Jolla,USA)。AgADE4基因及同来自啤酒酵母的线粒体ABC转移者ATM1同源物和另一未知功能的读码框架定位于此片段。
AgADE4基因产物(谷氨酰胺-PRPP氨基转移酶)和来自啤酒酵母和kluyveri裂殖酵母ADE4基因产物有确切的相似性(分别81%和86.3%)。相应基因只显示68.8%和72%,分别,同源性。和其它谷氨酰胺-PRPP氨基转移酶有较少相似性(例如和枯草杆菌相应的每只有27.5%相似性)。可按实施例2描述进行序列比较。
不可能用所述寡核苷酸对扩增来自啤酒酵母或kluyveri裂殖酵母的ADE4基因。
实施例4:
从棉铃腐阿氏酵母ATCC10895中克隆肌苷-单磷酸脱氢酶基因(AgGUA1)
从棉铃腐阿氏酵母ATCC10895中克隆肌苷-单磷酸脱氢酶基因(AgGUA1)可以两步实现。
第一步中,用PCR利用以下寡核苷酸扩增棉铃腐阿氏酵母来自基因组DNA的AgGUA1基因的特定区域是可能的:
IMP5:  5′-GGCATCAACCTCGAGGAGGCGAACC-3′
IMP3:  5′-CAGACCGGCCTCGACCAGCATCGCC-3′
用合适方法进行PCR。所得230bpDNA片段可用合适方法克隆入载体pGEMT(promega,madison,USA)并测序。
用此序列作探针用合适方法筛选基因组粘粒基因文库。一个36 16bp的ApaI片段粘粒对此探针给出信号,将其亚克隆入载体pBluescript SK+(Stratagene,La Jolla,USA)。AgGUA1基因的编码区长1569bp且为161bp内含子打断。内含子边界(5’剪切位点AGGTATGT和3’剪切位点CAG)可通过AgGUA1cDNA的克隆和测序证明。
AgGUA1是第一个来自棉铃腐阿氏酵母的含内含子的基因。
AgGUA1基因产物(IMP脱氢酶)显示和来自啤酒酵母的4IMP脱氢酶最明确相似性(相似性在67%和77.2%之间)。和其它IMP脱氢酶的相似性较少。序列比较用实施例2描述的方法进行。棉铃腐阿氏酵母显示只有一个此酶的基因。这可用上述探针通过对来自棉铃腐阿氏酵母基因组DNA的Southern杂交显示。
来自啤酒酵母的编码和AgGUA1基因产物有很大相似性IMP脱氢酶(IMH3)的基因和AgGUA1基因有70.2%的相似性。不可能用所述寡核苷酸对扩增来自啤酒酵母的此基因。
实施例5:
从棉铃腐阿氏酵母ATCC10895中克隆鸟苷-单磷酸合成酶基因(AgGUA2)
从棉铃腐阿氏酵母ATCC10895中克隆鸟苷-单磷酸合成酶基因(AgGUA2)可以两步实现。
第一步中,用PCR利用以下寡核苷酸扩增棉铃腐阿氏酵母来自基因组DNA的AgGUA2基因的特定区域是可能的:
GUA2A:5′-TGGACCGGGCGGTGTTCGAGTTGGG-3′
GUA2B:5′-AGGCTGGATCCTGGCTGCCTCGCGC-3′
用合适方法进行PCR。所得750bpDNA片段可用合适方法克隆入载体pGEMT(promega,madison,USA)并测序。
用此合适序列作探针用合适方法筛选基因组粘粒基因文库。一个2697bp的ClaI-EcorV片段粘粒对此探针给出信号,将其亚克隆入载体pBluescript SK+(Stratagene,La Jolla,USA)。
AgGUA2基因产物(GMP合成酶)和来自啤酒酵母的GMP合成酶有最明确相似性(相似性86.6%)。来自啤酒酵母和棉铃腐阿氏酵母的GMP合成酶基因有71.2%同源。AgAUG2基因产物和其它GMP合成酶的相似性较少。序列比较可按实施例2描述进行。
不可能用所述寡核苷酸对扩增来自啤酒酵母GMP基因。
实施例6:
来自棉铃腐阿氏酵母ATCC10895的AgADE4基因的破坏
破坏一个基因是指破坏该基因基因组拷贝的功能,通过(a)删除部分基因序列,或(b)通过在基因中插入一段外源DNA破坏基因或(c)用外源DNA取代部分基因。可用任何外源DNA,但优选对任何合适化学物带来抗性的基因。任何合适的抗性基因可用于破坏基因。
含G418抗性的基因可用于破坏来自棉铃腐阿氏酵母ATCC10895的AgADE4基因。来自TN903在棉铃腐阿氏酵母TEF启动子控制下的卡那霉素抗性基因也可用(见,例如,酵母101793-1808页,1994,wo9200379)。基因5’和3’以多个限制性内切酶位点为侧翼,以构建允许任何期望的通过体外DNA生产的合适方法产生的基因破坏构建物的盒子。
AgADE4内的HincII片段(2366和2924位间)可被上述抗性盒子取代。所得构建物称为ade4::G418。
所得质粒可在大肠杆菌中复制。可制备构建物ade4::G418的BamHI/BglII片段,琼脂糖凝胶电泳纯化并接着回收凝胶中的DNA(见美国国家科学院院刊76,615-619,1979)并用于转染棉铃腐阿氏酵母。
棉铃腐阿氏酵母可用原生质体转染(基因109,99-105,1991),但优选通过电转(BioRad Gene Pulser,条件:狭缝宽度为0.4mm的小杯,1500V,25微法,100欧)。转染细胞用含G418的固体培养基筛选。
所得G418抗性克隆可通过合适方法如PCR和Southern杂交检测以发现是否AgADE4基因组拷贝确实被破坏。AgADE4基因被破坏的克隆是嘌呤营养缺陷的。
实施例7:
来自棉铃腐阿氏酵母ATCC10895的AgGUA1基因的破坏
参见实施例6对基因破坏的原理的描述,抗性盒子的使用和转染棉铃腐阿氏酵母。
AgGUA1内的XhoI/KpnI片段(1620和2061位间)可被上述抗性盒子取代。所得构建物称为gual::G418。
所得质粒可在大肠杆菌中复制。可制备构建物gual::G418的XbaI/BamHI片段,琼脂糖凝胶电泳纯化并接着回收凝胶中的DNA并用于转染棉铃腐阿氏酵母。
所得G418抗性克隆可通过合适方法如PCR和Southern杂交检测以发现是否AgGUA1基因组拷贝确实被破坏。AgGUA1基因被破坏的克隆是鸟嘌呤营养缺陷的。
实施例8:
来自棉铃腐阿氏酵母ATCC10895的AgGUA2基因的破坏
参见实施例6对基因破坏的原理的描述,抗性盒子的使用和转染棉铃腐阿氏酵母。
AgGUA1内的SalI片段(1153和1219位间)可被上述抗性盒子取代。所得构建物称为gua2::G418。
所得质粒可在大肠杆菌中复制。可制备构建物gua2::G418的XbaI/BamHI片段,琼脂糖凝胶电泳纯化并接着回收凝胶中的DNA并用于转染棉铃腐阿氏酵母。
所得G418抗性克隆可通过合适方法如PCR和Southern杂交检测以发现是否AgGUA2基因组拷贝确实被破坏。AgGUA2基因被破坏的克隆是鸟嘌呤营养缺陷的。
实施例9:
来自棉铃腐阿氏酵母的GAP启动子的克隆
来自棉铃腐阿氏酵母甘油醛-3-磷酸脱氢酶基因(AgGAP)可通过筛选棉铃腐阿氏酵母基因组粘粒文库克隆到(见实施例1,用从啤酒酵母的GAP基因序列所得信息构建的探针)。
基因的5’非翻译区(相对翻译起始点-373到-8区)假定为启动子。两个限制性内切酶NotI剪切位点插入此序列两端。在此区有真正的TATA盒(nt224-230),两个和GCRl结合元件反应的序列部分(nt43-51和77-85),及其互补区和啤酒酵母RAP1结合元件(见,例如,Johnston,M和Carlson,M(1992)pp193-281酵母的分子生物学和细胞生物学酵母:基因表达,冷泉港实验室出版)反应的序列部分(nt9-20)。用此方法构建的启动子盒子作为易移动表达信号置于任何在棉铃腐阿氏酵母中过表达的目的基因前并导致棉铃腐阿氏酵母中基因的明显过表达,如实施例11所示。
实施例10:
具有在来自棉铃腐阿氏酵母GAP启动子控制下的基因的质粒的构建
为将AgADE4基因的编码区的GAP启动子盒子5’引入,在ATG起始密码子5’8bp处通过合适方法(例如Glover,D.M和Hames,B.D.(1995)DNA克隆Vol1,IRL出版)插入一个NotI剪切位点(识别序列GCGGCCGC)。
GAP启动子盒子可通过NotI插入此位置。类似方法可用于克隆GAP启动子盒子于基因AgKPR1,AgGUA1,AgGUA2和基因AgADE4,AgKPR1,AgGUA1和AgGUA2变种的编码区5’。
棉铃腐阿氏酵母中编码区5’有GAP启动子盒子的基因的表达受GAP启动子的控制。
实施例l1:
棉铃腐阿氏酵母中GAP启动子控制下的基因的过表达
用实施例10描述的DNA构建物转染棉铃腐阿氏酵母可如实施例6描述进行。接受的克隆优选,但不绝对是那些,转染进行前,具有待过表达基因的破坏。这样,例如,实施例6描述的具有ade4::G418突变的棉铃腐阿氏酵母突变可用实施例10描述的GAP-ADE4构建物转染。构建物整合如基因组可用Southern杂交分析证明。所得克隆不再具有G418抗性基因(并是G418敏感的)且是嘌呤原养型。过表达可用Nothern杂交分析或每活性检测(如实施例12描述)显示。天然启动子下的AgADE4基因的表达,0.007U/mg蛋白可被检测。在GAP启动子下的AgADE4基因的表达,0.382U/mg蛋白可被检测。
AgADE4基因的编码区的一部分序列可用作探针。类似的方法可利用AgKPR1,AgGUA1,AgGUA2和其基因变种。另外,这些基因中的一个和其它基因的组合用此法引入棉铃腐阿氏酵母基因组。
野生型棉铃腐阿氏酵母具有特殊的PRPP合成酶活性22U/mg蛋白(见实施例13PRPP合成酶活性分析)。在有GAP启动子的AgKPR1基因表达中,测得855U/mg蛋白。
实施例12:
AgADE4基因产物(谷氨酰胺-PRPP氨基转移酶)的变种不再受嘌呤或嘌呤合成中间体反馈抑制。
谷氨酰胺-PRPP氨基转移酶受嘌呤核苷酸反馈抑制。此抑制在许多生物中都发现(见,例如,Switzer,R.L.(1989)细菌谷氨酰胺-磷酸核糖焦磷酸-氨基转移酶的调节,Allosteric酶pp.129-151,CRC出版,Boca Raton)。
来自棉铃腐阿氏酵母的谷氨酰胺-PRPP氨基转移酶可能受AMP或GMP(见图)的抑制。来自棉铃腐阿氏酵母的谷氨酰胺-磷酸核糖焦磷酸-氨基转移酶的活性用如Messenger和Zalkin(1979)生物化学杂志254,3382-3392页描述测定。
不再被嘌呤抑制的修饰的谷氨酰胺-磷酸核糖焦磷酸-氨基转移酶可被构建。过表达这样不受调节的酶比过表达受反馈抑制的酶可增强嘌呤代谢是明确的。AgADE4基因序列的改变可通过合适方法实现(例如Glover,D.M和Hames,B.D.(1995)DNA克隆Vol1,IRL出版)。例如,谷氨酰胺-磷酸核糖焦磷酸-氨基转移酶中以下的氨基酸被取代是可能的:
编码310位天冬氨酸的密码子可被编码缬氨酸的密码子取代。编码333位赖氨酸的密码子可被编码丙氨酸的密码子取代。编码417位丙氨酸的密码子可被编码色氨酸的密码子取代。构建具有这些取代的组合的AgADe4具有也是可能的。
含有D310V,K333A,A417W或包括D310V或K333A的取代组合的所有酶显示减少的被AMP和GMP(见图)的反馈抑制。这可,例如,通过在棉铃腐阿氏酵母中表达酶显示(见实施例11)。
实施例13:
AgKPR1基因产物(PRPP合成酶)的变种不再被嘌呤或嘌呤合成的中间产物反馈抑制。
PRPP合成酶受嘌呤,嘧啶,氨基酸反馈抑制。此抑制在许多生物中都发现(见,例如,Gibson,K.J.等(1992)生物化学杂志257,2391-2396;Tatibana,M等(1995)酶调节进展35,229-249和其所引文献)。
临床医学研究中有基于增强的嘌呤生物合成的遗传性痛风的描述。引起这的分子是所谓人类PRPP合成酶超活性(见,例如,美国医学杂志55(1973)232-242;临床研究杂志96(1995)2133-2141;生物杂志268(1993)26476-26481)。其基础可能是突变导致酶不再受嘌呤的反馈抑制。
来自棉铃腐阿氏酵母PRPP合成酶的活性可如生化年鉴98(1979)254-263或细菌杂志174(1992)6852-6856描述测定。比活性(U/mg)通过所得产物的量定义(nmol/min/g蛋白)。
不再被嘌呤抑制的修饰的PRPP合成酶可被构建。过表达这样不受调节的酶比过表达受反馈抑制的酶可增强嘌呤代谢是明确的。AgKPR1基因序列的修饰可通过合适方法实现(例如Glover,D.M和Hames,B.D.(1995)DNA克隆Voll,IRL出版)。例如,PRPP合成酶中以下的氨基酸被取代是可能的:
编码131位亮氨酸的密码子可被编码异亮氨酸的密码子取代。编码196位组氨酸的密码子可被编码谷氨酰胺的密码子取代。
具有这些氨基酸替换(L131I或H196Q)的所有酶显示减少的被嘌呤的反馈抑制。图2以ADP为例显示。
这可在棉铃腐阿氏酵母中表达相应酶后显示。这可按照实施例11进行。
实施例14:
AgGUA1基因产物(IMP脱氢酶)的变种不再被嘌呤或嘌呤合成的中间产物反馈抑制。
实施例15:
嘌呤代谢的酶和其基因对在棉铃腐阿氏酵母中核黄素生产的增强和/或优化结果
原始株棉铃腐阿氏酵母ATCC10895可在摇瓶中测定核黄素产生,同其衍生的含GAP启动子控制下的基因染色体拷贝的克隆(如实施例11描述)比较。可用300ml摇瓶装20mlYPD培养基(Sambrook,J等91989)分子克隆:实验室手册,冷泉港实验室出版),在28℃孵育。
两天后,对照菌株平均产生14.5mg核黄素每升培养物。过表达嘌呤代谢酶的基因(如实施例11所示),或过表达嘌呤代谢优化酶的基因(例如实施例12,13和14),的菌株产生更多核黄素。这样,两天内每升培养物过表达AgADE4D310VK333A(实施例12)的菌株平均产生45.4mg核黄素。
过表达AgKPR1含GAP启动子的菌株产生不是14mg/l(如WT)而是36mg/l核黄素。含GAP启动子的过表达AgKPR1H196Q的菌株产生51mg/l核黄素。
                        序列列表:
(1)一般信息:
(i)申请者:
(A)姓名:
(B)街道:
(C)城市:
(E)国家:
(F)邮政编码:
(G)电话:
(H)传真:
(I)TELEX:
(ii)发明题目:来自A的嘌呤生物合成基因及在微生物核黄素合成中的应用
(iii)序列数目:13
(iv)计算机可读类型:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:
(D)软件:
(2)SEQ ID NO:1信息:
(i)序列特征:
(A)长度:1911碱基对
(B)类型:核酸
(C)链类型:单链
(D)拓扑学:线性
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iv)反义:无
(ix)特征:
(A)名字/关键词:5’UTR
(B)位置:1...625
(ix)特征:
(A)名字/关键词:CDS
(B)位置:626...1582(ix)特征:
(A)名字/关键词:3’UTR
(B)位置:1583...1911(xi)序列的详细情况:SEQ ID NO:1:GGTAGTCGCT CATCGACAGA CACAATCGCG TGTTCTCTCT GAATCGTCCA TTGGGTGTCA   60GCATCCTGAT CGCGGGCGGA TGGAATGGGT AATCATTAGG AAACACCAAT GTCCCATGGT  120ATTGTCCGTC CTCGTATGGT GTCTCAGGAG GACCCGTGAT CACGTAGTGC CACACCAGGA  180TATTGTCTTC CTTTGGTGCT GCCACGATGT AGGGCGGGGG GTTCTCGGTC ATCATTTTGT  240ACTCCTTTGA GAGCCGCTTG TACGCCTGTC TTGATGCCAT CTTGCCTACT ATTAGTTTCT  300CACCACTTCC CGCCAAACAA TCTGCACTTT ACGAGCGCTA TCTATCCCTC GGGTCGCTCT  360AGTTGATTAT TGGCGAAACT GATAGTTCAG GTACTTCCAT GATGCGGTCA TATCCACGTA  420TGTGATCACG TGATCATCAG CCATGCTGCC AGCTCACGGG CCTGCCTACA CTATTGGAGG  480CTCTGTGAGT CATGATTTAT TGCATATCAA GCCCAGATAG TCGTTGGGGA TACTACCGTT  540GCCGCGATGA GCTCCGATAT TAAGTTGTAG CCAAAAATTT TAACGGATGA CTTCTTAACA  600GTTATTGACG CCGCAATCCT ACGCC ATG TCG TCC AAT AGC ATA AAG CTG CTA    652
                        Met Ser Ser Asn Ser Ile Lys Leu Leu
                          1               5GCA GGT AAC TCG CAC CCG GAC CTA GCT GAG AAG GTC TCC GTT CGC CTA    700Ala Gly Asn Ser His Pro Asp Leu Ala Glu Lys Val Ser Val Arg Leu10                  15                  20                  25GGT GTA CCA CTT TCG AAG ATT GGA GTG TAT CAC TAC TCT AAC AAA GAG    748Gly Val Pro Leu Ser Lys Ile Gly Val Tyr His Tyr Ser Asn Lys Glu
             30                 35                 40ACG TCA GTT ACT ATC GGC GAA AGT ATC CGT GAT GAA GAT GTC TAC ATC    796Thr Ser Val Thr Ile Gly Glu Ser Ile Arg Asp Glu Asp Val Tyr Ile
         45                  50                  55ATC CAG ACA GGA ACGGGG GAG CAG GAA ATC AAC GAC TTC CTC ATG GAA     844Ile Gln Thr Gly Thr Gly Glu Gln Glu Ile Asn Asp Phe Leu Met Glu
     60                  65                  70CTG CTC ATC ATG ATC CAT GCC TGC CGG TCA GCC TCT GCG CGG AAG ATC    892Leu Leu Ile Met Ile His Ala Cys Arg Ser Ala Ser Ala Arg Lys Ile
 75                  80                  85ACA GCG GTT ATA CCA AAC TTC CCT TAC GCA AGA CAA GAC AAA AAG GAC         940Thr Ala Val Ile Pro Asn Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp90                  95                 100                 105AAG TCG CGA GCA CCG ATA ACT GCC AAG CTG GTG GCC AAG ATG CTA GAG         988Lys Ser Arg Ala Pro Ile Thr Ala Lys Leu Val Ala Lys Met Leu Glu
            110                 115                 120ACC GCG GGG TGC AAC CAC GTT ATC ACG ATG GAT TTG CAC GCG TCT CAA        1036Thr Ala Gly Cys Asn His Val Ile Thr Met Asp Leu His Ala Ser Gln
        125                 130                 135ATT CAG GGT TTC TTC CAC ATT CCA GTG GAC AAC CTA TAT GCA GAG CCG        1084Ile Gln Gly Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro
    140                 145                 150AAC ATC CTG CAC TAC ATC CAA CAT AAT GTG GAC TTC CAG AAT AGT ATG        1132Asn Ile Leu His Tyr Ile Gln His Asn Val Asp Phe Gln Asn Ser Met
155                 160                 165TTG GTC GCG CCA GAC GCG GGG TCG GCG AAG CGC ACG TCG ACG CTT TCG        1180Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr Leu Ser170                 175                 180                 185GAC AAG CTG AAT CTC AAC TTC GCG TTG ATC CAC AAA GAA CGG CAG AAG        1228Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys
            190                 195                 200GCG AAC GAG GTC TCG CGG ATG GTG TTG GTG GGT GAT GTC GCC GAC AAG        1276Ala Asn Glu Val Ser Arg Met Val Leu Val Gly Asp Val Ala Asp Lys
        205                 210                 215TCC TGT ATT ATT GTA GAC GAC ATG GCG GAC ACG TGC GGA ACG CTA GTG        1324Ser Cys Ile Ile Val Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val
    220                 225                 230AAG GCC ACT GAC ACG CTG ATC GAA AAT TGT GCG AAA GAA GTG ATT GCC        1372Lys Ala Thr Asp Thr Leu Ile Glu Asn Cys Ala Lys Glu Val Ile Ala
235                 240                 245ATT GTG ACA CAC GGT ATA TTT TCT GGC GGC GCC CGC GAG AAG TTG CGC        1420Ile Val Thr His Gly Ile Phe Ser Gly Gly Ala Arg Glu Lys Leu Arg250                 255                 260                 265AAC AGC AAG CTG GCA CGG ATC GTA AGC ACA AAT ACG GTG CCA GTG GAC        1468Asn Ser Lys Leu Ala Arg Ile Val Ser Thr Asn Thr Val Pro Val Asp
            270                 275                 280CTC AAT CTA GAT ATC TAC CAC CAA ATT GAC ATT AGT GCC ATT TTG GCC       1516Leu Asn Leu Asp Ile Tyr His Gln Ile Asp Ile Ser Ala Ile Leu Ala
        285                 290                 295GAG GCA ATT AGA AGG CTT CAC AAC GGG GAA AGT GTG TCG TAC CTG TTC       1564Glu Ala Ile Arg Arg Leu His Asn Gly Glu Sar Val Ser Tyr Leu Phe
    300                 305                 310AAT AAC GCT GTC ATG TAGTGCTGTC AGTGGCAGAT GCATGATCGC TGGCCTAATT       1619Asn Asn Ala Val Met
315ATCTGTGTAA GTTGATACAA TGCAGTAAAT ACAGTACATA AAACTGAATG TTTTTCACTT     1679AGGGGTGCTT TGTTGTTCTG ATAGCGTGTG TGCGAATTTG GAGGTGAAAG TTGAACATCA     1739CGTAATGAAT ACAAACAAGA TTGCACATTA GGAAAAGCGA TAAATTATTT ATTATTTGCA     1799ACTGGCCTTT GAGCGTTTAA GCCTGAACAT TTTTGCCCTT TTGTTTGACC GTACCGTTAT     1859CACTCGTCCT TATATATGGC TATCCTTCTC TTCCGGAACT TCTTCGAGCG TA             1911(2)SEQ ID NO:2信息:(i)序列特征:
(A)长度:318氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQID NO:2:Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp1               5                  10                  15Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile
         20                  25                  30Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu
     35                  40                  45Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu
 50                  55                  60Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala65                  70                  75                  80Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe
             85                  90                  95Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr
        100                 105                 110Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val
    115                 120                 125Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile
130                 135                 140Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln145                 150                 155                 160His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly
            165                 170                 175Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe
        180                 185                 190Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met
    195                 200                 205Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp
210                 215                 220Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile225                 230                 235                 240Glu Asn Cys Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe
            245                 250                 255Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile
        260                 265                 270Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His
    275                 280                 285Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His
290                 295                 300Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met305                 310                 315(2)SEQ ID NO:3信息:(i)序列特征:
(A)长度:5369碱基对
(B)类型:核酸
(C)链类型:单链
(D)拓扑学:线性(ii)分子类型:DNA(基因组)(iii)假设:无(iv)反义:无(ix)特征:
(A)名字/关键词:5’UTR
(B)位置:1...54(ix)特征:
(A)名字/关键词:CDS
(B)位置:55...1482(ix)特征:
(A)名字/关键词:CDS
(B)位置:1767...3299(ix)特征:
(A)名字/关键词:CDS
(B)位置:3588...4703(ix)特征:
(A)名字/关键词:3’UTR
(B)位置:4704...5369(xi)序列的详细情况:SEQ ID NO:3:AAGCTTGACC TTGGCTGGCA CTTGAGTCGG CAGACAGGTG GACTAACCCG AGCA ATG    57
                                                        Met
                                                          1GAT CGT GGT TGT AAA GGT ATC TCT TAT GTG CTC AGT GCA ATG GTT TTT    105Asp Arg Gly Cys Lys Gly Ile Ser Tyr Val Leu Ser Ala Met Val Phe
          5                  10                  15CAC ATA ATA CCG ATT ACA TTT GAA ATA TCG ATG GTA TGT GGC ATA TTG    153His Ile Ile Pro Ile Thr Phe Glu Ile Ser Met Val Cys Gly Ile Leu
     20                  25                  30ACA TAC CAG TTT GGT GCT TCC TTC GCT GCT ATA ACA TTC TCG ACT ATG          201Thr Tyr Gln Phe Gly Ala Ser Phe Ala Ala Ile Thr Phe Ser Thr Met
 35                  40                  45CTT CTT TAC TCC ATC TTT ACT TTC AGA ACG ACG GCG TGG CGC ACA CGG          249Leu Leu Tyr Ser Ile Phe Thr Phe Arg Thr Thr Ala Trp Arg Thr Arg50                 55                  60                  65TTT AGG CGT GAT GCG AAC AAG GCT GAC AAT AAG GCC GCT AGT GTG GCA          297Phe Arg Arg Asp Ala Asn Lys Ala Asp Asn Lys Ala Ala Ser Val Ala
             70                 75                  80TTG GAT TCC CTA ATA AAT TTT GAA GCT GTA AAG TAT TTC AAT AAC GAG          345Leu Asp Ser Leu Ile Asn Phe Glu Ala Val Lys Tyr Phe Asn Asn Glu
         85                  90                  95AAG TAC CTT GCG GAC AAG TAT CAC ACA TCC TTG ATG AAG TAC CGG GAT          393Lys Tyr Leu Ala Asp Lys Tyr His Thr Ser Leu Met Lys Tyr Arg Asp
    100                 105                 110TCC CAG ATA AAG GTC TCG CAA TCG CTG GCG TTT TTG AAC ACC GGC CAG          441Ser Gln Ile Lys Val Ser Gln Ser Leu Ala Phe Leu Asn Thr Gly Gln
115                 120                 125AAC CTA ATT TTT ACC ACT GCA CTG ACT GCA ATG ATG TAT ATG GCC TGT          489Asn Leu Ile Phe Thr Thr Ala Leu Thr Ala Met Met Tyr Met Ala Cys130                 135                 140                 145AAT GGT GTT ATG CAG GGC TCT CTT ACA GTG GGG GAT CTT GTG TTA ATT          537Asn Gly Val Met Gln Gly Ser Leu Thr Val Gly Asp Leu Val Leu Ile
            150                 155                 160AAT CAA CTG GTA TTC CAG CTC TCC GTG CCA CTA AAC TTC CTT GGT AGC          585Asn Gln Leu Val Phe Gln Leu Ser Val Pro Leu Asn Phe Leu Gly Ser
        165                 170                 175GTC TAC CGT GAT CTC AAG CAG TCT CTG ATA GAT ATG GAA TCT TTA TTT          633Val Tyr Arg Asp Leu Lys Gln Ser Leu Ile Asp Met Glu Ser Leu Phe
    180                 185                 190AAA CTG CAA AAA AAT CAG GTC ACA ATT AAG AAC TCC CCA AAT GCC CAG          681Lys Leu Gln Lys Asn Gln Val Thr Ile Lys Asn Ser Pro Asn Ala Gln
195                 200                 205AAC CTA CCA ATA CAC AAA CCG TTG GAT ATT CGC TTT GAA AAT GTT ACG          729Asn Leu Pro Ile His Lys Pro Leu Asp Ile Arg Phe Glu Asn Val Thr210                 215                 220                 225TTT GGC TAT GAC CCG GAG CGG CGT ATA TTG AAC AAT GTT TCG TTT ACC  777Phe Gly Tyr Asp Pro Glu Arg Arg Ile Leu Asn Ash Val Ser Phe Thr
            230                 235                 240ATC CCA GCT GGA ATG AAG ACT GCC ATA GTA GGC CCA TCG GGC TCG GGG  825Ile Pro Ala Gly Met Lys Thr Ala Ile Val Gly Pro Ser Gly Ser Gly
        245                 250                 255AAG TCC ACC ATT TTG AAG CTC GTA TTT AGA TTC TAT GAG CCC GAG CAA  873Lys Ser Thr Ile Leu Lys Leu Val Phe Arg Phe Tyr Glu Pro Glu Gln
    260                 265                 270GGT CGT ATC CTA GTT GGC GGC ACA GAT ATC CGC GAT TTA GAC TTG CTT  921Gly Arg Ile Leu Val Gly Gly Thr Asp Ile Arg Asp Leu Asp Leu Leu
275                 280                 285TCT TTA CGG AAG GCT ATC GGT GTC GTG CCC CAA GAT ACT CCT CTC TTC  969Ser Leu Arg Lys Ala Ile Gly Val Val Pro Gln Asp Thr Pro Leu Phe290                 295                 300                 305AAT GAC ACA ATC TGG GAG AAT GTT AAA TTC GGC AAT ATC AGT TCC TCT  1017Asn Asp Thr Ile Trp Glu Asn Val Lys Phe Gly Asn Ile Ser Ser Ser
            310                 315                 320GAC GAT GAG ATT CTC AGG GCC ATA GAA AAA GCT CAA CTC ACG AAG CTA  1065Asp Asp Glu Ile Leu Arg Ala Ile Glu Lys Ala Gln Leu Thr Lys Leu
        325                 330                 335CTC CAG AAC CTA CCA AAG GGC GCT TCC ACC GTT GTA GGG GAG CGC GGT  1113Leu Gln Asn Leu Pro Lys Gly Ala Ser Thr Val Val Gly Glu Arg Gly
    340                 345                 350TTG ATG ATC AGC GGA GGT GAG AAA CAA AGG CTT GCT ATT GCT CGT GTG  1161Leu Met Ile Ser Gly Gly Glu Lys Gln Arg Leu Ala Ile Ala Arg Val
355                 360                 365CTT TTG AAG GAC GCT CCG CTG ATG TTT TTC GAC GAG GCT ACA AGT GCT  1209Leu Leu Lys Asp Ala Pro Leu Met Phe Phe Asp Glu Ala Thr Ser Ala370                 375                 380                 385CTG GAT ACA CAC ACA GAG CAG GCA CTC TTG CAC ACC ATT CAG CAG AAC  1257Leu Asp Thr His Thr Glu Gln Ala Leu Leu His Thr Ile Gln Gln Asn
            390                 395                 400TTT TCT TCC AAT TCA AAG ACG AGC GTT TAC GTT GCC CAT AGA CTG CGC  1305Phe Ser Ser Asn Ser Lys Thr Ser Val Tyr Val Ala His Arg Leu Arg
        405                 410                 415ACA ATC GCT GAT GCA GAT AAG ATC ATT GTT CTT GAA CAA GGT TCT GTC        1353Thr Ile Ala Asp Ala Asp Lys Ile Ile Val Leu Glu Gln Gly Ser Val
    420                 425                430CGC GAA GAG GGC ACA CAC AGC TCG CTG TTA GCG TCA CAA GGA TCC CTA        1401Arg Glu Glu Gly Thr His Ser Ser Leu Leu Ala Ser Gln Gly Ser Leu
435                 440                 445TAC CGG GGT CTG TGG GAT ATT CAG GAA AAC CTA ACG CTT CCG GAA CGG        1449Tyr Arg Gly Leu Trp Asp Ile Gln Glu Asn Leu Thr Leu Pro Glu Arg450                 455                 460                465CCT GAG CAG TCA ACC GGA TCT CAG CAT GCA TAGACGTCTG ACTAGAGATT          1499Pro Glu Gln Ser Thr Gly Ser Gln His Ala
            470                 475ATATAATAAC CCTCGAGCCA AAATTATACG GCGCTAACAA GTAAAAATTT TAGTTACTTT      1559TCTGACTTCT CTACGCTGAC TTCTCTACCC TTCTAACATA GTTAATTGAA GTAGTGGTTA      1619ATGACGACTG CATTTTATTA TTGTCCACTT TGCATTAGAA GTACTAGTGC TTAAGCGCTC      1679TTTAGGCCGC TTTCTTCTTC TTTGTCAGGC CGCAAGGTAA AGGAAGCACC AACGGATTGC      1739TACCGCTGCT ATTCCTGCTC TCTCAAG ATG TGT GGC ATA TTA GGC GTT GTG          1790
                          Met Cys Gly Ile Leu Gly Val Val
                            1               5CTA GCC GAT CAG TCG AAG GTG GTC GCC CCT GAG TTG TTT GAT GGC TCA        1838Leu Ala Asp Gln Ser Lys Val Val Ala Pro Glu Leu Phe Asp Gly Ser
 10                  15                  20CTG TTC TTA CAG CAT CGC GGT CAA GAT GCT GCC GGG ATT GCT ACG TGC        1886Leu Phe Leu Gln His Arg Gly Gln Asp Ala Ala Gly Ile Ala Thr Cys25                  30                  35                  40GGC CCC GGT GGG CGC TTG TAC CAA TGT AAG GGC AAT GGT ATG GCA CGG        1934Gly Pro Gly Gly Arg Leu Tyr Gln Cys Lys Gly Asn Gly Met Ala Arg
             45                  50                  55GAC GTG TTC ACG CAA GCT CGG ATG TCA GGG TTG GTT GGC TCT ATG GGG        1982Asp Val Phe Thr Gln Ala Arg Met Ser Gly Leu Val Gly Ser Met Gly
         60                  65                  70ATT GCA CAC CTG AGA TAT CCC ACT GCA GGC TCC AGT GCG AAC TCA GAA        2030Ile Ala His Leu Arg Tyr Pro Thr Ala Gly Ser Ser Ala Asn Ser Glu
     75                  80                  85GCG CAG CCA TTC TAT GTG AAT AGT CCC TAC GGA ATT TGC ATG AGT CAT  2078Ala Gln Pro Phe Tyr Val Asn Ser Pro Tyr Gly Ile Cys Met Ser His
 90                  95                 100AAT GGT AAT CTG GTG AAC ACG ATG TCT CTA CGT AGA TAT CTT GAT GAA  2126Asn Gly Asn Leu Val Asn Thr Met Ser Leu Arg Arg Tyr Leu Asp Glu105                 110                     115             120GAC GTT CAC CGT CAT ATT AAC ACG GAC AGC GAT TCT GAG CTA CTG CTT  2174Asp Val His Arg His Ile Asn Thr Asp Ser Asp Ser Glu Leu Leu Leu
            125                 130                 135AAT ATA TTT GCC GCG GAG CTG GAA AAG TAC AAC AAA TAT CGT GTG AAC  2222Asn Ile Phe Ala Ala Glu Leu Glu Lys Tyr Asn Lys Tyr Arg Val Asn
        140                 145                 150AAC GAT GAT ATA TTT TGT GCT CTA GAG GGT GTT TAC AAA CGT TGT CGC  2270Asn Asp Asp Ile Phe Cys Ala Leu Glu Gly Val Tyr Lys Arg Cys Arg
    155                 160                 165GGT GGC TAT GCT TGT GTT GGC ATG TTG GCG GGA TAT GGA TTG TTT GGT  2318Gly Gly Tyr Ala Cys Val Gly Met Leu Ala Gly Tyr Gly Leu Phe Gly
170                 175                 180TTC CGG GAC CCC AAT GGG ATC AGG CCG CTA TTG TTT GGT GAG CGC GTC  2366Phe Arg Asp Pro Asn Gly Ile Arg Pro Leu Leu Phe Gly Glu Arg Val185                 190                 195                 200AAC GAT GAC GGC ACC ATG GAC TAC ATG CTA GCG TCC GAA AGT GTC GTT  2414Asn Asp Asp Gly Thr Met Asp Tyr Met Leu Ala Ser Glu Ser Val Val
            205                 210                 215CTT AAG GCC CAC CGC TTC CAA AAC ATA CGT GAT ATT CTT CCC GGC CAA  2462Leu Lys Ala His Arg Phe Gln Asn Ile Arg Asp Ile Leu Pro Gly Gln
        220                 225                 230GCC GTC ATT ATC CCT AAA ACG TGC GGC TCC AGT CCA CCA GAG TTC CGG  2510Ala Val Ile Ile Pro Lys Thr Cys Gly Ser Ser Pro Pro Glu Phe Arg
    235                 240                 245CAG GTA GTG CCA ATT GAG GCC TAC AAA CCG GAC TTG TTT GAG TAC GTG  2558Gln Val Val Pro Ile Glu Ala Tyr Lys Pro Asp Leu Phe Glu Tyr Val
250                 255                 260TAT TTC GCT CGT GCT GAC AGC GTT CTG GAC GGT ATT TCC GTT TAC CAT  2606Tyr Phe Ala Arg Ala Asp Ser Val Leu Asp Gly Ile Ser Val Tyr His265                 270                 275                 280ACA CGC CTG TTG ATG GGT ATC AAA CTT GCC GAG AAC ATC AAA AAA CAG       2654Thr Arg Leu Leu Met Gly Ile Lys Leu Ala Glu Asn Ile Lys Lys Gln
            285                 290                 295ATC GAT CTG GAC GAA ATT GAC GTT GTT GTA TCT GTT CCT GAC ACT GCA       2702Ile Asp Leu Asp Glu Ile Asp Val Val Val Ser Val Pro Asp Thr Ala
        300                     305             310CGT ACC TGT GCA TTG GAG TGT GCC AAC CAT TTA AAC AAA CCT TAT CGC       2750Arg Thr Cys Ala Leu Glu Cys Ala Asn His Leu Asn Lys Pro Tyr Arg
    315                 320                 325GAA GGA TTT GTC AAG AAC AGA TAT GTT GGA AGA ACA TTT ATC ATG CCA       2798Glu Gly Phe Val Lys Asn Arg Tyr Val Gly Arg Thr Phe Ile Met Pro
330                 335                 340AAC CAA AAA GAG CGA GTA TCT TCT GTG CGC CGC AAG TTG AAC CCA ATG       2846Asn Gln Lys Glu Arg Val Ser Ser Val Arg Arg Lys Leu Asn Pro Met345                 350                 355                 360AAC TCA GAA TTT AAA GAC AAG CGC GTG CTG ATT GTC GAT GAT TCC ATT       2894Asn Ser Glu Phe Lys Asp Lys Arg Val Leu Ile Val Asp Asp Ser Ile
            365                 370                 375GTG CGA GGT ACC ACT TCC AAA GAG ATT GTT AAC ATG GCG AAG GAA TCC       2942Val Arg Gly Thr Thr Ser Lys Glu Ile Val Asn Met Ala Lys Glu Ser
        380                 385                 390GGT GCT GCC AAG GTC TAC TTT GCC TCT GCA GCG CCA GCA ATT CGT TTC       2990Gly Ala Ala Lys Val Tyr Phe Ala Ser Ala Ala Pro Ala Ile Arg Phe
    395                 400                 405AAT CAC ATC TAC GGG ATT GAC CTA GCA GAT ACT AAG CAG CTT GTC GCC       3038Asn His Ile Tyr Gly Ile Asp Leu Ala Asp Thr Lys Gln Leu Val Ala
410                 415                 420TAC AAC AGA ACT GTT GAA GAA ATC ACT GCG GAG CTG GGC TGT GAC CGC       3086Tyr Asn Arg Thr Val Glu Glu Ile Thr Ala Glu Leu Gly Cys Asp Arg425                 430                 435                 440GTC ATC TAT CAA TCT TTG GAT GAC CTC ATC GAC TGT TGC AAG ACA GAC       3134Val Ile Tyr Gln Ser Leu Asp Asp Leu Ile Asp Cys Cys Lys Thr Asp
            445                 450                 455ATC ATC TCA GAA TTT GAA GTT GGA GTT TTC ACT GGT AAC TAC GTT ACA       3182Ile Ile Ser Glu Phe Glu Val Gly Val Phe Thr Gly Asn Tyr Val Thr
        460                 465                 470GGT GTT GAG GAT GTG TAC TTG CAG GAA TTA GAA CGT TGC CGC GCT CTT        3230Gly Val Glu Asp Val Tyr Leu Gln Glu Leu Glu Arg Cys Arg Ala Leu
    475                 480                 485AAT AAC TCG AAT AAG GGT GAA GCG AAG GCC GAG GTT GAT ATT GGT CTC        3278Asn Asn Ser Asn Lys Gly Glu Ala Lys Ala Glu Val Asp Ile Gly Leu
490                 495                 500TAC AAT TCT GCC GAC TAT TAGCGGCGCC GTTGCCGGCA TCCGGCCCCA               3326Tyr Asn Ser Ala Asp Tyr505                 510TATATAGACT CATCGGGACC TAAAATAAGC CTTTACAGAT CATTATCTAC AAATATAGAT      3386ACCATTAAAA GCCTGACTTT CGACTTACTC CTAGCACACC CCGTTGTATC CCTGTGCTTG      3446CTTTCTTAAA TGCCGTTGGT TAGGCTTTGG ACTTAGCGTC CCGCCCATTT TCTAGCATGT      3506GCAGATCTAG CAAATTTGGC CTAAGACAAG AAGATCCATT CGGCACCCAC ATCCTGGAGC      3566CAGCACACAG TGGACCCAGA C ATG AGC AGC GGC AAT ATA TGG AAG CAA TTG        3617
                    Met Ser Ser Gly Asn Ile Trp Lys Gln Leu
                      1               5                  10CTA GAG GAG AAT AGC GAA CAG CTG GAC CAG TCC ACT ACG GAG ACT TAC        3665Leu Glu Glu Asn Ser Glu Gln Leu Asp Gln Ser Thr Thr Glu Thr Tyr
             15                  20                  25GTG GTA TGC TGC GAG AAC GAA GAT TCC CTT AAC CAG TTT TTG CAA CAA        3713Val Val Cys Cys Glu Asn Glu Asp Ser Leu Asn Gln Phe Leu Gln Gln
         30                  35                  40TGT TGG CAG ATT GAC GAG GGC GAG AAG GTG ACC AAC CTG GAG CCG TTG        3761Cys Trp Gln Ile Asp Glu Gly Glu Lys Val Thr Asn Leu Glu Pro Leu
     45                  50                  55GGA TTC TTT ACA AAG GTG GTT TCG CGC GAC GAA GAG AAC CTC CGG CTC        3809Gly Phe Phe Thr Lys Val Val Ser Arg Asp Glu Glu Ash Leu Arg Leu
 60                  65                  70AAC GTA TAC TAT GCC AAG AGC CCA CTG GAT GCA CAG ACG CTG CAG TTT        3857Asn Val Tyr Tyr Ala Lys Ser Pro Leu Asp Ala Gln Thr Leu Gln Phe75                  80                  85                  90CTG GGC GTG TTC CTG CGC CAA ATG GAA ACC TCA CAA ATA CGT TGG ATC        3905Leu Gly Val Phe Leu Arg Gln Met Glu Thr Ser Gln Ile Arg Trp Ile
             95                 100                 105TTC CTA CTG GAC TGG CTG CTA GAC GAT AAA CGA TTA TGG CTA CGT CAA       3953Phe Leu Leu Asp Trp Leu Leu Asp Asp Lys Arg Leu Trp Leu Arg Gln
        110                 115                 120CTG CGG AAC TCG TGG GCC GCC TTG GAG GAA GCG CAG GTG GCA CCC TTT       4001Leu Arg Asn Ser Trp Ala Ala Leu Glu Glu Ala Gln Val Ala Pro Phe
    125                 130                 135CCA GGT GGC GCT GTG GTG GTG GTC CTC AAC CCG AGT CAC GTG ACA CAA       4049Pro Gly Gly Ala Val Val Val Val Leu Asn Pro Ser His Val Thr Gln
140                 145                 150CTG GAG CGA AAC ACG ATG GTT TGG AAC TCC CGC CGT CTG GAC CTG GTA       4097Leu Glu Arg Asn Thr Met Val Trp Asn Ser Arg Arg Leu Asp Leu Val155                 160                 165                170CAC CAG ACA CTG CGA GCT GCA TGC CTC AAC ACC GGC TCG GCG CTA GTT       4145His Gln Thr Leu Arg Ala Ala Cys Leu Asn Thr Gly Ser Ala Leu Val
            175                 180                 185ACA CTT GAT CCT AAT ACT GCG CGC GAA GAC GTC ATG CAC ATA TGT GCG       4193Thr Leu Asp Pro Asn Thr Ala Arg Glu Asp Val Met His Ile Cys Ala
        190                 195                 200CTG CTT GCG GGG CTG CCT ACA TCC CGT CCC GTC GCG ATG CTA AGC CTG       4241Leu Leu Ala Gly Leu Pro Thr Ser Arg Pro Val Ala Met Leu Ser Leu
    205                 210                 215CAA AGT CTA TTC ATC CCC CAC GGT GCA GAT TCC ATC GGC AAG ATC TGC       4289Gln Ser Leu Phe Ile Pro His Gly Ala Asp Ser Ile Gly Lys Ile Cys
220                 225                 230ACC ATC GCG CCC GAG TTC CCT GTT GCT ACG GTG TTC GAC AAC GAT TTT       4337Thr Ile Ala Pro Glu Phe Pro Val Ala Thr Val Phe Asp Asn Asp Phe235                 240                 245                 250GTG AGC TCG ACA TTC GAG GCC GCA ATT GCT CCA GAA CTT ACT CCA GGA       4385Val Ser Ser Thr Phe Glu Ala Ala Ile Ala Pro Glu Leu Thr Pro Gly
            255                 260                 265CCA CGT GTG CCA TCT GAC CAC CCA TGG CTA ACA GAG CCT ACC AAC CCC       4433Pro Arg Val Pro Ser Asp His Pro Trp Leu Thr Glu Pro Thr Asn Pro
        270                 275                 280CCT TCG GAG GCA ACC GCT TGG CAT TTC GAT CTC CAA GGT CGC CTC GCT       4481Pro Ser Glu Ala Thr Ala Trp His Phe Asp Leu Gln Gly Arg Leu Ala
    285                 290                 295ACC CTA TAC CGG CAT CTT GGT GAC TCT AAC AAG GCC ATA TCT GTT ACT       4529Thr Leu Tyr Arg His Leu Gly Asp Ser Asn Lys Ala Ile Ser Val Thr
300                     305             310CAG CAC CGC TTC CAC AAG CCC CGC TCG GAA GAT TAT GCA TAC GAA TTC       4577Gln His Arg Phe His Lys Pro Arg Ser Glu Asp Tyr Ala Tyr Glu Phe315                 320                 325                 330GAG CTG CCG TCT AAG CAC CCT ACA ATA CGT GAC CTC ATA CGC TCT GCC       4625Glu Leu Pro Ser Lys His Pro Thr Ile Arg Asp Leu Ile Arg Ser Ala
            335                 340                 345GCA GCC GAC TCA CCG AAC GAC GTC GCT GAC TCC ATC GAT GGG CTT ATG       4673Ala Ala Asp Ser Pro Asn Asp Val Ala Asp Ser Ile Asp Gly Leu Met
        350                 355                 360GAT GGT ATC GTA CAA AGG AAT GTT CAT TGACGTCGAC ACAAAAATTT             4720Asp Gly Ile Val Gln Arg Asn Val His
    365                 370TGTTACTGTT CTCTCGAGAA CTATTCTCAT CCAGTACTGA CATATTAGAA GGCGAAGTGA     4780ACTAGGATTT ATATAAAGTA GCCTTCAGGC AATTGCACAG GGTCTATTGA GTCGCTGCCG     4840TTCACGAGAG AGCCCAATAT ATCGAGGACT AATTGGTCAC TTTTGTTTTG CTATACTCAC     4900CCTGTATTTG CTAATCATTT ATCCGCTTTG TCCAAGTGGT TGCGAAGATA TCGAGCCAGA     4960ACATTAGAAT CTGGTTTGCC GCATCCTAGA GCTGTCTCCA AGCCAGTTGA ACCGTTGCGG     5020GAGATTACCG CAGCCGGTTT GATCAGAGTA CTGGTGACTG CCAGCACCCA CGTTTGTGAC     5080TTATAAATAT ACGCCCTGTG GAGCCATAGC CATTGGCATA AAGAGAAGAG CACCCCGTGC     5140CACGATGCAG ACACTTCCGG TGTACCCAGC GTCACAGACT GCGTCGCCTA CGAAGCGTGA     5200ACTTGCAGCG GCGCCCTCGG TGCCGCAGGA CGGCGCCCGG CTGCCTGCGC AGCTCACTTT     5260AGTGACGCCC CCAGAACCTG ATATCCAGAA GAAGTCAGTG CGATCTCAGG TCGCGCGTTT     5320AAGCATCTCG GAGACAGATG TAGTGAAGAG TGATATCGTG GCTAAGCTT                 5369(2)SEQ ID NO:4信息:
(i)序列特征:
(A)长度:475氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:4:Met Asp Arg Gly Cys Lys Gly Ile Ser Tyr Val Leu Ser Ala Met Val1               5                  10                  15Phe His Ile Ile Pro Ile Thr Phe Glu Ile Ser Met Val Cys Gly Ile
         20                  25                  30Leu Thr Tyr Gln Phe Gly Ala Ser Phe Ala Ala Ile Thr Phe Ser Thr
     35                  40                  45Met Leu Leu Tyr Ser Ile Phe Thr Phe Arg Thr Thr Ala Trp Arg Thr
 50                  55                  60Arg Phe Arg Arg Asp Ala Asn Lys Ala Asp Asn Lys Ala Ala Ser Val65                  70                  75                  80Ala Leu Asp Ser Leu Ile Asn Phe Glu Ala Val Lys Tyr Phe Asn Asn
             85                  90                  95Glu Lys Tyr Leu Ala Asp Lys Tyr His Thr Ser Leu Met Lys Tyr Arg
        100                 105                 ll0Asp Ser Gln Ile Lys Val Ser Gln Ser Leu Ala Phe Leu Asn Thr Gly
    115                 120                 125Gln Asn Leu Ile Phe Thr Thr Ala Leu Thr Ala Met Met Tyr Met Ala
130                 135                 140Cys Asn Gly Val Met Gln Gly Ser Leu Thr Val Gly Asp Leu Val Leu145                 150                 155                 160Ile Asn Gln Leu Val Phe Gln Leu Ser Val Pro Leu Asn Phe Leu Gly
            165                 170                 175Ser Val Tyr Arg Asp Leu Lys Gln Ser Leu Ile Asp Met Glu Ser Leu
        180                 185                 190Phe Lys Leu Gln Lys Asn Gln Val Thr Ile Lys Asn Ser Pro Asn Ala
    195                 200                 205Gln Asn Leu Pro Ile His Lys Pro Leu Asp Ile Arg Phe Glu Asn Val
210                 215                 220Thr Phe Gly Tyr Asp Pro Glu Arg Arg Ile Leu Asn Asn Val Ser Phe225                 230                 235                 240Thr Ile Pro Ala Gly Met Lys Thr Ala Ile Val Gly Pro Ser Gly Ser
            245                 250                 255Gly Lys Ser Thr Ile Leu Lys Leu Val Phe Arg Phe Tyr Glu Pro Glu
        260                 265                 270Gln Gly Arg Ile Leu Val Gly Gly Thr Asp Ile Arg Asp Leu Asp Leu
    275                 280                 285Leu Ser Leu Arg Lys Ala Ile Gly Val Val Pro Gln Asp Thr Pro Leu
290                 295                 300Phe Asn Asp Thr Ile Trp Glu Asn Val Lys Phe Gly Asn Ile Ser Ser305                 310                 315                 320Ser Asp Asp Glu Ile Leu Arg Ala Ile Glu Lys Ala Gln Leu Thr Lys
            325                 330                 335Leu Leu Gln Asn Leu Pro Lys Gly Ala Ser Thr Val Val Gly Glu Arg
        340                 345                 350Gly Leu Met Ile Ser Gly Gly Glu Lys Gln Arg Leu Ala Ile Ala Arg
    355                 360                 365Val Leu Leu Lys Asp Ala Pro Leu Met Phe Phe Asp Glu Ala Thr Ser
370                 375                 380Ala Leu Asp Thr His Thr Glu Gln Ala Leu Leu His Thr Ile Gln Gln385                 390                 395                 400Asn Phe Ser Ser Asn Ser Lys Thr Ser Val Tyr Val Ala His Arg Leu
            405                 410                 415Arg Thr Ile Ala Asp Ala Asp Lys Ile Ile Val Leu Glu Gln Gly Ser
       420                  425                 430Val Arg Glu Glu Gly Thr His Ser Ser Leu Leu Ala Ser Gln Gly Ser
    435                 440                 445Leu Tyr Arg Gly Leu Trp Asp Ile Gln Glu Asn Leu Thr Leu Pro Glu
450                 455                 460Arg Pro Glu Gln Ser Thr Gly Ser Gln His Ala465                 470                 475(2)SEQ ID NO:5信息:(i)序列特征:
(A)长度:510氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:5:Met Cys Gly Ile Leu Gly Val Val Leu Ala Asp Gln Ser Lys Val Val1               5                  10                  15Ala Pro Glu Leu Phe Asp Gly Ser Leu Phe Leu Gln His Arg Gly Gln
         20                  25                  30Asp Ala Ala Gly Ile Ala Thr Cys Gly Pro Gly Gly Arg Leu Tyr Gln
     35                  40                  45Cys Lys Gly Asn Gly Met Ala Arg Asp Val Phe Thr Gln Ala Arg Met
 50                  55                  60Ser Gly Leu Val Gly Ser Met Gly Ile Ala His Leu Arg Tyr Pro Thr65                  70                  75                  80Ala Gly Ser Ser Ala Asn Ser Glu Ala Gln Pro Phe Tyr Val Asn Ser
             85                  90                  95Pro Tyr Gly Ile Cys Met Ser His Asn Gly Asn Leu Val Asn Thr Met
        100                 105                 110Ser Leu Arg Arg Tyr Leu Asp Glu Asp Val His Arg His Ile Asn Thr
    115                 120                 125Asp Ser Asp Ser Glu Leu Leu Leu Asn Ile Phe Ala Ala Glu Leu Glu
130                 135                 140Lys Tyr Asn Lys Tyr Arg Val Asn Asn Asp Asp Ile Phe Cys Ala Leu145                 150                 155                 160Glu Gly Val Tyr Lys Arg Cys Arg Gly Gly Tyr Ala Cys Val Gly Met
            165                 170                 175Leu Ala Gly Tyr Gly Leu Phe Gly Phe Arg Asp Pro Asn Gly Ile Arg
        180                 185                 190Pro Leu Leu Phe Gly Glu Arg Val Asn Asp Asp Gly Thr Met Asp Tyr
    195                 200                 205Met Leu Ala Ser Glu Ser Val Val Leu Lys Ala His Arg Phe Gln Asn
210                 215                 220Ile Arg Asp Ile Leu Pro Gly Gln Ala Val Ile Ile Pro Lys Thr Cys225                 230                 235                 240Gly Ser Ser Pro Pro Glu Phe Arg Gln Val Val Pro Ile Glu Ala Tyr
            245                 250                 255Lys Pro Asp Leu Phe Glu Tyr Val Tyr Phe Ala Arg Ala Asp Ser Val
        260                 265                 270Leu Asp Gly Ile Ser Val Tyr His Thr Arg Leu Leu Met Gly Ile Lys
    275                 280                 285Leu Ala Glu Asn Ile Lys Lys Gln Ile Asp Leu Asp Glu Ile Asp Val
290                 295                 300Val Val Ser Val Pro Asp Thr Ala Arg Thr Cys Ala Leu Glu Cys Ala305                 310                 315                 320Asn His Leu Asn Lys Pro Tyr Arg Glu Gly Phe Val Lys Asn Arg Tyr
            325                 330                 335Val Gly Arg Thr Phe Ile Met Pro Asn Gln Lys Glu Arg Val Ser Ser
        340                 345                 350Val Arg Arg Lys Leu Asn pro Met Asn Ser Glu Phe Lys Asp Lys Arg
    355                 360                 365Val Leu Ile Val Asp Asp Ser Ile Val Arg Gly Thr Thr Ser Lys Glu
370                 375                 380Ile Val Asn Met Ala Lys Glu Ser Gly Ala Ala Lys Val Tyr Phe Ala385                 390                 395                400Ser Ala Ala Pro Ala Ile Arg Phe Asn His Ile Tyr Gly Ile Asp Leu
            405                 410                 4l5Ala Asp Thr Lys Gln Leu Val Ala Tyr Asn Arg Thr Val Glu Glu Ile
        420                 425                 430Thr Ala Glu Leu Gly Cys Asp Arg Val Ile Tyr Gln Ser Leu Asp Asp
    435                 440                 445Leu Ile Asp Cys Cys Lys Thr Asp Ile Ile Ser Glu Phe Glu Val Gly
450                 455                 460Val Phe Thr Gly Asn Tyr Val Thr Gly Val Glu Asp Val Tyr Leu Gln465                 470                 475                 480Glu Leu Glu Arg Cys Arg Ala Leu Asn Asn Ser Asn Lys Gly Glu Ala
            485                 490                 495Lys Ala Glu Val Asp Ile Gly Leu Tyr Asn Ser Ala Asp Tyr
        500                 505                 510(2)SEQ ID NO:6信息:(i)序列特征:
(A)长度:371氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:6:Met Ser Ser Gly Asn Ile Trp Lys Gln Leu Leu Glu Glu Asn Ser Glu1               5                  10                  15Gln Leu Asp Gln Ser Thr Thr Glu Thr Tyr Val Val Cys Cys Glu Asn
         20                  25                  30Glu Asp Ser Leu Asn Gln Phe Leu Gln Gln Cys Trp Gln Ile Asp Glu
     35                  40                  45Gly Glu Lys Val Thr Asn Leu Glu Pro Leu Gly Phe Phe Thr Lys Val
 50                  55                  60Val Ser Arg Asp Glu Glu Asn Leu Arg Leu Asn Val Tyr Tyr Ala Lys65                  70                  75                  80Ser Pro Leu Asp Ala Gln Thr Leu Gln Phe Leu Gly Val Phe Leu Arg
             85                  90                  95Gln Met Glu Thr Ser Gln Ile Arg Trp Ile Phe Leu Leu Asp Trp Leu
        100                 105                 110Leu Asp Asp Lys Arg Leu Trp Leu Arg Gln Leu Arg Asn Ser Trp Ala
    115                 120                 125Ala Leu Glu Glu Ala Gln Val Ala Pro Phe Pro Gly Gly Ala Val Val
130                 135                 140Val Val Leu Asn Pro Ser His Val Thr Gln Leu Glu Arg Asn Thr Met145                 150                 155                 160Val Trp Asn Ser Arg Arg Leu Asp Leu Val His Gln Thr Leu Arg Ala
            165                 170                 175Ala Cys Leu Asn Thr Gly Ser Ala Leu Val Thr Leu Asp Pro Asn Thr
        180                 185                 190Ala Arg Glu Asp Val Met His Ile Cys Ala Leu Leu Ala Gly Leu Pro
    195                 200                 205Thr Ser Arg Pro Val Ala Met Leu Ser Leu Gln Ser Leu Phe Ile Pro
210                 215                 220His Gly Ala Asp Ser Ile Gly Lys Ile Cys Thr Ile Ala Pro Glu Phe225                 230                 235                 240Pro Val Ala Thr Val Phe Asp Asn Asp Phe Val Ser Ser Thr Phe Glu
            245                 250                 255Ala Ala Ile Ala Pro Glu Leu Thr Pro Gly Pro Arg Val Pro Ser Asp
        260                 265                 270His Pro Trp Leu Thr Glu Pro Thr Asn Pro Pro Ser Glu Ala Thr Ala
    275                 280                 285Trp His Phe Asp Leu Gln Gly Arg Leu Ala Thr Leu Tyr Arg His Leu
290                 295                 300Gly Asp Ser Asn Lys Ala Ile Ser Val Thr Gln His Arg Phe His Lys305                 310                 315                 320Pro Arg Ser Glu Asp Tyr Ala Tyr Glu Phe Glu Leu Pro Ser Lys His
            325                 330                 335Pro Thr Ile Arg Asp Leu Ile Arg Ser Ala Ala Ala Asp Ser Pro Asn
        340                 345                 350Asp Val Ala Asp Ser Ile Asp Gly Leu Met Asp Gly Ile Val Gln Arg
    355                 360                 365Asn Val His
370(2)SEQ ID NO:7信息:(i)序列特征:
(A)长度:3616碱基对
(B)类型:核酸
(C)链类型:单链
(D)拓扑学:线性(ii)分子类型:DNA(基因组)(iii)假设:无(iv)反义:无(ix)特征:
(A)名字/关键词:5’UTR
(B)位置:1...863(ix)特征:
(A)名字/关键词:CDS
(B)位置:864...1316(ix)特征:
(A)名字/关键词:内含子
(B)位置:1317...1477(ix)特征:
(A)名字/关键词:CDS
(B)位置:1478...2592(ix)特征:
(A)名字/关键词:3’UTR
(B)位置:2593...3616(xi)序列的详细情况:SEQ ID NO:7:GGGCCCGGTG CCAGCTCGCC AGGTGCGGAC TCGCGCTCGG GCTGTGGGCG CTCTACCTGC       60TGCTGCTCGG CAGCTGCCTG ACGCGCGCGT ACGAGCTGTC GGATCTCGAA AACCTGGAAT      120CCGATTACTA CAGCTACGTG CTGGATGTGA ACTTCGCGCT GCTGAGCGCC ATGAGCGCGA      180CCGGCCTCGC GATGGGCGCC GTGAGCGGCT CCCTCGGGAG CGCGCCGGTG CTCGCGCAGT      240GGCCGGCAGC GATCTGGGCC GTGCGCTTCC TGCGCGCCGC GGGCTATGTC GCGATAGTCC      300TAATCCTGCC GTTCCTGTCC GTCGTCGCAT TCCTGCAGCC GCTCTGCGAG CGCGCGCTGG      360CGCTGTTCCC GTTTGTGCGC GCGTGGGGCA TGGACGGCGT GTTCAACTTC CTGCTGCTCT      420CCGCCGTGCT CTGGACTGTA TTCCTGGCCG TTCGCCTGCT CCGCGCCGTC TACAGACTGC      480TGCGCTGGCT GGTCGGTCTT TTGGTCCGCC TGGCACGCCT GCTGCTGCGA GGCGCCCGTC      540GGACGCCTGC GGCGGCCCCC GAGGAGCCCG TCTAGCGTGC GCGCGTTCTA GGCCCCTGAC      600AGCTCCTACC TGGTGCTGGC CGCCGGTAGG GCTCGCATCG TGCGGCGCAG GCCCATTGCT      660TTTTGGCCCC CGCTGGATCA TCGTTTCTTT TACGTGAAAA GTTTGCAGCG ATGAGCTGCA      720GTATAAATAG GTTTTCTAGA TGCGCCAAAT CCCAGCTGGG TTTACCGGCG TCTGTTCGGG      780ATAGTTACTT GATGGATGGG TCAACTTGAG AGCTTGGGTT TAGTGTTGAC TCCTTCTCTT      840CATAGCACGC CGAACAAAGC GCA ATG ACT TAC AGA GAC GCA GCC ACG GCA          890
                      Met Thr Tyr Arg Asp Ala Ala Thr Ala
                        1               5CTG GAG CAC CTG GCG ACG TAC GCC GAG AAG GAC GGG CTG TCC GTG GAG        938Leu Glu His Leu Ala Thr Tyr Ala Glu Lys Asp Gly Leu Ser Val Glu10                  15                  20                  25CAG TTG ATG GAC TCC AAG ACG CGG GGC GGG TTG ACG TAC AAC GAC TTC        986Gln Leu Met Asp Ser Lys Thr Arg Gly Gly Leu Thr Tyr Asn Asp Phe
             30                  35                  40CTG GTC TTG CCG GGC AAG ATC GAC TTC CCA TCG TCG GAG GTG GTG CTG        1034Leu Val Leu Pro Gly Lys Ile Asp Phe Pro Ser Ser Glu Val Val Leu
         45                  50                  55TCG TCG CGC CTG ACC AAG AAG ATC ACC TTG AAC GCG CCG TTT GTG TCG        1082Ser Ser Arg Leu Thr Lys Lys Ile Thr Leu Asn Ala Pro Phe Val Ser
     60                  65                  70TCG CCG ATG GAC ACG GTG ACG GAG GCC GAC ATG GCG ATC CAC ATG GCG        1130Ser Pro Met Asp Thr Val Thr Glu Ala Asp Met Ala Ile His Met Ala
 75                  80                  85CTC CTG GGC GGC ATC GGG ATC ATC CAC CAC AAC TGC ACT GCG GAG GAG        1178Leu Leu Gly Gly Ile Gly Ile Ile His His Asn Cys Thr Ala Glu Glu90                  95                 100                 105CAG GCG GAG ATG GTG CGC CGG GTC AAG AAG TAC GAA AAC GGG TTC ATC        1226Gln Ala Glu Met Val Arg Arg Val Lys Lys Tyr Glu Asn Gly Phe Ile
            110                 115                 120AAC GCC CCC GTG GTC GTG GGG CCG GAC GCG ACG GTG GCG GAC GTG CGC        1274Asn Ala Pro Val Val Val Gly Pro Asp Ala Thr Val Ala Asp Val Arg
        125                 130                 135CGG ATG AAG AAC GAG TTT GGG TTT GCA GGA TTT CCT GTG ACA                1316Arg Met Lys Asn Glu Phe Gly Phe Ala Gly Phe Pro Val Thr
    140                 145                 150GGTATGTTAG AGTGGCACGC GGGGCTGCAC GCTGGGATGA TGATCATAAA TCAATAACTT      1376TCGTTCTACT GACTGCGATC AAACGATCGT GTAGACACCT TTTACTCTGA CCGCAGACGT      1436GCAGCGCCTT TTTGGCAGGA ACATGTACTA ACACATCAGC A GAT GAT GGC AAG          1489
                                          Asp Asp Gly Lys
                                            1CCG ACC GGG AAG CTG CAG GGG ATC ATC ACG TCC CGT GAC ATC CAG TTT        1537Pro Thr Gly Lys Leu Gln Gly Ile Ile Thr Ser Arg Asp Ile Gln Phe5                  10                  15                  20GTC GAG GAC GAG ACC CTG CTT GTG TCT GAG ATC ATG ACC AAG GAC GTC        1585Val Glu Asp Glu Thr Leu Leu Val Ser Glu Ile Met Thr Lys Asp Val
             25                  30                  35ATC ACT GGG AAG CAG GGC ATC AAC CTC GAG GAG GCG AAC CAG ATC CTG        1633Ile Thr Gly Lys Gln Gly Ile Asn Leu Glu Glu Ala Asn Gln Ile Leu
         40                  45                  50AAG AAC ACC AAG AAG GGC AAG CTG CCA ATT GTG GAC GAG GCG GGC TGC        1681Lys Asn Thr Lys Lys Gly Lys Leu Pro Ile Val Asp Glu Ala Gly Cys
     55                  60                  65CTG GTG TCC ATG CTT TCG AGA ACT GAC TTG ATG AAG AAC CAG TCC TAC        1729Leu Val Ser Met Leu Ser Arg Thr Asp Leu Met Lys Asn Gln Ser Tyr
 70                  75                  80CCA TTG GCC TCC AAG TCT GCC GAC ACC AAG CAG CTG CTC TGT GGT GCT        1777Pro Leu Ala Ser Lys Ser Ala Asp Thr Lys Gln Leu Leu Cys Gly Ala85                  90                  95                 100GCG ATC GGC ACC ATC GAC GCG GAC AGG CAG AGA CTG GCG ATG CTG GTC        1825Ala Ile Gly Thr Ile Asp Ala Asp Arg Gln Arg Leu Ala Met Leu Val
            105                 110                 115GAG GCC GGT CTG GAC GTT GTT GTG CTA GAC TCC TCG CAG GGT AAC TCG        1873Glu Ala Gly Leu Asp Val Val Val Leu Asp Ser Ser Gln Gly Asn Ser
        120                 125                 130GTC TTC CAG ATC AAC ATG ATC AAG TGG ATC AAG GAG ACC TTC CCA GAC        1921Val Phe Gln Ile Asn Met Ile Lys Trp Ile Lys Glu Thr Phe Pro Asp
    135                 140                 145CTG CAG GTC ATT GCT GGC AAC GTG GTC ACC AGA GAG CAG GCT GCC AGC        1969Leu Gln Val Ile Ala Gly Asn Val Val Thr Arg Glu Gln Ala Ala Ser
150                 155                 160TTG ATC CAC GCC GGC GCA GAC GGG TTG CGT ATC GGT ATG GGC TCT GGC        2017Leu Ile His Ala Gly Ala Asp Gly Leu Arg Ile Gly Met Gly Ser Gly165                 170                 175                 180TCC ATC TGT ATC ACT CAG GAG GTG ATG GCC TGT GGT AGA CCA CAG GGT       2065Ser Ile Cys Ile Thr Gln Glu Val Met Ala Cys Gly Arg Pro Gln Gly
            185                 190                 195ACC GCT GTC TAC AAC GTC ACG CAG TTC GCC AAC CAG TTT GGT GTG CCA       2113Thr Ala Val Tyr Asn Val Thr Gln Phe Ala Asn Gln Phe Gly Val Pro
        200                 205                 210TGT ATT GCT GAC GGT GGT GTC CAG AAC ATC GGG CAC ATT ACC AAA GCT       2161Cys Ile Ala Asp Gly Gly Val Gln Asn Ile Gly His Ile Thr Lys Ala
    215                 220                 225ATC GCT CTT GGC GCG TCC ACC GTC ATG ATG GGC GGT ATGCTG GCA GGC        2209Ile Ala Leu Gly Ala Ser Thr Val Met Met Gly Gly Met Leu Ala Gly
230                 235                 240ACT ACA GAG TCT CCA GGC GAG TAC TTC TTC AGG GAC GGG AAG AGA CTG       2257Thr Thr Glu Ser Pro Gly Glu Tyr Phe Phe Arg Asp Gly Lys Arg Leu245                 250                 255                 260AAG ACC TAC AGA GGT ATG GGC TCC ATC GAC GCC ATG CAA AAG ACT GAT       2305Lys Thr Tyr Arg Gly Met Gly Ser Ile Asp Ala Met Gln Lys Thr Asp
            265                 270                 275GTC AAG GGT AAC GCC GCT ACC TCC CGT TAC TTC TCT GAG TCT GAC AAG       2353Val Lys Gly Asn Ala Ala Thr Ser Arg Tyr Phe Ser Glu Ser Asp Lys
        280                 285                 290GTT CTG GTC GCT CAG GGT GTT ACT GGT TCT GTG ATC GAC AAG GGC TCC       2401Val Leu Val Ala Gln Gly Val Thr Gly Ser Val Ile Asp Lys Gly Ser
    295                 300                 305ATC AAG AAG TAC ATT CCA TAT CTG TAC AAT GGT CTA CAG CAC TCG TGC       2449Ile Lys Lys Tyr Ile Pro Tyr Leu Tyr Asn Gly Leu Gln His Ser Cys
310                 315                 320CAG GAT ATC GGT GTG CGC TCT CTA GTG GAG TTC AGA GAG AAG GTG GAC       2497Gln Asp Ile Gly Val Arg Ser Leu Val Glu Phe Arg Glu Lys Val Asp325                 330                 335                 340TCT GGC TCG GTC AGA TTT GAG TTC AGA ACT CCA TCT GCC CAG TTG GAG       2545Ser Gly Ser Val Arg Phe Glu Phe Arg Thr Pro Ser Ala Gln Leu Glu
            345                 350                 355GGT GGT GTG CAC AAC TTG CAC TCC TAC GAG AAG CGC CTA TTT GACTGAGTGC    2597Gly Gly Val His Asn Leu His Ser Tyr Glu Lys Arg Leu Phe Asp
        360                 365                 370CACTAGGCCC ACACTATAGA AGTGGATCCG GGCGCGATGG CACCCATACT TTTATATTAT     2657GTTGATTGAT GTACGTAAAC GATAGATATA ATAACAGACG CGGCATCTCA TTTGTATGCA             2717ATATATCTGG AACATGGTTA TGCGTACTCA ACTGTATGTA CTACTTTATA TACACAGCTC             2777TGGGACACTT GGTGAGATAT ATGTTTCATT ATGTATGCCT CGCTATCGAA AGGTCTGGCA             2837TTATGGGCTA CTGGGTCTAA GAGTCATGGC TTATGAGTAT TTATTTATTT ATTTCTCTTC             2897CTTTTCATTA AACTCCTCGA GCTTCTTTCT GTAATACTGC TCTCTAGACT TCTCCACATC             2957TGCTAATGAT GGTGGAAGTC GTTCGTTTTC CAAATCCGCT CTACGAGCGC GCTCGAAGTT             3017AGACAGCGCC TCGTTCAGAC CTTCAGACCC GCGTGACAGC GCTCCACGAG GCAGCACGCC             3077AGAATTCATT GTTTTTAGGT ACTGCACCTT ATCGCTCTCT TCTCTCAACA CGCTATACAT             3137TCGGGAAACC TTGGCAATCG CCAATATTTT ACTGCGTAGT GCACGCCGTT TTGCATCATC             3197GTCCAGAATA GACCGTTTTT TCTTCGATTT CTTGGAGCCA GGTATAACAG TTACAACCTG             3257CTCAGTGTTT TTGGACTTCA ATGTAGCACC TAAGTCCTCC CTTATAACAA AAGTCTCTTC             3317CTCCAATTCT TCTTCAGTAC AAATGTTTAA TATCGAAACC AACATTTCAG TCACTTTCTC             3377GCCAACAAAT GGCAAAGACC AGGTGAATAC GTCCATGAAA TTCGGTAACC AATACGGATG             3437CTGTGACATG TTAAATTGTC TAATGTTCAT AACGTTATCC GAGTATTTTA GGACCGCGGC             3497CTTGTTCTTG TAAGTGTCCA AGTAGTTGGG TGCGCTGAAC AACGTAAGTA AACTAGGAAA             3557GCCCAGATTC TTGGTATTCT TGTACATTCT GTAGCCCTGA TCTTGGGCTT CGTGGGCCC              3616(2)SEQ ID NO:8信息:(i)序列特征:
(A)长度:151氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:8:Met Thr Tyr Arg Asp Ala Ala Thr Ala Leu Glu His Leu Ala Thr Tyr1               5                  10                  15Ala Glu Lys Asp Gly Leu Ser Val Glu Gln Leu Met Asp Ser Lys Thr
         20                  25                  30Arg Gly Gly Leu Thr Tyr Asn Asp Phe Leu Val Leu Pro Gly Lys Ile
     35                  40                  45Asp Phe Pro Ser Ser Glu Val Val Leu Ser Ser Arg Leu Thr Lys Lys
 50                  55                  60Ile Thr Leu Asn Ala Pro Phe Val Ser Ser Pro Met Asp Thr Val Thr65                  70                  75                  80Glu Ala Asp Met Ala Ile His Met Ala Leu Leu Gly Gly Ile Gly Ile
             85                  90                  95Ile His His Asn Cys Thr Ala Glu Glu Gln Ala Glu Met Val Arg Arg
        100                 105                 110Val Lys Lys Tyr Glu Asn Gly Phe Ile Asn Ala Pro Val Val Val Gly
    115                 120                 125Pro Asp Ala Thr Val Ala Asp Val Arg Arg Met Lys Asn Glu Phe Gly
130                 135                 140Phe Ala Gly Phe Pro Val Thr145                 150(2)SEQ ID NO:9信息:(i)序列特征:
(A)长度:371氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:9:Asp Asp Gly Lys Pro Thr Gly Lys Leu Gln Gly Ile Ile Thr Ser Arg1               5                  10                  15Asp Ile Gln Phe Val Glu Asp Glu Thr Leu Leu Val Ser Glu lle Met
         20                  25                  30Thr Lys Asp Val Ile Thr Gly Lys Gln Gly Ile Asn Leu Glu Glu Ala
     35                  40                  45Asn Gln Ile Leu Lys Asn Thr Lys Lys Gly Lys Leu Pro Ile Val Asp
 50                  55                  60Glu Ala Gly Cys Leu Val Ser Met Leu Ser Arg Thr Asp Leu Met Lys65                  70                  75                  80Asn Gln Ser Tyr Pro Leu Ala Ser Lys Ser Ala Asp Thr Lys Gln Leu
             85                  90                  95Leu Cys Gly Ala Ala Ile Gly Thr Ile Asp Ala Asp Arg Gln Arg Leu
        100                 105                 110Ala Met Leu Val Glu Ala Gly Leu Asp Val Val Val Leu Asp Ser Ser
    115                 120                 125Gln Gly Asn Ser Val Phe Gln Ile Asn Met Ile Lys Trp Ile Lys Glu
130                 135                 140Thr Phe Pro Asp Leu Gln Val Ile Ala Gly Asn Val Val Thr Arg Glu145                 150                 155                 160Gln Ala Ala Ser Leu Ile His Ala Gly Ala Asp Gly Leu Arg Ile Gly
            165                 170                 175Met Gly Ser Gly Ser Ile Cys Ile Thr Gln Glu Val Met Ala Cys Gly
        180                 185                 190Arg Pro Gln Gly Thr Ala Val Tyr Asn Val Thr Gln Phe Ala Asn Gln
    195                 200                 205Phe Gly Val Pro Cys Ile Ala Asp Gly Gly Val Gln Asn Ile Gly His
210                 215                 220Ile Thr Lys Ala Ile Ala Leu Gly Ala Ser Thr Val Met Met Gly Gly225                 230                 235                 240Met Leu Ala Gly Thr Thr Glu Ser Pro Gly Glu Tyr Phe Phe Arg Asp
            245                 250                 255Gly Lys Arg Leu Lys Thr Tyr Arg Gly Met Gly Ser Ile Asp Ala Met
        260                 265                 270Gln Lys Thr Asp Val Lys Gly Asn Ala Ala Thr Ser Arg Tyr Phe Ser
    275                 280                 285Glu Ser Asp Lys Val Leu Val Ala Gln Gly Val Thr Gly Ser Val Ile
290                 295                 300Asp Lys Gly Ser Ile Lys Lys Tyr Ile Pro Tyr Leu Tyr Asn Gly Leu305                 310                 315                 320Gln His Ser Cys Gln Asp Ile Gly Val Arg Ser Leu Val Glu Phe Arg
            325                 330                 335Glu Lys Val Asp Ser Gly Ser Val Arg Phe Glu Phe Arg Thr Pro Ser
        340                 345                 350Ala Gln Leu Glu Gly Gly Val His Asn Leu His Ser Tyr Glu Lys Arg
    355                 360                 365Leu Phe Asp
370(2)SEQ ID NO:10信息:(i)序列特征:
(A)长度:2697碱基对
(B)类型:核酸
(C)链类型:单链
(D)拓扑学:线性(ii)分子类型:DNA(基因组)(iii)假设:无(iv)反义:无(ix)特征:
(A)名字/关键词:5’UTR
(B)位置:1...455(ix)特征:
(A)名字/关键词:CDS
(B)位置:456...2033(ix)特征:
(A)名字/关键词:3’UTR
(B)位置:2034...2697(xi)序列的详细情况:SEQ ID NO:10:ATCGATTTCA GGAGATTTTT GGTAGCATTA TTGAGGTCAT TAGAGGCGTT CTGTGACTTT         60CGACGATTTG CACGCGCAGA AGAGGGCGTT CAACCAGCCT TTCGGATATT CCGGTTCGAG         120TTATACCAGC AGGGATCAGC GCAGGCACTA GAGTGGCGGG TGCTAATAAG AGGAGCAGGT         180CCTGGAACTG AAGTTGCAAG AGATAAGCAT TGCGCGGAGA AGGAGGCGGT TAGAGGGTGC         240AAGCGAGCAG GATGGGGTCT TCGATGAACT TCCCGTCTGG GTATGTGAAC AAGCACACGC         300TGCAGGCACA CCGGTAGGGC GAGTGCAGGG TGAAAAATAT ATATGCGCTC GAGAAGCGCT       360GGGGATGAGT TCGTCTGCAA CGGCAGGCGG ATCTTCATCT GACAAAACCA GCTGCCTACA       420TCAGTGCGAA GCTGTTCAGT GATAGAATAG GAGTA ATG GCT GCT GTT GAA CAA          473
                                   Met Ala Ala Val Glu Gln
                                     1               5GTT TCT AGC GTG TTT GAC ACC ATT TTG GTG CTG GAC TTC GGG TCC CAG         521Val Ser Ser Val Phe Asp Thr Ile Leu Val Leu Asp Phe Gly Ser Gln
         10                 15                  20TAC TCG CAT CTG ATC ACG CGG CGG CTG CGT GAG TTT AAT GTG TAC GCG         569Tyr Ser His Leu Ile Thr Arg Arg Leu Arg Glu Phe Asn Val Tyr Ala
     25                  30                  35GAG ATG CTT CCG TGT ACG CAG AAG ATC AGC GAG CTG GGC TGG AAG CCA         617Glu Met Leu Pro Cys Thr Gln Lys Ile Ser Glu Leu Gly Trp Lys Pro
 40                  45                  50AAG GGT GTG ATT TTG TCA GGC GGG CCG TAC TCC GTG TAC GCG GCA GAT         665Lys Gly Val Ile Leu Ser Gly Gly Pro Tyr Ser Val Tyr Ala Ala Asp55                  60                  65                  70GCT CCG CAC GTG GAC CGG GCG GTG TTC GAG TTG GGC GTT CCA ATT CTG         713Ala Pro His Val Asp Arg Ala Val Phe Glu Leu Gly Val Pro Ile Leu
            75                   80                  85GGC ATC TGC TAC GGG CTA CAG GAG CTT GCG TGG ATA GCC GGC GCA GAG         761Gly Ile Cys Tyr Gly Leu Gln Glu Leu Ala Trp Ile Ala Gly Ala Glu
         90                  95                 100GTG GGG CGC GGC GAG AAG CGC GAG TAC GGG CGC GCG ACG CTG CAC GTG         809Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly Arg Ala Thr Leu His Val
   105                  110                 115GAG GAC AGC GCG TGC CCG CTG TTC AAC AAC GTG GAC AGC AGC ACG GTG         857Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn Val Asp Ser Ser Thr Val
120                 125                 130TGG ATG TCG CAC GGT GAC AAG CTG CAC GCA CTA CCT GCG GAT TTC CAC         905Trp Met Ser His Gly Asp Lys Leu His Ala Leu Pro Ala Asp Phe His135                 140                 145                 150GTC ACT GCG ACG ACG GAG AAC TCT CCT TTC TGC GGG ATT GCA CAC GAC         953Val Thr Ala Thr Thr Glu Asn Ser Pro Phe Cys Gly Ile Ala His Asp
            155                 160                 165TCG AAG CCA ATC TTC GGG ATC CAG TTC CAC CCT GAG GTG ACG CAC TCC       1001Ser Lys Pro Ile Phe Gly Ile Gln Phe His Pro Glu Val Thr His Ser
        170                 175                 180TCG CAG GGG AAG ACG TTG CTG AAG AAC TTT GCG GTG GAG ATC TGC CAG       1049Ser Gln Gly Lys Thr Leu Leu Lys Asn Phe Ala Val Glu Ile Cys Gln
    185                 190                 195GCC GCG CAG ACC TGG ACG ATG GAA AAC TTC ATT GAC ACC GAG ATC CAG       1097Ala Ala Gln Thr Trp Thr Met Glu Asn Phe Ile Asp Thr Glu Ile Gln200                  205                 210CGG ATC CGG ACC CTT GTG GGC CCC ACC GCG GAA GTC ATC GGT GCT GTG       1145Arg Ile Arg Thr Leu Val Gly Pro Thr Ala Glu Val Ile Gly Ala Val215                 220                 225                 230TCC GGC GGT GTC GAC TCG ACC GTC GCT GCG AAG CTG ATG ACC GAG GCC       1193Ser Gly Gly Val Asp Ser Thr Val Ala Ala Lys Leu Met Thr Glu Ala
            235                 240                 245ATC GGC GAC CGG TTC CAC GCG ATC CTG GTC GAC AAC GGT GTT CTG CGC       1241Ile Gly Asp Arg Phe His Ala Ile Leu Val Asp Asn Gly Val Leu Arg
        250                 255                 260CTC AAC GAA GCG GCC AAT GTG AAG AAA ATC CTC GGC GAG GGC TTG GGC       1289Leu Asn Glu Ala Ala Asn Val Lys Lys Ile Leu Gly Glu Gly Leu Gly
    265                 270                 275ATC AAC TTG ACT GTT GTT GAC GCC TCC GAA GAG TTC TTG ACG AAG CTC       1337Ile Asn Leu Thr Val Val Asp Ala Ser Glu Glu Phe Leu Thr Lys Leu
280                 285                 290AAG GGC GTC ACG GAC CCT GAG AAG AAG AGA AAG ATC ATC GGT AAC ACC       1385Lys Gly Val Thr Asp Pro Glu Lys Lys Arg Lys Ile Ile Gly Asn Thr295                 300                 305                 310TTC ATT CAT GTT TTT GAG CGC GAG GCA GCC AGG ATC CAG CCT AAG AAC       1433Phe Ile His Val Phe Glu Arg Glu Ala Ala Arg Ile Gln Pro Lys Asn
            315                 320                 325GGC GAG GAG ATT GAG TTC CTG TTG CAG GGT ACC CTA TAC CCT GAC GTT       148lGly Glu Glu Ile Glu Phe Leu Leu Gln Gly Thr Leu Tyr Pro Asp Val
        330                 335                 340ATC GAG TCC ATT TCC TTT AAG GGC CCA TCT CAG ACG ATC AAG ACC CAC       1529Ile Glu Ser Ile Ser Phe Lys Gly Pro Ser Gln Thr Ile Lys Thr His
    345                 350                 355CAT AAC GTC GGT GGT CTT TTG GAC AAC ATG AAA CTG AAG CTC ATT GAG        1577His Asn Val Gly Gly Leu Leu Asp Asn Met Lys Leu Lys Leu Ile Glu
360                 365                 370CCT TTG CGC GAG CTT TTC AAG GAC GAG GTG AGA CAC CTG GGA GAA CTA        1625Pro Leu Arg Glu Leu Phe Lys Asp Glu Val Arg His Leu Gly Glu Leu375                 380                 385                 390TTG GGG ATC TCC CAC GAG TTG GTC TGG AGA CAT CCG TTC CCA GGC CCA        1673Leu Gly Ile Ser His Glu Leu Val Trp Arg His Pro Phe Pro Gly Pro
            395                 400                 405GGT ATC GCC ATC CGT GTG CTA GGC GAG GTC ACC AAG GAG CAG GTG GAG        1721Gly Ile Ala Ile Arg Val Leu Gly Glu Val Thr Lys Glu Gln Val Glu
        410                 415                 420ATT GCC AGA AAG GCA GAC CAC ATC TAC ATC GAG GAG ATC AGG AAA GCA        1769Ile Ala Arg Lys Ala Asp His Ile Tyr Ile Glu Glu Ile Arg Lys Ala
    425                 430                 435GGT CTA TAC AAC AAG ATT TCT CAA GCT TTT GCT TGC TTG CTG CCT GTT        1817Gly Leu Tyr Asn Lys Ile Ser Gln Ala Phe Ala Cys Leu Leu Pro Val
440                 445                 450AAG TCT GTG GGT GTC ATG GGT GAC CAG AGA ACC TAC GAC CAG GTC ATT        1865Lys Ser Val Gly Val Met Gly Asp Gln Arg Thr Tyr Asp Gln Val Ile455                 460                 465                 470GCT CTA AGA GCA ATT GAG ACC ACG GAC TTC ATG ACT GCC GAC TGG TAT        1913Ala Leu Arg Ala Ile Glu Thr Thr Asp Phe Met Thr Ala Asp Trp Tyr
            475                 480                 485CCA TTT GAG CAC GAA TTC TTG AAG CAT GTC GCA TCC CGT ATT GTT AAC        1961Pro Phe Glu His Glu Phe Leu Lys His Val Ala Ser Arg Ile Val Asn
        490                 495                 500GAG GTT GAA GGT GTT GCC AGA GTC ACC TAC GAC ATA ACT TCT AAG CCT        2009Glu Val Glu Gly Val Ala Arg Val Thr Tyr Asp Ile Thr Ser Lys Pro
    505                 510                 515CCA GCT ACC GTT GAA TGG GAA TAATCACCCT TGGGATCCGC TGACTGGCTA           2060Pro Ala Thr Val Glu Trp Glu
520                 525CTGTAATTCT ATGTAGTGGA TTAGTACGAT AAGTTACTTT TGTATGATAG ATGTAATCAC      2120ATCTGGCTAT TAAAATGACT CAGCCGAGGT AAATCTAACG TCCCTTCACA AGGGTGTTCC      2180TGTGTGGACT TCCGCCTGAA TTTTTATAGA TATATAGATA CTCTACTCAT GAACAACCTG      2240CAACCGAATA AGCATTAGTG CCAGGAGAAG AGAACCGTGG AAATGGGGCA AGTAGAAAAA     2300ATCATATTCC TTAAGAATAA GACAGTACCA GAGGACCATT ACGAGACGAT TTTTGAATCG     2360AATGGCTTCC AGACTCACTT TGTACCCATA ATAACCCATG AACACCTGCC AGATGAGGTT     2420CGCGGTCGAC TATCCGACGC GAATTACATG AAAAGGTTGA ATTGTTTGGT GGTAACCTCT     2480CAGAGGACTG TGGAGTGTCT CTATGAGGAC GTTCTGCCCT CTCTTCCAGC TGAAGCACGC     2540AAATCTCTTC TCAATACGCC AGTATTCGTG GTTGGGCGTG CCACTCAGGA ATTTATGGAG     2600AGATGCGGCT TTACGGACGT GAGAGGGGGA TCTGAGACTG GTAATGGCGT TTTGCTAGCG     2660GAGTTAATGT TAAATATGAT CCAGAAGGGC GATGGGG                              2697(2)SEQID NO:ll信息:(i)序列特征:
(A)长度:525氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:11:Met Ala Ala Val Glu Gln Val Ser Ser Val Phe Asp Thr Ile Leu Val1               5                  10                  15Leu Asp Phe Gly Ser Gln Tyr Ser His Leu Ile Thr Arg Arg Leu Arg
         20                  25                  30Glu Phe Asn Val Tyr Ala Glu Met Leu Pro Cys Thr Gln Lys Ile Ser
     35                  40                  45Glu Leu Gly Trp Lys Pro Lys Gly Val Ile Leu Ser Gly Gly Pro Tyr
 50                  55                  60Ser Val Tyr Ala Ala Asp Ala Pro His Val Asp Arg Ala Val Phe Glu65                  70                  75                  80Leu Gly Val Pro Ile Leu Gly Ile Cys Tyr Gly Leu Gln Glu Leu Ala
             85                  90                  95Trp Ile Ala Gly Ala Glu Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly
        100                 105                 110Arg Ala Thr Leu His Val Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn
    115                 120                 125Val Asp Ser Ser Thr Val Trp Met Ser His Gly Asp Lys Leu His Ala
130                 135                 140Leu Pro Ala Asp Phe His Val Thr Ala Thr Thr Glu Asn Ser Pro Phe145                 150                 155                 160Cys Gly Ile Ala His Asp Ser Lys Pro Ile Phe Gly Ile Gln Phe His
            165                 170                 175Pro Glu Val Thr His Ser Ser Gln Gly Lys Thr Leu Leu Lys Asn Phe
        180                 185                 190Ala Val Glu Ile Cys Gln Ala Ala Gln Thr Trp Thr Met Glu Asn Phe
    195                 200                 205Ile Asp Thr Glu Ile Gln Arg Ile Arg Thr Leu Val Gly Pro Thr Ala
210                 215                 220Glu Val Ile Gly Ala Val Ser Gly Gly Val Asp Ser Thr Val Ala Ala225                 230                 235                 240Lys Leu Met Thr Glu Ala Ile Gly Asp Arg Phe His Ala Ile Leu Val
            245                 250                 255Asp Asn Gly Val Leu Arg Leu Asn Glu Ala Ala Asn Val Lys Lys Ile
        260                 265                 270Leu Gly Glu Gly Leu Gly Ile Asn Leu Thr Val Val Asp Ala Ser Glu
    275                 280                 285Glu Phe Leu Thr Lys Leu Lys Gly Val Thr Asp Pro Glu Lys Lys Arg
290                 295                 300Lys Ile Ile Gly Asn Thr Phe Ile His Val Phe Glu Arg Glu Ala Ala305                 310                 315                 320Arg Ile Gln Pro Lys Asn Gly Glu Glu Ile Glu Phe Leu Leu Gln Gly
            325                 330                 335Thr Leu Tyr Pro Asp Val Ile Glu Ser Ile Ser Phe Lys Gly Pro Ser
        340                 345                 350Gln Thr Ile Lys Thr His His Asn Val Gly Gly Leu Leu Asp Asn Met
    355                 360                 365Lys Leu Lys Leu Ile Glu Pro Leu Arg Glu Leu Phe Lys Asp Glu Val
370                 375                 380Arg His Leu Gly Glu Leu Leu Gly Ile Ser His Glu Leu Val Trp Arg385                 390                395                 400His Pro Phe Pro Gly Pro Gly Ile Ala Ile Arg Val Leu Gly Glu Val
            405                 410                 415Thr Lys Glu Gln Val Glu Ile Ala Arg Lys Ala Asp His Ile Tyr Ile
        420                 425                 430Glu Glu Ile Arg Lys Ala Gly Leu Tyr Asn Lys Ile Ser Gln Ala Phe
    435                 440                 445Ala Cys Leu Leu Pro Val Lys Ser Val Gly Val Met Gly Asp Gln Arg
450                 455                 460Thr Tyr Asp Gln Val Ile Ala Leu Arg Ala Ile Glu Thr Thr Asp Phe465                 470                 475                 480Met Thr Ala Asp Trp Tyr Pro Phe Glu His Glu Phe Leu Lys His Val
            485                 490                 495Ala Ser Arg Ile Val Asn Glu Var Glu Gly Val Ala Arg Val Thr Tyr
        500                 505                 510Asp Ile Thr Ser Lys Pro Pro Ala Thr Val Glu Trp Glu
    515                 520                 525(2)SEQ ID NO:12信息:(i)序列特征:
(A)长度:1634碱基对
(B)类型:核酸
(C)链类型:双链
(D)拓扑学:线性(ii)分子类型:mRNA的cDNA(iii)假设:无(iv)反义:无(ix)特征:
(A)名字/关键词:5’UTR
(B)位置:1...519(ix)特征:
(A)名字/关键词:CDS
(B)位置:520...1482(ix)特征:
(A)名字/关键词:3’UTR
(B)位置:1483...1634(xi)序列的详细情况:SEQ ID NO:12:CCTCGAACAT CTATCTTCTG AGCTCGATAG TCTACGAAAT CGGCACACTA GCCTAATTGC        60CGAGATGAAG AGCTCCAGGG AACCGTTAAA GATCTGATGT TCCATCTTCA ATCAGGACAA       120ATGTTACGGG ATGTCCCTGA CGCCACAGAA GGTAGCCTGG TGGTCCAGAC AGAAAAAGAG       180CCTACACCAA AGAAGAAACA TAACAAGAAA AAGCCTCCGC ATCGTTTTGG TAAATCATAA       240TAGGCACGAT GCGCATATAC CCTGACCATC ATAGCGGTTC CCCCCGCTAA CTGCTCCGAG       300CGGGTAACCC CATGTCACAA AGTGACTCTG TCTCTTCGTG GTAGGTGATG TCAAATTTTC       360ACGACTTCCC ACCCCGATGA GCATCCGTAT TCCTTTTCAT CTAAATTCTA ATAGATGGCT       420TATGGATTCT TATTGGCGAC TTACAAGCCT ATGTAGTTGG CTTCCCTCAA GTGTTCGTAG       480TCTACCACCT CACACCCGGT CTAACAGCTT ACGAGAATA ATG GCT ACT AAT GCA          534
                                       Met Ala Thr Asn Ala
                                         1               5ATC AAG CTT CTT GCG CCA GAT ATC CAC AGG GGT CTG GCA GAG CTG GTC         582Ile Lys Leu Leu Ala Pro Asp Ile His Arg Gly Leu Ala Glu Leu Val
             10                  15                  20GCT AAA CGC CTA GGC TTA CGT CTG ACA GAC TGC AAG CTT AAG CGG GAT         630Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys Lys Leu Lys Arg Asp
         25                  30                  35TGT AAC GGG GAG GCG ACA TTT TCG ATC GGA GAA TCT GTT CGA GAC CAG         678Cys Asn Gly Glu Ala Thr Phe Ser Ile Gly Glu Ser Val Arg Asp Gln
     40                  45                  50GAT ATC TAC ATC ATC ACG CAG GTG GGG TCC GGG GAC GTG AAC GAC CGA        726Asp Ile Tyr Ile Ile Thr Gln Val Gly Ser Gly Asp Val Asn Asp Arg
 55                  60                  65GTG CTG GAG CTG CTC ATC ATG ATC AAC GCT AGC AAG ACG GCG TCT GCG        774Val Leu Glu Leu Leu Ile Met Ile Asn Ala Ser Lys Thr Ala Ser Ala70                  75                  80                  85CGG CGA ATT ACG GCT GTG ATT CCA AAC TTC CCA TAC GCG CGG CAG GAC        822Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro Tyr Ala Arg Gln Asp
             90                  95                 100CGG AAG GAT AAG TCA CGG GCG CCA ATT ACC GCG AAG CTC ATG GCG GAC        870Arg Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala Lys Leu Met Ala Asp
        105                 110                 115ATG CTG ACT ACC GCG GGC TGC GAT CAT GTC ATC ACC ATG GAC TTA CAC        918Met Leu Thr Thr Ala Gly Cys Asp His Val Ile Thr Met Asp Leu His
    120                 125                 130GCT TCG CAA ATC CAG GGC TTC TTT GAT GTA CCA GTT GAC AAC CTT TAC        966Ala Ser Gln Ile Gln Gly Phe Phe Asp Val Pro Val Asp Asn Leu Tyr
135                 140                 145GCA GAG CCT AGC GTG GTG AAG TAT ATC AAG GAG CAT ATT CCC CAC GAC       1014Ala Glu Pro Ser Val Val Lys Tyr Ile Lys Glu His Ile Pro His Asp150                 155                 160                 165GAT GCC ATC ATC ATC TCG CCG GAT GCT GGT GGT GCC AAA CGT GCG TCG       1062Asp Ala Ile Ile Ile Ser Pro Asp Ala Gly Gly Ala Lys Arg Ala Ser
            170                 175                 180CTT CTA TCA GAT CGC CTA AAC TTG AAC TTT GCG CTG ATT CAT AAG GAA       1110Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala Leu Ile His Lys Glu
        185                 190                 195CGT GCA AAG GCA AAC GAA GTG TCC CGC ATG GTT CTG GTC GGC GAT GTT       1158Arg Ala Lys Ala Asn Glu Val Ser Arg Met Val Leu Val Gly Asp Val
    200                 205                 210ACC GAT AAA GTC TGC ATT ATC GTT GAC GAT ATG GCG GAT ACT TGT GGT       1206Thr Asp Lys Val Cys Ile Ile Val Asp Asp Met Ala Asp Thr Cys Gly
215                 220                225ACG CTG GCC AAG GCG GCA GAA GTG CTG CTA GAG CAC AAC GCG CGG TCT       1254Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu His Asn Ala Arg Ser230                 235                 240                 245GTG ATA GCC ATT GTT ACC CAC GGT ATC CTT TCA GGA AAG GCC ATT GAG       1302Val Ile Ala Ile Val Thr His Gly Ile Leu Ser Gly Lys Ala Ile Glu
            250                 255                 260AAC ATC AAC AAT TCG AAG CTT GAT AGG GTT GTG TGT ACC AAC ACC GTG       1350Asn Ile Asn Asn Ser Lys Leu Asp Arg Val Val Cys Thr Asn Thr Val
       265                  270                 275CCA TTC GAG GAG AAG ATG AAG TTA TGC CCG AAG TTA GAT GTA ATT GAT       1398Pro Phe Glu Glu Lys Met Lys Leu Cys Pro Lys Leu Asp Val Ile Asp
    280                 285                 290ATC TCG GCA GTT CTT GCG GAA TCC ATT CGC CGT CTA CAC AAT GGT GAA       1446Ire Ser Ala Val Leu Ala Glu Ser Ile Arg Arg Leu His Asn Gly Glu
295                 300                 305AGT ATC TCC TAC CTC TTT AAA AAC AAC CCA CTA TGATTTTGCT TCTCGATGCT     1499Ser Ile Ser Tyr Leu Phe Lys Asn Asn Pro Leu310                 315                 320GGCTTCTTGA GGGCCAATTT TGCCGTAGAG GTAGTATCCC TTCTTTTTAT ATTGACTATT     1559TAACGAAGAC TATTTCTTCA TAAATGGACT TCGGCTTCAC TGTGAATCTC ACATGATATA     1619GTTGTTTCAG AGACC                                                      1634(2)SEQ ID NO:13信息:(i)序列特征:
(A)长度:320氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白(xi)序列的详细情况:SEQ ID NO:13:Met Ala Thr Asn Ala Ile Lys Leu Leu Ala Pro Asp Ile His Arg Gly1               5                  10                  15Leu Ala Glu Leu Val Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys
         20                  25                  30Lys Leu Lys Arg Asp Cys Asn Gly Glu Ala Thr Phe Ser Ile Gly Glu
     35                  40                  45Ser Val Arg Asp Gln Asp Ile Tyr Ile Ile Thr Gln Val Gly Ser Gly
 50                  55                  60Asp Val Asn Asp Arg Val Leu Glu Leu Leu Ile Met Ile Asn Ala Ser65                  70                  75                  80Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro
             85                  90                  95Tyr Ala Arg Gln Asp Arg Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala
        100                 105                 110Lys Leu Met Ala Asp Met Leu Thr Thr Ala Gly Cys Asp His Val Ile
    115                 120                 125Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asp Val Pro
130                 135                     140Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Val Lys Tyr Ile Lys Glu145                 150                 155                 160His Ile Pro His Asp Asp Ala Ile Ile Ile Ser Pro Asp Ala Gly Gly
            165                 170                 175Ala Lys Arg Ala Ser Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala
        180                 185                 190Leu Ile His Lys Glu Arg Ala Lys Ala Asn Glu Val Ser Arg Met Val
    195                 200                 205Leu Val Gly Asp Val Thr Asp Lys Val Cys Ile Ile Val Asp Asp Met
210                 215                 220Ala Asp Thr Cys Gly Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu225                 230                 235                 240His Asn Ala Arg Ser Val Ile Ara Ile Val Thr His Gly Ile Leu Ser
            245                 250                 255Gly Lys Ala Ile Glu Asn Ile Asn Asn Ser Lys Leu Asp Arg Val Val
        260                 265                 270Cys Thr Asn Thr Val Pro Phe Glu Glu Lys Met Lys Leu Cys Pro Lys
    275                 280                 285Leu Asp Val Ile Asp Ile Ser Ala Val Leu Ala Glu Ser Ile Arg Arg
290                 295                 300Leu His Asn Gly Glu Ser Ile Ser Tyr Leu Phe Lys Asn Asn Pro Leu305                 310                 315                 320

Claims (8)

1.具有序列号2所示多肽序列或从序列号2通过取代,插入,删除最高可达15%的氨基酸得到的多肽序列的蛋白,且具有磷酸核糖焦磷酸合成酶活性。
2.权利要求1的蛋白,它不再受嘌呤生物合成中间产物抑制,特别是嘌呤碱基,嘌呤核苷,嘌呤核苷酸5’单磷酸或嘌呤核苷酸5’-二磷酸或嘌呤核苷酸5’-三磷酸的抑制,它是L131I或H196Q。
3.权利要求1的蛋白,其中一个或多个下列氨基酸取代存在:7位的赖氨酸为缬氨酸取代,52位的天冬氨酸为组氨酸取代,133位的亮氨酸为异亮氨酸取代,186位的天冬氨酸为组氨酸取代,193位的丙氨酸为缬氨酸取代或196位的组氨酸为谷氨酰胺取代。
4.编码权利要求1的蛋白的核酸序列。
5.权利要求4的核酸序列在能产生核黄素的微生物基因工程构建中的应用。
6.通过培养棉铃腐阿氏酵母而制备核黄素的方法,其中棉铃腐阿氏酵母通过参入编码权利要求1-3之任一的蛋白的核苷酸序列而被遗传修饰。
7.权利要求6的方法,其中所述的遗传修饰包括至少一个如权利要求4所述的核酸序列的至少一个附加的拷贝。
8.权利要求6的方法,其中遗传修饰产生编码权利要求1-3之任一的蛋白的基因。
CNB981257844A 1997-12-23 1998-12-23 来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用 Expired - Fee Related CN1140629C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19757755 1997-12-23
DE19757755.5 1997-12-23

Publications (2)

Publication Number Publication Date
CN1227870A CN1227870A (zh) 1999-09-08
CN1140629C true CN1140629C (zh) 2004-03-03

Family

ID=7853311

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB988126443A Expired - Fee Related CN1149289C (zh) 1997-12-23 1998-12-23 棉桃阿舒氏囊霉启动子
CNB981257844A Expired - Fee Related CN1140629C (zh) 1997-12-23 1998-12-23 来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB988126443A Expired - Fee Related CN1149289C (zh) 1997-12-23 1998-12-23 棉桃阿舒氏囊霉启动子

Country Status (11)

Country Link
US (3) US6391603B1 (zh)
EP (2) EP0927761A3 (zh)
JP (2) JPH11243975A (zh)
KR (2) KR19990063322A (zh)
CN (2) CN1149289C (zh)
AT (1) ATE282699T1 (zh)
CA (2) CA2256052A1 (zh)
DE (1) DE59812281D1 (zh)
DK (1) DK1040193T3 (zh)
ES (1) ES2232035T3 (zh)
WO (1) WO1999033993A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19937548A1 (de) * 1999-08-09 2001-03-29 Forschungszentrum Juelich Gmbh Ein- oder mehrzellige Organismen zur Herstellung von Riboflavin
DE19946047A1 (de) * 1999-09-25 2001-03-29 Basf Ag Proteinproduktion mit Ashbya gossypii
EP1222293A2 (de) * 1999-10-01 2002-07-17 Basf Aktiengesellschaft Gmp-synthetase aus pflanzen
WO2002022823A2 (de) * 2000-09-14 2002-03-21 Basf Aktiengesellschaft An der stressantwort beteiligte proteine und dafür codierende gene aus ashbya gossypii
DE10046083A1 (de) * 2000-09-15 2002-03-28 Basf Ag Am Nukleotidmetabolismus beteiligte Proteine und dafür codierende Gene aus ASHBYA GOSSYPII
DE10160660A1 (de) * 2001-12-11 2003-06-18 Bayer Cropscience Ag Polypeptide zum Identifizieren von fungizid wirksamen Verbindungen
CN101365794A (zh) * 2005-08-12 2009-02-11 巴斯福植物科学有限公司 编码与非生物性胁迫应答相关的蛋白质的核酸序列和具有增加的环境胁迫耐受性的植物细胞及植物
WO2008043849A2 (en) * 2006-10-13 2008-04-17 Basf Plant Science Gmbh Plants with increased yield
US8518894B2 (en) 2009-06-01 2013-08-27 Kenneth James Friel Human milk peptides
KR102561864B1 (ko) * 2014-11-19 2023-08-01 바스프 에스이 Rib7 프로모터를 사용하여 유전자 발현을 하향조절하기 위한 에레모테시움의 유전적 변형
KR102561863B1 (ko) * 2014-11-19 2023-08-01 바스프 에스이 Imp 데히드로게나아제 활성을 증가시키기 위한 에레모테시움의 유전적 변형
KR102583349B1 (ko) * 2014-11-19 2023-09-26 바스프 에스이 Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형
CN114752610B (zh) * 2022-05-07 2023-08-11 赣南师范大学 柑橘木虱泛素结合酶e2j2基因在防控柑橘黄龙病中的应用
CN115820689B (zh) * 2022-11-30 2023-12-05 上海市农业科学院 一种多基因串联法提高蔬菜中nmn含量的方法及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1066486C (zh) * 1989-06-22 2001-05-30 霍夫曼-拉罗奇有限公司 高产核黄素的细菌菌株
US5650294A (en) 1990-06-25 1997-07-22 Basf Aktiengesellschaft Isolated promoter and terminator of elongation factor 1-α
DE4020181A1 (de) * 1990-06-25 1992-01-02 Basf Ag Neue promotorregion
JP3756180B2 (ja) 1994-03-25 2006-03-15 ビーエーエスエフ アクチェンゲゼルシャフト 真菌類におけるリボフラビン生合成
DE4420785A1 (de) * 1994-03-25 1995-10-05 Basf Ag Riboflavin-Biosynthese in Pilzen

Also Published As

Publication number Publication date
EP1040193A1 (de) 2000-10-04
CA2256052A1 (en) 1999-06-23
US6391603B1 (en) 2002-05-21
CA2315534A1 (en) 1999-07-08
DK1040193T3 (da) 2005-01-03
ATE282699T1 (de) 2004-12-15
CN1149289C (zh) 2004-05-12
KR20010033469A (ko) 2001-04-25
EP1040193B1 (de) 2004-11-17
US6376216B1 (en) 2002-04-23
EP0927761A3 (de) 2001-09-05
CN1283229A (zh) 2001-02-07
JP2002500014A (ja) 2002-01-08
DE59812281D1 (en) 2004-12-23
WO1999033993A1 (de) 1999-07-08
KR19990063322A (ko) 1999-07-26
JPH11243975A (ja) 1999-09-14
ES2232035T3 (es) 2005-05-16
CN1227870A (zh) 1999-09-08
US20030027309A1 (en) 2003-02-06
US6878536B2 (en) 2005-04-12
EP0927761A2 (de) 1999-07-07

Similar Documents

Publication Publication Date Title
CN1140629C (zh) 来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用
CN1198919C (zh) 经过发酵生产l-丝氨酸的方法
CN1155711C (zh) 制备o-乙酰丝氨酸和l-半胱氨酸以及l-半胱氨酸相关产物的方法
CN1117152C (zh) 生产l-赖氨酸的方法
CN1117151C (zh) 真菌中的核黄素生物合成
CN1103819C (zh) α-酮戊二酸脱氢酶基因
CN1187539A (zh) 用于产生l-赖氨酸的方法
CN1187540A (zh) 用于产生l-赖氨酸的方法
CN101044243A (zh) 类异戊二烯的生产方法
CN1384190A (zh) 通过发酵生产l-谷氨酰胺的方法和产生l-谷氨酰胺的细菌
CN1171442A (zh) 生产l-赖氨酸的方法
CN1823162A (zh) 丝氨酸乙酰转移酶突变体和生产l-半胱氨酸的方法
CN1230525C (zh) 生产l-氨基酸的方法和新型基因
CN1317049A (zh) 编码opcA基因的核苷酸序列
CN1177054C (zh) D-山梨醇脱氢酶基因
CN1152955C (zh) 生产蛋白酶的方法
CN101061222A (zh) 编码甲基化儿茶素生物合成酶的基因
CN1536072A (zh) 属于芽孢杆菌属的肌苷生产细菌和生产肌苷的方法
CN1592780A (zh) 产生γ-谷氨酰半胱氨酸的酵母
CN1763200A (zh) 产l-谷氨酸细菌和生产l-谷氨酸的方法
CN1502689A (zh) 生产l-谷氨酰胺的方法和生产l-谷氨酰胺的细菌
CN1661015A (zh) 来自产朊假丝酵母的谷胱甘肽合成酶编码基因
CN1774505A (zh) 含有γ-谷氨酰基半胱氨酸的产朊假丝酵母
CN1558953A (zh) 编码番茄红素环化酶 /八氢番茄红素合酶(carRP)和八氢番茄红素脱氢酶(carB)的三孢布拉霉β-胡萝卜素的生物合成基因
CN1391612A (zh) 来自嗜热棒状杆菌的氨基酸生物合成途径的抗热酶的基因

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee