CN1291232A - 生物素的制备方法 - Google Patents

生物素的制备方法 Download PDF

Info

Publication number
CN1291232A
CN1291232A CN99803153A CN99803153A CN1291232A CN 1291232 A CN1291232 A CN 1291232A CN 99803153 A CN99803153 A CN 99803153A CN 99803153 A CN99803153 A CN 99803153A CN 1291232 A CN1291232 A CN 1291232A
Authority
CN
China
Prior art keywords
ala
leu
gly
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99803153A
Other languages
English (en)
Other versions
CN1210403C (zh
Inventor
H·施勒德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN1291232A publication Critical patent/CN1291232A/zh
Application granted granted Critical
Publication of CN1210403C publication Critical patent/CN1210403C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/185Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
    • C12P17/186Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing a 2-oxo-thieno[3,4-d]imidazol nucleus, e.g. Biotin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明与一种基因构建物有关,该基因构建物包含下列基因:一种具有序列号1的S-腺苷甲硫氨酸合成酶基因;分别具有序列号3、序列号5和序列号7的生物素生物合成基因bioS1、bioS2和/或bioS3;以及在适当场合,至少一种选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的生物素合成基因序列。此外,本发明与含有这种基因构建物的生物和应用这种基团构建制备生物素有关。本发明还与制备生物素的方法有关。

Description

生物素的制备方法
本发明与一种基因构建物有关,该基因构建物含有下列基因:具有序列号1的S-腺苷甲硫氨酸合成酶基因;分别具有序列号3、序列号5和序列号7的生物素生物合成基因bioS1、bioS2和/或bioS3;以及在适当场合,至少一种选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的生物素合成基因序列。此外,本发明与含有这种基因构建物的生物和应用这种基团构建制备生物素有关。本发明还与制备生物素的方法有关。
作为辅酶,生物素(维生素H)在酶催化的羧化和脱羧化反应中起重要作用。因此,生物素是活细胞中的一种不可缺少的成分。几乎所有的动物以及某些微生物必需从外部摄取生物素,因为它们本身不能合成生物素。所以,生物素对这类有机体而言,是一种必需维生素。相反,细菌、酵母和植物自身能从生物素前体合成生物素(Brown等生物技术和遗传工程评论(Biotechno1.Genet.Eng Rev)9,1991:295-326,DeMoll E.,Escherichia coli and Salmonella,eds.Neidhardt,F.C.et al,ASM Press,Washington DC,USA,1996:704-708,ISBN1-55581-084-5)。
有人已对细菌,尤其革蓝氏阴性的大肠(埃希氏杆菌和革蓝氏阳性的圆形芽胞杆菌体内的生物素合成进行了研究(Brown等,生物技术和基因工程评论(Biotechnol.Genet.Eng Rev)9,1991:295~326)。庚二酰辅酶A(PmCoA)来源于脂肪酸合成,迄今是最早知道的大肠杆菌的中间产物(DeMoll E.大肠杆菌和圆形芽胞杆菌(Escherichiacol:and Salmonella)eds.Neidhardt F.C.et al.ASM Press,Washington DC,USA,1996:704-708,ISBN 1-55581-084-5,1996)。直到现在,在大肠杆菌中这种生物素前体得以合成的途径,在很大程度上仍然是未知的(Lemoine等,分子微生物学(Mol.Microbiol.19.1996:645~647)。bioC和bioH已被确认为是二种基因,其相应的蛋白负责Pm-CoA的合成。这种基因产物即BioH和BioH的酶功能至今尚不清楚(Lemoine等分子微生物学(Mol Microbiol)19,1996:645~647;DeMoll E.大肠杆菌和圆形芽胞杆菌(Escherichia coli:and Salmonella)eds.Neidhardt F.C.et al.ASM Press,Washington DC,USA,1996:704-708,ISBN -55581-084-5)。经过4个酶步骤,Pm-CoA转化为生物素。第一步,BioF把Pm-CoA和丙氨酸缩合,形成7-酮-8-氨基壬酸(KAPA)。然后BioA把KAPA转化为7,8二氨基壬酸(DAPA)。在ATP依赖的羧化反应后,下一个步骤产生去巯基生物素(DTB),这一过程由BioD催化。在最后一个步骤中,DTB转化为生物素。在DTB转化为生物素过程中所涉及的化学机制和酶机制日前只是部分地了解和弄清楚。
迄今为止,只有细菌和植物细胞提取物中由DTB转化为生物素的特性已得到描述(WO94/8023、EP-B-0 449 724,Sanyal等,生物化学与生物物理档案(Arch.Biochem.Biophys vol 326,No 1,1996:48-56和生物化学(Biochemistry)33,1994:3625-3631,Baldet等欧洲生物化学杂志(Europ J.Biochem)1,1993:479-485,Wéjean等生化反应物物理进展通讯(Biochem,Biophys.Res.Comun vol 217,No.3,1995:1231~1237,Ohshiro等,生物科学生物技术和生物化学(Biosci.Biotechnol.Biochem)58(9),1994:1738-1741)。
体外试验证明,低分子量生化成分如NADPH,半胱氨酸,硫胺素,Fe2+,天门冬酰胺,丝氨酸,果糖1,6-二磷酸和S-腺苷甲硫氨酸能刺激生物素的合成(Ohshiro等,生物科学生物技术和生物化学(Biosci.Biotechnol.Biochem)58,9,1994:1738-1741,Birch等,生物学和化学杂志(J.Biol Chem)270,32,1995:19158-19165,Ifuku等,生物科学生物技术和生物化学(Biosci.Biotechnol.Biochem)59,2,1995:185~189,Sanyal等,生物化学与生物物理档案(Arch BiochemBiophys)326,1,1996:48-56)。
除这些低分子量生化成分外,现已确认,某些蛋白质在BioB存在下,也可刺激从DTB合成生物素。这些蛋白是黄素氧化还原蛋白和黄素氧化还原蛋白NADPH还原酶(Birch等,生物学和化学杂志(J.BiolChem)270,32,1995:19158~19165,Ifuk等生物科学生物技术和生物化学(Biosci.Biotechnol.Biochem)59,2,1995:185~189,Sanyal等,生物化学与生物物理档案(Arch Biochem Biophys)326,1,1996:48-56)。能刺激生物素合成的其他蛋白还有基因bioS1和bioS2,在专利申请号为197.31274.8(优先权97.7.22)的德国专利申请中对此加以阐述。
关于生物素分子中硫的来源,得到不同的研究结果。对整体细胞抽提物中生物素合成的研究表明,在35S-标记的半胱氨酸存在下,放射性可插入生物素分子中;采用35S-标记的甲硫氨酸或S-腺苷甲硫氨酸时,要证明硫插入生物素分子中是不可能的(Ifuku等,生物科学生物技术和生物化学(Biosci.Biotechnol.Biochem)59,2,1995:184~189,Birch等,生物学和化学杂志(J.Biol Cehm)270,32,1995:19158~19165)。
编码所述蛋白的基因,即bioF,bioA,BioD和bioB被编码于大肠杆菌双向操纵子上,该操纵子位于大肠杆菌染色体上约17分钟处λ连接部位和B基因座之间(Berlyn等,1996:1715~1902。该操纵子上还编码有二个基因,其中之一即bioC,已经报道在pm-CoA的合成中具有功能,而到目前为止,确定位于BioA下游的(DNA)可译框架具有何种功能还是不可能的(WO 94/8023,Otsuka等,生物学和化学杂志(J.Biol Chem).263,1988:19577~19585)。在圆形芽胞杆菌,枯草杆菌,Syneccocystis sp(Brown等,生物技术和基因工程评论(Biotechnol Genet.Eng.Rev)9,1991:295~326,Bower等,细菌学杂志(J Bacteriol)175,1996:4122-4130,Kaneko等,DNARes,3,3,1996:109~136),在古细菌如甲烷球菌,酵母如啤酒酵母菌(Zhang等,生物化学生物物理评论(Arch Biochem Biophys)309,1,1994:29~35)或植物如拟南芥(Arabidopsis thaliana)(Baldet等,C.R.Acad.Sci.Ⅲ,Sci Vie.319,2,1996:99~106)中都已经发现大肠杆菌蛋白BioF,BioA,BioD和BioB的高度保守的同系物。
在迄今为止已研究的二种革兰氏阳性微生物中,Pm-CoA的合成看来以与大肠杆菌不同的方式进行。发现BioH和BioC的任何同系物是不可能的(Brown等,生物技术遗传工程评论(Biotechnol Genet.Eng.Rev)9,1991:295~326)。
生物素是一种具有三个手性中心的光学上活性物质。迄今只是从经济上用昂贵的多步骤化学合成法制备生物素。
作为这种化学合成法的替代方法,人们已作出许多努力建立一种微生物发酵法制备生物素。在已经转化了克隆多拷贝质粒上的生物素操纵子的基因的微生物中已成功地增加了生物素的合成。采用选择birA变异体的方法,来增量调节生物素基因表达,进一步提高生物素合成(Pai.C.H.细菌学杂志(J.Bacteriol)112,1972:1280~1287)。把这二种方法结合起来,即在调控功能不良的菌株(EP-B-0236429)中表达质粒编码的生物合成基因,生物素的合成产量还可进一步提高。在这种情况下,生物素操纵子或仍处于其天然双向启动子(EP-B-0 236 429)的控制下,或在外来启动子(WO 94/08023)的控制下。
到目前为止,这种一直在应用的生产生物素的大肠杆菌发酵法尚未取得任何经济上适当的产率。
本发明的目的之一是要建立一种工业化的,生物素合成产率尽可能高的发酵法来生产生物素。
我们发现,采用根据本发明生产生物素的方法,这一目的能够达到,在该法中,把S-腺苷甲硫氨酸合成酶即SAM合成酶,具有序列号1的为例,至少一个生物索生物合成基因bioS1,bioS2或bioS3分别具有序列号3,5和7的序列及其功能性变异体,类似物或衍生物,在原核生物或真核生物宿主中表达合成生物素,将此生物进行培养,从其生物量分离出所合成的生物素后,或纯化该生物素后,这种生物素可直接应用。
根据本发明的该方法中所用的基因,即SAM合成酶(其序列为序列号1)以及生物素生物合成基因bioS1,bioS2或bioS3(其序列为序列号分别为3,5和7),在访问号码分别为P04384(metk)、U29581(bioS1)、P39171(bioS2)和D90811(bioS3)下,贮存于SwissProt数据库中。在该数据库中,大肠杆菌Metk的许多同系物都有描述。这些同系物包括这样一些生物:其他真细菌(如H.influenzae,枯草杆菌);真核生物(例如,酵母:啤酒酵母菌;植物:P.deltoides;节肢动物:D.melanogaster;哺乳动物:R.norvegicus)。
用下面的方法可使生物素生物合成的产率显著增高:在原核生物或真核生物宿主中表达一个或多个其序列为序列号1的SAM合成酶基因及其功能性变异体、类似物或衍生物,与至少一个生物素合成基因bioS1,bioS2或bioS3(其序列为序列号分别为No 3,No 5和No 7)及其功能性变异体,类似物或衍生物中的结合。SAM合成酶基因与bioS1的结合优先用于表达。至少还有一种选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的生物素基因在同一时间有效地被表达,以进一步提高生物素的合成产率。与没有这些基因的对照相比,这些基因的表达可使生物素的合成量至少增加2倍,最好时增加3倍多。
本发明的生物素制备法中所用的基因,即核苷酸序列序列号为1的SAM合成酶基因,核苷酸序列序列号为3的bioS1基因,核苷酸序列序列号为5的bioS2和核苷酸序列序列号为7的bioS3——这4种核苷酸序列编码的氨基酸序列分别赋予序列号2、序列号4、序列号6和序列号8,或这些基因的等位变种,可以在分离并作(核苷酸)序列分析后获得。这些变种分别被命名为序列号1变种,序列号3变种,序列号5变种和序列号7变种,这些变种在氨基酸水平上显示30%~100%的同源性,优选50%~100%同源性,特别优选80%~100%同源性。特别是这些等位变种包含有功能的变种,后者可通过将核苷酸从序列号1、序列号3、序列号5和序列号7中所描述的核苷酸序列中删除、插入或替代而获得,但酶活性仍然保持。
此外,这些变种也可被理解为某些基因如O-乙酰丝氨酸磺基水解酶A,O-乙酰丝氨酸磺基水解酶B和β-胱硫醚酶(见Flint等,生物学和化学杂志(J Biol Chem)vol 271,1996:16053~16067),或nifs及其原核生物和真核生物同系物——例如从Klebsiella,念珠菌属,酵母或Caenorhabditis提取,可以推测它们是在生物素的合成中具有bioS1,bioS2或bioS3的酶活性——的有功能的同等物。
序列号1、序列号3、序列号5和序列号7的具功能的类似物可理解为-举例-其原核生物或真核生物同系物,例如细菌、霉菌、植物、动物和人同系物。此外,这些类似物也可理解为截短的核苷酸序列,或来源于编码的或非编码的DNA序列的单链DNA或RNA。
这些衍生物可理解为-举例-启动子变种。定位于已知核苷酸序列上游的启动子可通过一个或数个核苷酸的替代,或插入,或删除而加以改变,但不会损害这些启动子的功能性或活性。此外,可通过改变启动子的核苷酸序列提高启动子的活性,或者(原来的)启动子能完全被活性更高的启动子,包括来源于不同种类生物的启动子所代替。
这些衍生物也可理解为是这样的变种:其起始密码子上游-1~-30区域的核苷酸序列已经改变,从而基因的表达和/或蛋白质的表达得到增加。改变SD片段序列这种影响更为明显。
在本发明的生物素制备法中,所有各种革兰氏阴性和革兰氏阳性细菌原则上都适用于用作原核生物的宿主生物。以举例的方式可能提到的革兰氏阴性细菌有:肠道(无芽胞)杆菌科如大肠埃希氏杆菌属,气杆菌属,肠杆菌属,枸橼酸杆菌属(citrobacter),志贺氏杆菌族,克雷白氏杆菌属,沙雷氏菌属,欧文氏菌属或沙门氏菌属;假单胞菌科,如假单胞菌属,黄单胞杆菌属,Burkholderia属,葡萄糖酸杆菌属,亚硝化单胞菌属,硝化菌属,甲烷单毛杆菌属,丛毛单胞菌(Comamonas)属,纤维(单胞)菌属,或醋酸杆菌属;定氮菌科,如定氮菌属,氮杆菌属,Beijerinckia属或Derxia属;奈瑟氏菌科,如摩拉克氏菌属,不动杆菌属(Acinetobacter),Kingella属,奈瑟氏菌属或Branhamella属;根瘤菌科,如根瘤菌属,或植物肥大病菌属,或革兰氏阴性发酵杆菌属,色素杆菌属或产黄菌属。以举例的方式提到的革兰氏阳性细菌有:可形成内孢子的革兰氏阳性的需氧菌或厌氧菌,例如,芽胞杆菌属,孢子乳(酸)杆菌属(Sporolactobaccillus)或梭状芽胞杆菌属;棒状形成菌例如,节杆菌属(Arthrobacter),纤维(单胞)菌属,Curtobacterium,棒状杆菌属,短杆菌属,细纤菌或库尔特氏杆菌属;放线菌目,例如,分枝杆菌属,红球菌属,链霉菌属,或诺卡氏菌属;乳酸杆菌科,例如,乳酸杆菌属,或乳酸球菌属(Lactococus),或革兰氏阳性球菌,例如微球菌属,或葡萄球菌属。
在本发明的生物素制备法中,优先选择使用下列细菌:埃希氏杆菌属,枸橼酸杆菌属,沙雷氏菌属,克雷白氏杆菌属,沙门氏菌属,假单胞菌属,丛毛单胞菌属(Comamonas),不动杆菌属(Acinetobacter),定氮菌属,色素杆菌属,芽胞杆菌属,梭状芽胞杆菌属,节杆菌属,棒状杆菌属,短杆菌属,乳酸球菌属,乳酸杆菌属,链霉菌属,根瘤菌属,土壤杆菌属,葡萄球菌属。特别优先选择下列菌属和菌种:大肠埃希氏杆菌;枸橼酸杆菌属;弗氏柠檬酸杆菌;沙雷氏菌属粘质沙雷氏菌;沙门氏菌属:鼠伤寒沙门氏菌;假单胞菌属:门多隆假单胞菌,绿脓杆菌,可变假单胞菌,绿针假单胞菌,萤光假单胞菌;丛毛单胞菌属:食酸丛毛单胞菌(食酸假单胞菌),睾丸酮丛毛单胞菌;不动杆菌属:乙酸钙不动杆菌;定氮菌属:维涅兰德固氮菌;色素杆菌属:青紫色素杆菌;芽胞杆菌属:枯草芽胞杆菌,球形芽胞杆菌,立体嗜热杆菌,地衣型芽胞杆菌,液化性淀粉杆菌,巨大芽胞杆菌,蜡样芽胞杆菌,苏云金芽胞杆菌;节杆菌属:柠檬节杆菌,石腊节杆菌;棒杆菌属:谷氨酸棒杆菌,Corynebacterium Primorioxydans,Corynebacterium sp.,短杆菌属:酮戊二酸短杆菌,扩展短杆菌,Brevibacterium sp.,链霉菌属:浅青紫链霉菌;根瘤菌属:豌豆根瘤菌;土壤杆菌属:根瘤土壤杆菌(根瘤农杆菌)。尤其优先利用那些已经显示天然生物素生成增多的菌株。
近年来,所列出的上述菌属在分类学上的位置已经发生很大变化,而且随着不正确的菌属和菌种命名得到纠正,还会不断变化。因为在细菌分类系统内,上述的属的分类学重新组合——这种分类学重新组合过去常常是所要求的——,除上述的那些以外的科、属和种也适用于本发明的生物素制备方法。
所有能够合成生物素的生物,如霉菌,酵母,植物或植物细胞,原则上都适于作为本发明的生物素制备方法中的真核生物的宿主生物。可以优先提出的酵母有:红酵母,Yarrowia,掷孢酵母属(Sporobolomyces),酵母属(Saccharomyces),或裂殖酵母属。特别优先选择下列菌属和菌株:深红酵母,红酵母,牧草红酵母;YarrowiaLipolylica,赭色掷孢酵母,Sporobolomyces Shibatanus,酿酒酵母。
特别是所有植物都可作为宿主生物使用,优先选择那些在动物营养和人营养方面起重要作用的植物,例如,谷类,小麦,大麦,黑麦,马铃薯,豌豆,豆,向日葵,棕榈,小米,芝麻,椰子内核,或油菜。像Arabidopsis thaliana或Lavendula vera这样的植物也是适用的。特别优先选择的是植物细胞培养物,植物原生质体或愈伤组织培养物。
能将生物素分泌到培养基中,以及非必需的又已经显示生物素天然合成增加的、像细菌、霉菌、酵母这样一类微生物或植物细胞,应用于本发明的生物素生产方法中是有优点的。占优势的是,这些生物在其生物素生物合成的调控方面也是有缺陷的,即这种合成或者不受调控,或者受调控到非常弱的程度。这种调控缺陷导致这些生物已经具有使生物素生物合成产率明显增加的能力。例如,已知大肠杆菌的这样一种调控缺陷是以birA缺陷突变体形式存在,而且作为一种能被外部影响因素的诱导缺陷型(例如作为一种温度可诱导的缺陷),这种缺陷应优先存在于细胞中。不显示任何天然生物素产生能力的生物,一旦它们已用生物素基因作转化处理,原则上也是可采用的。
为了从整体上进一步提高生物素生物合成产率,本发明的生物素生产方法中还应至少包含一种有用的选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的生物素基因。可取的是,能刺激生物素合成的那些基因也可以与核苷酸序列号1、序列号3、序列号5和序列号7及其组合物组合的方式存在于细胞中,刺激生物素合成的基因的例子有黄素氧还蛋白基因和黄素氧还蛋白还原酶基因。这一附加的基因,或这些附加的基因,像具有序列号1、序列号3、序列号5或序列号7或它们的组合物的基因一样,能够以一个或多个拷贝存在于细胞中。它们能定位于与序列号1、序列号3、序列号5或序列号7一样的载体上,或者定位于不同的载体上,或者被整合到染色体中去。序列号1、序列号3、序列号5和/或序列号7也可以一起定位于一个载体或不同的载体上,或者一起插入基因组中。
按照本发明,基因构建物应被理解为是SAM合成酶基因序列号1的基因序列,是生物素合成基因序列号3、序列号5和/或序列号7以及它们的具功能的变种、类似物或衍生物的基因序列,为了增强基因表达这一目的,这些基因序列在功能上被连接到一个或多个调控信号。除了这些新的调控序列以外,这些基因序列的天然调控还是可以存在于实际的结构基因的上游,而且在适当的场合,可以发生遗传改变,这样天然调控就被关闭,基因表达从而得以增强。但是,这种基因构建物也可以更简单的方式组装,即,没有附加的调控信号插入序列号1、序列号3、序列号5和/或序列号7的上游,而且其天然启动子以及其调控并不除去。实际上,使天然调控序列发生突变,这样生物素引起的调控就不再发生,从而增加基因表达。序列号1、序列号3、序列号5和/或序列号7可处于一个启动子的调控下,或处于不同的启动子的调控下。此外,可利用的调控成分也可以在DNA序列的3'端插入。具有序列号1、序列号3、序列号5或序列号7的基因也可以一种或多种拷贝存在于本发明的基因构建物中。
例如,可利用于本发明的方法的调控序列包括这样一些革兰氏阴性菌的启动子,如cos-,tac-,trp-,tet-,trp-tet-,lpp-,lac-,lpp-lac-,lacIq-,T7-,T5-,T3-,gal-,trc-,ara-,SP6-,λ-PR-或λ-PL-启动子。进一步可利用的调控序列存在于——举例——革兰氏阳性启动子amy和SPO2,酵母启动子ADCl,MFα,AC,P-60,CYCl,GAPDH或真菌启动子CaMV/35S,SSU,OCS,lib4,usp,STLS1,B33或nos,或遍在蛋白启动子或菜豆蛋白启动子中。
像上面提及的启动子一样,所有天然启动子与它们的调控序列一起,原则上都可供本发明的方法使用。此外,合成的启动子也是可使用的。
选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY和bioR的其他生物素基因可以一个或多个拷贝形式存在于基因构建物中,这些基因可以有自己的启动子,不然的话可处于序列号1、序列号3、序列号5或序列号7诸序列中一个序列的启动子的调控之下,或处于所有这些序列的启动子的调控之下。
为了在前面提到的宿主生物中表达,把该基因构建物便利地插入到宿主特异的载体中,这种载体使得该基因在宿主中达到最佳表达成为可能。这些载体为本领域人员所熟知,并能从——举例——“无性繁殖载体”(Pouwels PH等编,Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)一书中得到确认。除质粒外,这些载体也被理解为本领域技术人员所知的所有其他载体,例如,噬菌体,病毒,转座子,IS因子,噬粒,柯斯质粒,线形或环形DNA。这些载体可在宿主生物中自动复制,或由染色体复制。
表达系统应被理解为是前面以举例的方式提及的宿主生物与适于这些生物的载体(例如质粒、病毒或噬菌体)的组合,例如,含有RNA多聚酶/启动子系统、噬菌体λ或Mu或其他温和噬菌体和/或其他可利用的调控序列的质粒。
术语表达系统应优先理解为是大肠埃希氏杆菌及其质粒的结合,噬菌体和附属启动子的结合,以及棒状杆菌及其质粒和启动子的结合。
根据本发明,3'和/或5'端调控序列也适于有效地表达序列号1、序列号3、序列号5和/或序列号7。
这些调控序列被打算用来使生物素基因,以及使生物素蛋白特异表达成为可能。这就意味着,取决于宿主生物(种类),在诱导后只有一种基因得到表达或过表达,或意味着这种基因立即表达或过表达。
在这种情况下,这些调控序列或调控因子可优选正面影响生物素基因表达,从而增高合成产率。例如,通过采用强转录信号(如启动子和/或增强子)的方法,这些调控成分能够在转录水平上有效地得到增强。但是,通过改善mRNA的稳定性来增强转译也是可能的。
增强子应被理解为——举例——通过改善RNA多聚酶和DNA之间相互作用而引起生物素表达增强的DNA序列。
采用经典的致突变方法,例如UV照射,或用化学致突变剂处理,和/或用特异的致突变方法,如定点突变、删除、插入和/或替代,通过改变相应的基因序列,或其同系物的序列,就能实现从序列号1、序列号3、序列号5和序列号7衍生的蛋白质(见序列号2、序列号4、序列号6和序列号8)和其酶活性的增高(与起始酶相比较而言)。除所述的基因扩增法以外,通过消除阻遏酶生物合成的因子,和/或合成活性酶而不是无活性酶,也能实现酶活性的增高。
本发明的生物素生产方法,通过采用下列生物素基因,有效地提高由DTB到生物素的转化率,从而有效地提高生物素的总产率:具有序列号1、序列号3、序列号5和序列号7的生物素基因;具有序列号1和序列号5,或序列号1和序列号7的基因的组合,优选具有序列号1和序列号3的基因的组合,把该组合基因借助于其载体和/或借助于染色体克隆,导入生物体中。
在本发明的方法中,把含有序列号1、序列号3、序列号5和/或序列号7的微生物置于能使这些生物生长的培养质中繁殖。这种培养基可以是合成的培养基,也可以是天然培养基。使用本领域技术人员所熟知并适合于这种微生物的培养基。为了使这种微生物生长,所采用的培养基含有碳源,氮源,无机盐以及在适当的场合,含有少量维生素和微量元素。
可利用的碳源的举例有:糖类如单糖、双糖或多糖,例如葡萄糖、果糖、甘露糖,木糖,半乳糖,核糖、山梨糖、核酮糖,乳糖,麦芽糖,蔗糖,棉子糖,淀粉或纤维素;复合糖来源如糖蜜;糖磷酸酯如果糖1,6-二磷酸;糖醇如甘露醇;多元醇如甘油;醇类如甲醇或乙醇;羧酸如枸橼酸,乳酸或醋酸;脂肪如大豆油、菜子油;氨基酸如谷氨酸或天门冬氨酸;或氨基糖,这些可同时用作一种氮源。
可利用的氮源有有机氮化合物或无机氮化合物,或含有这些化合物的材料。举例;氨盐如NH4Cl或(NH4)2SO4,硝酸盐或尿素;或复合氮源如玉米浆浸出液,Brewer's酵母自溶物,大豆花,小麦面筋,酵母提取物,肉提取物,干酪素水解物,或者酵母蛋白或马铃薯蛋白,这些常常也可以同时用作一种氮源。
无机盐的例子有钙盐、镁盐、钠盐、锰盐、钾盐、锌盐、铜盐和铁盐。将要特别被提及的这些盐的阴离子有氯离子、硫酸根离子和磷酸根离子。在本发明的方法中提高生物素产率的一个重要因素是Fe2+或Fe3+盐和/或钾盐加到生产培养基中。
在适当的场合,其他生长要素如维生素或生长促进剂,例如核黄素,硫胺素,叶酸,尼克酸,泛酸盐或吡哆醛;氨基酸如丙氨酸,半胱氨酸,门冬酰胺,天门冬氨酸,谷氨酰胺,丝氨酸,甲硫氨酸或赖氨酸;羧酸如枸橼酸,甲酸,庚二酸或乳酸,或像二巯基丙醇这样的物质,被加进营养培养基中。
为了稳定细胞中含生物素基因的载体,在适当的场合,抗菌素也可以加到培养基中。
上述营养成份混合的比例取决于发酵的性质,并根据不同情况制定。各种培养基成份在已经分开或集中消毒(如果有必要)后,可在发酵开始时全部投入,否则在发酵期间,根据需要,陆续投放。
培养条件如此安排是为了生物体在最佳条件下生长,获得尽可能高的产率。优选的培养条件为15℃~40℃。温度25℃~37℃之间尤其适宜。pH值优选地保持在3~9的范围内。一般来说,温育周期8~240h,优选的温育周期8~120h是足够的。在这一时间段内,培养基中积聚的生物素量最多,而且(或)在细胞破坏后可以收获。
根据本发明的生产生物素的这一方法,可以连续进行,或分批进行,或以分批给料的方式进行。如果要从已用这些生物素基因转化的植物细胞中再生全部植物(细胞),根据本发明的这一方法,它们可以完全正常地生长和繁殖。
实施例
1.S-腺苷甲硫氨酸合成酶基因(序列号1)的克隆
以大肠杆菌DNA基因组为出发材料,用二种特异的衍生于大肠杆菌基因组的寡核苷酸,通过多聚酶链反应(PCA),使编码SAM合成酶的基因(metk)从大肠杆菌染色体得到扩增。把已用这种方法扩增的DNA纯化,用限制酶Acc65Ⅰ消化后插入载体,该载体已用相同的酶作过切割,并能使该基因在大肠杆菌株中过表达。借助于二种寡核苷酸中的一种,将最佳的翻译信号提供给该基因构建物。
a)、用于从大肠杆菌染色体扩增metk基因的寡核苷酸的产生:
emtk作为表达盒由核糖核蛋白体结合位点、编码序列的起始密码子和二种限制酶识别位点之间的终止密码子组成,扩增Metk。选择Acc65Ⅰ识别序列用于这二种识别位点。用核苷酸Pmetk1(5'-GCGGTACCAGGTGATATTAAATATGGCAAAAC-3')和Pmetk2(5'-CGGGTACCGATTACTTCAGACCGGCAGC-3')扩增并克隆metk基因。
b)PCA操作:
条件:
从大肠杆菌W3110提取的染色体DNA 0.5μg用作模板。寡核苷酸Pmetk1和Pmetk2在各自浓度为15pMol条件下使用。dNTPs的浓度为200μM。2.5U Pwo DNA多聚酶(德国Boehringer Mannbeim公司)(置于厂家提供的反应缓冲液中)用作多聚酶。PCA反应体积为100μl。
扩增:
DNA置于94℃2min作变性处理,然后将寡核苷酸置55℃ 30S作退火处理。在72℃ 75S条件下发生延伸。PCA反应进行30个循环。
所产生的约1145个碱性对的DNA产物加以纯化并用Acc65Ⅰ在适当的缓冲中液中作消化处理。
c)在表达载体中metk的克隆
用Acc65Ⅰ消化2μg载体pHS1(构建方法在专利申请DE197.31274.8,优先权22.7.97,举例1,14~17页有叙述),并用Shrimp碱性磷酸酯(SAP)(Boehringer Mannheim公司)作去磷酰化处理。在SAP已作过变性处理后采用快速DAN连接试剂盒,按照厂家的使用说明书,以1∶3克分子比,把载体和片段连接起来。将连接混合物转化到大肠杆菌XL-1-blue株中,借助质粒制备和限制作用分析鉴定阳性克隆。采用限制消化和序列分析鉴定pHS1中metk片段的正确定向。产生的基因构建物称为pHSI metk(图1)。pHS1 metk的核苷酸序列在序列号9中给出。序列号10显示从metk编码区域推断出来的氨基酸序列。
2.质粒pHBbio14和pHS1bioS1的构建
质粒pHBbio14和pHS1 bioS1的构建已作过构建(DE 197.31274.8,优先权22.7.97,实施例1,2和5),
3.pHS1 metk bioS1的构建
质粒pHS1 bioS1〔序列号11(DE 197.31274.8,优先权22.7.97)和序列号12显示由bioS1编码区域推断出来的氨基酸序列〕和pHS1metk(序列号9)用质粒制备法(Boehringer)加以纯化。采用Acc65Ⅰ消化法将携带pHS1基因的片段从pHS1 metk分离出来。pHS1 bioS1用Acc65I加以消化并用Shrimp碱性磷酸酶(SAP)(BoehringerMannheim公司)作去磷酰化处理。根据厂家的说明书,将SAP作变性处理后,用快速DNA连接试剂盒,按照厂家的说明书,以1∶3的克分子比,把载体和metk片段加以连接。把连接混合物转化到大肠杆菌XL-1-blue株中。用质粒制备和限制作用分析鉴定阳性克隆。采用限制消化和序列分析法鉴定pHS1 metk中metk片段的正确方向。产生的基因构建物称为pHS1 metk bioS1(图2)。pHS1 metkbioS1的核苷酸序列在序列号13中列出。序列号14显示从metk编码区域推导出来的氨基酸序列。序列号15显示从bioS1编码区域推断出来的氨基酸序列。
4.通过过表达metk、bioS1以及metk与bioS1的组合,提高生物素产率。
采用在利福霉素平板上铺板的方法,将自发的利福霉素抗性菌落从BM4086株中分离(Ketner和Campbell,分子生物学杂志(J.Molec.Biology)1975,96:13)。从这些抗性株中的一种菌株中制备PI胞溶产物。用PI胞溶产物转导W3110株,接着用利福霉素选择克隆。产生的菌株采用CaCl2法以质粒pHBbiol4作转化处理(Maniatis等,分子克隆(Molecular Cloning),cold Spring Harbour LaboratoryPress 1989),并在含100μg氨苄青霉素/ml的LB(琼脂)上生长。经过分离和转化处理的菌株(LU5560)在各自情况下采用CaCl2法,以质粒pHS1,pHS1 metk,pHS1 bioS1或pHS1 metk bioS1作转化处理,并在含氨苄青霉素(100μg/ml)和卡那霉素(25μg/ml)LB琼脂上进行选择。
在各自情况下,从每一转化菌株选取的一个菌落接种到含适量抗菌素的DYT培养基中,温育12h。该过夜培养基(=ONC)用于接种10mlTB培养基培养物(Sambrook,J.Fritsch,E.F.Maniatis,T.2nd ed.CordSpring Harbor Laboratory Press.,1989 ISBN 0-87969-373-8),该培养基含甘油(30g/L)和适量的抗菌素。在存在质粒pHS1,pHS1 metk,pHS1 bioS1和pHS1 metk bioS1的情况下,为了分别诱导metk和bioS1基因的表达或诱导这二种基因结合物的表达,在培养基中同时加入1mM IPTG和0.5%阿拉伯糖。24h后,用离心法从培养物上清液中分离出菌细胞。采用使用链霉亲合素的竞争性ELISA法测定上清液中生物素浓度。这种测定的结果列于表Ⅰ。
表Ⅰ:生物素浓度的测定
菌株 质粒Ⅰ 质粒Ⅱ 生物素(mg/l)
LU5580 pHBbio14 对照,无质粒 11
LU5580 pHBbio14 pHS1 25
LU5580 pHBbio14 pHS1 bioS1 45
LU5580 pHBbio14 pHS1 metk 37
LU5580 pHBbio14 pHS1 metk bioS1 52
序列明细表(1)一般资料
(ⅰ)申请者:
  (A)名称:BASF Aktiengesellschaft
  (B)街道:Karl Bosch Strasse
  (C)城市:Ludwigshafen
  (D)联邦州:Rheinland-Pfalz
  (E)国家:德国
  (F)邮编:67056
(ⅱ)专利申请名称:生物素的制备方法
(ⅲ)序列图数目:15个
(ⅳ)计算机可读方式:
  (A)介质类型:软盘
  (B)计算机:IBMPC兼容机
  (C)操作系统:PC-DOS/MS-DOS
  (D)软件:PatentIn Release#1.0,Version#1.25(EPO)(2)序列        号1的资料
(ⅰ)序列特征:
  (A)长度:1155个碱基对
  (B)类型:核苷酸
  (C)STRANDEDNESS:Single
  (D)拓扑学:线性
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义:无
(ⅵ)起始来源:
  (B)菌株:大肠杆菌
(ⅶ)直接来源:
  (B)克隆:metk
(ⅸ)特征:
  (A)名称/索引:CDS
  (B)定位:1..1155
(ⅹⅰ)序列描述:序列号:1atg gca aaa cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct   48Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1                 5                  10                  15gac aaa att gct gac caa att tct gat gcc gtt tta gac gcg atc ctc   96Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20                  25                  30gaa cag gat ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc   144Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35                  40                  45ggc atg gtt tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac   192Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50                  55                  60atc gaa gag atc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat   240Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65                  70                  75                  80tcc gac atg ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc   288Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85                  90                  95ggc aaa cag tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg   336Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro            100                 105                 110ctg gaa cag ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act   384Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115                 120                 125aat gaa acc gac gtg ctg atg cca gca cct atc acc tat gca cac cgt   432Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130                 135                 140ctg gta cag cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg   480Leu Val Gln Arg Gln Ala Glu Val Arg Lys Ash Gly Thr Leu Pro Trp145                 150                 155                 160ctg cgc ccg gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc   528Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165                 170                 175aaa atc gtt ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa   576Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180                 185                 190gag atc gac cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc   624Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195                 200                 205aag cca att ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc   672Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210                 215                 220atc aac ccg acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc   720Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225                 230                 235                 240ggt ctg act ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg   768Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245                 250                 255cgt cac ggt ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac   816Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260                 265                 270cgt tcc gca gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct   864Arg Ser Ala Ala Tyr Ala Ala Arg Tyr val Ala Lys Asn Ile Val Ala275                 280                 285gct ggc ctg gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc   912Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290                 295                 300gtg gct gaa ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa   960Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305                 310                 315                 320gtg cct tct gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg   1008Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325                 330                 335cgc cca tac ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac   1056Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340                 345                 350aaa gaa acc gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg   1104Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355                 360                 365gaa aaa acc gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag   1152Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370                 375                 380taa                                                               1155385(2)序列号2的资料:
(ⅰ)序列特性
  (A)长度:384个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅵ)序列描述:序列号:2Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1                 5                 10                   15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala val Leu Asp Ala Ile Leu20                  25                  30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35                  40                  45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50                  55                  60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65                   70                  75                  80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85                  90                  95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100                 105                 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115                 120                 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130                 135                 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145                 150                 155                 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165                 170                 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180                 185                 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195                 200                 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210                 215                 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225                 230                 235                 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245                 250                 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260                 265                 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275                 280                 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290                 295                 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Giy Thr Glu Lys305                 310                 315                 320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325                 330                 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340                 345                 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355                 360                 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370                 375                 380(2)序列号3的资料:
(ⅰ)序列特性
  (A)长度:1206个碱基对
  (B)类型:核苷酸
  (C)STRANDEDNESS:Single
  (D)拓扑学:线性
(ⅱ)分子类型:基因组
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅵ)起始来源:
  (B)菌株:大肠杆菌
(ⅵ)直接来源:
  (B)克隆:bioSl
(ⅸ)特征:
  (A)名称/索引:CDS
 (B)定位:1..1206
(ⅹⅰ)序列描述:序列号:3:atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca cta   48Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1               5                  10                  15cag gat gcg ggc gtc tat ctc gac agc gcc gcg acc gcg ctt aaa cct   96Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20                  25                  30gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg agc gcc gga   144Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35                  40                  45aac gtc cat cgc agc cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt   192Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50                  55                  60tat gaa gct gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat   240Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65                  70                  75                  80gat aaa act atc gtc tgg acg cgc ggc acc act gaa tcc atc aac atg   288Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85                  90                  95gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att   336Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100                 105                 110att gtc agc gtg gca gaa cac cac gcc aac ctc gtc ccc tgg ctg atg   384Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115                 120                 125gtc gcc caa caa act gga gcc aaa gtg gtg aaa ttg ccg ctt aat gcg   432Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130                 135                 140cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt   480Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145                 150                 155                 160agt cgg att ctg gcg ttg ggt cag atg tcg aac gtt act ggc ggt tgc   528Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165                 170                 175ccg gat ctg gcg cga gcg att acc ttt gct cat tca gcc ggg atg gtg   576Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180                 185                 190gtg atg gtt gat ggt gct cag ggg gca gtg cat ttc ccc gcg gat gtt   624Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195                 200                 205cag caa ctg gat att gat ttc tat gct ttt tca ggt cac aaa ctg tat   672Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210                 215                 220ggc ccg aca ggt atc ggc gtg ctg tat ggt aaa tca gaa ctg ctg gag   720Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Gln225                 230                 235                 240gcg atg tcg ccc tgg ctg ggc ggc ggc aaa atg gtt cac gaa gtg agt   768Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245                 250                 255ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa gct gga   816Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260                 265                 270acg cca aat gtc gct ggt gtc ata gga tta agc gcg gcg ctg gaa tgg   864Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275                 280                 285ctg gca gat tac gat atc aac cag gcc gaa agc tgg agc cgt agc tta   912Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290                 295                 300gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tca   960Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305                 310                 315                 320ttc cgc tgc cag gat tcc agc ctg ctg gcc ttt gat ttt gct ggc gtt   1008Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325                 330                 335cat cat agc gat atg gtg acg ctg ctg gcg gag tac ggt att gcc ctg   1056His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340                 345                 350cgg gcc ggg cag cat tgc gct cag ccg cta ctg gca gaa tta ggc gta   1104Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355                 360                 365acc ggc aca ctg cgc gcc tct ttt gcg cca tat aat aca aag agt gat   1152Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370                 375                 380gtg gat gcg ctg gtg aat gcc gtt gac cgc gcg ctg gaa tta ttg gtg   1200Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385                 390                 395                 400gat taa                                                           1206Asp(2)序列号4的资料:
(ⅰ)序列特性
  (A)长度:401个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:4Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1               5                  10                  15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20                  25                  30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35                  40                  45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50                  55                  60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65                  70                  75                  80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85                  90                  95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100                 105                 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115                 120                 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130                 135                 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145                 150                 155                 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165                 170                 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180                 185                 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195                 200                 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210                 215                 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225                 230                 235                 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245                 250                 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260                 265                 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275                 280                 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290                 295                 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305                 310                 315                 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325                 330                 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340                 345                 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355                 360                 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370                 375                 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385                 390                 395                 400Asp(2)序列号5的资料:
(ⅰ)序列特性
  (A)长度:1215个碱基对
  (B)类型:核苷酸
  (C)STRANDEDNESS:Single
  (D)拓扑学:线性
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅵ)起始来源:
  (B)菌株:大肠杆菌
(ⅶ)直接来源:
  (B)克隆:bioS2
(ⅸ)特征:
  (B)名称/索引:CDS
  (B)定位:1..1215(ⅹⅰ)序列描述:序列号:5:atg aaa tta ccg att tat ctc gac tac tcc gca acc acg ccg gtg gac   48Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1               5                  10                  15ccg cgt gtt gcc gag aaa atg atg cag ttt atg acg atg gac gga acc    96Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20                  25                  30ttt ggt aac ccg gcc tcc cgt tct cac cgt ttc ggc tgg cag gct gaa   144Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35                  40                  45gaa gcg gta gat atc gcc cgt aat cag att gcc gat ctg gtc ggc gct   192Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50                  55                  60gat ccg cgt gaa atc gtc ttt acc tct ggt gca acc gaa tct gac aac   240Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65                  70                  75                  80ctg gcg atc aaa ggt gca gcc aac ttt tat cag aaa aaa ggc aag cac   288Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85                  90                  95atc arc acc agc aaa acc gaa cac aaa gcg gta ctg gat acc tgc cgt   336Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100                 105                 110cag ctg gag cgc gaa ggt ttt gaa gtc acc tac ctg gca ccg cag cgt   384Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115                 120                 125aac ggc att atc gac ctg aaa gaa ctt gaa gca gcg atg cgt gac gac   432Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130                 135                 140acc atc ctc gtg tcc atc atg cac gta aat aac gaa atc ggc gtg gtg   480Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly VaI Val145                 150                 155                 160cag gat atc gcg gct atc ggc gaa atg tgc cgt gct cgt ggc att atc   528Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165                 170                 175tat cac gtt gat gca acc cag agc gtg ggt aaa ctg cct atc gac ctg   576Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu            180                 185                 190agc cag ttg aaa gtt gac ctg atg tct ttc tcc ggt cac aaa atc tat   624ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195                 200                 205ggc ccg aaa ggt atc ggt gcg ctg tat gta cgt cgt aaa ccg cgc gta   672Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210                 215                 220cgc atc gaa gcg caa atg cac ggc ggc ggt cac gag cgc ggt atg cgt   720Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225                 230                 235                 240tcc ggc act ctg cct gtt cac cag atc gtc gga atg ggc gag gcc tat   768Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr245                 250                 255cgc atc gca aaa gaa gag atg gcg acc gag atg gaa cgt ctg cgc ggc   816Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260                 265                 270ctg cgt aac cgt ctg tgg aac ggc atc aaa gat atc gaa gaa gtt tac   864Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275                 280                 285ctg aac ggt gac ctg gaa cac ggt gcg ccg aac att ctc aac gtc agc   912Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290                 295                 300ttc aac tac gtt gaa ggt gag tcg ctg att atg gcg ctg aaa gac ctc   960Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305                 310                 315                 320gca gtt tct tca ggt tcc gcc tgt acg tca gca agc ctc gaa ccg tcc   1008Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325                 330                 335tac gtg ctg cgc gcg ctg ggg ctg aac gac gag ctg gca cat agc tct   1056Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340                 345                 350atc cgt ttc tct tta ggt cgt ttt act act gaa gaa gag atc gac tac   1104Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355                 360                 365acc atc gag tta gtt cgt aaa tcc atc ggt cgt ctg cgt gac ctt tct   1152Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370                 375                 380ccg ctg tgg gaa atg tac aag cag ggc gtg gat ctg aac agc atc gaa   1200Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385                 390                 395                 400tgg gct cat cat taa                                                   1215Trp Ala His His405(2)序列号6的资料:
(ⅰ)序列特性
  (A)长度:404个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:6Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1               5                  10                  15Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20                  25                  30Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35                  40                  45Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50                  55                  60Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65                   70                  75                  80Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85                  90                  95Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100                 105                 110Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115                 120                 125Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130                 135                 140Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val145                 150                 155                 160Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165                 170                 175Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ila Asp Leu180                 185                 190Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195                 200                 205Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210                 215                 220Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225                 230                 235                 240Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met G1y Glu Ala Tyr245                 250                 255Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260                 265                 270Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275                 280                 285Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290                 295                 300Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305                 310                 315                 320Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325                 330                 335Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340                 345                 350Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355                 360                 365Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370                 375                 380Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385                 390                 395                 400Trp Ala His His(2)序列号7的资料:
(ⅰ)序列特性
  (A)长度:1221个碱基对
  (B)类型:核苷酸
  (C)STRANDEDNESS:Single
  (D)拓扑学:线性
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅵ)起始来源:
  (B)菌株:大肠杆菌
(ⅶ)直接来源:
  (B)克隆:bioS3
(ⅸ)特征:
  (C)名称/索引:CDS
(B)定位:1..1221
(ⅹⅰ)序列描述:序列号:7:atg att ttt tcc gtc gac aaa gtg cgg gcc gac ttt ccg gtg ctt tcg   48Met Ile Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser1               5                  10                  15cgt gag gta aac ggt ttg ccg ctg gct tat ctc gac agc gcc gcc agt   96Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser20                  25                  30gcg cag aaa ccg agc cag gtg att gac gcc gag gcc gag ttt tat cgt   144Ala Gln Lys Pro Ser Gln Val Ile Asp Ala Glu Ala Glu Phe Tyr Arg35                  40                  45cat ggc tac gcg gcg gtg cat cgt ggt att cat acc tta agc gcc cag   192His Gly Tyr Ala Ala Val His Arg Gly Ile His Thr Leu Ser Ala Gln50                  55                  60gcg acc gag aaa atg gag aac gtg cgc aag cgg gca tcg ctg ttt att   240Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe Ile65                  70                  75                  80aat gcc cgt tcg gcg gaa gag ctg gtg ttc gtc cgc ggc acg acg gaa    288Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu85                  90                  95ggg atc aat ctg gtc gcc aat agc tgg ggc aac agc aac gtg cgg gcg   336Gly Ile Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala100                 105                 110ggc gat aac atc atc atc agt cag atg gag cac cac gct aac att gtt   384Gly Asp Asn Ile Ile Ile Ser Gln Met Glu His His Ala Asn Ile Val115                 120                 125ccc tgg cag atg ctt tgc gca cgc gtt ggc gca gag ctg cgt gtg atc   432Pro Trp Gln Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val Ile130                 135                 140ccg ctc aat ccc gat ggt acg ttg caa ctg gag acg ctg cct acg ctg   480Pro Leu Asn Pro Asp Gly Thr Leu Gln Leu Glu Thr Leu Pro Thr Leu145                 150                 155                 160ttt gat gag aaa act cgc ctg ctg gca att act cat gtc tcc aac gtg   528Phe Asp Glu Lys Thr Arg Leu Leu Ala Ile Thr His Val Ser Asn Val165                 170                 175ctt ggc aca gaa aat cca ctg gcg gaa atg atc acg ctt gcg cac cag   576Leu Gly Thr Glu Asn Pro Leu Ala Glu Met Ile Thr Leu Ala His Gln180                 185                 190cat ggc gca aaa gtg ctg gtg gat ggc gct cag gcg gtg atg cat cat   624His Gly Ala Lys Val Leu Val Asp Gly Ala Gln Ala Val Met His His195                 200                 205ccg gtg gat gtt cag gcg ctg gat tgc gac ttt tac gtg ttc tcc ggg   672Pro Val Asp Val Gln Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly210                 215                 220cat aaa ctg tat ggc ccc acc gga att ggc att ctt tat gtg aaa gaa   720His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Ile Leu Tyr Val Lys Glu225                 230                 235                 240gcc ttg ttg cag gag atg ccg ccg tgg gaa ggg ggc ggt tct atg atc   768Ala Leu Leu Gln Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met Ile245                 250                 255gcc acc gtc agc ctg agt gaa ggc act acc tgg acc aaa gca cca tgg   816Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp260                 265                 270cgg ttt gaa gcc ggt aca ccc aat acc ggg ggc atc att ggt ctt ggc   864Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly Ile Ile Gly Leu Gly275                 280                 285gcg gcg ctg gag tat gtt tcg gcg ctg ggg ctt aat aac ata gcc gag   912Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Ash Ash Ile Ala Glu290                 295                 300tat gaa cag aat ctg atg cat tat gcg cta tca cag ctg gaa tct gta   960Tyr Glu Gln Asn Leu Met His Tyr Ala Leu Ser Gln Leu Glu Ser Val305                 310                 315                 320ccg gat ctc act ctc tat ggc cca caa aac agg ctt ggc gtt att gct   1008Pro Asp Leu Thr Leu Tyr Gly Pro Gln Asn Arg Leu Gly Val Ile Ala325                 330                 335ttt aat ctc ggt aaa cac cac gcc tat gat gtt ggc agt ttt ctc gat   1056Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp340                 345                 350aat tac ggc att gct gtg cgt acc gga cat cac tgc gca atg cca ttg   1104Asn Tyr Gly Ile Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu355                 360                 365atg gcc tat tac aac gtc cct gcg atg tgt cgg gcg tcg ctg gcc atg   1152Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met370                 375                 380tat aac acc cat gaa gaa gtg gat cgt ctg gtg acc ggc ctg caa cgt   1200Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gln Arg385                 390                 395                 400att cac cgt ttg ctg gga taa                                               1221Ile His Arg Leu Leu Gly(2)序列号8的资料:
(ⅰ)序列特性
  (A)长度:406个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:8Met Ile Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser1               5                  10                  15Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser20                  25                  30Ala Gln Lys Pro Ser Gln Val Ile Asp Ala Glu Ala Glu Phe Tyr Arg35                  40                  45His Gly Tyr Ala Ala Val His Arg Gly Ile His Thr Leu Ser Ala Gln50                  55                  60Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe Ile65                  70                  75                  80Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu85                  90                  95Gly Ile Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala100                 105                 110Gly Asp Asn Ile Ile Ile Ser Gln Met Glu His His Ala Asn Ile Val115                 120                 125Pro Trp Gln Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val Ile130                 135                 140Pro Leu Asn Pro Asp Gly Thr Leu Gln Leu Glu Thr Leu Pro Thr Leu145                 150                 155                 160Phe Asp Glu Lys Thr Arg Leu Leu Ala Ile Thr His Val Ser Asn Val165                 170                 175Leu Gly Thr Glu Asn Pro Leu Ala Glu Met Ile Thr Leu Ala His Gln180                 185                 190His Gly Ala Lys Val Leu Val Asp Gly Ala Gln Ala Val Met His His195                 200                 205Pro Val Asp Val Gln Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly210                 215                 220His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Ile Leu Tyr Val Lys Glu225                 230                 235                 240Ala Leu Leu Gln Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met Ile245                 250                 255Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp260                 265                 270Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly Ile Ile Gly Leu Gly275                 280                 285Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn Ile Ala Glu290                 295                 300Tyr Glu Gln Asn Leu Met His Tyr Ala Leu Ser Gln Leu Glu Ser Val305                 310                 315                 320Pro Asp Leu Thr Leu Tyr Gly Pro Gln Asn Arg Leu G1y Val Ile Ala325                 330                 335Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp340                 345                 350Asn Tyr Gly Ile Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu355                 360                 365Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met370                 375                 380Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gln Arg385                 390                 395                 400Ile His Arg Leu Leu Gly405(2)序列号9的资料:
(ⅰ)序列特性
  (A)长度:3720个碱基对
  (B)类型:核苷酸
  (C)STRANDEDNESS:Single
  (D)拓扑学:线性
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅶ)直接来源:
  (B)克隆:pHS1 metk
(ⅸ)特征:
  (D)名称/索引:CDS
  (B)定位:530..1684
(ⅹⅰ)序列描述:序列号:9:gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac caaagaggag aaattaact atg gca aaa 538Met Ala Lys1cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct gac aaa att   586His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys Ile5                  10                  15gct gac caa att tct gat gcc gtt tta gac gcg atc ctc gaa cag gat   634Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu Glu Gln Asp20                  25                  30                  35ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc ggc atg gtt   682Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val40                  45                  50tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac atc gaa gag   730Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp Ile Glu Glu55                  60                  65arc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tcc gac atg   778Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His Ser Asp Met70                  75                  80ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc ggc aaa cag   826Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile Gly Lys Gln85                  90                  95tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg ctg gaa cag   874Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro Leu Glu Gln100                 105                 110                 115ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act aat gaa acc   922Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr120                 125                 130gac gtg ctg atg cca gca cct atc acc tat gca cac cgt ctg gta cag    970Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg Leu Val Gln135                 140                 145cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg   1018Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro150                 155                 160gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc aaa atc gtt   1066Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly Lys Ile Val165                 170                 175ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa gag atc gac   1114Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu Glu Ile Asp180                 185                 190                 195cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc aag cca att   1162Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile Lys Pro Ile200                 205                 210ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc atc aac ccg   1210Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe Ile Asn Pro215                 220                 225acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc ggt ctg act   1258Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys Gly Leu Thr230                 235                 240ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg cgt cac ggt   1306Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly245                 250                 255ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac cgt tcc gca   1354Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala260                 265                 270                 275gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct gct ggc ctg   1402Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala Ala Gly Leu280                 285                 290gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc gtg gct gaa   1450Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly Val Ala Glu295                 300                 305ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa gtg cct tct   1498Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser310                 315                 320gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac   1546Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr325                 330                 335ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac aaa gaa acc   1594Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr Lys Glu Thr340                 345                 350                 355gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc   1642Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr360                 365                 370gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag taa            1684Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys375                 380                 385tcggtaccgc ttgatatcga attcctgcag cccgggggat cccatggtac gcgtgctaga 1744ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 1804tgtcggtgaa cgctctcctg agtaggacaa atccgccgcc ctagacctag gggatatatt 1864ccgcttcctc gctcactgac tcgctacgct cggtcgttcg actgcggcga gcggaaatgg 1924cttacgaacg gggcggagat ttcctggaag atgccaggaa gatacttaac agggaagtga 1984gagggccgcg gcaaagccgt ttttccatag gctccgcccc cctgacaagc atcacgaaat 2044ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 2104ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 2164gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2224gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 2284gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 2344ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2404aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 2464gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2524attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2584tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2644aagttgttac tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagcgtt 2704ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag gagtccaagc 2764gagctctcga accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga 2824tgcgctgcga atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc 2884cgccaagctc ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca 2944cacccagccg gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg 3004gcaagcaggc atcgccatgg gtcacgacga gatcctcgcc gtcgggcatg cgcgccttga 3064gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat 3124cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt 3184cgaatgggca ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg 3244atactttctc ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca 3304atagcagcca gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc 3364ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg 3424acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg 3484catcagagca gccgattgtc tggtgtgccc agtcatagcc gaatagcctc tccacccaag 3544cggccggaga acctgcgtgc aatccatctt gttcaatcat gcgaaacgat cctcatcctg 3604tctcttgatc agatcttgat cccctgcgcc atcagatcct tggcggcaag aaagccatcc 3664agtttacttt gcagggcttc ccaaccttac cagagggcgc cccagctggc aattcc     3720(2)序列号10的资料:
(ⅰ)序列特性
  (A)长度:384个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:10Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1               5                  10                  15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20                  25                  30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr val Lys Thr35                  40                  45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50                  55                  60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65                  70                  75                  80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85                  90                  95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100                 105                 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115                 120                 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130                 135                 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145                 150                 155                 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165                 170                 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180                 185                 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195                 200                 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210                 215                 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225                 230                 235                 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245                 250                 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260                 265                 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275                 280                 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290                 295                 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305                     310                 315             320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325                 330                 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340                 345                 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355                 360                 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370                 375                 380(2)序列号11的资料:
(ⅰ)序列特性
  (A)长度:3794个碱基对
  (B)类型:核苷酸
  (C)链绞合:单链
  (D)拓扑学:循环
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅶ)直接来源:
  (B)克隆:pHSl bioSl
(ⅸ)特征:
  (E)名称/索引:CDS
  (B)定位:601..1806
(ⅹⅰ)序列描述:序列号:11:gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac cgggcccccc ctcgaggtcg acggtatcga 540taagcttgat atcgaattcc tgcagcccgg gggatcccat ggtacgcgtc gaggagtacc 600atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca cta   648Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1               5                  10                  15cag gat gcg ggc gtc tat ctc gac agc gcc gcg acc gcg ctt aaa cct   696Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20                  25                  30gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg agc gcc gga   744Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35                  40                  45aac gtc cat cgc agc cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt   792Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50                  55                  60tat gaa gct gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat   840Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65                  70                  75                  80gat aaa act atc gtc tgg acg cgc ggc acc act gaa tcc atc aac atg   888Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85                  90                  95gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att   936Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100                 105                 110att gtc agc gtg gca gaa cac cac gcc aac ctc gtc ccc tgg ctg atg   984Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115                 120                 125gtc gcc caa caa act gga gcc aaa gtg gtg aaa ttg ccg ctt aat gcg   1032Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130                 135                 140cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt   1080Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145                 150                 155                 160agt cgg att ctg gcg ttg ggt cag atg tcg aac gtt act ggc ggt tgc   1128Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165                 170                 175ccg gat ctg gcg cga gcg att acc ttt gct cat tca gcc ggg atg gtg   1176Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180                 185                 190gtg atg gtt gat ggt gct cag ggg gca gtg cat ttc ccc gcg gat gtt   1224Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195                 200                 205cag caa ctg gat att gat ttc tat gct ttt tca ggt cac aaa ctg tat   1272Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210                 215                 220ggc ccg aca ggt atc ggc gtg ctg tat ggt aaa tca gaa ctg ctg gag   1320Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225                 230                 235                 240gcg atg tcg ccc tgg ctg ggc ggc ggc aaa atg gtt cac gaa gtg agt   1368Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245                 250                 255ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa gct gga   1416Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260                 265                 270acg cca aat gtc gct ggt gtc ata gga tta agc gcg gcg ctg gaa tgg   1464Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275                 280                 285ctg gca gat tac gat atc aac cag gcc gaa agc tgg agc cgt agc tta   1512Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290                 295                 300gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tca   1560Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305                 310                 315                 320ttc cgc tgc cag gat tcc agc ctg ctg gcc ttt gat ttt gct ggc gtt   1608Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325                 330                 335cat cat agc gat atg gtg acg ctg ctg gcg gag tac ggt att gcc ctg   1656His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340                 345                 350cgg gcc ggg cag cat tgc gct cag ccg cta ctg gca gaa tta ggc gta   1704Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu G1y Val355                 360                 365acc ggc aca ctg cgc gcc tct ttt gcg cca tat aat aca aag agt gat   1752Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370                 375                 380gtg gat gcg ctg gtg aat gcc gtt gac cgc gcg ctg gaa tta ttg gtg   1800Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385                 390                 395                 400gat taa acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg    1856Aspgcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg 1916ccctagacct aggggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt 1976cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg 2036aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc 2096cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac 2156tataaagata ccaggcgttt ccccctggcg gctccctcgt gcgctctcct gttcctgcct 2216ttcggtttac cggtgtcatt ccgctgttat ggccgcgttt gtctcattcc acgcctgaca 2276ctcagttccg ggtaggcagt tcgctccaag ctggactgta tgcacgaacc ccccgttcag 2336tccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccgga aagacatgca 2396aaagcaccac tggcagcagc cactggtaat tgatttagag gagttagtct tgaagtcatg 2456cgccggttaa ggctaaactg aaaggacaag ttttggtgac tgcgctcctc caagccagtt 2516acctcggttc aaagagttgg tagctcagag aaccttcgaa aaaccgccct gcaaggcggt 2576tttttcgttt tcagagcaag agattacgcg cagaccaaaa cgatctcaag aagatcatct 2636tattaatcag ataaaatatt tctagatttc agtgcaattt atctcttcaa atgtagcacc 2696tgaagtcagc cccatacgat ataagttgtt actagtgctt ggattctcac caataaaaaa 2756cgcccggcgg caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg 2816atctatcaac aggagtccaa gcgagctctc gaaccccaga gtcccgctca gaagaactcg 2876tcaagaaggc gatagaaggc gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg 2936aggaagcggt cagcccattc gccgccaagc tcttcagcaa tatcacgggt agccaacgct 2996atgtcctgat agcggtccgc cacacccagc cggccacagt cgatgaatcc agaaaagcgg 3056ccattttcca ccatgatatt cggcaagcag gcatcgccat gggtcacgac gagatcctcg 3116ccgtcgggca tgcgcgcctt gagcctggcg aacagttcgg ctggcgcgag cccctgatgc 3176tcttcgtcca gatcatcctg atcgacaaga ccggcttcca tccgagtacg tgctcgctcg 3236atgcgatgtt tcgcttggtg gtcgaatggg caggtagccg gatcaagcgt atgcagccgc 3296cgcattgcat cagccatgat ggatactttc tcggcaggag caaggtgaga tgacaggaga 3356tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt gacaacgtcg 3416agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc 3476tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc 3536gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc ccagtcatag 3596ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc ttgttcaatc 3656atgcgaaacg atcctcatcc tgtctcttga tcagatcttg atcccctgcg ccatcagatc 3716cttggcggca agaaagccat ccagtttact ttgcagggct tcccaacctt accagagggc 3776gccccagctg gcaattcc                                                         3794(2)序列号12的资料:
(ⅰ)序列特性
  (A)长度:401个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:12Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1               5                  10                  15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20                  25                  30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35                  40                  45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50                  55                  60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65                  70                  75                  80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85                  90                  95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100                 105                 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115                 120                 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130                 135                 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145                 150                 155                 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165                 170                 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180                 185                 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195                 200                 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210                 215                 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225                 230                 235                 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245                 250                 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260                 265                 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275                 280                 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290                 295                 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305                 310                 315                 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325                 330                 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340                 345                 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355                 360                 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370                 375                 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385                 390                 395                 400Asp(2)序列号13的资料:
(ⅰ)序列特性
  (A)长度:4975个碱基对
  (B)类型:核苷酸
  (C)链绞合:单链
  (D)拓扑学:循环
(ⅱ)分子类型:DNA(基因组)
(ⅲ)假设的:无
(ⅲ)反义的:无
(ⅶ)直接来源:
  (B)克隆:pHS1 metk bioS1
(ⅸ)特征:
  (F)名称/索引:CDS
  (B)定位:1782..1684
(ⅹⅰ)序列描述:序列号:13:gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 120ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 420agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480ggataacaat ttcacacacg ctagcggtac caaagaggag aaattaact atg gca aaa 538Met Ala Lys1cac ctt ttt acg tcc gag tcc gtc tct gaa ggg cat cct gac aaa att   586His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys Ile5                  10                  15gct gac caa att tct gat gcc gtt tta gac gcg atc ctc gaa cag gat   634Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu Glu Gln Asp20                  25                  30                  35ccg aaa gca cgc gtt gct tgc gaa acc tac gta aaa acc ggc atg gtt   682Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val40                  45                  50tta gtt ggc ggc gaa atc acc acc agc gcc tgg gta gac atc gaa gag   730Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp Ile Glu Glu55                  60                  65atc acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tcc gac atg   778Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His Ser Asp Met70                  75                  80ggc ttt gac gct aac tcc tgt gcg gtt ctg agc gct atc ggc aaa cag   826Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile Gly Lys Gln85                  90                  95tct cct gac atc aac cag ggc gtt gac cgt gcc gat ccg ctg gaa cag   874Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro Leu Glu Gln100                 105                 110                 115ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act aat gaa acc   922Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr120                 125                 130gac gtg ctg atg cca gca cct atc acc tat gca cac cgt ctg gta cag   970Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg Leu Val Gln            135                 140                 145cgt cag gct gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg   1018Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro150                 155                 160gac gcg aaa agc cag gtg act ttt cag tat gac gac ggc aaa atc gtt   1066Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly Lys Ile Val165                 170                 175ggt atc gat gct gtc gtg ctt tcc act cag cac tct gaa gag atc gac   1114Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu Glu Ile Asp180                 185                 190                 195cag aaa tcg ctg caa gaa gcg gta atg gaa gag atc atc aag cca att   1162Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile Lys Pro Ile200                 205                 210ctg ccc gct gaa tgg ctg act tct gcc acc aaa ttc ttc atc aac ccg   1210Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe Ile Asn Pro215                 220                 225acc ggt cgt ttc gtt atc ggt ggc cca atg ggt gac tgc ggt ctg act   1258Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys Gly Leu Thr230                 235                 240ggt cgt aaa att atc gtt gat acc tac ggc ggc atg gcg cgt cac ggt   1306Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly245                 250                 255ggc ggt gca ttc tct ggt aaa gat cca tca aaa gtg gac cgt tcc gca   1354Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala260                 265                 270                 275gcc tac gca gca cgt tat gtc gcg aaa aac atc gtt gct gct ggc ctg   1402Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala Ala Gly Leu280                 285                 290gcc gat cgt tgt gaa att cag gtt tcc tac gca atc ggc gtg gct gaa   1450Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly Val Ala Glu295                 300                 305ccg acc tcc atc atg gta gaa act ttc ggt act gag aaa gtg cct tct   1498Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser310                 315                 320gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac   1546Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr325                 330                 335ggt ctg att cag atg ctg gat ctg ctg cac ccg atc tac aaa gaa acc   1594Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr Lys Glu Thr340                 345                 350                 355gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc   1642Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr360                 365                 370gac aaa gcg cag ctg ctg cgc gat gct gcc ggt ctg aag taa            1684Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys375                 380                 385tcggtaccgg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 1744agcccggggg atcccatggt acgcgtcgag gagtacc atg aac gtt ttt aat ccc  1799Met Asn Val Phe Asn Pro390gcg cag ttt cgc gcc cag ttt ccc gca cta cag gat gcg ggc gtc tat   1847Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu Gln Asp Ala Gly Val Tyr395                 400                 405ctc gac agc gcc gcg acc gcg ctt aaa cct gaa gcc gtg gtt gaa gcc   1895Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala410                 415                 420acc caa cag ttt tac agt ctg agc gcc gga aac gtc cat cgc agc cag   1943Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gln425                 430                 435ttt gcc gaa gcc caa cgc ctg acc gcg cgt tat gaa gct gca cga gag   1991Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu440                 445                 450                 455aaa gtg gcg caa tta ctg aat gca ccg gat gat aaa act atc gtc tgg   2039Lys Val Ala Gln Leu Leu Asn Ala Pro Asp Asp Lys Thr Ile Val Trp460                 465                 470acg cgc ggc acc act gaa tcc atc aac atg gtg gca caa tgc tat gcg   2087Thr Arg Gly Thr Thr Glu Ser Ile Asn Met Val Ala Gln Cys Tyr Ala475                 480                 485cgt ccg cgt ctg caa ccg ggc gat gag att att gtc agc gtg gca gaa   2135Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile Ile Val Ser Val Ala Glu490                 495                 500cac cac gcc aac ctc gtc ccc tgg ctg atg gtc gcc caa caa act gga   2183His His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gln Gln Thr Gly505                 510                 515gcc aaa gtg gtg aaa ttg ccg ctt aat gcg cag cga ctg ccg gat gtc   2231Ala Lys Val Val Lys Leu Pro Leu Asn Ala Gln Arg Leu Pro Asp Val520                 525                 530                 535gat ttg ttg cca gaa ctg att act ccc cgt agt cgg att ctg gcg ttg   2279Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg Ser Arg Ile Leu Ala Leu540                 545                 550ggt cag atg tcg aac gtt act ggc ggt tgc ccg gat ctg gcg cga gcg   2327Gly Gln Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala555                 560                 565att acc ttt gct cat tca gcc ggg atg gtg gtg atg gtt gat ggt gct   2375Ile Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala570                 575                 580cag ggg gca gtg cat ttc ccc gcg gat gtt cag caa ctg gat att gat   2423Gln Gly Ala Val His Phe Pro Ala Asp Val Gln Gln Leu Asp Ile Asp585                 590                 595ttc tat gct ttt tca ggt cac aaa ctg tat ggc ccg aca ggt atc ggc   2471Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly Ile Gly600                 605                 610                 615gtg ctg tat ggt aaa tca gaa ctg ctg gag gcg atg tcg ccc tgg ctg   2519Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu620                 625                 630ggc ggc ggc aaa atg gtt cac gaa gtg agt ttt gac ggc ttc acg act   2567Gly Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr635                 640                 645caa tct gcg ccg tgg aaa ctg gaa gct gga acg cca aat gtc gct ggt   2615Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly650                 655                 660gtc ata gga tta agc gcg gcg ctg gaa tgg ctg gca gat tac gat atc   2663Val Ile Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp Ile665                 670                 675aac cag gcc gaa agc tgg agc cgt agc tta gca acg ctg gcg gaa gat   2711Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp680                 685                 690                 695gcg ctg gcg aaa cgt ccc ggc ttt cgt tca ttc cgc tgc cag gat tcc   2759Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gln Asp Ser700                 705                 710agc ctg ctg gcc ttt gat ttt gct ggc gtt cat cat agc gat atg gtg   2807Ser Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val715                 720                 725acg ctg ctg gcg gag tac ggt att gcc ctg cgg gcc ggg cag cat tgc   2855Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu Arg Ala Gly Gln His Cys730                 735                 740gct cag ccg cta ctg gca gaa tta ggc gta acc ggc aca ctg cgc gcc   2903Ala Gln Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala745                 750                 755tct ttt gcg cca tat aat aca aag agt gat gtg gat gcg ctg gtg aat   2951Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn760                 765                 770                 775gcc gtt gac cgc gcg ctg gaa tta ttg gtg gat taa acgcgtgcta         2997Ala Val Asp Arg Ala Leu Glu Leu Leu Val Asp780                 785gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg 3057tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ccctagacct aggggatata 3117ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt cgactgcggc gagcggaaat 3177ggcttacgaa cggggcggag atttcctgga agatgccagg aagatactta acagggaagt 3237gagagggccg cggcaaagcc gtttttccat aggctccgcc cccctgacaa gcatcacgaa 3297atctgacgct caaatcagtg gtggcgaaac ccgacaggac tataaagata ccaggcgttt 3357ccccctggcg gctccctcgt gcgctctcct gttcctgcct ttcggtttac cggtgtcatt 3417ccgctgttat ggccgcgttt gtctcattcc acgcctgaca ctcagttccg ggtaggcagt 3477tcgctccaag ctggactgta tgcacgaacc ccccgttcag tccgaccgct gcgccttatc 3537cggtaactat cgtcttgagt ccaacccgga aagacatgca aaagcaccac tggcagcagc 3597cactggtaat tgatttagag gagttagtct tgaagtcatg cgccggttaa ggctaaactg 3657aaaggacaag ttttggtgac tgcgctcctc caagccagtt acctcggttc aaagagttgg 3717tagctcagag aaccttcgaa aaaccgccct gcaaggcggt tttttcgttt tcagagcaag 3777agattacgcg cagaccaaaa cgatctcaag aagatcatct tattaatcag ataaaatatt 3837tctagatttc agtgcaattt atctcttcaa atgtagcacc tgaagtcagc cccatacgat 3897ataagttgtt actagtgctt ggattctcac caataaaaaa cgcccggcgg caaccgagcg 3957ttctgaacaa atccagatgg agttctgagg tcattactgg atctatcasc aggagtccaa 4017gcgagctctc gaaccccaga gtcccgctca gaagaactcg tcaagaaggc gatagaaggc 4077gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc 4137gccgccaagc tcttcagcaa tatcacgggt agccaacgct atgtcctgat agcggtccgc 4197cacacccagc cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt 4257cggcaagcag gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt 4317gagcctggcg aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg 4377atcgacaaga ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg 4437gtcgaatggg caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat 4497ggatactttc tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc 4557caatagcagc cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac 4617gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc 4677ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc 4737ggcatcagag cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca 4797agcggccgga gaacctgcgt gcaatccatc ttgttcaatc atgcgaaacg atcctcatcc 4857tgtctcttga tcagatcttg atcccctgcg ccatcagatc cttggcggca agaaagccat 4917ccagtttact ttgcagggct tcccaacctt accagagggc gccccagctg gcaattcc   4975(2)序列号14的资料:
(ⅰ)序列特性
  (A)长度:384个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:14Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro1               5                  10                  15Asp Lys Ile Ala Asp Gln Ile Ser Asp Ala Val Leu Asp Ala Ile Leu20                  25                  30Glu Gln Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr35                  40                  45Gly Met Val Leu Val Gly Gly Glu Ile Thr Thr Ser Ala Trp Val Asp50                  55                  60Ile Glu Glu Ile Thr Arg Asn Thr Val Arg Glu Ile Gly Tyr Val His65                  70                  75                  80Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala Ile85                  90                  95Gly Lys Gln Ser Pro Asp Ile Asn Gln Gly Val Asp Arg Ala Asp Pro100                 105                 110Leu Glu Gln Gly Ala Gly Asp Gln Gly Leu Met Phe Gly Tyr Ala Thr115                 120                 125Asn Glu Thr Asp Val Leu Met Pro Ala Pro Ile Thr Tyr Ala His Arg130                 135                 140Leu Val Gln Arg Gln Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp145                 150                 155                 160Leu Arg Pro Asp Ala Lys Ser Gln Val Thr Phe Gln Tyr Asp Asp Gly165                 170                 175Lys Ile Val Gly Ile Asp Ala Val Val Leu Ser Thr Gln His Ser Glu180                 185                 190Glu Ile Asp Gln Lys Ser Leu Gln Glu Ala Val Met Glu Glu Ile Ile195                 200                 205Lys Pro Ile Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe210                 215                 220Ile Asn Pro Thr Gly Arg Phe Val Ile Gly Gly Pro Met Gly Asp Cys225                 230                 235                 240Gly Leu Thr Gly Arg Lys Ile Ile Val Asp Thr Tyr Gly Gly Met Ala245                 250                 255Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp260                 265                 270Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn Ile Val Ala275                 280                 285Ala Gly Leu Ala Asp Arg Cys Glu Ile Gln Val Ser Tyr Ala Ile Gly290                 295                 300Val Ala Glu Pro Thr Ser Ile Met Val Glu Thr Phe Gly Thr Glu Lys305                 310                 315                 320Val Pro Ser Glu Gln Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu325                 330                 335Arg Pro Tyr Gly Leu Ile Gln Met Leu Asp Leu Leu His Pro Ile Tyr340                 345                 350Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp355                 360                 365Glu Lys Thr Asp Lys Ala Gln Leu Leu Arg Asp Ala Ala Gly Leu Lys370                 375                 380(2)序列号15的资料:
(ⅰ)序列特性
  (A)长度:401个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:序列号:15Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1               5                  10                  15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20                  25                  30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35                  40                  45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50                  55                  60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65                  70                  75                  80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85                  90                  95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100                 105                 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115                 120                 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130                 135                 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145                 150                 155                 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165                 170                 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180                 185                 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195                 200                 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210                 215                 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225                 230                 235                 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245                 250                 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260                 265                 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275                 280                 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290                 295                 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305                 310                 315                 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325                 330                 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340                 345                 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355                 360                 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370                 375                 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385                 390                 395                 400Asp
氨基酸缩写:Gly:甘氨酸;Ala:丙氨酸;Val:缬氨酸;Leu:亮氨酸;Ile:异亮氨酸;Pro:脯氨酸;phe:苯丙氨酸;Tyr:酪氨酸;Trp:色氨酸;Ser:丝氨酸;Thr:苏氨酸;Cys:半胱氨酸;Met:甲硫氨酸;Asp:天门冬氨酸;Glu:谷氨酸;Asn:天冬酰胺;Gln:谷氨酰胺;Lys:赖氨酸;Arg:精氨酸;His:组氨酸。

Claims (14)

1.生产生物素的方法,其中具有序列号1的S-腺苷甲硫氨酸合成酶基因和具有序列号3、序列号5和序列号7的生物素生物合成基因bioS1、bioS2或bioS3中的至少一种基因及其它们的变种、类似物或衍生物在能合成生物素的原核或真核宿主生物中表达,培养这种生物,所合成的生物素在从生物量分离后,或在生物素纯化后可以直接应用。
2.权利要求1的方法,其中具有序列号1、序列号3、序列号5和序列号7的基因的变体是这样一些基因:从权利要求1的核苷酸序列推断的氨基酸水平上,它们显示30~100%的同源性,并能够实现生物素合成增加。
3.权利要求1和2中的方法,其中从下列菌株中所选择的生物用作宿主生物:埃希氏杆菌属、枸橼酸杆菌属、沙雷氏菌属、克雷白杆菌属,沙门氏菌属、假单胞菌属,Comamonas,Acinetobacter,定氮菌属,色素杆菌属、芽胞杆菌属,梭状芽胞杆菌属,节杆菌属,棒状杆菌属,短杆菌属,乳酸球菌属,乳酸杆菌属,链霉菌属,根瘤菌属,农杆菌属,葡萄球菌属,红酵母属,掷孢酵母属,Yarrowia,
裂殖酵母菌或酵母属。
4.权利要求1-3任一的方法,其中一种调节缺陷的生物素突变株用作宿主生物。
5.权利要求1~4之任一的方法,其中如在权利要求1的具有序列号1、序列号3、序列号5和序列号7的基因的至少一个拷贝在原核的或真核的宿主生物中表达,这种表达或单独进行,或与选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一种生物素基因的一个或多个拷贝一起进行。
6.权利要求1~5之任一个的方法,其中权利要求1的具有序列号1、序列号3、序列号5和序列号7的基因的至少一个拷贝在原核的或真核的宿主生物中表达,这种表达或单独进行,或与在同一载体或不同载体之上,选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一种生物素基因的一个或多个拷贝一起进行。
7.一种基因构建物,该基因构建物包含具有序列号1的S-腺苷甲硫氨酸合成基因、具有序列号3、序列号5和序列号7的bioS1、bioS2或bioS3三种生物素生物合成基因中至少一种基因,以及这些基因的有功能的变体、类似物或衍生物,以提高基因表达和/或进行有功能的蛋白质表达和/或关闭这些基因的天然调节,该基因构建物与一种或多种调节信号有效连接。
8.权利要求7的基因构建物,该基因构建物已被插入适宜于在原核的或真核的宿主生物中表达该基因的载体。
9.权利要求7或8的基因构建物,其中具有序列号1、序列号3、序列号5和序列号7的诸基因以及它们的有功能的变体,类似物或衍生物在该基因构建物中以几个拷贝存在。
10.权利要求7~9之一的基因构建物,其中具有序列号1的S-腺苷甲硫氨酸合成酶基因,具有序列号3、序列号5和序列号7的bioS1、bioS2或bioS3三种生物素生物合成基因中至少一种基因,以及这些基因的有功能的变体,类似物或衍生物,如权利要求7中所述,与选自bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一种生物素基因的一个或多个拷贝一起,存在于该基因构建物或载体中。
11.一种含有权利要求7~10之一的基因构建物的生物。
12.权利要求1的序列在生产生物素中的用途。
13.具有序列号7的bioS3基因,或其有功能的变体、类似物或衍生物单独应用于,或与选自S-腺苷甲硫氨酸合成酶基因,bioS1、bioS2、bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR的至少一种基因联合在生产生物素中的用途。
14.权利要求7~10之一的基因构建物在生产生物素中的用途。
CNB998031534A 1998-02-19 1999-02-17 生物素的制备方法 Expired - Fee Related CN1210403C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19806872.7 1998-02-19
DE19806872A DE19806872A1 (de) 1998-02-19 1998-02-19 Verfahren zur Herstellung von Biotin

Publications (2)

Publication Number Publication Date
CN1291232A true CN1291232A (zh) 2001-04-11
CN1210403C CN1210403C (zh) 2005-07-13

Family

ID=7858233

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998031534A Expired - Fee Related CN1210403C (zh) 1998-02-19 1999-02-17 生物素的制备方法

Country Status (8)

Country Link
EP (1) EP1054977A1 (zh)
JP (1) JP2002504338A (zh)
KR (1) KR20010041062A (zh)
CN (1) CN1210403C (zh)
CA (1) CA2321264A1 (zh)
DE (1) DE19806872A1 (zh)
IL (1) IL137310A0 (zh)
WO (1) WO1999042591A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107099497A (zh) * 2017-06-09 2017-08-29 浙江大学 一种促进生物素合成的质粒、细胞及其促进方法
CN110229815A (zh) * 2013-03-15 2019-09-13 孟山都技术有限公司 通过有效转录终止来改进rna的产生和递送的组合物和方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101023788B1 (ko) * 2008-04-18 2011-03-21 주식회사 콧데 재조합 플라스미드, 이 재조합 플라스미드에 의해형질전환된 바이오틴 생산균 및 이 형질전환된 바이오틴생산균을 이용한 바이오틴 생산방법
CN112473700A (zh) * 2020-12-07 2021-03-12 南昌航空大学 一种溴氧化铋/生物炭复合可见光催化剂的制备方法及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09224690A (ja) * 1996-02-21 1997-09-02 Shiseido Co Ltd ビオチンの製造方法
ES2201219T3 (es) * 1996-05-06 2004-03-16 F. Hoffmann-La Roche Ag Produccion fermentativa de biotina.
DE19731274A1 (de) * 1997-07-22 1999-01-28 Basf Ag Verfahren zur Herstellung von Biotin

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110229815A (zh) * 2013-03-15 2019-09-13 孟山都技术有限公司 通过有效转录终止来改进rna的产生和递送的组合物和方法
US11647753B2 (en) 2013-03-15 2023-05-16 Monsanto Technology Llc Compositions and methods for the improved production and delivery of RNA by efficient transcription termination
CN110229815B (zh) * 2013-03-15 2024-02-20 孟山都技术有限公司 通过有效转录终止来改进rna的产生和递送的组合物和方法
CN107099497A (zh) * 2017-06-09 2017-08-29 浙江大学 一种促进生物素合成的质粒、细胞及其促进方法
CN107099497B (zh) * 2017-06-09 2020-08-11 浙江大学 一种促进生物素合成的质粒、细胞及其促进方法

Also Published As

Publication number Publication date
CA2321264A1 (en) 1999-08-26
WO1999042591A1 (de) 1999-08-26
KR20010041062A (ko) 2001-05-15
IL137310A0 (en) 2001-07-24
EP1054977A1 (de) 2000-11-29
DE19806872A1 (de) 1999-08-26
JP2002504338A (ja) 2002-02-12
CN1210403C (zh) 2005-07-13

Similar Documents

Publication Publication Date Title
JP6219481B2 (ja) L−リジン生産能を有する微生物を用いてl−リジンを生産する方法
CN1206342C (zh) 生产l-赖氨酸的棒状菌和制备l-赖氨酸的方法
JP4273661B2 (ja) L−アミノ酸生産菌及びl−アミノ酸の製造法
JP4173777B2 (ja) 微生物株、プラスミド、微生物株の製造方法及びホスホグリセレート−ファミリーのアミノ酸の製造方法
CN1256313A (zh) 使用棒状细菌发酵生产d-泛酸的方法
RU2588657C2 (ru) Микроорганизм для продуцирования одновременно l-аминокислоты и рибофлавина и способ производства l-аминокислоты и рибофлавина с его применением
CN1466630A (zh) 使用肠细菌科菌株发酵生产l-氨基酸的方法
CN1106066A (zh) 枯草芽胞杆菌中生物素的生物合成
CA2456416A1 (en) Coryneform bacteria which produce chemical compounds ii
CN1233660A (zh) 生产l-谷氨酸的细菌和生产l-谷氨酸的方法
CN1200150A (zh) L-氨基酸的制备方法
CN1934265A (zh) 使用棒状细菌生产l-氨基酸的方法
CN1288058A (zh) 编码pgi基因的新核苷酸序列
CN114729012B (zh) L-苏氨酸输出蛋白变体和使用其生产l-苏氨酸的方法
CN1231574C (zh) 生产l-赖氨酸的棒状菌和制备赖氨酸的方法
CN101365797A (zh) 用于改良生产天冬氨酸衍生的氨基酸及化学品的改变的乙醛酸支路
CN1298019A (zh) 编码基因sucC和sucD的新核苷酸序列
EP1633851A2 (en) Methods and compositions for amino acid production
CN1317050A (zh) 编码tal基因的核苷酸序列
CN1705751A (zh) 具有修饰c端的反馈抗性高丝氨酸转琥珀酰酶
US6451564B1 (en) Methods for producing L-isoleucine
CN1291232A (zh) 生物素的制备方法
CN1336958A (zh) 来自谷氨酸棒杆菌的丙酮酸羧化酶
US9574215B2 (en) Production of fatty acids by heterologous expression of gene clusters from myxobacteria
CN1483080A (zh) 发酵生产d-对羟基苯基甘氨酸和d-苯基甘氨酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee