CN1173993C - 绿色荧光蛋白及其编码序列 - Google Patents

绿色荧光蛋白及其编码序列 Download PDF

Info

Publication number
CN1173993C
CN1173993C CNB001338021A CN00133802A CN1173993C CN 1173993 C CN1173993 C CN 1173993C CN B001338021 A CNB001338021 A CN B001338021A CN 00133802 A CN00133802 A CN 00133802A CN 1173993 C CN1173993 C CN 1173993C
Authority
CN
China
Prior art keywords
seq
protein
gfpxm
fluorescence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB001338021A
Other languages
English (en)
Other versions
CN1321689A (zh
Inventor
夏宁邵
罗文新
张军
谢小燕
杨海杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CNB001338021A priority Critical patent/CN1173993C/zh
Publication of CN1321689A publication Critical patent/CN1321689A/zh
Application granted granted Critical
Publication of CN1173993C publication Critical patent/CN1173993C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供来自大型多管水母的新的绿色荧光蛋白的基因组DNA序列、cDNA序列及其蛋白,新的绿色荧光蛋白的三株突变型的核苷酸序列及其蛋白,新的发光蛋白的基因组DNA序列及其蛋白,来自细小多管水母的新的发光蛋白的基因组DNA序列及其蛋白,其中所述新的绿色荧光蛋白可用作监测活细胞内基因表达、蛋白定位、细胞分化发育的良好标记,还可以用于体外蛋白质相互作用研究,新的发光蛋白可用作细胞内Ca2+指示剂、细胞内基因表达、发光免疫检测的良好标记。

Description

绿色荧光蛋白及其编码序列
本发明涉及来自大型多管水母的新的绿色荧光蛋白的基因组DNA序列、cDNA序列及其蛋白,由此cDNA序列突变而来的3个核苷酸序列及其蛋白,新的发光蛋白的基因组DNA序列及其蛋白,来自细小多管水母的新的发光蛋白的基因组DNA序列及其蛋白,其中所述新的绿色荧光蛋白可用作监测活细胞内基因表达、蛋白定位、细胞分化发育的良好标记,还可以用于体外蛋白质相互作用研究,新的发光蛋白可用作细胞内Ca2+指示剂、细胞内基因表达、发光免疫检测的良好标记,因此本发明的绿色荧光蛋白的基因的DNA序列、cDNA序列及其蛋白可用于疾病诊断及与发光蛋白有关的领域。
发光水母(Aequorea victoria)的绿色荧光蛋白(green fluorescentprotein,GFP)存在于发光水母体内,在紫外光或蓝光照射下会发出绿色荧光,是近年来出现的一种革命性的标记分子,已被大量应用于由病毒、细菌、真菌、植物、低等动物到哺乳动物等多种生命形式的多个领域的研究中。
1992年Prasher等首先从美国西海岸附近水域的发光水母中克隆出gfp基因的全长cDNA及大部分基因组DNA[(Prasher,D.C.,Eckenrode,V.K.,Ward,W.W.,et al.,Gene,111:229-233(1992))。真正使人们意识到gfp作为标记基因的巨大应用潜力的是1994年Chalfie等人的研究,他们将gfp的编码序列分别转入大肠杆菌E.coli和四膜线虫C.elegans中,均表达出了与天然GFP性质极其相似的重组GFP,表达gfp基因的细胞在紫外光或蓝光照射下发出清晰明亮的绿色荧光[Chalfie,M.,Tu,y.,Euskirchen,G.,et al.,Science263:802-808(1994)]。四膜线虫的mec-7基因编码一种β-微管蛋白,这种蛋白在线虫的6个触觉感受神经细胞中含量丰富。将gfp基因置于mec-7启动子之下,转化新生线虫,转基因线虫成功表达出了GFP,其表达模式与用MEC-7抗体或mec-7-lacZ嵌合表达检测出的模式相似,在活的线虫体内可以清楚地看到6个神经元的细胞体和突起,在幼虫中可以看到生长腔。
在Chalfie等首先异源表达出野生型gfp基因之后不久,美国Tsien研究小组就通过随机突变从表达gfp的大肠杆菌中筛选出了几株荧光强度更强的和/或荧光光谱改变的gfp变异型,随后该研究小组及其他研究小组又通过类似方法筛选出一些理化、生物学性质有所改变的gfp变异型,如荧光强度增强的GFP(EGFP)、光谱变异的GFP、易表达的GFP等[Heim,R.,Prasher,D.C.,and Tsien,R.Y.,Proc.Natl.Acad.Sci.U.S.A.91:12501-12504(1994),Heim,R.,Cubitt,A.B.,Tsien,R.Y.,Nature,373:663-664(1995)]。Tsien研究小组还在用X-衍射分析了GFP的晶体结构后,预测出将第203位的苏氨酸替换为组氨酸、酪氨酸等极性芳香族氨基酸有可能改变GFP的发射峰,据此进行了定向突变,产生出发射峰移至527nm左右的黄色荧光蛋白(YFP)。这些变异型GFP与野生型GFP都只有几个氨基酸的差别,而且许多位点的变异的效应可以叠加。
所有这些工作大大加速和扩展了GFP在生命科学众多领域内的应用,内容涉及细胞生物学、分子生物学、发育生物学、免疫学、病毒学、微生物学、植物学、微生态学以及生物工程等众多学科和领域。我国学者在近两年也开始应用GFP作为分子标记在昆虫杆状病毒载体系统方面进行了一些工作。
迄今GenBank中登录的野生型gfp基因完整编码序列有4条(GenBank:AEVGFPA M62653,AVGFP1 X83959,AVGFP2 X83960,AEVGFPL29345)都来自美国西海岸附近水域的发光水母Aequorea Victoria。对这4条序列进行核苷酸和氨基酸的比较,发现核苷酸的同源性在96%左右,238个氨基酸中有8个位点存在变异。
水母发光蛋白是一种生物发光蛋白,分离自发光水母,由22KD的apo水母发光蛋白蛋白和分子氧和luminophore coelenterazine组成。当3个Ca2+与之结合,coelenterazine即氧化为coelenteramide,并释放出CO2、发射兰光(最大发射波长为466nm)。1985年,Inouye等首先从维多利亚多管水母分离出apo水母发光蛋白的cDNA--AQ440,并从核酸序列推导出其蛋白质初级结构[Satoshi Inouye,MasatoNoguchi,Yoshiyuki Sakaki,et al.,Proc.Natl.Acad.Sci.USA,82:3154-3158(1985)]。Charbonneau等通过蛋白测序确定了其初级结构,Apo水母发光蛋白由189个氨基酸组成,分子量为21.4KD,有3个EFhand结构,是Ca2+结合位点[Charbonneau,H.,Walsh,K.A.,McCann,R.O.,Prendergast,F.G.,et al.,Bichemistry,24:6762-6771(1985)]。同年Presher等从维多利亚多管水母等亦克隆到apo水母发光蛋白的cDNA,并在大肠杆菌中得到表达,其序列与Inouye分离的水母发光蛋白cDNA有很大不同,存在52个核苷酸差异[Prasher,D.,McCann,R.O.,Cormier,M.J.,Biochemical and Biophysical ResearchCommunications,126(3):1259-1268(1985)].Cormier等在2维琼脂糖电泳中观察到,从水母组织中提取的水母发光蛋白有5种不同的类型,可能由多基因家族的存在而引起。水母发光蛋白DNA的Southernblot分析表明,至少存在4种水母发光蛋白基因[Cormier,M.J.,Prasher,D.C.,Longiaru.M.,et al.,Photochem.Photobiol,49:509-512(1989)].在genebank中登录的水母发光蛋白序列有9条,其中6条均来自维多利亚多管水母[GeneBank,L29571,M11394,E02319,M16103,M16104,M16105],1条来自不知名的水母[GeneBank,E00875],2条为人工突变序列。目前已通过C-端一系列缺失、代替、增加的突变对其进行了发光活性研究,亦通过其核酸和氨基酸序列的定点突变而增强其生物发光活性,此外,重组水母发光蛋白和重组半合成水母发光蛋白的出现使其更适应于细胞内Ca2+监测[Nomura.M.,Inouye,S.,Ohmiya,Y.,et al.,FEBS Lett.,295:63-66(1991),Shimomura,O.,Inouye,S.,Musicki,B.,et al.,Biochem.J.,270:309-312(1990),Kurose.K.,Inouye.S.,Sakaki.Y.,et al.,Proc.Natl.Acad.Sci.U.S.A.86:80-84(1989)]。
因为水母发光蛋白对Ca2+的高度特异性而被用作Ca2+的生物学指示剂,已被成功地应用于哺乳动物细胞、植物、酵母、大肠杆菌细胞,其中在肌肉细胞中的应用最为广泛。此外水母发光蛋白亦可用作哺乳动物细胞中基因表达研究的报告蛋白。apo水母发光蛋白基因被融合到免疫球蛋白重链基因的3’末端或与抗原蛋白进行融合,用这些融合蛋白进行灵敏的发光免疫检测[Casadei,J.,Powell,M.J.,Kenten,J.H.,Proc.Natl.Acad.Sci.U.S.A.87:2047-2051(1990),Zenno,S.,Inouye,S.,Biochem.Biophys.Res.Commun.,171:169-174(1990)].Verhaegen等将水母发光蛋白应用于定量PCR,用化学发光检测目的DNA和内参[Verhaegen,M.,Christopoulos,T.K.,Anal.Chem.70:4120-4125(1998)]。
GFP和水母发光蛋白的巨大应用价值促使科学工作者试图从其他地区、其他种类的发光水母中去分离新的gfp和水母发光蛋白基因,寻找天然的荧光性质有所不同的GFP和水母发光蛋白蛋白。
本发明中使用下脚标“xm”是指厦门的缩写。
本发明的目的是寻找新的绿色荧光蛋白,水母发光蛋白及相应的核苷酸序列或核酸,对新的绿色荧光蛋白的核苷酸序列进行突变而获得新的变异型绿色荧光蛋白等。
本发明从现已从中国厦门水域的发光水母大型多管水母中发现了新的gfp基因-gfpxm,其包括其基因组DNA序列和cDNA序列,新的水母发光蛋白基因-aeqxm,包括其DNA序列,以及从细小多管水母中分离的另一种新的水母发光蛋白基因-aeqxxm,包括其DNA序列,获得了3株gfpxm的突变型。并在原核系统中表达了新的GFP蛋白-GFPxm、新的水母发光蛋白-Aeqxm、Aeqxxm,及3种突变型GFPxm蛋白-GFPxm16、GFPxm18、GFPxm19。
本发明第一方面涉及编码绿色荧光蛋白的核苷酸序列,其由序列SEQID NO:1或序列SEQ ID NO:4,或含序列SEQ ID NO:1和/或SEQ ID NO:4且其中核苷酸可被取代、插入或缺失而不引起所编码蛋白的生物活性改变的核酸表示。
SEQ ID NO:1
1    ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAG TTCTCATTGAGTTAGACGGT
61   GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGG AAGGCGATGCAGATTATGGA
121  AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTAC CAGTTCCATGGCCAACACTT
181  GTTACTACAT TCTCTTATGG CATCCAGTAA GTGGTTCTCT ACTAATCAATTTGACGTCCT
241  GTGCTTACTG GGTAGGTGTA ACCAAACCCG ATTCCAGAGC ATCATCTTAACATATGCTGA
301  TGACGGGAGA GAAGATTTAA AAAGTTGAAA AAGGCCCTGG AACGTGGTCTGTAATTCACT
361  ATAAATGATT TTTTACCTGT TTGTTTAGAT GTTTCGCAAG ATACCCAGAACACATGAAAA
421  TGAATGACTT CTTCAAGAGT GCCATGCCTG AGGGTTACAT TCAAGAAAGAACCATCTTTT
481  TCCAAGATGA TGGAAAATAC AAGACACGTG GTGAAGTCAA GTTTGAAGGTGATACTCTTG
541  TTAACAGAAT TGAGCTCAAA GGTATGGACT TTAAAGAAGA TGGCAATATCCTTGGACACA
601  AGTTGGAGTA CAATTTTAAC TCACATAATG TATACATTAT GCCGGACAAAGCCAATAATG
661  GACTCAAAGT CAATTTCAAA ATTGTGAGTA AATATATAGT TTTACCATATGTACGAGGTA
721  CATTTTCTTA CATTTTTACT GGAAAATAAA TTTTAAAAAT TACGAGTTACACCGTCATAC
781  AACTGCCGTG AATTATTTTA GAACTGGTGT ATTTTTTTTC AGAGACACAATATCGAAGGT
841  GGTGGTGTCC AACTTGCTGA TCATTACCAA ACAAATGTTC CCCTTGGAGACGGTCCTGTC
901  CTTATACCAA TCAATCACTA CCTATCCACG CAAACAGCCA TTTCAAAAGATCGAAATGAG
961  ACGAGAGATC ATATGGTGTT TCTGGAATTT TTCTCAGCTT GTGGACATACACATGGCATG
1021 GATGAACTAT ACAAATAAAT GT
SEQ ID NO:4
1    ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAG TTCTCATTGAGTTAGACGGT
61   GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGG AAGGCGATGCAGATTATGGA
121  AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTAC CAGTTCCATGGCCAACACTT
181  GTTACTACAT TCTCTTATGG CATCCAATGT TTCGCAAGAT ACCCAGAACACATGAAAATG
241  AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTC AAGAAAGAACCATCTTTTTC
301  CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGT TTGAAGGTGATACTCTTGTT
361  AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATG GCAATATCCTTGGACACAAG
421  TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGC CGGACAAAGCCAATAATGGA
481  CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTG GTGGTGTCCAACTTGCTGAT
541  CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCC TTATACCAATCAATCACTAC
601  CTATCCACGC AAACAGCCAT TTCAAAAGAT CGAAATGAGA CGAGAGATCATATGGTGTTT
661  CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGG ATGAACTATACAAATAA
本发明再一方面涉及核苷酸序列SEQ ID NO:1的第1和第2内含子序列,它们分别由序列SEQ ID NO:2和SEQ ID NO:3表示,
SEQ ID NO:2
1    GTAAGTGGTT CTCTACTAAT CAATTTGACG TCCTGTGCTT ACTGGGTAGGTGTAACCAAA
61   CCCGATTCCA GAGCATCATC TTAACATATG CTGATGACGG GAGAGAAGATTTAAAAAGTT
121  GAAAAAGGCC CTGGAACGTG GTCTGTAATT CACTATAAAT GATTTTTTACCTGTTTGTTT
181  AG
SEQ ID NO:3
1    GTGAGTAAAT ATATAGTTTT ACCATATGTA CGAGGTACAT TTTCTTACATTTTTACTGGA
61   AAATAAATTT TAAAAATTAC GAGTTACACC GTCATACAAC TGCCGTGAATTATTTTAGAA
121  CTGGTGTATT TTTTTTCAG
本发明另一方面涉及核苷酸序列SEQ ID NO:1和/或SEQ ID NO:4编码的蛋白,其具有SEQ ID NO:5表示的氨基酸序列,
SEQ ID NO:5
1                             MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                            AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                            LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                            ValThrThrPheSerTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
81                            AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                           GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                           AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                           LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                           LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                           HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                           LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221 LeuGluPhePheSerAlaCysGlyHisThr  HisGlyMetAspGluLeuTyrLys
本发明再一方面涉及核酸编码蛋白的氨基酸序列,其中所述核酸为含序列SEQ ID NO:1和/或SEQ ID NO:4且其中部分核苷酸序列可被取代、插入或缺失而不引起其编码蛋白生物活性改变的核酸。
本发明还涉及核苷酸序列SEQ ID NO:1和/或SEQ ID NO:4或含序列SEQ ID NO:1和/或SEQ ID NO:4且其中部分核苷酸可被取代,插入或缺失而不引起其编码蛋白生物活性改变的核酸的编码显示的绿色荧光蛋白生物活性的蛋白的脱氧核糖核酸,该脱氧核糖核酸含有编码其它蛋白或多肽的于5’或3’末端与其核苷酸序列相连的核苷酸序列,并编码显示绿色荧光生物活性的蛋白。
本发明还涉及含各自被置于其启动子下游的核苷酸序列SEQ IDNO:1,SEQ ID NO:4或含SEQ ID NO:1和/或SEQ ID NO:4的核酸所述序列或核酸编码的氨基酸序列的脱氧核糖核酸的表达质粒。
本发明还涉及编码发光蛋白的核苷酸序列,其由序列SEQ ID NO:6表示
SEQ ID NO:6
  1    ATGACCAGCA AATACGCCGT CAAACTTGAG CCAGACTTTG AGAACCCAAAATGGGTTGGT
   61  CGACACAAGC ATATGTTCAA ATTCCTTGAT GTCAATCAAAATGGAAAGAT CTCTCTTGAC
  121  GAGATGGTCT ACAAGGCGTC CGACATTGTC ATCAACAATCTTGGGGCGAC ACCCGAACAA
  181  GCTAAACGAC ACAAGGACGC CGTAGAGGCT TTCTTCGGAGGCGCCGGAAT GAAATACGGC
  241  GTGGAAACTG AATGGCCTGA ATACATCGAA GGATGGAAGAATTTGGCGAG AACGGAATTA
  301  GACAGATTTG CAAAGAATCA AATAACGCTC ATTCGCTTGTGGGGCGATGC GTTGTTTGAC
  361  ATCATTGACA AAGATCAAAA TGGTGCTATC ACCTTGGACGAATGGAAGAA ATACACACTG
  421  TCAGCTGGCA TCATTCAGTC AGCAGAAGAT TGCGAGATAACGTTCAAGGT ATGTGATTTG
  481  GACGACAGTG GAAGACTTGA TGCCGACGAA ATGACACGACAACACATCGG ATTTTGGTAC
  541  ACCATGGATC CGGCGTGCGA AAAGCTCTAC GGAGGAGCTGTCCCCTAAGA AGCTC
本发明还涉及由核酸序列SEQ ID NO:6编码的蛋白,其具有序列SEQID NO:7所示的氨基酸序列
SEQ ID NO:7
1                             MetThrSerLysTyrAlaValLysLeuGlu
ProAspPheGluAsnProLysTrpValGly
21                            ArgHisLysHisMetPheLysPheLeuAsp
ValAsnGlnAsnGlyLysI1eSerLeuAsp
41                            GluMetValTyrLysAlaSerAspIleVal
IleAsnAsnLeuGlyAlaThrProGluGln
61                            AlaLysArgHisLysAspAlaValGluAla
PhePheGlyGlyAlaGlyMetLysTyrGly
81                            ValGluThrGluTrpProGluTyrIleGlu
GlyTrpLysAsnLeuAlaArgThrGluLeu
101                           AspArgPheAlaLysAsnGlnIleThrLeu
IleArgLeuTrpGlyAspAlaLeuPheAsp
121                           IleIleAspLysAspGlnAsnGlyAlaIle
ThrLeuAspGluTrpLysLysTyrThrLeu
141                           SerAlaGlyIleIleGlnSerAlaGluAsp
CysGluIleThrPheLysValCysAspLeu
161                           AspAspSerGlyArgLeuAspAlaAspGlu
MetThrArgGlnHisIleGlyPheTrpTyr
181 ThrMetAspProAlaCysGluLysLeuTyr  GlyGlyAlaValPro
本发明还涉及编码发光蛋白的核苷酸序列,其由序列SEQ ID NO:8表示
SEQ ID NO:8
 1 ATG
   61  ACCAGCAAAT ACGCAGTCAA GCTCGAACCA GACTTTGAGAATCCAAGATG GATTGGTCGA
  121  CACAAACATA TGTTCAACTT TCTTGATGTC AACCAAAATGGAAAGATCTC TCTTGACGAA
  181  ATGGTCTACA AGGCGTCTGA TATTGTCATA AACAATCTTGGAGCAACACC TGAGCAAGCA
  241  AAACGCCACA AGGAGGCTGT AGAAGCTTTC TTTGGAGGAGCTGGTATGAA ATATGGTGTA
  301  GAAACCGAAT GGCCTGAATA CATCAAAGGA TGGAAGAAATTGGCTCAAAC AGAATTAGAC
  361  AAATTTGCAA AGAATCAAGT AACCCTCATC CGTTTATGGGGTGATGCTTT GTTAGATATC
  421  ATTGACAAAG ATCAGAATGG TGCAATCACA TTGGACGAGTGGAAGAAATA CACACAATCA
  481  GCTGGTATCA TTCAATCAGC AGAAGATTGT GAGGAAACATTCAAAGTGTG TGATCTGGAT
  541  GACAGTGGCC GACTAGATGC TGATGAGATG ACACGACAACATATAGGATT TTGGTACACC
  601 ATGGATCCTG CTTGTGAAAA GCTCTACGGA GGAGCTGTCC CCTAA
本发明还涉及由序列SEQ ID NO:8编码的蛋白,其具有序列SEQ IDNO:9所示的氨基酸序列,
SEQ ID NO:9
1                             MetThrSerLysTyrAlaValLysLeuGlu
ProAspPheGluAsnProArgTrpIleGly
21                            ArgHisLysHisMetPheAsnPheLeuAsp
ValAsnGlnAsnGlyLysIleSerLeuAsp
41                            GluMetValTyrLysAlaSerAspIleVal
IleAsnAsnLeuGlyAlaThrProGluGln
61                            AlaLysArgHisLysGluAlaValGluAla
PhePheGlyGlyAlaGlyMetLysTyrGly
81                            ValGluThrGluTrpProGluTyrIleLys
GlyTrpLysLysLeuAlaGlnThrGluLeu
101                           AspLysPheAlaLysAsnGlnValThrLeu
IleArgLeuTrpGlyAspAlaLeuLeuAsp
121                           IleIleAspLysAspGlnAsnGlyAlaIle
ThrLeuAspGluTrpLysLysTyrThrGln
141                           SerAlaGlyIleIleGlnSerAlaGluAsp
CysGluGluThrPheLysValCysAspLeu
161 AspAspSerGlyArgLeuAspAlaAspGlu
    MetThrArgGlnHisIleGlyPheTrpTyr
181 ThrMetAspProAlaCysGluLysLeuTyr  GlyGlyAlaValPro
本发明还涉及含序列SEQ ID NO:6和/或SEQ ID NO:8的核酸,其中该核酸部分核苷酸可被取代,插入或缺失不引起其编码蛋白生物活性的损失。
本发明还涉及含序列SEQ ID NO:6和/或SEQ ID NO:8的核酸所编码蛋白的氨基酸序列。
本发明还涉及含各自被置于其启动子下游的核苷酸序列SEQ IDNO:6,核苷酸序列SEQ ID NO:8或含SEQ ID NO:6和/或SEQ ID NO:8的核酸所编码蛋白的抗氧核糖核酸的表达质粒。
本发明还涉及由序列SEQ ID NO:4突变而来的核苷酸序列SEQ IDNO:10
   1   ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTTCTCATTGA GTTAGACGGT
   61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121  AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181  GTTACTACAC TGGGCTACGG CATCCAATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241  AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301  CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361  AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421  TTGGAGTACA ATTTTAATTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481  CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541  CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAAT CAATCACTAC
  601  CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661  CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
本发明还涉及序列SEQ ID NO:10的核酸所编码蛋白,其氨基酸序列SEQ ID NO:11表示
  1                           MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
  21                          AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
  41                          LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
  61                          ValThrThrLeuGlyTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
  81                          AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
  101                         GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
  121                         AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
  141                         LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
  l61                         LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
  181                         HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
  201                         LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
  221                         LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
本发明还涉及由序列SEQ ID NO:4突变而来的核苷酸序列SEQ IDNO:12
    1  ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTTCTCATTGA GTTAGACGGT
   61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121  AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181  GTTACTACAC TCGCCTACGG CATCCAATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241  AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301  CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361  AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421  TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481  CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541  CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAAT CAATCACTAC
  601  CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661  CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
本发明还涉及序列SEQ ID NO:12的核酸所编码蛋白,其氨基酸序列由SEQ ID NO:13表示
   1                          MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
   21                         AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
   41                         LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
   61                         ValThrThrLeuAlaTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
   81                         AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
   101                        GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
   121                        AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
   141                        LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
   161                        LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
   181                        HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
   201                        LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
   221                        LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
本发明还涉及由序列SEQ ID NO:4突变而来的核苷酸序列SEQ IDNO:14
    1    ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTCTCATTGA GTTAGACGGT
   61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121  AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181  GTTACTACAC TCTCTTATGG CATCCTATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241  AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301  CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361  AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421  TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481  CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541  CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAATCAATCACTAC
  601  CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661  CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
本发明还涉及含序列SEQ ID NO:14的核酸所编码蛋白,其氨基酸序列由SEQ ID NO:15表示
    1                         MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
    21                        AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
    41                        LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
    61                        ValThrThrLeuSerTyrGlyIleLeuCys
PheAlaArgTyrProGluHisMetLysMet
    81                        AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
    101                       GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
    121                       AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
    141                       LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
    161                       LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
    181                       HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
    201                       LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
    221                       LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
根据本发明,本发明中所述绿色荧光蛋白或发光蛋白可来自大型多管水母或细小多管水母,尤其是中国厦门水域的大型多管水母或细小多管水母。
根据本发明,本发明的核酸序列SEQ ID NO:1,SEQ ID NO:4和SEQID NO:8可来自大型多管水母,尤其是中国厦门水域的大型多管水母。
根据本发明,本发明的核苷酸序列SEQ ID NO:8可来自细小多管水母,尤其是中国厦门水域的细小多管水母。
大型多管水母和细小多管水母是中国近海多管水母属的常见种(见附图一、二)。两者的“胃”都很宽大,无胃柄,有许多筒单或分枝的辐管,生殖腺在辐管上,与“胃”分开。触手空心,具有排泄孔,无缘丝或侧丝。平衡囊关闭型。生殖腺几乎占了整条辐管。大型多管水母有60-250条辐管,7-29条触手(很少40条以上),触手球有背龙突。而细小多管水母的辐管大多为32条以上,触手4-8条,触手球无背龙突。
最先在GeneBank中登录的野生型gfp是1992年Prasher根据GFP的氨基酸序列合成相应的寡聚核苷酸片段,以此为探针从AequoreaVictoria的cDNA文库中筛选出的gfp的几个阳性克隆之一gfp10[(Prasher,D.C.,Eckenrode,V.K.,Ward,W.W.,et al.,Gene,111:229-233(1992)]。本研究则是根据gfp10的序列来设计特异性引物,用聚合酶链式反应(PCR)方法来分离大型多管水母的gfpxm基因。根据已知的野生型gfp基因序列,先后设计合成了12条特异性引物,将6条上游引物和6条下游引物进行多种组合形成多种引物对,以大型多管水母的DNA为模板,在不同条件下进行套式或半套式PCR扩增,得到了很多大小不同的片段。将PCR产物进行Southern blot杂交,杂交结果为阳性者进行测序。结果以DNA为模板,在7条引物组成的4对引物的套式及半套式PCR产物中筛选出了2个Southern blot阳性片段。测序结果表明,这两个片段分别为新分离的gfpxm基因的前一部分和后一部分,两者在中间有200多个核苷酸完全相同。因此我们得到了来自于厦门港大型多管水母的gfpxm基因的DNA序列(见SEQ IDNO:1)。gfpxm DNA序列包括三个外显子和二个内含子,总长为1042bp,而维多利亚多管水母Aeqgfp10 DNA序列中相应片段的长度达2300bp。gfpxm基因三个外显子的长度分别为206bp、295bp、216bp,与Aeqgfp10 DNA中三个外显子之间的核苷酸同源性分别为84.0%、84.1%、76.9%。
gfpxm DNA与Aeqgfp10 DNA中两个内含子序列之间存在着极大的差异,GFPxm DNA第1和第2内含子长度分别为182bp(见SEQ ID NO:2)和139bp(见SEQ ID NO:3),而Aeqgfp10第1和第2内含子长度则分别为532bp、1067bp。
在gfpxm基因DNA序列的基础上,重新设计合成了2条引物,采用半套式PCR扩增gfpxm cDNA序列,结果得到一约720bp片段,测序结果表明这一片段即为gfpxm基因的cDNA序列(见SEQ ID NO:4),编码区全长为717bp,与已知野生型gfp10基因cDNA长度相等,但其中有130个核苷酸出现差异,二者之间的序列同源性为81.9%。gfpxmcDNA与另外三种野生型QEVGFP、AVGFP1、AVGFP2的核苷酸同源性分别为81.6%、81.1%和80.8%。
将gfpxm 720bp cDNA序列,克隆至pTO-T7 E.coli表达载体(罗文新,张军,夏宁邵等,生物工程学报,16(5):578-581,2000),得到表达质粒pTO-T7GFPxm。pTO-T7GFPxm转化至BL21菌株中,涂布的平板置于4℃10天左右,菌落呈现绿色。pTO-T7GFPxm在BL21菌株中进行表达(见附图3),15℃诱导36小时表达的GFPxm蛋白达菌体总蛋白量的40%左右,而其中约有90%的蛋白存在于包涵体中,上清中可溶性的GFPxm蛋白只占10%左右。
将上述pTO-T7GFPxm表达菌体的超声上清分别用荧光全谱仪进行荧光强度和性质分析。结果表明(见附图4),GFPxm蛋白的激发波长为479nm、发射波长为504nm,而EGFP的激发波长为488nm、发射波长为509nm。pTO-T7GFPxm表达的超声上清中GFPxm在479nm波长激发下的荧光强度为0.82,而pTO-T7EGFP经30℃诱导6小时表达的超声上清中EGFP在488nm波长激发下的荧光强度为0.97,但超声上清中EGFP的蛋白量明显高于GFPxm的蛋白量,由此可见GFPxm的荧光强于EGFP的荧光。
但pTO-T7GFPxm表达出来的GFPxm带有T7 tag的12个融合氨基酸,因此表达的GFPxm是一个融合蛋白。融合氨基酸虽少,但也有可能影响到GFPxm的荧光性质,所以重新将将gfpxm 720bp cDNA序列,克隆至NdeI/HindIII双酶切的pTO-T7 E.coli表达载体,得到表达质粒pTO-T7NGFPxm,表达出来的GFPxm则为非融合蛋白。pTO-T7NGFPxm在BL21菌株中的表达情况与pTO-T7GFPxm的表达相似,GFPxm的分子量约为27KD,表达的GFPxm蛋白达菌体总蛋白量的40%左右,而其中约有90%的蛋白存在于包涵体中,上清中可溶性的GFPxm蛋白只占10%左右(附图5)。
菌体超声上清经硫酸铵沉淀,溶于1×PBS(pH7.45),对1×PBS(pH7.45)透析,经0.22uM微孔滤膜过滤,再分别经过高压液相分子筛色谱纯化(色谱柱:TSK GEL SW3000 21.5×60,洗脱缓冲液为1×PBS pH7.45)和高压液相离子交换色谱纯化(色谱柱:Q Hyper D 20,线性洗脱液为0~1MNaCl/25mM Bis-tris pH6.5),高压液相色谱仪为Beckman System GoldNouveau HPLC(125NMP/166NMP)。最后得到色谱纯的GFPxm蛋白,将部分纯化样品置于1cm的石英杯中,在荧光全谱仪上检测其荧光性质和荧光强度。结果发现GFPxm蛋白的激发峰为476nm,其发射峰为496nm(附图6)。以FITC为参比标准,用参比法测定GFPxm的荧光量子产率,结果测得其荧光量子产率为1。
检测不同温度和时间处理对非融合GFPxm蛋白荧光的影响,结果在63℃水浴3小时后,其荧光强度才下降37%,而在56℃以下水浴3小时对其荧光强度仍无明显影响。可知GFPxm蛋白具有较强的抗高温能力。GFPxm蛋白荧光在pH值6-11.5之间稳定,而在pH值小于6及11.5-12时开始受影响,pH值5.0以下则荧光下降50%,pH值达到3.5则荧光完全消失。然而当pH值恢复到碱性条件时,GFPxm蛋白荧光强度亦能回到原来水平。GFPxm蛋白荧光在高浓度尿素(8mol/L)中仍保持稳定,而在3mol/L盐酸胍中受到较小的影响,当盐酸胍浓度大于3mol/L时,荧光下降显著。此外,高浓度的巯基乙醇不影响其荧光,而0.3%的SDS就使GFPxm蛋白荧光下降50%。
检测8种盐的不同浓度对GFPxm蛋白荧光的影响,结果发现当LiCl浓度达到2mol/L时仍不影响其荧光,而当CuCl2浓度仅为5mmol/L时荧光即完全消失,高浓度的KCl和NaCl对GFPxm蛋白荧光影响不大。当NH4Cl浓度为2mol/L、MgCl2浓度为1.8mol/L时,GFPxm蛋白荧光下降50%。CaCl2和MnCl2的影响相当较大,二者浓度分别为0.6mol/L和0.1mol/L时,GFPxm蛋白荧光下降50%(见附图7)。在后四种盐中消失的荧光,当盐浓度降低后又能重新恢复。
由GFPxm基因的cDNA序列推测其氨基酸序列(见SEQ ID NO:5),蛋白全长为238个氨基酸,分子量约为27KD。与Aeqgfp10的氨基酸序列进行比较,显然二者存在很大的差异,其中有39个氨基酸不同,二者的同源性为83.6%。已知的4条野生型gfp基因的核苷酸同源性在96%左右,238个氨基酸中只有8个位点存在变异。GFPxm氨基酸序列与另三种野生型AVGFP1、AVGFP2、AEVGFP氨基酸序列的同源性分别为82.4%、81.5%、81.9%。
GFPxm与EGFP存在41个氨基酸的差异,这41个氨基酸在整个序列中的分布较均匀,这些氨基酸组成的差异导致在pTO-T7载体中表达的可溶性情况的不同,以及分子量上的差异,更重要的是引起了蛋白荧光性质的差异。已知第64-69位的6个氨基酸组成GFP的发色团结构,其中65-67位的三个氨基酸能够形成一种独特的丝氨酸-脱氢酪氨酸-甘氨酸(Ser65-脱氢Tyr66-Gly67)环化结构,这一结构使得GFP具有氧化环境下较强的荧光性。GFPxm第65-69位的6个氨基酸中,只有第68I有所不同,在GFP中相应氨基酸为V,这一不同可能是导致其荧光性质不同的主要原因之一。由大型多管水母获得的天然GFPxm的荧光比EGFP更强,如果通过突变提高它的可溶性,则GFPxm在实际中的应用将更优越于现有的GFP。此外,GFPxm氨基酸序列上相对于野生型GFP存在众多的变化,这些变化为GFP基因改造提供了丰富的资源。
本发明还根据AEVAQ440X的序列[GeneBank:L29571]来设计特异性引物,用聚合酶链式反应(PCR)方法来分离大型多管水母和细小多管水母的aeqxm、aeqxxm基因。根据已知的AEVAQ440X基因cDNA序列,先后设计合成了6条特异性引物,将3条上游引物和3条下游引物进行多种组合形成多种引物对,以大型多管水母和细小多管水母的DNA为模板,在不同条件下进行套式或半套式PCR扩增,将PCR产物进行Southern blot杂交,杂交结果为阳性者进行测序。结果以大型多管水母DNA为模板,在aqF93和aqR712两条引物的PCR产物中筛选出了1个Southern blot阳性片段。测序结果表明,这个片段即为新分离的aeqxm基因。因此得到了来自于厦门港大型多管水母的aeqxm基因的DNA序列(见SEQ ID NO:6)。aeqxm DNA序列无内含子,编码区总长为585bp。以细小多管水母DNA为模板,在aqF1和aqR1两条引物的PCR产物中筛选出了1个Southern blot阳性片段。测序结果表明,这个片段即为新分离的aeqxxm基因,其序列见SEQ ID NO:8。aeqxxmDNA序列亦无内含子,编码区总长为585bp。而已知的水母发光蛋白核酸序列都是cDNA序列,未见相应的DNA序列报道。而维多利亚多管水母AEVAQ440X cDNA序列中编码区的长度为588bp。aeqxm、aeqxxm DNA与AEQ440x cDNA之间的核苷酸序列同源性分别为80.7%和85.1%。aeqxm和aeqxxm DNA之间的核苷酸序列同源性为87.2%。AEVAQ440X编码196个氨基酸,而aeqxm、aeqxxm都只编码195个氨基酸(SEQ ID NO:7、SEQ ID NO:9),即在第5位少了一个Gln,apoaeqxm、apoaeqxxm与Aeq440x之间的氨基酸序列同源性分别为84.7%和87.2%,而apoaeqxm和apoaeqxxm之间的氨基酸序列同源性为94.4%。
将aeqxm和aeqxxm基因DNA片段分别插入pTO-T7表达载体,得到表达质粒pTO-T7-Axm、pTO-T7-Axxm。将两个质粒分别转化至BL21菌株中进行表达,蛋白质SDS-PAGE电泳结果用扫描仪在波长为560nm处扫描分析,结果表明表达的apoaeqxm和apoaeqxxm蛋白都达菌体总蛋白量的40%左右,且大部分蛋白都以可溶性形式存在(见图8)。表达蛋白的生物功能测定参照Shimomura等的方法[Shimomura,O.,Johnson,F.H.,Nature,256:236-238(1975)].分别将1ml pTO-T7Axm、pTO-T7-Axxm表达的超声上清与coelenterate f、2-mercaptoethanol混匀冰浴3小时后,加入2.0ml 30mM CaCl2/30MmTris-HCl pH7.630mM CaCl2,用荧光全谱仪检测到在470nm处的瞬时发光,Aeqxm的光强度达0.084,Aeqxxm的光强度达0.041,说明表达的两种发光蛋白具有正常的生物学功能。进一步研究了再生时间、NaCl浓度、pH和温度对Aeqxm、Aeqxxm再生的影响(见附图9)。由附图9a可知,再生混合物冰浴30分钟后Aeqxm已显示出较好的活性(0.051),而Aeqxxm再生时间为90min时,其活性才达到0.032,但二者都随着时间的增加而升高,并且都在三个小时后达到最高值(分别为0.084、0.041)。NaCl浓度为0到0.3mol/L时,Aeqxm的活性呈现显著的下降趋势,而从0.3到0.9mol/L时,其活性保持不变,Aeqxxm的活性则一直呈缓慢的下降趋势(附图9b)。由附图7c可知,pH为7.6时,Aeqxm的活性达到最大值,pH为8.0时,其活性下降50%,pH达9.0以上时,其大部分活性丧失至完全失活。而当pH为7.6-8.5时,Aeqxxm的活性基本保持不变,pH上升到9.0,其活性则迅速消失。再生混合物冰浴180min后分别在30℃水浴10min,检测到的Aeqxm、Aeqxxm的活性比未经处理的活性稍低,当温度上升到40℃到50℃时,Aeqxm、Aeqxxm的活性下降显著,直至完全失活(附图9d)。
本发明还以序列SEQ ID NO:4为模板,通过定点随机突变的方法来筛选荧光强度提高或光谱发生变化或可溶性提高的GFPxm变异型。新分离GFPxm的氨基酸序列与现有的GFP的氨基酸序列的同源性在81.5%~83.6%之间,GFPxm蛋白的激发波长为476nm,发射波长为504nm,与现有GFP的荧光光谱有所不同。但发光基团处的氨基酸(aa65-67)为SYG,没有任何差异。我们设计了aa64-66的兼并引物,对GFPxm进行定点突变,以期得到荧光性质或蛋白可溶性有所变异的新的GFPxm。
以质粒pTGFPxm为模板,利用aa64-66的兼并引物进行盒式PCR突变。用两对引物分别PCR扩增出部分重叠的两个片段,然后分别回收这两个片段,再直接以这两个片段为引物和模板,在重叠部分退火的基础上向两端延伸,从而获得引入了核苷酸位点突变的128种不同GFPxm混合PCR产物,此混合PCR产物的序列两端还带有部分pMD18-T载体的序列。回收带有突变的混合PCR产物,再经BamHI/HindIII双酶切,克隆至相同酶切的pTO-T7载体中。连接物转化至大肠杆菌中,挑取大量单菌落分别进行培养并在30℃诱导表达5小时后,用荧光全谱仪测定荧光光谱和荧光强度。在原来Lumax公司的荧光全谱仪基础上研制的可自动检测96孔细胞培养板的配套仪器,大大提高了筛选效率。
从约5700个单菌落中筛选出了一些蛋白可溶性有所提高的GFPxm突变型,其中有3种突变型尤为突出,分别命名为GFPxm16、GFPxm18、GFPxm19。用荧光全谱仪对这三种突变型蛋白的荧光性质进行扫描分析,结果发现,GFPxm16的最大激发波长为489nm、最大发射波长为508nm,GFPxm18的最大激发波长为471nm、最大发射波长为501nm,GFPxm19的最大激发波长为475nm、最大发射波长为501nm,与GFPxm的荧光光谱均有不同。
进一步将这三种突变型在不同的温度下进行表达,以检测相应蛋白的可溶性情况,同时表达GFPxm、EGFP以作对照。这五种GFP都以相同的酶切位点克隆至pTO-T7载体,并在相同条件下表达,分别将菌体浓度调到OD600=0.7,直接测菌液的荧光强度,结果如附表1。诱导温度为37℃时,三种GFPxm变异型的荧光强度均高于EGFP,其中GFPxm16为EGFP的1.69倍,而GFPxm则测不到荧光。诱导温度为30℃时,GFPxm16和GFPxm19的荧光强度相同,均高于EGFP的荧光强度,GFPxm18的荧光强度稍低,而GFPxm的荧光强度极低。诱导温度为15℃时,三种新的突变型的荧光强度在0.49左右,而EGFP的荧光强度只有0.19,GFPxm的荧光强度为0.22。由此可知,三种新的GFPxm变异型蛋白在较高温度下表达仍呈可溶性状态存在,且荧光强度高于EGFP,这些特点可能将更适合用于哺乳动物细胞中的分子标记,而比已有的EGFP、GFPxm更为优越。
为了去除表达出来蛋白的前面12个融合氨基酸,尽可能减少其对三种变异型蛋白的荧光性质,重新将三种变异型的DNA序列,分别克隆至NdeI/HindIII双酶切的pTO-T7 E.coli表达载体,得到表达质粒pTO-T7NGFPxm16、pTO-T7NGFPxm18、pTO-T7NGFPxm19,表达出来的为非融合蛋白。30℃诱导表达3小时后,菌体蛋白的SDS-PAGE电泳结果表明,表达的GFPxm16、GFPxm18、GFPxm19蛋白均达到菌体总蛋白量的40%左右(附图10)。
表达GFPxm16、GFPxm18、GFPxm19蛋白的菌体超声上清分别经过硫酸铵沉淀,高压液相分子筛色谱纯化(色谱柱:TSK GEL SW3000 21.5×60,洗脱缓冲液为1×PBS pH7.45)和高压液相离子交换色谱纯化(色谱柱:QHyper D 20,线性洗脱液为0~1M NaCl/25mM Bis-tris pH6.5),最后得到色谱纯的GFPxm16、GFPxm18、GFPxm19蛋白(附图11),将部分纯化样品置于1cm的石英杯中,在荧光全谱仪上检测其荧光性质和荧光强度。结果发现GFPxm16蛋白的激发峰为488nm,其发射峰为502nm(附图12),GFPxm18蛋白的激发峰为468nm,其发射峰为496nm(附图13),GFPxm19蛋白的激发峰为472nm,其发射峰为496nm(附图14)。以FITC为参比标准,用参比法测定三种突变型蛋白的荧光量子产率,结果测得GFPxm16的荧光量子产率为0.74、GFPxm18荧光量子产率为0.96、GFPxm19荧光量子产率为0.7。
取100u1菌体超声上清,分别测定温度、pH、尿素、盐酸胍、SDS和8种盐对GFPxm16、GFPxm18、GFPxm19荧光的影响,反应时间为30分钟,之后用荧光全谱仪检测GFPxm的荧光强度。
检测不同温度和时间处理对GFPxm16、GFPxm18、GFPxm19蛋白荧光的影响,发现在37℃-64℃的温度范围内水浴30min后,GFPxm16、GFPxm18荧光强度保持稳定,GFPxm19蛋白荧光强度在37℃-60℃的温度范围内保持稳定。温度进一步升高三种蛋的荧光强度开始下降,GFPxm16、GFPxm18、GFPxm19蛋白荧光强度分别在69℃、67.2℃、75℃时下降50%,分别在75℃、72℃、80℃时完全消失。继续延长处理时间对其荧光没有明显影响。可知GFPxm16、GFPxm18、GFPxm19蛋白具有较强的抗高温能力。
GFPxm16、GFPxm18蛋白荧光在pH值7-11.5之间稳定,而在pH值小于7及11.5-12时开始受影响,GFPxm19蛋白荧光在pH值6.7-11.5之间稳定,而在pH值小于6.7及11.5-12时开始受影响。GFPxm16在pH值为6时则荧光下降50%。GFPxm18、GFPxm19在pH值为5.5时则荧光下降50%。而当pH值恢复到碱性条件时,GFPxm16、GFPxm18、GFPxm19蛋白的荧光强度亦能分别恢复到60%、80%、70%左右。
GFPxm16蛋白荧光在高浓度尿素(8mol/L)中受到的影响不大,GFPxm18和GFPxm19蛋白荧光在8mol/L尿素中下降50%。GFPxm16、GFPxm18在3mol/L盐酸胍中荧光强度分别下降50%、35%。GFPxm19在4mol/L盐酸胍中荧光强度仍保留38%,GFPxm18在此浓度下荧光完全消失。当盐酸胍浓度为5mol/L时,GFPxm16、GFPxm19的荧光几乎完全消失。1%的SDS使GFPxm16蛋白荧光下降50%,当SDS浓度上升到10%时。仍能测到28%的荧光强度。0.4%的SDS使GFPxm18蛋白荧光下降50%,当SDS浓度大于1%时,荧光强度维持在7.5%。在0.1%SDS中GFPxm19蛋白荧光下降为85.5%,当SDS浓度上升到0.2%时,仍能测到15%的荧光强度,SDS浓度继续上升到0.3%以上时,荧光强度维持在4%左右。
检测8种盐的不同浓度对GFPxm16、GFPxm18、GFPxm19蛋白荧光的影响,结果发现当LiCl浓度达到2mol/L时仍不影响其荧光。而当CuCl2浓度仅为5mmol/L时,GFPxm16、GFPxm18荧光强度下降为25%,GFPxm19蛋白荧光消失。在高浓度的KCl和NaCl中三种蛋白荧光保持稳定。当NH4Cl浓度分别为1.2mol/L、0.8mol/L时,GFPxm16、GFPxm19蛋白荧光下降50%。当NH4Cl浓度为2.0mol/L时,GFPxml8蛋白荧光为50%。
MgCl2、CaCl2和MnCl2对三种蛋白的影响较大。
GFPxm16(SEQ ID NO:10)、GFPxm18(SEQ ID NO:12)、GFPxm19(SEQID NO:14)的核苷酸测序结果表明,GFPxm16、GFPxm18、GFPxm19与GFPxm的同源性分别为99.0%、99.4%、99.7%,变异主要存在于第190-198个核苷酸,此处为利用aa64-66兼并引物而引起的突变。GFPxm19在第206个核苷酸处、GFPxm16在第438个核苷酸处亦发生了变异,为沉默突变,推测是由于PCR过程产生的突变。
将三种突变型的氨基酸序列GFPxm16(SEQ ID NO:11)、GFPxm18(SEQID NO:13)、GFPxm19(SEQ ID NO:15)与GFPxm的氨基酸序列进行比较,发现突变主要发生在第64~65位氨基酸,尤其是第64位氨基酸均由F突变成了L,此外GFPxm16发生了S65G的突变,GFPxm18发生了S65A的突变,GFPxm19发生了Q69L的突变。由此推测aa64位变成L可提高蛋白的可溶性,而在GFPxm18中第65位氨基酸为A,与已知的其它GFP均不相同,但这一改变并不影响蛋白的绿色荧光性质,可见组成发色团的第65-67位氨基酸并不是不可改变的。
运用定点突变、DNA-shuffling技术、易变株筛选等可从gfpxm基因衍生出多种理化、生物学性质不同的gfpxm变异型,编码多种性能更强、光谱范围更广的GFPxm蛋白。
已知GFP荧光结构的形成是一个自催化的过程,仅由其一级结构决定,因此几乎可在所有生命形式中进行多种异源表达;众多研究都已表明GFP的表达对细胞的功能和生长、分化没有明显干扰,只有在表达量很大时少数细胞的生长会有所减缓;GFP的N端和C端都可以与其他蛋白进行嵌合表达而保留其荧光活性;许多重要的蛋白如P53、蛋白激酶C(PKC)、钙调素等与GFP融合表达后,蛋白的生物活性基本上不受影响;GFP的荧光很稳定,不易发生光漂白。这些特性使得GFP成为监测活细胞内基因表达、蛋白定位、细胞分化发育的良好标记。
Gfpxm及其变异型可作为细胞内基因表达的报告基因,研究基因表达的调控。GFPxm的检测极其方便,一旦正确折叠形成晶体,利用长波紫外光或蓝光激发就可以检测到它的表达,因此gpfxm及其变异型作为报告基因体现出其他需要底物、辅助因子的报告基因所不具备的优越性。可以构建各种缺省了启动子或增强子序列的gfpxm载体,利用它们来测定组织特异性启动子和特殊的增强子。
利用已知技术易于将编码其他蛋白和合成多肽的核苷酸序列与gfpxm DNA或其DNA突变体在氨基末端或羧基末端相连,从而制备融合蛋白。GFPxm及其变异型可作为其他蛋白的分子标记,与其他蛋白融合表达,进行细胞内定位,或观察蛋白在细胞内的动力学过程,亦可作为细胞标记,观察细胞的生长、分化和发育。
GFPxm及其变异型作为蛋白标记,可用于体外蛋白质相互作用研究。GFPxm及其变异型可应用于免疫荧光试验,荧光免疫检测技术在临床免疫学领域已成为取代放射免疫检测的另一种方法,具有专一性强、灵敏度高、实用性好等优点,可用来测量含量很低的生物活性化合物,如蛋白质(酶、接受体、抗体)、药物及微生物等。
因为水母发光蛋白对Ca2+的高度特异性而被用作Ca2+的生物学指示剂。细胞内游离Ca2+浓度涉及到很多重要的病理学和生理学反应,检测游离Ca2+浓度变化对了解其生理角色尤为关键。水母发光蛋白对细胞无毒性,进入细胞后数天内仍能检测到荧光,其自身发出的荧光信号要强于荧光离子指示剂,并消除了自发荧光的干扰。基于这些优点,Aeqxm、Aeqxxm可成为良好的细胞内Ca2+指示剂,应用于人体细胞、植物、酵母、大肠杆菌细胞中游离Ca2+浓度检测。可与抗原或抗体融合表达从而进行发光免疫检测。
以下参照附图描述及实施例以更详细地说明本发明。
附图中:
图1显示大型多管水母。
图2显示细小多管水母。
图3显示融合GFPxm、EGFP在大肠杆菌中的表达。
1、蛋白Marker                   2、融合GFPxm的表达
3、超声沉淀中的融合GFPxm蛋白    4、超声上清中的融合GFPxm蛋白
5、EGFP的表达
6、超声沉淀中的EGFP蛋白         7、超声上清中的EGFP蛋白
图4显示融合GFPxm、EGFP蛋白的荧光性质测定,其中横轴为波长,纵轴为荧光强度,由图4可看到,本发明融合绿色荧光蛋白(GFPxm)的激发峰为479nm,发射峰为504nm。
图5显示GFPxm蛋白在大肠杆菌中的表达及单一纯的GFPxm蛋白
1、蛋白Marker               2、GFPxm的表达
3、超声上清中的GFPxm蛋白    4、超声沉淀中的GFPxm蛋白
5、纯化的GFPxm蛋白
图6显示GFPxm蛋白的荧光性质测定,其中横轴为波长,纵轴为荧光强度,由图4可看到,本发明绿色荧光蛋白(GFPxm)的激发峰为476nm,发射峰为496nm。
图7显示GFPxm蛋白的理化性质分析
(a)温度的影响              (b)pH的影响
(c)尿素和盐酸胍的影响      (d)SDS的影响
(e)Kcl、NaCl和NH4Cl的影响  (f)MgCl2、MnCl2和CaCl2的影响
图8显示apoaeqxm和apoaeqxxm在大肠杆菌中的表达
1、蛋白Marker                 2、超声沉淀中的apoaeqxm蛋白
3、超声上清中的apoaeqxm蛋白   4、apoaeqxm的表达
5、超声沉淀中的apoaeqxxm蛋白  6、超声上清中的apoaeqxxm蛋白
7、apoaeqxxm的表达
图9显示显示再生时间、NaCl浓度、pH和温度对Aeqxm、Aeqxxm活性的影响
(a)再生时间的影响            (b)NaCl浓度的影响
(c)pH的影响                  (d)温度的影响
图10显示GFPxm16、GFPxm18、GFPxm19在大肠杆菌中的表达
1、蛋白Marker       2、GFPxm16的表达
3、GFPxm18的表达    4、GFPxm19的表达
图11显示纯化的GFPxm16、GFPxm18、GFPxm19蛋白
1、蛋白Marker    2、GFPxm16
3、GFPxm18       4、GFPxm19
图12显示GFPxm16蛋白的荧光性质测定,其中横轴为波长,纵轴为荧光强度,由图12可看到,本发明突变型绿色荧光蛋白GFPxm16的激发峰为488nm,发射峰为502nm。
图13显示GFPxm18蛋白的荧光性质测定,其中横轴为波长,纵轴为荧光强度,由图13可看到,本发明突变型绿色荧光蛋白GFPxm18的激发峰为468nm,发射峰为496nm。
图14显示GFPxm19蛋白的荧光性质测定,其中横轴为波长,纵轴为荧光强度,由图14可看到,本发明突变型绿色荧光蛋白GFPxm19的激发峰为472nm,发射峰为496nm。
图15显示GFPxm16蛋白的理化性质分析
(a)温度的影响              (b)pH的影响
(c)尿素和盐酸胍的影响      (d)SDS的影响
(e)Kcl、NaCl和NH4Cl的影响  (f)MgCl2、MnCl2和CaCl2的影响
图16显示GFPxm18蛋白的理化性质分析
(a)温度的影响              (b)pH的影响
(c)尿素和盐酸胍的影响        (d)SDS的影响
(e)Kcl、NaCl和NH4Cl的影响    (f)MgCl2、MnCl2和CaCl2的影响
图17显示GFPxm19蛋白的理化性质分析
(a)温度的影响                (b)pH的影响
(c)尿素和盐酸胍的影响        (d)SDS的影响
(e)Kcl、NaCl和NH4Cl的影响    (f)MgCl2、MnCl2和CaCl2的影响
实施例1
gfpxm基因组DNA序列的获得
大型多管水母来自中国厦门水域,取2ml水母伞缘组织于匀浆器中,加入4ml DNA提取液,匀浆后用等体积酚抽提,1,2000rpm离心5min,吸取上清液,加入5ul RNAse A(10mg/ml),37℃静置2hrs,加入等体积氯仿,1,2000rpm离心5min,吸取上清液,加入乙酸铵(终浓度0.3mol/L)和2倍体积无水乙醇,混匀即可看到丝状DNA,将DNA绕在玻棒上,在70%乙醇中洗涤一次,置于一干净Eppendorf管中,烘干后溶于TE中。
合成特异性引物,并以pGFPUV为模板,dNTP为地高辛标记的dNTPMix,经PCR扩增出GFPUV从181bp到512bp的一段331bp的双链DNA作为Southern blot探针。
最先在GeneBank中登录的野生型gfp是1992年Prasher根据GFP的氨基酸序列合成相应的寡聚核苷酸片段,以此为探针从AequoreaVictoria的cDNA文库中筛选出的gfp的几个阳性克隆之一gfp10。本发明则是根据gfp10的序列来设计特异性引物,用PCR方法来分离大型多管水母的gfpxm基因。
根据已知的野生型gfp基因序列,先后设计合成了12条特异性引物。将6条上游引物和6条下游引物进行多种组合形成多种引物对,分别以大型多管水母的DNA为模板,在不同条件下进行套式或半套式PCR扩增。将PCR产物进行Southern blot杂交,杂交结果为阳性者进行测序。结果以DNA为模板,在7条引物组成的4对引物的套式及半套式PCR产物中筛选出了2个Southern blot阳性片段。
这7条引物序列如下:
F5  5’-CAC AGG ATA ACA AAG ATG-3’
F4  5’-GAT AAC AAA GAT GAG TAA AGG AG-3’
F3  5’-GTC ACT ACT TTC TCT TAT GG-3’
R3  5’-AAA CTT GAC TTC AGC ACG TCA-3’
R2  5’-CAA TTG GAG TCT GGA CAT TTA-3’
R5  5’-GTG TCA ATT GGA AGT CTG G-3’
R4  5’-ATT AGG AAT GCA CTC CAG TAG-3’
PCR扩增条件为:
第一次:94℃15min,94℃60″46℃90″72℃90″35个循环,72℃10min,4℃-
第二次:94℃5min,94℃50″59℃50″72℃60″35个循环,72℃10min,4℃-
以F4-R4为第一次PCR引物,F3-R5为第二次PCR引物,经套式PCR扩增出约900bp片段;以F5-R2为第一次PCR引物,F5-R3为第二次PCR引物,经半套式PCR扩增出约550bp片段。
将两个片段分别克隆至pMD-18T载体中,克隆质粒pTG900、pTG550经斑点杂交鉴定为阳性。质粒测序结果表明,这两个片段分别为新分离的gfp基因的前一部分和后一部分,两者在中间有200多个核苷酸完全相同。因此我们得到了来自于厦门港大型多管水母的gfpxm基因的DNA序列。gfpxm DNA序列包括三个外显子和二个内含子,总长为1042bp,三个外显子的长度分别为206bp、295bp、216bp,第1和第2内含子长度分别为182bp、139bp。
实施例2
gfpxm基因cDNA序列的获得
取大型多管水母伞缘发光组织约2ml至匀浆器中,加入3ml Trizol匀浆后,分装到1.5ml Eppendorf管中,每1ml加入200ul氯仿,混匀后静置10min,1,2000rpm离心10min。吸取上清液,加入等体积异丙醇于-20℃静置10min,12000rpm离心10min,沉淀用70%乙醇洗涤一次,真空抽干后溶于RT-Buffer备用。以Random Primer为引物,按常规操作将RNA反转录成cDNA。
在gfpxm基因DNA序列的基础上,重新设计合成了2条引物,F65’-GGA TCC ATG AGT AAA GGA GAA GAA C-3’,R6 5’-TTA TTT GTA TAGTTC ATC CAT GCC-3’。采用半套式PCR扩增cDNA序列,第一次PCR引物为F4-R6,反应条件为:94℃10min,94℃50″52℃ 50″72℃60″35个循环,72℃10min,4℃-;第二次PCR引物为F6-R6,反应条件为:94℃5min,94℃50″58℃45″72℃60″35个循环,72℃10min,4℃-。结果得到一约720bp片段,克隆至pMD-18T载体得到质粒pTGFPxm,测序结果表明这一片段即为gfpxm基因的cDNA序列,编码区全长为717bp。
实施例3
融合GFPxm在大肠杆菌中的表达
用BamH I/Sal I双酶切从质粒pTGFPxm上切下GFPxm 720bp片段,克隆至相同酶切的pTO-T7 E.coli表达载体,得到表达质粒pTO-T7GFPxm。pTO-T7GFPxm转化至BL21菌株中,涂布的平板置于4℃10天左右,菌落呈现绿色。
用E.coli BL21(DE3)作表达菌株,挑单菌落于200ml LB(含Kan100ug/ml)培养基中,37℃振荡培养过夜,菌液OD600值达0.8左右,0.2mmol/L的IPTG诱导,15℃表达36hr后收获菌体,超声破碎,15000rpm离10min,沉淀溶于与上清等体积的Tris-HCl中,取等量上清和沉淀溶液进行SDS-PAGE电泳。蛋白质SDS-PAGE结果用扫描仪在波长为560nm处扫描分析。
结果表明表达的GFPxm蛋白达菌体总蛋白量的40%左右,而其中约有90%的蛋白存在于包涵体中,上清中可溶性的GFPxm蛋白只占10%左右。用相同条件表达pTO-T7EGFP,取相同量的菌体超声上清和沉淀进行SDS-PAGE电泳,由图可知EGFP的表达量亦达40%以上,然而约有90%的EGFP蛋白呈可溶性形式存在,只有约10%的EGFP蛋白存在于包涵体中。
实施例4
融合GFPxm蛋白的荧光性质和荧光强度分析
将上述pTO-T7GFPxm表达菌体的超声上清分别用荧光全谱仪进行荧光强度和性质分析。结果表明(见附图4),融合GFPxm蛋白的激发波长为479nm、发射波长为504nm,而EGFP的激发波长为488nm、发射波长为509nm。pTO-T7GFPxm表达的超声上清中融合GFPxm在479nm波长激发下的荧光强度为0.82,而pTO-T7EGFP经30℃诱导6小时表达的超声上清中EGFP在488nm波长激发下的荧光强度为0.97,但超声上清中EGFP的蛋白量明显高于GFPxm的蛋白量,由此推测GFPxm的荧光强于EGFP的荧光。
实施例5
GFPxm蛋白在大扬杆菌中的表达
pTO-T7GFPxm表达出来的GFPxm带有T7 tag的12个融合氨基酸,因此表达的GFPxm是一个融合蛋白。融合氨基酸虽少,但也有可能影响到GFPxm的荧光性质,所以重新将gfpxm 720bp cDNA序列,克隆至NdeI/HindIII双酶切的pTO-T7 E.coli表达载体,得到表达质粒pTO-T7NGFPxm,表达出来的GFPxm则为非融合蛋白。pTO-T7NGFPxm在BL21菌株中的表达情况与pTO-T7GFPxm的表达相似,GFPxm的分子量约为27KD,表达的GFPxm蛋白达菌体总蛋白量的40%左右,而其中约有90%的蛋白存在于包涵体中,上清中可溶性的GFPxm蛋白只占10%左右(附图5)。
实施例6
GFPxm蛋白的纯化、荧光性质和荧光量子产率测定
菌体超声上清经硫酸铵沉淀,溶于1×PBS(pH7.45),对1×PBS(pH7.45)透析,经0.22uM微孔滤膜过滤。样品进一步经过高压液相分子筛色谱纯化,色谱柱为TSK GEL SW3000 21.5×60,洗脱缓冲液为1×PBS pH7.45,合并目的蛋白峰,对25mM Bis-tris pH6.5缓冲液透析,所得样品再进行高压液相离子交换色谱纯化,色谱柱为Q Hyper D 20,线性洗脱液为0~1MNaCl/25mM Bis-tris pH6.5。后两步所用高压液相色谱仪为BeckmanSystem Gold Nouveau HPLC(125NMP/166NMP)。最后得到色谱纯的GFPxm蛋白,将部分纯化样品置于1cm的石英杯中,在荧光全谱仪上检测其荧光性质和荧光强度。结果发现GFPxm蛋白的激发峰为476nm,发射峰为496nm(见附图6)。以FITC为参比标准,用参比法测定GFPxm的荧光量子产率,结果测得其荧光量子产率为1。
实施例7
GFPxm的理化性质初步分析
取100ul菌体超声上清,分别测定温度、pH、尿素、盐酸胍、SDS和8种盐对GFPxm荧光的影响,除温度以外的其余反应时间为30分钟,之后用荧光全谱仪检测GFPxm的荧光强度。
检测不同温度和时间处理对非融合GFPxm蛋白荧光的影响,结果在63℃水浴3小时后,其荧光强度才下降37%,而在56℃以下水浴3小时对其荧光强度仍无明显影响。可知GFPxm蛋白具有较强的抗高温能力。GFPxm蛋白荧光在pH值6-11.5之间稳定,而在pH值小于6及11.5-12时开始受影响,pH值5.0以下则荧光下降50%,pH值达到3.5则荧光完全消失。然而当pH值恢复到碱性条件时,GFPxm蛋白荧光强度亦能回到原来水平。GFPxm蛋白荧光在高浓度尿素(8mol/L)中仍保持稳定,而在3mol/L盐酸胍中受到较小的影响,当盐酸胍浓度大于3mol/L时,荧光下降显著。此外,高浓度的巯基乙醇不影响其荧光,而0.3%的SDS就使GFPxm蛋白荧光下降50%。
检测8种盐的不同浓度对GFPxm蛋白荧光的影响,结果发现当LiCl浓度达到2mol/L时仍不影响其荧光,而当CuCl2浓度仅为5mmol/L时荧光即完全消失,高浓度的KCl和NaCl对GFPxm蛋白荧光影响不大。当NH4Cl浓度为2mol/L、MgCl2浓度为1.8mol/L时,GFPxm蛋白荧光下降50%。CaCl2和MnCl2的影响相当较大,二者浓度分别为0.6mol/L和0.1mol/L时,GFPxm蛋白荧光下降50%(见附图5)。在后四种盐中消失的荧光,当盐浓度降低后又能重新恢复。
实施例8
aeqxm基因的分离
来自中国厦门水域的大型多管水母,取2ml水母伞缘组织于匀浆器中,加入4ml DNA提取液,匀浆后用等体积酚抽提,1,2000rpm离心5min,吸取上清液,加入5ul RNAse A(10mg/ml),37℃静置2hrs,加入等体积氯仿,1,2000rpm离心5min,吸取上清液,加入乙酸铵(终浓度0.3mol/L)和2倍体积无水乙醇,混匀即可看到丝状DNA,将DNA绕在玻棒上,在70%乙醇中洗涤一次,置于一干净Eppendorf管中,烘干后溶于TE中。
根据AEVAQ440X的序列设计特异性引物aqF448、aqR712,序列分别为:aqF448 5’-ATC CGT ATA TGG GGT GAT GC-3’,aqR712 5’-GAGCTT CTT AGG GGA CAG CT-3’。以细小多管水母的DNA为模板,在不同条件下进行PCR扩增,结果在如下的条件下获得了一条特异的260bp左右DNA片段:94℃5min,94℃55″51℃55″72℃55″35个循环,72℃10min,4℃-。测序结果证明此片段为264bp,与aeq440x cDNA之间的核苷酸序列同源性为87.5%。以aqF448、aqR712为引物,此264bp片段为为模板,dNTP为地高辛标记的dNTP Mix,经PCR扩增出264bp片段作为Southern blot探针。
用聚合酶链式反应(PCR)方法来分离大型多管水母的aeqxm基因。根据已知的AEVAQ440X基因序列,另设计合成了4条特异性引物,将3条上游引物和3条下游引物进行多种组合形成多种引物对,以大型多管水母的DNA为模板,在不同条件下进行套式或半套式PCR扩增,将PCR产物进行Southern blot杂交,杂交结果为阳性者进行测序。结果以大型多管水母DNA为模板,在aqF93和aqR712两条引物的PCR产物中筛选出了1个Southern blot阳性片段。aqF93引物的序列为:5’-GTC TCG ACA ACA AGC AAA C-3’。PCR反应条件为:94℃15min,94℃60″46℃90″72℃60″35个循环,72℃10min,4℃-。
将此片段克隆至pMD18-T载体,得到质粒pTAxm,经斑点杂交鉴定为阳性。测序结果表明,这个片段即为新分离的aeqxm基因。因此得到了来自大型多管水母的aeqxm基因的DNA序列(见SEQ ID NO:6)。aeqxm DNA序列无内含子,编码区总长为585bp,编码195个氨基酸(见SEQ ID NO:7)。aeqxm与AEQ440x之间的核苷酸序列同源性分别为80.7%。
实施例9
apoaeqxm的表达
用EcoRI/XhoI双酶切,从pTAxm质粒中切出aeqxm DNA片段,插入相同酶切的pTO-T7表达载体,得到表达质粒pTO-T7-Axm。将pTO-T7-Axm转化至BL21菌株中,挑单菌落于200ml LB(含Kan 100ug/ml)培养基中,37℃振荡培养过夜,菌液OD600值达0.8左右,0.2mmol/L的IPTG诱导,25℃表达6hr后收获菌体。菌体重悬于Tris-HCl(30mM,pH7.6)/10mM EDTA溶液,超声破碎,15000rpm离心10min,沉淀溶于与上清等体积的Tris-HCl(30mM,pH7.6)/10mM EDTA溶液中,取等量上清和沉淀溶液进行SDS-PAGE电泳。蛋白质SDS-PAGE结果用扫描仪在波长为560nm处扫描分析。结果表明表达的apoaeqxm蛋白达菌体总蛋白量的40%左右,且大部分蛋白都以可溶性形式存在(见图8)。apoaeqxm与AEVAQ440x之间的氨基酸序列同源性为84.7%。
分别取1ml表达菌体超声上清,加入6ul coelenterate f(1ug/ul,甲醇溶)和10ul 2-mercaptoethanol,混匀后置于4℃4小时,加入2.0ml 30mM CaCl2/30Mm Tris-HCl pH7.6,在471nm处发射出兰光。结果表明表达的aeqxm蛋白具有正常的生物功能。
实施例10
aeqxxm基因的分离
根据aeqxm基因的序列设计特异性引物,用聚合酶链式反应(PCR)方法来分离细小多管水母的aeqxxm基因。设计的两条特异性引物的序列为:aqF1 5’-CTG CAG TGA ATT CAT GAC CAG CA ATA CGC-3’,aqR15’-CTC GAG TTA GGG GAC AGC TCC-3’。以细小多管水母的DNA为模板,在各种不同条件下进行PCR扩增,PCR扩增产物经Southern blot杂交分析,结果扩增到了1条阳性片段。PCR反应条件为:94℃15min,94℃50″57℃40″72℃45″35个循环,72℃10min,4℃-。
将此片段克隆至pMD18-T载体,得到质粒pTAxxm,经斑点杂交鉴定为阳性。测序结果表明,这个片段即为新分离的aeqxxm基因。因此我们得到了来自细小多管水母的aeqxxm基因的DNA序列(见SEQ IDNO:8)。aeqxxm DNA序列无内含子,编码区总长为585bp,编码195个氨基酸(见SEQ ID NO:9)。aeqxxm与AEQ440x之间的核苷酸序列同源性为85.1%。
实施例11
apoaeqxxm的表达
用EcoRI/XhoI双酶切,从pTAxxm质粒中切出aeqxxm DNA片段,插入相同酶切的pTO-T7表达载体,得到表达质粒pTO-T7-Axxm。将pTO-T7-Axxm转化至BL21菌株中,挑单菌落于200ml LB(含Ap100ug/ml)培养基中,37℃振荡培养过夜,菌液OD600值达0.8左右,0.2mmol/L的IPTG诱导,25℃表达6hr后收获菌体。菌体重悬于Tris-HCl(30mM,pH7.6)/10mM EDTA溶液,超声破碎,15000rpm离心10min,沉淀溶于与上清等体积的Tris-HCl(30Mm,pH7.6)/10mM EDTA溶液中,取等量上清和沉淀溶液进行SDS-PAGE电泳。蛋白质SDS-PAGE结果用扫描仪在波长为560nm处扫描分析。结果表明表达的apoaeqxxm蛋白达菌体总蛋白量的40%左右,且大部分蛋白都以可溶性形式存在(见图8)。apoaeqxxm与AEVAQ440x之间的氨基酸序列同源性为87.2%。
实施例12
Aeqxm和Aeqxxm的生物功能测定
分别将1ml pTO-T7Axm、pTO-T7-Axxm表达的超声上清与coelenteratef、2-mercaptoethanol混匀冰浴3小时后,加入2.0ml 30mM CaCl2/30MmTris-HCl pH7.630mM CaCl2,用荧光全谱仪检测到在700nm处的瞬时发光,Aeqxm的荧光强度达0.084,Aeqxxm的荧光强度达0.041,说明表达的两种发光蛋白具有正常的生物学功能。
进一步研究了再生时间、NaCl浓度、pH和温度对Aeqxm、Aeqxxm再生的影响(见附图9)。由附图7a可知,再生混合物冰浴30分钟后Aeqxm已显示出较好的活性(0.051),而Aeqxm再生时间为90min时,其活性才达到0.032,但二者都随着时间的增加而升高,并且都在三个小时后达到最高值(分别为0.084、0.041)。NaCl浓度为0到0.3mol/L时,Aeqxm的活性呈现显著的下降趋势,而从0.3到0.9mol/L时,其活性保持不变,Aeqxxm的活性则一直呈缓慢的下降趋势(附图9b)。由附图7c可知,pH为7.6时,Aeqxm的活性达到最大值,pH为8.0时,其活性下降50%,pH达9.0以上时,其大部分活性丧失至完全失活。而当pH为7.6-8.5时,Aeqxxm的活性基本保持不变,pH上升到9.0,其活性则迅速消失。再生混合物冰浴180min后分别在30水浴10min,检测到的Aeqxm、Aeqxxm的活性比未经处理的活性稍低,当温度上升到40℃到50℃时,Aeqxm、Aeqxxm的活性下降显著,直至完全失活(附图9d)。
实施例13
GFPxm突变型GFPxm16、GFPxm18、GFPxm19的获得
设计aa64-66的兼并引物,用PCR方法对GFPxm进行定点突变,以期得到荧光性质或蛋白可溶性有所提高的变异型GFPxm。以质粒pTGFPxm为模板,利用aa64-66的兼并引物进行盒式PCR突变。用xyF1-fpR、fpF-xyR1两对引物分别PCR扩增出部分重叠的两个片段,xxF1的序列为5’-GTA AAA CGA CGG CCA GT-3’,xyR1的序列为5’-AAC AGC TAT GACCAT G-3’,fpF的序列为5’-G CCA ACA CTT GTT ACT ACA(C/T)T(C/G)(G/A)(C/G)C(C/T)(G/A)(C/G)GGC ATC CAA TGT TTC GC-3’,fpR的序列为5’-TGT AGT AAC AAG TGT TGG C-3’。PCR反应条件为:94℃5min,94℃40″55℃40″72℃50″25个循环,72℃10min,4℃-。分别回收这两个片段,再直接以这两个片段为引物和模板,在重叠部分退火的基础上向两端延伸,PCR条件同上,循环数为15。由此获得引入了核苷酸位点突变的128种不同GFPxm的混合PCR产物,此混合PCR产物的序列两端还带有部分pMD18-T载体的序列。回收带有突变的混合PCR产物,再经BamHI/HindIII双酶切,克隆至相同酶切的pTO-T7载体中。连接物转化至大肠杆菌中,挑取大量单菌落分别进行培养并在30℃诱导表达5小时后,用荧光全谱仪测定荧光光谱和荧光强度。在原来Lumax公司的荧光全谱仪基础上研制的可自动检测96孔细胞培养板的配套仪器,大大提高了筛选效率。
从约5700个单菌落中筛选出了一些蛋白可溶性有所提高的GFPxm突变型,其中有3种突变型尤为突出,分别命名为GFPxm16、GFPxm18、GFPxm19。用荧光全谱仪对这三种突变型蛋白的荧光性质进行扫描分析,结果发现,GFPxm16的最大激发波长为489nm、最大发射波长为508nm,GFPxm18的最大激发波长为471nm、最大发射波长为501nm,GFPxm19的最大激发波长为475nm、最大发射波长为501nm,与GFPxm的荧光光谱均有不同。
实施例14
突变型GFPxm16、GFPxm18、GFPxm19在不同温度下的表达
进一步将这三种突变型在不同的温度下进行表达,以检测相应蛋白的可溶性情况,同时表达GFPxm、EGFP以作对照。这五种GFP都以相同的酶切位点克隆至pTO-T7载体,并在相同条件下表达,分别将菌体浓度调到OD600=0.7,直接测菌液的荧光强度,结果如下表。诱导温度为37℃时,三种GFPxm变异型的荧光强度均高于EGFP,其中GFPxm16为EGFP的1.69倍,而GFPxm则测不到荧光。诱导温度为30℃时,GFPxm16和GFPxm19的荧光强度相同,均高于EGFP的荧光强度,GFPxm18的荧光强度稍低,而GFPxm的荧光强度极低。诱导温度为15℃时,三种新的突变型的荧光强度在0.49左右,而EGFP的荧光强度只有0.19,GFPxm的荧光强度为0.22。由此可知,三种新的GFPxm变异型蛋白在较高温度下表达仍呈可溶性状态存在,且荧光强度高于EGFP,这些特点可能将更适合用于哺乳动物细胞中的分子标记,而比已有的EGFP、GFPxm更为优越。
实施例15
GFPxm16、GFPxm18、GFPxm19的表达
为了去除表达出来蛋白的前面12个融合氨基酸,尽可能减少其对三种变异型蛋白的荧光性质,重新将三种变异型的DNA序列,分别克隆至NdeI/HindIII双酶切的pTO-T7 E.coli表达载体,得到表达质粒pTO-T7NGFPxm16、pTO-T7NGFPxm18、pTO-T7NGFPxm19,表达出来的为非融合蛋白。30℃诱导表达3小时后,菌体蛋白的SDS-PAGE电泳结果表明,表达的GFPxm16、GFPxm18、GFPxm19蛋白均达到菌体总蛋白量的40%左右(附图10)。
实施例16
GFPxm16、GFPxm18、GFPxm19的纯化和荧光量子产率测定
表达GFPxm16、GFPxm18、GFPxm19蛋白的菌体超声上清分别经过硫酸铵沉淀,高压液相分子筛色谱纯化(色谱柱:TSK GEL SW3000 21.5×60,洗脱缓冲液为1×PBS pH7.45)和高压液相离子交换色谱纯化(色谱柱:QHyper D 20,线性洗脱液为0~1M NaCl/25mM Bis-tris pH6.5),最后得到色谱纯的GFPxm16、GFPxm18、GFPxm19蛋白(附图11),将部分纯化样品置于1cm的石英杯中,在荧光全谱仪上检测其荧光性质和荧光强度。结果发现GFPxm16蛋白的激发峰为488nm,其发射峰为502nm(附图12),GFPxm18蛋白的激发峰为468nm,其发射峰为496nm(附图13),GFPxm19蛋白的激发峰为472nm,其发射峰为496nm(附图14)。以FITC为参比标准,用参比法测定三种突变型蛋白的荧光量子产率,结果测得GFPxm16的荧光量子产率为0.74、GFPxm18荧光量子产率为0.96、GFPxm19荧光量子产率为0.7。
实施例17
GFPxm16、GFPxm18、GFPxm19的理化性质初步测定(附图15、16、17)
取100ul菌体超声上清,分别测定温度、pH、尿素、盐酸胍、SDS和8种盐对GFPxm16、GFPxm18、GFPxm19荧光的影响,反应时间为30分钟,之后用荧光全谱仪检测GFPxm的荧光强度。
检测不同温度和时间处理对GFPxm16、GFPxm18、GFPxm19蛋白荧光的影响,发现在37℃-64℃的温度范围内水浴30min后,GFPxm16、GFPxm18荧光强度保持稳定,GFPxm19蛋白荧光强度在37℃-60℃的温度范围内保持稳定。温度进一步升高三种蛋的荧光强度开始下降,GFPxm16、GFPxm18、GFPxm19蛋白荧光强度分别在69℃、67.2℃、75℃时下降50%,分别在75℃、72℃、80℃时完全消失。继续延长处理时间对其荧光没有明显影响。可知GFPxm16、GFPxm18、GFPxm19蛋白具有较强的抗高温能力。
GFPxm16、GFPxm18蛋白荧光在pH值7-11.5之间稳定,而在pH值小于7及11.5-12时开始受影响,GFPxm19蛋白荧光在pH值6.7-11.5之间稳定,而在pH值小于6.7及11.5-12时开始受影响。GFPxm16在pH值为6时则荧光下降50%。GFPxm18、GFPxm19在pH值为5.5时则荧光下降50%。而当pH值恢复到碱性条件时,GFPxm16、GFPxm18、GFPxm19蛋白的荧光强度亦能分别恢复到60%、80%、70%左右。
GFPxm16蛋白荧光在高浓度尿素(8mol/L)中受到的影响不大,GFPxm18和GFPxm19蛋白荧光在8mol/L尿素中下降50%。GFPxm16、GFPxm18在3mol/L盐酸胍中荧光强度分别下降50%、35%。GFPxm19在4mol/L盐酸胍中荧光强度仍保留38%,GFPxm18在此浓度下荧光完全消失。当盐酸胍浓度为5mol/L时,GFPxm16、GFPxm19的荧光几乎完全消失。1%的SDS使GFPxm16蛋白荧光下降50%,当SDS浓度上升到10%时。仍能测到28%的荧光强度。0.4%的SDS使GFPxm18蛋白荧光下降50%,当SDS浓度大于1%时,荧光强度维持在7.5%。在0.1%SDS中GFPxm19蛋白荧光下降为85.5%,当SDS浓度上升到0.2%时,仍能测到15%的荧光强度,SDS浓度继续上升到0.3%以上时,荧光强度维持在4%左右。
检测8种盐的不同浓度对GFPxm16、GFPxm18、GFPxm19蛋白荧光的影响,结果发现当LiCl浓度达到2mol/L时仍不影响其荧光。而当CuCl2浓度仅为5mmol/L时,GFPxm16、GFPxm18荧光强度下降为25%,GFPxm19蛋白荧光消失。在高浓度的KCl和NaCl中三种蛋白荧光保持稳定。当NH4Cl浓度分别为1.2mol/L、0.8mol/L时,GFPxm16、GFPxm19蛋白荧光下降50%。当NH4Cl浓度为2.0mol/L时,GFPxm18蛋白荧光为50%。
MgCl2、CaCl2和MnCl2对三种蛋白的影响较大,蛋白荧光强度下降50%时的各自浓度见下表:
当这三种盐的浓度降低后,GFPxm16消失的荧光又能重新恢复到50%-90%,GFPxm19消失的荧光又能重新恢复到90%以上。当MgCl2浓度下降,GFPxm18的荧光亦能恢复90%以上。当CaCl2浓度大于1.2mol/L时,GFPxm丧失的荧光不能恢复,小于1.2mol/L时,其荧光能恢复90%以上。
实施例18
GFPxm16、GFPxm18、GFPxm19的核苷酸序列及推测的氨基酸序列
GFPxm16(SEQ ID NO:10)、GFPxm18(SEQ ID NO:12)、GFPxm19(SEQID NO:14)的核苷酸测序结果表明,GFPxm16、GFPxm18、GFPxm19与GFPxm的同源性分别为99.0%、99.4%、99.7%,变异主要存在于第190-198个核苷酸,此处为利用aa64-66兼并引物而引起的突变。GFPxm19在第206个核苷酸处、GFPxm16在第438个核苷酸处亦发生了变异,为沉默突变,推测是由于PCR过程产生的突变。
将三种突变型的氨基酸序列GFPxm16(SEQ ID NO:11)、GFPxm18(SEQID NO:13)、GFPxm19(SEQ ID NO:15)与GFPxm的氨基酸序列进行比较,发现突变主要发生在第64~65位氨基酸,尤其是第64位氨基酸均由F突变成了L,此外GFPxm16发生了S65G的突变,GFPxm18发生了S65A的突变,GFPxm19发生了Q69L的突变。由此推测aa64位变成L可提高蛋白的可溶性,而在GFPxm18中第65位氨基酸为A,与已知的其它GFP均不相同,但这一改变并不影响蛋白的绿色荧光性质,可见组成发色团的第65-67位氨基酸并不是不可改变的。
                             序列表
(一)一般资料
(i)序列数:15
(1)SEQ ID NO:1的资料:
(i)序列特征
(A)长度:1042核苷酸对
(B)类型:核酸
(C)链型:双链
(D)几何结构:线性
(ii)分子类型:基因组DNA
(iii)推测:非
(iv)反义:非
(v)序列描述:SEQ ID NO:1
1   ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAG TTCTCATTGAGTTAGACGGT
61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGG AAGGCGATGCAGATTATGGA
121 AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTAC CAGTTCCATGGCCAACACTT
181 GTTACTACAT TCTCTTATGG CATCCAGTAA GTGGTTCTCT ACTAATCAATTTGACGTCCT
241 GTGCTTACTG GGTAGGTGTA ACCAAACCCG ATTCCAGAGC ATCATCTTAACATATGCTGA
301 TGACGGGAGA GAAGATTTAA AAAGTTGAAA AAGGCCCTGG AACGTGGTCTGTAATTCACT
361 ATAAATGATT TTTTACCTGT TTGTTTAGAT GTTTCGCAAG ATACCCAGAACACATGAAAA
421 TGAATGACTT CTTCAAGAGT GCCATGCCTG AGGGTTACAT TCAAGAAAGAACCATCTTTT
481 TCCAAGATGA TGGAAAATAC AAGACACGTG GTGAAGTCAA GTTTGAAGGTGATACTCTTG
541 TTAACAGAAT TGAGCTCAAA GGTATGGACT TTAAAGAAGA TGGCAATATCCTTGGACACA
601 AGTTGGAGTA CAATTTTAAC TCACATAATG TATACATTAT GCCGGACAAAGCCAATAATG
661 GACTCAAAGT CAATTTCAAA ATTGTGAGTA AATATATAGT TTTACCATATGTACGAGGTA
721 CATTTTCTTA CATTTTTACT GGAAAATAAA TTTTAAAAAT TACGAGTTACACCGTCATAC
781 AACTGCCGTG AATTATTTTA GAACTGGTGT ATTTTTTTTC AGAGACACAATATCGAAGGT
841 GGTGGTGTCC AACTTGCTGA TCATTACCAA ACAAATGTTC CCCTTGGAGACGGTCCTGTC
901 CTTATACCAA TCAATCACTA CCTATCCACG CAAACAGCCA TTTCAAAAGATCGAAATGAG
961 ACGAGAGATC ATATGGTGTT TCTGGAATTT TTCTCAGCTT GTGGACATACACATGGCATG
1021 GATGAACTAT ACAAATAAAT GT
(2)SEQ ID NO:2的资料:
(i)序列特征
(A)长度:182核苷酸对
(B)类型:核酸
(C)链型:双链
(D)几何结构:线性
(ii)分子类型:基因组DNA
(iii)推测:非
(iv)反义:非
(v)序列描述:SEQ ID NO:2
2   GTAAGTGGTT CTCTACTAAT CAATTTGACG TCCTGTGCTT ACTGGGTAGGTGTAACCAAA
62  CCCGATTCCA GAGCATCATC TTAACATATG CTGATGACGG GAGAGAAGATTTAAAAAGTT
122 GAAAAAGGCC CTGGAACGTG GTCTGTAATT CACTATAAAT GATTTTTTACCTGTTTGTTT
182 AG
(3)SEQ ID NO:3的资料:
(i)序列特征
(A)长度:139核苷酸对
(B)类型:核酸
(c)链型:双链
(d)几何结构:线性
(iii)分子类型:基因组DNA
(vi)推测:非
(v)反义:非
(iv)序列描述:SEQ ID NO:3
2   GTGAGTAAAT ATATAGTTTT ACCATATGTA CGAGGTACAT TTTCTTACATTTTTACTGGA
62  AAATAAATTT TAAAAATTAC GAGTTACACC GTCATACAAC TGCCGTGAATTATTTTAGAA
122 CTGGTGTATT TTTTTTCAG
(4)SEQ ID NO:4资料:
(i)序列特征
(A)长度:717核苷酸对
(B)类型:核酸
(C)链型:双链
(D)几何结构:线性
(ii)分子类型:cDNA
(iii)推测:非
(iv)反义:非
(v)序列描述:SEQ ID NO:4
1   ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAG TTCTCATTGAGTTAGACGGT
61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGG AAGGCGATGCAGATTATGGA
121 AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTAC CAGTTCCATGGCCAACACTT
181 GTTACTACAT TCTCTTATGG CATCCAATGT TTCGCAAGAT ACCCAGAACACATGAAAATG
241 AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTC AAGAAAGAACCATCTTTTTC
301 CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGT TTGAAGGTGATACTCTTGTT
361 AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATG GCAATATCCTTGGACACAAG
421 TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGC CGGACAAAGCCAATAATGGA
481 CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTG GTGGTGTCCAACTTGCTGAT
541 CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCC TTATACCAATCAATCACTAC
601 CTATCCACGC AAACAGCCAT TTCAAAAGAT CGAAATGAGA CGAGAGATCATATGGTGTTT
661 CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGG ATGAACTATACAAATAA
(5)SEQ ID NO:5的资料:
(i)序列特征
(A)长度:238氨基酸
(B)类型:蛋白
(C)链型:单链
(D)几何结构:
(ii)分子类型:蛋白质
(iii)推测:是
(iv)序列描述:SEQ ID NO:5
1                             MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                            AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                            LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                            ValThrThrPheSerTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
81                            AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                           GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                           AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                           LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                           LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                           HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                           LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221 LeuGluPhePheSerAlaCysGlyHisThr  HisGlyMetAspGluLeuTyrLys
(6)SEQ ID NO:6的资料:
(vi)序列特征
(E)长度:585核苷酸对
(F)类型:核酸
(G)链型:双链
(H)几何结构:线性
(vii)分子类型:基因组DNA
(viii)推测:非
(ix)反义:非
(x)序列描述:SEQ ID NO:6
  1   ATGACCAGCA AATACGCCGT CAAACTTGAG CCAGACTTTG AGAACCCAAAATGGGTTGGT
   61  CGACACAAGC ATATGTTCAA ATTCCTTGAT GTCAATCAAAATGGAAAGAT CTCTCTTGAC
  121  GAGATGGTCT ACAAGGCGTC CGACATTGTC ATCAACAATCTTGGGGCGAC ACCCGAACAA
  181  GCTAAACGAC ACAAGGACGC CGTAGAGGCT TTCTTCGGAGGCGCCGGAAT GAAATACGGC
  241  GTGGAAACTG AATGGCCTGA ATACATCGAA GGATGGAAGAATTTGGCGAG AACGGAATTA
  301  GACAGATTTG CAAAGAATCA AATAACGCTC ATTCGCTTGTGGGGCGATGC GTTGTTTGAC
  361 ATCATTGACA AAGATCAAAA TGGTGCTATC ACCTTGGACGAATGGAAGAA ATACACACTG
  421 TCAGCTGGCA TCATTCAGTC AGCAGAAGAT TGCGAGATAACGTTCAAGGT ATGTGATTTG
  481 GACGACAGTG GAAGACTTGA TGCCGACGAA ATGACACGACAACACATCGG ATTTTGGTAC
  541 ACCATGGATC CGGCGTGCGA AAAGCTCTAC GGAGGAGCTGTCCCCTAAGA AGCTC
(7)SEQ ID NO:7的资料:
(v)序列特征
(E)长度:195氨基酸
(F)类型:蛋白
(G)链型:单链
(H)几何结构:
(vi)分子类型:蛋白质
(vii)推测:是
(viii)序列描述:SEQ ID NO:7
1                             MetThrSerLysTyrAlaValLysLeuGlu
ProAspPheGluAsnProLysTrpValGly
21                            ArgHisLysHisMetPheLysPheLeuAsp
ValAsnGlnAsnGlyLysIleSerLeuAsp
41                            GluMetValTyrLysAlaSerAspIleVal
IleAsnAsnLeuGlyAlaThrProGluGln
61                            AlaLysArgHisLysAspAlaValGluAla
PhePheGlyGlyAlaGlyMetLysTyrGly
81                            ValGluThrGluTrpProGluTyrIleGlu
GlyTrpLysAsnLeuAlaArgThrGluLeu
101                           AspArgPheAlaLysAsnGlnIleThrLeu
IleArgLeuTrpGlyAspAlaLeuPheAsp
121                           IleIleAspLysAspGlnAsnGlyAlaIle
ThrLeuAspGluTrpLysLysTyrThrLeu
141                           SerAlaGlyIleIleGlnSerAlaGluAsp
CysGluIleThrPheLysValCysAspLeu
161                           AspAspSerGlyArgLeuAspAlaAspGlu
MetThrArgGlnHisIleGlyPheTrpTyr
181 ThrMetAspProAlaCysGluLysLeuTyr  GlyGlyAlaValPro
(8)SEQ ID NO:8的资料:
(xi)序列特征
(I)长度:585核苷酸对
(J)类型:核酸
(K)链型:双链
(L)几何结构:线性
(xii)分子类型:基因组DNA
(xiii)推测:非
(xiv)反义:非
(xv)序列描述:SEQ ID NO:8
1 ATG
  61  ACCAGCAAAT ACGCAGTCAA GCTCGAACCA GACTTTGAGAATCCAAGATG GATTGGTCGA
  121 CACAAACATA TGTTCAACTT TCTTGATGTC AACCAAAATGGAAAGATCTC TCTTGACGAA
  181 ATGGTCTACA AGGCGTCTGA TATTGTCATA AACAATCTTGGAGCAACACC TGAGCAAGCA
  241 AAACGCCACA AGGAGGCTGT AGAAGCTTTC TTTGGAGGAGCTGGTATGAA ATATGGTGTA
  301 GAAACCGAAT GGCCTGAATA CATCAAAGGA TGGAAGAAATTGGCTCAAAC AGAATTAGAC
  361 AAATTTGCAA AGAATCAAGT AACCCTCATC CGTTTATGGGGTGATGCTTT GTTAGATATC
  421 ATTGACAAAG ATCAGAATGG TGCAATCACA TTGGACGAGTGGAAGAAATA CACACAATCA
  481 GCTGGTATCA TTCAATCAGC AGAAGATTGT GAGGAAACATTCAAAGTGTG TGATCTGGAT
  541 GACAGTGGCC GACTAGATGC TGATGAGATG ACACGACAACATATAGGATT TTGGTACACC
  601 ATGGATCCTG CTTGTGAAAA GCTCTACGGA GGAGCTGTCC CCTAA
(9)SEQ ID NO:9的资料:
(ix)序列特征
(I)长度:195氨基酸
(J)类型:蛋白
(K)链型:单链
(L)几何结构:
(x)分子类型:蛋白质
(xi)推测:是
(xii)序列描述:SEQ ID NO:9
1                             MetThrSerLysTyrAlaValLysLeuGlu
ProAspPheGluAsnProArgTrpIleGly
21                            ArgHisLysHisMetPheAsnPheLeuAsp
ValAsnGlnAsnGlyLysIleSerLeuAsp
41                            GluMetValTyrLysAlaSerAspIleVal
IleAsnAsnLeuGlyAlaThrProGluGln
61                            AlaLysArgHisLysGluAlaValGluAla
PhePheGlyGlyAlaGlyMetLysTyrGly
81                            ValGluThrGluTrpProGluTyrIleLys
GlyTrpLysLysLeuAlaGlnThrGluLeu
101                           AspLysPheAlaLysAsnGlnValThrLeu
IleArgLeuTrpGlyAspAlaLeuLeuAsp
121                           IleIleAspLysAspGlnAsnGlyAlaIle
ThrLeuAspGluTrpLysLysTyrThrGln
141                           SerAlaGlyIleIleGlnSerAlaGluAsp
CysGluGluThrPheLysValCysAspLeu
162 AspAspSerGlyArgLeuAspAlaAspGlu
    MetThrArgGlnHisIleGlyPheTrpTyr
182    ThrMetAspProAlaCysGluLysLeuTyr  GlyGlyAlaValPro
(10)SEQ ID NO:10的资料:
(xvi)序列特征
(M)长度:717核苷酸对
(N)类型:核酸
(O)链型:双链
(P)几何结构:线性
(xvii)分子类型:基因组DNA
(xviii)推测:非
(xix)反义:非
(xx)序列描述:SEQ ID NO:10
    1  ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTTCTCATTGA GTTAGACGGT
   61  GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121 AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181 GTTACTACAC TGGGCTACGG CATCCAATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241 AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301 CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361 AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421 TTGGAGTACA ATTTTAATTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481 CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541 CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAAT CAATCACTAC
  601 CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661 CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
(11)SEQ ID NO:11的资料:
(xxi)序列特征
(Q)长度:238氨基酸
(R)类型:蛋白
(S)链型:单链
(T)几何结构:
(xxii)分子类型:蛋白质
(xxiii)推测:是
(xxiv)反义:
(xxv)序列描述:SEQ ID NO:11
  1                           MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
  21                          AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
  41                          LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
  61                          ValThrThrLeuGlyTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
  81                          AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
  101                         GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
  121                         AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
  141                         LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
  161                         LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
  181                         HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
  201                         LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
  221                         LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
(12)SEQ ID NO:12的资料:
(xxvi)序列特征
(U)长度:717核苷酸对
(V)类型:核酸
(W)链型:双链
(X)几何结构:线性
(xxvii)分子类型:基因组DNA
(xxviii)推测:非
(xxix)反义:非
(xxx)序列描述:SEQ ID NO:12
    1 ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTTCTCATTGA GTTAGACGGT
   61 GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121 AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181 GTTACTACAC TCGCCTACGG CATCCAATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241 AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301 CAAGATGATG GAAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361 AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421 TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481 CTCAAAGTCA ATFTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541 CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAAT CAATCACTAC
  601 CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661 CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
(13)SEQ ID NO:13的资料:
(xxxi)序列特征
(Y)长度:238氨基酸
(Z)类型:蛋白
(AA)链型:单链
(BB)几何结构:
(xxxii)分子类型:蛋白质
(xxxiii)推测:是
(xxxiv)反义:
(xxxv)序列描述:SEQ ID NO:13
   1                          MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
   21                         AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
   41                         LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
   61                         ValThrThrLeuAlaTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
   81                         AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
   101                        GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
   121                        AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
   141                        LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
   161                        LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
   181                        HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
   201                        LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
   221                        LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
(14)SEQ ID NO:14的资料:
(xxxvi)序列特征
(CC)长度:717核苷酸对
(DD)类型:核酸
(EE)链型:双链
(FF)几何结构:线性
(xxxvii)分子类型:基因组DNA
(xxxviii)推测:非
(xxxix)反义:非
(xl)序列描述:SEQ ID NO:14
    1 ATGAGTAAAG GAGAAGAACT TTTCACTGGG ATTGTCCCAGTTCTCATTGA GTTAGACGGT
   6l GATGTCCATG GACATAAATT CTCTGTCAGA GGAGAAGGGGAAGGCGATGC AGATTATGGA
  121 AAACTTGAAA TCAAATTCAT TTGCACTACT GGAAAGCTACCAGTTCCATG GCCAACACTT
  181 GTTACTACAC TCTCTTATGG CATCCTATGT TTCGCAAGATACCCAGAACA CATGAAAATG
  241 AATGACTTCT TCAAGAGTGC CATGCCTGAG GGTTACATTCAAGAAAGAAC CATCTTTTTC
  301 CAAGATGATG GAAATACAA GACACGTGGT GAAGTCAAGTTTGAAGGTGA TACTCTTGTT
  361 AACAGAATTG AGCTCAAAGG TATGGACTTT AAAGAAGATGGCAATATCCT TGGACACAAG
  421 TTGGAGTACA ATTTTAACTC ACATAATGTA TACATTATGCCGGACAAAGC CAATAATGGA
  481 CTCAAAGTCA ATTTCAAAAT TAGACACAAT ATCGAAGGTGGTGGTGTCCA ACTTGCTGAT
  541 CATTACCAAA CAAATGTTCC CCTTGGAGAC GGTCCTGTCCTTATACCAAT CAATCACTAC
  601 CTATCCACGC AAACGGCCAT TTCAAAAGAT CGAAATGAGACGAGAGATCA TATGGTGTTT
  661 CTGGAATTTT TCTCAGCTTG TGGACATACA CATGGCATGGATGAACTATA CAAATAA
(15)SEQ ID NO:15的资料:
(xli)序列特征
(GG)长度:238氨基酸
(HH)类型:蛋白
(II)链型:单链
(JJ)几何结构:
(xlii)分子类型:蛋白质
(xliii)推测:是
(xliv)反义:
(xlv)序列描述:SEQ ID NO:15
    1                         MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
    21                        AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
    41                        LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
    61                        ValThrThrLeuSerTyrGlyIleLeuCys
PheAlaArgTyrProGluHisMetLysMet
    81                        AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
    101                       GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
    121                       AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
    141                       LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
    161                       LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
    181                       HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
    201                       LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
    221                       LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*

Claims (12)

1.编码绿色荧光蛋白的核苷酸序列,其是由SEQ ID NO:1或SEQID NO:4代表或是含SEQ ID NO:1和/或SEQ ID NO:4且其中核苷酸可被取代、插入或缺失而不引起所编码蛋白的生物活性改变的核酸,SEQ ID NO:1
1       ATGAGTAAAG    GAGAAGAACT   TTTCACTGGG
ATTGTCCCAG TTCTCATTGA GTTAGACGGT
61     GATGTCCATG    GACATAAATT    CTCTGTCAGA
GGAGAAGGGG AAGGCGATGC AGATTATGGA
121    AAACTTGAAA    TCAAATTCAT    TTGCACTACT
GGAAAGCTAC CAGTTCCATG GCCAACACTT
181    GTTACTACAT    TCTCTTATGG    CATCCAGTAA
GTGGTTCTCT ACTAATCAAT TTGACGTCCT
241    GTGCTTACTG    GGTAGGTGTA    ACCAAACCCG
ATTCCAGAGC ATCATCTTAA CATATGCTGA
301    TGACGGGAGA    GAAGATTTAA    AAAGTTGAAA
AAGGCCCTGG AACGTGGTCT GTAATTCACT
361    ATAAATGATT    TTTTACCTGT    TTGTTTAGAT
GTTTCGCAAG ATACCCAGAA CACATGAAAA
421    TGAATGACTT    CTTCAAGAGT    GCCATGCCTG
AGGGTTACAT TCAAGAAAGA ACCATCTTTT
481    TCCAAGATGA    TGGAAAATAC    AAGACACGTG
GTGAAGTCAA GTTTGAAGGT GATACTCTTG
541    TTAACAGAAT    TGAGCTCAAA    GGTATGGACT
TTAAAGAAGA TGGCAATATC CTTGGACACA
601    AGTTGGAGTA    CAATTTTAAC    TCACATAATG
TATACATTAT GCCGGACAAA GCCAATAATG
661    GACTCAAAGT    CAATTTCAAA    ATTGTGAGTA
AATATATAGT TTTACCATAT GTACGAGGTA
721    CATTTTCTTA    CATTTTTACT    GGAAAATAAA
TTTTAAAAAT TACGAGTTAC ACCGTCATAC
781    AACTGCCGTG    AATTATTTTA    GAACTGGTGT
ATTTTTTTTC AGAGACACAA TATCGAAGGT
841    GGTGGTGTCC    AACTTGCTGA    TCATTACCAA
ACAAATGTTC CCCTTGGAGA CGGTCCTGTC
901    CTTATACCAA    TCAATCACTA    CCTATCCACG
CAAACAGCCA TTTCAAAAGA TCGAAATGAG
961    ACGAGAGATC    ATATGGTGTT    TCTGGAATTT
TTCTCAGCTT GTGGACATAC ACATGGCATG
1021 GATGAACTAT ACAAATAAAT GT
SEQ ID NO:4
1      ATGAGTAAAG    GAGAAGAACT    TTTCACTGGG
ATTGTCCCAG TTCTCATTGA GTTAGACGGT
61     GATGTCCATG    GACATAAATT    CTCTGTCAGA
GGAGAAGGGG AAGGCGATGC AGATTATGGA
121    AAACTTGAAA    TCAAATTCAT    TTGCACTACT
GGAAAGCTAC CAGTTCCATG GCCAACACTT
181    GTTACTACAT    TCTCTTATGG    CATCCAATGT
TTCGCAAGAT ACCCAGAACA CATGAAAATG
241    AATGACTTCT    TCAAGAGTGC    CATGCCTGAG
GGTTACATTC AAGAAAGAAC CATCTTTTTC
301    CAAGATGATG    GAAAATACAA    GACACGTGGT
GAAGTCAAGT TTGAAGGTGA TACTCTTGTT
361    AACAGAATTG    AGCTCAAAGG    TATGGACTTT
AAAGAAGATG GCAATATCCT TGGACACAAG
421    TTGGAGTACA    ATTTTAACTC    ACATAATGTA
TACATTATGC CGGACAAAGC CAATAATGGA
481  CTCAAAGTCA    ATTTCAAAAT    TAGACACAAT
ATCGAAGGTG GTGGTGTCCA ACTTGCTGAT
541  CATTACCAAA    CAAATGTTCC    CCTTGGAGAC
GGTCCTGTCC TTATACCAAT CAATCACTAC
601  CTATCCACGC    AAACAGCCAT    TTCAAAAGAT
CGAAATGAGA CGAGAGATCA TATGGTGTTT
661  CTGGAATTTT    TCTCAGCTTG    TGGACATACA
CATGGCATGG ATGAACTATA CAAATAA
2.权利要求1的核苷酸序列,其中SEQ ID NO:1的第1和第2内含子序列分别由SEQ ID NO:2、SEQ ID NO:3代表
SEQ ID NO:2
1 GTAAGTGGTT CTCTACTAAT CAATTTGACG TCCTGTGCTT
ACTGGGTAGG TGTAACCAAA
61   CCCGATTCCA    GAGCATCATC    TTAACATATG
CTGATGACGG GAGAGAAGAT TTAAAAAGTT
121  GAAAAAGGCC    CTGGAACGTG    GTCTGTAATT
CACTATAAAT GATTTTTTAC CTGTTTGTTT
181 AG
SEQ ID NO:3
1 GTGAGTAAAT ATATAGTTTT ACCATATGTA CGAGGTACAT
TTTCTTACAT TTTTACTGGA
61 AAATAAATTT TAAAAATTAC GAGTTACACC GTCATACAAC
TGCCGTGAAT TATTTTAGAA
121 CTGGTGTATT TTTTTTCAG。
3.由权利要求1的核酸编码的蛋白,它具有SEQ ID NO:5所示的氨基酸序列
SEQ  ID  NO:5
1                           MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                         AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                         LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                         ValThrThrPheSerTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
81                         AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                        GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                        AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                        LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                        LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                        HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                        LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221                        LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys。
4.权利要求1的核酸编码蛋白的氨基酸序列。
5.权利要求1的核苷酸序列或核酸编码显示绿色荧光蛋白生物活性的蛋白的脱氧核糖核酸,该脱氧核糖核酸含有编码其他蛋白或多肽的、在5’或3’末端与其核苷酸序列连接的核苷酸序列,并编码显示大型多管水母绿色荧光生物活性的蛋白。
6.含各自被置于其启动子下游的权利要求1核苷酸序列或权利要求5的核苷酸序列的表达质粒。
7.编码绿色荧光蛋白的核苷酸序列,是由SEQ ID NO:4核苷酸序列定点突变而来,是由SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14代表或是含SEQ ID NO:10和/或SEQ ID NO:12和/或SEQ ID NO:14且其中核苷酸可被取代、插入或缺失而不引起所编码蛋白的生物活性改变的核酸,
    SEQ ID NO:10
    1   ATGAGTAAAG    GAGAAGAACT    TTTCACTGGG
ATTGTCCCAG TTCTCATTGA GTTAGACGGT
    61  GATGTCCATG    GACATAAATT    CTCTGTCAGA
GGAGAAGGGG AAGGCGATGC AGATTATGGA
    121 AAACTTGAAA    TCAAATTCAT    TTGCACTACT
GGAAAGCTAC CAGTTCCATG GCCAACACTT
    181 GTTACTACAC    TGGGCTACGG    CATCCAATGT
TTCGCAAGAT ACCCAGAACA CATGAAAATG
    241 AATGACTTCT    TCAAGAGTGC    CATGCCTGAG
GGTTACATTC AAGAAAGAAC CATCTTTTTC
    301 CAAGATGATG    GAAAATACAA    GACACGTGGT
GAAGTCAAGT TTGAAGGTGA TACTCTTGTT
    361 AACAGAATTG    AGCTCAAAGG    TATGGACTTT
AAAGAAGATG GCAATATCCT TGGACACAAG
    421 TTGGAGTACA    ATTTTAATTC    ACATAATGTA
TACATTATGC CGGACAAAGC CAATAATGGA
    481 CTCAAAGTCA    ATTTCAAAAT    TAGACACAAT
ATCGAAGGTG GTGGTGTCCA ACTTGCTGAT
    541 CATTACCAAA    CAAATGTTCC    CCTTGGAGAC
GGTCCTGTCC TTATACCAAT CAATCACTAC
    601 CTATCCACGC    AAACGGCCAT    TTCAAAAGAT
CGAAATGAGA CGAGAGATCA TATGGTGTTT
    661  CTGGAATTTT   TCTCAGCTTG    TGGACATACA
CATGGCATGG ATGAACTATA CAAATAA
    SEQ ID NO:12
     1  ATGAGTAAAG    GAGAAGAACT    TTTCACTGGG
ATTGTCCCAG TTCTCATTGA GTTAGACGGT
    61  GATGTCCATG    GACATAAATT    CTCTGTCAGA
GGAGAAGGGG AAGGCGATGC AGATTATGGA
    121 AAACTTGAAA    TCAAATTCAT    TTGCACTACT
GGAAAGCTAC CAGTTCCATG GCCAACACTT
    181 GTTACTACAC    TCGCCTACGG    CATCCAATGT
TTCGCAAGAT ACCCAGAACA CATGAAAATG
    241 AATGACTTCT    TCAAGAGTGC    CATGCCTGAG
GGTTACATTC AAGAAAGAAC CATCTTTTTC
    301 CAAGATGATG    GAAAATACAA    GACACGTGGT
GAAGTCAAGT TTGAAGGTGA TACTCTTGTT
    361 AACAGAATTG    AGCTCAAAGG    TATGGACTTT
AAAGAAGATG GCAATATCCT TGGACACAAG
    421 TTGGAGTACA    ATTTTAACTC    ACATAATGTA
TACATTATGC CGGACAAAGC CAATAATGGA
    481 CTCAAAGTCA    ATTTCAAAAT    TAGACACAAT
ATCGAAGGTG GTGGTGTCCA ACTTGCTGAT
    541 CATTACCAAA    CAAATGTTCC    CCTTGGAGAC
GGTCCTGTCC TTATACCAAT CAATCACTAC
    601 CTATCCACGC    AAACGGCCAT    TTCAAAAGAT
CGAAATGAGA CGAGAGATCA TATGGTGTTT
    661  CTGGAATTTT    TCTCAGCTTG   TGGACATACA
CATGGCATGG ATGAACTATA CAAATAA
    SEQ ID NO:14
    1   ATGAGTAAAG    GAGAAGAACT    TTTCACTGGG
ATTGTCCCAG TTCTCATTGA GTTAGACGGT
    61  GATGTCCATG    GACATAAATT    CTCTGTCAGA
GGAGAAGGGG AAGGCGATGC AGATTATGGA
    121 AAACTTGAAA    TCAAATTCAT    TTGCACTACT
GGAAAGCTAC CAGTTCCATG GCCAACACTT
    181 GTTACTACAC    TCTCTTATGG    CATCCTATGT
TTCGCAAGAT ACCCAGAACA CATGAAAATG
    241 AATGACTTCT    TCAAGAGTGC    CATGCCTGAG
GGTTACATTC AAGAAAGAAC CATCTTTTTC
    301 CAAGATGATG    GAAAATACAA    GACACGTGGT
GAAGTCAAGT TTGAAGGTGA TACTCTTGTT
    361 AACAGAATTG    AGCTCAAAGG    TATGGACTTT
AAAGAAGATG GCAATATCCT TGGACACAAG
    421 TTGGAGTACA    ATTTTAACTC    ACATAATGTA
TACATTATGC CGGACAAAGC CAATAATGGA
    481 CTCAAAGTCA    ATTTCAAAAT    TAGACACAAT
ATCGAAGGTG GTGGTGTCCA ACTTGCTGAT
    541 CATTACCAAA    CAAATGTTCC    CCTTGGAGAC
GGTCCTGTCC TTATACCAAT CAATCACTAC
    601 CTATCCACGC    AAACGGCCAT    TTCAAAAGAT
CGAAATGAGA CGAGAGATCA TATGGTGTTT
    661 CTGGAATTTT    TCTCAGCTTG    TGGACATACA
CATGGCATGG ATGAACTATA CAAATAA
8.由权利要求7的核酸SEQ ID NO:10编码的蛋白,它具有SEQID NO:11所示的氨基酸序列
SEQ ID NO:11
1                              MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                             AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                            LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                            ValThrThrLeuGlyTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
81                            AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                           GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                           AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                           LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                           LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                           HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                           LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221                           LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
9.由权利要求7的核酸SEQ ID NO:12编码的蛋白,它具有SEQ IDNO:13所示的氨基酸序列
SEQ  ID  NO:13
1                             MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                            AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                            LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                             ValThrThrLeuAlaTyrGlyIleGlnCys
PheAlaArgTyrProGluHisMetLysMet
81                             AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                            GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                            AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                            LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                            LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                            HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                            LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221                            LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
10.由权利要求7的核酸SEQ ID NO:14编码的蛋白,它具有SEQ IDNO:15所示的氨基酸序列
SEQ ID NO:15
1                              MetSerLysGlyGluGluLeuPheThrGly
IleValProValLeuIleGluLeuAspGly
21                             AspValHisGlyHisLysPheSerValArg
GlyGluGlyGluGlyAspAlaAspTyrGly
41                             LysLeuGluIleLysPheIleCysThrThr
GlyLysLeuProValProTrpProThrLeu
61                             ValThrThrLeuSerTyrGlyIleLeuCys
PheAlaArgTyrProGluHisMetLysMet
81                            AsnAspPhePheLysSerAlaMetProGlu
GlyTyrIleGlnGluArgThrIlePhePhe
101                           GlnAspAspGlyLysTyrLysThrArgGly
GluValLysPheGluGlyAspThrLeuVal
121                           AsnArgIleGluLeuLysGlyMetAspPhe
LysGluAspGlyAsnIleLeuGlyHisLys
141                           LeuGluTyrAsnPheAsnSerHisAsnVal
TyrIleMetProAspLysAlaAsnAsnGly
161                           LeuLysValAsnPheLysIleArgHisAsn
IleGluGlyGlyGlyValGlnLeuAlaAsp
181                           HisTyrGlnThrAsnValProLeuGlyAsp
GlyProValLeuIleProIleAsnHisTyr
201                           LeuSerThrGlnThrAlaIleSerLysAsp
ArgAsnGluThrArgAspHisMetValPhe
221                           LeuGluPhePheSerAlaCysGlyHisThr
HisGlyMetAspGluLeuTyrLys*
11.编码显示绿色荧光蛋白生物活性的蛋白的脱氧核糖核酸,该脱氧核糖核酸含有编码其他蛋白或多肽的、在5’或3’末端与权利要求7的核苷酸序列连接的核苷酸序列,并编码显示大型多管水母绿色荧光生物活性的蛋白。
12.含各自被置于其启动子下游的权利要求7核苷酸序列或权利要求11的核苷酸序列的表达质粒。
CNB001338021A 2000-04-30 2000-11-06 绿色荧光蛋白及其编码序列 Expired - Lifetime CN1173993C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001338021A CN1173993C (zh) 2000-04-30 2000-11-06 绿色荧光蛋白及其编码序列

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN00107255.2 2000-04-30
CN00107255 2000-04-30
CNB001338021A CN1173993C (zh) 2000-04-30 2000-11-06 绿色荧光蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1321689A CN1321689A (zh) 2001-11-14
CN1173993C true CN1173993C (zh) 2004-11-03

Family

ID=25739289

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001338021A Expired - Lifetime CN1173993C (zh) 2000-04-30 2000-11-06 绿色荧光蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1173993C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011042181A1 (en) 2009-10-08 2011-04-14 Veterinärmedizinische Universität Wien Cell-tracking model system, transgenic for marker variants

Also Published As

Publication number Publication date
CN1321689A (zh) 2001-11-14

Similar Documents

Publication Publication Date Title
CN1160470C (zh) 研究体内蛋白质相互作用的方法
CN1681842A (zh) 减毒活寄生虫疫苗
CN1516734A (zh) 生产人胶原的转化蚕
CN1192037C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1726283A (zh) 利用c4bp支架制备多聚体融合蛋白
CN1639320A (zh) 冷休克诱导的异源多肽的表达和生产
CN1173993C (zh) 绿色荧光蛋白及其编码序列
CN1500801A (zh) 可提高联合固氮菌固氮水平的基因及其应用
CN1958794A (zh) 人肿瘤坏死因子相关凋亡诱导配体突变体编码cDNA及制备方法和应用
CN1283661C (zh) 重组悦目金蛛大壶状腺丝蛋白及其制备方法
CN1172955C (zh) 新的荧光蛋白
CN1216989C (zh) 一种新的青霉素g酰化酶及其应用
CN1614019A (zh) 人胰岛素基因在甲醇酵母中的分泌表达
CN1778930A (zh) 激发机体抗鸡球虫感染的融合基因及其编码蛋白与应用
CN1769436A (zh) 南京椴3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列
CN1303213C (zh) 启动子与其应用
CN1950505A (zh) 生产多肽的方法
CN1873000A (zh) 胞外分泌型表达系统pES2c及其制备方法
CN1920015A (zh) 在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法
CN1298742C (zh) 一种适合于高效表达的融合蛋白及其生产方法
CN1896104A (zh) 细胞抑制因子与白蛋白的融合蛋白
CN1763203A (zh) 一种基因重组人巨细胞病毒融合蛋白pp150/MDBP及其制备方法与应用
CN1948469A (zh) 一种s-腺苷甲硫氨酸生产菌株的构建及大规模发酵
CN1547610A (zh) 用于生长激素高表达的dna及其应用
CN1281749C (zh) 多肽及其用途和生产方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20041103