CN101809152A

CN101809152A - 深蓝色荧光蛋白质

Info

Publication number: CN101809152A
Application number: CN200880101774A
Authority: CN
Inventors: 永井健治; 友杉亘; 松田知己
Original assignee: Hokkaido University NUC
Current assignee: Hokkaido University NUC
Priority date: 2007-08-03
Filing date: 2008-08-01
Publication date: 2010-08-18
Also published as: JPWO2009020197A1; EP2189528A4; KR20100065294A; WO2009020197A1; US20100167394A1; EP2189528A1

Abstract

本发明提供一种具有新的发光波长峰的GFP的人工突变体。由在序列号1所示的氨基酸序列中，66位的氨基酸残基和175位的氨基酸残基分别被取代，而且72位的氨基酸残基或206位的氨基酸残基的至少一个氨基酸残基被取代的氨基酸序列构成的，发光波长峰为424nm的荧光蛋白质；或65位、145位、148位、46位、和/或203位的各氨基酸残基还被取代的，发光波长峰为424nm的，具有pH非依赖性荧光强度的荧光蛋白质。本发明的荧光蛋白质发出424nm这样的发光波长峰的荧光，其作为深蓝色可通过肉眼将其与其它荧光蛋白质识别开。而且，具有pH的变化不会影响荧光强度的pH非依赖性的荧光强度。

Description

深蓝色荧光蛋白质

技术领域

本发明涉及具有改良的荧光特性的荧光蛋白质、尤其是发出深蓝色光的荧光蛋白质。

背景技术

来源于发光水母的其中一种维多利亚多管发光水母(Aequorea victoria)的荧光蛋白质、即GFP(Green Fluorescence Protein)具有395nm的激发光谱峰和509nm的发光光谱峰，是一种发出绿色光的蛋白质(Chalfie等人、Science、1994年、第263卷、第802-805页)。该蛋白质在高温下稳定(Tm＝78℃)，在离液(chaotropic)试剂(例如8M尿素)中稳定，其具有以与其它蛋白质的融合蛋白质的形态较为稳定地表达，通过其荧光发色可以目测该融合蛋白质的存在等优点，可以使用无损伤的生物体或细胞，确认或观察生物体或细胞内特定物质的局部存在性、进而进行特定基因表达的确认，这给分子生物学中的研究带来大的变革。

现在广泛进行了进一步提高这种荧光蛋白质的有用性的研究，有许多关于将GFP的特定氨基酸残基取代为其它氨基酸的人工突变体的报告。GFP的人工突变体的构建目的大致分为荧光强度的增加和发光光谱的偏移。尤其是，通过使用多种发光光谱发生偏移的荧光蛋白质，可以同时确认多种不同物质的局部存在性或多个基因的表达，由此达到了关于发出各种荧光色的突变体的报告。

现已报道的GFP的人工突变体的突变部位和特征，可以列举例如下述的例子。而且，GFP的人工突变体突变体的表述，例如野生型GFP的氨基酸序列的N末端起的第66位的氨基酸残基酪氨酸(Y，以下只要没有特别事先说明，氨基酸用单字母表示)被取代为H的突变体表示为Y66H，多个氨基酸残基同时被取代的突变体的各个取代用连字符(-)连接。

Y66H：是发出蓝色的荧光蛋白质，荧光强度低，发光急速消失(非专利文献1)

V163A：是发出蓝色的荧光蛋白质，而且V163A-S175G获得耐热性，具有增强的荧光强度(专利文献1)

F64I、F64V、F64A、F64G、F64L：发光波长没有变化，但荧光强度增强的荧光蛋白质(专利文献2)

F64L-S65T-Y66H-Y145F：发出蓝色的，荧光强度低，发光急速消失的荧光蛋白质(专利文献3)

F64L-Y66H-Y145F-L236R、F64L-Y66H-Y145F-V163A-S175G-L236R、Y66H-Y145F-V163A-S175G、F64L-Y66H-Y145F：具有光稳定性的荧光蛋白质(专利文献4)

F64L-Y66H-S175G：呈现稳定的荧光特性，具有不同的激发光谱和/或发光光谱的蓝色荧光蛋白质(专利文献5)

F64L-Y66H-V163A：具有增强的荧光强度的蓝色荧光蛋白质(专利文献6)。

非专利文献1：Heim等人、1994年、Proc.Natl.Acad.Sci.USA、第91卷、第12501-12504页

专利文献1：国际公开第96/27675号

专利文献2：美国专利第6172188号

专利文献3：美国专利第5777079号

专利文献4：美国专利第6194548号

专利文献5：特表2005-511027

专利文献6：特表2000-509987

发明内容

本发明的第一个目的在于提供一种具有迄今没有报道过的新的最大发光波长峰的新荧光蛋白质。而且，由于含有野生型的GFP，以往的突变荧光蛋白质的荧光强度极大地依赖于pH的变化，在酸性下几乎丧失荧光，因此本发明的第二个目的在于提供一种迄今为止没有报道过的具有新的发光光谱且荧光强度不受pH的变化左右，具有pH非依赖性的荧光强度的新的荧光蛋白质。

本发明人以制成具有迄今为止没有报道过的新的发光波长峰，尤其是荧光强度在大范围pH下稳定保持的GFP的人工突变体作为目的进行研究，发现GFP的特定氨基酸被取代的突变体发挥这种特性，完成了下述各发明。

(1)由序列号1中所示的氨基酸序列中，66位的氨基酸残基和175位的氨基酸残基分别被取代，而且72位的氨基酸残基或206位的氨基酸残基的至少一个氨基酸残基被取代的氨基酸序列构成的，发光波长峰为424nm的荧光蛋白质。

(2)(1)所述的荧光蛋白质，72位的氨基酸残基和206位的氨基酸残基全都被取代。

(3)(2)所述的荧光蛋白质，66位的氨基酸残基被取代为苯基丙氨酸、72位的氨基酸残基被取代为丙氨酸、175位的氨基酸残基被取代为甘氨酸、和206位的氨基酸残基被取代为赖氨酸。

(4)(1)～(3)任一项所述的荧光蛋白质，其65位的氨基酸残基、145位的氨基酸残基或148位的氨基酸残基的至少一个氨基酸残基也被取代。

(5)(4)所述的荧光蛋白质，其65位的氨基酸残基、145位的氨基酸残基和148位的氨基酸残基均被取代。

(6)(5)所述的荧光蛋白质，其65位的氨基酸残基被取代为谷氨酰胺、145位的氨基酸残基被取代为甘氨酸、和148位的氨基酸残基被取代为丝氨酸。

(7)(4)～(6)任一项所述的荧光蛋白质，其46位的氨基酸残基也被取代。

(8)(7)所述的荧光蛋白质，其46位的氨基酸残基被取代为亮氨酸。

(9)(1)～(8)任一项所述的荧光蛋白质，其203位的氨基酸残基也被取代。

(10)(9)所述的荧光蛋白质，其203位的氨基酸残基被取代为缬氨酸。

(11)(10)所述的荧光蛋白质，其66位的氨基酸残基被取代为苯基丙氨酸、175位的氨基酸残基被取代为甘氨酸、72位的氨基酸残基被取代为丙氨酸、206位的氨基酸残基被取代为赖氨酸、65位的氨基酸残基被取代为谷氨酰胺、145位的氨基酸残基被取代为甘氨酸、148位的氨基酸残基被取代为丝氨酸、46位的氨基酸残基被取代为亮氨酸、和203位的氨基酸残基被取代为缬氨酸。

(12)(1)～(11)所述的荧光蛋白质中，再缺失、取代或添加了一个或多个氨基酸的氨基酸序列所构成的，发光波长峰为424nm的荧光蛋白质。

(13)(1)～(12)任一项所述的荧光蛋白质和任意蛋白质或多肽构成的融合蛋白质。

(14)编码(1)～(13)任一项所述的荧光蛋白质或融合蛋白质的核酸。

(15)表达(14)所述的核酸编码的荧光蛋白质或融合蛋白质的载体。

(16)由(15)所述的表达载体转化或转染的宿主细胞。

本发明的荧光蛋白质，首先，发出迄今为止没有的424nm这样的发光波长峰的荧光，其作为深蓝色可通过肉眼将其与其它荧光蛋白质识别开。具有pH的变化不会影响荧光强度的pH非依赖性的荧光强度的本发明的荧光蛋白质使得在以往困难的酸性环境下，利用荧光蛋白质成为可能。

附图说明

图1表示GFP、GFP的已知的氨基酸取代突变体和本发明的UMFP-1的荧光的显色。

图2表示本发明的荧光蛋白质和已知的荧光蛋白质的吸收光谱和发光光谱。图左为吸收光谱，图右为发光光谱。

图3表示涉及本发明的荧光蛋白质和已知的荧光蛋白质突变体(GFP和BFP)的发光强度的pH滴定曲线。

图4表示用355nm的激发光激发UMFP-3(红色)、EBFP(蓝色)时的荧光褪色曲线。

图5表示用355nm的激发光激发CΔ11UMFP-LE-NΔ4ECFP(蓝色)、UMFP-3(红色)、ECFP(蓝绿色)时的荧光光谱。

图6UC-SCAT3产生的细胞内中caspase3活性化的监控。纵轴越大，表示caspase3被活性化。横轴表示TNFα处理后的时间。

图7表示表达Sirius(浅蓝色)或EGFP(绿色)的大肠杆菌通过吞噬作用被吸收到细胞性粘菌(微分干涉像)中，逐步被消化的图像。图板上的数字表示从大肠杆菌被吸收到细胞性粘菌开始的时间(秒)。

图8由SC-SCAT3和SapRC2产生的细胞内的caspase3活性化和Ca2+动态的同时图像化。颜色越暖，表示caspase3的活性越高，Ca2+的浓度越高。而且，图板上部的数字表示从TNFα添加起的时间。

具体实施方式

本发明涉及一般被称为GFP的荧光蛋白质的突变体。本发明的突变体是来源于多管水母属(Aequorea属)生物、例如维多利亚多管发光水母(Aequoreavictoria)的GFP的特定的氨基酸残基被取代，发光波长峰为424nm的荧光蛋白质、而且其是由该荧光蛋白质中还缺失、取代或添加了1个或多个氨基酸的氨基酸序列构成，且发光波长峰为424nm的荧光蛋白质。该发光波长作为深蓝色(Ultra Marine)，用肉眼识别，通过肉眼可以明确地与以往已知的蓝色荧光蛋白质的发光色区分开来(图1)。以下，将发出深蓝色荧光的本发明的蛋白质表示为UMFP(Ultra Marine Fluorescence Protein)。

本发明的UMFP是序列号1中所示的氨基酸序列中特定位置的氨基酸被取代的荧光蛋白质。该序列号1中所示的氨基酸序列，维多利亚多管发光水母来源的野生型GFP的氨基酸序列中，64位的F被取代为L，65位的S被取代为T，66位的Y被取代为W，146位的N被取代为I，153位的M被取代为T，163位的V被取代为A，231位的H被取代为L的氨基酸序列。因此，本发明为，在野生型GFP的氨基酸序列中前述7个位置具有取代突变的氨基酸序列构成的荧光蛋白质，再取代特定部位的氨基酸而构成的具有多重取代突变的荧光蛋白质。而且，序列号1中所示的氨基酸序列是以前从Clontech公司以pECFP Vector的名称(目录号632309)购买的。

本发明的UMFP是含有序列号1中所示的氨基酸序列中66位(W)和175位(S)的氨基酸残基的取代，以及72位(S)或206位(A)的氨基酸残基的至少一个氨基酸残基的取代的蛋白质。以下，将该UMFP表示为UMFP-1。UMFP-1优选是包含序列号1中所示的氨基酸序列中66位、175位、72位和206位的4个氨基酸残基的取代的蛋白质。而且，UMFP-1优选是66位的氨基酸残基被取代为F、72位的氨基酸残基被取代为A，175位的氨基酸残基被取代为G和206位的氨基酸残基被取代为K的荧光蛋白质。以下，在用取代位置和取代后的氨基酸的种类表示本发明的荧光蛋白质时，由于以序列号1中所示的氨基酸序列为基础表示，因此通过用连字符连接，在取代位置和取代后的氨基酸的前面添加ECFP来表示。例如，上述UMFP-1的优选例子表示为ECFP-W66F-S72A-S175G-A206K。

而且，本发明包括上述UMFP-1中，65位(T)、145位(Y)或148位(H)中的任意氨基酸残基的任意，优选这3个氨基酸残基全部都同时被取代的荧光蛋白质。以下，将含有进一步取代的UMFP表示为UMFP-2。UMFP-2优选是在65位、145位和148位这3个氨基酸残基在被取代的荧光蛋白质。尤其是，优选UMFP-2是65位的氨基酸残基被取代为Q，145位的氨基酸残基被取代为G，和148位的氨基酸残基被取代为S的荧光蛋白质。前述3个氨基酸残基分别被取代为合适的氨基酸残基的本发明的UMFP-2的特别优选的例子表示为ECFP-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S。UMFP-2除了发光波长峰为424nm之外，还具有比UMFP-1高的荧光强度。该荧光强度，由于还在46位(F)导入了优选F46L这样的取代，因此可以进一步提高荧光强度。含有该46位取代的UMFP、即ECFP-F46L-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S也是UMFP-2的一种。

此外，本发明还包括，前述UMFP-1或UMFP-2中203位(T)也被取代的荧光蛋白质。以下将含有该进一步的203位的取代的UMFP称为UMFP-3。UMFP-3中优选的取代是T203V。

本发明的蛋白质的荧光波长，可以适当通过光学手段、例如分光光度计、荧光计CCD撮像素子等来测定。光谱特性可以作为本发明的蛋白质产生的发光的激发波长特性和发光波长特性被测定，根据这些光谱特性，可以确认形成激发波长和发光波长各个峰的波长。如果没有特别说明，例如本发明中“424nm”这样的记载可以采用包括优选424±3nm(更优选424±2nm)这样的含义。

通过上述的氨基酸取代，本发明的荧光蛋白质与公知的荧光蛋白质明确不同，在约424nm以下具有发光波长的峰。例如、公知的荧光蛋白质，发光波长峰有约450nm(例如、BFP)、约470nm(例如、CFP)、约510nm(例如、eGFP)、约530nm(例如、YFP)、约600nm(例如、DsRed)等的峰。与这些公知的波长峰明确不同的发光波长峰提高具有不同色彩的发光(例如、本发明的深蓝色)，由此可通过肉眼识别(图1)。

本发明的荧光蛋白质还具有与公知荧光蛋白质明确不同的，在约355nm处的激发波长峰。例如、公知的荧光蛋白质的激发波长峰有约380nm(例如、BFP)、约430nm(例如、CFP)、约480nm(例如、eGFP)、约510nm(例如、YFP)、约550nm(例如、DsRed)等的峰。因此，可以照射公知荧光蛋白质几乎不会反应的波长的激发光。

此外，本发明的荧光蛋白质，例如UMFP-3，其具有发光波长的峰为424nm，此外其荧光强度即使在酸性条件下也维持在高水平这种特点。wtGFP其它现有的GFP在酸性条件下，例如pH5以下的荧光强度，显著低于中性至弱碱性条件下、例如pH7～pH9下显示的荧光强度(通常降低70％～100％)，与之相对，例如本申请的UMFP-3的酸性条件下的荧光强度维持在中性至弱碱性条件下的荧光强度的至少50％以上、优选75％以上、更优选90％以上。而且，本发明的荧光蛋白质在酸性条件下(优选pH5以下、更优选pH3～pH5)的荧光强度也可以比碱性条件下(优选pH7以上、更优选pH7～pH9)的荧光强度强。即，本发明的荧光蛋白质中，相对于pH9下的荧光强度标准化的相对荧光强度，例如在pH3～9的范围内，可以在优选50％以内、优选25％以内、更优选10％以内变化。上述这种相对于pH变化在优选50％以内、优选25％以内、更优选10％以内变化的荧光强度，本说明书中表示为pH非依赖性荧光强度。

本说明书中所谓“提高的荧光强度”是指，与以往的荧光蛋白质相比，相对于具有一定波长的一定光量的激发光，本发明的荧光蛋白质的每摩尔的发光量高。作为由于在荧光蛋白质的氨基酸序列中导入突变而荧光强度上升的例子，可以列举本发明的UMFP-1和UMFP-3的比较，这个例子的情况显示，给各个荧光蛋白质照射355nm的激发光时，UMFP-3比原来的UMFP-1上升至少20％、优选至少30％、更优选至少40％。而且，本发明的荧光蛋白质，由于与公知的荧光蛋白质相比，激发光位于低波长侧，因此可以提供对于低波长激发光的较高的荧光强度。

例如，在UMFP-2的一种ECFP-F46L-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S中再导入T203V的取代的UMFP-3、即ECFP-F46L-W66F-S72A-S175G-A206K-T65Q-Y145V-H148S-T203V有以下这样的特征，即具有424nm的发光波长峰，具有比UMFP-1高至少20％、优选至少30％、更优选至少40％的荧光强度，且即使在酸性条件下，其荧光强度没有大的变化例如荧光强度的变化在50％以内、优选25％以内、更优选10％以内)。

本发明还包括这样的荧光蛋白质，其显示出UMFP的前述特征，例如、具有约424nm的发光波长峰，优选具有增高到约424nm的发光波长峰的荧光强度，更优选具有424nm的发光波长峰、和提高的荧光强度和pH非依赖性荧光强度的特征，且由在赋予本发明的UMFP特征的突变部位、即46位、66位、72位、175位、206位、65位、145位、148位和203位以外的部位，缺失、取代或添加了1个或多个氨基酸的氨基酸序列构成。本发明中氨基酸的取代、缺失、和/或添加涉及的所谓“1或多个”，是指1～数十个氨基酸以内、优选1～70个、更优选1～50个、更优选1～30个、尤为优选1～15个、1～14个、1～13个、1～12个、1～11个、1～10个、1～9个、1～8个、1～7个、1～6个、1～5个、1～4个、1～3个、1～2个或1个的氨基酸残基的变化。如果用氨基酸序列的同一性(％)来表示，可以表示为与序列号1表示的氨基酸序列具有80％以上、优选85％以上、更优选90％以上、尤为优选95％以上的同一性的氨基酸序列。

蛋白质的氨基酸序列，就氨基酸残基的电荷、大小、疏水性等物理化学的性质而言，可以经验性地确认可以允许保守性高的突变。例如、氨基酸残基的取代，可以列举甘氨酸(Gly)和脯氨酸(Pro)、Gly和丙氨酸(Ala)或缬氨酸(Val)、亮氨酸(Leu)和异亮氨酸(Ile)、谷氨酰胺酸(Glu)和谷氨酰胺(Gln)、天冬氨酸(Asp)和天冬酰胺(Asn)、半胱氨酸(Cys)和苏氨酸(Thr)、Thr和丝氨酸(Ser)或Ala、赖氨酸(Lys)和精氨酸(Arg)等。而且，本领域技术人员根据经验可得出，即使在超出上述保守性的情况下，还能够存在不丧失该蛋白质的本质功能的突变。因此，即使是由在UMFP中作为取代部位的特定的46位、66位、72位、175位、206位、65位、145位、148位和203位以外的部位，序列号1中记载的氨基酸序列中取代、缺失、和/或添加了1个或多个氨基酸的氨基酸序列构成的蛋白质，也存在具有作为UMFP的前述特征的情况，这些可被理解为是本发明的一个方式。例如，还包括由在前述46位、66位、72位、175位、206位、65位、145位、148位和203位以外部位的氨基酸以外，其余所有部位的氨基酸与wtGFP的氨基酸序列同一的氨基酸构成的荧光蛋白质。此外，本发明还包括这样的荧光蛋白质，即在前述46位、66位、72位、175位、206位、65位、145位、148位和203位以外的部位的氨基酸的取代不损伤本发明的UMFP的特征的上述功能，而且还带来酶的稳定性提高或荧光强度的增加等有益的特性变化。

而且，本发明的蛋白质在经时褪色上具有优点。即，与公知的荧光蛋白质相比，本发明的荧光蛋白质的褪色被延缓。例如，如本说明书中的实施例6和图4中所示，测定相对于紧随10秒的脉冲照射后的发光强度的1000秒后的发光强度，本发明的荧光蛋白质维持原有的约80％，而公知的EBFP只能维持约10％。此外，本发明的荧光蛋白质的特征还在于能够提供在至少照射后1000秒的范围内的线形型的褪色。

本发明的蛋白质可以单独制造，使用，也可以作为在本发明的蛋白质的N末端和/或C末端上添加本发明的蛋白质以外的蛋白质或多肽的所谓融合蛋白质来制造和使用。这种包含本发明的蛋白质的融合蛋白质也是本发明的一种方式。尤其是，本发明的UMFP，在与以往的GFP或其突变体相同使用目的中，可以与它们交换使用。例如，通过使某种蛋白质与本发明的UMFP的融合蛋白质在生物体或细胞内表达，可以调节该蛋白质在生物体或细胞内的局部存在性。而且，还以本发明的UMFP的表达作为目标，调节生物体或细胞内的基因表达控制机制。尤其是，由于本发明的UMFP-3具有pH非依赖性荧光强度，因此可以用于确认内涵体或溶酶体等以往已知无法利用或极难利用GFP或其突变体的酸性细胞器官中蛋白质的局部存在性，观察细胞内膜举动，以及其它目的。

由于本发明的荧光蛋白质的发光波长峰和激发波长峰都与公知的荧光蛋白质具有的各个峰不同，因此可以在同时使用多个荧光蛋白质的用途中利用。例如，由于本发明的荧光蛋白质的发光波长峰与公知的荧光蛋白质不同，因此通过肉眼可以识别本发明的荧光蛋白质(或其融合蛋白质)产生的发光和公知的荧光蛋白质(或其融合蛋白质)产生的发光(图1)。而且，由于本发明的荧光蛋白质的激发波长峰与公知的荧光蛋白质不同，因此利用公知的荧光蛋白质无法激发的波长的测定系统也是可能的。而且，根据上述这些优点，如果同时利用本发明的荧光蛋白质和公知的荧光蛋白质，可以进行比以往复杂，并且/或示差性上更为优异的同时的多重分析。

此外，由于本发明的荧光蛋白质与上述的公知的荧光蛋白质的激发波长峰和发光波长峰都不同，因此通过将本发明的蛋白质或其融合蛋白质与公知的荧光蛋白质或其融合蛋白质适当组合，可以构建利用在与以往不同的波长中荧光共振能量移动(Fluorescent Resonance Energy Transfer：FRET)的系统。FRET和其利用例是本领域技术人员公知的，例如记载于Takemoto，K.，Nagai，T.，Miyawaki，A.&Miura，M.Spatio-temporal activation of caspase revealed byindicator that is insensitive to environmental effects.J.Cell.Biol.160，235-243(2003)；Mizuno，H.，Sawano，A.，Eli，P.，Hama，H.&Miyawaki，A.Redfluorescent protein from Discosoma as a fusion tag and a partner for fluorescenceresonance resonance energy transfer.Biochemistry.40，2502-2510(2001).等。

此外，含有本发明的蛋白质的融合蛋白质，在添加了该功能性蛋白质显示的功能这方面，与单独制造或使用本发明的蛋白质时相比，具有更高的有用性。作为这种功能性蛋白质的例子，可以列举谷胱甘肽S转移酶(GST)、麦芽糖结合蛋白质(MBP)、蛋白质A、其它广泛用于融合蛋白质制造的蛋白质。而且，如果利用FLAG标记、组氨酸标记或几丁质结合序列这种容易进行重组蛋白质制造、尤其是重组蛋白质纯化的功能性多肽，可以更有利地进行本发明的蛋白质的制造。

此外，可以在本发明的蛋白质或含有本发明的蛋白质的融合蛋白质上，根据需要添加荧光物质或放射性物质等适当的标识化合物，或结合各种化学修饰物质或聚乙二醇等高分子，或使本发明中使用的蛋白质与不溶性载体结合。以这样形成的蛋白质作为对象的化学的修饰法是本领域技术人员周知的，只要不损伤本发明的蛋白质的功能，可以进行任意修饰、利用。

尤其是，在融合蛋白质制造中的提取操作或纯化操作等、或标识化蛋白质的制造中的标识化合物的添加反应等中，蛋白质可暴露在各种反应条件下。由于本发明的荧光蛋白质能够以pH非依赖性维持活性，因此其在各种反应条件下的耐受性高于公知的荧光蛋白质，我们认为由于这种特性，促进了本发明的蛋白质的利用。

本发明提供编码本发明的蛋白质或包含本发明蛋白质的融合蛋白质的核酸。核酸包括RNA或DNA，其形态，除了mRNA、cDNA之外，还包括化学合成DNA等，但没有特别限制。本发明的优选核酸是DNA。而且，本发明的核酸可以是单链，也可以和具有与其互补的序列的核酸或RNA结合形成双链、三链。此外，该核酸还可以用辣根过氧化物酶(HRPO)等酶或放射性同位素、荧光物质、化学发光物质等来标识。

本发明的核酸、优选编码本发明的蛋白质UMFP的DNA，由在序列号2中所示的编码GFP的碱基序列中，给予前述UMFP1～3特征的取代部位、即46位、66位、72位、175位、206位、65位、145位、148位和203位以外的密码子被取代为对应于各个氨基酸取代的密码子的碱基序列构成。而且，和由与涉及的碱基序列互补的碱基序列构成的核酸在严谨条件下杂交，且编码本发明的UMFP的核酸也包括在本发明的核酸中。本发明中的所谓严谨条件，是指在包括盐浓度1.5M的65℃的缓冲液中，与由和序列号2互补的碱基序列构成的核酸杂交，在50℃的2×SSC溶液(含有0.1％[w/v]SDS)下清洗DNA的条件(1×SSC为0.15M NaCl、0.015M柠檬酸钠)下维持杂交的条件。而且，如果用碱基序列的同一性(％)表示，可以是由与序列号2的碱基序列具有70％以上、优选80％以上、更优选90％以上、更优选95％以上同一性的碱基序列构成的核酸。这些方法，可以利用例如记载于Molecular Cloning 3rdEd.、Current Protocols in Molecular Biology，John Wiley&Sons 1987-1997等中的方法。

本发明的核酸可以基于由编码序列号1中所示的氨基酸序列的DNA、具体的是序列号2中所示的碱基序列构成的DNA，通过PCR、位点特异的突变法等其它一般的基因工程方法来制备。含有序列号2中所示的碱基序列构成的DNA的载体有各种市售产品，也可以直接利用这种DNA。而且部位特异的突变等基因工程方法记载于例如Maniatis T.等(MolecularCloning，aLaboratory Manual，Cold Spring harbor Laboratory，New York，1982年)以及其它本领域技术人员广泛利用的实验操作手册中。而且，本发明的核酸还可以基于序列号2中所示的碱基序列信息，通过亚磷酰胺(Phosphoramidite)法等化学合成的手法，或使用市售的DNA测序仪等直接制造。

作为编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸的DNA，可以整合到适当的表达载体，这种表达载体用于重组生产本发明的蛋白质或含有本发明蛋白质的融合蛋白质。这种蛋白质生产用的重组载体也包括于本发明中。本发明的载体可以是环状、支链状等任意形态，而且除了编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸，如有必要，还可以具有其它碱基序列。所谓其它碱基序列，是增强子序列、启动子序列、核糖体结合序列、以拷贝数扩增作为目的而使用的碱基序列、编码信号肽的碱基序列、编码其它多肽的碱基序列、polyA添加序列、剪切序列、复制起始点、形成选择标记的基因的碱基序列等。

在基因重组时，可以使用适当的合成DNA衔接子(adapter)将翻译起始密码子或翻译终止密码子添加在编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸上，或在碱基序列内使适当的限制性酶切断序列新产生或消失。这些都是在本领域技术人员通常进行作业的范围内，本领域技术人员可以基于编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸，任意且容易地加工。

而且带有编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸的载体，可以根据使用的宿主选择适当的载体，并使用，除了质粒，还可以使用噬菌体、杆状病毒、逆转录病毒、痘病毒等各种病毒。

作为可以利用的市售的表达载体，可以列举pcDM8(FUNAKOSHI公司制)、pcDNAI(FUNAKOSHI公司制)、pcDNAI/AmP(Invitrogen公司制)、EGFP-C1(Clontech公司制)、pREP4(Invitrogen公司制)、pGBT-9(Clontech公司制)等。本发明的蛋白质或含有本发明蛋白质的融合蛋白质的表达可以使编码该蛋白质的基因在固有的启动子序列的控制下表达。或者，在编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的碱基序列的上游连结其它适当的表达启动子后再使用。这种表达启动子可以根据宿主和表达目的适当选择，例如，在宿主为大肠杆菌时，可以列举T7启动子、lac启动子、trp启动子、λPL启动子等，在宿主为酵母时，可以列举PHO5启动子、GAP启动子、ADH启动子等，在宿主为动物细胞时，可以列举SV40来源启动子、逆转录病毒启动子、细胞巨化病毒(人CMV)的IE(immediate early)基因的启动子、金属硫蛋白启动子、热休克启动子、SRα启动子等。将编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸、优选DNA与上述例示的启动子连结、或整合到表达载体等的操作也可以基于前述Maniatis等人和其它实验操作手册的记载进行。

本发明的蛋白质或含有本发明蛋白质的融合蛋白质还可以使用例如Fmoc法(芴甲氧羰基法)或tBoc法(t-叔丁氧羰基法)等有机化学的合成方法、或使用市售的适当的肽合成机来制造，但优选通过基因重组技术，将前述核酸、尤其是整合到表达载体的DNA导入于使用从原核生物或真核生物中选择的适当的宿主细胞的合适的表达系统来制造。

作为宿主细胞的例子，可以列举埃希氏菌(Escherichia)属细菌、棒杆菌(Corynebacterium)属细菌、短杆菌(Brevibacterium)属细菌、芽孢杆菌(Bacillus)属细菌、沙雷氏菌(Serratia)属细菌、假单胞菌(Pseudomonas)属细菌、节杆菌(Arthrobacter)属细菌、欧文氏菌(Erwinia)属细菌、甲基杆菌(Methylobacterium)属细菌、红细菌(Rhodobacter)属细菌、链霉菌(Streptomyces)属微生物、发酵单胞菌(Zymomonas)属微生物、酵母菌(Saccharomyces)属酵母等微生物、蚕等昆虫细胞、HEK293细胞、MEF细胞、Vero细胞、Hela细胞、CHO细胞、WI38细胞、BHK细胞、COS-7细胞、MDCK细胞、C127细胞、HKG细胞、人肾细胞株等动物细胞。

作为在宿主细胞中导入表达载体的方法，可以通过最初由前述Maniatis等人进行的记载于实验操作手册中的方法、例如、电穿孔法、原生质体法、碱金属法、磷酸钙沉淀法、DEAE右旋糖苷法、显微注射法、粒子枪法等进行。对于Sf9或Sf21等昆虫细胞的利用，记载于杆状病毒(杆状病毒)表达载体(杆状病毒expression vectors)、实验室手册、W.H.Freeman and Company、NewYork、1992年)或Bio/Technology、1988年、第6卷、第47页等中。

本发明的蛋白质或含有本发明蛋白质的融合蛋白质可以通过使前述表达载体在上述宿主细胞内表达，从宿主细胞或培养基中回收并纯化目的蛋白质来获得。作为纯化蛋白质的方法，可以从蛋白质纯化中通常使用的方法中适当选择适当的方法来进行。即，从盐析法、超滤法、等电点沉淀法、凝胶过滤法、电泳法、离子交换层析、疏水性层析或抗体层析等各种亲合层析、色谱聚焦法、吸附层析和逆相层析等通常可使用的方法中适当选择合适的方法，可以根据需要使用HPLC系统等，按适当的顺序进行纯化。

而且，在本发明的蛋白质与组氨酸标记和FLAG标记等作为融合蛋白质表达时，优选采用针对该标记等的特征性的纯化法。可以用适当的蛋白酶(凝血酶、胰蛋白酶等)切断融合蛋白质，回收本发明的蛋白质。此外，利用重组DNA分子，通过无细胞系的合成方法获得的方法也是基因工程法生产的方法的1种。

这种本发明的蛋白质可以以单独形态，也可以以与其它种类的蛋白质的融合蛋白质的形态来制备，但不仅限于此，还可以使本发明的蛋白质再变换为各种形态。例如，可以考虑对蛋白质的各种化学修饰、与聚乙二醇等高分子的结合、与不溶性载体的结合、封入脂质体等通过本领域技术人员公知的多种手法进行的加工。

此外，作为与本发明的蛋白质特异性结合的抗体，可以列举单克隆抗体、多克隆抗体、嵌合抗体、单链抗体、人化抗体等免疫特异的抗体，但特别优选单克隆抗体。这种抗体可以通过使用本发明的蛋白质作为抗原，通过常规的操作，免疫非人动物，回收血清，或诱导产生单克隆抗体的杂交瘤细胞来制造。此外，按照常规方法，例如，可以用FITC(异硫氰基荧光素)或四甲基罗丹明异氰酸酯等荧光物质、放射性同位素、碱性磷酸酶或过氧化物酶等酶蛋白质来标识。

本发明的蛋白质可以在以往已知的利用GFP或其突变体作为标记的各种分子生物学方法中，作为代替该GFP或其突变体的标记蛋白质来使用。例如、本领域技术人员利用如Invitrogen公司制的pRSET/EmGFP载体等这样的能够简单地使与GFP的融合蛋白质表达的载体，或制备将市售的各种载体中编码GFP的ORF替换为编码本发明的蛋白质的ORF的载体，可以简便地制造或利用任意蛋白质与本发明的蛋白质的融合蛋白质。通过使用这种载体，还可以测定或确认该任意蛋白质在生物体内或细胞内的表达、细胞和/或细胞外局部存在性，测定方法。测定或确认可以通过检测或测定本发明的蛋白质或含有本发明蛋白质的融合蛋白质的荧光发光来进行。

此外，将编码本发明的蛋白质或含有本发明蛋白质的融合蛋白质的核酸连接在任意功能性核酸的控制下，通过检测或测定本发明的蛋白质或含有本发明蛋白质的融合蛋白质的荧光发光，还可以研究该功能性核酸的控制机制，探索促进或抑制该功能性核酸的功能的物质。

【实施例】

<实施例1>UMFP-1(ECFP-W66F-S72A-S175G-A206K)的制备

用限制性酶BamHI和EcoRI切出Invitrogen公司制的pcDNA3中带有的编码ECFP(由序列号1中所示的氨基酸序列构成的突变荧光蛋白质)的DNA(ECFP基因)，将其重组于用相同限制性酶开环的质粒载体pRSETB(Invitrogen公司)中，制成pRSETB/ECFP。以该质粒载体作为模板，使用下述的引物DNA，按照Asano等人的方法(Nuc.Acid Res.，2000年、第28卷、第16号、e78)，导入S72A、S175G和A206K这3个位点的氨基酸突变。

引物1：CAGTGCTTCAGCCGCTACCCC(序列号：3)

引物2：GAGGACGGCAGCGTGCAGCTC(序列号：4)

引物3：ACCCAGTCCGCCCTGAGCAAA(序列号：5)

即，制备含有500ng的pRSETB/ECFP、各10pmol的引物1～3、3.75nmol的dNTPs、1.25U的Pfu DNA聚合酶、20U的Pfu DNA连接酶(STRATAGENE公司)的20μL反应液，以进行65℃、5分钟的预温育，通过Pfu DNA连接酶修复模板DNA的缺口，然后，95℃、1分钟的DNA变性后，95℃、10秒钟的DNA变性、55℃、30秒钟的退火反应和65℃、10分钟的伸长·连结反应作为1个循环，进行20个循环的热循环反应。在20μL热循环反应后的反应溶液中加入0.4μL(8U)的DpnI(New England BioLabs公司)，于37℃温育1小时，再进行酚氯仿提取纯化DNA后，通过氯化钙法，转化大肠杆菌JM109(DE3)，获得了具有编码ECFP-S72A-S175G-A206K(序列号：15)的DNA(序列号：14)的质粒载体pRSETB/mSECFP。

以该载体作为模板，使用下述引物进行热循环反应。

引物4：ACCCTGACCTTCGGCGTGCAG(序列号：6)

热循环的反应条件是，除了使用的引物，其余与先前所示的热循环反应相同的条件。通过该反应，制备出编码添加了组氨酸标记的ECFP-W66F-S72A-S175G-A206K(UMFP-1)的载体pRSETB/UMFP-1。UMFP-1的核苷酸序列和氨基酸序列分别记载于序列号：16和17。

将使用该载体，通过氯化钙法被转化的大肠杆菌JM109(DE3)在2mL含有100μg/mL的氨苄西林的LB液体培养基中，于23℃培养4天，将获得的细胞用法式细胞破碎器(French Press)破碎。从通过离心分离除去破碎后的残渣的上清液中，用nickel chelating柱(Qiagen公司制)，用含有100mM咪唑和300mM NaCl的50mMTris盐酸缓冲液pH7.4洗脱添加了组氨酸标记的ECFP-W66F-S72A-S175G-A206K，进行回收，再通过PD-10脱盐·缓冲液交换用柱(GE Healthcare Bio-Sciences公司)，将缓冲液交换成50mMHEPES缓冲液pH7.4，获得了添加了组氨酸标记的ECFP-W66F-S72A-S175G-A206K(UMFP-1)(约7.5mg/mL)。

<实施例2>UMFP-2(ECFP-F46L-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S)的制备

以实施例1中制备的pRSETB/UMFP-1作为模板，使用下述引物DNA进行热循环反应。

引物5：ACCACCCTGCAATTCGGCGTG(序列号：7)

引物6：GAGTACAACGGGATCAGCCAC(序列号：8)

引物7：GGGATCAGCTCAAACGTCTAT(序列号：9)

即，制备含有500ng的pRSETB/UMFP-1、各10pmol的引物5～7、3.75nmol的dNTPs、1.25U的Pfu DNA聚合酶、20U的Pfu DNA连接酶(STRATAGENE公司)的20μL反应液，以进行65℃、5分钟的预温育，通过Pfu DNA连接酶修复模板DNA的缺口，然后，95℃、1分钟的DNA变性后，95℃、10秒钟的DNA变性、55℃、30秒钟的退火反应和65℃、10分钟的伸长·连结反应作为1个循环，进行20个循环的热循环反应。在20μL热循环反应后的反应溶液中加入0.4μL(8U)的DpnI(New England BioLabs公司)，于37℃温育1小时，再进行酚氯仿提取纯化DNA后，通过氯化钙法，转化大肠杆菌JM109(DE3)，获得了具有编码ECFP-W66F-S72A-S175G-A206K-T65Q-Y145V-H148S(序列号：19)的DNA(序列号：18)的质粒载体pRSETB/ECFP-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S。

以该载体作为模板，使用下述引物进行热循环反应，获得了pRSETB/UMFP-2。

引物8：ACCCTGAAGCTCATCTGCACC(序列号：10)

热循环的反应条件是，除了使用的引物，其余与先前所示的热循环反应相同的条件。使用pRSETB/UMFP-2，进行与实施例1同样的操作，获得了添加了组氨酸标记的UMFP-2(约9.3mg/mL)。UMFP-2的核苷酸序列和氨基酸序列分别记载于序列号：20和21。

<实施例3>UMFP-3(ECFP-F46L-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S-T203V)的制备

以实施例2制备的pRSETB/UMFP-2作为模板，使用下述引物DNA进行热循环反应，获得了pRSETB/UMFP-3。

引物9：TACCTGAGCGTCCAGTCCGCC(序列号：11)

热循环的反应条件是，除了使用的引物，其余与先前所示的热循环反应相同的条件。使用pRSETB/UMFP-3，进行与实施例1同样的操作，获得了添加了组氨酸标记的UMFP-3(约9.3mg/mL)。UMFP-3的核苷酸序列和氨基酸序列分别记载于序列号：22和23。

<实施例4>UMFP的激发波长峰和发光波长峰的测定

用50mM的HEPES缓冲液(pH7.4)将实施例1～3中制备的UMFP-1～3/50mM HEPES缓冲液pH7.4的水溶液稀释100倍，用荧光分光光度计(HITACHI F-2500)测定激发光谱和荧光光谱。并且，同时，在与UMFP同一条件下测定wtGFP、已知的GFP的人工突变体BFP(Heim等人、前述非专利文献1)、CFP(Heim等人、Curr.Biol.、1996年、第6卷、第178-182页)、YFP(Ormoe等人、1994年、Science、第273卷、第1392-1395)和DsRed(Terskikh等人、2000年、Science、第290卷、第1585-1588页)的激发光谱和荧光光谱。将各荧光蛋白质的最大亮度标准化成1的荧光光谱示于图2。UMFP1～3的激发波长的峰都是在约355nm，发光波长的峰都在约424nm。

<实施例5>UMFP-3的pH非依赖性荧光强度

使用50mM Glycine-HCl缓冲液(pH3.0～3.4)、50mM NaOAc(pH3.8～5.4)、50mM MES(pH5.8～6.2)、50mM MOPS(pH6.6～7.0)、50mM HEPES(pH7.4～7.8)、50mM Glycine(pH8.6～9.0)，制备pH3.0～9.0范围的缓冲液，测定2μM的UMFP-3/各缓冲液20mM的荧光，计算各pH下的荧光强度。而且，对GFP和BFP进行同样的测定。其结果示于图3。

GFP和BFP，它们在酸性环境下的荧光强度都减少到1/2以下。另一方面，UMFP-3的荧光强度在广泛的pH范围(pH3.0～9.0)下稳定。

<实施例6>UMFP-3的光稳定性

通过使UMFP-3和用于比较的EBFP在HeLa细胞中瞬时表达，进行光稳定性的测定。用Surperfect(Invitrogen)，将pcDNA3/UMFP-3、pcDNA3/EBFP分别转染培养于35mm的玻底培养皿的HeLa细胞。转染1天后，确认各个重组蛋白质在细胞质中正常表达，进行光稳定性的测定。显微镜采用NikonTE-2000E倒置显微镜，物镜采用Flour、40倍、开口数1.30的油浸物镜。UMFP-3、EBFP的荧光，在340-380nm的波长域激发，用435-485nm的波长域的带通滤波器检测。图4表示对在表达UMFP-3、EBFP各个荧光蛋白质的HeLa细胞中遇到10秒钟激发光时，进行反复摄影的操作获得的荧光强度的褪色曲线。如图4中所示，如果测定相对于测定10秒的脉冲照射后不久的发光强度的1000秒后的发光强度，本发明的荧光蛋白质维持其的约80％，但公知的EBFP的情况是只能维持约10％。而且，该图还显示，本发明的荧光蛋白质还能够提供在至少照射后1000秒的范围内线形型的褪色。

<实施例7>以UMFP-3作为供体，以ECFP作为受体的FRET传能对的制作和FRET效率的研究

在测定UMFP-3和ECFP的荧光光谱和FRET效率时，制作用限制性酶XhoI的识别序列亮氨酸、谷氨酰胺酸这2个连接子氨基酸连结删除了C末端11氨基酸的UMFP-3和删除N末端4个氨基酸的mSECFP的嵌合蛋白质(以下CΔ11UMFP-LE-NΔ4ECFP：核苷酸序列和氨基酸序列分别记载于序列号：24和25)。通过使用含有限制性酶BamHI的识别序列的正义引物和含有限制性酶XhoI的识别序列的反义引物进行PCR使CΔ11UMFP的cDNA扩增。而且，通过使用含有限制性酶XhoI的识别序列的正义引物和含有限制性酶EcoRI的识别序列的反义引物，进行PCR使NΔ4ECFP的cDNA。将进行了限制性酶处理的产物导入于pRSETB(Invitrogen)，制作出大肠杆菌表达质粒的pRSETB/CΔ11UMFP-LE-NΔ4ECFP。将pRSETB/CΔ11UMFP-LE-NΔ4ECFP、pRSETB/UMFP-3、pRSETB/ECFP导入大肠杆菌JM109(DE3)，在室温下使各个重组蛋白质表达，进行采用多组氨酸标记的纯化。纯化的试样的荧光光谱的测定使用F-2500荧光分光光度计(HITACHI)。测定使用将浓度为2μM的试样溶解于50mM HEPES(pH7.4)的产物。图5表示用355nm的激发光激发CΔ11UMFP-LE-NΔ4ECFP(蓝色)、UMFP-3(红色)、ECFP(蓝绿色)时的荧光光谱。通过该实验，计算出CΔ11UMFP-LE-NΔ4ECFP的FRET效率为约66％。就FRET效率而言，例如，采用由于FRET效率的优越性而一般使用的CFP-YFP的FRET传能对的cAMP指示剂(文献：Ponsioen，B.et al.Detecting cAMP-induced Epac activation by fluorescence resonanceenergy transfer：Epac as a novel cAMP indicator.EMBO Rep.5，1176-1180(2004).)，有记载指出，根据荧光光谱进行判断，其FRET效率为几个％左右。因此，本荧光蛋白质传能对与以往相比，用低波长的激发光，就可以以极高的效率发生FRET。

<实施例8>采用UMFP-3和mSECFP的FRET传能对的SCAT type指示剂产生的Caspase-3活性化的实时成像

制成使用由UMFP-3向mSECFP的FRET的半胱氨酸蛋白酶caspase3的活性化指示剂UC-SCAT3(核苷酸序列和氨基酸序列分别记载于序列号：26和27)。表达本指示剂基因的质粒UC-SCAT3-pcDNA3.1(-)通过以下方式制作，即用限制性酶KpnI和HindIII切断由竹本等人开发的利用ECFP和Venus作为FRET传能对的caspase3活性化指示剂SCAT3(Takemoto K，Nagai T，Miyawaki A，et al.：Spatio-temporal activation of caspase revealed by indicatorthat is insensitive to environmental effects.J.Cell Biol.160：235-243，2003.)的Venus基因，在其中导入UMFP-3，再用限制性酶BamHI和KpnI切断ECFP基因，在其中导入mSECFP。用Surperfect(Invitrogen)将UC-SCAT3-pcDNA3.1(-)转染培养于35mm的玻底培养皿的HeLa细胞，使之在细胞质中表达。转染1天后进行成像。而且，为了诱导细胞凋亡，在进行成像的90分钟前，用50ng/ml TNFα和10μg/ml的环己酰亚胺处理细胞。观察使用NikonTE-2000E倒置显微镜，物镜使用Apo-VC、60倍、开口数1.35的油浸物镜。在352-388nm波长域激发在HeLa细胞的细胞质中表达的UC-SCAT3。荧光的检测，对于UMFP-3，使用415-455nm的波长域的带通滤波器检测，对于ECFP，使用459-499nm的波长域的带通滤波器检测。图6的左图表示右图的各圆框内(ROI：Region Of Interst)中UMFP-3/mSECFP伴随Caspase-3的活性化的比率的变化。横轴表示自观察开始时起的经过时间。由该图，清楚了伴随UMFP-3/mSECFP荧光强度比的变化，可以检测Caspase-3的活性化。

<实施例9>UMFP-4(ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V)的制备

以实施例3中制备的编码UMFP-3(ECFP-F46L-T65Q-W66F-S72A-Y145G-H148S-S175G-A206K-T203V)的质粒载体pRSETB/UMFP-3作为模板，使用下述的引物DNA，进行热循环反应。

引物10：5’-TTCGGGGTGCTGTGCTTCGCC-3’(序列号：12)

即，制备含有50ng的pRSETB/UMFP-3、10pmol的引物10、3.75nmol的dNTPs、1.25U的Pfu DNA聚合酶、20U的Pfu DNA连接酶(STRATAGENE公司)的20μL反应液，以进行65℃、5分钟的预温育，通过Pfu DNA连接酶修复模板DNA的缺口，然后，95℃、1分钟的DNA变性后，95℃、10秒钟的DNA变性、55℃、30秒钟的退火反应和65℃、10分钟的伸长·连结反应作为1个循环，进行20个循环的热循环反应。在20μL热循环反应后的反应溶液中加入0.4μL(8U)的DpnI(New England BioLabs公司)，于37℃温育1小时，再进行酚氯仿提取纯化DNA后，通过氯化钙法，转化大肠杆菌JM109(DE3)，获得了具有编码ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V(UMFP-4)的质粒载体pRSETB/UMFP-4。UMFP-4的核苷酸序列和氨基酸序列分别记载于序列号：28和29。

将用该载体pRSETB/UMFP-4，通过氯化钙法转化的大肠杆菌JM109(DE3)在200mL含有100μg/mL的氨苄西林的LB液体培养基中，于23℃培养4天，用法式细胞破碎器(French Press)破碎所得细胞。从通过离心分离除去了破碎后的残渣的上清液中，用nickel chelating柱(Qiagen公司制)，用含有100mM咪唑和300mM NaCl的50mMTris盐酸缓冲液pH7.4回收添加了组氨酸标记的ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V。再通过PD-10脱盐·缓冲液交换用柱(GEHealthcare Bio-Sciences公司)，将缓冲液交换成50mM HEPES缓冲液pH7.4，获得了约500μg/mL添加了组氨酸标记的ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V(UMFP-4)。

<实施例10>Sirius(ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S)的制备

以<实施例9>中制备的编码ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V的质粒载体pRSETB/UMFP-4作为模板，使用下述的引物DNA，进行热循环反应。

引物11：5’-TTCGGGGTGCTGTGCTTCGCC-3’(序列号：13)

即，制备含有50ng的pRSETB/UMFP-4、10pmol的引物11、3.75nmol的dNTPs、1.25U的Pfu DNA聚合酶、20U的Pfu DNA连接酶(STRATAGENE公司)的20μL反应液，以进行65℃、5分钟的预温育，通过Pfu DNA连接酶修复模板DNA的缺口，然后，95℃、1分钟的DNA变性后，95℃、10秒钟的DNA变性、55℃、30秒钟的退火反应和65℃、10分钟的伸长·连结反应作为1个循环，进行20个循环的热循环反应。在20μL热循环反应后的反应溶液中加入0.4μL(8U)的DpnI(New England BioLabs公司)，于37℃温育1小时，再进行酚氯仿提取纯化DNA后，通过氯化钙法，转化大肠杆菌JM109(DE3)，获得了具有编码ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S(Sirius)的DNA的质粒载体pRSETB/Sirius。Sirius的核苷酸序列和氨基酸序列分别记载于序列号：30和31。

将用该载体pRSETB/Sirius，通过氯化钙法转化的大肠杆菌JM109(DE3)在200mL含有100μg/mL的氨苄西林的LB液体培养基中，于23℃培养4天，用法式细胞破碎器(French Press)破碎所得细胞。从通过离心分离除去了破碎后的残渣的上清液中，用nickel chelating柱(Qiagen公司制)，用含有100mM咪唑和300mM NaCl的50mMTris盐酸缓冲液pH7.4回收添加了组氨酸标记的ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S(Sirius)。再通过PD-10脱盐·缓冲液交换用柱(GEHealthcare Bio-Sciences公司)，将缓冲液交换成50mM HEPES缓冲液pH7.4，获得了约500μg/mL ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S(Sirius)。

<实施例11>采用双光子激发显微镜观察由细胞性粘菌盘基网柄菌(Dictyostelium discoideum)产生的对表达Sirius的大肠杆菌E.Coli的吞噬作用

预先于23.3℃、10mL的HL5培养基中培养细胞性粘菌AX2，用<实施例10>制备的质粒载体pRSETB/Sirius通过氯化钙法转化大肠杆菌JM109(DE3)后，于2mL含有100μg/mL的氨苄西林的LB液体培养基中，37℃、培养12小时。通过离心使细胞性粘菌AX2沉淀后，再次悬浮于BSS缓冲液，通过离心使表达Sirius的大肠杆菌JM109(DE3)沉淀后，再次悬浮于PBS缓冲液中。在35mmPetri Dish上的1％琼脂糖凝胶上，将悬浮于缓冲液的细胞性粘菌AX2和表达Sirius的大肠杆菌JM109(DE3)混合。然后在室温下温育1小时，将35mmPetri Dish上的琼脂糖凝胶翻过来，用显微镜观察混合的细胞性粘菌AX2和表达Sirius的大肠杆菌JM109(DE3)。显微镜使用多光子激发显微镜Olympus Fluoview FV300，物镜使用UPlan FLN、40倍、开口数1.30(Olympus)的油浸物镜。激光使用Ti：sapphire(MAITAI，SpectraPhysics公司)，用780nm的激发光对Sirius激发双光子，进行荧光观察。图7表示表达Sirius的大肠杆菌由于吞噬作用而进入到细胞性粘菌，并逐渐被消化的情形。该图显示，荧光强度为pH非依赖性的Sirius，相比于荧光强度依赖于pH的EGFP，可以明确确认进入到处于酸性条件下的粘菌的吞噬体中的大肠杆菌的样子。

<实施例12>同时使用以Sirius作为供体，以mSECFP作为受体的FRET传能对和以Sapphire作为供体，以DsRed作为受体的FRET传能对的1个波长激发测4个波长的荧光的Dual FRET观察

最初，制备使用由Sirius向mSECFP的FRET的半胱氨酸蛋白酶caspase3的活性化指示剂SC-SCAT3(核苷酸序列和氨基酸序列分别记载于序列号：32和33。)。表达本指示剂基因的质粒SC-SCAT3-pcDNA3.1(-)通过用限制性酶KpnI和HindIII切断<实施例8>中制备的UC-SCAT3的UMFP-3基因，在其中导入Sirius制成。

使该caspase3指示剂SC-SCAT3和钙离子指示剂SapRC2(Mizuno H，Sawano A，Miyawaki A，et al.：Red Fluorescent Protein from Discosoma as aFusion Tag and a Partner for Fluorescence Resonance Energy Transfer.Biochemistry.40：2502-2510，2001.)这两组的FRET传能对在HeLa细胞内中表达。即，通过使用4μl的Surperfect(Invitrogen)，将1μg/dish的pcDNA3.1(-)/SC-SCAT3和pcDNA3/SapRC2导入于培养在35mm玻底培养皿上的HeLa细胞中，使之共表达来进行。

观察在导入质粒载体2天后进行。而且，为了在HeLa细胞中诱导细胞凋亡，在即将进行成像前，用50ng/ml TNFα和10μg/ml环己酰亚胺处理细胞。Wide-field荧光观察用TE-2000E倒置显微镜(Nikon)进行，物镜使用Apo-VC、60倍、开口数1.35的油浸物镜(Nikon)。而且，干涉滤镜都使用Semrock公司的产品。

SC-SCAT3、SapRC2的发光观察，都是以水银弧光灯作为光源，通过FF01-370/36的激发滤片和CFW-Di0i-Clin的二色镜激发。Sirius、mSEECFP、Sapphire、DsRed的荧光检测分别通过FF01-435/40、FF01/479/40、FF01-525/39、FF01-585/40的滤片进行。图8表示同时经时观察细胞凋亡过程的HeLa细胞内caspase3的活性化和Ca2+的动态图像。由该图清楚了，可以同时观察伴随由于使caspase3指示剂SC-SCAT3和钙离子指示剂SapRC2在细胞中共表达而诱导的细胞死亡的caspase3的活性化和钙离子浓度的时间变化。

【工业上利用的可能性】

本发明的荧光蛋白质第一次发出从未有过的424nm这样的发光波长峰的荧光，作为深蓝色，可以通过肉眼与其它荧光蛋白质识别开来。而且，荧光强度不受pH的变化影响的具有pH非依赖性的荧光强度的本发明的荧光蛋白质可以使原本难以在酸性环境下利用荧光蛋白质成为可能。因此，本发明的荧光蛋白质能够提供用于使用无损伤的生物体或细胞，通过目视观察或确认生物体或细胞内的特定物质的局部存在性，以及进行特定基因表达的确认等的，可适于更多种条件的荧光蛋白质，能够对分子生物学中的研究等有大的贡献。

SEQUENCE LISTING

<110>National University Corporation Hokkaido University

<120>Ultra marine fluorescent protein

<130>PCT08-0042

<150>JP 2007-203300

<151>2007-08-03

<160>33

<170>PatentIn version 3.5

<210>1

<211>239

<212>PRT

<213>Aequorea victoria

<400>1

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>2

<211>720

<212>DNA

<213>Aequorea victoria

<400>2

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgacctg gggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacat cagccacaac gtctatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>3

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer1

<400>3

cagtgcttca gccgctaccc c 21

<210>4

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer2

<400>4

gaggacggca gcgtgcagct c 21

<210>5

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer3

<400>5

acccagtccg ccctgagcaa a 21

<210>6

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer4

<400>6

accctgacct tcggcgtgca g 21

<210>7

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer5

<400>7

accaccctgc aattcggcgt g 21

<210>8

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer6

<400>8

gagtacaacg ggatcagcca c 21

<210>9

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer7

<400>9

gggatcagct caaacgtcta t 21

<210>10

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer8

<400>10

accctgaagc tcatctgcac c 21

<210>11

<211>21

<212>DNA

<213>Artificial sequence

<220>

<223>primer9

<400>11

tacctgagcg tccagtccgc c 21

<210>12

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>primer10

<400>12

ttcggggtgc tgtgcttcgc c 21

<210>13

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>primer11

<400>13

ttcggggtgc tgtgcttcgc c 21

<210>14

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>ECFP-S72A-S175G-A206K

<400>14

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgacctg gggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacat cagccacaac gtctatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>15

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>ECFP-S72A-S175G-A206K

<400>15

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Trp Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>16

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>UMFP-1

<400>16

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgacctt cggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacat cagccacaac gtctatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>17

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>UMFP-1

<400>17

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>18

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>ECFP-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S

<400>18

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>19

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>ECFP-W66F-S72A-S175G-A206K-T65Q-Y145G-H148S

<400>19

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>20

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>UMFP-2

<400>20

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagct catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>21

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>UMFP-2

<400>21

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>22

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>UMFP-3

<400>22

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagct catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagcg tccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>23

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>UMFP-3

<400>23

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>24

<211>1395

<212>DNA

<213>Artificial Sequence

<220>

<223>C(delta)11UMFP-LE-N(delta)4ECFP

<400>24

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagct catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggggtgcag tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagcg tccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccctcgag gaggagctgt tcaccggggt ggtgcccatc 720

ctggtcgagc tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag 780

ggcgatgcca cctacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc 840

gtgccctggc ccaccctcgt gaccaccctg acctggggcg tgcagtgctt cagccgctac 900

cccgaccaca tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag 960

gagcgcacca tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc 1020

gagggcgaca ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc 1080

aacatcctgg ggcacaagct ggagtacaac tacatcagcc acaacgtcta tatcaccgcc 1140

gacaagcaga agaacggcat caaggccaac ttcaagatcc gccacaacat cgaggacggc 1200

agcgtgcagc tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg 1260

ctgcccgaca accactacct gagcacccag tccgccctga gcaaagaccc caacgagaag 1320

cgcgatcaca tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac 1380

gagctgtaca agtaa 1395

<210>25

<211>464

<212>PRT

<213>Artificial Sequence

<220>

<223>C(delta)11UMFP-LE-N(delta)4ECFP

<400>25

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Leu Glu Glu Glu Leu Phe Thr Gly Val Val Pro Ile

225 230 235 240

Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser

245 250 255

Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe

260 265 270

Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr

275 280 285

Thr Leu Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met

290 295 300

Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln

305 310 315 320

Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala

325 330 335

Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys

340 345 350

Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu

355 360 365

Tyr Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys

370 375 380

Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly

385 390 395 400

Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp

405 410 415

Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala

420 425 430

Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu

435 440 445

Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

450 455 460

<210>26

<211>1491

<212>DNA

<213>Artificial Sequence

<220>

<223>UC-SCAT3

<400>26

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgacctg gggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacat cagccacaac gtctatatca ccgccgacaa gcagaagaac 480

ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtcc 720

tcgtccgagc tcagcggaga tgaggtcgat ggtaccagcg gaagcgaatt catggtgagc 780

aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 840

aacggccaca ggttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 900

accctgaagc tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 960

accctgcaat tcggggtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac 1020

ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gtaccatctt cttcaaggac 1080

gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 1140

atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 1200

tacaacggga taagctcaaa cgtatatatc accgccgaca agcagaagaa cggcatcaag 1260

gcccacttca agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac 1320

cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 1380

gtccagtcca agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 1440

ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta a 1491

<210>27

<211>496

<212>PRT

<213>Artificial Sequence

<220>

<223>UC-SCAT3

<400>27

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Ser

225 230 235 240

Ser Ser Glu Leu Ser Gly Asp Glu Val Asp Gly Thr Ser Gly Ser Glu

245 250 255

Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile

260 265 270

Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser

275 280 285

Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu

290 295 300

Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr

305 310 315 320

Thr Leu Gln Phe Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met

325 330 335

Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln

340 345 350

Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala

355 360 365

Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys

370 375 380

Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu

385 390 395 400

Tyr Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys

405 410 415

Asn Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly

420 425 430

Gly Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp

435 440 445

Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys

450 455 460

Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu

465 470 475 480

Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

485 490 495

<210>28

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>UMFP-4

<400>28

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagct catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggcgtgctg tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagcg tccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>29

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>UMFP-4

<400>29

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Leu Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>30

<211>720

<212>DNA

<213>Artificial Sequence

<220>

<223>ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S

(Sirius)

<400>30

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacag gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagct catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgcaatt cggcgtgctg tgcttcgccc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg taccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaacgggat aagctcaaac gtatatatca ccgccgacaa gcagaagaac 480

ggcatcaagg cccacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagcg tccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt ccgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210>31

<211>239

<212>PRT

<213>Artificial Sequence

<220>

<223>ECFP-F46L-T65Q-W66F-Q69L-S72A-Y145G-H148S-S175G-A206K-T203V-F223S

(Sirius)

<400>31

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Gln Phe Gly Val Leu Cys Phe Ala Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly Gly

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Ser

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210>32

<211>1491

<212>DNA

<213>Artificial Sequence

<220>

<223>SC-SCAT3

<400>32

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgacctg gggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacat cagccacaac gtctatatca ccgccgacaa gcagaagaac 480

ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtcc 720

tcgtccgagc tcagcggaga tgaggtcgat ggtaccagcg gaagcgaatt catggtgagc 780

aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 840

aacggccaca ggttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 900

accctgaagc tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 960

accctgcaat tcggcgtgct gtgcttcgcc cgctaccccg accacatgaa gcagcacgac 1020

ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gtaccatctt cttcaaggac 1080

gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 1140

atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 1200

tacaacggga taagctcaaa cgtatatatc accgccgaca agcagaagaa cggcatcaag 1260

gcccacttca agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac 1320

cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 1380

gtccagtcca agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 1440

tccgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta a 1491

<210>33

<211>496

<212>PRT

<213>Artificial Sequence

<220>

<223>SC-SCAT3

<400>33

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Ser

225 230 235 240

Ser Ser Glu Leu Ser Gly Asp Glu Val Asp Gly Thr Ser Gly Ser Glu

245 250 255

Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile

260 265 270

Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Arg Phe Ser Val Ser

275 280 285

Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu

290 295 300

Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr

305 310 315 320

Thr Leu Gln Phe Gly Val Leu Cys Phe Ala Arg Tyr Pro Asp His Met

325 330 335

Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln

340 345 350

Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala

355 360 365

Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys

370 375 380

Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu

385 390 395 400

Tyr Asn Gly Ile Ser Ser Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys

405 410 415

Asn Gly Ile Lys Ala His Phe Lys Ile Arg His Asn Ile Glu Asp Gly

420 425 430

Gly Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp

435 440 445

Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Val Gln Ser Lys

450 455 460

Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu

465 470 475 480

Ser Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

485 490 495

Claims

1.一种荧光蛋白质，由在序列号1所示的氨基酸序列中，66位的氨基酸残基和175位的氨基酸残基分别被取代，而且72位的氨基酸残基或206位的氨基酸残基的至少一个氨基酸残基也被取代的氨基酸序列构成，发光波长峰为424nm。

2.如权利要求1所述的荧光蛋白质，其72位的氨基酸残基和206位的氨基酸残基全都被取代。

3.如权利要求2所述的荧光蛋白质，其66位的氨基酸残基被取代为苯基丙氨酸，72位的氨基酸残基被取代为丙氨酸，175位的氨基酸残基被取代为甘氨酸，和206位的氨基酸残基被取代为赖氨酸。

4.如权利要求1～3中任一项所述的荧光蛋白质，其65位的氨基酸残基、145位的氨基酸残基或148位的氨基酸残基的至少一个氨基酸残基也被取代。

5.如权利要求4所述的荧光蛋白质，其65位的氨基酸残基、145位的氨基酸残基和148位的氨基酸残基均被取代。

6.如权利要求5所述的荧光蛋白质，其65位的氨基酸残基被取代为谷氨酰胺，145位的氨基酸残基被取代为甘氨酸，和148位的氨基酸残基被取代为丝氨酸。

7.如权利要求4～6中任一项所述的荧光蛋白质，其46位的氨基酸残基也被取代。

8.如权利要求7所述的荧光蛋白质，其46位的氨基酸残基被取代为亮氨酸。

9.如权利要求1～8中任一项所述的荧光蛋白质，其203位的氨基酸残基也被取代。

10.如权利要求9所述的荧光蛋白质，其203位的氨基酸残基被取代为缬氨酸。

11.如权利要求10所述的荧光蛋白质，其66位的氨基酸残基被取代为苯基丙氨酸，175位的氨基酸残基被取代为甘氨酸，72位的氨基酸残基被取代为丙氨酸，206位的氨基酸残基被取代为赖氨酸，65位的氨基酸残基被取代为谷氨酰胺，145位的氨基酸残基被取代为甘氨酸，148位的氨基酸残基被取代为丝氨酸，46位的氨基酸残基被取代为亮氨酸，和203位的氨基酸残基被取代为缬氨酸。

12.一种荧光蛋白质，由权利要求1～11所述的荧光蛋白质中，再缺失、取代或添加了一个或多个氨基酸的氨基酸序列所构成，发光波长峰为424nm。

13.一种融合蛋白质，由权利要求1～12中任一项所述的荧光蛋白质和任意的蛋白质或多肽构成。

14.一种核酸，编码权利要求1～13中任一项所述的荧光蛋白质或融合蛋白质。

15.一种载体，表达由权利要求14所述的核酸所编码的荧光蛋白质或融合蛋白质。

16.一种宿主细胞，由权利要求15所述的表达载体转化或转染。