具体实施方式
本发明使用以下缩写:
G-CSF人粒细胞集落刺激因子,mG-CSF人粒细胞集落刺激因子突变体,HSA人血清白蛋白,PEG聚乙二醇,rHSA/G-CSF重组人血清白蛋白粒细胞集落刺激因子,rHSA/mG-CSF重组人血清白蛋白粒细胞集落刺激因子突变体。
用于定义氨基酸残基取代的缩写举例说明如下:K34指氨基酸序列中编号34的位置是赖氨酸残基;K34H指编号34的赖氨酸残基被组氨酸残基取代;K34H+K40H指编号34的赖氨酸残基被组氨酸残基取代并且编号40的赖氨酸残基被组氨酸残基取代。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。
实施例1突变位点的筛选
将位于G-CSF受体结合界面及相关的多个氨基酸残基进行突变构建了多个rHSA/G-CSF的突变体,除序列差异外,突变体的构建方法同实施例2。并在毕赤酵母中进行了表达(表达纯化方法如实施例3-5记载),对这些获得的突变体通过SPR(表面等离子共振)技术进行了测定配基-受体亲合力测定,以及细胞水平的生物学活性试验。通过SPR技术可以获得结合速度常数和解离速度常数并因此直接确定配体-受体平衡解离常数(Zhou等,Biochemistry,32:8193-8198,1993;Faegerstram和Osh annessy,In handbook ofAffinity Chromatography,Marcel Dekker INc,NY,1993),平衡解离常数越大,表明配体与受体的亲合力越低。在本发明的实施例8中,详细描述了通过SPR技术测定rHSA/G-CSF与G-CSFR结合亲合力的方法。在本发明的实施例7中,详细描述了测定突变体体外生物学活性的方法。38个rHSA/mG-CSF的突变体的试验结果如表1所示。
表1
|
平衡解离常数KD(nmol/L) |
体外活性%(按摩尔比计) |
|
平衡解离常数KD(nmol/L) |
体外活性%(按摩尔比计) |
G-CSF |
0.3 |
100 |
A37G |
7.4 |
16 |
rHSA/G-CSF |
1.3 |
15.6 |
T38S |
6.7 |
15 |
T1A |
1.7 |
30 |
K40H |
25.2 |
14 |
P2K |
1.2 |
12 |
L41I |
17.1 |
12 |
L3T |
1.8 |
40 |
H43R |
4.3 |
3.8 |
G4Y |
1.1 |
38 |
P44K |
1.6 |
18 |
P5R |
1.5 |
44 |
E45D |
0.8 |
15 |
A6G |
8.9 |
11 |
E46D |
8.5 |
16 |
S7T |
1.6 |
12 |
Q70K |
5.9 |
17 |
P10K |
0.9 |
11 |
Q90K |
6.8 |
17 |
Q11N |
3.4 |
11 |
L108I |
7.2 |
6.1 |
S12T |
1.1 |
17 |
D109E |
6.5 |
12 |
L15I |
4.8 |
15 |
D112E |
3.1 |
1.3 |
K16H |
7.3 |
17 |
T115S |
2.5 |
12 |
C17S |
1.3 |
16 |
T116S |
2.5 |
17 |
L19I |
11.2 |
5.6 |
Q119N |
1.8 |
13 |
Q20N |
97.5 |
1.2 |
Q120K |
1.5 |
15 |
K34H |
18.4 |
18 |
E123D |
1.5 |
14 |
L35I |
12.5 |
11 |
L124I |
1.4 |
16 |
*rHSA/G-CSF:实施例2-4的方法制备
由试验结果可以看到,与rHSA/G-CSF相比,K34H,L35I,K40H,L41I这几个位点的突变,平衡解离常数高,活性却没有明显提高,这说明这几个突变体与受体的亲和力较低。而T1A,L3T,G4Y,P5R等位点突变后活性较高,但是对亲和力影响不大。
根据以上实验结果,重新设计了一些突变位点组合:K34H+L35I,K34H+K40H,K34H+L41I,L35I+K40H,L35I+L41I,K40H+L41I,突变体的获得方法按上文所述,按上文的方法进行第二轮优化筛选试验,并按照实施例7的方法测定其体外活性,以及实施例9的方法测定其体内半衰期,结果如表2所示。同时,将文献报道能够延长G-CSF体内半衰期的D110H和D113H突变位点引入作为对照(Sarker等,Nature Biotech,20:908-913,2002)。本实施例中的G-CSF不含N端Met,D110H和D113H位点对应为D109H和D112H。
表2
样品 |
平衡解离常数KD(nmol/L) |
体外活性(%) |
半衰期(小时) |
G-CSF |
0.3 |
100 |
2.8 |
rHSA/G-CSF |
1.3 |
16 |
8.5 |
K34H+L35I |
42.7 |
18 |
12.6 |
K34H+K40H |
40.1 |
12 |
18.0 |
K34H+L41I |
28.5 |
17 |
13.2 |
L35I+K40H |
25.5 |
17 |
21.9 |
L35I+L41I |
23.5 |
13 |
16.7 |
K40H+L41I |
30.6 |
15 |
24.5 |
D109H+D112H |
5.3 |
13 |
8.8 |
由上述结果可见,这些突变体相比rHSA/G-CSF半衰期获得了延长,与受体的亲和力获得了降低,体内生物活性获得了提高。而能够延长G-CSF单体半衰期的突变(D109H,D112H)用于HSA融合蛋白,并未能显著延长半衰期。
实施例2rHSA/G-CSF以及突变体rHSA/mG-CSF酵母表达菌株的构建
在实施例1研究的基础上,对突变体进行了进一步的优化,最终筛选出一株与受体亲合力低、半衰期长,且活性高的优化菌株,该菌株发生了T1A,L3T,G4Y,P5R,K34H,L35I,K40H,L41I这些位点的突变。菌株的构建方法如下:
编码HSA/G-CSF(参见SEQ NO:5)和HSA/mG-CSF(参见SEQ NO:6)的DNA序列由上海Invitrogen公司合成,并插入到pMD18-T(TaKaRa)中,构建成质粒HSA/G-CSF/pMD18-T和HSA/mG-CSF/pMD18-T。HSA带有其天然的信号肽序列,并在信号肽序列前加入BamHI位点,G-SCF的3’端加入EcoRI位点。
HSA/G-CSF/pMD18-T质粒用BamHI/EcoRI酶切,分别回收HSA/G-CSF和HSA/mG-CSF片段,并分别连接到相同酶切的pPIC9质粒上,转化E.coli DH5a感受态细胞,最后涂布于含50ug/ml氨苄青霉素的LB琼脂平板上,37℃培养过夜,直到长出单克隆菌斑。转化斑按常规方法提取质粒,用BamHI/EcoRI酶切鉴定,有目的大小片段切下的质粒,送往上海Invitrogen公司测序。
测序验证正确的质粒,经SalI酶切线性化后,用电转化转化至感受态GS115细胞中,涂布于RDB平板(1M山梨醇,2%葡萄糖,1.34%YNB,4×10-5%生物素,0.005%氨基酸(不含组氨酸)上,于30℃培养3天,至单菌落出现。
实施例3rHSA/G-CSF以及突变体rHSA/mG-CSF的表达筛选
将实施例2转化的重组酵母单菌落接种至10ml BMGY液体培养基(1%酵母浸出物,2%蛋白胨,100mM磷酸钾,pH6.0,1.34%YNB,4×10-5%生物素,1%甘油)中,30℃,250rpm培养24小时后,静置过夜,弃上清,加入10ml含1%甲醇的BMMY液体培养基(1%酵母浸出物,2%蛋白胨,100mM磷酸钾,pH6.0,1.34%YNB,4×10-5%生物素,1%甲醇),30℃,250rpm诱导,每24小时补加一次甲醇,共诱导72小时。从0小时起,每隔10小时取1ml诱导菌液至1.5ml离心管中,5000g离心5分钟。取40μl上清加入10μl 5×Loadingbuffer,沸水浴中煮5分钟,12%SDS-PAGE电泳,以GS115空菌诱导72小时样为对照,分析表达情况。
实施例4rHSA/G-CSF以及突变体rHSA/mG-CSF在酵母中的表达
挑取实施例3获得的含有rHSA/G-CSF以及突变体rHSA/mG-CSF重组体的单菌落接种于BMGY培养基中,30℃震荡培养过夜,A600约为5.0。离心收集菌体,以BMMY培养基重悬菌体至A600为2.0后诱导表达,每隔24h补加甲醇至甲醇终浓度为2%,72h后离心收集上清。
在毕赤酵母中生产的融合蛋白的表达水平用市售的G-CSF ELISA试剂(QuantikineHuman G-CSF Immunoassay,R&D system Cat No.DCS50)进行定量,表达水平约为200mg/L。
实施例5从酵母表达上清中纯化rHSA/mG-CSF
将实施例4的酵母表达上清离心,离心好的上清液上样于用平衡缓冲液(20mM PH 7.0)预先平衡好的Blue Sepharose CL6B亲和层析柱(GE Healthcare,XK26/20,50mL),上样完成后用平衡缓冲液洗两个柱体积洗脱未结合的蛋白,然后用洗脱缓冲液(20mM PB,2M NaCl,10%甘油,pH7.0)洗脱目标蛋白(图2)。
在GE Healthcare公司的XK26/20柱中装入20mL的Phenyl High Sub疏水胶,流动相A为20mM PH 7.0加1mol/L(NH4)2SO4,流动相B为20mM pH 7.0的PB缓冲液。将上一步亲和层析收集的目标峰补加硫酸铵至硫酸铵终浓度为1M,上样于预先用流动相A平衡好的上述层析柱,上完样后用流动相A平衡2个柱体积,再用50%的流动相B洗脱,收集目标峰(图3)。
在GE Healthcare公司的XK16/20柱中装入10mL的Sepharose Q FF胶,流动相A为20mMPH 7.0,流动相B为20mM 0.5M NaCl,pH 7.0。先将上一步的疏水层析洗脱峰用纯水稀释2倍,然后上样于用流动相A平衡好的上述层析柱,上完样后再用流动相A平衡2个柱体积,然后以10个柱体积,0-100%流动相B的线性梯度洗脱,收集目标峰(图4)。
实施例6鉴定和定量rHSA/mG-CSF
对象:实施例5纯化获得的rHSA/mG-CSF。
1.蛋白浓度测定采用Bradford方法。
2.SDS-聚丙烯酰胺凝胶电泳
对纯化好的rHSA/mG-CSF进行12%SDS聚丙烯酰胺电泳,明显可见一条分子量为85KD的单一条带。(图5)
3.分子筛层析(SEC-HPLC)
SEC-HPLC采用TSK Gel G3000 Swxl柱,缓冲液为50mM PB,0.25M NaCl,pH7.0,表观分子量约为85KD。(图6)
4.反相层析-高效液相色谱(RP-HPLC)
RP-HPLC采用VYDAC protein C4 TP5415柱,流动相A为:含0.1%TFA的水溶液,流动相B采用含0.1%TFA的9∶1乙腈∶水溶液,结果显示,所纯化的rHSA/mG-CSF纯度为98%。
5.氨基酸序列分析
通过氨基酸序列分析能更准确地测定蛋白组成。对纯化的rHSA/mG-CSF进行N端及C端的氨基酸分析表明,经过实验确定的氨基酸序列与预期的一致。
实施例7测定rHSA/mG-CSF的体外生物学活性
对象:实施例5纯化获得的rHSA/mG-CSF。
rHSA/mG-CSF的体外活性测定选用G-CSF依赖细胞株NFS60,以MTT法测定生物学活性(中华人民共和国药典,2005版,三部)。
1.标准品溶液的制备
取重组人粒细胞刺激因子生物学活性测定的国家标准品(中国药品生物制品检定所,批号98/01),按说明书复溶,用基础培养液稀释至每毫升含50~100IU。在96孔细胞培养板中,做2倍系列稀释,共8个稀释度,每个稀释度做2孔。每孔分别留50μl标准品溶液,弃去孔中多余溶液。
2.供试品溶液的制备
取供试品按标示量溶解后,用基础培养液稀释至每毫升含50~100IU。在96孔细胞培养板中,做2倍系列稀释,共8个稀释度,每个稀释度做2孔。每孔分别留50μl供试品稀释液,弃去孔中多余溶液。
3.测定
NFS 60细胞株用完全培养液于37℃、5%CO2培养,控制细胞浓度为每毫升含1×105~4×105个细胞,传代24~36小时后用于测定。取足量NFS 60细胞培养物,离心收集细胞,用RPMI 1640培养液洗两次,然后重悬于基础培养液(RPMI 1640900ml+新生牛血清100ml)配成每毫升含2×105个细胞的细胞悬液。在加有标准品和供试品的96孔板中每孔加入细胞悬液50μl,于37℃、5%CO2培养40~48小时。每孔加入MTT溶液20μl,于37℃、5%CO2培养5小时。每孔加入裂解液100μl,37℃过夜,用酶标仪于波长570nm处测定吸光度,以630nm为参比波长,其中一个典型的活性检测结果参见图7,活性为天然G-CSF的48%。实验数据采用ORIGIN 7.0软件(Microcal公司)或四参数回归计算法进行处理,并用以下公式计算:
式中Pr为标准品生物学活性,IU/ml;Ds为供试品预稀释倍数;Dr为标准品预稀释倍数;Es为供试品相当于标准品半效量的稀释倍数;Er为标准品半效稀释倍数。
实施例8测定rHSA/mG-CSF与受体亲合力的配基-受体结合-解离常数
1.G-CSFR的偶联
用Biacore
控制软件Wizard中的氨基偶联方法将受体G-CSFR(R&D公司,,货号381GR/CF)偶联到CM5芯片的FC
4道上。HBS-P缓冲液(10mM HEPES,150mM NaCl,0.005%(v/v)的surfactant P20,pH 7.4)作为工作缓冲液,1mg/mL的G-CSFR用pH 4.5,10mM NaAC稀释至终浓度为20μg/mL。芯片表面用0.2M EDC和50mM NHS 1∶1混合以10μL/min的流速进样7分钟,然后注射G-CSFR溶液,以pH 8.5,1M ethanolamine进样7分钟,封闭活化的芯片表面。
2.用SPR(表面等离子共振)方法测配体和受体的结合活性。
用HBS-P缓冲液将rHSA/mG-CSF和G-CSF标准品定量稀释,按Biacore
控制软件中的动力学分析Wizard进行动力学实验。所有样品进样时,流速为30μL/min,进样3min,解离5min,然后分别用50mM NaOH,1M NaCL和HBS-P缓冲液以100μL/min的流速进样15s、60s进行再生。得到的数据根据Biacore 3000分析软件中的1∶1 Langmuir结合模型进行拟合,得到确切的动力学常数:
结合速度常数ka和解离速度常数kd,然后计算出平衡解离常数KD=kd/ka。实施例5纯化获得的rHSA/mG-CSF最终检测其平衡解离常数为42.6nm/L。
实施例9rHSA/G-CSF及rHSA/mG-CSF的体内半衰期试验
采用雄性Sprague Dawley大鼠,在给药的当天,称量动物体重(每只280-310克),将rHSA/G-CSF和rHSA/mG-CSF样品按每千克体重100μg经尾静脉注射给三只大鼠,注射后30分钟,1,2,4,8,24,48,72,96,120小时取血。室温储存血样1.5小时后,离心分离血清,-80℃储存样品。采用双抗体夹心ELISA法检测样品中rHSA/G-CSF、rHSA/mG-CSF的血药浓度,具体操作参见Human G-CSF DuoSet试剂盒Human G-CSF ELISA ConstructionKit(ANTIGENIX)的操作手册。得到标准品的数据用MicroCal Origin软件中的四参数逻辑曲线绘制标准曲线,并求回归方程及相关统计参数;用Microsoft Excel 2003软件将样品数据代入标准曲线的回归方程计算相关数值并作图。结果见图8,未突变的rHSA/G-CSF和突变的rHSA/mG-CSF(实施例5获得)的半衰期经测定分别为8.5小时和25.5小时;说明在G-CSF中引入新的氨基酸替换导致体内半衰期明显增加。
实施例10rHSA/G-CSF及rHSA/mG-CSF体内生物学活性分析
SPF Sprague Dawley大鼠(250-270克)按6只/组随机分组。给药前24小时,对每只大鼠腹腔注射50mg/kg的环磷酰胺(CPA)。在给药当天,将rHSA/G-CSF和rHSA/mG-CSF样品按每千克体重100μg分别静脉或者皮下注射6只随机分配的大鼠。在给药前,以及给药后6、12、24、36、48、72、96、120、144和168小时,从尾静脉采血300μl,加EDTA使其稳定。对血清样品进行白细胞计数。结果如图9所示,rHSA/G-CSF和rHSA/mG-CSF给药后3小时白细胞水平增加,之后白细胞水平由于化疗下降,约48小时达到最小值,rHSA/mG-CSF给药组白细胞下降水平明显低于对照rHSA/G-CSF组。给药约48小时后,rHSA/mG-CSF给药的大鼠白细胞数目恢复正常水平,而对照的rHSA/G-CSF给药的大鼠在72小时后中性粒细胞数目才开始接近正常水平。与对照组比较,rHSA/mG-CSF给药组的白细胞减少症的持续时间大大缩短。
序列表
<110>泰州贝今生物技术有限公司
<120>G-CSF融合蛋白突变体及其制备与应用
<130>
<160>6
<170>PatentIn version 3.3
<210>1
<211>174
<212>PRT
<213>Homo sapiens
<400>1
Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys
1 5 10 15
Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln
20 25 30
Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val
35 40 45
Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys
50 55 60
Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser
65 70 75 80
Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser
85 90 95
Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp
100 105 110
Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro
115 120 125
Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe
130 135 140
Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe
145 150 155 160
Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
165 170
<210>2
<211>174
<212>PRT
<213>人工序列
<220>
<221>MISC_FEATURE
<223>mG-CSF序列,与G-CSF相比,发生了T1A,L3T,G4Y,P5R,K34H,L35I,
K40H,L41I位点的突变
<400>2
Ala Pro Thr Tyr Arg Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys
1 5 10 15
Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln
20 25 30
Glu His Ile Cys Ala Thr Tyr His Ile Cys His Pro Glu Glu Leu Val
35 40 45
Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys
50 55 60
Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser
65 70 75 80
Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser
85 90 95
Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp
100 105 110
Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro
115 120 125
Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe
130 135 140
Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe
145 150 155 160
Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
165 170
<210>3
<211>783
<212>PRT
<213>人工序列
<220>
<221>SIGNAL
<222>(1)..(24)
<223>人血清白蛋白信号肽
<400>3
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
20 25 30
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
35 40 45
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
50 55 60
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
100 105 110
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
130 135 140
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
145 150 155 160
Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
180 185 190
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
195 200 205
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
210 215 220
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
245 250 255
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
275 280 285
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
290 295 300
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
305 310 315 320
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
325 330 335
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
355 360 365
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
370 375 380
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
385 390 395 400
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
405 410 415
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
420 425 430
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
450 455 460
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
465 470 475 480
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
485 490 495
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
515 520 525
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
530 535 540
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
565 570 575
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
580 585 590
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
595 600 605
Leu Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu
610 615 620
Lys Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu
625 630 635 640
Gln Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu
645 650 655
Val Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser
660 665 670
Cys Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His
675 680 685
Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile
690 695 700
Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala
705 710 715 720
Asp Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala
725 730 735
Pro Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala
740 745 750
Phe Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser
755 760 765
Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
770 775 780
<210>4
<211>783
<212>PRT
<213>人工序列
<220>
<221>SIGNAL
<222>(1)..(24)
<223>人血清白蛋白信号肽
<400>4
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
20 25 30
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
35 40 45
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
50 55 60
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
100 105 110
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
130 135 140
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
145 150 155 160
Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
180 185 190
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
195 200 205
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
210 215 220
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
245 250 255
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
275 280 285
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
290 295 300
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
305 310 315 320
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
325 330 335
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
355 360 365
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
370 375 380
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
385 390 395 400
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
405 410 415
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
420 425 430
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
450 455 460
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
465 470 475 480
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
485 490 495
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
515 520 525
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
530 535 540
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
565 570 575
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
580 585 590
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
595 600 605
Leu Ala Pro Thr Tyr Arg Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu
610 615 620
Lys Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu
625 630 635 640
Gln Glu His Ile Cys Ala Thr Tyr His Ile Cys His Pro Glu Glu Leu
645 650 655
Val Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser
660 665 670
Cys Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His
675 680 685
Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile
690 695 700
Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala
705 710 715 720
Asp Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala
725 730 735
Pro Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala
740 745 750
Phe Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser
755 760 765
Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
770 775 780
<210>5
<211>2352
<212>DNA
<213>人工序列
<220>
<221>sig_peptide
<222>(1)..(72)
<223>人血清白蛋白信号肽
<400>5
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 60
gtgtttcgtc gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120
gaaaatttca aagccttggt gctgattgcc tttgctcagt atcttcagca gtgtccattt 180
gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240
gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300
gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360
gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420
agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480
aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540
tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600
tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660
agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720
gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780
gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840
agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900
gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960
gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020
aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080
aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140
ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200
tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260
cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320
caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380
tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440
ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagggt cactaaatgc 1500
tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560
tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620
tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagcttgt gaaacacaag 1680
cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740
aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800
gctgcaagtc aagctgcctt aggcttaaca ccattaggcc ctgccagctc cctgccccag 1860
agcttcctgc tcaagtgctt agagcaagtg aggaagatcc agggcgatgg cgcagcgctc 1920
caggagaagc tgtgtgccac ctacaagctg tgccaccccg aggagctggt gctgctcgga 1980
cactctctgg gcatcccctg ggctcccctg agcagctgcc ccagccaggc cctgcagctg 2040
gcaggctgct tgagccaact ccatagcggc cttttcctct accaggggct cctgcaggcc 2100
ctggaaggga tctcccccga gttgggtccc accttggaca cactgcagct ggacgtcgcc 2160
gactttgcca ccaccatctg gcagcagatg gaagaactgg gaatggcccc tgccctgcag 2220
cccacccagg gtgccatgcc ggccttcgcc tctgctttcc agcgccgggc aggaggggtc 2280
ctggttgcct cccatctgca gagcttcctg gaggtgtcgt accgcgttct acgccacctt 2340
gcccagccct ga 2352
<210>6
<211>2352
<212>DNA
<213>人工序列
<220>
<221>sig_peptide
<222>(1)..(72)
<223>人血清白蛋白信号肽
<400>6
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 60
gtgtttcgtc gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120
gaaaatttca aagccttggt gctgattgcc tttgctcagt atcttcagca gtgtccattt 180
gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240
gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300
gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360
gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420
agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480
aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540
tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600
tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660
agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720
gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780
gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840
agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900
gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960
gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020
aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080
aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140
ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200
tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260
cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320
caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380
tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440
ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagggt cactaaatgc 1500
tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560
tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620
tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagcttgt gaaacacaag 1680
cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740
aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800
gctgcaagtc aagctgcctt aggcttagca ccaacatacc gtgctagctc cctgccccag 1860
agcttcctgc tcaagtgctt agagcaagtg aggaagatcc agggcgatgg cgcagcgctc 1920
caggagcata tttgtgccac ctaccatatt tgccaccccg aggagctggt gctgctcgga 1980
cactctctgg gcatcccctg ggctcccctg agcagctgcc ccagccaggc cctgcagctg 2040
gcaggctgct tgagccaact ccatagcggc cttttcctct accaggggct cctgcaggcc 2100
ctggaaggga tctcccccga gttgggtccc accttggaca cactgcagct ggacgtcgcc 2160
gactttgcca ccaccatctg gcagcagatg gaagaactgg gaatggcccc tgccctgcag 2220
cccacccagg gtgccatgcc ggccttcgcc tctgctttcc agcgccgggc aggaggggtc 2280
ctggttgcct cccatctgca gagcttcctg gaggtgtcgt accgcgttct acgccacctt 2340
gcccagccct ga 2352