人干细胞生长因子突变蛋白及其制法和药物组合物
发明领域
本发明涉及生物技术领域。具体地说,本发明涉及一种活性和表达量有所提高的重组人干细胞生长因子突变蛋白。另外,本发明还涉及该突变蛋白的制备方法以及含有该突变蛋白的药物组合物。
发明背景
自1990年美国3个研究组几乎同时报道干细胞因子以来,世界各地进行了广泛深入的研究。干细胞因子又称肥大细胞生长因子(MGF),Kit配体(KL)及Steel因子(SLF)。它是由骨髓微环境中的基质细胞产生的一种酸性糖蛋白。其糖基连在肽键的N和O基团上,相对分子质量31000~36000,由非共价结合的两个相同亚基组成。等电点PI=3.8。
SCF在小鼠由10号染色体Steel位点编码。在人中位于12 q22~24。SCF有2种存在形式:可溶性和膜结合型。在人中,编码248个氨基酸的mRNA(SCF248),其第6个外显子中有一蛋白切割位点。由此mRNA表达165个氨基酸的可溶性SCF。编码220个氨基酸的mRNA(SCF220),其第6个外显子中无蛋白切割位点。由此mRNA表达膜结合型SCF。在鼠中,可溶性SCF可由SCF248在第6外显子切割或SCF248和SCF220的第7外显子切割而成。膜结合型SCF由SCF220表达。2种形式SCF均有生物学活性(Huang EJ等,Mol Biol Cell,1992,3:349)。鼠和人SCF对人造血细胞几乎有相等的生物学活性,但对鼠细胞,鼠SCF比人SCF生物效应强800倍(Martin FH等,Cell,l990,63(1):203)。
基因重组SCF和天然SCF有着相同生物学活性。2种形式SCF对造血都起重要作用。但Dolci等(Nature,1991,352(6338):809)发现结合型SCF比可溶性SCF支持造血长几个星期,对原始胚细胞存活刺激作用以结合型SCF为强。可溶性SCF激活c-kit受体短暂,诱导细胞表面c-kit受体下调更迅速。
SCF和其他细胞因子一起诱导干和祖细胞增生、延长其存活期及引起干和祖细胞动员。虽然SCF的受体在祖细胞无显著不同,但SCF诱导红系祖细胞增生比粒-单祖细胞强,可能是其他特异性因素影响祖细胞对SCF的反应性(OlweusJ等.Blood,1996(5),88:1594)。给小鼠应用SCF和粒细胞集落刺激因子(G-CSF),外周血干细胞和祖细胞第1天即达高峰,6周后正常。骨髓中干和祖细胞第1天下降,第14天升高达10倍,6周后正常。表明最初外周血干和祖细胞升高是由骨髓中动员到外周血(Bodine DM等,Blood,1996,88(1):89)。Mauch等(Blood,1995,86(12):4674)报道SCF和IL-11合用增加长期骨髓增殖细胞(LTMRC)从骨髓动员到未切脾鼠的脾和切脾鼠的血液。Yonemura等(Blood,1997,89(6):1915)认为SCF单独在体外不能维持干细胞数量,体内作用是SCF和其他细胞因子相互作用的结果。
在体外SCF和IL-7协同促进前体B细胞增生。Takeda等(Blood,1997,89(2):518)认为体内B细胞发育不是受体c-kit和SCF相互作用,而另一受体型酪氨酸激酶(FLK2)对B细胞发育比c-kit更重要。
SCF在肥大细胞发育和存活中起关键作用。小鼠SCF的基因缺失导致结缔组织和粘膜表面肥大细胞缺乏。由于SCF引起肥大细胞脱粒,应用时一般以减少剂量为代价。Nocka等(Blood,1997,90(10):3874)发现二硫化物相联系的二聚体SCF比普通SCF刺激细胞增生强10~20倍。但对肥大细胞脱粒并不比普通SCF强。
SCF既有化学激动性,也有化学趋化性。膜结合型SCF促进造血祖细胞回到骨髓。静脉输注kit+造血祖细胞后其沿着SCF的梯度移动到骨髓。这是由kit粘附到骨髓基质细胞表面的SCF引起(OkumuraN等,Blood,1996,87(10):4100)。Kim等(Blood,1998,91(1):100)认为基质细胞源因子-1(SDF-1)只有化学趋化性,它作为生理抗移动因子抑制造血祖细胞移出骨髓。
应用SCF、促血小板生长因子(TPO)、IL-12、IL-3处理冷冻骨髓细胞移植给鼠,其恢复血小板和中性粒细胞比用未处理的骨髓移植早3~6天(Ratajczak MZ等,Blood,1998,91(1):353)。在鼠模型中,受者在应用5-FU前和后给予SCF注射,可以使干细胞从静止期进入细胞周期。这样干细胞对5-FU敏感,易于杀死,为供者骨髓移入受者提供了稳定的内环境,有利于骨髓移植的成功(Van os R,等,Blood,1997,89(7):2376)。
将虫荧光素酶基因连在质粒上,该基因以聚赖氨酸(PL)与抗生蛋白链菌素(SA)共价连接,生物素酰基化的SCF以生物素与SA连接,腺病毒与PL共价连接,用此载体转染人MBO2和MO-7e细胞(两者均表达c-kit),孵育2小时通过SCF与c-kit结合转染效率可达90%(Schwarzenberger.Blood,1996,87(2):472)。但Fielding等(Blood,1998,91(5):1802)报道逆转录病毒载体通过连接SCF使SCF与造血细胞表面c-kit粘附,则病毒不能转染造血细胞,对不表达c-kit的非造血细胞却能转染。
曾经将血清SCF低下作为引起造血功能障碍的原因。据报道在再障、骨髓增生异常综合征中,骨髓移植后患者血清SCF水平低下。Abkowitz等(Blood,1996,87(9):4017)检测了34例纯红系再障患者血清SCF与正常人比较,无显著统计学意义。认为血清SCF水平可能与临床无相关性。但血清SCF是可溶性SCF,至于膜结合型SCF尚无法检测。
Weaver等(Blood,1996,88(9):3323)将48例上皮卵巢癌患者第1天给予3g·(m2)-1环磷酰胺输注,4小时输完,美司钠6g·(m2)-1输注12小时。然后48例随机分成4组,每人均注射5μg·kg·d-1G-CSF,每组中有9例加用重组人的SCF。按组别分别给予5μg·kg-1·d-1、10μg·kg-1·d-1、15μg·kg-1·d-1、20μg·kg-1·d-1。化疗后48小时开始应用,直到外周血WBC≥4.0×109L-1。这时进行外周血单成分采集。结果发现长期培养起始细胞(LTC-IC)在SCF 20μg·kg-1·d-1组比单用G-CSF组增加5.8倍,CD34 +细胞增加3倍,CD34 +CD33 -细胞增加64倍。Glaspy等(Blood,1997,90(8):2939)将215例高危期乳癌患者化疗后随机分组,单用G-CSF 10mg·kg-1·d-1达7d,G-CSF 10μg·kg-1·d-1和重组人SCF5、10、15、20、25、30μg·kg-1·d-1联合用药达7、10、13d。每种疗法的最后3d进行外周血白细胞单成分采集,结果发现应用20μg·kg-1·d-1SCF和10μg·kg-1·d-1G-CSF后,第5天开始进行外周血单采是动员外周血祖细胞的最适剂量和最佳方案。Begley等(Blood,1997,90(9):3378)将62例早期乳癌患者化疗前随机分组接受12μg·kg-1·d-1G-CSF和同剂量G-CSF加rhSCF 5、10、15μg·kg-1·d-1达7天,以及用10d10μg·kg-1·d-1SCF且第4天加用G-CSF达7天。结果发现先用SCF 3天作预治疗,再用二者联合治疗组,外周血造血祖细胞升高更加明显。SCF一般为皮下注射。最普遍的副反应是注射局部皮肤有轻度水肿,外有一圈红肿。一般在注射后4小时开始,持续24~48小时,以后恢复正常。偶有过敏反应报道,应用前可给予抗过敏预防。
综上所述,人干细胞生长因子具有广泛的应用。然而,目前市售的人干细胞生长因子制品的活性仍需要进一步提高。而且,目前用大肠杆菌来表达人干细胞生长因子的方法的表达量不够高,且蛋白质在纯化时需要复性。因此,目前本领域中仍然需要一种生物活性和表达量更高的人干细胞生长因子。
发明内容
本发明的目的是提供一种分离的人干细胞生长因子突变蛋白。本发明的另一目的是提供编码上述突变蛋白的DNA分子。本发明的另一目的是提供一种含有上述突变蛋白的药物组合物。本发明还有一个目的是提供制备上述突变蛋白的方法。
为了满足上述发明目的,本发明一个方面提供了一种分离的人干细胞生长因子突变蛋白,该突变蛋白含有Arg23Gly、Tyr110Ser和Pro288Ala突变。在一个较佳的实例中,所述突变蛋白具有SEQ ID NO:2所示的氨基酸序列。
本发明另一个方面提供了一种分离的DNA序列,该DNA序列包含上述人干细胞生长因子突变蛋白编码序列。在一个较佳实例中,该DNA序列具有SEQ ID NO:4所示的核苷酸序列。
本发明另一个方面提供了一种表达载体,该表达载体含有编码上述人干细胞生长因子突变蛋白的DNA序列以及与该DNA序列操作性相连的表达调控序列。
本发明还有一个方面提供了一种宿主细胞,该宿主细胞被上述表达载体转化。在较佳的实例中,该宿主细胞是大肠杆菌和枯草杆菌。
本发明另一个方面提供了一种药物组合物,该药物组合物含有药学上有效量的上述人干细胞生长因子突变蛋白以及药学上可接受的载体。
本发明还有一个方面提供了一种制备上述人干细胞生长因子突变蛋白的方法,该方法包括下列步骤:
a)提供一表达载体,该表达载体含有编码上述人干细胞生长因子突变蛋白DNA序列以及与该DNA序列操作性相连的表达调控序列;
b)用步骤a)中的表达载体转化宿主细胞;
c)在适合表达所述突变蛋白的条件下培养步骤b)所得的宿主细胞;和
d)分离纯化获得所表达出的突变蛋白。
本发明的优点在于上述人干细胞生长因子突变蛋白的生物活性比天然的干细胞生长因子高10倍,而且其在大肠杆菌等宿主细胞中的表达量也有大幅度提高。本发明的其它目的和优点可通过下面的详细描述得知。
附图简述
图1显示了本文所用的pUC18表达载体的图谱以及pUC18表达载体中多克隆位点的核苷酸序列。
图2显示了用Microsoft Excel作出的SCF活性测定曲线图。
发明详述
本发明提供了一种含有Arg23Gly、Tyr110Ser和Pro288Ala突变的分离的人干细胞生长因子突变蛋白。
本文所用的术语“干细胞生长因子”可以是具有天然野生型序列的人干细胞生长因子蛋白,也可以是具有突变序列的衍生型或重组人干细胞生长因子蛋白,只要该突变序列中不包括Arg23Gly、Tyr110Ser和Pro288Ala突变即可。天然的人干细胞生长因子蛋白的编码序列及其氨基酸序列如SEQ ID NO:3和SEQ ID NO:1所示。
本发明者通过研究发现,通过将该蛋白质氨基酸序列的23位的精氨酸(Arg)、110位的酪氨酸(Tyr)和288位的脯氨酸(Pro)分别突变成甘氨酸(Gly)、丝氨酸(Ser)和丙氨酸(Ala),可使突变蛋白的生物活性大幅度提高。本文中所用的术语“Arg23Gly”即表示第23位的氨基酸由Arg变为Gly。术语“Tyr110Ser”即表示第110位的氨基酸由Tyr变为Ser。术语“Pro288Ala”即表示第288位的氨基酸由Pro变为Ala。
本文所用的术语“分离的”在用于核酸或蛋白质时,表示核酸或蛋白质基本上不含其它在天然状态下相关的细胞成分,其最好呈均质状态,但也可以是干的或水溶液。纯度和均一性通常可用分析化学方法如聚丙烯酰胺凝胶电泳或高效液相色谱法测定。
在另一较佳的实施例中,还可使本发明突变蛋白与另一多肽、较佳的是与信号肽序列或在成熟多肽N端有特异性断裂位点的其它多肽融合表达。通常,该信号肽编码序列可以是载体的一个组件,或者它可以是插入载体的多肽DNA的一部分。该信号肽的功能是引导表达产物以活性的形式转移(分泌)到基质中,以便以后的纯化并避免复性过程。本发明下文实施例中采用的一个例子是大肠杆菌OmpA的信号肽序列:KKTAIAIAVALAGFATVAQA(20氨基酸,SEQ ID NO:6)(GenBank ACCESSIONNumber:U40577),其编码序列为:aaaaagacagctatcgcgattgcagtggcactggctggtttcgctaccgtagcgcaggcc(60bp,SEQ ID NO:5)(GenBank Accession Number:U40577)。当然,本领域技术人员也可采用熟知的其它信号肽序列。
本发明还提供了一种编码本发明上述人干细胞生长因子突变蛋白的DNA序列。在一个较佳的实例中,所述DNA序列具有SEQ ID NO:4所示的核苷酸序列。当然,本领域技术人员也可利用本领域中熟知的遗传密码的简并性获得编码上述氨基酸序列的所有其它核酸序列。另外,还可针对该DNA序列以及任选插入的信号肽编码序列进行密码子偏好设计,以便进一步提高其在宿主细胞中的表达量。
本发明的突变蛋白可通过以下方法来进行制备。首先,提供含有编码本发明突变蛋白的核苷酸序列以及与该序列操作性相连的表达调控序列的表达载体。
本文所用的术语“表达调控序列”通常指参与控制核苷酸序列表达的序列。表达调控序列包括与目标核苷酸序列操作性相连的启动子和终止信号。它们通常还包括核苷酸序列适当翻译所需的序列。“操作性相连”是指线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果启动子或增强子增加了编码序列的转录,则它与编码序列是操作性相连的。
上述编码突变型干细胞生长因子蛋白的DNA序列可用本领域技术人员熟知的常规手段来获得,例如,根据已经本文公开的人干细胞生长因子蛋白的DNA序列来合成引物进行PCR法扩增,或用诸如定点诱变、盒式诱变和聚合酶链反应(PCR)诱变等方法进行诱变。
在获得了具有定点突变后的DNA序列后,就可通过本领域熟知的各种方法将其连入合适的表达载体中。本发明中所用的表达载体是本领域技术人员已知的各种市售的表达载体,例如购自Qiagen和Promega公司的表达载体,如pUC18。
然后,用上述获得的表达载体转化合适的宿主细胞。在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳的宿主细胞是大肠杆菌和枯草杆菌。
最后,在适合本发明突变蛋白表达的条件下,培养转化所得的宿主细胞,然后用离子交换层析、疏水层析和分子筛层析等本领域技术人员熟知的常规分离纯化手段纯化得到本发明的突变蛋白。
本发明还提供了一种药物组合物,该组合物含有药学上有效量的本发明突变蛋白以及药学上可接受的载体。本文所用的术语“药学上可接受的”是指当分子本体和组合物适当地给予动物或人时,它们不会产生不利的、过敏的或其它不良反应。本文所用的“药学上可接受的载体”应当与本发明的突变蛋白相容,即能与其共混而不会在通常情况下大幅度降低药物组合物的效果。可作为药学上可接受的载体或其组分的一些物质的具体例子是糖类,如乳糖、葡萄糖和蔗糖;淀粉,如玉米淀粉和土豆淀粉;纤维素及其衍生物,如羧甲基纤维素钠、乙基纤维素和甲基纤维素;西黄蓍胶粉末;麦芽;明胶;滑石;固体润滑剂,如硬脂酸和硬脂酸镁;硫酸钙;植物油,如花生油、棉籽油、芝麻油、橄榄油、玉米油和可可油;多元醇,如丙二醇、甘油、山梨糖醇、甘露糖醇和聚乙二醇;海藻酸;乳化剂,如Tween;润湿剂,如月桂基硫酸钠;着色剂;调味剂;压片剂、稳定剂;抗氧化剂;防腐剂;无热原水;等渗盐溶液;和磷酸盐缓冲液等。
本发明的药物组合物可根据需要制成各种剂型,并可由医师根据患者种类、年龄、体重和大致疾病状况、给药方式等因素确定对病人有益的剂量进行施用。
下面将结合实施例进一步详细地描述本发明。然而应当理解,列举这些实施例只是为了起说明作用,而并不是用来限制本发明。
实施例1 基因合成
首先,提供一个具有大肠杆菌OmpA信号肽编码序列且经过密码子偏好设计的突变型人干细胞生长因子编码序列(如SEQ ID NO:4所示)。在该序列中,第124位碱基由C变为G,使得第42位(对应于除去信号肽序列后的第23位)氨基酸由精氨酸变为甘氨酸;第386位碱基由A变为C,第387位碱基由C变为T,使得其编码的第129位(对应于除去信号肽序列后的第110位)氨基酸由酪氨酸变为丝氨酸;第919位碱基由C变为G,第921位碱基由G变为T,使得其编码的第307位(对应于除去信号肽序列后的第288位)氨基酸由脯氨酸变为丙氨酸。将该基因结构记作SCF/ompA。合成基因时在该结构的5’端加上一个EcoRI切点,在3’-端加入一个HindIII切点。
根据上述SCF/ompA基因序列,按照常规引物设计的原则将上述序列及其互补链拆分成26个长度约为83~88b长度的寡核苷酸片段并委托上海生工公司合成。然后,利用PCR方法获得各SCF/ompA基因片段,具体操作如下:
反应体系:在0.2毫升PCR管中加入以下各物质。
组分 体积
10×Pfu PCR缓冲液 5微升
各寡片段(100毫微克/微升) (每种)1微升
50×dNTP混合物 1微升
50×Pfu DNA聚合酶 1微升
PCR级水 至40微升
总体积 50微升
(2)反应条件
预变性:94℃ 2分钟;
主循环:95℃ 1分钟,60℃ 40秒,72℃ 1分钟,循环35次;
后延伸:72℃10分钟。
(3)电泳观察结果并胶回收hSCF/ompA全长基因片段。
把胶回收的基因片段按照常规方法克隆于质粒pGEM-T Easy(Promega公司,Madison,WI)上并进行基因测序。测序工作委托上海基康公司进行。根据测序结果确定了一个序列完全正确的克隆,记作pSCF/ompA。
实施例2.表达载体的构建
本实施例采用pUC18载体作为表达载体,该表达载体购自(Promega公司,图1中显示出了该载体的图谱)。将上述完全正确的pSCF/ompA的DNA用EcoRI及HindIII酶切,在1%琼脂糖电泳上分离,用PROMEGA公司的胶回收试剂盒回收长度大约1kb左右的片段。然后用MBI公司的连接试剂盒把SCF/ompA基因片段连接于原核表达载体pUC18载体的上,构成pUC18-SCF/ompA表达载体。详细操作过程如下:
1)用EcoRI及HindIII酶切表达质粒pUC18。在微量离心管中加入以下各物质:
pUC18质粒DNA 3微克
10×限制酶缓冲液 3微升
EcoRI和HindIII 15U
1毫克/毫升乙酰化BSA 3微升
无核酸酶的水 至40微升
37℃孵育4小时,以DNA标记作为对照进行电泳,胶回收酶切的质粒pUC18,置-20℃保存待用。
2)用EcoRI及HindIII酶切携带目的基因的质粒pGEM-T Easy,切下目的基因并胶回收。方法同上。
3)连接酶切表达质粒pUC18及目的基因片段。在0.2毫升PCR管中加入以下各物:
10×连接酶缓冲液 2微升
100mM DTT 2微升
10mM ATP 1微升
50毫微克/微升制得的pUC18载体 2微升
T4连接酶(0.2-0.4Weise单位/微升) 1微升
制备的目的基因(0.2pmol) 1微升
无核酸酶的水 11微升
总体积 20微升
4℃连接过夜。
4)把连接构建好的质粒pUC18转化入表达工程菌DH5a中。
5)用以下方法酶切鉴定转化质粒:
挑取氨苄青霉素培养皿上单个表达工程菌菌落进行扩增培养,抽提质粒,用EcoRI及HindIII酶切鉴定,方法同前。酶切产物在1%琼脂糖电泳上进行鉴定,初步确定了11个克隆带有目的插入序列。选取其中2个正确克隆进行测序,根据测序结果确认1个克隆的插入序列是完全正确的,记作pUC18-SCF/ompA。
实施例3.诱导目的基因表达
取正确克隆的菌液100微升分别接种到5毫升含氨苄青霉素(100微克/毫升)的LB液体培养基中,37℃,260rpm震荡培养至OD值达0.4~1.0,加入异丙基硫代半乳糖苷(IPTG)至终浓度1毫摩尔/升。培养3小时,从每种培养物中取出1毫升转移到离心管中,离心,去上清;裂解菌体进行SDS蛋白电泳,用考马斯亮蓝对SDS聚丙烯酰胺进行染色,检测目的蛋白的表达。结果表明,该菌株表达的目的产物占菌体可溶性蛋白的68%,比国外已经发表的直接将天然基因表达的方法所获得的表达量15%(Chen W,Di X,Li J,Song F,Chen S.cDNA cloning of human stem cell factor and itshigh level expression in E.coli,中国医学科学院学报,1997 Feb;19(1):29-34)高出至少4倍。这一高表达结果对于实现该基因的产业化具有重要意义。
实施例4.目的蛋白的纯化及其活性检测
按照上述方法在LB培养基中诱导该基因表达并经过离子交换层析、疏水层析和分子筛层析后获得了纯度在95%以上的该重组蛋白。
用下述ELISA方法对上述菌株的表达量进行研究。ELISA方法用MO-7E细胞株进行。在含8%的小牛血清的RPMI1640培养基、5%CO2培养箱中培养24小时的MO-7E细胞500RPM离心收集细胞,用含有10%小牛血清的DEME培养基配制成5×104细胞/毫升的悬液。
取96孔板,每孔中加入100微升细胞悬液,100微升系列稀释的SCF待测样品(200毫微克/毫升)或者标准品(重组天然人SCF,购自Pharmacia)(200毫微克/毫升),37℃5%CO2培养箱中培养48小时。以不加SCF作为阴性对照。每处理3个重复孔。
取经过上述处理的细胞0.1毫升,加入1/10体积浓度为5毫克/毫升的MTT溶液,37℃培养30分钟后在酶标仪上读取570nm处的光吸收。以三个重复孔读数的平均数作为计算和比较的依据。结果表明,经过SCF处理的细胞比未经处理的对照光吸收明显提高,读数比对照高36%~670%。待测样品与阳性对照的比较结果显示在下表1中。
表1 SCF活性测定结果
样品编号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
浓度(ng/ml) |
0.01 |
0.05 |
0.1 |
0.5 |
1 |
2.5 |
5 |
7.5 |
10 |
12.5 |
15 |
17.5 |
20 |
22.5 |
25 |
50 |
100 |
阳性对照 |
0.04 |
0.05 |
0.05 |
0.06 |
0.07 |
0.17 |
0.41 |
0.74 |
0.99 |
1.24 |
1.42 |
1.6 |
1.72 |
1.76 |
1.79 |
1.81 |
1.82 |
待测样品 |
0.14 |
0.21 |
0.32 |
0.56 |
0.87 |
1.16 |
1.43 |
1.59 |
1.73 |
1.78 |
1.81 |
1.83 |
1.85 |
1.87 |
1.87 |
1.89 |
1.9 |
根据上述数据,用Excel作图(见图2)。
从表1和图2可以看出,本发明的待测样品的活性明显高于天然结构的SCF。天然结构的ED50(即达到50%最大效果所需要的剂量)为10毫微克/毫升左右,而本发明的SCF的生物活性大幅提高,其ED50大约为1nm/毫升左右,二者大约相差一个数量级。
序列表
<110>上海中信国健药业有限公司
<120>人干细胞生长因子突变蛋白及其制法和药物组合物
<130>020770
<160>6
<170>PatentIn version 3.0
<210>1
<211>323
<212>PRT
<213>智人(Homo sapiens)
<400>1
Met Gln Ala Ala Trp Leu Leu Gly Ala Leu Val Val Pro Gln Leu Leu
1 5 10 15
Gly Phe Gly His Gly Ala Arg Gly Ala Glu Arg Glu Trp Glu Gly Gly
20 25 30
Top Gly Gly Ala Gln Glu Glu Glu Arg Glu Arg Glu Ala Leu Met Leu
35 40 45
Lys His Leu Gln Glu Ala Leu Gly Leu Pro Ala Gly Arg Gly Asp Glu
50 55 60
Asn Pro Ala Gly Thr Val Glu Gly Lys Glu Asp Trp Glu Met Glu Glu
65 70 75 80
Asp Gln Gly Glu Glu Glu Glu Glu Glu Ala Thr Pro Thr Pro Ser Ser
85 90 95
Gly Pro Ser Pro Ser Pro Thr Pro Glu Asp Ile Val Thr Tyr Ile Leu
100 105 110
Gly Arg Leu Ala Gly Leu Asp Ala Gly Leu His Gln Leu His Val Arg
115 120 125
Leu His Ala Leu Asp Thr Arg Val Val Glu Leu Thr Gln Gly Leu Arg
130 135 140
Gln Leu Arg Asn Ala Ala Gly Asp Thr Arg Asp Ala Val Gln Ala Leu
145 150 155 160
Gln Glu Ala Gln Gly Arg Ala Glu Arg Glu His Gly Arg Leu Glu Gly
165 170 175
Cys Leu Lys Gly Leu Arg Leu Gly His Lys Cys Phe Leu Leu Ser Arg
180 185 190
Asp Phe Glu Ala Gln Ala Ala Ala Gln Ala Arg Cys Thr Ala Arg Gly
195 200 205
Gly Ser Leu Ala Gln Pro Ala Asp Arg Gln Gln Met Glu Ala Leu Thr
210 215 220
Arg Tyr Leu Arg Ala Ala Leu Ala Pro Tyr Asn Trp Pro Val Trp Leu
225 230 235 240
Gly Val His Asp Arg Arg Ala Glu Gly Leu Tyr Leu Phe Glu Asn Gly
245 250 255
Gln Arg Val Ser Phe Phe Ala Trp His Arg Ser Pro Arg Pro Glu Leu
260 265 270
Gly Ala Gln Pro Ser Ala Ser Pro His Pro Leu Ser Pro Asp Gln Pro
275 280 285
Asn Gly Gly Thr Leu Glu Asn Cys Val Ala Gln Ala Ser Asp Asp Gly
290 295 300
Ser Trp Trp Asp His Asp Cys Gln Arg Arg Leu Tyr Tyr Val Cys Glu
305 310 315 320
Phe Pro Phe
<210>2
<211>323
<212>PRT
<213>智人(Homo sapiens)
<400>2
Met Gln Ala Ala Trp Leu Leu Gly Ala Leu Val Val Pro Gln Leu Leu
1 5 10 15
Gly Phe Gly His Gly Ala Gly Gly Ala Glu Arg Glu Trp Glu Gly Gly
20 25 30
Trp Gly Gly Ala Gln Glu Glu Glu Arg Glu Arg Glu Ala Leu Met Leu
35 40 45
Lys His Leu Gln Glu Ala Leu Gly Leu Pro Ala Gly Arg Gly Asp Glu
50 55 60
Asn Pro Ala Gly Thr Val Glu Gly Lys Glu Asp Trp Glu Met Glu Glu
65 70 75 80
Asp Gln Gly Glu Glu Glu Glu Glu Glu Ala Thr Pro Thr Pro Ser Ser
85 90 95
Gly Pro Ser Pro Ser Pro Thr Pro Glu Asp Ile Val Thr Ser Ile Leu
100 105 110
Gly Arg Leu Ala Gly Leu Asp Ala Gly Leu His Gln Leu His Val Arg
115 120 125
Leu His Ala Leu Asp Thr Arg Val Val Glu Leu Thr Gln Gly Leu Arg
130 135 140
Gln Leu Arg Asn Ala Ala Gly Asp Thr Arg Asp Ala Val Gln Ala Leu
145 150 155 160
Gln Glu Ala Gln Gly Arg Ala Glu Arg Glu His Gly Arg Leu Glu Gly
165 170 175
Cys Leu Lys Gly Leu Arg Leu Gly His Lys Cys Phe Leu Leu Ser Arg
180 185 190
Asp Phe Glu Ala Gln Ala Ala Ala Gln Ala Arg Cys Thr Ala Arg Gly
195 200 205
Gly Ser Leu Ala Gln Pro Ala Asp Arg Gln Gln Met Glu Ala Leu Thr
210 215 220
Arg Tyr Leu Arg Ala Ala Leu Ala Pro Tyr Asn Trp Pro Val Trp Leu
225 230 235 240
Gly Val His Asp Arg Arg Ala Glu Gly Leu Tyr Leu Phe Glu Asn Gly
245 250 255
Gln Arg Val Ser Phe Phe Ala Trp His Arg Ser Pro Arg Pro Glu Leu
260 265 270
Gly Ala Gln Pro Ser Ala Ser Pro His Pro Leu Ser Pro Asp Gln Ala
275 280 285
Asn Gly Gly Thr Leu Glu Asn Cys Val Ala Gln Ala Ser Asp Asp Gly
290 295 300
Ser Trp Trp Asp His Asp Cys Gln Arg Arg Leu Tyr Tyr Val Cys Glu
305 310 315 320
Phe Pro Phe
<210>3
<211>969
<212>DNA
<213>智人(Homo sapiens)
<400>3
atgcaggcag cctggctttt gggggctttg gtggtccccc agctcttggg ctttggccat 60
ggggctcggg gagcagagag ggagtgggag ggaggctggg gaggtgccca ggaggaggag 120
cgggagaggg aggccctgat gctgaagcat ctgcaggaag ccctaggact gcctgctggg 180
aggggggatg agaatcctgc cggaactgtt gagggaaaag aggactggga gatggaggag 240
gaccaggggg aggaagagga ggaggaagca acgccaaccc catcctccgg ccccagcccc 300
tctcccaccc ctgaggacat cgtcacttac atcctgggcc gcctggccgg cctggacgca 360
ggcctgcacc agctgcacgt ccgtctgcac gcgttggaca cccgcgtggt cgagctgacc 420
caggggctgc ggcagctgcg gaacgcggca ggcgacaccc gcgatgccgt gcaagccctg 480
caggaggcgc agggtcgcgc cgagcgcgag cacggccgct tggagggctg cctgaagggg 540
ctgcgcctgg gccacaagtg cttcctgctc tcgcgcgact tcgaagctca ggcggcggcg 600
caggcgcggt gcacggcgcg gggcgggagc ctggcgcagc cggcagaccg ccagcagatg 660
gaggcgctca ctcggtacct gcgcgcggcg ctcgctccct acaactggcc cgtgtggctg 720
ggcgtgcacg atcggcgcgc cgagggcctc tacctcttcg aaaacggcca gcgcgtgtcc 780
ttcttcgcct ggcatcgctc accccgcccc gagctcggcg cccagcccag cgcctcgccg 840
catccgctca gcccggacca gcccaacggt ggcacgctcg agaactgcgt ggcgcaggcc 900
tctgacgacg gctcctggtg ggaccacgac tgccagcggc gtctctacta cgtctgcgag 960
ttccccttc 969
<210>4
<211>1026
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>带信号肽编码序列
<400>4
aaaaaaaccg ctatcgctat cgctgttgct ctggctggtt tcgctaccgt tgctcaggct 60
caggctgctt ggctgctggg tgctctggtt gttccgcagc tgctgggttt cggtcacggt 120
gctggtggtg ctgaacgtga atgggaaggt ggttggggtg gtgctcagga agaagaacgt 180
gaacgtgaag ctctgatgct gaaacacctg caggaagctc tgggtctgcc ggctggtcgt 240
ggtgacgaaa acccggctgg taccgttgaa ggtaaagaag actgggaaat ggaagaagac 300
cagggtgaag aagaagaaga agaagctacc ccgaccccgt cttctggtcc gtctccgtct 360
ccgaccccgg aagacatcgt tacctctatc ctgggtcgtc tggctggtct ggacgctggt 420
ctgcaccagc tgcacgttcg tctgcacgct ctggacaccc gtgttgttga actgacccag 480
ggtctgcgtc agctgcgtaa cgctgctggt gacacccgtg acgctgttca ggctctgcag 540
gaagctcagg gtcgtgctga acgtgaacac ggtcgtctgg aaggttgcct gaaaggtctg 600
cgtctgggtc acaaatgctt cctgctgtct cgtgacttcg aagctcaggc tgctgctcag 660
gctcgttgca ccgctcgtgg tggttctctg gctcagccgg ctgaccgtca gcagatggaa 720
gctctgaccc gttacctgcg tgctgctctg gctccgtaca actggccggt ttggctgggt 780
gttcacgacc gtcgtgctga aggtctgtac ctgttcgaaa acggtcagcg tgtttctttc 840
ttcgcttggc accgttctcc gcgtccggaa ctgggtgctc agccgtctgc ttctccgcac 900
ccgctgtctc cggaccaggc taacggtggt accctggaaa actgcgttgc tcaggcttct 960
gacgacggtt cttggtggga ccacgactgc cagcgtcgtc tgtactacgt ttgcgaattc 1020
ccgttc 1026
<210>5
<211>60
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>5
aaaaagacag ctatcgcgat tgcagtggca ctggctggtt tcgctaccgt agcgcaggcc 60
<210>6
<211>20
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>6
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala
20