发明内容
本发明所解决的现有技术问题是:现有的哺乳动物蛋白表达系统普遍有着表达量低,成本高的特点。
为了解决上述问题,本发明先是提供一种转录因子组合物,含有ELL转录因子、AFF转录因子和CRTC转录因子,优选地,ELL转录因子选自ELL2 或ELL1中的一种,AFF转录因子选自AFF4或AFF1中的一种,CRTC转录因子选自CRTC2或CRTC1或CRTC3中的一种。
本发明提供了一种DNA分子,所述DNA分子含有编码ELL转录因子的碱基序列,编码AFF转录因子的碱基序列和编码CRTC转录因子的碱基序列。
本发明提供了一种重组表达载体,其是将转录因子组合物或三重转录因子克隆到哺乳动物表达载体而得到。
本发明还提供了重组表达载体的制备方法,其是将将编码ELL转录因子、 AFF转录因子和CRTC转录因子的基因分别与载体连接,得到含有三重转录因子的重组载体;然后将重组载体转化到受体细胞,筛选得到转录因子表达的载体;最后将表达载体进行DNA测序,得到重组表达载体。
本发明提供了一种哺乳动物蛋白表达系统的制备方法,其是通过利用增强基因转录的方式来提高蛋白含量。这不仅会大大降低哺乳动物重组蛋白的生产成本,增加收益,同时也会对生命科学研究和生物制药业的发展产生积极的促进作用。
本发明哺乳动物蛋白表达系统的制备方法是将重组表达载体和目的基因表达载体共同转染到细胞株中表达,得到重组蛋白。
本发明哺乳动物蛋白表达系统的制备方法还可以将编码ELL转录因子、 AFF转录因子和CRTC转录因子的基因整合到目的基因中,得到含有编码三重转录因子的基因的目的基因,然后将含有编码三重转录因子的基因的目的基因与载体连接,得到含有编码三重转录因子的基因的目的基因表达载体,最后转染到细胞株中得到哺乳动物蛋白表达系统。
本发明还提供了一种哺乳动物蛋白表达系统的纯化方法,其是在收集的细胞株中加入裂解液,离心得上清液;然后将上清液与标签混合后,离心去除上清液,加入高盐洗涤液进行洗涤;接着对洗涤液进行离心,去除上清液,加入低盐洗涤液进行洗涤;最后用带有标记的肽进行洗脱,离心得到上清液,所述上清液即为哺乳动物蛋白表达系统。
具体来说,本发明提出了如下技术方案。
一种转录因子组合物,含有ELL转录因子、AFF转录因子和CRTC转录因子,优选地,ELL转录因子选自ELL2或ELL1中的一种,AFF转录因子选自AFF4或AFF1中的一种,CRTC转录因子选自CRTC2或CRTC1或CRTC3 中的一种。
优选的,对于所述的转录因子组合物,其中,所述组合物所述组合物含有 ELL2、AFF4和CRTC2,所述ELL2、AFF4和CRTC2的比例为1:1-3:1-4;更优选的,所述ELL2、AFF4和CRTC2的比例为1:1:1。
优选的,对于所述的转录因子组合物,其中,所述转录因子组合物选自于人源、鼠源、狗源或者猪源中的一种;优选的,所述转录因子组合物为人源的。
一种三重转录因子,其包含上述的转录因子组合物。
一种DNA分子,所述DNA分子含有编码ELL转录因子的碱基序列、编码AFF转录因子的碱基序列和编码CRTC转录因子的碱基序列;优选,所述编码ELL转录因子的碱基序列选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.1所示;
(b)与SEQ ID NO.1序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.2所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.2所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
所述编码AFF转录因子的碱基序列选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.3所示;
(b)与SEQ ID NO.3序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.4所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.4所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
所述编码CRTC转录因子的碱基序列选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.5所示;
(b)与SEQ ID NO.5序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.6所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.6所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
一种重组表达载体,其是将所述转录因子组合物或者所述三重转录因子克隆到哺乳动物表达载体中而得到。
一种重组表达载体的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子和CRTC转录因子的基因分别与载体连接,得到含有三重转录因子的重组载体;
(2)将步骤(1)所得到的重组载体转化到受体细胞,筛选得到转录因子表达的载体;
(3)将步骤(2)所得到的转录因子表达的载体进行DNA测序,得到重组表达载体。
所述转录因子组合物或三重转录因子在哺乳动物蛋白表达系统中的应用。
一种哺乳动物蛋白表达系统,其是将重组表达载体或重组表达载体与目的基因表达载体共同转染到细胞株中表达得到,所述重组表达载体的总量与目的基因表达载体的总量的比为1:1-5。
优选的,对于所述的哺乳动物蛋白表达系统,其中,所述细胞株选自于人胚胎肾细胞293或者中国仓鼠卵巢细胞中的一种。
一种哺乳动物蛋白表达系统的制备方法,其包含下述步骤:
(1)将重组表达载体和目的基因表达载体总量比为1:1-5共同转染到细胞株中;
(2)1-3天后收集细胞,得到哺乳动物蛋白表达系统。
优选的,对于所述的制备方法,其特征在于,在步骤(1)中,所述目的基因载体的制备方法包含下述步骤:将目的基因及表达载体连接得到目的基因表达载体。
一种哺乳动物蛋白表达系统,其是将三重转录因子的目的基因表达载体转染到细胞株中得到。
优选的,对于所述的哺乳动物蛋白表达系统,其中,所述细胞株选自于人胚胎肾细胞或中国仓鼠卵巢细胞中的一种。
一种哺乳动物蛋白表达系统的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子和CRTC转录因子的基因整合到目的基因中得到含有编码三重转录因子的基因的目的基因;
(2)将含有编码三重转录因子的基因的目的基因与载体连接,得到含有编码三重转录因子基因的目的基因表达载体;
(3)将步骤(2)所得到的表达载体转染到细胞株中,1-3天后收集细胞,得到哺乳动物蛋白表达系统。
一种哺乳动物蛋白表达系统的纯化方法,其包含下述步骤:
(1)收集哺乳动物蛋白表达系统细胞,加入裂解液,离心得到上清液;
(2)将步骤(1)所述的上清液与标签beads混合,离心去除上清液,然后加入高盐洗涤液洗涤;
(3)将步骤(2)所得的洗涤液离心,去除上清液,加入低盐洗涤液洗涤;
(4)用带有标记peptide进行洗脱,然后离心得到上清液,所述上清液即为哺乳动物蛋白表达系统。
优选的,对于所述的纯化方法,其中,在步骤(1)中,所述裂解液包含 4-羟乙基哌嗪乙磺酸、甘油、NaCl、EDTA、乙基苯基聚乙二醇和蛋白酶抑制剂混合物,所述裂解液的加入量为每1×107个细胞加入1-5ml的裂解液。
优选的,对于所述的纯化方法,其中,在步骤(2)中,所述上清液与标签beads的体积比为20-50:1。
优选的,对于所述的纯化方法,其中,在步骤(2)中,所述高盐洗涤液包含4-羟乙基哌嗪乙磺酸、甘油、NaCl、EDTA、乙基苯基聚乙二醇和蛋白酶抑制剂混合物,所述高盐洗涤液的加入量为1-5ml。
优选的,对于所述的纯化方法,其中,在步骤(3)中,所述低盐洗涤液包含4-羟乙基哌嗪乙磺酸、甘油、NaCl、EDTA、乙基苯基聚乙二醇和蛋白酶抑制剂混合物,所述低盐洗涤液的加入量为1-5ml。
优选的,对于所述的纯化方法,其中,所述标签peptide与标签beads的体积比为3-5:1。
哺乳动物蛋白表达系统,其在生物医药中的应用。
本发明所取得的有益效果为:本发明所得到的哺乳动物表达系统与传统方法相比,具有低成本、高产量的优势,能够有效提高重组蛋白的产量,并保持其完整的翻译后修饰来提高生物活性。此哺乳动物表达系统通过引入优化的超级转录延伸复合物中的转录因子,在转录水平上极大的提高基因的表达,从根本上达到增加蛋白产量的目的。同时,本发明所得到的哺乳动物表达系统具有操作简单,易大规模生成和快速产业化的潜能。
具体实施方式
图1是实施例1中所得到的LIF蛋白表达系统的表达量的示意图,其中, 1是只有LIF表达载体转染到中国仓鼠卵巢细胞时所得到的LIF蛋白表达系统的表达量的图,2是LIF表达载体和含有转录因子ELL2和AFF4的表达载体共同转染到中国仓鼠卵巢细胞中所得到的LIF蛋白表达系统表达量的示意图,3是LIF表达载体和含有三重转录因子ELL2、AFF4和CRTC2的表达载体共同转染到中国仓鼠卵巢细胞中所得到的LIF蛋白表达系统表达量的示意图,从上图可以看出,三重转录因子ELL2、AFF4和CRTC2可以把LIF 的表达量提高7倍。
图2是实施例1所得到的LIF蛋白表达系统纯度的示意图,从图中可以看出,纯化后的LIF蛋白表达系统具有极高的纯度,纯度高于95%。
图3是实施例1所得到的LIF蛋白表达系统与利用细菌表达系统同类产品 (货号PHC9484,Thermo Fisher Scientific)生物活性比较示意图,其中,图3-1 是没有LIF的蛋白表达系统的生物活性示意图,图3-2是利用细菌表达系统的同类产品(10ng/ml)的生物活性示意图,图3-3至3-6是实施例1中的蛋白表达系统在2.5ng/ml、5ng/ml、10ng/l和20ng/ml的生物活性示意图,从图中可以看出,使用本发明的蛋白表达系统,干细胞较多,说明本发明所得到的LIF 蛋白表达系统生物活性较高,生物活性超出利用细菌表达系统同类产品的300%以上。
如上所述,本发明提供了一种转录因子组合物,含有ELL转录因子、AFF 转录因子和CRTC转录因子,优选地,ELL转录因子选自ELL2或ELL1中的一种,AFF转录因子选自AFF4或AFF1中的一种,CRTC转录因子选自CRTC2 或CRTC1或CRTC3中的一种。
其中,所述组合物有ELL2、AFF4和CRTC2。优选的,所述ELL2、AFF4 和CRTC2的比例为1:1-3:1-4,更优选的,所述ELL2、AFF4和CRTC2的比例为1:1:1。
其中,所述转录因子组合物选自于人源、鼠源、狗源或者猪源中的一种,优选的,所述转录因子组合物为人源的。
本发明还提供了一种三重转录因子表达载体,其是将三重转录因子克隆到哺乳动物表达载体中而得到。
本发明提供了一种DNA分子,所述DNA分子含有编码ELL转录因子的碱基序列,编码AFF转录因子的碱基序列和编码CRTC转录因子的碱基序列,其中,所述编码ELL转录因子的选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.1所示;
(b)与SEQ ID NO.1序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.2所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.2所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
所述编码AFF转录因子的碱基序列选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.3所示;
(b)与SEQ ID NO.3序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.4所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.4所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
所述编码CRTC转录因子的碱基序列选自以下碱基序列中的一种:
(a)碱基序列如SEQ ID NO.5所示;
(b)与SEQ ID NO.5序列的同源性在90%以上的碱基序列,优选95%以上的碱基序列;更优选在99%以上的碱基序列;
(c)编码SEQ ID NO.6所示的氨基酸序列组成的蛋白质的基因;
(d)在SEQ ID NO.6所示的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有调控基因转录活性的由(c)衍生的蛋白质。
本发明提供了一种重组表达载体,其是将转录因子组合物或三重转录因子克隆到含有CMV启动子的哺乳动物表达载体中而得到。
本发明提供了一种重组表达载体的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子和CRTC转录因子的基因分别与载体连接,得到含有三重转录因子的重组载体;
(2)将步骤(1)所得到的重组载体转化到受体细胞,筛选得到转录因子表达的载体;
(3)将步骤(2)所得到的转录因子表达的载体进行DNA测序,得到重组表达载体。
在本发明优选的具体实施方式中,本发明提供了一种重组表达载体的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子、CRTC转录因子的基因和表达载体分别进行限制性内切酶酶切,之后再进行分离纯化。酶切后的ELL转录因子、AFF转录因子、CRTC转录因子的基因和分别与酶切后的载体通过 T4连接酶连接,得到含有三重转录因子的重组载体;
(2)将步骤(1)所得到的重组载体与大肠杆菌感受态细菌混合,冰上孵育30分钟,然后通过热激法(在42度水浴锅中90秒中)的方式,把重组载体转化进入到细菌中去。之后,把转化后的细菌铺到含有氨苄的LB培养板上,在37度的培养箱中培养过夜。
(3)对(2)中培养板上的细菌进行鉴定,筛选出含有转录因子表达载体的细菌克隆。具体步骤如下:挑选10个细菌克隆分别放入5毫升的含有氨苄的液体LB培养液中,于37度摇床上过夜。第二天,用Invitrogen的小抽质粒试剂盒提取质粒,然后进行酶切(与(1)中的限制性内切酶酶切一致)。如果能够得两条片段(大片段的为载体,小片段为插入的转录因子基因),则为阳性克隆。
(4)将步骤(3)所得到的阳性克隆重组质粒送到测序公司进行DNA测序,确认序列无突变。
本发明提供了一种哺乳动物蛋白表达系统,其是通过将重组表达载体与目的基因表达载体共同转染到细胞株中表达得到,所述三重转录因子表达载体的总量与目的基因表达载体的总量的比为1:1-5。
其中,所述细胞株为选自于人胚胎肾细胞293或者中国仓鼠卵巢细胞的一种。
本发明提供了一种哺乳动物蛋白表达系统的制备方法,其包含下述步骤:
(1)将三重转录因子表达载体和目的基因的表达载体总量比为1:1-5共同转染到细胞株中;
(2)1-3天后收集细胞,得到所需的哺乳动物蛋白。
本发明还提供了另一种哺乳动物蛋白表达系统的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子和CRTC转录因子的基因整合到目的基因中得到含有编码三重转录因子的基因的目的基因;
(2)将含有编码三重转录因子的基因的目的基因与载体连接,得到含有编码三重转录因子基因的目的基因表达载体;
(3)将步骤(2)所得到的表达载体转染到细胞株中,1-3天后收集细胞,得到哺乳动物蛋白表达系统。
在本发明另一种具体的实施方式中,本发明提供了一种哺乳动物蛋白表达系统的制备方法,其包含下述步骤:
(1)将编码ELL转录因子、AFF转录因子和CRTC转录因子的基因的表达载体整合到细胞株的基因组,构建稳定细胞株,具体步骤包括(a)用转染试剂将三重转录因子表达载体转染到表达细胞株中;(b)第二天将细胞稀释,以1000个细胞/150毫米的细胞培养板的浓度培养2周;(c)随机挑选50 个细胞克隆,用Westernblot的方法检测ELL转录因子、AFF转录因子和CRTC 这三个蛋白的表达,挑选高表达的细胞株,此则为稳定细胞株。
(2)将目的基因与载体连接,得到含有编码目的基因表达载体;
(3)将步骤(2)所得到的表达载体转染到(1)中所得的稳定细胞株中, 1-3天后收集细胞,得到所需哺乳动物蛋白。
本发明提供了一种哺乳动物蛋白表达系统的纯化方法,其包含下述步骤:
(1)收集哺乳动物蛋白表达系统细胞,加入裂解液,离心得到上清液;
(2)将步骤(1)所述的上清液与标签混合,离心去除上清液,然后加入高盐洗涤液洗涤;
(3)将步骤(2)所得的洗涤液离心,去除上清液,加入低盐洗涤液洗涤;
(4)用带有标记的肽进行洗脱,然后离心得到上清液,所述上清液即为哺乳动物蛋白表达系统。
其中,所述裂解液包含4-羟乙基哌嗪乙磺酸(摩尔浓度优选为20mM,pH 优选为7.9)、甘油(质量浓度优选为10%)、NaCl(摩尔浓度优选为0.3M)、 EDTA(摩尔浓度优选为0.2mM,pH优选为8.0)、乙基苯基聚乙二醇(质量浓度优选为0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail),所述裂解液的加入量为每1×107个细胞加入1-5ml的裂解液。
其中,所述高盐洗涤液包含4-羟乙基哌嗪乙磺酸(摩尔浓度优选为20mM, pH优选为7.9)、甘油(质量浓度优选为10%)、NaCl(摩尔浓度优选为0.8M)、 EDTA(摩尔浓度优选为0.2mM,pH优选为8.0)、乙基苯基聚乙二醇(质量浓度优选为0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail),所述高盐洗涤液的加入量为1-5ml。
其中,所述低盐洗涤液包含4-羟乙基哌嗪乙磺酸(摩尔浓度优选为20mM, pH优选为7.9)、甘油(质量浓度优选为10%)、NaCl(摩尔浓度优选为0.15M)、 EDTA(摩尔浓度优选为0.2mM,pH优选为8.0)、乙基苯基聚乙二醇(质量浓度优选为0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail),所述低盐洗涤液的加入量为1-5ml。
在本发明一种优选的具体实施方式中,所述裂解液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油(10%)、NaCl(0.3M)、EDTA(0.2mM, pH8.0)、乙基苯基聚乙二醇(NP-40,0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail);
所述高盐洗涤液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油(10%)、NaCl(0.8M)、EDTA(0.2mM,pH8.0)、乙基苯基聚乙二醇 (NP-40,0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail);
所述低盐洗涤液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油(10%)、NaCl(0.15M)、EDTA(0.2mM,pH8.0)、乙基苯基聚乙二醇 (NP-40,0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail)。
在本发明优选的实施方式中,使用哺乳蛋白表达系统对重组人白血病抑制因子(LIF)进行表达和纯化。
下面对本实施例所用的原料及设备的生产厂家,以及产品分析使用的设备和分析方法进行说明如下,其中所述的化学物质没有标明的均为常规试剂的化学纯级别。其中,实施例中所用到的原料的信息和设备分别如表1和表2所示。
表1所用到的原料的信息
原料 |
纯度 |
厂家 |
HEPES |
1M |
ThermoFisher公司 |
EDTA |
>98% |
Sigma公司 |
NP-40 |
/ |
Sigma公司 |
NaCl |
>99% |
Sigma公司 |
Proteaseinhibitorcocktail |
>98% |
罗氏公司(Roche) |
Flagbeads |
>98% |
Sigma公司 |
Flagpeptide |
>98% |
Sigma公司 |
人胚胎肾细胞 |
/ |
ATCC公司 |
中国仓鼠卵巢细胞 |
/ |
ATCC公司 |
人白血病抑制因子 |
/ |
ThermoFisher公司 |
BamHI |
/ |
ThermoFisher公司 |
NotI |
/ |
ThermoFisher公司 |
HindIII |
/ |
ThermoFisher公司 |
T4连接酶 |
/ |
罗氏公司(Roche) |
银染试剂盒 |
/ |
ThermoFisher公司 |
表2所用到的实验设备
名称 |
型号 |
生产厂家 |
离心机 |
5417C |
Eppendorf公司 |
细胞培养箱 |
3131 |
ThermoFisher公司 |
细菌培养箱 |
IMC18 |
ThermoFisher公司 |
PCR仪 |
4484073 |
ThermoFisher公司 |
不锈钢水浴锅 |
89032-189 |
VWR公司 |
漩涡式震荡器 |
444-0203 |
VWR公司 |
轨道式摇床 |
Standard1000 |
VWR公司 |
滚筒式混合器 |
444-0501 |
VWR公司 |
凝胶成像系统 |
GelDocXR+ |
Bio-Rad公司 |
电源 |
164-5050 |
Bio-Rad公司 |
电泳槽 |
164-0300 |
Bio-Rad公司 |
实施例一
(一)重组表达载体的制备及蛋白表达量的比较
(1)将编码ELL2转录因子、AFF4转录因子和CRTC2转录因子的基因分别进行聚合酶链式反应(94℃,30秒/56℃,30秒/68℃,2分钟,循环 30次),电泳分离纯化分别得到编码ELL2转录因子、AFF4转录因子和CRTC2 转录因子的基因;将所得到的编码ELL2转录因子和AFF4转录因子分别用BamHI和NotI两个酶进行酶切,将CRTC2转录因子的基因用HindIII和NotI 两个酶进行酶切,然后分别与载体用T4连接酶进行连接,得到含有编码ELL2 转录因子、AFF4转录因子和CRTC2转录因子的基因的重组载体,所述转录因子的蛋白质摩尔比例为1:1:1;
其中ELL2的碱基序列如SEQ ID NO.1所示;
AFF4的碱基序列如SEQ ID NO.3所示;
CRTC2的碱基序列如SEQ ID NO.5所示;
(2)将步骤(1)所得到的重组载体转化到受体细胞,筛选得到转录因子表达的载体;
(3)将步骤(2)所得到的转录因子表达的载体进行DNA测序,得到重组表达载体。
(二)人白血病抑制因子(LIF)表达载体的制备
将LIF和含有巨细胞病毒启动子的表达载体分别用HindIII和BamHI进行酶切,得到露出粘性末端的LIF和巨细胞病毒载体,然后用T4连接酶将LIF 与表达载体连接,得到人白血病抑制因子(LIF)表达载体。
(三)表达量的比较
将人白血病抑制因子(LIF)表达载体与不同的转录因子表达载体组合表达载体共同转染到中国仓鼠卵巢细胞中,两天后收集细胞,对表达量进行比较,结果见图1。第一道是LIF在一般的表达系统中的量,第二道是LIF在含有 ELL2/AFF4的表达系统中的量,第三道是LIF在含有ELL2/AFF4/CRTC2的表达系统中的量。我们清楚的看到,LIF在含有ELL2/AFF4/CRTC2三重转录因子的情况下,表达量最高。
实施例二
(一)人白血病抑制因子的蛋白的制备
(1)将上述所得到的重组表达载体与LIF表达载体共同转染到中国仓鼠卵巢细胞中,所述重组表达载体的总量与LIF表达载体的总量的比例为1:2;
(2)两天后收集细胞,得到人白血病抑制因子(LIF)的蛋白。
(二)人白血病抑制因子(LIF)蛋白的纯化
(1)收集上述所得到的LIF蛋白表达系统,加入裂解液,所述裂解液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油(10%)、NaCl(0.3M)、EDTA(0.2mM,pH8.0)、乙基苯基聚乙二醇(NP-40,0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail),所述裂解液的加入量是1×107个细胞中加入1ml裂解液,在冰上放置15分钟,在转速为15000rpm下离心10min,得到上清液;
(2)将步骤(1)所得到的上清液与flag beads混合,在4°孵育90min, 所述上清液与flag beads的体积比为20:1;然后在转速为5000rpm下离心30s,去除上清液,最后加入高盐洗涤液洗涤,所述高盐洗涤液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油(10%)、NaCl(0.8M)、EDTA(0.2mM, pH8.0)、乙基苯基聚乙二醇(NP-40,0.5%)和蛋白酶抑制剂混合物(Protease inhibitor cocktail),然后在转速为5000rpm下离心30s,去除上清液,重复2 次,所加入的高盐洗涤液的体积为1ml;
(3)采用与步骤(2)相同的方法,用低盐洗涤液进行洗涤,重复3次,所述低盐洗涤液包含4-羟乙基哌嗪乙磺酸(HEPES,20mM,pH7.9)、甘油 (10%)、NaCl(0.15M)、EDTA(0.2mM,pH8.0)、乙基苯基聚乙二醇(NP-40, 0.5%)和蛋白酶抑制剂混合物(Proteaseinhibitor cocktail),所使用的低盐洗涤液的体积为1ml;
(4)用终浓度为0.5mg/ml的flag peptide(溶在低盐洗涤液)在室温下洗脱25min,所述的洗脱体积与flag beads的体积比为4:1,然后进行离心,得到上清液,所述上清液即为纯化的人白血病抑制因子(LIF)的蛋白表达系统。
将实施例一中纯化好的蛋白表达系统进行蛋白电泳,然后用ThermoFisher 公司的银染试剂盒进行染色,测定结果见图2,对蛋白浓度进行估算,其纯度大于95%。
实施例三
生物活性的验证
采用小鼠胚胎干细胞进行生物活性验证的实验,实验结果见图3。由于人和鼠LIF具有很高的同源性,人源的LIF被验证对于鼠源的胚胎干细胞也起作用,及抑制鼠源胚胎干细胞的分化,让其保持不断分裂增殖的能力。我们用含 ELL2/AFF4/CRTC2三重转录因子的表达系统所产生的LIF能够较ThermoFisher公司的LIF在相同浓度下有着更高的活性,体现为产生了更多胚胎干细胞(因为更多的胚胎干细胞能够分裂增殖),从图3中可以看出,使用本发明的蛋白表达系统的胚胎干细胞较多,说明本发明的蛋白表达系统能够促进干细胞生长且抑制干细胞分化的生物活性。
综上所述,本发明所制备得到的蛋白表达系统与利用细菌表达系统所产生的同类产品进行对比的实验中,表现出高活性,能够在极低浓度下促进胚胎干细胞生长的活性。并且与加入ELL2和AFF4的蛋白表达系统相比较,本发明所制备的蛋白表达系统的表达量提高7倍,说明这种组合(ELL2/AFF4/CRTC2) 能极大地增强CMV启动子,从而提高目的基因的表达。
以上所述,仅是本发明实施的较佳实施例,并非对本发明做任何形式上的限制,凡在本发明的精神和原则之内所做的修改、等同替换和改进等,均需要包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 杭州阿诺生物医药科技股份有限公司
<120> 三重转录因子及其在哺乳动物蛋白表达系统的应用
<130> PCT170001
<160> 6
<170> DNAMAN Version 5.1
<210> 1
<211> 1921
<212> DNA
<213> 人工序列
<400> 1
1 ATGGCGGCGG GGGGGACAGG GGGCCTGCGG GAGGAGCAGC GCTATGGGCT GTCGTGCGGA
61 CGGCTGGGGC AGGACAACAT CACCGTACTG CATGTGAAGC TCACCGAGAC GGCGATCCGG
121 GCGCTCGAGA CTTACCAGAG CCACAAGAAT TTAATTCCTT TTCGACCTTC AATCCAGTTC
181 CAAGGACTCC ACGGGCTTGT CAAAATTCCC AAAAATGATC CCCTCAATGA AGTTCATAAC
241 TTTAACTTTT ATTTGTCAAA TGTGGGCAAA GACAACCCTC AGGGCAGCTT TGACTGCATC
301 CAGCAAACAT TCTCCAGCTC TGGAGCCTCC CAGCTCAATT GCCTGGGATT TATACAAGAT
361 AAAATTACAG TGTGTGCAAC AAACGACTCG TATCAGATGA CACGAGAAAG AATGACCCAG
421 GCAGAGGAGG AATCCCGCAA CCGAAGCACA AAAGTTATCA AACCCGGTGG ACCATATGTA
481 GGGAAAAGAG TGCAAATTCG GAAAGCACCT CAAGCTGTTT CAGATACAGT TCCTGAGAGG
541 AAAAGGTCAA CCCCCATGAA CCCTGCAAAT ACAATTCGAA AGACACATAG CAGCAGCACC
601 ATCTCTCAGA GGCCATACAG GGACAGGGTG ATTCACTTAC TGGCCCTGAA GGCCTACAAG
661 AAACCGGAGC TACTTGCTAG ACTCCAGAAA GATGGTGTCA ATCAAAAAGA CAAGAACTCC
721 CTGGGAGCAA TTCTGCAACA GGTAGCCAAT CTGAATTCTA AGGACCTCTC ATATACCTTA
781 AAGGATTATG TTTTTAAAGA GCTTCAAAGA GACTGGCCTG GATACAGTGA AATAGACAGA
841 CGGTCATTGG AGTCAGTGCT CTCTAGAAAA CTAAATCCGT CTCAGAATGC TGCAGGCACC
901 AGCCGTTCAG AATCTCCTGT ATGTTCTAGT AGAGACGCTG TATCTTCTCC TCAGAAACGG
961 CTTTTGGATT CAGAGTTTAT TGATCCTTTA ATGAATAAAA AAGCCCGAAT ATCTCACCTG
1021 ACGAACAGAG TACCACCAAC ACTAAATGGT CATTTGAATC CCACCAGTGA AAAATCTGCT
1081 GCAGGCCTCC CGCTGCCCCC TGCGGCTGCT GCCATCCCTA CCCCTCCACC GCTGCCTTCA
1141 ACCTATCTGC CCATCTCACA TCCTCCTCAG ATTGTAAATT CTAACTCCAA CTCCCCTAGC
1201 ACTCCAGAAG GCCGGGGGAC TCAAGACCTA CCTGTTGACA GTTTTAGTCA AAACGATAGT
1261 ATCTATGAGG ACCAGCAAGA CAAATATACC TCTAGGACTT CTCTGGAAAC CTTACCCCCT
1321 GGTTCCGTTC TACTAAAGTG TCCAAAGCCT ATGGAAGAAA ACCATTCAAT GTCTCACAAA
1381 AAGTCCAAAA AGAAGTCTAA AAAACATAAG GAAAAGGACC AAATAAAAAA GCACGACATT
1441 GAGACTATTG AGGAAAAGGA GGAAGATCTT AAGAGAGAAG AGGAAATTGC CAAGCTAAAT
1501 AACTCCAGTC CAAATTCCAG TGGAGGAGTT AAAGAGGATT GCACTGCCTC CATGGAACCT
1561 TCAGCAATTG AACTCCCAGA TTATTTGATA AAATATATCG CTATCGTCTC CTATGAGCAA
1621 CGCCAGAATT ATAAGGATGA CTTCAATGCA GAGTATGATG AGTACAGAGC TTTGCATGCC
1681 AGGATGGAGA CTGTAGCTAG AAGATTTATC AAACTAGATG CACAAAGAAA GCGCCTTTCT
1741 CCAGGCTCAA AAGAGTATCA GAATGTTCAT GAAGAAGTCT TACAAGAATA TCAGAAGATA
1801 AAGCAGTCTA GTCCCAATTA CCATGAAGAA AAATACAGAT GTGAATATCT TCATAACAAG
1861 CTGGCTCACA TCAAAAGGCT AATAGGTGAA TTTGACCAAC AGCAAGCAGA GTCATGGTCC
1921 TAG
<210> 2
<211> 601
<212> DNA
<213> 人工序列
<400> 2
1 MAAGGTGGLR EEQRYGLSCG RLGQDNITVL HVKLTETAIR ALETYQSHKN LIPFRPSIQF
61 QGLHGLVKIP KNDPLNEVHN FNFYLSNVGK DNPQGSFDCI QQTFSSSGAS QLNCLGFIQD
121 KITVCATNDS YQMTRERMTQ AEEESRNRST KVIKPGGPYV GKRVQIRKAP QAVSDTVPER
181 KRSTPMNPAN TIRKTHSSST ISQRPYRDRV IHLLALKAYK KPELLARLQK DGVNQKDKNS
241 LGAILQQVAN LNSKDLSYTL KDYVFKELQR DWPGYSEIDR RSLESVLSRK LNPSQNAAGT
301 SRSESPVCSS RDAVSSPQKR LLDSEFIDPL MNKKARISHL TNRVPPTLNG HLNPTSEKSA
361 AGLPLPPAAA AIPTPPPLPS TYLPISHPPQ IVNSNSNSPS TPEGRGTQDL PVDSFSQNDS
421 IYEDQQDKYT SRTSLETLPP GSVLLKCPKP MEENHSMSHK KSKKKSKKHK EKDQIKKHDI
481 ETIEEKEEDL KREEEIAKLN NSSPNSSGGV KEDCTASMEP SAIELPDYLI KYIAIVSYEQ
541 RQNYKDDFNA EYDEYRALHA RMETVARRFI KLDAQRKRLS PGSKEYQNVH EEVLQEYQKI
601 KQSSPNYHEE KYRCEYLHNK LAHIKRLIGE FDQQQAESWS
<210> 3
<211> 3481
<212> DNA
<213> 人工序列
<400> 3
1 ATGAACCGTG AAGACCGGAA TGTGCTGCGT ATGAAAGAAC GGGAAAGGCG GAATCAGGAA
61 ATTCAGCAGG GCGAAGACGC CTTCCCACCT AGCTCTCCTC TCTTTGCAGA GCCATACAAA
121 GTTACTAGCA AAGAAGATAA GTTATCAAGT CGTATTCAGA GTATGCTTGG AAACTACGAT
181 GAAATGAAGG ATTTCATAGG AGACAGATCT ATACCAAAGC TTGTTGCAAT TCCCAAGCCT
241 ACAGTACCAC CATCAGCAGA TGAAAAATCT AACCCAAATT TCTTTGAACA GAGACATGGA
301 GGCTCTCATC AGAGTAGCAA ATGGACTCCA GTAGGACCCG CACCCAGCAC TTCTCAGTCT
361 CAGAAACGGT CCTCAGGCTT ACAGAGTGGA CATAGTAGCC AGCGGACCAG CGCAGGTAGC
421 AGTAGTGGCA CTAACAGTAG TGGTCAGAGG CACGACCGTG AGTCATATAA CAATAGTGGG
481 AGCAGTAGCC GGAAAAAAGG CCAGCATGGA TCAGAACACT CCAAATCACG TTCTTCCAGC
541 CCTGGAAAAC CCCAGGCTGT TTCTTCATTA AACTCTAGTC ATTCCAGGTC TCATGGGAAT
601 GATCACCATA GCAAGGAACA TCAACGCTCC AAATCACCTC GGGACCCTGA TGCAAACTGG
661 GATTCTCCTT CCCGTGTACC TTTTTCAAGT GGGCAGCACT CAACTCAATC TTTCCCACCC
721 TCATTGATGT CAAAGTCCAA TTCAATGTTA CAGAAACCCA CTGCCTATGT GCGGCCCATG
781 GACGGACAGG AGTCCATGGA ACCAAAGCTG TCCTCTGAGC ACTACAGCAG CCAATCCCAT
841 GGCAACAGCA TGACTGAGCT GAAGCCCAGC AGCAAAGCAC ATCTCACCAA GCTGAAAATA
901 CCTTCCCAAC CACTGGATGC ATCAGCTTCT GGTGATGTGA GCTGTGTGGA TGAAATCCTA
961 AAAGAGATGA CGCATTCATG GCCTCCCCCT CTAACGGCTA TTCATACACC ATGCAAAACA
1021 GAACCTTCCA AATTTCCTTT TCCAACTAAG GAGTCTCAGC AGTCCAATTT TGGCACTGGA
1081 GAACAAAAAA GATATAATCC TTCTAAAACT TCAAATGGGC ACCAGTCTAA ATCTATGTTA
1141 AAAGATGACT TAAAACTAAG CAGCAGTGAA GACAGTGATG GGGAACAGGA TTGTGATAAG
1201 ACAATGCCGA GGAGTACACC AGGAAGTAAC TCTGAACCTT CACACCATAA TAGTGAAGGA
1261 GCAGATAACT CCAGGGATGA TTCTAGTAGC CACAGTGGAT CTGAAAGCAG CTCTGGATCT
1321 GACTCAGAGA GTGAAAGTAG TTCCAGTGAC AGTGAGGCAA ATGAGCCATC CCAGAGTGCA
1381 TCTCCCGAGC CTGAACCCCC GCCAACAAAC AAATGGCAAC TTGATAATTG GCTGAATAAA
1441 GTGAACCCAC ATAAAGTGTC ACCCGCCTCT TCAGTGGACA GTAACATCCC ATCATCTCAA
1501 GGCTACAAAA AGGAAGGCCG AGAGCAGGGC ACTGGGAATA GCTACACTGA TACAAGTGGA
1561 CCTAAAGAAA CGAGTTCCGC TACTCCGGGA CGAGACTCCA AAACCATCCA AAAGGGATCA
1621 GAAAGTGGGC GTGGGAGGCA GAAATCTCCT GCACAGAGTG ACAGCACAAC ACAGAGAAGA
1681 ACTGTAGGCA AAAAACAACC CAAAAAGGCT GAGAAGGCAG CTGCTGAAGA GCCTCGTGGA
1741 GGCCTGAAGA TAGAAAGTGA AACCCCTGTA GACTTGGCTA GCAGCATGCC CTCCAGCAGA
1801 CACAAAGCAG CCACCAAAGG CTCAAGGAAA CCCAATATAA AGAAGGAGTC TAAGTCTTCC
1861 CCTCGACCTA CAGCAGAGAA AAAGAAATAT AAGTCAACAA GTAAATCTTC CCAGAAATCA
1921 AGGGAAATCA TAGAAACAGA TACCTCATCC TCAGATTCAG ATGAAAGTGA GAGCCTTCCT
1981 CCTTCCTCAC AAACTCCTAA GTACCCCGAG AGCAATAGGA CTCCTGTTAA ACCCTCCTCA
2041 GTGGAGGAAG AAGATAGCTT TTTTCGGCAA CGAATGTTCT CTCCTATGGA AGAGAAGGAA
2101 CTTCTTTCAC CCCTCAGTGA GCCTGATGAC AGGTACCCAC TTATTGTGAA GATTGACCTG
2161 AATCTTTTGA CTAGAATACC AGGAAAGCCT TACAAAGAAA CAGAGCCGCC CAAGGGGGAA
2221 AAGAAAAATG TGCCAGAAAA GCACACGAGA GAGGCTCAGA AACAAGCCTC AGAAAAAGTT
2281 TCCAACAAAG GCAAGAGGAA GCATAAGAAT GAAGATGATA ACCGAGCCAG TGAGAGCAAG
2341 AAACCCAAAA CGGAGGACAA GAATTCAGCA GGCCATAAGC CATCCAGCAA CAGAGAGTCA
2401 TCTAAGCAGA GTGCTGCAAA AGAAAAGGAT TTGTTGCCTT CTCCCGCTGG GCCTGTTCCT
2461 TCAAAAGATC CAAAAACAGA GCATGGCTCT CGGAAGAGGA CTATTAGTCA GTCTTCTTCC
2521 TTAAAGTCAA GCAGTAACAG CAACAAGGAG ACGAGTGGCA GCAGCAAAAA CAGTTCCTCC
2581 ACATCAAAGC AGAAGAAGAC CGAAGGGAAG ACTTCCAGTA GCTCCAAGGA GGTTAAGGAA
2641 AAGGCTCCAA GTAGCTCCTC TAACTGTCCT CCATCTGCAC CAACTCTTGA TTCTTCTAAG
2701 CCTCGGAGAA CAAAGCTTGT CTTTGATGAC AGAAATTATT CAGCAGACCA TTATTTACAA
2761 GAAGCAAAAA AGCTAAAGCA CAATGCAGAT GCATTGTCTG ATAGGTTTGA GAAAGCTGTA
2821 TACTATCTTG ATGCTGTGGT ATCTTTCATT GAATGTGGGA ATGCATTAGA GAAGAATGCT
2881 CAGGAATCCA AATCCCCATT CCCTATGTAT TCAGAGACGG TGGATCTCAT CAAATACACT
2941 ATGAAGCTAA AGAATTACTT GGCACCAGAT GCTACAGCTG CAGATAAACG ACTCACAGTA
3001 CTTTGCCTGC GATGCGAGTC TTTGCTGTAC CTGAGGCTGT TCAAACTGAA GAAGGAAAAT
3061 GCTCTGAAGT ACTCAAAGAC ACTGACAGAG CACCTGAAGA ATTCTTATAA TAATTCTCAA
3121 GCACCATCGC CTGGCTTGGG AAGCAAAGCT GTGGGGATGC CTTCCCCTGT TTCTCCAAAG
3181 CTGTCACCAG GCAATTCAGG AAATTATTCA TCTGGGGCCA GTAGTGCTTC TGCAAGTGGT
3241 TCTTCAGTGA CCATTCCACA GAAGATCCAC CAGATGGCAG CCAGCTATGT TCAGGTCACA
3301 TCCAACTTCC TCTATGCCAC CGAAATTTGG GACCAAGCTG AACAGCTTTC CAAAGAGCAA
3361 AAAGAATTCT TTGCTGAACT GGATAAAGTA ATGGGCCCTC TCATCTTTAA TGCAAGCATC
3421 ATGACAGATC TAGTTCGTTA TACCCGGCAG GGACTGCACT GGCTTCGCCA GGATGCCAAG
3481 TTGATATCTT GA
<210> 4
<211> 1141
<212> DNA
<213> 人工序列
<400> 4
1 MNREDRNVLR MKERERRNQE IQQGEDAFPP SSPLFAEPYK VTSKEDKLSS RIQSMLGNYD
61 EMKDFIGDRS IPKLVAIPKP TVPPSADEKS NPNFFEQRHG GSHQSSKWTP VGPAPSTSQS
121 QKRSSGLQSG HSSQRTSAGS SSGTNSSGQR HDRESYNNSG SSSRKKGQHG SEHSKSRSSS
181 PGKPQAVSSL NSSHSRSHGN DHHSKEHQRS KSPRDPDANW DSPSRVPFSS GQHSTQSFPP
241 SLMSKSNSML QKPTAYVRPM DGQESMEPKL SSEHYSSQSH GNSMTELKPS SKAHLTKLKI
301 PSQPLDASAS GDVSCVDEIL KEMTHSWPPP LTAIHTPCKT EPSKFPFPTK ESQQSNFGTG
361 EQKRYNPSKT SNGHQSKSML KDDLKLSSSE DSDGEQDCDK TMPRSTPGSN SEPSHHNSEG
421 ADNSRDDSSS HSGSESSSGS DSESESSSSD SEANEPSQSA SPEPEPPPTN KWQLDNWLNK
481 VNPHKVSPAS SVDSNIPSSQ GYKKEGREQG TGNSYTDTSG PKETSSATPG RDSKTIQKGS
541 ESGRGRQKSP AQSDSTTQRR TVGKKQPKKA EKAAAEEPRG GLKIESETPV DLASSMPSSR
601 HKAATKGSRK PNIKKESKSS PRPTAEKKKY KSTSKSSQKS REIIETDTSS SDSDESESLP
661 PSSQTPKYPE SNRTPVKPSS VEEEDSFFRQ RMFSPMEEKE LLSPLSEPDD RYPLIVKIDL
721 NLLTRIPGKP YKETEPPKGE KKNVPEKHTR EAQKQASEKV SNKGKRKHKN EDDNRASESK
781 KPKTEDKNSA GHKPSSNRES SKQSAAKEKD LLPSPAGPVP SKDPKTEHGS RKRTISQSSS
841 LKSSSNSNKE TSGSSKNSSS TSKQKKTEGK TSSSSKEVKE KAPSSSSNCP PSAPTLDSSK
901 PRRTKLVFDD RNYSADHYLQ EAKKLKHNAD ALSDRFEKAV YYLDAVVSFI ECGNALEKNA
961 QESKSPFPMY SETVDLIKYT MKLKNYLAPD ATAADKRLTV LCLRCESLLY LRLFKLKKEN
1021 ALKYSKTLTE HLKNSYNNSQ APSPGLGSKA VGMPSPVSPK LSPGNSGNYS SGASSASASG
1081 SSVTIPQKIH QMAASYVQVT SNFLYATEIW DQAEQLSKEQ KEFFAELDKV MGPLIFNASI
1141 MTDLVRYTRQ GLHWLRQDAK LIS
<210> 5
<211> 2041
<212> DNA
<213> 人工序列
<400> 5
1 ATGGCGACGT CGGGGGCGAA CGGGCCTGGT TCGGCCACGG CCTCGGCTTC CAATCCGCGC
61 AAATTTAGTG AGAAGATTGC GCTGCAGAAG CAGCGTCAGG CCGAGGAGAC GGCGGCCTTC
121 GAGGAGGTGA TGATGGACAT CGGCTCCACC CGGTTACAGG CCCAAAAACT GCGACTGGCA
181 TACACAAGGA GCTCTCATTA TGGTGGGTCT CTGCCCAATG TTAACCAGAT TGGCTCTGGC
241 CTGGCCGAGT TCCAGAGCCC CCTCCACTCA CCTTTGGATT CATCTCGGAG CACTCGGCAC
301 CATGGGCTGG TGGAACGGGT GCAGCGAGAT CCTCGAAGAA TGGTGTCCCC ACTTCGCCGA
361 TACACCCGCC ACATTGACAG CTCTCCCTAT AGTCCTGCCT ACTTATCTCC TCCCCCAGAG
421 TCTAGCTGGC GAAGGACGAT GGCCTGGGGC AATTTCCCTG CAGAGAAGGG GCAGTTGTTT
481 CGACTACCAT CTGCACTTAA CAGGACAAGC TCTGACTCTG CCCTTCATAC AAGTGTGATG
541 AACCCCAGTC CCCAGGATAC CTACCCAGGC CCCACACCTC CCAGCATCCT GCCCAGCCGA
601 CGTGGGGGTA TTCTGGATGG TGAAATGGAC CCCAAAGTAC CTGCTATTGA GGAGAACTTG
661 CTAGATGACA AGCATTTGCT GAAGCCATGG GATGCTAAGA AGCTATCCTC ATCCTCTTCC
721 CGACCTCGGT CCTGTGAAGT CCCTGGAATT AACATCTTTC CATCTCCTGA CCAGCCTGCC
781 AATGTGCCTG TCCTCCCACC TGCCATGAAC ACGGGGGGCT CCCTACCTGA CCTCACCAAC
841 CTGCACTTTC CCCCACCACT GCCCACCCCC CTGGACCCTG AAGAGACAGC CTACCCTAGC
901 CTGAGTGGGG GCAACAGTAC CTCCAATTTG ACCCACACCA TGACTCACCT GGGCATCAGC
961 AGGGGCATGG GCCTGGGCCC AGGCTATGAT GCACCAGGAC TTCATTCACC TCTCAGCCAC
1021 CCATCCCTGC AGTCCTCCCT AAGCAATCCC AACCTCCAGG CTTCCCTGAG CAGTCCTCAG
1081 CCCCAGCTTC AGGGCTCCCA CAGCCACCCC TCTCTGCCTG CCTCCTCCTT GGCCCGCCAT
1141 GTACTGCCCA CCACCTCCCT GGGCCACCCC TCACTCAGTG CTCCGGCTCT CTCCTCCTCC
1201 TCTTCCTCCT CCTCCACTTC ATCTCCTGTT TTGGGCGCCC CCTCTTACCC TGCTTCTACC
1261 CCTGGGGCCT CCCCCCACCA CCGCCGTGTG CCCCTCAGCC CCCTGAGTTT GCTCGCGGGC
1321 CCAGCCGACG CCAGAAGGTC CCAACAGCAG CTGCCCAAAC AGTTTTCGCC AACAATGTCA
1381 CCCACCTTGT CTTCCATCAC TCAGGGCGTC CCCCTGGATA CCAGTAAACT GTCCACTGAC
1441 CAGCGGTTAC CCCCATACCC ATACAGCTCC CCAAGTCTGG TTCTGCCTAC CCAGCCCCAC
1501 ACCCCAAAGT CTCTACAGCA GCCAGGGCTG CCCTCTCAGT CTTGTTCAGT GCAGTCCTCA
1561 GGTGGGCAGC CCCCAGGCAG GCAGTCTCAT TATGGGACAC CGTACCCACC TGGGCCCAGT
1621 GGGCATGGGC AACAGTCTTA CCACCGGCCA ATGAGTGACT TCAACCTGGG GAATCTGGAG
1681 CAGTTCAGCA TGGAGAGCCC ATCAGCCAGC CTGGTGCTGG ATCCCCCTGG CTTTTCTGAA
1741 GGGCCTGGAT TTTTAGGGGG TGAGGGGCCA ATGGGTGGCC CCCAGGATCC CCACACCTTC
1801 AACCACCAGA ACTTGACCCA CTGTTCCCGC CATGGCTCAG GGCCTAACAT CATCCTCACA
1861 GGGGACTCCT CTCCAGGTTT CTCTAAGGAG ATTGCAGCAG CCCTGGCCGG AGTGCCTGGC
1921 TTTGAGGTGT CAGCAGCTGG ATTGGAGCTA GGGCTTGGGC TAGAAGATGA GCTGCGCATG
1981 GAGCCACTGG GCCTGGAAGG GCTAAACATG CTGAGTGACC CCTGTGCCCT GCTGCCTGAT
2041 CCTGCTGTGG AGGAGTCATT CCGCAGTGAC CGGCTCCAAT GA
<210> 6
<211> 661
<212> DNA
<213> 人工序列
<400> 6
1 MATSGANGPG SATASASNPR KFSEKIALQK QRQAEETAAF EEVMMDIGST RLQAQKLRLA
61 YTRSSHYGGS LPNVNQIGSG LAEFQSPLHS PLDSSRSTRH HGLVERVQRD PRRMVSPLRR
121 YTRHIDSSPY SPAYLSPPPE SSWRRTMAWG NFPAEKGQLF RLPSALNRTS SDSALHTSVM
181 NPSPQDTYPG PTPPSILPSR RGGILDGEMD PKVPAIEENL LDDKHLLKPW DAKKLSSSSS
241 RPRSCEVPGI NIFPSPDQPA NVPVLPPAMN TGGSLPDLTN LHFPPPLPTP LDPEETAYPS
301 LSGGNSTSNL THTMTHLGIS RGMGLGPGYD APGLHSPLSH PSLQSSLSNP NLQASLSSPQ
361 PQLQGSHSHP SLPASSLARH VLPTTSLGHP SLSAPALSSS SSSSSTSSPV LGAPSYPAST
421 PGASPHHRRV PLSPLSLLAG PADARRSQQQ LPKQFSPTMS PTLSSITQGV PLDTSKLSTD
481 QRLPPYPYSS PSLVLPTQPH TPKSLQQPGL PSQSCSVQSS GGQPPGRQSH YGTPYPPGPS
541 GHGQQSYHRP MSDFNLGNLE QFSMESPSAS LVLDPPGFSE GPGFLGGEGP MGGPQDPHTF
601 NHQNLTHCSR HGSGPNIILT GDSSPGFSKE IAAALAGVPG FEVSAAGLEL GLGLEDELRM
661 EPLGLEGLNM LSDPCALLPD PAVEESFRSD RLQ