CN114380920A

CN114380920A - 人甲胎蛋白融合蛋白及其制备方法和应用

Info

Publication number: CN114380920A
Application number: CN202111553094.1A
Authority: CN
Inventors: 黄黉; 蒋析文; 颜青青; 卢杰锋; 梁国立; 肖兰花
Original assignee: Guangzhou Da'an Gene Co ltd
Current assignee: Guangzhou Da'an Gene Co ltd
Priority date: 2021-12-17
Filing date: 2021-12-17
Publication date: 2022-04-22

Abstract

本发明公开了人甲胎蛋白融合蛋白及其制备方法和应用，具体地本发明对人甲胎蛋白进行重组表达，经过大量的筛选测试，获得了能够在哺乳动物细胞中进行大量表达的人甲胎蛋白融合蛋白，并且具有良好的抗原性。在此基础上制备了表达载体和重组细胞，从而获得了能够在体外大量制备重组人甲胎蛋白的工艺。为临床检测提供了成本较低且抗原性良好的诊断试剂原料。

Description

人甲胎蛋白融合蛋白及其制备方法和应用

技术领域

本发明属于生物技术领域。更具体地，涉及人甲胎蛋白融合蛋白及其制备方法和应用。

背景技术

甲胎蛋白(alpha-fetoprotein，AFP)含有609个氨基酸残基，分子量约70kDa，是一种肿瘤相关的单链糖蛋白，其糖链部分具有癌胚性变化的特征。AFP为胎儿时期肝脏合成的一种胚胎蛋白，出生后一周消失，以后完全被白蛋白替代。正常人不产生AFP，当患肝细胞癌、卵黄囊和胚胎样肿瘤及部分肝外肿瘤时机体可重新合成AFP，因此是原发性肝癌(primary hepatic carcinoma，PHC)重要的血清学标志物，并作为PHC诊断、评价疗效给予后的敏感指标应用于临床。另外，甲胎蛋白也是睾丸非精原细胞瘤的诊断和治疗效果评价中是较为敏感的指标，且对于胃癌的早期发现和手术方式选择以及预后判断也具有较高的指导意义。

目前已公开了一些AFP的制备方法，很多是利用原核表达系统表达，缺乏人甲胎蛋白翻译后后加工与修饰，绝大多数抗体都存在特异性差、灵敏度低的缺点，这应该是利用大肠杆菌来源重组AFP蛋白制备的单抗在建立AFP检测试剂遇到困难的主要原因。

因此本领域技术人员致力于开发表达特异性强、灵敏度高的AFP制备工艺。

发明内容

本文发明建立了高效表达与制备外分泌型人源AFP的方法，采用选择适合分泌蛋白表达的pcDNA3.4载体，采用能高效分泌AFP的白蛋白信号肽，并在起始密码子ATG前加入kozak序列，构建了适用于CHO细胞的高效表达及分泌效率的载体。

本发明的第一方面，提供了一种融合蛋白，所述融合蛋白具有结构如式I所示，

S-A，式I

式I中，S为信号肽多肽元件、A为甲胎蛋白多肽元件；“-”为健或连接序列，其中，所述信号肽多肽元件的氨基酸序列如SEQ ID NO.3或SEQ ID NO.5所示。

在另一优选例中，所述甲胎蛋白多肽元件选自下组：

(A)具有SEQ ID NO.1所示氨基酸序列的多肽；

(B)具有与SEQ ID NO.1所示氨基酸序列≥90％同源性(优选地，≥95％的同源性；等优选地≥96％的同源性；最优选地，≥97％的同源性)的多肽，且所述多肽保持有SEQ IDNO.1所示多肽的活性；

(C)将SEQ ID NO.1所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的，且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。

在另一优选例中，所述融合蛋白选自下组：

(A)具有SEQ ID NO.7或9所示氨基酸序列的多肽；

(B)具有与SEQ ID NO.7或9所示氨基酸序列≥90％同源性(优选地，≥95％的同源性；等优选地≥96％的同源性；最优选地，≥97％的同源性)的多肽，且所述多肽保持有SEQID NO.1所示多肽的活性；

(C)将SEQ ID NO.7或9中任一所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的，且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。

在另一优选例中，所述融合蛋白为分离的。

本发明的第二方面，提供了一种分离的经密码子优化的多核苷酸，所述多核苷酸编码本发明第一方面所述的融合蛋白。

在另一优选例中，所述多核苷酸选自下组：

(a)序列如SEQ ID NO.11所示的多核苷酸；

(b)核苷酸序列与SEQ ID NO.11所示序列的同源性≥95％(较佳地≥98％)的多核苷酸；

(c)与(a)-(b)任一所述的多核苷酸互补的多核苷酸。

本发明的第三方面，提供了一种表达载体，所述表达载体含有本发明第二方面所述的多核苷酸。

本发明的第四方面，提供了一种宿主细胞，所述的宿主细胞含有本发明第三方面所述的表达载体，或者在基因组中整合有本发明第二方面所述的多核苷酸。

在另一优选例中，所述宿主细胞为真核细胞，优选地所述宿主细胞为哺乳动物细胞，更优选地为CHO细胞。

本发明的第五方面，提供了一种制备甲胎蛋白的方法，包括步骤：

在适合表达的条件下，培养本发明第四方面所述的细胞，从而表达出甲胎蛋白；和分离所述甲胎蛋白。

本发明的第六方面，提供了一种试剂盒，所述的试剂盒含有本发明第一方面所述的融合蛋白、本发明第二方面所述的多核苷酸或者本发明第三方面所述的表达载体或者本发明第四方面所述的宿主细胞。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1为连接不同信号肽的AFP表达效率。

图2为融合蛋白纯化电泳图。

具体实施方式

本发明对人甲胎蛋白进行重组表达，经过大量的筛选测试，意外获得了能够在哺乳动物细胞中进行大量表达的人甲胎蛋白融合蛋白，并且具有良好的抗原性。在此基础上制备了表达载体和重组细胞，从而获得了能够在体外大量制备重组人甲胎蛋白的工艺。

在描述本发明之前，应当理解本发明不限于所述的具体方法和实验条件，因为这类方法和条件可以变动。还应当理解本文所用的术语其目的仅在于描述具体实施方案，并且不意图是限制性的，本发明的范围将仅由所附的权利要求书限制。

除非另外定义，否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用，在提到具体列举的数值中使用时，术语“约”意指该值可以从列举的值变动不多于1％。例如，如本文所用，表述“约100”包括99和101和之间的全部值(例如，99.1、99.2、99.3、99.4等)。

虽然在本发明的实施或测试中可以使用与本发明中所述相似或等价的任何方法和材料，本文在此处例举优选的方法和材料。

融合蛋白及其制备

在本发明中，“融合蛋白”、“重组蛋白”、“本发明蛋白”、“本发明融合蛋白”可互换使用，指具有式I所述结构，即含有信号肽多肽元件和甲胎蛋白多肽元件的融合蛋白。本发明蛋白可以是单体或由单体形成的多聚体(如二聚体)。此外，应理解，所述术语还包括融合蛋白的活性片段和衍生物。

如本文所用，“分离的”是指物质从其原始环境中分离出来(如果是天然的物质，原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的，但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开，则为分离纯化的。

如本文所用，“分离的融合蛋白”是指融合蛋白基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化融合蛋白。基本上纯的蛋白在非还原聚丙烯酰胺凝胶上能产生单一的主带。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。

本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的蛋白质片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码多肽的功能。

如本文所用，术语“引物”指的是在与模板配对，在DNA聚合酶的作用下能以其为起点进行合成与模板互补的DNA链的寡居核苷酸的总称。引物可以是天然的RNA、DNA，也可以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一条链充分互补才能开始延伸，但引物的序列不必与模板的序列完全互补。比如，在一个3'端与模板互补的引物的5'端加上一段与模板不互补的序列，这样的引物仍大致上与模板互补。只要有足够长的引物能与模板充分的结合，非完全互补的引物也可以与模板形成引物-模板复合物，从而进行扩增。

本发明融合蛋白或其元件的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据已公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。

应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或融合蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述蛋白质的方法。

通过常规的重组DNA技术，可利用本发明的多核苷酸序列可用来表达或生产重组蛋白。一般来说有以下步骤：

(1)用本发明的编码本发明蛋白的多核苷酸(或变异体)，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；

(2)在合适的培养基中培养的宿主细胞；

(3)从培养基或细胞中分离、纯化蛋白质。

本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞优选为真核细胞，更优选为高等真核细胞，如哺乳动物细胞。代表性例子有：CHO、NS0、COS7、或293细胞的动物细胞等。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主是真核生物，可选用如下的DNA转染方法：磷酸钙共沉淀法，常规机械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的多肽。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

在一个优选地实施方式中，本发明所述的人AFP的氨基酸序列如下：

KWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCI IHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADIIIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.1)；

密码子优化后的编码序列如下：

AAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.2)。

在一个优选地实施方式中，本发明所述的信号肽多肽元件(Gaussia luc信号肽)的氨基酸序列如下：

MGVKVLFALICIAVAEA(SEQ ID NO.3)；

其编码基因序列如下：

ATGGGTGTGAAGGTGCTATTTGCACTAATCTGCATCGCCGTGGCCGAGGCT(SEQ ID NO.4)。

在另一个优选地实施方式中，本发明所述的信号肽多肽元件(Albumin信号肽)的氨基酸序列如下：

MKWVTFISLLFSSAYS(SEQ ID NO.5)；

其编码基因序列如下：

ATGAAGTGGGTGACTTTTATCAGTCTACTATTTAGCTCTGCCTACTCC(SEQ ID NO.6)。在一个优选地实施方式中，本发明所述的融合蛋白的氨基酸序列如下：

MGVKVLFALICIAVAEAKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADII IGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.7)；

其密码子优化后的编码序列如下：

ATGGGTGTGAAGGTGCTATTTGCACTAATCTGCATCGCCGTGGCCGAGGCTAAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.8)

在一个优选地实施方式中，本发明所述的融合蛋白的氨基酸序列如下：

MKWVTFISLLFSSAYSKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADIIIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.9)；

其密码子优化后的编码序列如下：

ATGAAGTGGGTGACTTTTATCAGTCTACTATTTAGCTCTGCCTACTCCAAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.10)。

在一个优选地实施方式中，所述融合蛋白的C端添加6xHis标签。

在一个优选地实施方式中，所述融合蛋白编码序列的5’端还包括kozak序列；优选地，所述kozak序列为GCCACC。

在一个优选地实施方式中，本发明所述的人AFP融合蛋白的密码子优化后的基因序列如下：

GCCAC

AAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTGCACCACCA CCACCATCATTAA(SEQ ID NO.11)。

应理解，所述术语还包括本发明融合蛋白的衍生物，指本发明融合蛋白在经过1-3个氨基酸添加或替换、1-2个氨基酸缺失并仍具有活性的多肽。

一旦鉴定获得了相关的肽序列，就可以用重组法来大批量地获得相关肽序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到相关肽(融合蛋白)。

此外，还可用化学方法直接合成相关肽序列。

基因工程细胞

本发明提供了一种基因工程细胞(宿主细胞)，所述基因工程细胞为真核细胞(优选为哺乳动物细胞)，并且所述细胞的基因组中整合有本发明融合蛋白的表达盒；或者所述细胞中含有表达载体，所述表达载体含有本发明融合蛋白的表达盒。

在一优选例中，本发明融合蛋白的表达盒包括5'至3'可操作地连接的以下元件：启动子、起始密码子、融合蛋白的ORF序列和终止密码子。

本发明中，术语“可操作地连接”意指这样的构型，其中将调控序列置于相对于多核苷酸的编码序列的适当位置，使得调控序列指导编码序列的表达。

本发明的有益效果在于：

(1)本发明的融合蛋白，在哺乳动物细胞株中不仅能够大量表达，而且融合蛋白保持了良好的抗原性。

(2)本发明的融合蛋白，其浓度与RLU值的线性良好，能够作为检测标准品使用。

(3)本发明采用重组CHO表达AFP融合蛋白，只有C端有(His)6标签，不用再进行切除标签和二次纯化等步骤，一步法获得高纯度、高活性目的蛋白

下面结合具体实施例，进一步详陈本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法，通常按照常规条件如美国Sambrook.J等著《分子克隆实验室指南》(黄培堂等译，北京：科学出版社，2002年)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。以下实施例中所用的实验材料和试剂如无特别说明均可从市售渠道获得。

实施例1

1)以NCBI提供的人AFP的基因为参考，结合本发明的试验设计要求，确定SEQ IDNO.1所示的氨基酸序列编码基因进行同义密码子偏好性优化，并在N端分别连接多种不同的信号肽编码基因，测试不同信号肽的效果。

人工合成基因片段(C端添加(His)6标签)后连接至pcDNA3.4载体，有利于快速分离纯化提供便利。

2)AFP在CHO细胞中的表达

大量制备质粒，检测内毒素为阴性。

使用ExpiCHO转染试剂盒(购自Thermo公司)，依据说明书进行转染CHO细胞，15-24小时加入增强剂和辅料。

温度36.5℃，转速95rpm，8％CO₂培养12天左右,且活率高于70％时，4℃3500rpm离心30min收集上清。

3)Elisa鉴定表达量

取等量不同信号肽质粒瞬转的细胞上清，加入到酶标板进行4℃包被过夜。

包被结束后用洗板机洗涤3次，加入脱脂奶粉37℃恒温培养箱中封闭1h。

然后加入用PBS稀释5000倍的抗体(抗AFP抗体，购自Abcam公司)，37℃恒温培养箱中孵育2h，结束后洗板3次。

加入二抗(购自生工)37℃孵育30min，洗涤5次轻拍干溶液，加入TMB显色液室温避光显色时间10min，至肉眼可见浅蓝色。加入终止液50μL/孔，在酶标仪上450nm/630nm测OD值。

部分结果如图1所示，其中：

Gaussia luc信号肽序列如SEQ ID NO.3所示；

Albumin信号肽序列如SEQ ID NO.4所示；

α-factor信号肽序列如下：

MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKREAEA(SEQ ID NO.12)

其编码基因序列为：

ATGCGATTTCCAAGTATCTTTACTGCAGTGCTCTTTGCCGCTTCTAGCGCCCTGGCTGCTCCTGTGAATACCACCACCGAGGACGAGACAGCTCAGATCCCCGCTGAGGCTGTGATCGGCTACTCCGATCTGGAAGGCGACTTCGACGTGGCCGTGCTGCCTTTCTCCAACTCCACCAACAACGGCCTGCTGTTCATCAACACCACCATCGCCTCTATCGCCGCCAAGGAAGAGGGAGTCTCTCTGGAAAAGAGAGAGGCCGAGGCC(SEQ ID NO.13)。

结果表明：连接Albumin信号肽的AFP表达载体的分泌及表达效率是最高；Gaussialuc信号肽效率次之，其它信号肽的效率显著较低。

4)表达产物纯化

取200ml AFP载体瞬转的细胞上清，0.22μm针式过滤器过滤得到过滤后细胞上清。

滤后过Ni-柱亲和层析，用50mM Tris-HCl，50mM NaCl，200mM咪唑，pH7.0洗脱的蛋白即为目的蛋白洗脱后蛋白。

Albumin信号肽的融合蛋白的电泳图如图2所示，分子量大小接近70KD，与理论值相同。

用BCA法检测浓度，标准曲线R²＝0.997，蛋白总量为30.85mg，纯度达到95％。

计算目的蛋白AFP在CHO细胞上清中的表达为154.25mg/L。

实施例2采用化学发光法进行活性鉴定

用成品试剂盒(广州市达瑞生物技术股份有限公司)检测实施例1制备的AFP抗原活性。

连接Albumin信号肽的AFP融合蛋白，经检测甲胎蛋白的发光值最高可达到350万，说明该抗原活性较高。发光度与RLU值的线性回归方程为：y＝3E+11x+30836，R²＝0.9962，说明线性良好(R²＞0.99)。

连接Gaussia luc信号肽的AFP融合蛋白，经检测甲胎蛋白的发光值为339万，说明该抗原活性较低。发光度与RLU值的线性回归方程为：3E+11x+148693，R²＝0.9732，说明线性较差(R²＜0.99)。

实施例3蛋白稳定性试验

将获得的目的蛋白(连接Albumin信号肽的AFP融合蛋白)分别分装于2mL EP管中，1mL/支，用封口膜封好。每批次3支，1支置于4℃作为对照，1支置于37℃做加速3天进行鉴定，另外一支-20℃放置3天，用化学发光法鉴定稳定性。

实验结论：与4℃放置相比，除了本底外，企标各点在-20℃和37℃放置3天的相对偏差在±25％以内。

综上说明该AFP抗原稳定性较好。

表1

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 广州达安基因股份有限公司

<120> 人甲胎蛋白融合蛋白及其制备方法和应用

<130> 000097

<160> 13

<170> SIPOSequenceListing 1.0

<210> 1

<211> 608

<212> PRT

<213> 人(Homo sapiens)

<400> 1

Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr Glu

1 5 10 15

Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp

20 25 30

Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile

35 40 45

Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys

50 55 60

Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu

65 70 75 80

Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu

85 90 95

Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys

100 105 110

Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys

115 120 125

Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro Val

130 135 140

Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys

145 150 155 160

Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr

165 170 175

Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys

180 185 190

Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val

195 200 205

Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys Ala

210 215 220

Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val Thr

225 230 235 240

Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys

245 250 255

Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp

260 265 270

Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys

275 280 285

Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu

290 295 300

Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu

305 310 315 320

Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg

325 330 335

Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser

340 345 350

Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val

355 360 365

Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe

370 375 380

Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu

385 390 395 400

Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly

405 410 415

Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val

420 425 430

Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala

435 440 445

Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser

450 455 460

Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile

465 470 475 480

Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val

485 490 495

Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser

500 505 510

Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp

515 520 525

Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu

530 535 540

Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro

545 550 555 560

Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly

565 570 575

Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala

580 585 590

Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val

595 600 605

<210> 2

<211> 1824

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 2

aagtgggtgg aaagtatctt tctaatcttt ctgctgaatt tcaccgagtc tcggaccctg 60

caccggaacg agtatggcat cgcctctatc ctggactcct accagtgtac cgccgagatc 120

agcctggctg acctggccac catcttcttc gcccagttcg tccaggaggc tacctacaag 180

gaagtctcta agatggtgaa ggacgccctc accgccatcg aaaagcctac cggagacgag 240

cagtcttctg gctgcctgga gaaccaactg cctgcttttc tggaagaact gtgtcatgaa 300

aaagaaatcc tggagaagta cggccactcc gactgctgca gccagtccga agagggccgg 360

cacaactgct tcctggccca caagaaacca acacctgctt ccatccctct gttccaggtg 420

cccatccccg tgacatcttg cgaggcctac gaggaggaca gagagacctt catgaacaag 480

ttcatctacg agatcgccag acggcatcct ttcctgtacg ctcccaccat cctgctgtgg 540

gccgctagat acgacaagat tatcccttcc tgttgcaagg ccgagaatgc cgtggaatgc 600

ttccagacca aggctgccac cgtgaccaaa gagctgagag aatcctctct gctgaagcag 660

cacgcctgcg ccgtgatgaa gaacttcggc agaaccacct ttcaggccat cacagtgacc 720

aagctgtctc agaagttcac caaggtgaac ttcaccgaga tccagaagct tgtactggac 780

gtggctcacg tgcatgagca ctgctgcaga ggcgacgtgc tggattgtct gcaggacggc 840

gagaagatca tgtcctatat ctgctcccag caggacaccc tgtctaacaa gatcaccgag 900

tgttgcaagc tgaccacact ggagcggggc cagtgcatca tccacgctga aaacgacgag 960

aagcctgagg gcctgtcccc taacctgaac agattcctgg gagatcggga cttcaatcag 1020

ttctcttccg gcgagaagaa catcttcctg gcctccttcg tgcacgagta ctccagaaga 1080

cacccccagc tggctgtgtc cgtgatcctg agagtggcca aaggctacca agagctgctg 1140

gaaaagtgct tccagacaga gaaccccctg gagtgccagg ataaaggcga agaggaactg 1200

cagaagtaca tccaagagag ccaggccctg gccaagcggt cctgtggcct gttccaaaaa 1260

ctgggagagt actacctcca gaacgccttc ctggtggctt acaccaagaa ggcccctcag 1320

ctgacctcct ccgagctgat ggctatcacc cggaagatgg ccgctacagc cgctacctgc 1380

tgtcaactct ctgaggacaa gctgctggcc tgtggtgaag gcgccgccga catcattatc 1440

ggccacctgt gcatccggca cgagatgacc cctgtgaacc ctggcgtggg ccagtgctgc 1500

accagcagct acgccaaccg cagaccttgt tttagttccc tggtggtgga cgaaacttac 1560

gtgcctcctg ccttttctga cgataagttt atcttccaca aggatctgtg ccaggctcag 1620

ggcgtggctc tccagaccat gaagcaagag ttcctgatca acctggtcaa gcagaaacca 1680

cagatcacag aggaacagct ggaagccgtg atcgccgatt tctctggact gctggaaaag 1740

tgctgtcagg gccaagagca ggaagtgtgc ttcgctgagg aaggccagaa actgatctcc 1800

aagaccagag ctgctctggg cgtg 1824

<210> 3

<211> 17

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 3

Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu

1 5 10 15

Ala

<210> 4

<211> 51

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 4

atgggtgtga aggtgctatt tgcactaatc tgcatcgccg tggccgaggc t 51

<210> 5

<211> 16

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 5

Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Ser Ser Ala Tyr Ser

1 5 10 15

<210> 6

<211> 48

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 6

atgaagtggg tgacttttat cagtctacta tttagctctg cctactcc 48

<210> 7

<211> 625

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 7

Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu

1 5 10 15

Ala Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr

20 25 30

Glu Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu

35 40 45

Asp Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr

50 55 60

Ile Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser

65 70 75 80

Lys Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp

85 90 95

Glu Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu

100 105 110

Glu Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp

115 120 125

Cys Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His

130 135 140

Lys Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro

145 150 155 160

Val Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn

165 170 175

Lys Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro

180 185 190

Thr Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys

195 200 205

Cys Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr

210 215 220

Val Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys

225 230 235 240

Ala Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val

245 250 255

Thr Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln

260 265 270

Lys Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly

275 280 285

Asp Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile

290 295 300

Cys Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys

305 310 315 320

Leu Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp

325 330 335

Glu Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp

340 345 350

Arg Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala

355 360 365

Ser Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser

370 375 380

Val Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys

385 390 395 400

Phe Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu

405 410 415

Leu Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys

420 425 430

Gly Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu

435 440 445

Val Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met

450 455 460

Ala Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu

465 470 475 480

Ser Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile

485 490 495

Ile Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly

500 505 510

Val Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe

515 520 525

Ser Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp

530 535 540

Asp Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala

545 550 555 560

Leu Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys

565 570 575

Pro Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser

580 585 590

Gly Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe

595 600 605

Ala Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly

610 615 620

Val

625

<210> 8

<211> 1875

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 8

atgggtgtga aggtgctatt tgcactaatc tgcatcgccg tggccgaggc taagtgggtg 60

gaaagtatct ttctaatctt tctgctgaat ttcaccgagt ctcggaccct gcaccggaac 120

gagtatggca tcgcctctat cctggactcc taccagtgta ccgccgagat cagcctggct 180

gacctggcca ccatcttctt cgcccagttc gtccaggagg ctacctacaa ggaagtctct 240

aagatggtga aggacgccct caccgccatc gaaaagccta ccggagacga gcagtcttct 300

ggctgcctgg agaaccaact gcctgctttt ctggaagaac tgtgtcatga aaaagaaatc 360

ctggagaagt acggccactc cgactgctgc agccagtccg aagagggccg gcacaactgc 420

ttcctggccc acaagaaacc aacacctgct tccatccctc tgttccaggt gcccatcccc 480

gtgacatctt gcgaggccta cgaggaggac agagagacct tcatgaacaa gttcatctac 540

gagatcgcca gacggcatcc tttcctgtac gctcccacca tcctgctgtg ggccgctaga 600

tacgacaaga ttatcccttc ctgttgcaag gccgagaatg ccgtggaatg cttccagacc 660

aaggctgcca ccgtgaccaa agagctgaga gaatcctctc tgctgaagca gcacgcctgc 720

gccgtgatga agaacttcgg cagaaccacc tttcaggcca tcacagtgac caagctgtct 780

cagaagttca ccaaggtgaa cttcaccgag atccagaagc ttgtactgga cgtggctcac 840

gtgcatgagc actgctgcag aggcgacgtg ctggattgtc tgcaggacgg cgagaagatc 900

atgtcctata tctgctccca gcaggacacc ctgtctaaca agatcaccga gtgttgcaag 960

ctgaccacac tggagcgggg ccagtgcatc atccacgctg aaaacgacga gaagcctgag 1020

ggcctgtccc ctaacctgaa cagattcctg ggagatcggg acttcaatca gttctcttcc 1080

ggcgagaaga acatcttcct ggcctccttc gtgcacgagt actccagaag acacccccag 1140

ctggctgtgt ccgtgatcct gagagtggcc aaaggctacc aagagctgct ggaaaagtgc 1200

ttccagacag agaaccccct ggagtgccag gataaaggcg aagaggaact gcagaagtac 1260

atccaagaga gccaggccct ggccaagcgg tcctgtggcc tgttccaaaa actgggagag 1320

tactacctcc agaacgcctt cctggtggct tacaccaaga aggcccctca gctgacctcc 1380

tccgagctga tggctatcac ccggaagatg gccgctacag ccgctacctg ctgtcaactc 1440

tctgaggaca agctgctggc ctgtggtgaa ggcgccgccg acatcattat cggccacctg 1500

tgcatccggc acgagatgac ccctgtgaac cctggcgtgg gccagtgctg caccagcagc 1560

tacgccaacc gcagaccttg ttttagttcc ctggtggtgg acgaaactta cgtgcctcct 1620

gccttttctg acgataagtt tatcttccac aaggatctgt gccaggctca gggcgtggct 1680

ctccagacca tgaagcaaga gttcctgatc aacctggtca agcagaaacc acagatcaca 1740

gaggaacagc tggaagccgt gatcgccgat ttctctggac tgctggaaaa gtgctgtcag 1800

ggccaagagc aggaagtgtg cttcgctgag gaaggccaga aactgatctc caagaccaga 1860

gctgctctgg gcgtg 1875

<210> 9

<211> 624

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 9

Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Ser Ser Ala Tyr Ser

1 5 10 15

Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr Glu

20 25 30

Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp

35 40 45

Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile

50 55 60

Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys

65 70 75 80

Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu

85 90 95

Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu

100 105 110

Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys

115 120 125

Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys

130 135 140

Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro Val

145 150 155 160

Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys

165 170 175

Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr

180 185 190

Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys

195 200 205

Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val

210 215 220

Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys Ala

225 230 235 240

Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val Thr

245 250 255

Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys

260 265 270

Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp

275 280 285

Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys

290 295 300

Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu

305 310 315 320

Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu

325 330 335

Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg

340 345 350

Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser

355 360 365

Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val

370 375 380

Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe

385 390 395 400

Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu

405 410 415

Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly

420 425 430

Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val

435 440 445

Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala

450 455 460

Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser

465 470 475 480

Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile

485 490 495

Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val

500 505 510

Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser

515 520 525

Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp

530 535 540

Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu

545 550 555 560

Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro

565 570 575

Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly

580 585 590

Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala

595 600 605

Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val

610 615 620

<210> 10

<211> 1872

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 10

atgaagtggg tgacttttat cagtctacta tttagctctg cctactccaa gtgggtggaa 60

agtatctttc taatctttct gctgaatttc accgagtctc ggaccctgca ccggaacgag 120

tatggcatcg cctctatcct ggactcctac cagtgtaccg ccgagatcag cctggctgac 180

ctggccacca tcttcttcgc ccagttcgtc caggaggcta cctacaagga agtctctaag 240

atggtgaagg acgccctcac cgccatcgaa aagcctaccg gagacgagca gtcttctggc 300

tgcctggaga accaactgcc tgcttttctg gaagaactgt gtcatgaaaa agaaatcctg 360

gagaagtacg gccactccga ctgctgcagc cagtccgaag agggccggca caactgcttc 420

ctggcccaca agaaaccaac acctgcttcc atccctctgt tccaggtgcc catccccgtg 480

acatcttgcg aggcctacga ggaggacaga gagaccttca tgaacaagtt catctacgag 540

atcgccagac ggcatccttt cctgtacgct cccaccatcc tgctgtgggc cgctagatac 600

gacaagatta tcccttcctg ttgcaaggcc gagaatgccg tggaatgctt ccagaccaag 660

gctgccaccg tgaccaaaga gctgagagaa tcctctctgc tgaagcagca cgcctgcgcc 720

gtgatgaaga acttcggcag aaccaccttt caggccatca cagtgaccaa gctgtctcag 780

aagttcacca aggtgaactt caccgagatc cagaagcttg tactggacgt ggctcacgtg 840

catgagcact gctgcagagg cgacgtgctg gattgtctgc aggacggcga gaagatcatg 900

tcctatatct gctcccagca ggacaccctg tctaacaaga tcaccgagtg ttgcaagctg 960

accacactgg agcggggcca gtgcatcatc cacgctgaaa acgacgagaa gcctgagggc 1020

ctgtccccta acctgaacag attcctggga gatcgggact tcaatcagtt ctcttccggc 1080

gagaagaaca tcttcctggc ctccttcgtg cacgagtact ccagaagaca cccccagctg 1140

gctgtgtccg tgatcctgag agtggccaaa ggctaccaag agctgctgga aaagtgcttc 1200

cagacagaga accccctgga gtgccaggat aaaggcgaag aggaactgca gaagtacatc 1260

caagagagcc aggccctggc caagcggtcc tgtggcctgt tccaaaaact gggagagtac 1320

tacctccaga acgccttcct ggtggcttac accaagaagg cccctcagct gacctcctcc 1380

gagctgatgg ctatcacccg gaagatggcc gctacagccg ctacctgctg tcaactctct 1440

gaggacaagc tgctggcctg tggtgaaggc gccgccgaca tcattatcgg ccacctgtgc 1500

atccggcacg agatgacccc tgtgaaccct ggcgtgggcc agtgctgcac cagcagctac 1560

gccaaccgca gaccttgttt tagttccctg gtggtggacg aaacttacgt gcctcctgcc 1620

ttttctgacg ataagtttat cttccacaag gatctgtgcc aggctcaggg cgtggctctc 1680

cagaccatga agcaagagtt cctgatcaac ctggtcaagc agaaaccaca gatcacagag 1740

gaacagctgg aagccgtgat cgccgatttc tctggactgc tggaaaagtg ctgtcagggc 1800

caagagcagg aagtgtgctt cgctgaggaa ggccagaaac tgatctccaa gaccagagct 1860

gctctgggcg tg 1872

<210> 11

<211> 1899

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 11

gccaccatga agtgggtgac ttttatcagt ctactattta gctctgccta ctccaagtgg 60

gtggaaagta tctttctaat ctttctgctg aatttcaccg agtctcggac cctgcaccgg 120

aacgagtatg gcatcgcctc tatcctggac tcctaccagt gtaccgccga gatcagcctg 180

gctgacctgg ccaccatctt cttcgcccag ttcgtccagg aggctaccta caaggaagtc 240

tctaagatgg tgaaggacgc cctcaccgcc atcgaaaagc ctaccggaga cgagcagtct 300

tctggctgcc tggagaacca actgcctgct tttctggaag aactgtgtca tgaaaaagaa 360

atcctggaga agtacggcca ctccgactgc tgcagccagt ccgaagaggg ccggcacaac 420

tgcttcctgg cccacaagaa accaacacct gcttccatcc ctctgttcca ggtgcccatc 480

cccgtgacat cttgcgaggc ctacgaggag gacagagaga ccttcatgaa caagttcatc 540

tacgagatcg ccagacggca tcctttcctg tacgctccca ccatcctgct gtgggccgct 600

agatacgaca agattatccc ttcctgttgc aaggccgaga atgccgtgga atgcttccag 660

accaaggctg ccaccgtgac caaagagctg agagaatcct ctctgctgaa gcagcacgcc 720

tgcgccgtga tgaagaactt cggcagaacc acctttcagg ccatcacagt gaccaagctg 780

tctcagaagt tcaccaaggt gaacttcacc gagatccaga agcttgtact ggacgtggct 840

cacgtgcatg agcactgctg cagaggcgac gtgctggatt gtctgcagga cggcgagaag 900

atcatgtcct atatctgctc ccagcaggac accctgtcta acaagatcac cgagtgttgc 960

aagctgacca cactggagcg gggccagtgc atcatccacg ctgaaaacga cgagaagcct 1020

gagggcctgt cccctaacct gaacagattc ctgggagatc gggacttcaa tcagttctct 1080

tccggcgaga agaacatctt cctggcctcc ttcgtgcacg agtactccag aagacacccc 1140

cagctggctg tgtccgtgat cctgagagtg gccaaaggct accaagagct gctggaaaag 1200

tgcttccaga cagagaaccc cctggagtgc caggataaag gcgaagagga actgcagaag 1260

tacatccaag agagccaggc cctggccaag cggtcctgtg gcctgttcca aaaactggga 1320

gagtactacc tccagaacgc cttcctggtg gcttacacca agaaggcccc tcagctgacc 1380

tcctccgagc tgatggctat cacccggaag atggccgcta cagccgctac ctgctgtcaa 1440

ctctctgagg acaagctgct ggcctgtggt gaaggcgccg ccgacatcat tatcggccac 1500

ctgtgcatcc ggcacgagat gacccctgtg aaccctggcg tgggccagtg ctgcaccagc 1560

agctacgcca accgcagacc ttgttttagt tccctggtgg tggacgaaac ttacgtgcct 1620

cctgcctttt ctgacgataa gtttatcttc cacaaggatc tgtgccaggc tcagggcgtg 1680

gctctccaga ccatgaagca agagttcctg atcaacctgg tcaagcagaa accacagatc 1740

acagaggaac agctggaagc cgtgatcgcc gatttctctg gactgctgga aaagtgctgt 1800

cagggccaag agcaggaagt gtgcttcgct gaggaaggcc agaaactgat ctccaagacc 1860

agagctgctc tgggcgtgca ccaccaccac catcattaa 1899

<210> 12

<211> 89

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 12

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Glu Ala Glu Ala

85

<210> 13

<211> 267

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 13

atgcgatttc caagtatctt tactgcagtg ctctttgccg cttctagcgc cctggctgct 60

cctgtgaata ccaccaccga ggacgagaca gctcagatcc ccgctgaggc tgtgatcggc 120

tactccgatc tggaaggcga cttcgacgtg gccgtgctgc ctttctccaa ctccaccaac 180

aacggcctgc tgttcatcaa caccaccatc gcctctatcg ccgccaagga agagggagtc 240

tctctggaaa agagagaggc cgaggcc 267

Claims

1.一种融合蛋白，其特征在于，所述融合蛋白具有结构如式I所示，

S-A，式I

2.如权利要求1所述的融合蛋白，其特征在于，所述甲胎蛋白多肽元件选自下组：

(A)具有SEQ ID NO.1所示氨基酸序列的多肽；

(B)具有与SEQ ID NO.1所示氨基酸序列≥90％同源性(优选地，≥95％的同源性；等优选地≥96％的同源性；最优选地，≥97％的同源性)的多肽，且所述多肽保持有SEQ ID NO.1所示多肽的活性；

3.如权利要求1所述的融合蛋白，其特征在于，所述融合蛋白选自下组：

(A)具有SEQ ID NO.7或9所示氨基酸序列的多肽；

(B)具有与SEQ ID NO.7或9所示氨基酸序列≥90％同源性(优选地，≥95％的同源性；等优选地≥96％的同源性；最优选地，≥97％的同源性)的多肽，且所述多肽保持有SEQ IDNO.1所示多肽的活性；

4.一种分离的经密码子优化的多核苷酸，其特征在于，所述多核苷酸编码权利要求1所述的融合蛋白。

5.如权利要求4所述的多核苷酸，其特征在于，所述多核苷酸选自下组：

(a)序列如SEQ ID NO.11所示的多核苷酸；

(c)与(a)-(c)任一所述的多核苷酸互补的多核苷酸。

6.一种表达载体，其特征在于，所述表达载体含有权利要求4所述的多核苷酸。

7.一种宿主细胞，其特征在于，所述的宿主细胞含有权利要求6所述的表达载体，或者在基因组中整合有权利要求4所述的多核苷酸。

8.如权利要求7所述的宿主细胞，其特征在于，所述宿主细胞为真核细胞，优选地所述宿主细胞为哺乳动物细胞，更优选地为CHO细胞。

9.一种制备甲胎蛋白的方法，其特征在于，包括步骤：

在适合表达的条件下，培养权利要求7所述的细胞，从而表达出甲胎蛋白；和分离所述甲胎蛋白。

10.一种试剂盒，其特征在于，所述的试剂盒含有权利要求1所述的融合蛋白、权利要求4所述的多核苷酸或者权利要求6所述的表达载体或者权利要求7所述的宿主细胞。