CN114380920A - 人甲胎蛋白融合蛋白及其制备方法和应用 - Google Patents

人甲胎蛋白融合蛋白及其制备方法和应用 Download PDF

Info

Publication number
CN114380920A
CN114380920A CN202111553094.1A CN202111553094A CN114380920A CN 114380920 A CN114380920 A CN 114380920A CN 202111553094 A CN202111553094 A CN 202111553094A CN 114380920 A CN114380920 A CN 114380920A
Authority
CN
China
Prior art keywords
leu
glu
ala
lys
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111553094.1A
Other languages
English (en)
Inventor
黄黉
蒋析文
颜青青
卢杰锋
梁国立
肖兰花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Da'an Gene Co ltd
Original Assignee
Guangzhou Da'an Gene Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Da'an Gene Co ltd filed Critical Guangzhou Da'an Gene Co ltd
Priority to CN202111553094.1A priority Critical patent/CN114380920A/zh
Publication of CN114380920A publication Critical patent/CN114380920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4715Pregnancy proteins, e.g. placenta proteins, alpha-feto-protein, pregnancy specific beta glycoprotein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Reproductive Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gynecology & Obstetrics (AREA)
  • Pregnancy & Childbirth (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了人甲胎蛋白融合蛋白及其制备方法和应用,具体地本发明对人甲胎蛋白进行重组表达,经过大量的筛选测试,获得了能够在哺乳动物细胞中进行大量表达的人甲胎蛋白融合蛋白,并且具有良好的抗原性。在此基础上制备了表达载体和重组细胞,从而获得了能够在体外大量制备重组人甲胎蛋白的工艺。为临床检测提供了成本较低且抗原性良好的诊断试剂原料。

Description

人甲胎蛋白融合蛋白及其制备方法和应用
技术领域
本发明属于生物技术领域。更具体地,涉及人甲胎蛋白融合蛋白及其制备方法和应用。
背景技术
甲胎蛋白(alpha-fetoprotein,AFP)含有609个氨基酸残基,分子量约70kDa,是一种肿瘤相关的单链糖蛋白,其糖链部分具有癌胚性变化的特征。AFP为胎儿时期肝脏合成的一种胚胎蛋白,出生后一周消失,以后完全被白蛋白替代。正常人不产生AFP,当患肝细胞癌、卵黄囊和胚胎样肿瘤及部分肝外肿瘤时机体可重新合成AFP,因此是原发性肝癌(primary hepatic carcinoma,PHC)重要的血清学标志物,并作为PHC诊断、评价疗效给予后的敏感指标应用于临床。另外,甲胎蛋白也是睾丸非精原细胞瘤的诊断和治疗效果评价中是较为敏感的指标,且对于胃癌的早期发现和手术方式选择以及预后判断也具有较高的指导意义。
目前已公开了一些AFP的制备方法,很多是利用原核表达系统表达,缺乏人甲胎蛋白翻译后后加工与修饰,绝大多数抗体都存在特异性差、灵敏度低的缺点,这应该是利用大肠杆菌来源重组AFP蛋白制备的单抗在建立AFP检测试剂遇到困难的主要原因。
因此本领域技术人员致力于开发表达特异性强、灵敏度高的AFP制备工艺。
发明内容
本文发明建立了高效表达与制备外分泌型人源AFP的方法,采用选择适合分泌蛋白表达的pcDNA3.4载体,采用能高效分泌AFP的白蛋白信号肽,并在起始密码子ATG前加入kozak序列,构建了适用于CHO细胞的高效表达及分泌效率的载体。
本发明的第一方面,提供了一种融合蛋白,所述融合蛋白具有结构如式I所示,
S-A, 式I
式I中,S为信号肽多肽元件、A为甲胎蛋白多肽元件;“-”为健或连接序列,其中,所述信号肽多肽元件的氨基酸序列如SEQ ID NO.3或SEQ ID NO.5所示。
在另一优选例中,所述甲胎蛋白多肽元件选自下组:
(A)具有SEQ ID NO.1所示氨基酸序列的多肽;
(B)具有与SEQ ID NO.1所示氨基酸序列≥90%同源性(优选地,≥95%的同源性;等优选地≥96%的同源性;最优选地,≥97%的同源性)的多肽,且所述多肽保持有SEQ IDNO.1所示多肽的活性;
(C)将SEQ ID NO.1所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的,且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。
在另一优选例中,所述融合蛋白选自下组:
(A)具有SEQ ID NO.7或9所示氨基酸序列的多肽;
(B)具有与SEQ ID NO.7或9所示氨基酸序列≥90%同源性(优选地,≥95%的同源性;等优选地≥96%的同源性;最优选地,≥97%的同源性)的多肽,且所述多肽保持有SEQID NO.1所示多肽的活性;
(C)将SEQ ID NO.7或9中任一所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的,且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。
在另一优选例中,所述融合蛋白为分离的。
本发明的第二方面,提供了一种分离的经密码子优化的多核苷酸,所述多核苷酸编码本发明第一方面所述的融合蛋白。
在另一优选例中,所述多核苷酸选自下组:
(a)序列如SEQ ID NO.11所示的多核苷酸;
(b)核苷酸序列与SEQ ID NO.11所示序列的同源性≥95%(较佳地≥98%)的多核苷酸;
(c)与(a)-(b)任一所述的多核苷酸互补的多核苷酸。
本发明的第三方面,提供了一种表达载体,所述表达载体含有本发明第二方面所述的多核苷酸。
本发明的第四方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第三方面所述的表达载体,或者在基因组中整合有本发明第二方面所述的多核苷酸。
在另一优选例中,所述宿主细胞为真核细胞,优选地所述宿主细胞为哺乳动物细胞,更优选地为CHO细胞。
本发明的第五方面,提供了一种制备甲胎蛋白的方法,包括步骤:
在适合表达的条件下,培养本发明第四方面所述的细胞,从而表达出甲胎蛋白;和分离所述甲胎蛋白。
本发明的第六方面,提供了一种试剂盒,所述的试剂盒含有本发明第一方面所述的融合蛋白、本发明第二方面所述的多核苷酸或者本发明第三方面所述的表达载体或者本发明第四方面所述的宿主细胞。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1为连接不同信号肽的AFP表达效率。
图2为融合蛋白纯化电泳图。
具体实施方式
本发明对人甲胎蛋白进行重组表达,经过大量的筛选测试,意外获得了能够在哺乳动物细胞中进行大量表达的人甲胎蛋白融合蛋白,并且具有良好的抗原性。在此基础上制备了表达载体和重组细胞,从而获得了能够在体外大量制备重组人甲胎蛋白的工艺。
在描述本发明之前,应当理解本发明不限于所述的具体方法和实验条件,因为这类方法和条件可以变动。还应当理解本文所用的术语其目的仅在于描述具体实施方案,并且不意图是限制性的,本发明的范围将仅由所附的权利要求书限制。
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
虽然在本发明的实施或测试中可以使用与本发明中所述相似或等价的任何方法和材料,本文在此处例举优选的方法和材料。
融合蛋白及其制备
在本发明中,“融合蛋白”、“重组蛋白”、“本发明蛋白”、“本发明融合蛋白”可互换使用,指具有式I所述结构,即含有信号肽多肽元件和甲胎蛋白多肽元件的融合蛋白。本发明蛋白可以是单体或由单体形成的多聚体(如二聚体)。此外,应理解,所述术语还包括融合蛋白的活性片段和衍生物。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的,但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的融合蛋白”是指融合蛋白基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化融合蛋白。基本上纯的蛋白在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的蛋白质片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码多肽的功能。
如本文所用,术语“引物”指的是在与模板配对,在DNA聚合酶的作用下能以其为起点进行合成与模板互补的DNA链的寡居核苷酸的总称。引物可以是天然的RNA、DNA,也可以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一条链充分互补才能开始延伸,但引物的序列不必与模板的序列完全互补。比如,在一个3'端与模板互补的引物的5'端加上一段与模板不互补的序列,这样的引物仍大致上与模板互补。只要有足够长的引物能与模板充分的结合,非完全互补的引物也可以与模板形成引物-模板复合物,从而进行扩增。
本发明融合蛋白或其元件的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据已公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或融合蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述蛋白质的方法。
通过常规的重组DNA技术,可利用本发明的多核苷酸序列可用来表达或生产重组蛋白。一般来说有以下步骤:
(1)用本发明的编码本发明蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2)在合适的培养基中培养的宿主细胞;
(3)从培养基或细胞中分离、纯化蛋白质。
本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞优选为真核细胞,更优选为高等真核细胞,如哺乳动物细胞。代表性例子有:CHO、NS0、COS7、或293细胞的动物细胞等。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
在一个优选地实施方式中,本发明所述的人AFP的氨基酸序列如下:
KWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCI IHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADIIIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.1);
密码子优化后的编码序列如下:
AAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.2)。
在一个优选地实施方式中,本发明所述的信号肽多肽元件(Gaussia luc信号肽)的氨基酸序列如下:
MGVKVLFALICIAVAEA(SEQ ID NO.3);
其编码基因序列如下:
ATGGGTGTGAAGGTGCTATTTGCACTAATCTGCATCGCCGTGGCCGAGGCT(SEQ ID NO.4)。
在另一个优选地实施方式中,本发明所述的信号肽多肽元件(Albumin信号肽)的氨基酸序列如下:
MKWVTFISLLFSSAYS(SEQ ID NO.5);
其编码基因序列如下:
ATGAAGTGGGTGACTTTTATCAGTCTACTATTTAGCTCTGCCTACTCC(SEQ ID NO.6)。在一个优选地实施方式中,本发明所述的融合蛋白的氨基酸序列如下:
MGVKVLFALICIAVAEAKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADII IGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.7);
其密码子优化后的编码序列如下:
ATGGGTGTGAAGGTGCTATTTGCACTAATCTGCATCGCCGTGGCCGAGGCTAAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.8)
在一个优选地实施方式中,本发明所述的融合蛋白的氨基酸序列如下:
MKWVTFISLLFSSAYSKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATYKEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGHSDCCSQSEEGRHNCFLAHKKPTPASIPLFQVPIPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTILLWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLKQHACAVMKNFGRTTFQAITVTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKITECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYSRRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLFQKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADIIIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQAQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKLISKTRAALGV(SEQ ID NO.9);
其密码子优化后的编码序列如下:
ATGAAGTGGGTGACTTTTATCAGTCTACTATTTAGCTCTGCCTACTCCAAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTG(SEQ ID NO.10)。
在一个优选地实施方式中,所述融合蛋白的C端添加6xHis标签。
在一个优选地实施方式中,所述融合蛋白编码序列的5’端还包括kozak序列;优选地,所述kozak序列为GCCACC。
在一个优选地实施方式中,本发明所述的人AFP融合蛋白的密码子优化后的基因序列如下:
GCCAC
Figure BDA0003418368690000081
AAGTGGGTGGAAAGTATCTTTCTAATCTTTCTGCTGAATTTCACCGAGTCTCGGACCCTGCACCGGAACGAGTATGGCATCGCCTCTATCCTGGACTCCTACCAGTGTACCGCCGAGATCAGCCTGGCTGACCTGGCCACCATCTTCTTCGCCCAGTTCGTCCAGGAGGCTACCTACAAGGAAGTCTCTAAGATGGTGAAGGACGCCCTCACCGCCATCGAAAAGCCTACCGGAGACGAGCAGTCTTCTGGCTGCCTGGAGAACCAACTGCCTGCTTTTCTGGAAGAACTGTGTCATGAAAAAGAAATCCTGGAGAAGTACGGCCACTCCGACTGCTGCAGCCAGTCCGAAGAGGGCCGGCACAACTGCTTCCTGGCCCACAAGAAACCAACACCTGCTTCCATCCCTCTGTTCCAGGTGCCCATCCCCGTGACATCTTGCGAGGCCTACGAGGAGGACAGAGAGACCTTCATGAACAAGTTCATCTACGAGATCGCCAGACGGCATCCTTTCCTGTACGCTCCCACCATCCTGCTGTGGGCCGCTAGATACGACAAGATTATCCCTTCCTGTTGCAAGGCCGAGAATGCCGTGGAATGCTTCCAGACCAAGGCTGCCACCGTGACCAAAGAGCTGAGAGAATCCTCTCTGCTGAAGCAGCACGCCTGCGCCGTGATGAAGAACTTCGGCAGAACCACCTTTCAGGCCATCACAGTGACCAAGCTGTCTCAGAAGTTCACCAAGGTGAACTTCACCGAGATCCAGAAGCTTGTACTGGACGTGGCTCACGTGCATGAGCACTGCTGCAGAGGCGACGTGCTGGATTGTCTGCAGGACGGCGAGAAGATCATGTCCTATATCTGCTCCCAGCAGGACACCCTGTCTAACAAGATCACCGAGTGTTGCAAGCTGACCACACTGGAGCGGGGCCAGTGCATCATCCACGCTGAAAACGACGAGAAGCCTGAGGGCCTGTCCCCTAACCTGAACAGATTCCTGGGAGATCGGGACTTCAATCAGTTCTCTTCCGGCGAGAAGAACATCTTCCTGGCCTCCTTCGTGCACGAGTACTCCAGAAGACACCCCCAGCTGGCTGTGTCCGTGATCCTGAGAGTGGCCAAAGGCTACCAAGAGCTGCTGGAAAAGTGCTTCCAGACAGAGAACCCCCTGGAGTGCCAGGATAAAGGCGAAGAGGAACTGCAGAAGTACATCCAAGAGAGCCAGGCCCTGGCCAAGCGGTCCTGTGGCCTGTTCCAAAAACTGGGAGAGTACTACCTCCAGAACGCCTTCCTGGTGGCTTACACCAAGAAGGCCCCTCAGCTGACCTCCTCCGAGCTGATGGCTATCACCCGGAAGATGGCCGCTACAGCCGCTACCTGCTGTCAACTCTCTGAGGACAAGCTGCTGGCCTGTGGTGAAGGCGCCGCCGACATCATTATCGGCCACCTGTGCATCCGGCACGAGATGACCCCTGTGAACCCTGGCGTGGGCCAGTGCTGCACCAGCAGCTACGCCAACCGCAGACCTTGTTTTAGTTCCCTGGTGGTGGACGAAACTTACGTGCCTCCTGCCTTTTCTGACGATAAGTTTATCTTCCACAAGGATCTGTGCCAGGCTCAGGGCGTGGCTCTCCAGACCATGAAGCAAGAGTTCCTGATCAACCTGGTCAAGCAGAAACCACAGATCACAGAGGAACAGCTGGAAGCCGTGATCGCCGATTTCTCTGGACTGCTGGAAAAGTGCTGTCAGGGCCAAGAGCAGGAAGTGTGCTTCGCTGAGGAAGGCCAGAAACTGATCTCCAAGACCAGAGCTGCTCTGGGCGTGCACCACCA CCACCATCATTAA(SEQ ID NO.11)。
应理解,所述术语还包括本发明融合蛋白的衍生物,指本发明融合蛋白在经过1-3个氨基酸添加或替换、1-2个氨基酸缺失并仍具有活性的多肽。
一旦鉴定获得了相关的肽序列,就可以用重组法来大批量地获得相关肽序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到相关肽(融合蛋白)。
此外,还可用化学方法直接合成相关肽序列。
基因工程细胞
本发明提供了一种基因工程细胞(宿主细胞),所述基因工程细胞为真核细胞(优选为哺乳动物细胞),并且所述细胞的基因组中整合有本发明融合蛋白的表达盒;或者所述细胞中含有表达载体,所述表达载体含有本发明融合蛋白的表达盒。
在一优选例中,本发明融合蛋白的表达盒包括5'至3'可操作地连接的以下元件:启动子、起始密码子、融合蛋白的ORF序列和终止密码子。
本发明中,术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
本发明的有益效果在于:
(1)本发明的融合蛋白,在哺乳动物细胞株中不仅能够大量表达,而且融合蛋白保持了良好的抗原性。
(2)本发明的融合蛋白,其浓度与RLU值的线性良好,能够作为检测标准品使用。
(3)本发明采用重组CHO表达AFP融合蛋白,只有C端有(His)6标签,不用再进行切除标签和二次纯化等步骤,一步法获得高纯度、高活性目的蛋白
下面结合具体实施例,进一步详陈本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如美国Sambrook.J等著《分子克隆实验室指南》(黄培堂等译,北京:科学出版社,2002年)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。以下实施例中所用的实验材料和试剂如无特别说明均可从市售渠道获得。
实施例1
1)以NCBI提供的人AFP的基因为参考,结合本发明的试验设计要求,确定SEQ IDNO.1所示的氨基酸序列编码基因进行同义密码子偏好性优化,并在N端分别连接多种不同的信号肽编码基因,测试不同信号肽的效果。
人工合成基因片段(C端添加(His)6标签)后连接至pcDNA3.4载体,有利于快速分离纯化提供便利。
2)AFP在CHO细胞中的表达
大量制备质粒,检测内毒素为阴性。
使用ExpiCHO转染试剂盒(购自Thermo公司),依据说明书进行转染CHO细胞,15-24小时加入增强剂和辅料。
温度36.5℃,转速95rpm,8%CO2培养12天左右,且活率高于70%时,4℃3500rpm离心30min收集上清。
3)Elisa鉴定表达量
取等量不同信号肽质粒瞬转的细胞上清,加入到酶标板进行4℃包被过夜。
包被结束后用洗板机洗涤3次,加入脱脂奶粉37℃恒温培养箱中封闭1h。
然后加入用PBS稀释5000倍的抗体(抗AFP抗体,购自Abcam公司),37℃恒温培养箱中孵育2h,结束后洗板3次。
加入二抗(购自生工)37℃孵育30min,洗涤5次轻拍干溶液,加入TMB显色液室温避光显色时间10min,至肉眼可见浅蓝色。加入终止液50μL/孔,在酶标仪上450nm/630nm测OD值。
部分结果如图1所示,其中:
Gaussia luc信号肽序列如SEQ ID NO.3所示;
Albumin信号肽序列如SEQ ID NO.4所示;
α-factor信号肽序列如下:
MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKREAEA(SEQ ID NO.12)
其编码基因序列为:
ATGCGATTTCCAAGTATCTTTACTGCAGTGCTCTTTGCCGCTTCTAGCGCCCTGGCTGCTCCTGTGAATACCACCACCGAGGACGAGACAGCTCAGATCCCCGCTGAGGCTGTGATCGGCTACTCCGATCTGGAAGGCGACTTCGACGTGGCCGTGCTGCCTTTCTCCAACTCCACCAACAACGGCCTGCTGTTCATCAACACCACCATCGCCTCTATCGCCGCCAAGGAAGAGGGAGTCTCTCTGGAAAAGAGAGAGGCCGAGGCC(SEQ ID NO.13)。
结果表明:连接Albumin信号肽的AFP表达载体的分泌及表达效率是最高;Gaussialuc信号肽效率次之,其它信号肽的效率显著较低。
4)表达产物纯化
取200ml AFP载体瞬转的细胞上清,0.22μm针式过滤器过滤得到过滤后细胞上清。
滤后过Ni-柱亲和层析,用50mM Tris-HCl,50mM NaCl,200mM咪唑,pH7.0洗脱的蛋白即为目的蛋白洗脱后蛋白。
Albumin信号肽的融合蛋白的电泳图如图2所示,分子量大小接近70KD,与理论值相同。
用BCA法检测浓度,标准曲线R2=0.997,蛋白总量为30.85mg,纯度达到95%。
计算目的蛋白AFP在CHO细胞上清中的表达为154.25mg/L。
实施例2采用化学发光法进行活性鉴定
用成品试剂盒(广州市达瑞生物技术股份有限公司)检测实施例1制备的AFP抗原活性。
连接Albumin信号肽的AFP融合蛋白,经检测甲胎蛋白的发光值最高可达到350万,说明该抗原活性较高。发光度与RLU值的线性回归方程为:y=3E+11x+30836,R2=0.9962,说明线性良好(R2>0.99)。
Figure BDA0003418368690000111
连接Gaussia luc信号肽的AFP融合蛋白,经检测甲胎蛋白的发光值为339万,说明该抗原活性较低。发光度与RLU值的线性回归方程为:3E+11x+148693,R2=0.9732,说明线性较差(R2<0.99)。
Figure BDA0003418368690000112
实施例3蛋白稳定性试验
将获得的目的蛋白(连接Albumin信号肽的AFP融合蛋白)分别分装于2mL EP管中,1mL/支,用封口膜封好。每批次3支,1支置于4℃作为对照,1支置于37℃做加速3天进行鉴定,另外一支-20℃放置3天,用化学发光法鉴定稳定性。
实验结论:与4℃放置相比,除了本底外,企标各点在-20℃和37℃放置3天的相对偏差在±25%以内。
综上说明该AFP抗原稳定性较好。
表1
Figure BDA0003418368690000113
Figure BDA0003418368690000121
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 广州达安基因股份有限公司
<120> 人甲胎蛋白融合蛋白及其制备方法和应用
<130> 000097
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 608
<212> PRT
<213> 人(Homo sapiens)
<400> 1
Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr Glu
1 5 10 15
Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp
20 25 30
Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile
35 40 45
Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys
50 55 60
Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu
65 70 75 80
Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu
85 90 95
Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys
100 105 110
Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys
115 120 125
Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro Val
130 135 140
Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys
145 150 155 160
Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr
165 170 175
Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys
180 185 190
Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val
195 200 205
Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys Ala
210 215 220
Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val Thr
225 230 235 240
Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys
245 250 255
Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp
260 265 270
Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys
275 280 285
Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu
290 295 300
Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu
305 310 315 320
Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg
325 330 335
Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser
340 345 350
Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val
355 360 365
Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe
370 375 380
Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu
385 390 395 400
Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly
405 410 415
Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val
420 425 430
Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala
435 440 445
Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser
450 455 460
Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile
465 470 475 480
Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val
485 490 495
Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser
500 505 510
Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp
515 520 525
Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu
530 535 540
Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro
545 550 555 560
Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly
565 570 575
Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala
580 585 590
Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val
595 600 605
<210> 2
<211> 1824
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 2
aagtgggtgg aaagtatctt tctaatcttt ctgctgaatt tcaccgagtc tcggaccctg 60
caccggaacg agtatggcat cgcctctatc ctggactcct accagtgtac cgccgagatc 120
agcctggctg acctggccac catcttcttc gcccagttcg tccaggaggc tacctacaag 180
gaagtctcta agatggtgaa ggacgccctc accgccatcg aaaagcctac cggagacgag 240
cagtcttctg gctgcctgga gaaccaactg cctgcttttc tggaagaact gtgtcatgaa 300
aaagaaatcc tggagaagta cggccactcc gactgctgca gccagtccga agagggccgg 360
cacaactgct tcctggccca caagaaacca acacctgctt ccatccctct gttccaggtg 420
cccatccccg tgacatcttg cgaggcctac gaggaggaca gagagacctt catgaacaag 480
ttcatctacg agatcgccag acggcatcct ttcctgtacg ctcccaccat cctgctgtgg 540
gccgctagat acgacaagat tatcccttcc tgttgcaagg ccgagaatgc cgtggaatgc 600
ttccagacca aggctgccac cgtgaccaaa gagctgagag aatcctctct gctgaagcag 660
cacgcctgcg ccgtgatgaa gaacttcggc agaaccacct ttcaggccat cacagtgacc 720
aagctgtctc agaagttcac caaggtgaac ttcaccgaga tccagaagct tgtactggac 780
gtggctcacg tgcatgagca ctgctgcaga ggcgacgtgc tggattgtct gcaggacggc 840
gagaagatca tgtcctatat ctgctcccag caggacaccc tgtctaacaa gatcaccgag 900
tgttgcaagc tgaccacact ggagcggggc cagtgcatca tccacgctga aaacgacgag 960
aagcctgagg gcctgtcccc taacctgaac agattcctgg gagatcggga cttcaatcag 1020
ttctcttccg gcgagaagaa catcttcctg gcctccttcg tgcacgagta ctccagaaga 1080
cacccccagc tggctgtgtc cgtgatcctg agagtggcca aaggctacca agagctgctg 1140
gaaaagtgct tccagacaga gaaccccctg gagtgccagg ataaaggcga agaggaactg 1200
cagaagtaca tccaagagag ccaggccctg gccaagcggt cctgtggcct gttccaaaaa 1260
ctgggagagt actacctcca gaacgccttc ctggtggctt acaccaagaa ggcccctcag 1320
ctgacctcct ccgagctgat ggctatcacc cggaagatgg ccgctacagc cgctacctgc 1380
tgtcaactct ctgaggacaa gctgctggcc tgtggtgaag gcgccgccga catcattatc 1440
ggccacctgt gcatccggca cgagatgacc cctgtgaacc ctggcgtggg ccagtgctgc 1500
accagcagct acgccaaccg cagaccttgt tttagttccc tggtggtgga cgaaacttac 1560
gtgcctcctg ccttttctga cgataagttt atcttccaca aggatctgtg ccaggctcag 1620
ggcgtggctc tccagaccat gaagcaagag ttcctgatca acctggtcaa gcagaaacca 1680
cagatcacag aggaacagct ggaagccgtg atcgccgatt tctctggact gctggaaaag 1740
tgctgtcagg gccaagagca ggaagtgtgc ttcgctgagg aaggccagaa actgatctcc 1800
aagaccagag ctgctctggg cgtg 1824
<210> 3
<211> 17
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 3
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala
<210> 4
<211> 51
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
atgggtgtga aggtgctatt tgcactaatc tgcatcgccg tggccgaggc t 51
<210> 5
<211> 16
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 5
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Ser Ser Ala Tyr Ser
1 5 10 15
<210> 6
<211> 48
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
atgaagtggg tgacttttat cagtctacta tttagctctg cctactcc 48
<210> 7
<211> 625
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 7
Met Gly Val Lys Val Leu Phe Ala Leu Ile Cys Ile Ala Val Ala Glu
1 5 10 15
Ala Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr
20 25 30
Glu Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu
35 40 45
Asp Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr
50 55 60
Ile Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser
65 70 75 80
Lys Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp
85 90 95
Glu Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu
100 105 110
Glu Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp
115 120 125
Cys Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His
130 135 140
Lys Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro
145 150 155 160
Val Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn
165 170 175
Lys Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro
180 185 190
Thr Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys
195 200 205
Cys Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr
210 215 220
Val Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys
225 230 235 240
Ala Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val
245 250 255
Thr Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln
260 265 270
Lys Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly
275 280 285
Asp Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile
290 295 300
Cys Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys
305 310 315 320
Leu Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp
325 330 335
Glu Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp
340 345 350
Arg Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala
355 360 365
Ser Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser
370 375 380
Val Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys
385 390 395 400
Phe Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu
405 410 415
Leu Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys
420 425 430
Gly Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu
435 440 445
Val Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met
450 455 460
Ala Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu
465 470 475 480
Ser Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile
485 490 495
Ile Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly
500 505 510
Val Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe
515 520 525
Ser Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp
530 535 540
Asp Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala
545 550 555 560
Leu Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys
565 570 575
Pro Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser
580 585 590
Gly Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe
595 600 605
Ala Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly
610 615 620
Val
625
<210> 8
<211> 1875
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 8
atgggtgtga aggtgctatt tgcactaatc tgcatcgccg tggccgaggc taagtgggtg 60
gaaagtatct ttctaatctt tctgctgaat ttcaccgagt ctcggaccct gcaccggaac 120
gagtatggca tcgcctctat cctggactcc taccagtgta ccgccgagat cagcctggct 180
gacctggcca ccatcttctt cgcccagttc gtccaggagg ctacctacaa ggaagtctct 240
aagatggtga aggacgccct caccgccatc gaaaagccta ccggagacga gcagtcttct 300
ggctgcctgg agaaccaact gcctgctttt ctggaagaac tgtgtcatga aaaagaaatc 360
ctggagaagt acggccactc cgactgctgc agccagtccg aagagggccg gcacaactgc 420
ttcctggccc acaagaaacc aacacctgct tccatccctc tgttccaggt gcccatcccc 480
gtgacatctt gcgaggccta cgaggaggac agagagacct tcatgaacaa gttcatctac 540
gagatcgcca gacggcatcc tttcctgtac gctcccacca tcctgctgtg ggccgctaga 600
tacgacaaga ttatcccttc ctgttgcaag gccgagaatg ccgtggaatg cttccagacc 660
aaggctgcca ccgtgaccaa agagctgaga gaatcctctc tgctgaagca gcacgcctgc 720
gccgtgatga agaacttcgg cagaaccacc tttcaggcca tcacagtgac caagctgtct 780
cagaagttca ccaaggtgaa cttcaccgag atccagaagc ttgtactgga cgtggctcac 840
gtgcatgagc actgctgcag aggcgacgtg ctggattgtc tgcaggacgg cgagaagatc 900
atgtcctata tctgctccca gcaggacacc ctgtctaaca agatcaccga gtgttgcaag 960
ctgaccacac tggagcgggg ccagtgcatc atccacgctg aaaacgacga gaagcctgag 1020
ggcctgtccc ctaacctgaa cagattcctg ggagatcggg acttcaatca gttctcttcc 1080
ggcgagaaga acatcttcct ggcctccttc gtgcacgagt actccagaag acacccccag 1140
ctggctgtgt ccgtgatcct gagagtggcc aaaggctacc aagagctgct ggaaaagtgc 1200
ttccagacag agaaccccct ggagtgccag gataaaggcg aagaggaact gcagaagtac 1260
atccaagaga gccaggccct ggccaagcgg tcctgtggcc tgttccaaaa actgggagag 1320
tactacctcc agaacgcctt cctggtggct tacaccaaga aggcccctca gctgacctcc 1380
tccgagctga tggctatcac ccggaagatg gccgctacag ccgctacctg ctgtcaactc 1440
tctgaggaca agctgctggc ctgtggtgaa ggcgccgccg acatcattat cggccacctg 1500
tgcatccggc acgagatgac ccctgtgaac cctggcgtgg gccagtgctg caccagcagc 1560
tacgccaacc gcagaccttg ttttagttcc ctggtggtgg acgaaactta cgtgcctcct 1620
gccttttctg acgataagtt tatcttccac aaggatctgt gccaggctca gggcgtggct 1680
ctccagacca tgaagcaaga gttcctgatc aacctggtca agcagaaacc acagatcaca 1740
gaggaacagc tggaagccgt gatcgccgat ttctctggac tgctggaaaa gtgctgtcag 1800
ggccaagagc aggaagtgtg cttcgctgag gaaggccaga aactgatctc caagaccaga 1860
gctgctctgg gcgtg 1875
<210> 9
<211> 624
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 9
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Ser Ser Ala Tyr Ser
1 5 10 15
Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr Glu
20 25 30
Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp
35 40 45
Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile
50 55 60
Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys
65 70 75 80
Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu
85 90 95
Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu
100 105 110
Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys
115 120 125
Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys
130 135 140
Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Ile Pro Val
145 150 155 160
Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys
165 170 175
Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr
180 185 190
Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys
195 200 205
Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val
210 215 220
Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Lys Gln His Ala Cys Ala
225 230 235 240
Val Met Lys Asn Phe Gly Arg Thr Thr Phe Gln Ala Ile Thr Val Thr
245 250 255
Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys
260 265 270
Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp
275 280 285
Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys
290 295 300
Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu
305 310 315 320
Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu
325 330 335
Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg
340 345 350
Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser
355 360 365
Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val
370 375 380
Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe
385 390 395 400
Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu
405 410 415
Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly
420 425 430
Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val
435 440 445
Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala
450 455 460
Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser
465 470 475 480
Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile
485 490 495
Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val
500 505 510
Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser
515 520 525
Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp
530 535 540
Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu
545 550 555 560
Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro
565 570 575
Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly
580 585 590
Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala
595 600 605
Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val
610 615 620
<210> 10
<211> 1872
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 10
atgaagtggg tgacttttat cagtctacta tttagctctg cctactccaa gtgggtggaa 60
agtatctttc taatctttct gctgaatttc accgagtctc ggaccctgca ccggaacgag 120
tatggcatcg cctctatcct ggactcctac cagtgtaccg ccgagatcag cctggctgac 180
ctggccacca tcttcttcgc ccagttcgtc caggaggcta cctacaagga agtctctaag 240
atggtgaagg acgccctcac cgccatcgaa aagcctaccg gagacgagca gtcttctggc 300
tgcctggaga accaactgcc tgcttttctg gaagaactgt gtcatgaaaa agaaatcctg 360
gagaagtacg gccactccga ctgctgcagc cagtccgaag agggccggca caactgcttc 420
ctggcccaca agaaaccaac acctgcttcc atccctctgt tccaggtgcc catccccgtg 480
acatcttgcg aggcctacga ggaggacaga gagaccttca tgaacaagtt catctacgag 540
atcgccagac ggcatccttt cctgtacgct cccaccatcc tgctgtgggc cgctagatac 600
gacaagatta tcccttcctg ttgcaaggcc gagaatgccg tggaatgctt ccagaccaag 660
gctgccaccg tgaccaaaga gctgagagaa tcctctctgc tgaagcagca cgcctgcgcc 720
gtgatgaaga acttcggcag aaccaccttt caggccatca cagtgaccaa gctgtctcag 780
aagttcacca aggtgaactt caccgagatc cagaagcttg tactggacgt ggctcacgtg 840
catgagcact gctgcagagg cgacgtgctg gattgtctgc aggacggcga gaagatcatg 900
tcctatatct gctcccagca ggacaccctg tctaacaaga tcaccgagtg ttgcaagctg 960
accacactgg agcggggcca gtgcatcatc cacgctgaaa acgacgagaa gcctgagggc 1020
ctgtccccta acctgaacag attcctggga gatcgggact tcaatcagtt ctcttccggc 1080
gagaagaaca tcttcctggc ctccttcgtg cacgagtact ccagaagaca cccccagctg 1140
gctgtgtccg tgatcctgag agtggccaaa ggctaccaag agctgctgga aaagtgcttc 1200
cagacagaga accccctgga gtgccaggat aaaggcgaag aggaactgca gaagtacatc 1260
caagagagcc aggccctggc caagcggtcc tgtggcctgt tccaaaaact gggagagtac 1320
tacctccaga acgccttcct ggtggcttac accaagaagg cccctcagct gacctcctcc 1380
gagctgatgg ctatcacccg gaagatggcc gctacagccg ctacctgctg tcaactctct 1440
gaggacaagc tgctggcctg tggtgaaggc gccgccgaca tcattatcgg ccacctgtgc 1500
atccggcacg agatgacccc tgtgaaccct ggcgtgggcc agtgctgcac cagcagctac 1560
gccaaccgca gaccttgttt tagttccctg gtggtggacg aaacttacgt gcctcctgcc 1620
ttttctgacg ataagtttat cttccacaag gatctgtgcc aggctcaggg cgtggctctc 1680
cagaccatga agcaagagtt cctgatcaac ctggtcaagc agaaaccaca gatcacagag 1740
gaacagctgg aagccgtgat cgccgatttc tctggactgc tggaaaagtg ctgtcagggc 1800
caagagcagg aagtgtgctt cgctgaggaa ggccagaaac tgatctccaa gaccagagct 1860
gctctgggcg tg 1872
<210> 11
<211> 1899
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 11
gccaccatga agtgggtgac ttttatcagt ctactattta gctctgccta ctccaagtgg 60
gtggaaagta tctttctaat ctttctgctg aatttcaccg agtctcggac cctgcaccgg 120
aacgagtatg gcatcgcctc tatcctggac tcctaccagt gtaccgccga gatcagcctg 180
gctgacctgg ccaccatctt cttcgcccag ttcgtccagg aggctaccta caaggaagtc 240
tctaagatgg tgaaggacgc cctcaccgcc atcgaaaagc ctaccggaga cgagcagtct 300
tctggctgcc tggagaacca actgcctgct tttctggaag aactgtgtca tgaaaaagaa 360
atcctggaga agtacggcca ctccgactgc tgcagccagt ccgaagaggg ccggcacaac 420
tgcttcctgg cccacaagaa accaacacct gcttccatcc ctctgttcca ggtgcccatc 480
cccgtgacat cttgcgaggc ctacgaggag gacagagaga ccttcatgaa caagttcatc 540
tacgagatcg ccagacggca tcctttcctg tacgctccca ccatcctgct gtgggccgct 600
agatacgaca agattatccc ttcctgttgc aaggccgaga atgccgtgga atgcttccag 660
accaaggctg ccaccgtgac caaagagctg agagaatcct ctctgctgaa gcagcacgcc 720
tgcgccgtga tgaagaactt cggcagaacc acctttcagg ccatcacagt gaccaagctg 780
tctcagaagt tcaccaaggt gaacttcacc gagatccaga agcttgtact ggacgtggct 840
cacgtgcatg agcactgctg cagaggcgac gtgctggatt gtctgcagga cggcgagaag 900
atcatgtcct atatctgctc ccagcaggac accctgtcta acaagatcac cgagtgttgc 960
aagctgacca cactggagcg gggccagtgc atcatccacg ctgaaaacga cgagaagcct 1020
gagggcctgt cccctaacct gaacagattc ctgggagatc gggacttcaa tcagttctct 1080
tccggcgaga agaacatctt cctggcctcc ttcgtgcacg agtactccag aagacacccc 1140
cagctggctg tgtccgtgat cctgagagtg gccaaaggct accaagagct gctggaaaag 1200
tgcttccaga cagagaaccc cctggagtgc caggataaag gcgaagagga actgcagaag 1260
tacatccaag agagccaggc cctggccaag cggtcctgtg gcctgttcca aaaactggga 1320
gagtactacc tccagaacgc cttcctggtg gcttacacca agaaggcccc tcagctgacc 1380
tcctccgagc tgatggctat cacccggaag atggccgcta cagccgctac ctgctgtcaa 1440
ctctctgagg acaagctgct ggcctgtggt gaaggcgccg ccgacatcat tatcggccac 1500
ctgtgcatcc ggcacgagat gacccctgtg aaccctggcg tgggccagtg ctgcaccagc 1560
agctacgcca accgcagacc ttgttttagt tccctggtgg tggacgaaac ttacgtgcct 1620
cctgcctttt ctgacgataa gtttatcttc cacaaggatc tgtgccaggc tcagggcgtg 1680
gctctccaga ccatgaagca agagttcctg atcaacctgg tcaagcagaa accacagatc 1740
acagaggaac agctggaagc cgtgatcgcc gatttctctg gactgctgga aaagtgctgt 1800
cagggccaag agcaggaagt gtgcttcgct gaggaaggcc agaaactgat ctccaagacc 1860
agagctgctc tgggcgtgca ccaccaccac catcattaa 1899
<210> 12
<211> 89
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 12
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala
85
<210> 13
<211> 267
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 13
atgcgatttc caagtatctt tactgcagtg ctctttgccg cttctagcgc cctggctgct 60
cctgtgaata ccaccaccga ggacgagaca gctcagatcc ccgctgaggc tgtgatcggc 120
tactccgatc tggaaggcga cttcgacgtg gccgtgctgc ctttctccaa ctccaccaac 180
aacggcctgc tgttcatcaa caccaccatc gcctctatcg ccgccaagga agagggagtc 240
tctctggaaa agagagaggc cgaggcc 267

Claims (10)

1.一种融合蛋白,其特征在于,所述融合蛋白具有结构如式I所示,
S-A, 式I
式I中,S为信号肽多肽元件、A为甲胎蛋白多肽元件;“-”为健或连接序列,其中,所述信号肽多肽元件的氨基酸序列如SEQ ID NO.3或SEQ ID NO.5所示。
2.如权利要求1所述的融合蛋白,其特征在于,所述甲胎蛋白多肽元件选自下组:
(A)具有SEQ ID NO.1所示氨基酸序列的多肽;
(B)具有与SEQ ID NO.1所示氨基酸序列≥90%同源性(优选地,≥95%的同源性;等优选地≥96%的同源性;最优选地,≥97%的同源性)的多肽,且所述多肽保持有SEQ ID NO.1所示多肽的活性;
(C)将SEQ ID NO.1所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的,且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。
3.如权利要求1所述的融合蛋白,其特征在于,所述融合蛋白选自下组:
(A)具有SEQ ID NO.7或9所示氨基酸序列的多肽;
(B)具有与SEQ ID NO.7或9所示氨基酸序列≥90%同源性(优选地,≥95%的同源性;等优选地≥96%的同源性;最优选地,≥97%的同源性)的多肽,且所述多肽保持有SEQ IDNO.1所示多肽的活性;
(C)将SEQ ID NO.7或9中任一所示氨基酸序列经过1-5个氨基酸残基的取代、缺失或添加而形成的,且保持有SEQ ID NO.1所示多肽的活性的衍生多肽。
4.一种分离的经密码子优化的多核苷酸,其特征在于,所述多核苷酸编码权利要求1所述的融合蛋白。
5.如权利要求4所述的多核苷酸,其特征在于,所述多核苷酸选自下组:
(a)序列如SEQ ID NO.11所示的多核苷酸;
(b)核苷酸序列与SEQ ID NO.11所示序列的同源性≥95%(较佳地≥98%)的多核苷酸;
(c)与(a)-(c)任一所述的多核苷酸互补的多核苷酸。
6.一种表达载体,其特征在于,所述表达载体含有权利要求4所述的多核苷酸。
7.一种宿主细胞,其特征在于,所述的宿主细胞含有权利要求6所述的表达载体,或者在基因组中整合有权利要求4所述的多核苷酸。
8.如权利要求7所述的宿主细胞,其特征在于,所述宿主细胞为真核细胞,优选地所述宿主细胞为哺乳动物细胞,更优选地为CHO细胞。
9.一种制备甲胎蛋白的方法,其特征在于,包括步骤:
在适合表达的条件下,培养权利要求7所述的细胞,从而表达出甲胎蛋白;和分离所述甲胎蛋白。
10.一种试剂盒,其特征在于,所述的试剂盒含有权利要求1所述的融合蛋白、权利要求4所述的多核苷酸或者权利要求6所述的表达载体或者权利要求7所述的宿主细胞。
CN202111553094.1A 2021-12-17 2021-12-17 人甲胎蛋白融合蛋白及其制备方法和应用 Pending CN114380920A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111553094.1A CN114380920A (zh) 2021-12-17 2021-12-17 人甲胎蛋白融合蛋白及其制备方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111553094.1A CN114380920A (zh) 2021-12-17 2021-12-17 人甲胎蛋白融合蛋白及其制备方法和应用

Publications (1)

Publication Number Publication Date
CN114380920A true CN114380920A (zh) 2022-04-22

Family

ID=81197649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111553094.1A Pending CN114380920A (zh) 2021-12-17 2021-12-17 人甲胎蛋白融合蛋白及其制备方法和应用

Country Status (1)

Country Link
CN (1) CN114380920A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009126920A2 (en) * 2008-04-11 2009-10-15 Merrimack Pharmaceuticals, Inc. Human serum albumin linkers and conjugates thereof
CN109913414A (zh) * 2019-03-21 2019-06-21 吉林省银丰生物工程技术有限公司 肝癌afp特异性人工抗原递呈细胞诱导试剂盒
CN109937050A (zh) * 2016-09-14 2019-06-25 鲁汶大学 修饰的vsv-g及其疫苗
CN110028588A (zh) * 2018-01-11 2019-07-19 上海细胞治疗研究院 抗原-Fc融合蛋白及其检测阳性CAR-T细胞的应用
US20210040217A1 (en) * 2018-08-31 2021-02-11 Invectys SA Chimeric antigen receptors against multiple hla-g isoforms
CN113481115A (zh) * 2021-07-06 2021-10-08 江南大学 表达人α-乳白蛋白的重组毕赤酵母菌及其构建方法与应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009126920A2 (en) * 2008-04-11 2009-10-15 Merrimack Pharmaceuticals, Inc. Human serum albumin linkers and conjugates thereof
CN109937050A (zh) * 2016-09-14 2019-06-25 鲁汶大学 修饰的vsv-g及其疫苗
CN110028588A (zh) * 2018-01-11 2019-07-19 上海细胞治疗研究院 抗原-Fc融合蛋白及其检测阳性CAR-T细胞的应用
US20210040217A1 (en) * 2018-08-31 2021-02-11 Invectys SA Chimeric antigen receptors against multiple hla-g isoforms
CN109913414A (zh) * 2019-03-21 2019-06-21 吉林省银丰生物工程技术有限公司 肝癌afp特异性人工抗原递呈细胞诱导试剂盒
CN113481115A (zh) * 2021-07-06 2021-10-08 江南大学 表达人α-乳白蛋白的重组毕赤酵母菌及其构建方法与应用

Similar Documents

Publication Publication Date Title
CN112375784A (zh) 制备重组新型冠状病毒Spike蛋白的方法
WO2019174633A1 (zh) 支链氨基酸荧光探针及其应用
CN111575308A (zh) 梅毒螺旋体重组嵌合抗原及其制备方法、用途
CN113403339A (zh) 一种c端带有表位标签m的表达载体及其构建方法与应用
WO2024032020A1 (zh) 一种增强型单体StayGold蛋白及其应用
CN110878123B (zh) 一种抗tk1原核重组单链抗体及制备方法
CN109957003B (zh) 一种稳定的saa突变体及其在疾病检测中的应用
CN111100209A (zh) 一种重组蛋白g3p20-31及其制备方法和应用
CN114380920A (zh) 人甲胎蛋白融合蛋白及其制备方法和应用
CN116023460B (zh) 一种StayGold黄色荧光蛋白及其应用
CN113481236B (zh) 一种n端带有表位标签m的表达载体及其构建方法与应用
CN114409800B (zh) 制备重组胱抑素c的方法
Chen et al. High-efficiency secretory expression of human neutrophil gelatinase-associated lipocalin from mammalian cell lines with human serum albumin signal peptide
CN111138554A (zh) 一种重组蛋白g3p1-12及其制备方法和应用
CN113087807B (zh) 用于检测糖类抗原的基于志贺毒素b亚基重组蛋白的探针、制备方法
CN111808170A (zh) 多肽、hla-dr蛋白及其制备方法和应用
CN117720669A (zh) 真核细胞表达制备重组胱抑素c的方法
CN113943718B (zh) 一种糖基转移酶及其在Tn抗原的标记、成像和检测中的应用
JP6795214B2 (ja) ステロイドホルモン膜受容体の精製方法
JPWO2014098112A1 (ja) ノダフジ由来改変レクチン
CN116359504B (zh) Akap4截断蛋白在肺癌筛查中的应用
CN110592113B (zh) 一种豆状带绦虫SUMO化修饰系统基因TpUBC9及其用途
CN117720668A (zh) 制备人前白蛋白的方法
CN116773811B (zh) Brca2截断蛋白在肺癌筛查中的应用
CN116396395A (zh) 人转铁融合蛋白及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination