CN111499759A - 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用 - Google Patents

一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用 Download PDF

Info

Publication number
CN111499759A
CN111499759A CN201910098200.8A CN201910098200A CN111499759A CN 111499759 A CN111499759 A CN 111499759A CN 201910098200 A CN201910098200 A CN 201910098200A CN 111499759 A CN111499759 A CN 111499759A
Authority
CN
China
Prior art keywords
ala
leu
gly
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910098200.8A
Other languages
English (en)
Other versions
CN111499759B (zh
Inventor
刘佳
陈德富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ShanghaiTech University
Original Assignee
ShanghaiTech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ShanghaiTech University filed Critical ShanghaiTech University
Priority to CN201910098200.8A priority Critical patent/CN111499759B/zh
Publication of CN111499759A publication Critical patent/CN111499759A/zh
Application granted granted Critical
Publication of CN111499759B publication Critical patent/CN111499759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/79Transferrins, e.g. lactoferrins, ovotransferrins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P39/00General protective or antinoxious agents
    • A61P39/06Free radical scavengers or antioxidants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/10Fusion polypeptide containing a localisation/targetting motif containing a tag for extracellular membrane crossing, e.g. TAT or VP22

Abstract

本发明属于生物技术领域,具体涉及一种具有细胞穿膜性的锌指蛋白‑人乳铁蛋白融合蛋白质及其制备与应用。本发明所述融合蛋白质的结构域中包括锌指蛋白和人乳铁蛋白,该融合蛋白具有抑菌和抗氧化活性,且能进入哺乳动物细胞内。

Description

一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其 制备与应用
技术领域
本发明属于生物技术领域,具体涉及一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用。
背景技术
细胞膜的选择通透性将细胞内组分与外源分子分开。这是治疗药物递送到细胞的主要挑战。如基因,蛋白质和病毒等各种生物活性物质可有效地进入到细胞中。在这些药物中,由于功能性蛋白质直接递送的安全性和有效性,使其有希望应用到治疗中。蛋白质递送不依赖于注入核酸的转录和翻译。因此,递送的蛋白质可以迅速发挥作用,然后被蛋白酶体降解,降低脱靶效应。细胞膜的选择性是蛋白质递送的主要障碍。在研的许多膜微扰技术,如显微注射和电穿孔,可加速蛋白质递送。然而,这些膜破裂技术通常效率差,毒性大,生物利用度低和特异性差。除了物理膜穿刺方法之外,还开发了许多生物化学试剂以促进蛋白质递送,例如超荷电转导结构域,纳米粒,脂质体,病毒样颗粒和聚合物微球。在临床前或临床实践中,这些策略可能与诸如细胞摄取低效、稳定性差、无细胞特异性、溶酶体逃逸率低或毒性大等缺点相关。
在20世纪80年代后期,一种来源于人类免疫缺陷病毒(HIV)的TAT反式激活因子的天然肽被发现具有固有的细胞穿透能力。在随后的几年中,一系列被认为是细胞穿透肽(CPP)的具有相似细胞通透性的天然肽被确定。基于天然存在的CPP的特征,人造或嵌合CPP被设计出来。CPPs通常具有最小的细胞毒性,并且可以应用于各种细胞类型以递送具有不同分子量的各种货物分子。这些CPP可以与货物蛋白基因融合或化学缀合。
发明内容
为了克服现有技术中所存在的问题,本发明的目的在于提供一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用。
为了实现上述目的以及其他相关目的,本发明采用如下技术方案:
本发明的第一方面,提供一种融合蛋白质,其结构域中包括锌指蛋白和人乳铁蛋白。
进一步地,所述锌指蛋白的氨基酸序列如SEQ ID NO.2所示,具体为:
EKPYKCPECGKSFSASAALVAHQRTHT。
进一步地,所述乳铁蛋白的氨基酸序列如SEQ ID NO.4所示,具体为:
MKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。
进一步地,所述锌指蛋白和人乳铁蛋白之间通过连接肽连接。
进一步地,所述连接肽的氨基酸数量为12个,所述连接肽由甘氨酸(Gly)和丝氨酸(Ser)组合而成,采用以G2S(即氨基酸序列GGS)为单位的多单位连接实现。
进一步地,所述连接肽的氨基酸序列如SEQ ID NO.3所示,具体为:GGSGGSGGSGGS。
本发明对于连接顺序没有特殊要求,只要不限制本发明的目的即可。例如,所述锌指蛋白的C末端可以与所述人乳铁蛋白的N末端连接。或者人乳铁蛋白的C末端可以与所述锌指蛋白的N末端连接。
亦即,所述融合蛋白的结构域的通式为:锌指蛋白-连接肽-人乳铁蛋白或者人乳铁蛋白-连接肽-锌指蛋白。
优选地,所述融合蛋白的结构域从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白。
所述融合蛋白结构域中,可以包括1个、2个或3个锌指蛋白。
优选地,所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白-连接肽-人乳铁蛋白,即ZFP1-hLF,或锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白,即ZFP2-hLF,或锌指蛋白-锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白,即ZFP3-hLF。
进一步地,在本案的较佳案例中,列举了所述融合蛋白的结构域氨基序列如SEQID NO.5所示,具体为:
EKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。但不限于本发明较佳案例中所列举的具体形式。
在本案的一种实施方式中,列举了所述融合蛋白的结构域氨基序列如SEQ IDNO.13所示。
在本案的一种实施方式中,列举了所述融合蛋白的结构域氨基序列如SEQ IDNO.17所示。
进一步地,所述融合蛋白还可含有标签。所述标签用于蛋白质的纯化。
例如,所述标签可以是His标签、MBP标签、GST标签、FLAG标签等亲和纯化标签。
所述标签可以连接在所述融合蛋白的结构域N端或C端,只要不影响标签和融合蛋白结构域发挥作用即可。
在本案的较佳案例中,列举了带有标签的ZFP1-hLF融合蛋白的氨基酸序列如SEQID NO.6所示,具体为:
MHHHHHHPKKKRKVEKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。但不限于本发明较佳案例中所列举的具体形式。
在本发明的一种实施方式中,列举了带有标签的ZFP2-hLF融合蛋白的氨基酸序列如SEQ ID NO.15所示。但不限于本发明较佳案例中所列举的具体形式。
在本发明的一种实施方式中,列举了带有标签的ZFP3-hLF融合蛋白的氨基酸序列如SEQ ID NO.19所示。但不限于本发明较佳案例中所列举的具体形式。
本发明的第二方面,提供一种分离的多核苷酸(亦即DNA分子),其编码前述融合蛋白。
本发明的编码所述融合蛋白的多核苷酸,可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。
本发明的编码所述融合蛋白的多核苷酸,可以通过本领域技术人员熟知的任何适当的技术制备。所述技术见于本领域的一般描述。包括但不限于重组DNA技术、化学合成等方法;例如采用重叠延伸PCR法。
例如,编码所述锌指蛋白的核苷酸序列如SEQ ID NO.8所示,具体为:
gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggc。
编码所述人乳铁蛋白的核苷酸序列如SEQ ID NO.10所示,具体为:
atgaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。
编码所述连接肽的核苷酸序列如SEQ ID NO.9所示,具体为:
ggtggatccggtggatccggtggatccggtggatcc。
编码所述ZFP1-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.11所示,具体为:gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。
编码带有标签的ZFP1-hLF融合蛋白的核苷酸序列如SEQ ID NO.12所示,具体为:atgcatcatcatcatcatcacgagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。
编码ZFP2-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.14所示。
编码带有标签的ZFP2-hLF融合蛋白的核苷酸序列如SEQ ID NO.16所示。
编码所述ZFP3-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.18所示。
编码带有标签的ZFP3-hLF融合蛋白的核苷酸序列如SEQ ID NO.20所示。
本发明的第三方面,提供一种重组表达载体,其含有前述分离的多核苷酸。
发明的所述表达载体含有编码所述融合蛋白的多核苷酸。本领域的技术人员熟知的方法能用于构建所述表达载体。这些方法包括重组DNA技术、DNA合成技术等。可将编码所述融合蛋白的DNA有效连接到载体中的多克隆位点上,以指导mRNA合成进而表达蛋白,或者用于同源重组。本发明的较佳案例中,所述表达载体可采用pCAMBIA-1301C等。
本发明的第四方面,提供一种宿主细胞,所述细胞含有前述重组表达载体或基因组中整合有外源的前述分离的多核苷酸。
本发明的较佳案例中,所述宿主细胞可采用莱茵衣藻、雨生红球藻、水稻、烟草、大肠杆菌、昆虫细胞、哺乳动物细胞等。
本发明的第五方面,提供一种制备前述融合蛋白的方法,包括如下步骤:
构建含有所述融合蛋白编码多核苷酸的重组表达载体,然后将所述重组表达载体转化至宿主细胞中诱导表达,从表达产物中分离获得所述融合蛋白;
或者
在合适的条件下培养前述宿主细胞,使之表达所述融合蛋白,而后分离及纯化获得所述融合蛋白。
本发明的较佳案例中,所述表达载体可采用pCAMBIA-1301C。
所述宿主细胞可采用莱茵衣藻、雨生红球藻、水稻、烟草、大肠杆菌、昆虫细胞、哺乳动物细胞等。
本发明的第六方面,提供前述融合蛋白、分离的多核苷酸、重组表达载体、或宿主细胞在制备抑菌、抗氧化、调节免疫力等相关产品中的用途。
优选地,所述产品选自抗病毒治疗产品、抑菌产品、抗氧化产品、调节免疫力产品、促进铁离子吸收产品、肠道相关疾病治疗产品。
与现有技术相比,本发明具有如下有益效果:
(1)本发明的融合蛋白比传统细胞穿膜肽融合的乳铁蛋白更容易表达纯化。
(2)本发明的融合蛋白有更低的风险引起免疫反应。锌指蛋白和人乳铁蛋白都是人体内天然存在的蛋白质。
(3)本发明的融合蛋白能不影响乳铁蛋白正常活性(抗菌等)。
(4)本发明的融合蛋白能将大分子的有活性的乳铁蛋白递呈到细胞中。
附图说明
图1:ZFP-hLF纯化,(a)ZFP-hLF构建体的示意图;(b)纯化的ZFP-hLF蛋白的SDS-PAGE。
图2:通过Western blotting测定的HIEC-6细胞内吞的乳铁蛋白。
图3:莱茵衣藻表达的ZFP-hLF融合蛋白的抑菌活性,(a)对Escherichia coli DH-5α的抑制作用;(b)对Klebsiella variicola IV-3的抑制作用。n.s.表示无统计学意义。*表示P<0.05。
图4:莱茵衣藻表达的ZFP-hLF融合蛋白的抗氧化活性,(a)DPPH自由基清除效率;(b)羟基自由基清除效率。n.s.表示无统计学意义。*表示P<0.05。
具体实施方式
本发明的发明人鉴定出Cys2-His2锌指蛋白(ZFPs)为新的蛋白质递送系统。由于蛋白质表面带有6个带正电荷的残基,ZFP具有固有的细胞渗透性。我们通过突变α--螺旋中负责DNA结合的残基来消除ZFP的DNA结合能力。工程化的锌指蛋白(ZFP)保留了细胞通透性,可以用作融合标签来递送货物蛋白。通过调节串联ZFP结构域的数量可调节细胞摄取功效,以适应不同应用。ZFP结构域可以有效介导蛋白质如绿色荧光蛋白(GFP)和Fok I核酸酶的细胞内递送。除了转化的细胞系之外,ZFP可以促进货物蛋白质向原代细胞和干细胞的递送,这对于治疗应用非常重要。
乳铁蛋白是一种具有抑菌、抗病毒、抗癌、免疫调节、抗氧化等诸多生物学功能的糖蛋白;在肠道疾病的治疗中也发挥着重要的作用,主要体现在促进铁离子的吸收,改善炎症引起的肠道功能紊乱,缓解肠道出血,抑制肠道肿瘤细胞的增殖、迁移和侵袭。
本发明首次提供了ZFP-hLF融合蛋白的构建、表达、纯化及生物学活性和穿膜效果检测,并证明了ZFP-hLF的融合蛋白具有抑菌、抗氧化的生物学活性;且能穿透HIEC-6细胞膜。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法,通常按照常规条件,或者按照各制造商所建议的条件。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。
莱茵衣藻的转化可参考文献:Neupert,J.等,Genetic transformation of themodel green alga Chlamydomonas reinhardtii.Methods Mol Biol,2012;847,35-47以及书籍Harris EH(1989)The Chlamydomonas Sourcebook.Academic Press,San Diego。
本发明中,所述ZFP-hLF包括ZFP1-hLF、ZFP2-hLF和ZFP3-hLF。
实施例1
一、材料
(一)质粒构建
1、莱茵衣藻表达偏好性优化的人乳铁蛋白基因的质粒。
2、含有ZFP编码基因序列的质粒。
3、DNA聚合酶。
4、脱氧核苷酸混合物,包括dATP,dCTP,dGTP和dTTP。
5、PCR反应缓冲液。
6、无菌水。
7、DNA染色试剂。
8、限制性内切酶、DNA连接酶。
9、DH5α大肠杆菌感受态。
10、溶菌肉汤(LB)培养基。
11、琼脂,细菌学等级。
12、质粒DNA抽提试剂盒和琼脂糖凝胶回收试剂盒。
13、用于PCR的梯度热循环仪。
14、琼脂糖凝胶电泳试剂和设备。
15、UV透射照胶仪。
16、离心机。
17、水浴锅。
18、Nano drop 2000。
(二)蛋白表达和纯化
1、编码重组ZFP-hLF蛋白质的质粒。
2、莱茵衣藻CW-15株系
3、琼脂,细菌学等级。
4、0.2mg/ml阿特拉津储备溶液
5、100mg/ml精氨酸储备液。
6、十六烷基三甲基溴化铵。
7、Ni-NTA琼脂糖。
8、50mM sodium phosphate,pH 7.0。
9、4M咪唑储备液。
10、100mM ZnCl2原液。
11、苯甲基磺酰基氟化物(PMSF)(100mM乙醇溶液)。
12、裂解缓冲液:50mM sodium phosphate,300mM NaCl,10%glycerol,100μMZnCl2,1mM PMSF。
13、洗涤缓冲液:50mM sodium phosphate,300mM NaCl,10%glycerol,20mMimidazole,100μM ZnCl2,1mM PMSF,pH7.0。
14、洗脱缓冲液:50mM sodium phosphate,300mM NaCl,10%glycerol,300mMimidazole,100μM ZnCl2,1mM PMSF,pH7.0。
15、磷酸盐缓冲液:137mM NaCl,2.7mM KCl,10mM Na2HPO4,2mM KH2PO4
16、储存缓冲液:50mM sodium phosphate,300mM NaCl,10%glycerol,100μMZnCl2,pH7.0。
17、4-20%Tris-甘氨酸SDS-PAGE。
18、SDS蛋白上样缓冲液。
19、考马斯亮蓝染色液。
20、液氮。
21、TAP培养基。
22、光照培养箱。
23、-70℃低温冰箱。
(三)蛋白转导
1、纯化ZFP-hLF蛋白。
2、二类生物安全柜。
3、细胞培养箱。
4、明场相差显微镜。
5、达尔伯克改良鹰的培养基(DMEM)。
6、胎牛血清(FBS)。
7、青霉素和链霉素溶液。
8、磷酸盐缓冲液(PBS)。
9、10mM ZnCl2
10、细胞刮刀。
11、0.05%含酚红的胰蛋白酶-EDTA溶液。
12、HIEC-6细胞。
13、细胞培养瓶。
14、24孔平底细胞培养板。
15、离心机。
16、金属浴。
17、转膜仪。
18、抗体(anti-hLF,anti-GAPDH)。
19、PVDF膜。
20、0.5mg/mL肝素。
(四)抑菌活性
1、纯化ZFP-hLF蛋白。
2、恒温培养箱。
3、恒温摇床。
4、紫外分光光度计。
5、LB培养基。
6、微量比色皿。
(五)抗氧化活性
1、纯化ZFP-hLF蛋白。
2、紫外分光光度计。
3、微量比色皿。
4、0.1mmol/L DPPH溶液。
5、6mmol/L H2O2
6、6mmol/L水杨酸。
7、6mmol/L FeSO4
8、蒸馏水。
二、方法
(一)表达ZFP-hLF蛋白质的质粒构建
1、使用商业基因合成服务,经密码子优化后,小量制备编码ZFP的质粒(pET21-ZFP)和编码hLF的质粒(pCAMBIA-1301C-hLF)(人乳铁蛋白基因)。
2、在冰上解冻200微升化学感受态DH5α大肠杆菌细胞,与质粒轻轻混合,然后在冰上孵育30分钟。
3、将混合物在42℃下热击45-90s,用LB培养基900μL复苏细胞并在37℃振荡1h。
4、在补充有20μg/mL卡那霉素的LB琼脂平板上铺100μL复苏的细胞(转化入pCAMBIA-1301C-hLF质粒),在补充有100μg/mL氨苄霉素的LB琼脂平板上铺100μL复苏的细胞(转化入pET21-ZFP质粒),在37℃培养过夜。
5、次日,将单个菌落接种到含有对应抗生素的5mL LB培养基中,在37℃下培养过夜。
6、质粒提取后,在37℃条件下,用10U BamHI在推荐缓冲液中消化1g pET21-ZFP和pCAMBIA-1301C-hLF质粒2h。通过经DNA染料(例如EB)染色的琼脂糖凝胶电泳观察酶切结果。
7、使用凝胶回收试剂盒回收对应的目的片段,并通过Nano drop 2000来确定DNA浓度。
8、按如下条件构建表达ZFP-hLF融合蛋白的质粒:在20μL的反应体系加入0.06pmol ZFP酶切回收产物、0.03pmol线性化pCAMBIA-1301C-hLF质粒、2μL T4连接酶、2μL10x重组缓冲液和去离子水,于恒温连接箱中连接过夜。
9、制备pCAMBIA-1301C-ZFP-hLF质粒,并使用引物(5'-aggatccatgcaccaccaccac-3')与(5'-tcgctcaggtcctcgaacac-3'),通过DNA测序确认构建体【ZFP-hLF构建体的示意图如图1中(a)所示】。
结果可知:ZFP-hLF蛋白质(锌指蛋白-人乳铁蛋白)的结构域中从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白,所述融合蛋白结构域的全长基因均序列正确,均与预期相符。
亦即,融合蛋白结构域中,锌指蛋白的编码核苷酸序列如SEQ ID NO.8所示,具体为:
gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggc。
连接肽的编码核苷酸序列如SEQ ID NO.9所示,具体为:
ggtggatccggtggatccggtggatccggtggatcc。
人乳铁蛋白的编码核苷酸序列如SEQ ID NO.10所示,具体为:
atgaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa
ZFP1-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.11所示,具体为:
gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa
ZFP2-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.14所示。
ZFP3-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.18所示。
为了纯化方便,ZFP1-hLF、ZFP2-hLF和ZFP3-hLF蛋白质在结构域N端添加了His标签。
His标签的编码核苷酸序列如SEQ ID NO.7所示,具体为:catcatcatcatcatcac。
带有His标签的ZFP1-hLF蛋白质的编码核苷酸序列如SEQ ID NO.12所示,具体为:atgcatcatcatcatcatcacgagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa
带有His标签的ZFP2-hLF蛋白质的编码核苷酸序列如SEQ ID NO.16所示。
带有His标签的ZFP3-hLF蛋白质的编码核苷酸序列如SEQ ID NO.20所示。
(二)ZFP-hLF蛋白质的表达与纯化
1、玻璃珠法进行转化,将300mg酸洗玻璃珠,1μg pCAMBIA-1301C-ZFP-hLF质粒和108个莱茵衣藻CW-15细胞缓慢混合均匀,漩涡震荡15s,间歇20s,重复三次。
2、将EP管中的上清液转接入含精氨酸的小体积TAP培养基中进行8-12h的避光培养。
3、8-12h后,低速离心,弃上清,取200-400μL的含精氨酸的TAP液体培养基将藻细胞重悬。涂布至含阿特拉津抗性固体平板上,置于光照培养箱中培养。
4、5-7天后,挑取单藻落,转接至5ml含精氨酸的TAP液体培养基中扩大培养,3-5天后,CTAB法提取基因组,PCR鉴定阳性转化株。
5、将获得的多个株系通过qRT-PCR进行分析RNA水平的分析,通过westernblotting进行蛋白水平的分析;筛选出表达水平最高的株系。
6、将表达量最高的转化株大量培养,离心弃上清,将藻细胞反复冻融后加入洗涤缓冲液,冰浴超声破碎5min。4℃,12000g,离心30min,取上清用0.45μM微孔滤膜过滤。
7、常规方法进行Ni-NTA琼脂糖纯化,用10mL洗脱缓冲液洗脱蛋白质。
8、用储存缓冲液置换洗脱的蛋白质,按照产品说明使用Millipore超滤浓缩管对蛋白质进行脱咪唑和浓缩处理。
9、通过Bradford方法确定蛋白质浓度。
10、用2μL 5×SDS-PAGE上样缓冲液混合8μL纯化的蛋白质,在98℃金属浴中充分裂解10分钟,然后在4-20%Tris-甘氨酸SDS-PAGE上分离以评估蛋白质纯度,结果如图1中(b)所示,说明:ZFP-hLF蛋白质能成功在体外重组表达,并可以获得纯度较高的融合蛋白。
为了纯化方便,ZFP-hLF在结构域N端添加了His标签。
His标签的氨基酸序列如SEQ ID NO.1所示,具体为:HHHHHH。
带有His标签的ZFP1-hLF蛋白质的氨基酸序列如SEQ ID NO.6所示,具体为:MHHHHHHPKKKRKVEKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK
带有His标签的ZFP2-hLF蛋白质的氨基酸序列如SEQ ID NO.15所示。
带有His标签的ZFP2-hLF蛋白质的氨基酸序列如SEQ ID NO.19所示。
11、浓缩蛋白质,在液氮中快速冷冻并储存在-70℃低温冰箱。
(三)ZFP-hLF蛋白质转导
1、在含有5%CO2的完全湿化的环境中,37℃温度下用补充有10%(v/v)FBS,100U/mL青霉素和100U/mL链霉素的DMEM培养基培养HIEC-6细胞。
2、在25℃下预先用50μg/mL聚赖氨酸500μL预涂24-60孔板30至60分钟。HIEC-6细胞以每孔2×105个细胞的密度铺在预涂板上。
3、接种24小时后,从各孔中弃去培养基,用500μL预热的无血清DMEM洗涤。
4、每孔加入250μL含1μM nZFP-hLF蛋白质的SFM。37℃共孵育90min。
5、从各孔中弃去培养基,用500μL含0.5mg/mL肝素的PBS洗涤三次。
6、使用细胞刮板收取细胞,加入足量的1×loading buffer,置于98℃金属浴中,充分裂解。
7、Western blotting分析转导效率,结果如图2所示,ZFP-hLF蛋白质可以穿过细胞膜进入HIEC-6细胞内,而无ZFP连接的乳铁蛋白则不能进入细胞。
(四)ZFP-hLF蛋白质的抑菌活性
1、选用Escherichia coli DH-5α和Klebsiella variicola IV-3为乳铁蛋白抑菌能力分析的菌株。
2、菌种先接种于LB固体平板上,37℃过夜培养,挑选单菌落接种于LB液体培养基中,37℃过夜培养,用无菌水稀释至其密度为105-106CFU/mL的菌悬液。
3、20μL菌悬液,0.5mg/mL乳铁蛋白或CW-15藻株蛋白,加至LB液体培养基中,总体积为10ml,37℃振荡培养(180r/min)。
4、分别于0h,2h,4h,6h,8h,10h,12h,14h取样,测定其A600值。分析菌种的生长趋势以判断乳铁蛋白的抑菌能力。结果如图3所示,ZFP-hLF蛋白具有抑菌活性。
(五)ZFP-hLF蛋白质的抗氧化活性
对DPPH自由基和羟基自由基的清除实验方法分别如下:
1、DPPH自由基清除能力检测
1.1分别将1.5mL不同浓度的锌指蛋白-人乳铁蛋白依次加入3mL 0.1mmol/L DPPH的乙醇溶液,记为Ai;
1.2将1.5mL不同浓度的锌指蛋白-人乳铁蛋白依次加入3mL乙醇溶液、1.5mL试样,记为Aj;
1.3 3mL 0.1mmol/L DPPH的乙醇溶液和1.5mL蒸馏水均匀混合,记为A0;
1.4均置于37℃水浴30min,测定混合溶液的A525值。清除率(%)=[1-(Ai-Aj)/A0]×100%。结果如图4a所示,ZFP-hLF蛋白具有DPPH自由基清除能力。
2、羟基自由基清除能力检测
2.1分别将2mL不同浓度的锌指蛋白-人乳铁蛋白中依次加入2mL 6mmol/L H2O2和6mmol/L水杨酸,摇匀,室温静置15min;再加入6mmol/L FeSO4,记为Ai。
2.2将2mL不同浓度的锌指蛋白-人乳铁蛋白中依次加入2mL 6mmol/L H2O2和等体积蒸馏水,摇匀,室温静置15min;再加入6mmol/L FeSO4,记为Aj;
2.3将2mL蒸馏水中依次加入2mL 6mmol/L H2O2和6mmol/L水杨酸,摇匀,室温静置15min;再加入6mmol/L FeSO4,记为A0;
2.4测定混合溶液的A510值。清除率(%)=[1-(Ai-Aj)/A0]×100%。结果如图4b所示,ZFP-hLF蛋白具有羟基自由基清除能力。
以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
序列表
<110> 上海科技大学
<120> 一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用
<160> 20
<170> SIPOSequenceListing 1.0
<210> 1
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
His His His His His His
1 5
<210> 2
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser
1 5 10 15
Ala Ala Leu Val Ala His Gln Arg Thr His Thr
20 25
<210> 3
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 4
<211> 711
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu
1 5 10 15
Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser
20 25 30
Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg
35 40 45
Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln
50 55 60
Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp
65 70 75 80
Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro
85 90 95
Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr
100 105 110
Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu
115 120 125
Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly
130 135 140
Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly
145 150 155 160
Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser
165 170 175
Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu
180 185 190
Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro
195 200 205
Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly
210 215 220
Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp
225 230 235 240
Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg
245 250 255
Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser
260 265 270
His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp
275 280 285
Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro
290 295 300
Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe
305 310 315 320
Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser
325 330 335
Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg
340 345 350
Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys
355 360 365
Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu
370 375 380
Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys
385 390 395 400
Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly
405 410 415
Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala
420 425 430
Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val
435 440 445
Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser
450 455 460
Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His
465 470 475 480
Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu
485 490 495
Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser
500 505 510
Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile
515 520 525
Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg
530 535 540
Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly
545 550 555 560
Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly
565 570 575
Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala
580 585 590
Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser
595 600 605
Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp
610 615 620
Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe
625 630 635 640
Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser
645 650 655
Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg
660 665 670
Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val
675 680 685
Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu
690 695 700
Ala Cys Glu Phe Leu Arg Lys
705 710
<210> 5
<211> 750
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser
1 5 10 15
Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Gly Ser Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu
35 40 45
Phe Leu Gly Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser
50 55 60
Val Gln Trp Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln
65 70 75 80
Trp Gln Arg Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile
85 90 95
Lys Arg Asp Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg
100 105 110
Ala Asp Ala Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu
115 120 125
Ala Pro Tyr Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu
130 135 140
Arg Gln Pro Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly
145 150 155 160
Gly Ser Phe Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr
165 170 175
Gly Leu Arg Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg
180 185 190
Pro Phe Leu Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val
195 200 205
Ala Arg Phe Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln
210 215 220
Phe Pro Asn Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys
225 230 235 240
Ala Phe Ser Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys
245 250 255
Cys Leu Arg Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr
260 265 270
Val Phe Glu Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu
275 280 285
Leu Cys Pro Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys
290 295 300
His Leu Ala Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn
305 310 315 320
Gly Lys Glu Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys
325 330 335
Phe Gly Lys Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser
340 345 350
Gly Gln Lys Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg
355 360 365
Val Pro Pro Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe
370 375 380
Thr Ala Ile Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg
385 390 395 400
Arg Ala Arg Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys
405 410 415
Cys Asn Gln Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser
420 425 430
Ala Ser Thr Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala
435 440 445
Asp Ala Met Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys
450 455 460
Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser
465 470 475 480
Asp Pro Asp Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala
485 490 495
Val Ala Val Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val
500 505 510
Lys Gly Lys Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp
515 520 525
Asn Ile Pro Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe
530 535 540
Asp Glu Tyr Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser
545 550 555 560
Asn Leu Cys Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys
565 570 575
Val Pro Asn Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg
580 585 590
Cys Leu Ala Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr
595 600 605
Val Leu Gln Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp
610 615 620
Leu Lys Leu Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys
625 630 635 640
Pro Val Thr Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His
645 650 655
Ala Val Val Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu
660 665 670
Leu His Gln Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp
675 680 685
Lys Phe Cys Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp
690 695 700
Asn Thr Glu Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys
705 710 715 720
Tyr Leu Gly Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys
725 730 735
Ser Thr Ser Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys
740 745 750
<210> 6
<211> 765
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys
1 5 10 15
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala
20 25 30
Leu Val Ala His Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser
35 40 45
Gly Gly Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe
50 55 60
Leu Gly Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val
65 70 75 80
Gln Trp Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp
85 90 95
Gln Arg Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys
100 105 110
Arg Asp Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala
115 120 125
Asp Ala Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala
130 135 140
Pro Tyr Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg
145 150 155 160
Gln Pro Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly
165 170 175
Ser Phe Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly
180 185 190
Leu Arg Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro
195 200 205
Phe Leu Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala
210 215 220
Arg Phe Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe
225 230 235 240
Pro Asn Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala
245 250 255
Phe Ser Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys
260 265 270
Leu Arg Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val
275 280 285
Phe Glu Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu
290 295 300
Cys Pro Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His
305 310 315 320
Leu Ala Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly
325 330 335
Lys Glu Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe
340 345 350
Gly Lys Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly
355 360 365
Gln Lys Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val
370 375 380
Pro Pro Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr
385 390 395 400
Ala Ile Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg
405 410 415
Ala Arg Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys
420 425 430
Asn Gln Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala
435 440 445
Ser Thr Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp
450 455 460
Ala Met Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly
465 470 475 480
Leu Val Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp
485 490 495
Pro Asp Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val
500 505 510
Ala Val Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys
515 520 525
Gly Lys Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn
530 535 540
Ile Pro Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp
545 550 555 560
Glu Tyr Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn
565 570 575
Leu Cys Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val
580 585 590
Pro Asn Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys
595 600 605
Leu Ala Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val
610 615 620
Leu Gln Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu
625 630 635 640
Lys Leu Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro
645 650 655
Val Thr Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala
660 665 670
Val Val Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu
675 680 685
His Gln Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys
690 695 700
Phe Cys Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn
705 710 715 720
Thr Glu Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr
725 730 735
Leu Gly Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser
740 745 750
Thr Ser Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys
755 760 765
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
catcatcatc atcatcac 18
<210> 8
<211> 84
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60
gcgcaccagc gcacccacac cggc 84
<210> 9
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggtggatccg gtggatccgg tggatccggt ggatcc 36
<210> 10
<211> 2136
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atgaaacttg tcttcctcgt cctgctgttc ctcggggccc tcggactgtg tctggctggc 60
cgtaggagaa ggagtgttca gtggtgcacc gtatcccaac ccgaggccac aaaatgcttc 120
caatggcaaa ggaatatgag aagagtgcgt ggccctcctg tcagctgcat aaagagagac 180
tcccccatcc agtgtatcca ggccattgcg gaaaacaggg ccgatgctgt gacccttgat 240
ggtggtttca tatacgaggc aggcctggcc ccctacaaac tgcgacctgt agcggcggaa 300
gtctacggga ccgaaagaca gccacgaact cactattatg ccgtggctgt ggtgaagaag 360
ggcggcagct ttcagctgaa cgaactgcaa ggtctgaagt cctgccacac aggccttcgc 420
aggaccgctg gatggaatgt gcctataggg acacttcgtc cattcttgaa ttggacgggt 480
ccacctgagc ccattgaggc agctgtggcc aggttcttct cagccagctg tgttcccggt 540
gcagataaag gacagttccc caacctgtgt cgcctgtgtg cggggacagg ggaaaacaaa 600
tgtgccttct cctcccagga accgtacttc agctactctg gtgccttcaa gtgtctgaga 660
gacggggctg gagacgtggc ttttatcaga gagagcacag tgtttgagga cctgtcagac 720
gaggctgaaa gggacgagta tgagttactc tgcccagaca acactcggaa gccagtggac 780
aagttcaaag actgccatct ggcccgggtc ccttctcatg ccgttgtggc acgaagtgtg 840
aatggcaagg aggatgccat ctggaatctt ctccgccagg cacaggaaaa gtttggaaag 900
gacaagtcac cgaaattcca gctctttggc tcccctagtg ggcagaaaga tctgctgttc 960
aaggactctg ccattgggtt ttcgagggtg cccccgagga tagattctgg gctgtacctt 1020
ggctccggct acttcactgc catccagaac ttgaggaaaa gtgaggagga agtggctgcc 1080
cggcgtgcgc gggtcgtgtg gtgtgcggtg ggcgagcagg agctgcgcaa gtgtaaccag 1140
tggagtggct tgagcgaagg cagcgtgacc tgctcctcgg cctccaccac agaggactgc 1200
atcgccctgg tgctgaaagg agaagctgat gccatgagtt tggatggagg atatgtgtac 1260
actgcaggca aatgtggttt ggtgcctgtc ctggcagaga actacaaatc ccaacaaagc 1320
agtgaccctg atcctaactg tgtggataga cctgtggaag gatatcttgc tgtggcggtg 1380
gttaggagat cagacactag ccttacctgg aactctgtga aaggcaagaa gtcctgccac 1440
accgccgtgg acaggactgc aggctggaat atccccatgg gcctgctctt caaccagacg 1500
ggctcctgca aatttgatga atatttcagt caaagctgtg cccctgggtc tgacccgaga 1560
tctaatctct gtgctctgtg tattggcgac gagcagggtg agaataagtg cgtgcccaac 1620
agcaatgaga gatactacgg ctacactggg gctttccggt gcctggctga gaatgctgga 1680
gacgttgcat ttgtgaaaga tgtcactgtc ttgcagaaca ctgatggaaa taacaatgag 1740
gcatgggcta aggatttgaa gctggcagac tttgcgctgc tgtgcctcga tggcaaacgg 1800
aagcctgtga ctgaggctag aagctgccat cttgccatgg ccccgaatca tgccgtggtg 1860
tctcggatgg ataaggtgga acgcctgaaa caggtgctgc tccaccaaca ggctaaattt 1920
gggagaaatg gatctgactg cccggacaag ttttgcttat tccagtctga aaccaaaaac 1980
cttctgttca atgacaacac tgagtgtctg gccagactcc atggcaaaac aacatatgaa 2040
aaatatttgg gaccacagta tgtcgcaggc attactaatc tgaaaaagtg ctcaacctcc 2100
cccctcctgg aagcctgtga attcctcagg aagtaa 2136
<210> 11
<211> 2253
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60
gcgcaccagc gcacccacac cggcggtgga tccggtggat ccggtggatc cggtggatcc 120
aaacttgtct tcctcgtcct gctgttcctc ggggccctcg gactgtgtct ggctggccgt 180
aggagaagga gtgttcagtg gtgcaccgta tcccaacccg aggccacaaa atgcttccaa 240
tggcaaagga atatgagaag agtgcgtggc cctcctgtca gctgcataaa gagagactcc 300
cccatccagt gtatccaggc cattgcggaa aacagggccg atgctgtgac ccttgatggt 360
ggtttcatat acgaggcagg cctggccccc tacaaactgc gacctgtagc ggcggaagtc 420
tacgggaccg aaagacagcc acgaactcac tattatgccg tggctgtggt gaagaagggc 480
ggcagctttc agctgaacga actgcaaggt ctgaagtcct gccacacagg ccttcgcagg 540
accgctggat ggaatgtgcc tatagggaca cttcgtccat tcttgaattg gacgggtcca 600
cctgagccca ttgaggcagc tgtggccagg ttcttctcag ccagctgtgt tcccggtgca 660
gataaaggac agttccccaa cctgtgtcgc ctgtgtgcgg ggacagggga aaacaaatgt 720
gccttctcct cccaggaacc gtacttcagc tactctggtg ccttcaagtg tctgagagac 780
ggggctggag acgtggcttt tatcagagag agcacagtgt ttgaggacct gtcagacgag 840
gctgaaaggg acgagtatga gttactctgc ccagacaaca ctcggaagcc agtggacaag 900
ttcaaagact gccatctggc ccgggtccct tctcatgccg ttgtggcacg aagtgtgaat 960
ggcaaggagg atgccatctg gaatcttctc cgccaggcac aggaaaagtt tggaaaggac 1020
aagtcaccga aattccagct ctttggctcc cctagtgggc agaaagatct gctgttcaag 1080
gactctgcca ttgggttttc gagggtgccc ccgaggatag attctgggct gtaccttggc 1140
tccggctact tcactgccat ccagaacttg aggaaaagtg aggaggaagt ggctgcccgg 1200
cgtgcgcggg tcgtgtggtg tgcggtgggc gagcaggagc tgcgcaagtg taaccagtgg 1260
agtggcttga gcgaaggcag cgtgacctgc tcctcggcct ccaccacaga ggactgcatc 1320
gccctggtgc tgaaaggaga agctgatgcc atgagtttgg atggaggata tgtgtacact 1380
gcaggcaaat gtggtttggt gcctgtcctg gcagagaact acaaatccca acaaagcagt 1440
gaccctgatc ctaactgtgt ggatagacct gtggaaggat atcttgctgt ggcggtggtt 1500
aggagatcag acactagcct tacctggaac tctgtgaaag gcaagaagtc ctgccacacc 1560
gccgtggaca ggactgcagg ctggaatatc cccatgggcc tgctcttcaa ccagacgggc 1620
tcctgcaaat ttgatgaata tttcagtcaa agctgtgccc ctgggtctga cccgagatct 1680
aatctctgtg ctctgtgtat tggcgacgag cagggtgaga ataagtgcgt gcccaacagc 1740
aatgagagat actacggcta cactggggct ttccggtgcc tggctgagaa tgctggagac 1800
gttgcatttg tgaaagatgt cactgtcttg cagaacactg atggaaataa caatgaggca 1860
tgggctaagg atttgaagct ggcagacttt gcgctgctgt gcctcgatgg caaacggaag 1920
cctgtgactg aggctagaag ctgccatctt gccatggccc cgaatcatgc cgtggtgtct 1980
cggatggata aggtggaacg cctgaaacag gtgctgctcc accaacaggc taaatttggg 2040
agaaatggat ctgactgccc ggacaagttt tgcttattcc agtctgaaac caaaaacctt 2100
ctgttcaatg acaacactga gtgtctggcc agactccatg gcaaaacaac atatgaaaaa 2160
tatttgggac cacagtatgt cgcaggcatt actaatctga aaaagtgctc aacctccccc 2220
ctcctggaag cctgtgaatt cctcaggaag taa 2253
<210> 12
<211> 2274
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atgcatcatc atcatcatca cgagaagccg tacaagtgcc cggagtgcgg caagagcttc 60
agcgccagcg ccgccctggt ggcgcaccag cgcacccaca ccggcggtgg atccggtgga 120
tccggtggat ccggtggatc caaacttgtc ttcctcgtcc tgctgttcct cggggccctc 180
ggactgtgtc tggctggccg taggagaagg agtgttcagt ggtgcaccgt atcccaaccc 240
gaggccacaa aatgcttcca atggcaaagg aatatgagaa gagtgcgtgg ccctcctgtc 300
agctgcataa agagagactc ccccatccag tgtatccagg ccattgcgga aaacagggcc 360
gatgctgtga cccttgatgg tggtttcata tacgaggcag gcctggcccc ctacaaactg 420
cgacctgtag cggcggaagt ctacgggacc gaaagacagc cacgaactca ctattatgcc 480
gtggctgtgg tgaagaaggg cggcagcttt cagctgaacg aactgcaagg tctgaagtcc 540
tgccacacag gccttcgcag gaccgctgga tggaatgtgc ctatagggac acttcgtcca 600
ttcttgaatt ggacgggtcc acctgagccc attgaggcag ctgtggccag gttcttctca 660
gccagctgtg ttcccggtgc agataaagga cagttcccca acctgtgtcg cctgtgtgcg 720
gggacagggg aaaacaaatg tgccttctcc tcccaggaac cgtacttcag ctactctggt 780
gccttcaagt gtctgagaga cggggctgga gacgtggctt ttatcagaga gagcacagtg 840
tttgaggacc tgtcagacga ggctgaaagg gacgagtatg agttactctg cccagacaac 900
actcggaagc cagtggacaa gttcaaagac tgccatctgg cccgggtccc ttctcatgcc 960
gttgtggcac gaagtgtgaa tggcaaggag gatgccatct ggaatcttct ccgccaggca 1020
caggaaaagt ttggaaagga caagtcaccg aaattccagc tctttggctc ccctagtggg 1080
cagaaagatc tgctgttcaa ggactctgcc attgggtttt cgagggtgcc cccgaggata 1140
gattctgggc tgtaccttgg ctccggctac ttcactgcca tccagaactt gaggaaaagt 1200
gaggaggaag tggctgcccg gcgtgcgcgg gtcgtgtggt gtgcggtggg cgagcaggag 1260
ctgcgcaagt gtaaccagtg gagtggcttg agcgaaggca gcgtgacctg ctcctcggcc 1320
tccaccacag aggactgcat cgccctggtg ctgaaaggag aagctgatgc catgagtttg 1380
gatggaggat atgtgtacac tgcaggcaaa tgtggtttgg tgcctgtcct ggcagagaac 1440
tacaaatccc aacaaagcag tgaccctgat cctaactgtg tggatagacc tgtggaagga 1500
tatcttgctg tggcggtggt taggagatca gacactagcc ttacctggaa ctctgtgaaa 1560
ggcaagaagt cctgccacac cgccgtggac aggactgcag gctggaatat ccccatgggc 1620
ctgctcttca accagacggg ctcctgcaaa tttgatgaat atttcagtca aagctgtgcc 1680
cctgggtctg acccgagatc taatctctgt gctctgtgta ttggcgacga gcagggtgag 1740
aataagtgcg tgcccaacag caatgagaga tactacggct acactggggc tttccggtgc 1800
ctggctgaga atgctggaga cgttgcattt gtgaaagatg tcactgtctt gcagaacact 1860
gatggaaata acaatgaggc atgggctaag gatttgaagc tggcagactt tgcgctgctg 1920
tgcctcgatg gcaaacggaa gcctgtgact gaggctagaa gctgccatct tgccatggcc 1980
ccgaatcatg ccgtggtgtc tcggatggat aaggtggaac gcctgaaaca ggtgctgctc 2040
caccaacagg ctaaatttgg gagaaatgga tctgactgcc cggacaagtt ttgcttattc 2100
cagtctgaaa ccaaaaacct tctgttcaat gacaacactg agtgtctggc cagactccat 2160
ggcaaaacaa catatgaaaa atatttggga ccacagtatg tcgcaggcat tactaatctg 2220
aaaaagtgct caacctcccc cctcctggaa gcctgtgaat tcctcaggaa gtaa 2274
<210> 13
<211> 779
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 13
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser
1 5 10 15
Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
20 25 30
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val
35 40 45
Ala His Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly
50 55 60
Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly
65 70 75 80
Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp
85 90 95
Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg
100 105 110
Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp
115 120 125
Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala
130 135 140
Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr
145 150 155 160
Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro
165 170 175
Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe
180 185 190
Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg
195 200 205
Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu
210 215 220
Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe
225 230 235 240
Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn
245 250 255
Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser
260 265 270
Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg
275 280 285
Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu
290 295 300
Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro
305 310 315 320
Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala
325 330 335
Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu
340 345 350
Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys
355 360 365
Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys
370 375 380
Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro
385 390 395 400
Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile
405 410 415
Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg
420 425 430
Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln
435 440 445
Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr
450 455 460
Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met
465 470 475 480
Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val
485 490 495
Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp
500 505 510
Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val
515 520 525
Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys
530 535 540
Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro
545 550 555 560
Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr
565 570 575
Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys
580 585 590
Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn
595 600 605
Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala
610 615 620
Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln
625 630 635 640
Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu
645 650 655
Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr
660 665 670
Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala Val Val
675 680 685
Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln
690 695 700
Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys
705 710 715 720
Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu
725 730 735
Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly
740 745 750
Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser
755 760 765
Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys
770 775
<210> 14
<211> 2340
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60
gcgcaccagc gcacccacac cggcgagaag ccgtacaagt gcccggagtg cggcaagagc 120
ttcagcgcca gcgccgccct ggtggcgcac cagcgcaccc acaccggcgg cggctccggc 180
ggctccggcg gctccggcgg atccatgaag ctggtgttcc tggtgctgct gttcctgggc 240
gccctgggcc tgtgcctggc gggccggcgc cgccgcagcg tgcagtggtg caccgtgtcc 300
cagccggagg ccaccaagtg cttccagtgg cagcgcaaca tgcgccgcgt gcgcggcccg 360
ccggtgtcct gcatcaagcg cgacagcccg atccagtgca tccaggcgat cgcggagaac 420
cgcgccgacg ccgtgaccct ggacggcggc ttcatctacg aggcgggcct ggccccgtac 480
aagctgcgcc cggtggccgc cgaggtgtac ggcaccgagc gccagccgcg cacccactac 540
tacgccgtgg ccgtcgtgaa gaagggcggc agcttccagc tgaacgagct gcagggcctg 600
aagtcctgcc acaccggcct gcgccgcacc gccggctgga acgtgccgat cggcaccctg 660
cgcccgttcc tgaactggac cggcccgccg gagccgatcg aggccgccgt ggcgcgcttc 720
ttcagcgcca gctgcgtgcc gggcgccgac aagggccagt tcccgaacct gtgccgcctg 780
tgcgccggca ccggcgagaa caagtgcgcc ttcagcagcc aggagccgta cttcagctac 840
agcggcgcct tcaagtgcct gcgcgacggc gcgggcgacg tggccttcat ccgcgagagc 900
accgtgttcg aggacctgag cgacgaggcc gagcgcgacg agtacgagct gctgtgcccg 960
gacaacaccc gcaagccggt ggacaagttc aaggactgcc acctggcccg cgtgccgagc 1020
cacgccgtgg tggcccgctc cgtgaacggc aaggaggacg ccatctggaa cctgctgcgc 1080
caggcccagg agaagttcgg caaggacaag agcccgaagt tccagctgtt cggcagcccg 1140
agcggccaga aggacctgct gttcaaggac agcgccatcg gcttcagccg cgtgccgccg 1200
cgcatcgaca gcggcctgta cctgggcagc ggctacttca ccgccatcca gaacctgcgc 1260
aagagcgagg aggaggtggc cgcccgccgc gcccgcgtcg tgtggtgcgc cgtgggcgag 1320
caggagctgc gcaagtgcaa ccagtggagc ggcctgagcg agggcagcgt gacctgctcc 1380
agcgcctcca ccaccgagga ctgcatcgcg ctggtgctga agggcgaggc cgacgccatg 1440
tcgctggacg gcggctacgt gtacaccgcc ggcaagtgcg gcctggtgcc ggtgctggcc 1500
gagaactaca agagccagca gagcagcgac ccggacccga actgcgtgga ccgcccggtg 1560
gagggctacc tggccgtggc cgtcgtgcgc cgcagcgaca ccagcctgac ctggaacagc 1620
gtgaagggca agaagtcgtg ccacaccgcc gtggaccgca ccgcgggctg gaacatcccg 1680
atgggcctgc tgttcaacca gaccggcagc tgcaagttcg acgagtactt cagccagtcc 1740
tgcgccccgg gctccgaccc gcgctcgaac ctgtgcgccc tgtgcatcgg cgacgagcag 1800
ggcgagaaca agtgcgtgcc gaacagcaac gagcgctact acggctacac cggcgcgttc 1860
cgctgcctgg cggagaacgc cggcgacgtg gcgttcgtga aggacgtgac cgtgctgcag 1920
aacaccgacg gcaacaacaa cgaggcctgg gccaaggacc tgaagctggc cgacttcgcg 1980
ctgctgtgcc tggacggcaa gcgcaagccg gtgaccgagg cccgcagctg ccacctggcg 2040
atggccccga accacgcggt ggtgtcgcgc atggacaagg tggagcgcct gaagcaggtg 2100
ctgctgcacc agcaggccaa gttcggccgc aacggcagcg actgcccgga caagttctgc 2160
ctgttccaga gcgagaccaa gaacctgctg ttcaacgaca acaccgagtg cctggcccgc 2220
ctgcacggca agaccaccta cgagaagtac ctgggcccgc agtacgtggc cggcatcacc 2280
aacctgaaga agtgcagcac ctcgccgctg ctggaggcct gcgagttcct gcgcaagtaa 2340
<210> 15
<211> 793
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 15
Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys
1 5 10 15
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala
20 25 30
Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
35 40 45
Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His
50 55 60
Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
65 70 75 80
Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu
85 90 95
Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr
100 105 110
Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met
115 120 125
Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro
130 135 140
Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr
145 150 155 160
Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu
165 170 175
Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr
180 185 190
His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu
195 200 205
Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr
210 215 220
Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp
225 230 235 240
Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser
245 250 255
Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys
260 265 270
Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln
275 280 285
Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly
290 295 300
Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu
305 310 315 320
Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn
325 330 335
Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val
340 345 350
Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala
355 360 365
Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys
370 375 380
Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu
385 390 395 400
Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile
405 410 415
Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn
420 425 430
Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val
435 440 445
Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser
450 455 460
Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu
465 470 475 480
Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu
485 490 495
Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val
500 505 510
Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn
515 520 525
Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg
530 535 540
Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser
545 550 555 560
Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly
565 570 575
Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser
580 585 590
Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu
595 600 605
Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn
610 615 620
Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn
625 630 635 640
Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr
645 650 655
Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp
660 665 670
Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala
675 680 685
Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg
690 695 700
Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala
705 710 715 720
Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe
725 730 735
Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu
740 745 750
Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln
755 760 765
Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu
770 775 780
Leu Glu Ala Cys Glu Phe Leu Arg Lys
785 790
<210> 16
<211> 2382
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
atgcaccacc accaccacca cccgaagaag aagcgcaagg tcgagaagcc gtacaagtgc 60
ccggagtgcg gcaagagctt cagcgccagc gccgccctgg tggcgcacca gcgcacccac 120
accggcgaga agccgtacaa gtgcccggag tgcggcaaga gcttcagcgc cagcgccgcc 180
ctggtggcgc accagcgcac ccacaccggc ggcggctccg gcggctccgg cggctccggc 240
ggatccatga agctggtgtt cctggtgctg ctgttcctgg gcgccctggg cctgtgcctg 300
gcgggccggc gccgccgcag cgtgcagtgg tgcaccgtgt cccagccgga ggccaccaag 360
tgcttccagt ggcagcgcaa catgcgccgc gtgcgcggcc cgccggtgtc ctgcatcaag 420
cgcgacagcc cgatccagtg catccaggcg atcgcggaga accgcgccga cgccgtgacc 480
ctggacggcg gcttcatcta cgaggcgggc ctggccccgt acaagctgcg cccggtggcc 540
gccgaggtgt acggcaccga gcgccagccg cgcacccact actacgccgt ggccgtcgtg 600
aagaagggcg gcagcttcca gctgaacgag ctgcagggcc tgaagtcctg ccacaccggc 660
ctgcgccgca ccgccggctg gaacgtgccg atcggcaccc tgcgcccgtt cctgaactgg 720
accggcccgc cggagccgat cgaggccgcc gtggcgcgct tcttcagcgc cagctgcgtg 780
ccgggcgccg acaagggcca gttcccgaac ctgtgccgcc tgtgcgccgg caccggcgag 840
aacaagtgcg ccttcagcag ccaggagccg tacttcagct acagcggcgc cttcaagtgc 900
ctgcgcgacg gcgcgggcga cgtggccttc atccgcgaga gcaccgtgtt cgaggacctg 960
agcgacgagg ccgagcgcga cgagtacgag ctgctgtgcc cggacaacac ccgcaagccg 1020
gtggacaagt tcaaggactg ccacctggcc cgcgtgccga gccacgccgt ggtggcccgc 1080
tccgtgaacg gcaaggagga cgccatctgg aacctgctgc gccaggccca ggagaagttc 1140
ggcaaggaca agagcccgaa gttccagctg ttcggcagcc cgagcggcca gaaggacctg 1200
ctgttcaagg acagcgccat cggcttcagc cgcgtgccgc cgcgcatcga cagcggcctg 1260
tacctgggca gcggctactt caccgccatc cagaacctgc gcaagagcga ggaggaggtg 1320
gccgcccgcc gcgcccgcgt cgtgtggtgc gccgtgggcg agcaggagct gcgcaagtgc 1380
aaccagtgga gcggcctgag cgagggcagc gtgacctgct ccagcgcctc caccaccgag 1440
gactgcatcg cgctggtgct gaagggcgag gccgacgcca tgtcgctgga cggcggctac 1500
gtgtacaccg ccggcaagtg cggcctggtg ccggtgctgg ccgagaacta caagagccag 1560
cagagcagcg acccggaccc gaactgcgtg gaccgcccgg tggagggcta cctggccgtg 1620
gccgtcgtgc gccgcagcga caccagcctg acctggaaca gcgtgaaggg caagaagtcg 1680
tgccacaccg ccgtggaccg caccgcgggc tggaacatcc cgatgggcct gctgttcaac 1740
cagaccggca gctgcaagtt cgacgagtac ttcagccagt cctgcgcccc gggctccgac 1800
ccgcgctcga acctgtgcgc cctgtgcatc ggcgacgagc agggcgagaa caagtgcgtg 1860
ccgaacagca acgagcgcta ctacggctac accggcgcgt tccgctgcct ggcggagaac 1920
gccggcgacg tggcgttcgt gaaggacgtg accgtgctgc agaacaccga cggcaacaac 1980
aacgaggcct gggccaagga cctgaagctg gccgacttcg cgctgctgtg cctggacggc 2040
aagcgcaagc cggtgaccga ggcccgcagc tgccacctgg cgatggcccc gaaccacgcg 2100
gtggtgtcgc gcatggacaa ggtggagcgc ctgaagcagg tgctgctgca ccagcaggcc 2160
aagttcggcc gcaacggcag cgactgcccg gacaagttct gcctgttcca gagcgagacc 2220
aagaacctgc tgttcaacga caacaccgag tgcctggccc gcctgcacgg caagaccacc 2280
tacgagaagt acctgggccc gcagtacgtg gccggcatca ccaacctgaa gaagtgcagc 2340
acctcgccgc tgctggaggc ctgcgagttc ctgcgcaagt aa 2382
<210> 17
<211> 807
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 17
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser
1 5 10 15
Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
20 25 30
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val
35 40 45
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
50 55 60
Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His Gln Arg
65 70 75 80
Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
85 90 95
Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu
100 105 110
Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser
115 120 125
Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg
130 135 140
Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln
145 150 155 160
Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp
165 170 175
Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro
180 185 190
Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr
195 200 205
Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu
210 215 220
Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly
225 230 235 240
Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly
245 250 255
Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser
260 265 270
Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu
275 280 285
Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro
290 295 300
Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly
305 310 315 320
Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp
325 330 335
Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg
340 345 350
Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser
355 360 365
His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp
370 375 380
Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro
385 390 395 400
Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe
405 410 415
Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser
420 425 430
Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg
435 440 445
Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys
450 455 460
Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu
465 470 475 480
Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys
485 490 495
Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly
500 505 510
Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala
515 520 525
Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val
530 535 540
Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser
545 550 555 560
Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His
565 570 575
Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu
580 585 590
Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser
595 600 605
Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile
610 615 620
Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg
625 630 635 640
Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly
645 650 655
Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly
660 665 670
Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala
675 680 685
Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser
690 695 700
Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp
705 710 715 720
Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe
725 730 735
Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser
740 745 750
Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg
755 760 765
Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val
770 775 780
Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu
785 790 795 800
Ala Cys Glu Phe Leu Arg Lys
805
<210> 18
<211> 2424
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60
gcgcaccagc gcacccacac cggcgagaag ccgtacaagt gcccggagtg cggcaagagc 120
ttcagcgcca gcgccgccct ggtggcgcac cagcgcaccc acaccggcga gaagccgtac 180
aagtgcccgg agtgcggcaa gagcttcagc gccagcgccg ccctggtggc gcaccagcgc 240
acccacaccg gcggcggctc cggcggctcc ggcggctccg gcggatccat gaagctggtg 300
ttcctggtgc tgctgttcct gggcgccctg ggcctgtgcc tggcgggccg gcgccgccgc 360
agcgtgcagt ggtgcaccgt gtcccagccg gaggccacca agtgcttcca gtggcagcgc 420
aacatgcgcc gcgtgcgcgg cccgccggtg tcctgcatca agcgcgacag cccgatccag 480
tgcatccagg cgatcgcgga gaaccgcgcc gacgccgtga ccctggacgg cggcttcatc 540
tacgaggcgg gcctggcccc gtacaagctg cgcccggtgg ccgccgaggt gtacggcacc 600
gagcgccagc cgcgcaccca ctactacgcc gtggccgtcg tgaagaaggg cggcagcttc 660
cagctgaacg agctgcaggg cctgaagtcc tgccacaccg gcctgcgccg caccgccggc 720
tggaacgtgc cgatcggcac cctgcgcccg ttcctgaact ggaccggccc gccggagccg 780
atcgaggccg ccgtggcgcg cttcttcagc gccagctgcg tgccgggcgc cgacaagggc 840
cagttcccga acctgtgccg cctgtgcgcc ggcaccggcg agaacaagtg cgccttcagc 900
agccaggagc cgtacttcag ctacagcggc gccttcaagt gcctgcgcga cggcgcgggc 960
gacgtggcct tcatccgcga gagcaccgtg ttcgaggacc tgagcgacga ggccgagcgc 1020
gacgagtacg agctgctgtg cccggacaac acccgcaagc cggtggacaa gttcaaggac 1080
tgccacctgg cccgcgtgcc gagccacgcc gtggtggccc gctccgtgaa cggcaaggag 1140
gacgccatct ggaacctgct gcgccaggcc caggagaagt tcggcaagga caagagcccg 1200
aagttccagc tgttcggcag cccgagcggc cagaaggacc tgctgttcaa ggacagcgcc 1260
atcggcttca gccgcgtgcc gccgcgcatc gacagcggcc tgtacctggg cagcggctac 1320
ttcaccgcca tccagaacct gcgcaagagc gaggaggagg tggccgcccg ccgcgcccgc 1380
gtcgtgtggt gcgccgtggg cgagcaggag ctgcgcaagt gcaaccagtg gagcggcctg 1440
agcgagggca gcgtgacctg ctccagcgcc tccaccaccg aggactgcat cgcgctggtg 1500
ctgaagggcg aggccgacgc catgtcgctg gacggcggct acgtgtacac cgccggcaag 1560
tgcggcctgg tgccggtgct ggccgagaac tacaagagcc agcagagcag cgacccggac 1620
ccgaactgcg tggaccgccc ggtggagggc tacctggccg tggccgtcgt gcgccgcagc 1680
gacaccagcc tgacctggaa cagcgtgaag ggcaagaagt cgtgccacac cgccgtggac 1740
cgcaccgcgg gctggaacat cccgatgggc ctgctgttca accagaccgg cagctgcaag 1800
ttcgacgagt acttcagcca gtcctgcgcc ccgggctccg acccgcgctc gaacctgtgc 1860
gccctgtgca tcggcgacga gcagggcgag aacaagtgcg tgccgaacag caacgagcgc 1920
tactacggct acaccggcgc gttccgctgc ctggcggaga acgccggcga cgtggcgttc 1980
gtgaaggacg tgaccgtgct gcagaacacc gacggcaaca acaacgaggc ctgggccaag 2040
gacctgaagc tggccgactt cgcgctgctg tgcctggacg gcaagcgcaa gccggtgacc 2100
gaggcccgca gctgccacct ggcgatggcc ccgaaccacg cggtggtgtc gcgcatggac 2160
aaggtggagc gcctgaagca ggtgctgctg caccagcagg ccaagttcgg ccgcaacggc 2220
agcgactgcc cggacaagtt ctgcctgttc cagagcgaga ccaagaacct gctgttcaac 2280
gacaacaccg agtgcctggc ccgcctgcac ggcaagacca cctacgagaa gtacctgggc 2340
ccgcagtacg tggccggcat caccaacctg aagaagtgca gcacctcgcc gctgctggag 2400
gcctgcgagt tcctgcgcaa gtaa 2424
<210> 19
<211> 821
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 19
Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys
1 5 10 15
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala
20 25 30
Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
35 40 45
Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His
50 55 60
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
65 70 75 80
Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His Gln Arg Thr His
85 90 95
Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Lys
100 105 110
Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu Cys Leu
115 120 125
Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser Gln Pro
130 135 140
Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg Val Arg
145 150 155 160
Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln Cys Ile
165 170 175
Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp Gly Gly
180 185 190
Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro Val Ala
195 200 205
Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr Tyr Ala
210 215 220
Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu Leu Gln
225 230 235 240
Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly Trp Asn
245 250 255
Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly Pro Pro
260 265 270
Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser Cys Val
275 280 285
Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu Cys Ala
290 295 300
Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro Tyr Phe
305 310 315 320
Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly Asp Val
325 330 335
Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp Glu Ala
340 345 350
Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg Lys Pro
355 360 365
Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser His Ala
370 375 380
Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp Asn Leu
385 390 395 400
Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro Lys Phe
405 410 415
Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe Lys Asp
420 425 430
Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser Gly Leu
435 440 445
Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg Lys Ser
450 455 460
Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys Ala Val
465 470 475 480
Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu Ser Glu
485 490 495
Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys Ile Ala
500 505 510
Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Tyr
515 520 525
Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn
530 535 540
Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val Asp Arg
545 550 555 560
Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser Asp Thr
565 570 575
Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His Thr Ala
580 585 590
Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu Phe Asn
595 600 605
Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser Cys Ala
610 615 620
Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile Gly Asp
625 630 635 640
Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg Tyr Tyr
645 650 655
Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly Asp Val
660 665 670
Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly Asn Asn
675 680 685
Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala Leu Leu
690 695 700
Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser Cys His
705 710 715 720
Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp Lys Val
725 730 735
Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe Gly Arg
740 745 750
Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser Glu Thr
755 760 765
Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg Leu His
770 775 780
Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val Ala Gly
785 790 795 800
Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu Ala Cys
805 810 815
Glu Phe Leu Arg Lys
820
<210> 20
<211> 2466
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
atgcaccacc accaccacca cccgaagaag aagcgcaagg tcgagaagcc gtacaagtgc 60
ccggagtgcg gcaagagctt cagcgccagc gccgccctgg tggcgcacca gcgcacccac 120
accggcgaga agccgtacaa gtgcccggag tgcggcaaga gcttcagcgc cagcgccgcc 180
ctggtggcgc accagcgcac ccacaccggc gagaagccgt acaagtgccc ggagtgcggc 240
aagagcttca gcgccagcgc cgccctggtg gcgcaccagc gcacccacac cggcggcggc 300
tccggcggct ccggcggctc cggcggatcc atgaagctgg tgttcctggt gctgctgttc 360
ctgggcgccc tgggcctgtg cctggcgggc cggcgccgcc gcagcgtgca gtggtgcacc 420
gtgtcccagc cggaggccac caagtgcttc cagtggcagc gcaacatgcg ccgcgtgcgc 480
ggcccgccgg tgtcctgcat caagcgcgac agcccgatcc agtgcatcca ggcgatcgcg 540
gagaaccgcg ccgacgccgt gaccctggac ggcggcttca tctacgaggc gggcctggcc 600
ccgtacaagc tgcgcccggt ggccgccgag gtgtacggca ccgagcgcca gccgcgcacc 660
cactactacg ccgtggccgt cgtgaagaag ggcggcagct tccagctgaa cgagctgcag 720
ggcctgaagt cctgccacac cggcctgcgc cgcaccgccg gctggaacgt gccgatcggc 780
accctgcgcc cgttcctgaa ctggaccggc ccgccggagc cgatcgaggc cgccgtggcg 840
cgcttcttca gcgccagctg cgtgccgggc gccgacaagg gccagttccc gaacctgtgc 900
cgcctgtgcg ccggcaccgg cgagaacaag tgcgccttca gcagccagga gccgtacttc 960
agctacagcg gcgccttcaa gtgcctgcgc gacggcgcgg gcgacgtggc cttcatccgc 1020
gagagcaccg tgttcgagga cctgagcgac gaggccgagc gcgacgagta cgagctgctg 1080
tgcccggaca acacccgcaa gccggtggac aagttcaagg actgccacct ggcccgcgtg 1140
ccgagccacg ccgtggtggc ccgctccgtg aacggcaagg aggacgccat ctggaacctg 1200
ctgcgccagg cccaggagaa gttcggcaag gacaagagcc cgaagttcca gctgttcggc 1260
agcccgagcg gccagaagga cctgctgttc aaggacagcg ccatcggctt cagccgcgtg 1320
ccgccgcgca tcgacagcgg cctgtacctg ggcagcggct acttcaccgc catccagaac 1380
ctgcgcaaga gcgaggagga ggtggccgcc cgccgcgccc gcgtcgtgtg gtgcgccgtg 1440
ggcgagcagg agctgcgcaa gtgcaaccag tggagcggcc tgagcgaggg cagcgtgacc 1500
tgctccagcg cctccaccac cgaggactgc atcgcgctgg tgctgaaggg cgaggccgac 1560
gccatgtcgc tggacggcgg ctacgtgtac accgccggca agtgcggcct ggtgccggtg 1620
ctggccgaga actacaagag ccagcagagc agcgacccgg acccgaactg cgtggaccgc 1680
ccggtggagg gctacctggc cgtggccgtc gtgcgccgca gcgacaccag cctgacctgg 1740
aacagcgtga agggcaagaa gtcgtgccac accgccgtgg accgcaccgc gggctggaac 1800
atcccgatgg gcctgctgtt caaccagacc ggcagctgca agttcgacga gtacttcagc 1860
cagtcctgcg ccccgggctc cgacccgcgc tcgaacctgt gcgccctgtg catcggcgac 1920
gagcagggcg agaacaagtg cgtgccgaac agcaacgagc gctactacgg ctacaccggc 1980
gcgttccgct gcctggcgga gaacgccggc gacgtggcgt tcgtgaagga cgtgaccgtg 2040
ctgcagaaca ccgacggcaa caacaacgag gcctgggcca aggacctgaa gctggccgac 2100
ttcgcgctgc tgtgcctgga cggcaagcgc aagccggtga ccgaggcccg cagctgccac 2160
ctggcgatgg ccccgaacca cgcggtggtg tcgcgcatgg acaaggtgga gcgcctgaag 2220
caggtgctgc tgcaccagca ggccaagttc ggccgcaacg gcagcgactg cccggacaag 2280
ttctgcctgt tccagagcga gaccaagaac ctgctgttca acgacaacac cgagtgcctg 2340
gcccgcctgc acggcaagac cacctacgag aagtacctgg gcccgcagta cgtggccggc 2400
atcaccaacc tgaagaagtg cagcacctcg ccgctgctgg aggcctgcga gttcctgcgc 2460
aagtaa 2466

Claims (10)

1.一种融合蛋白质,其结构域中包括锌指蛋白和人乳铁蛋白。
2.根据权利要求1所述的融合蛋白,其特征在于,还包括以下特征中的任一项或多项:
(1)所述锌指蛋白和人乳铁蛋白之间通过连接肽连接,优选地,所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白;
(2)所述锌指蛋白的氨基酸序列如SEQ ID NO.2所示;
(3)所述人乳铁蛋白的氨基酸序列如SEQ ID NO.4所示。
3.根据权利要求2所述的融合蛋白,其特征在于,特征(1)中,所述融合蛋白结构域中,包括1个、2个或3个锌指蛋白,优选地,所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白--连接肽-人乳铁蛋白,即ZFP1-hLF,或锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白,即ZFP2-hLF,或锌指蛋白-锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白,即ZFP3-hLF。
4.根据权利要求3所述的融合蛋白,其特征在于,还包括以下特征中的任一项或多项:
(1)所述ZFP1-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.5所示;
(2)所述ZFP2-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.13所示;
(3)所述ZFP3-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.17所示;
(4)所述融合蛋白还包括标签。
5.根据权利要求4所述的融合蛋白,其特征在于,特征(4)中,还包括以下特征中的任一项或多项:
(1)带标签的ZFP1-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.6所示;
(2)带标签的ZFP2-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.15所示;
(3)带标签的ZFP3-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.19所示。
6.一种分离的多核苷酸,其编码如权利要求1~5任一项所述的融合蛋白。
7.一种重组表达载体,其含有如权利要求6所述的分离的多核苷酸。
8.一种宿主细胞,所述细胞含有如权利要求7所述重组表达载体或基因组中整合有外源的如权利要求6所述的分离的多核苷酸。
9.一种制备如权利要求1~5任一项所述融合蛋白的方法,包括如下步骤:构建含有所述融合蛋白编码多核苷酸的重组表达载体,然后将所述重组表达载体转化至宿主细胞中表达,从表达产物中分离获得所述融合蛋白。
10.如权利要求1~5任一项所述融合蛋白在制备涉及乳铁蛋白所有生物学功能性的相关产品中的用途,优选地,所述功能性产品选自癌症治疗产品、抗病毒治疗产品、抑菌产品、抗氧化产品、调节免疫力产品、促进铁离子吸收产品、肠道相关疾病治疗产品。
CN201910098200.8A 2019-01-31 2019-01-31 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用 Active CN111499759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910098200.8A CN111499759B (zh) 2019-01-31 2019-01-31 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910098200.8A CN111499759B (zh) 2019-01-31 2019-01-31 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用

Publications (2)

Publication Number Publication Date
CN111499759A true CN111499759A (zh) 2020-08-07
CN111499759B CN111499759B (zh) 2022-12-20

Family

ID=71867056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910098200.8A Active CN111499759B (zh) 2019-01-31 2019-01-31 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用

Country Status (1)

Country Link
CN (1) CN111499759B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114129713A (zh) * 2021-11-23 2022-03-04 南方科技大学 乳铁蛋白活性肽或编码该活性肽的核苷酸序列在制备抗炎和/或抗氧化产品中的应用
CN114230672A (zh) * 2021-11-23 2022-03-25 华侨大学 一种牛乳铁蛋白肽融合蛋白、编码基因及其在海鲜保鲜和/或防腐中的应用
CN114716538A (zh) * 2022-04-12 2022-07-08 广州泰术生物科技有限公司 一种人乳铁蛋白突变体及其与双歧杆菌在制备食品或保健品中的应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101395180A (zh) * 2005-12-30 2009-03-25 赢创罗姆有限责任公司 用作细胞穿膜肽的肽
US20100285584A1 (en) * 2006-11-03 2010-11-11 Ron Weiss Engineered cellular pathways for programmed autoregulation of differentiation
CN103298935A (zh) * 2007-08-15 2013-09-11 阿穆尼克斯公司 用于改善生物活性多肽性能的组合物和方法
CN105112383A (zh) * 2015-08-25 2015-12-02 三峡大学 细胞膜穿透肽hPP5及其用途
CN105175526A (zh) * 2015-08-25 2015-12-23 三峡大学 细胞膜穿透肽hPP8及其用途

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101395180A (zh) * 2005-12-30 2009-03-25 赢创罗姆有限责任公司 用作细胞穿膜肽的肽
US20100285584A1 (en) * 2006-11-03 2010-11-11 Ron Weiss Engineered cellular pathways for programmed autoregulation of differentiation
CN103298935A (zh) * 2007-08-15 2013-09-11 阿穆尼克斯公司 用于改善生物活性多肽性能的组合物和方法
CN105112383A (zh) * 2015-08-25 2015-12-02 三峡大学 细胞膜穿透肽hPP5及其用途
CN105175526A (zh) * 2015-08-25 2015-12-23 三峡大学 细胞膜穿透肽hPP8及其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAONAN PANG ET AL.: "Expression and characterization of human lactoferrin with tandem zinc finger protein in Chlamydomonas reinhardtii", 《ALGAL RESEARCH》 *
李璐等: "C2H2锌指蛋白药物递送技术的研发与应用", 《自然杂志》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114129713A (zh) * 2021-11-23 2022-03-04 南方科技大学 乳铁蛋白活性肽或编码该活性肽的核苷酸序列在制备抗炎和/或抗氧化产品中的应用
CN114230672A (zh) * 2021-11-23 2022-03-25 华侨大学 一种牛乳铁蛋白肽融合蛋白、编码基因及其在海鲜保鲜和/或防腐中的应用
CN114230672B (zh) * 2021-11-23 2023-08-08 华侨大学 一种牛乳铁蛋白肽融合蛋白、编码基因及其在海鲜保鲜和/或防腐中的应用
CN114716538A (zh) * 2022-04-12 2022-07-08 广州泰术生物科技有限公司 一种人乳铁蛋白突变体及其与双歧杆菌在制备食品或保健品中的应用

Also Published As

Publication number Publication date
CN111499759B (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN111499759B (zh) 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用
CN107245494A (zh) Aβ42在大肠杆菌中的高效可溶性表达及纯化方法
CN113087804B (zh) 一种二价植物免疫融合蛋白及其生产方法和应用
CN111217903B (zh) 一种重组人纤连蛋白ⅲ1-c及其制备方法和应用
US10519203B2 (en) Gene for biosynthesis of core structure of ophiobolin
KR101026526B1 (ko) 대장균에서 외래단백질을 분비 생산하는 방법
CN116333097A (zh) 一种高活性的重组人纤连蛋白及其制备方法和应用
JP2022530774A (ja) イソオイゲノールからのバニリンの生合成
CN112745385A (zh) 重组人源化胶原蛋白及其产业化制备方法与产品应用
CN107746432B (zh) 一种Aβ42修饰蛋白及其表达与纯化方法
CN108484749B (zh) 一种重组可溶性人源骨靶向干扰素γ-1b及其制备方法
US20220135629A1 (en) Zinc Finger Protein-Superoxide Dismutase Fusion Protein With Cell Membrane Penetrating Property
CN107779464A (zh) 一种人源铜锌超氧化物歧化酶的制备方法
CN110305887A (zh) 抗真菌肽Drosomycin、制备方法及其应用
CN113736762A (zh) 一种α-L-鼠李糖苷酶突变体及其在制备普鲁宁中的应用
KR20130141001A (ko) 목적 단백질의 분리 및 정제를 위한 신규한 벡터 시스템
CN107266540A (zh) 一种结核分枝杆菌延伸因子EF‑Tu蛋白的制备方法
CN112941058B (zh) 一种重组溶组织梭菌ii型胶原酶及其制备方法和应用
CN110396132B (zh) 具有细胞穿膜性的锌指蛋白-超氧化物歧化酶融合蛋白质
CN114262363B (zh) 一种生物防御素及其应用
CN113214409B (zh) 一种蜂毒素-死亡素杂合肽突变体mtm及其应用
CN116731126B (zh) 内含肽ChiATP、内含肽ChiATP-二肽-2融合蛋白及二肽-2的表达方法
CN107779463A (zh) 一种用于表达人源铜锌超氧化物歧化酶的重组载体、重组菌株及制备方法
CN114381468B (zh) 一种甲硫氨酸裂解酶及其编码基因和应用
CN111434693B (zh) 一种抗氧化融合蛋白及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant