CN111499759A

CN111499759A - 一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用

Info

Publication number: CN111499759A
Application number: CN201910098200.8A
Authority: CN
Inventors: 刘佳; 陈德富
Original assignee: ShanghaiTech University
Current assignee: ShanghaiTech University
Priority date: 2019-01-31
Filing date: 2019-01-31
Publication date: 2020-08-07
Anticipated expiration: 2039-01-31
Also published as: CN111499759B

Abstract

本发明属于生物技术领域，具体涉及一种具有细胞穿膜性的锌指蛋白‑人乳铁蛋白融合蛋白质及其制备与应用。本发明所述融合蛋白质的结构域中包括锌指蛋白和人乳铁蛋白，该融合蛋白具有抑菌和抗氧化活性，且能进入哺乳动物细胞内。

Description

一种具有细胞穿膜性的锌指蛋白-乳铁蛋白融合蛋白质及其制备与应用

技术领域

本发明属于生物技术领域，具体涉及一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用。

背景技术

细胞膜的选择通透性将细胞内组分与外源分子分开。这是治疗药物递送到细胞的主要挑战。如基因，蛋白质和病毒等各种生物活性物质可有效地进入到细胞中。在这些药物中，由于功能性蛋白质直接递送的安全性和有效性，使其有希望应用到治疗中。蛋白质递送不依赖于注入核酸的转录和翻译。因此，递送的蛋白质可以迅速发挥作用，然后被蛋白酶体降解，降低脱靶效应。细胞膜的选择性是蛋白质递送的主要障碍。在研的许多膜微扰技术，如显微注射和电穿孔，可加速蛋白质递送。然而，这些膜破裂技术通常效率差，毒性大，生物利用度低和特异性差。除了物理膜穿刺方法之外，还开发了许多生物化学试剂以促进蛋白质递送，例如超荷电转导结构域，纳米粒，脂质体，病毒样颗粒和聚合物微球。在临床前或临床实践中，这些策略可能与诸如细胞摄取低效、稳定性差、无细胞特异性、溶酶体逃逸率低或毒性大等缺点相关。

在20世纪80年代后期，一种来源于人类免疫缺陷病毒(HIV)的TAT反式激活因子的天然肽被发现具有固有的细胞穿透能力。在随后的几年中，一系列被认为是细胞穿透肽(CPP)的具有相似细胞通透性的天然肽被确定。基于天然存在的CPP的特征，人造或嵌合CPP被设计出来。CPPs通常具有最小的细胞毒性，并且可以应用于各种细胞类型以递送具有不同分子量的各种货物分子。这些CPP可以与货物蛋白基因融合或化学缀合。

发明内容

为了克服现有技术中所存在的问题，本发明的目的在于提供一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用。

为了实现上述目的以及其他相关目的，本发明采用如下技术方案：

本发明的第一方面，提供一种融合蛋白质，其结构域中包括锌指蛋白和人乳铁蛋白。

进一步地，所述锌指蛋白的氨基酸序列如SEQ ID NO.2所示，具体为：

EKPYKCPECGKSFSASAALVAHQRTHT。

进一步地，所述乳铁蛋白的氨基酸序列如SEQ ID NO.4所示，具体为：

MKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。

进一步地，所述锌指蛋白和人乳铁蛋白之间通过连接肽连接。

进一步地，所述连接肽的氨基酸数量为12个，所述连接肽由甘氨酸(Gly)和丝氨酸(Ser)组合而成，采用以G2S(即氨基酸序列GGS)为单位的多单位连接实现。

进一步地，所述连接肽的氨基酸序列如SEQ ID NO.3所示，具体为：GGSGGSGGSGGS。

本发明对于连接顺序没有特殊要求，只要不限制本发明的目的即可。例如，所述锌指蛋白的C末端可以与所述人乳铁蛋白的N末端连接。或者人乳铁蛋白的C末端可以与所述锌指蛋白的N末端连接。

亦即，所述融合蛋白的结构域的通式为：锌指蛋白-连接肽-人乳铁蛋白或者人乳铁蛋白-连接肽-锌指蛋白。

优选地，所述融合蛋白的结构域从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白。

所述融合蛋白结构域中，可以包括1个、2个或3个锌指蛋白。

优选地，所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白-连接肽-人乳铁蛋白，即ZFP1-hLF，或锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白，即ZFP2-hLF，或锌指蛋白-锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白，即ZFP3-hLF。

进一步地，在本案的较佳案例中，列举了所述融合蛋白的结构域氨基序列如SEQID NO.5所示，具体为：

EKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。但不限于本发明较佳案例中所列举的具体形式。

在本案的一种实施方式中，列举了所述融合蛋白的结构域氨基序列如SEQ IDNO.13所示。

在本案的一种实施方式中，列举了所述融合蛋白的结构域氨基序列如SEQ IDNO.17所示。

进一步地，所述融合蛋白还可含有标签。所述标签用于蛋白质的纯化。

例如，所述标签可以是His标签、MBP标签、GST标签、FLAG标签等亲和纯化标签。

所述标签可以连接在所述融合蛋白的结构域N端或C端，只要不影响标签和融合蛋白结构域发挥作用即可。

在本案的较佳案例中，列举了带有标签的ZFP1-hLF融合蛋白的氨基酸序列如SEQID NO.6所示，具体为：

MHHHHHHPKKKRKVEKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK。但不限于本发明较佳案例中所列举的具体形式。

在本发明的一种实施方式中，列举了带有标签的ZFP2-hLF融合蛋白的氨基酸序列如SEQ ID NO.15所示。但不限于本发明较佳案例中所列举的具体形式。

在本发明的一种实施方式中，列举了带有标签的ZFP3-hLF融合蛋白的氨基酸序列如SEQ ID NO.19所示。但不限于本发明较佳案例中所列举的具体形式。

本发明的第二方面，提供一种分离的多核苷酸(亦即DNA分子)，其编码前述融合蛋白。

本发明的编码所述融合蛋白的多核苷酸，可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。

本发明的编码所述融合蛋白的多核苷酸，可以通过本领域技术人员熟知的任何适当的技术制备。所述技术见于本领域的一般描述。包括但不限于重组DNA技术、化学合成等方法；例如采用重叠延伸PCR法。

例如，编码所述锌指蛋白的核苷酸序列如SEQ ID NO.8所示，具体为：

gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggc。

编码所述人乳铁蛋白的核苷酸序列如SEQ ID NO.10所示，具体为：

atgaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。

编码所述连接肽的核苷酸序列如SEQ ID NO.9所示，具体为：

ggtggatccggtggatccggtggatccggtggatcc。

编码所述ZFP1-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.11所示，具体为：gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。

编码带有标签的ZFP1-hLF融合蛋白的核苷酸序列如SEQ ID NO.12所示，具体为：atgcatcatcatcatcatcacgagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa。

编码ZFP2-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.14所示。

编码带有标签的ZFP2-hLF融合蛋白的核苷酸序列如SEQ ID NO.16所示。

编码所述ZFP3-hLF融合蛋白结构域的核苷酸序列如SEQ ID NO.18所示。

编码带有标签的ZFP3-hLF融合蛋白的核苷酸序列如SEQ ID NO.20所示。

本发明的第三方面，提供一种重组表达载体，其含有前述分离的多核苷酸。

发明的所述表达载体含有编码所述融合蛋白的多核苷酸。本领域的技术人员熟知的方法能用于构建所述表达载体。这些方法包括重组DNA技术、DNA合成技术等。可将编码所述融合蛋白的DNA有效连接到载体中的多克隆位点上，以指导mRNA合成进而表达蛋白，或者用于同源重组。本发明的较佳案例中，所述表达载体可采用pCAMBIA-1301C等。

本发明的第四方面，提供一种宿主细胞，所述细胞含有前述重组表达载体或基因组中整合有外源的前述分离的多核苷酸。

本发明的较佳案例中，所述宿主细胞可采用莱茵衣藻、雨生红球藻、水稻、烟草、大肠杆菌、昆虫细胞、哺乳动物细胞等。

本发明的第五方面，提供一种制备前述融合蛋白的方法，包括如下步骤：

构建含有所述融合蛋白编码多核苷酸的重组表达载体，然后将所述重组表达载体转化至宿主细胞中诱导表达，从表达产物中分离获得所述融合蛋白；

或者

在合适的条件下培养前述宿主细胞，使之表达所述融合蛋白，而后分离及纯化获得所述融合蛋白。

本发明的较佳案例中，所述表达载体可采用pCAMBIA-1301C。

所述宿主细胞可采用莱茵衣藻、雨生红球藻、水稻、烟草、大肠杆菌、昆虫细胞、哺乳动物细胞等。

本发明的第六方面，提供前述融合蛋白、分离的多核苷酸、重组表达载体、或宿主细胞在制备抑菌、抗氧化、调节免疫力等相关产品中的用途。

优选地，所述产品选自抗病毒治疗产品、抑菌产品、抗氧化产品、调节免疫力产品、促进铁离子吸收产品、肠道相关疾病治疗产品。

与现有技术相比，本发明具有如下有益效果：

(1)本发明的融合蛋白比传统细胞穿膜肽融合的乳铁蛋白更容易表达纯化。

(2)本发明的融合蛋白有更低的风险引起免疫反应。锌指蛋白和人乳铁蛋白都是人体内天然存在的蛋白质。

(3)本发明的融合蛋白能不影响乳铁蛋白正常活性(抗菌等)。

(4)本发明的融合蛋白能将大分子的有活性的乳铁蛋白递呈到细胞中。

附图说明

图1：ZFP-hLF纯化，(a)ZFP-hLF构建体的示意图；(b)纯化的ZFP-hLF蛋白的SDS-PAGE。

图2：通过Western blotting测定的HIEC-6细胞内吞的乳铁蛋白。

图3：莱茵衣藻表达的ZFP-hLF融合蛋白的抑菌活性，(a)对Escherichia coli DH-5α的抑制作用；(b)对Klebsiella variicola IV-3的抑制作用。n.s.表示无统计学意义。*表示P<0.05。

图4：莱茵衣藻表达的ZFP-hLF融合蛋白的抗氧化活性，(a)DPPH自由基清除效率；(b)羟基自由基清除效率。n.s.表示无统计学意义。*表示P<0.05。

具体实施方式

本发明的发明人鉴定出Cys₂-His₂锌指蛋白(ZFPs)为新的蛋白质递送系统。由于蛋白质表面带有6个带正电荷的残基，ZFP具有固有的细胞渗透性。我们通过突变α--螺旋中负责DNA结合的残基来消除ZFP的DNA结合能力。工程化的锌指蛋白(ZFP)保留了细胞通透性，可以用作融合标签来递送货物蛋白。通过调节串联ZFP结构域的数量可调节细胞摄取功效，以适应不同应用。ZFP结构域可以有效介导蛋白质如绿色荧光蛋白(GFP)和Fok I核酸酶的细胞内递送。除了转化的细胞系之外，ZFP可以促进货物蛋白质向原代细胞和干细胞的递送，这对于治疗应用非常重要。

乳铁蛋白是一种具有抑菌、抗病毒、抗癌、免疫调节、抗氧化等诸多生物学功能的糖蛋白；在肠道疾病的治疗中也发挥着重要的作用，主要体现在促进铁离子的吸收，改善炎症引起的肠道功能紊乱，缓解肠道出血，抑制肠道肿瘤细胞的增殖、迁移和侵袭。

本发明首次提供了ZFP-hLF融合蛋白的构建、表达、纯化及生物学活性和穿膜效果检测，并证明了ZFP-hLF的融合蛋白具有抑菌、抗氧化的生物学活性；且能穿透HIEC-6细胞膜。

在进一步描述本发明具体实施方式之前，应理解，本发明的保护范围不局限于下述特定的具体实施方案；还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法，通常按照常规条件，或者按照各制造商所建议的条件。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外，根据本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

除非另外说明，本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。

莱茵衣藻的转化可参考文献：Neupert,J.等,Genetic transformation of themodel green alga Chlamydomonas reinhardtii.Methods Mol Biol,2012；847,35-47以及书籍Harris EH(1989)The Chlamydomonas Sourcebook.Academic Press,San Diego。

本发明中，所述ZFP-hLF包括ZFP1-hLF、ZFP2-hLF和ZFP3-hLF。

实施例1

一、材料

(一)质粒构建

1、莱茵衣藻表达偏好性优化的人乳铁蛋白基因的质粒。

2、含有ZFP编码基因序列的质粒。

3、DNA聚合酶。

4、脱氧核苷酸混合物，包括dATP，dCTP，dGTP和dTTP。

5、PCR反应缓冲液。

6、无菌水。

7、DNA染色试剂。

8、限制性内切酶、DNA连接酶。

9、DH5α大肠杆菌感受态。

10、溶菌肉汤(LB)培养基。

11、琼脂，细菌学等级。

12、质粒DNA抽提试剂盒和琼脂糖凝胶回收试剂盒。

13、用于PCR的梯度热循环仪。

14、琼脂糖凝胶电泳试剂和设备。

15、UV透射照胶仪。

16、离心机。

17、水浴锅。

18、Nano drop 2000。

(二)蛋白表达和纯化

1、编码重组ZFP-hLF蛋白质的质粒。

2、莱茵衣藻CW-15株系

3、琼脂，细菌学等级。

4、0.2mg/ml阿特拉津储备溶液

5、100mg/ml精氨酸储备液。

6、十六烷基三甲基溴化铵。

7、Ni-NTA琼脂糖。

8、50mM sodium phosphate，pH 7.0。

9、4M咪唑储备液。

10、100mM ZnCl₂原液。

11、苯甲基磺酰基氟化物(PMSF)(100mM乙醇溶液)。

12、裂解缓冲液：50mM sodium phosphate,300mM NaCl,10％glycerol,100μMZnCl₂,1mM PMSF。

13、洗涤缓冲液：50mM sodium phosphate,300mM NaCl,10％glycerol,20mMimidazole,100μM ZnCl₂,1mM PMSF,pH7.0。

14、洗脱缓冲液：50mM sodium phosphate,300mM NaCl,10％glycerol,300mMimidazole,100μM ZnCl₂,1mM PMSF,pH7.0。

15、磷酸盐缓冲液：137mM NaCl,2.7mM KCl,10mM Na₂HPO₄,2mM KH₂PO₄。

16、储存缓冲液：50mM sodium phosphate,300mM NaCl,10％glycerol,100μMZnCl₂,pH7.0。

17、4-20％Tris-甘氨酸SDS-PAGE。

18、SDS蛋白上样缓冲液。

19、考马斯亮蓝染色液。

20、液氮。

21、TAP培养基。

22、光照培养箱。

23、-70℃低温冰箱。

(三)蛋白转导

1、纯化ZFP-hLF蛋白。

2、二类生物安全柜。

3、细胞培养箱。

4、明场相差显微镜。

5、达尔伯克改良鹰的培养基(DMEM)。

6、胎牛血清(FBS)。

7、青霉素和链霉素溶液。

8、磷酸盐缓冲液(PBS)。

9、10mM ZnCl₂。

10、细胞刮刀。

11、0.05％含酚红的胰蛋白酶-EDTA溶液。

12、HIEC-6细胞。

13、细胞培养瓶。

14、24孔平底细胞培养板。

15、离心机。

16、金属浴。

17、转膜仪。

18、抗体(anti-hLF,anti-GAPDH)。

19、PVDF膜。

20、0.5mg/mL肝素。

(四)抑菌活性

1、纯化ZFP-hLF蛋白。

2、恒温培养箱。

3、恒温摇床。

4、紫外分光光度计。

5、LB培养基。

6、微量比色皿。

(五)抗氧化活性

1、纯化ZFP-hLF蛋白。

2、紫外分光光度计。

3、微量比色皿。

4、0.1mmol/L DPPH溶液。

5、6mmol/L H₂O₂。

6、6mmol/L水杨酸。

7、6mmol/L FeSO₄。

8、蒸馏水。

二、方法

(一)表达ZFP-hLF蛋白质的质粒构建

1、使用商业基因合成服务，经密码子优化后，小量制备编码ZFP的质粒(pET21-ZFP)和编码hLF的质粒(pCAMBIA-1301C-hLF)(人乳铁蛋白基因)。

2、在冰上解冻200微升化学感受态DH5α大肠杆菌细胞，与质粒轻轻混合，然后在冰上孵育30分钟。

3、将混合物在42℃下热击45-90s，用LB培养基900μL复苏细胞并在37℃振荡1h。

4、在补充有20μg/mL卡那霉素的LB琼脂平板上铺100μL复苏的细胞(转化入pCAMBIA-1301C-hLF质粒)，在补充有100μg/mL氨苄霉素的LB琼脂平板上铺100μL复苏的细胞(转化入pET21-ZFP质粒)，在37℃培养过夜。

5、次日，将单个菌落接种到含有对应抗生素的5mL LB培养基中，在37℃下培养过夜。

6、质粒提取后，在37℃条件下，用10U BamHI在推荐缓冲液中消化1g pET21-ZFP和pCAMBIA-1301C-hLF质粒2h。通过经DNA染料(例如EB)染色的琼脂糖凝胶电泳观察酶切结果。

7、使用凝胶回收试剂盒回收对应的目的片段，并通过Nano drop 2000来确定DNA浓度。

8、按如下条件构建表达ZFP-hLF融合蛋白的质粒：在20μL的反应体系加入0.06pmol ZFP酶切回收产物、0.03pmol线性化pCAMBIA-1301C-hLF质粒、2μL T₄连接酶、2μL10x重组缓冲液和去离子水，于恒温连接箱中连接过夜。

9、制备pCAMBIA-1301C-ZFP-hLF质粒，并使用引物(5'-aggatccatgcaccaccaccac-3')与(5'-tcgctcaggtcctcgaacac-3')，通过DNA测序确认构建体【ZFP-hLF构建体的示意图如图1中(a)所示】。

结果可知：ZFP-hLF蛋白质(锌指蛋白-人乳铁蛋白)的结构域中从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白，所述融合蛋白结构域的全长基因均序列正确，均与预期相符。

亦即，融合蛋白结构域中，锌指蛋白的编码核苷酸序列如SEQ ID NO.8所示，具体为：

连接肽的编码核苷酸序列如SEQ ID NO.9所示，具体为：

ggtggatccggtggatccggtggatccggtggatcc。

人乳铁蛋白的编码核苷酸序列如SEQ ID NO.10所示，具体为：

atgaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa

ZFP1-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.11所示，具体为：

gagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa

ZFP2-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.14所示。

ZFP3-hLF蛋白质结构域的编码核苷酸序列如SEQ ID NO.18所示。

为了纯化方便，ZFP1-hLF、ZFP2-hLF和ZFP3-hLF蛋白质在结构域N端添加了His标签。

His标签的编码核苷酸序列如SEQ ID NO.7所示，具体为：catcatcatcatcatcac。

带有His标签的ZFP1-hLF蛋白质的编码核苷酸序列如SEQ ID NO.12所示，具体为：atgcatcatcatcatcatcacgagaagccgtacaagtgcccggagtgcggcaagagcttcagcgccagcgccgccctggtggcgcaccagcgcacccacaccggcggtggatccggtggatccggtggatccggtggatccaaacttgtcttcctcgtcctgctgttcctcggggccctcggactgtgtctggctggccgtaggagaaggagtgttcagtggtgcaccgtatcccaacccgaggccacaaaatgcttccaatggcaaaggaatatgagaagagtgcgtggccctcctgtcagctgcataaagagagactcccccatccagtgtatccaggccattgcggaaaacagggccgatgctgtgacccttgatggtggtttcatatacgaggcaggcctggccccctacaaactgcgacctgtagcggcggaagtctacgggaccgaaagacagccacgaactcactattatgccgtggctgtggtgaagaagggcggcagctttcagctgaacgaactgcaaggtctgaagtcctgccacacaggccttcgcaggaccgctggatggaatgtgcctatagggacacttcgtccattcttgaattggacgggtccacctgagcccattgaggcagctgtggccaggttcttctcagccagctgtgttcccggtgcagataaaggacagttccccaacctgtgtcgcctgtgtgcggggacaggggaaaacaaatgtgccttctcctcccaggaaccgtacttcagctactctggtgccttcaagtgtctgagagacggggctggagacgtggcttttatcagagagagcacagtgtttgaggacctgtcagacgaggctgaaagggacgagtatgagttactctgcccagacaacactcggaagccagtggacaagttcaaagactgccatctggcccgggtcccttctcatgccgttgtggcacgaagtgtgaatggcaaggaggatgccatctggaatcttctccgccaggcacaggaaaagtttggaaaggacaagtcaccgaaattccagctctttggctcccctagtgggcagaaagatctgctgttcaaggactctgccattgggttttcgagggtgcccccgaggatagattctgggctgtaccttggctccggctacttcactgccatccagaacttgaggaaaagtgaggaggaagtggctgcccggcgtgcgcgggtcgtgtggtgtgcggtgggcgagcaggagctgcgcaagtgtaaccagtggagtggcttgagcgaaggcagcgtgacctgctcctcggcctccaccacagaggactgcatcgccctggtgctgaaaggagaagctgatgccatgagtttggatggaggatatgtgtacactgcaggcaaatgtggtttggtgcctgtcctggcagagaactacaaatcccaacaaagcagtgaccctgatcctaactgtgtggatagacctgtggaaggatatcttgctgtggcggtggttaggagatcagacactagccttacctggaactctgtgaaaggcaagaagtcctgccacaccgccgtggacaggactgcaggctggaatatccccatgggcctgctcttcaaccagacgggctcctgcaaatttgatgaatatttcagtcaaagctgtgcccctgggtctgacccgagatctaatctctgtgctctgtgtattggcgacgagcagggtgagaataagtgcgtgcccaacagcaatgagagatactacggctacactggggctttccggtgcctggctgagaatgctggagacgttgcatttgtgaaagatgtcactgtcttgcagaacactgatggaaataacaatgaggcatgggctaaggatttgaagctggcagactttgcgctgctgtgcctcgatggcaaacggaagcctgtgactgaggctagaagctgccatcttgccatggccccgaatcatgccgtggtgtctcggatggataaggtggaacgcctgaaacaggtgctgctccaccaacaggctaaatttgggagaaatggatctgactgcccggacaagttttgcttattccagtctgaaaccaaaaaccttctgttcaatgacaacactgagtgtctggccagactccatggcaaaacaacatatgaaaaatatttgggaccacagtatgtcgcaggcattactaatctgaaaaagtgctcaacctcccccctcctggaagcctgtgaattcctcaggaagtaa

带有His标签的ZFP2-hLF蛋白质的编码核苷酸序列如SEQ ID NO.16所示。

带有His标签的ZFP3-hLF蛋白质的编码核苷酸序列如SEQ ID NO.20所示。

(二)ZFP-hLF蛋白质的表达与纯化

1、玻璃珠法进行转化，将300mg酸洗玻璃珠，1μg pCAMBIA-1301C-ZFP-hLF质粒和10⁸个莱茵衣藻CW-15细胞缓慢混合均匀，漩涡震荡15s，间歇20s,重复三次。

2、将EP管中的上清液转接入含精氨酸的小体积TAP培养基中进行8-12h的避光培养。

3、8-12h后，低速离心，弃上清，取200-400μL的含精氨酸的TAP液体培养基将藻细胞重悬。涂布至含阿特拉津抗性固体平板上，置于光照培养箱中培养。

4、5-7天后，挑取单藻落，转接至5ml含精氨酸的TAP液体培养基中扩大培养，3-5天后，CTAB法提取基因组，PCR鉴定阳性转化株。

5、将获得的多个株系通过qRT-PCR进行分析RNA水平的分析，通过westernblotting进行蛋白水平的分析；筛选出表达水平最高的株系。

6、将表达量最高的转化株大量培养，离心弃上清，将藻细胞反复冻融后加入洗涤缓冲液，冰浴超声破碎5min。4℃,12000g，离心30min，取上清用0.45μM微孔滤膜过滤。

7、常规方法进行Ni-NTA琼脂糖纯化，用10mL洗脱缓冲液洗脱蛋白质。

8、用储存缓冲液置换洗脱的蛋白质，按照产品说明使用Millipore超滤浓缩管对蛋白质进行脱咪唑和浓缩处理。

9、通过Bradford方法确定蛋白质浓度。

10、用2μL 5×SDS-PAGE上样缓冲液混合8μL纯化的蛋白质，在98℃金属浴中充分裂解10分钟，然后在4-20％Tris-甘氨酸SDS-PAGE上分离以评估蛋白质纯度，结果如图1中(b)所示，说明：ZFP-hLF蛋白质能成功在体外重组表达，并可以获得纯度较高的融合蛋白。

为了纯化方便，ZFP-hLF在结构域N端添加了His标签。

His标签的氨基酸序列如SEQ ID NO.1所示，具体为：HHHHHH。

带有His标签的ZFP1-hLF蛋白质的氨基酸序列如SEQ ID NO.6所示，具体为：MHHHHHHPKKKRKVEKPYKCPECGKSFSASAALVAHQRTHTGGSGGSGGSGGSMKLVFLVLLFLGALGLCLAGRRRRSVQWCTVSQPEATKCFQWQRNMRRVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFPNLCRLCAGTGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAERDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARSVNGKEDAIWNLLRQAQEKFGKDKSPKFQLFGSPSGQKDLLFKDSAIGFSRVPPRIDSGLYLGSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWSGLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVYTAGKCGLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRRSDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLLFNQTGSCKFDEYFSQSCAPGSDPRSNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMDKVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSETKNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNLKKCSTSPLLEACEFLRK

带有His标签的ZFP2-hLF蛋白质的氨基酸序列如SEQ ID NO.15所示。

带有His标签的ZFP2-hLF蛋白质的氨基酸序列如SEQ ID NO.19所示。

11、浓缩蛋白质，在液氮中快速冷冻并储存在-70℃低温冰箱。

(三)ZFP-hLF蛋白质转导

1、在含有5％CO₂的完全湿化的环境中，37℃温度下用补充有10％(v/v)FBS，100U/mL青霉素和100U/mL链霉素的DMEM培养基培养HIEC-6细胞。

2、在25℃下预先用50μg/mL聚赖氨酸500μL预涂24-60孔板30至60分钟。HIEC-6细胞以每孔2×10⁵个细胞的密度铺在预涂板上。

3、接种24小时后，从各孔中弃去培养基，用500μL预热的无血清DMEM洗涤。

4、每孔加入250μL含1μM nZFP-hLF蛋白质的SFM。37℃共孵育90min。

5、从各孔中弃去培养基，用500μL含0.5mg/mL肝素的PBS洗涤三次。

6、使用细胞刮板收取细胞，加入足量的1×loading buffer，置于98℃金属浴中，充分裂解。

7、Western blotting分析转导效率，结果如图2所示，ZFP-hLF蛋白质可以穿过细胞膜进入HIEC-6细胞内，而无ZFP连接的乳铁蛋白则不能进入细胞。

(四)ZFP-hLF蛋白质的抑菌活性

1、选用Escherichia coli DH-5α和Klebsiella variicola IV-3为乳铁蛋白抑菌能力分析的菌株。

2、菌种先接种于LB固体平板上,37℃过夜培养,挑选单菌落接种于LB液体培养基中,37℃过夜培养，用无菌水稀释至其密度为10⁵-10⁶CFU/mL的菌悬液。

3、20μL菌悬液，0.5mg/mL乳铁蛋白或CW-15藻株蛋白，加至LB液体培养基中,总体积为10ml，37℃振荡培养(180r/min)。

4、分别于0h,2h,4h,6h,8h,10h,12h,14h取样，测定其A₆₀₀值。分析菌种的生长趋势以判断乳铁蛋白的抑菌能力。结果如图3所示，ZFP-hLF蛋白具有抑菌活性。

(五)ZFP-hLF蛋白质的抗氧化活性

对DPPH自由基和羟基自由基的清除实验方法分别如下：

1、DPPH自由基清除能力检测

1.1分别将1.5mL不同浓度的锌指蛋白-人乳铁蛋白依次加入3mL 0.1mmol/L DPPH的乙醇溶液，记为Ai；

1.2将1.5mL不同浓度的锌指蛋白-人乳铁蛋白依次加入3mL乙醇溶液、1.5mL试样，记为Aj；

1.3 3mL 0.1mmol/L DPPH的乙醇溶液和1.5mL蒸馏水均匀混合，记为A0；

1.4均置于37℃水浴30min，测定混合溶液的A₅₂₅值。清除率(％)＝[1-(Ai-Aj)/A0]×100％。结果如图4a所示，ZFP-hLF蛋白具有DPPH自由基清除能力。

2、羟基自由基清除能力检测

2.1分别将2mL不同浓度的锌指蛋白-人乳铁蛋白中依次加入2mL 6mmol/L H₂O₂和6mmol/L水杨酸，摇匀，室温静置15min；再加入6mmol/L FeSO₄，记为Ai。

2.2将2mL不同浓度的锌指蛋白-人乳铁蛋白中依次加入2mL 6mmol/L H₂O₂和等体积蒸馏水，摇匀，室温静置15min；再加入6mmol/L FeSO₄，记为Aj；

2.3将2mL蒸馏水中依次加入2mL 6mmol/L H₂O₂和6mmol/L水杨酸，摇匀，室温静置15min；再加入6mmol/L FeSO₄，记为A0；

2.4测定混合溶液的A₅₁₀值。清除率(％)＝[1-(Ai-Aj)/A0]×100％。结果如图4b所示，ZFP-hLF蛋白具有羟基自由基清除能力。

以上所述，仅为本发明的较佳实施例，并非对本发明任何形式上和实质上的限制，应当指出，对于本技术领域的普通技术人员，在不脱离本发明方法的前提下，还将可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员，在不脱离本发明的精神和范围的情况下，当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化，均为本发明的等效实施例；同时，凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变，均仍属于本发明的技术方案的范围内。

序列表

<110> 上海科技大学

<120> 一种具有细胞穿膜性的锌指蛋白-人乳铁蛋白融合蛋白质及其制备与应用

<160> 20

<170> SIPOSequenceListing 1.0

<210> 1

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

His His His His His His

1 5

<210> 2

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser

1 5 10 15

Ala Ala Leu Val Ala His Gln Arg Thr His Thr

20 25

<210> 3

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser

1 5 10

<210> 4

<211> 711

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 4

Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu

1 5 10 15

Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser

20 25 30

Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg

35 40 45

Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln

50 55 60

Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp

65 70 75 80

Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro

85 90 95

Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr

100 105 110

Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu

115 120 125

Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly

130 135 140

Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly

145 150 155 160

Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser

165 170 175

Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu

180 185 190

Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro

195 200 205

Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly

210 215 220

Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp

225 230 235 240

Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg

245 250 255

Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser

260 265 270

His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp

275 280 285

Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro

290 295 300

Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe

305 310 315 320

Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser

325 330 335

Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg

340 345 350

Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys

355 360 365

Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu

370 375 380

Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys

385 390 395 400

Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly

405 410 415

Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala

420 425 430

Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val

435 440 445

Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser

450 455 460

Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His

465 470 475 480

Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu

485 490 495

Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser

500 505 510

Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile

515 520 525

Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg

530 535 540

Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly

545 550 555 560

Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly

565 570 575

Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala

580 585 590

Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser

595 600 605

Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp

610 615 620

Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe

625 630 635 640

Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser

645 650 655

Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg

660 665 670

Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val

675 680 685

Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu

690 695 700

Ala Cys Glu Phe Leu Arg Lys

705 710

<210> 5

<211> 750

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 5

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser

1 5 10 15

Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Gly Ser Gly Gly

20 25 30

Ser Gly Gly Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu

35 40 45

Phe Leu Gly Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser

50 55 60

Val Gln Trp Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln

65 70 75 80

Trp Gln Arg Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile

85 90 95

Lys Arg Asp Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg

100 105 110

Ala Asp Ala Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu

115 120 125

Ala Pro Tyr Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu

130 135 140

Arg Gln Pro Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly

145 150 155 160

Gly Ser Phe Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr

165 170 175

Gly Leu Arg Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg

180 185 190

Pro Phe Leu Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val

195 200 205

Ala Arg Phe Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln

210 215 220

Phe Pro Asn Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys

225 230 235 240

Ala Phe Ser Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys

245 250 255

Cys Leu Arg Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr

260 265 270

Val Phe Glu Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu

275 280 285

Leu Cys Pro Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys

290 295 300

His Leu Ala Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn

305 310 315 320

Gly Lys Glu Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys

325 330 335

Phe Gly Lys Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser

340 345 350

Gly Gln Lys Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg

355 360 365

Val Pro Pro Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe

370 375 380

Thr Ala Ile Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg

385 390 395 400

Arg Ala Arg Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys

405 410 415

Cys Asn Gln Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser

420 425 430

Ala Ser Thr Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala

435 440 445

Asp Ala Met Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys

450 455 460

Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser

465 470 475 480

Asp Pro Asp Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala

485 490 495

Val Ala Val Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val

500 505 510

Lys Gly Lys Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp

515 520 525

Asn Ile Pro Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe

530 535 540

Asp Glu Tyr Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser

545 550 555 560

Asn Leu Cys Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys

565 570 575

Val Pro Asn Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg

580 585 590

Cys Leu Ala Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr

595 600 605

Val Leu Gln Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp

610 615 620

Leu Lys Leu Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys

625 630 635 640

Pro Val Thr Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His

645 650 655

Ala Val Val Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu

660 665 670

Leu His Gln Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp

675 680 685

Lys Phe Cys Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp

690 695 700

Asn Thr Glu Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys

705 710 715 720

Tyr Leu Gly Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys

725 730 735

Ser Thr Ser Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys

740 745 750

<210> 6

<211> 765

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys

1 5 10 15

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala

20 25 30

Leu Val Ala His Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser

35 40 45

Gly Gly Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe

50 55 60

Leu Gly Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val

65 70 75 80

Gln Trp Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp

85 90 95

Gln Arg Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys

100 105 110

Arg Asp Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala

115 120 125

Asp Ala Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala

130 135 140

Pro Tyr Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg

145 150 155 160

Gln Pro Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly

165 170 175

Ser Phe Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly

180 185 190

Leu Arg Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro

195 200 205

Phe Leu Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala

210 215 220

Arg Phe Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe

225 230 235 240

Pro Asn Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala

245 250 255

Phe Ser Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys

260 265 270

Leu Arg Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val

275 280 285

Phe Glu Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu

290 295 300

Cys Pro Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His

305 310 315 320

Leu Ala Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly

325 330 335

Lys Glu Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe

340 345 350

Gly Lys Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly

355 360 365

Gln Lys Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val

370 375 380

Pro Pro Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr

385 390 395 400

Ala Ile Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg

405 410 415

Ala Arg Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys

420 425 430

Asn Gln Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala

435 440 445

Ser Thr Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp

450 455 460

Ala Met Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly

465 470 475 480

Leu Val Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp

485 490 495

Pro Asp Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val

500 505 510

Ala Val Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys

515 520 525

Gly Lys Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn

530 535 540

Ile Pro Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp

545 550 555 560

Glu Tyr Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn

565 570 575

Leu Cys Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val

580 585 590

Pro Asn Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys

595 600 605

Leu Ala Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val

610 615 620

Leu Gln Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu

625 630 635 640

Lys Leu Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro

645 650 655

Val Thr Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala

660 665 670

Val Val Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu

675 680 685

His Gln Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys

690 695 700

Phe Cys Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn

705 710 715 720

Thr Glu Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr

725 730 735

Leu Gly Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser

740 745 750

Thr Ser Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys

755 760 765

<210> 7

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

catcatcatc atcatcac 18

<210> 8

<211> 84

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60

gcgcaccagc gcacccacac cggc 84

<210> 9

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ggtggatccg gtggatccgg tggatccggt ggatcc 36

<210> 10

<211> 2136

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

atgaaacttg tcttcctcgt cctgctgttc ctcggggccc tcggactgtg tctggctggc 60

cgtaggagaa ggagtgttca gtggtgcacc gtatcccaac ccgaggccac aaaatgcttc 120

caatggcaaa ggaatatgag aagagtgcgt ggccctcctg tcagctgcat aaagagagac 180

tcccccatcc agtgtatcca ggccattgcg gaaaacaggg ccgatgctgt gacccttgat 240

ggtggtttca tatacgaggc aggcctggcc ccctacaaac tgcgacctgt agcggcggaa 300

gtctacggga ccgaaagaca gccacgaact cactattatg ccgtggctgt ggtgaagaag 360

ggcggcagct ttcagctgaa cgaactgcaa ggtctgaagt cctgccacac aggccttcgc 420

aggaccgctg gatggaatgt gcctataggg acacttcgtc cattcttgaa ttggacgggt 480

ccacctgagc ccattgaggc agctgtggcc aggttcttct cagccagctg tgttcccggt 540

gcagataaag gacagttccc caacctgtgt cgcctgtgtg cggggacagg ggaaaacaaa 600

tgtgccttct cctcccagga accgtacttc agctactctg gtgccttcaa gtgtctgaga 660

gacggggctg gagacgtggc ttttatcaga gagagcacag tgtttgagga cctgtcagac 720

gaggctgaaa gggacgagta tgagttactc tgcccagaca acactcggaa gccagtggac 780

aagttcaaag actgccatct ggcccgggtc ccttctcatg ccgttgtggc acgaagtgtg 840

aatggcaagg aggatgccat ctggaatctt ctccgccagg cacaggaaaa gtttggaaag 900

gacaagtcac cgaaattcca gctctttggc tcccctagtg ggcagaaaga tctgctgttc 960

aaggactctg ccattgggtt ttcgagggtg cccccgagga tagattctgg gctgtacctt 1020

ggctccggct acttcactgc catccagaac ttgaggaaaa gtgaggagga agtggctgcc 1080

cggcgtgcgc gggtcgtgtg gtgtgcggtg ggcgagcagg agctgcgcaa gtgtaaccag 1140

tggagtggct tgagcgaagg cagcgtgacc tgctcctcgg cctccaccac agaggactgc 1200

atcgccctgg tgctgaaagg agaagctgat gccatgagtt tggatggagg atatgtgtac 1260

actgcaggca aatgtggttt ggtgcctgtc ctggcagaga actacaaatc ccaacaaagc 1320

agtgaccctg atcctaactg tgtggataga cctgtggaag gatatcttgc tgtggcggtg 1380

gttaggagat cagacactag ccttacctgg aactctgtga aaggcaagaa gtcctgccac 1440

accgccgtgg acaggactgc aggctggaat atccccatgg gcctgctctt caaccagacg 1500

ggctcctgca aatttgatga atatttcagt caaagctgtg cccctgggtc tgacccgaga 1560

tctaatctct gtgctctgtg tattggcgac gagcagggtg agaataagtg cgtgcccaac 1620

agcaatgaga gatactacgg ctacactggg gctttccggt gcctggctga gaatgctgga 1680

gacgttgcat ttgtgaaaga tgtcactgtc ttgcagaaca ctgatggaaa taacaatgag 1740

gcatgggcta aggatttgaa gctggcagac tttgcgctgc tgtgcctcga tggcaaacgg 1800

aagcctgtga ctgaggctag aagctgccat cttgccatgg ccccgaatca tgccgtggtg 1860

tctcggatgg ataaggtgga acgcctgaaa caggtgctgc tccaccaaca ggctaaattt 1920

gggagaaatg gatctgactg cccggacaag ttttgcttat tccagtctga aaccaaaaac 1980

cttctgttca atgacaacac tgagtgtctg gccagactcc atggcaaaac aacatatgaa 2040

aaatatttgg gaccacagta tgtcgcaggc attactaatc tgaaaaagtg ctcaacctcc 2100

cccctcctgg aagcctgtga attcctcagg aagtaa 2136

<210> 11

<211> 2253

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60

gcgcaccagc gcacccacac cggcggtgga tccggtggat ccggtggatc cggtggatcc 120

aaacttgtct tcctcgtcct gctgttcctc ggggccctcg gactgtgtct ggctggccgt 180

aggagaagga gtgttcagtg gtgcaccgta tcccaacccg aggccacaaa atgcttccaa 240

tggcaaagga atatgagaag agtgcgtggc cctcctgtca gctgcataaa gagagactcc 300

cccatccagt gtatccaggc cattgcggaa aacagggccg atgctgtgac ccttgatggt 360

ggtttcatat acgaggcagg cctggccccc tacaaactgc gacctgtagc ggcggaagtc 420

tacgggaccg aaagacagcc acgaactcac tattatgccg tggctgtggt gaagaagggc 480

ggcagctttc agctgaacga actgcaaggt ctgaagtcct gccacacagg ccttcgcagg 540

accgctggat ggaatgtgcc tatagggaca cttcgtccat tcttgaattg gacgggtcca 600

cctgagccca ttgaggcagc tgtggccagg ttcttctcag ccagctgtgt tcccggtgca 660

gataaaggac agttccccaa cctgtgtcgc ctgtgtgcgg ggacagggga aaacaaatgt 720

gccttctcct cccaggaacc gtacttcagc tactctggtg ccttcaagtg tctgagagac 780

ggggctggag acgtggcttt tatcagagag agcacagtgt ttgaggacct gtcagacgag 840

gctgaaaggg acgagtatga gttactctgc ccagacaaca ctcggaagcc agtggacaag 900

ttcaaagact gccatctggc ccgggtccct tctcatgccg ttgtggcacg aagtgtgaat 960

ggcaaggagg atgccatctg gaatcttctc cgccaggcac aggaaaagtt tggaaaggac 1020

aagtcaccga aattccagct ctttggctcc cctagtgggc agaaagatct gctgttcaag 1080

gactctgcca ttgggttttc gagggtgccc ccgaggatag attctgggct gtaccttggc 1140

tccggctact tcactgccat ccagaacttg aggaaaagtg aggaggaagt ggctgcccgg 1200

cgtgcgcggg tcgtgtggtg tgcggtgggc gagcaggagc tgcgcaagtg taaccagtgg 1260

agtggcttga gcgaaggcag cgtgacctgc tcctcggcct ccaccacaga ggactgcatc 1320

gccctggtgc tgaaaggaga agctgatgcc atgagtttgg atggaggata tgtgtacact 1380

gcaggcaaat gtggtttggt gcctgtcctg gcagagaact acaaatccca acaaagcagt 1440

gaccctgatc ctaactgtgt ggatagacct gtggaaggat atcttgctgt ggcggtggtt 1500

aggagatcag acactagcct tacctggaac tctgtgaaag gcaagaagtc ctgccacacc 1560

gccgtggaca ggactgcagg ctggaatatc cccatgggcc tgctcttcaa ccagacgggc 1620

tcctgcaaat ttgatgaata tttcagtcaa agctgtgccc ctgggtctga cccgagatct 1680

aatctctgtg ctctgtgtat tggcgacgag cagggtgaga ataagtgcgt gcccaacagc 1740

aatgagagat actacggcta cactggggct ttccggtgcc tggctgagaa tgctggagac 1800

gttgcatttg tgaaagatgt cactgtcttg cagaacactg atggaaataa caatgaggca 1860

tgggctaagg atttgaagct ggcagacttt gcgctgctgt gcctcgatgg caaacggaag 1920

cctgtgactg aggctagaag ctgccatctt gccatggccc cgaatcatgc cgtggtgtct 1980

cggatggata aggtggaacg cctgaaacag gtgctgctcc accaacaggc taaatttggg 2040

agaaatggat ctgactgccc ggacaagttt tgcttattcc agtctgaaac caaaaacctt 2100

ctgttcaatg acaacactga gtgtctggcc agactccatg gcaaaacaac atatgaaaaa 2160

tatttgggac cacagtatgt cgcaggcatt actaatctga aaaagtgctc aacctccccc 2220

ctcctggaag cctgtgaatt cctcaggaag taa 2253

<210> 12

<211> 2274

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atgcatcatc atcatcatca cgagaagccg tacaagtgcc cggagtgcgg caagagcttc 60

agcgccagcg ccgccctggt ggcgcaccag cgcacccaca ccggcggtgg atccggtgga 120

tccggtggat ccggtggatc caaacttgtc ttcctcgtcc tgctgttcct cggggccctc 180

ggactgtgtc tggctggccg taggagaagg agtgttcagt ggtgcaccgt atcccaaccc 240

gaggccacaa aatgcttcca atggcaaagg aatatgagaa gagtgcgtgg ccctcctgtc 300

agctgcataa agagagactc ccccatccag tgtatccagg ccattgcgga aaacagggcc 360

gatgctgtga cccttgatgg tggtttcata tacgaggcag gcctggcccc ctacaaactg 420

cgacctgtag cggcggaagt ctacgggacc gaaagacagc cacgaactca ctattatgcc 480

gtggctgtgg tgaagaaggg cggcagcttt cagctgaacg aactgcaagg tctgaagtcc 540

tgccacacag gccttcgcag gaccgctgga tggaatgtgc ctatagggac acttcgtcca 600

ttcttgaatt ggacgggtcc acctgagccc attgaggcag ctgtggccag gttcttctca 660

gccagctgtg ttcccggtgc agataaagga cagttcccca acctgtgtcg cctgtgtgcg 720

gggacagggg aaaacaaatg tgccttctcc tcccaggaac cgtacttcag ctactctggt 780

gccttcaagt gtctgagaga cggggctgga gacgtggctt ttatcagaga gagcacagtg 840

tttgaggacc tgtcagacga ggctgaaagg gacgagtatg agttactctg cccagacaac 900

actcggaagc cagtggacaa gttcaaagac tgccatctgg cccgggtccc ttctcatgcc 960

gttgtggcac gaagtgtgaa tggcaaggag gatgccatct ggaatcttct ccgccaggca 1020

caggaaaagt ttggaaagga caagtcaccg aaattccagc tctttggctc ccctagtggg 1080

cagaaagatc tgctgttcaa ggactctgcc attgggtttt cgagggtgcc cccgaggata 1140

gattctgggc tgtaccttgg ctccggctac ttcactgcca tccagaactt gaggaaaagt 1200

gaggaggaag tggctgcccg gcgtgcgcgg gtcgtgtggt gtgcggtggg cgagcaggag 1260

ctgcgcaagt gtaaccagtg gagtggcttg agcgaaggca gcgtgacctg ctcctcggcc 1320

tccaccacag aggactgcat cgccctggtg ctgaaaggag aagctgatgc catgagtttg 1380

gatggaggat atgtgtacac tgcaggcaaa tgtggtttgg tgcctgtcct ggcagagaac 1440

tacaaatccc aacaaagcag tgaccctgat cctaactgtg tggatagacc tgtggaagga 1500

tatcttgctg tggcggtggt taggagatca gacactagcc ttacctggaa ctctgtgaaa 1560

ggcaagaagt cctgccacac cgccgtggac aggactgcag gctggaatat ccccatgggc 1620

ctgctcttca accagacggg ctcctgcaaa tttgatgaat atttcagtca aagctgtgcc 1680

cctgggtctg acccgagatc taatctctgt gctctgtgta ttggcgacga gcagggtgag 1740

aataagtgcg tgcccaacag caatgagaga tactacggct acactggggc tttccggtgc 1800

ctggctgaga atgctggaga cgttgcattt gtgaaagatg tcactgtctt gcagaacact 1860

gatggaaata acaatgaggc atgggctaag gatttgaagc tggcagactt tgcgctgctg 1920

tgcctcgatg gcaaacggaa gcctgtgact gaggctagaa gctgccatct tgccatggcc 1980

ccgaatcatg ccgtggtgtc tcggatggat aaggtggaac gcctgaaaca ggtgctgctc 2040

caccaacagg ctaaatttgg gagaaatgga tctgactgcc cggacaagtt ttgcttattc 2100

cagtctgaaa ccaaaaacct tctgttcaat gacaacactg agtgtctggc cagactccat 2160

ggcaaaacaa catatgaaaa atatttggga ccacagtatg tcgcaggcat tactaatctg 2220

aaaaagtgct caacctcccc cctcctggaa gcctgtgaat tcctcaggaa gtaa 2274

<210> 13

<211> 779

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 13

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser

1 5 10 15

Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

20 25 30

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val

35 40 45

Ala His Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly

50 55 60

Ser Gly Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly

65 70 75 80

Ala Leu Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp

85 90 95

Cys Thr Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg

100 105 110

Asn Met Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp

115 120 125

Ser Pro Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala

130 135 140

Val Thr Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr

145 150 155 160

Lys Leu Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro

165 170 175

Arg Thr His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe

180 185 190

Gln Leu Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg

195 200 205

Arg Thr Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu

210 215 220

Asn Trp Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe

225 230 235 240

Phe Ser Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn

245 250 255

Leu Cys Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser

260 265 270

Ser Gln Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg

275 280 285

Asp Gly Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu

290 295 300

Asp Leu Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro

305 310 315 320

Asp Asn Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala

325 330 335

Arg Val Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu

340 345 350

Asp Ala Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys

355 360 365

Asp Lys Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys

370 375 380

Asp Leu Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro

385 390 395 400

Arg Ile Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile

405 410 415

Gln Asn Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg

420 425 430

Val Val Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln

435 440 445

Trp Ser Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr

450 455 460

Thr Glu Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met

465 470 475 480

Ser Leu Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val

485 490 495

Pro Val Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp

500 505 510

Pro Asn Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val

515 520 525

Val Arg Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys

530 535 540

Lys Ser Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro

545 550 555 560

Met Gly Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr

565 570 575

Phe Ser Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys

580 585 590

Ala Leu Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn

595 600 605

Ser Asn Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala

610 615 620

Glu Asn Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln

625 630 635 640

Asn Thr Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu

645 650 655

Ala Asp Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr

660 665 670

Glu Ala Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala Val Val

675 680 685

Ser Arg Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln

690 695 700

Gln Ala Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys

705 710 715 720

Leu Phe Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu

725 730 735

Cys Leu Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly

740 745 750

Pro Gln Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser

755 760 765

Pro Leu Leu Glu Ala Cys Glu Phe Leu Arg Lys

770 775

<210> 14

<211> 2340

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60

gcgcaccagc gcacccacac cggcgagaag ccgtacaagt gcccggagtg cggcaagagc 120

ttcagcgcca gcgccgccct ggtggcgcac cagcgcaccc acaccggcgg cggctccggc 180

ggctccggcg gctccggcgg atccatgaag ctggtgttcc tggtgctgct gttcctgggc 240

gccctgggcc tgtgcctggc gggccggcgc cgccgcagcg tgcagtggtg caccgtgtcc 300

cagccggagg ccaccaagtg cttccagtgg cagcgcaaca tgcgccgcgt gcgcggcccg 360

ccggtgtcct gcatcaagcg cgacagcccg atccagtgca tccaggcgat cgcggagaac 420

cgcgccgacg ccgtgaccct ggacggcggc ttcatctacg aggcgggcct ggccccgtac 480

aagctgcgcc cggtggccgc cgaggtgtac ggcaccgagc gccagccgcg cacccactac 540

tacgccgtgg ccgtcgtgaa gaagggcggc agcttccagc tgaacgagct gcagggcctg 600

aagtcctgcc acaccggcct gcgccgcacc gccggctgga acgtgccgat cggcaccctg 660

cgcccgttcc tgaactggac cggcccgccg gagccgatcg aggccgccgt ggcgcgcttc 720

ttcagcgcca gctgcgtgcc gggcgccgac aagggccagt tcccgaacct gtgccgcctg 780

tgcgccggca ccggcgagaa caagtgcgcc ttcagcagcc aggagccgta cttcagctac 840

agcggcgcct tcaagtgcct gcgcgacggc gcgggcgacg tggccttcat ccgcgagagc 900

accgtgttcg aggacctgag cgacgaggcc gagcgcgacg agtacgagct gctgtgcccg 960

gacaacaccc gcaagccggt ggacaagttc aaggactgcc acctggcccg cgtgccgagc 1020

cacgccgtgg tggcccgctc cgtgaacggc aaggaggacg ccatctggaa cctgctgcgc 1080

caggcccagg agaagttcgg caaggacaag agcccgaagt tccagctgtt cggcagcccg 1140

agcggccaga aggacctgct gttcaaggac agcgccatcg gcttcagccg cgtgccgccg 1200

cgcatcgaca gcggcctgta cctgggcagc ggctacttca ccgccatcca gaacctgcgc 1260

aagagcgagg aggaggtggc cgcccgccgc gcccgcgtcg tgtggtgcgc cgtgggcgag 1320

caggagctgc gcaagtgcaa ccagtggagc ggcctgagcg agggcagcgt gacctgctcc 1380

agcgcctcca ccaccgagga ctgcatcgcg ctggtgctga agggcgaggc cgacgccatg 1440

tcgctggacg gcggctacgt gtacaccgcc ggcaagtgcg gcctggtgcc ggtgctggcc 1500

gagaactaca agagccagca gagcagcgac ccggacccga actgcgtgga ccgcccggtg 1560

gagggctacc tggccgtggc cgtcgtgcgc cgcagcgaca ccagcctgac ctggaacagc 1620

gtgaagggca agaagtcgtg ccacaccgcc gtggaccgca ccgcgggctg gaacatcccg 1680

atgggcctgc tgttcaacca gaccggcagc tgcaagttcg acgagtactt cagccagtcc 1740

tgcgccccgg gctccgaccc gcgctcgaac ctgtgcgccc tgtgcatcgg cgacgagcag 1800

ggcgagaaca agtgcgtgcc gaacagcaac gagcgctact acggctacac cggcgcgttc 1860

cgctgcctgg cggagaacgc cggcgacgtg gcgttcgtga aggacgtgac cgtgctgcag 1920

aacaccgacg gcaacaacaa cgaggcctgg gccaaggacc tgaagctggc cgacttcgcg 1980

ctgctgtgcc tggacggcaa gcgcaagccg gtgaccgagg cccgcagctg ccacctggcg 2040

atggccccga accacgcggt ggtgtcgcgc atggacaagg tggagcgcct gaagcaggtg 2100

ctgctgcacc agcaggccaa gttcggccgc aacggcagcg actgcccgga caagttctgc 2160

ctgttccaga gcgagaccaa gaacctgctg ttcaacgaca acaccgagtg cctggcccgc 2220

ctgcacggca agaccaccta cgagaagtac ctgggcccgc agtacgtggc cggcatcacc 2280

aacctgaaga agtgcagcac ctcgccgctg ctggaggcct gcgagttcct gcgcaagtaa 2340

<210> 15

<211> 793

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 15

Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys

1 5 10 15

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala

20 25 30

Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys

35 40 45

Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His

50 55 60

Gln Arg Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

65 70 75 80

Gly Ser Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu

85 90 95

Gly Leu Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr

100 105 110

Val Ser Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met

115 120 125

Arg Arg Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro

130 135 140

Ile Gln Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr

145 150 155 160

Leu Asp Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu

165 170 175

Arg Pro Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr

180 185 190

His Tyr Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu

195 200 205

Asn Glu Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr

210 215 220

Ala Gly Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp

225 230 235 240

Thr Gly Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser

245 250 255

Ala Ser Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys

260 265 270

Arg Leu Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln

275 280 285

Glu Pro Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly

290 295 300

Ala Gly Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu

305 310 315 320

Ser Asp Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn

325 330 335

Thr Arg Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val

340 345 350

Pro Ser His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala

355 360 365

Ile Trp Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys

370 375 380

Ser Pro Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu

385 390 395 400

Leu Phe Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile

405 410 415

Asp Ser Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn

420 425 430

Leu Arg Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val

435 440 445

Trp Cys Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser

450 455 460

Gly Leu Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu

465 470 475 480

Asp Cys Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu

485 490 495

Asp Gly Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val

500 505 510

Leu Ala Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn

515 520 525

Cys Val Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg

530 535 540

Arg Ser Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser

545 550 555 560

Cys His Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly

565 570 575

Leu Leu Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser

580 585 590

Gln Ser Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu

595 600 605

Cys Ile Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn

610 615 620

Glu Arg Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn

625 630 635 640

Ala Gly Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr

645 650 655

Asp Gly Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp

660 665 670

Phe Ala Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala

675 680 685

Arg Ser Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg

690 695 700

Met Asp Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala

705 710 715 720

Lys Phe Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe

725 730 735

Gln Ser Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu

740 745 750

Ala Arg Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln

755 760 765

Tyr Val Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu

770 775 780

Leu Glu Ala Cys Glu Phe Leu Arg Lys

785 790

<210> 16

<211> 2382

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

atgcaccacc accaccacca cccgaagaag aagcgcaagg tcgagaagcc gtacaagtgc 60

ccggagtgcg gcaagagctt cagcgccagc gccgccctgg tggcgcacca gcgcacccac 120

accggcgaga agccgtacaa gtgcccggag tgcggcaaga gcttcagcgc cagcgccgcc 180

ctggtggcgc accagcgcac ccacaccggc ggcggctccg gcggctccgg cggctccggc 240

ggatccatga agctggtgtt cctggtgctg ctgttcctgg gcgccctggg cctgtgcctg 300

gcgggccggc gccgccgcag cgtgcagtgg tgcaccgtgt cccagccgga ggccaccaag 360

tgcttccagt ggcagcgcaa catgcgccgc gtgcgcggcc cgccggtgtc ctgcatcaag 420

cgcgacagcc cgatccagtg catccaggcg atcgcggaga accgcgccga cgccgtgacc 480

ctggacggcg gcttcatcta cgaggcgggc ctggccccgt acaagctgcg cccggtggcc 540

gccgaggtgt acggcaccga gcgccagccg cgcacccact actacgccgt ggccgtcgtg 600

aagaagggcg gcagcttcca gctgaacgag ctgcagggcc tgaagtcctg ccacaccggc 660

ctgcgccgca ccgccggctg gaacgtgccg atcggcaccc tgcgcccgtt cctgaactgg 720

accggcccgc cggagccgat cgaggccgcc gtggcgcgct tcttcagcgc cagctgcgtg 780

ccgggcgccg acaagggcca gttcccgaac ctgtgccgcc tgtgcgccgg caccggcgag 840

aacaagtgcg ccttcagcag ccaggagccg tacttcagct acagcggcgc cttcaagtgc 900

ctgcgcgacg gcgcgggcga cgtggccttc atccgcgaga gcaccgtgtt cgaggacctg 960

agcgacgagg ccgagcgcga cgagtacgag ctgctgtgcc cggacaacac ccgcaagccg 1020

gtggacaagt tcaaggactg ccacctggcc cgcgtgccga gccacgccgt ggtggcccgc 1080

tccgtgaacg gcaaggagga cgccatctgg aacctgctgc gccaggccca ggagaagttc 1140

ggcaaggaca agagcccgaa gttccagctg ttcggcagcc cgagcggcca gaaggacctg 1200

ctgttcaagg acagcgccat cggcttcagc cgcgtgccgc cgcgcatcga cagcggcctg 1260

tacctgggca gcggctactt caccgccatc cagaacctgc gcaagagcga ggaggaggtg 1320

gccgcccgcc gcgcccgcgt cgtgtggtgc gccgtgggcg agcaggagct gcgcaagtgc 1380

aaccagtgga gcggcctgag cgagggcagc gtgacctgct ccagcgcctc caccaccgag 1440

gactgcatcg cgctggtgct gaagggcgag gccgacgcca tgtcgctgga cggcggctac 1500

gtgtacaccg ccggcaagtg cggcctggtg ccggtgctgg ccgagaacta caagagccag 1560

cagagcagcg acccggaccc gaactgcgtg gaccgcccgg tggagggcta cctggccgtg 1620

gccgtcgtgc gccgcagcga caccagcctg acctggaaca gcgtgaaggg caagaagtcg 1680

tgccacaccg ccgtggaccg caccgcgggc tggaacatcc cgatgggcct gctgttcaac 1740

cagaccggca gctgcaagtt cgacgagtac ttcagccagt cctgcgcccc gggctccgac 1800

ccgcgctcga acctgtgcgc cctgtgcatc ggcgacgagc agggcgagaa caagtgcgtg 1860

ccgaacagca acgagcgcta ctacggctac accggcgcgt tccgctgcct ggcggagaac 1920

gccggcgacg tggcgttcgt gaaggacgtg accgtgctgc agaacaccga cggcaacaac 1980

aacgaggcct gggccaagga cctgaagctg gccgacttcg cgctgctgtg cctggacggc 2040

aagcgcaagc cggtgaccga ggcccgcagc tgccacctgg cgatggcccc gaaccacgcg 2100

gtggtgtcgc gcatggacaa ggtggagcgc ctgaagcagg tgctgctgca ccagcaggcc 2160

aagttcggcc gcaacggcag cgactgcccg gacaagttct gcctgttcca gagcgagacc 2220

aagaacctgc tgttcaacga caacaccgag tgcctggccc gcctgcacgg caagaccacc 2280

tacgagaagt acctgggccc gcagtacgtg gccggcatca ccaacctgaa gaagtgcagc 2340

acctcgccgc tgctggaggc ctgcgagttc ctgcgcaagt aa 2382

<210> 17

<211> 807

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 17

Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser

1 5 10 15

Ala Ala Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr

20 25 30

Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val

35 40 45

Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu

50 55 60

Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His Gln Arg

65 70 75 80

Thr His Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser

85 90 95

Met Lys Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu

100 105 110

Cys Leu Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser

115 120 125

Gln Pro Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg

130 135 140

Val Arg Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln

145 150 155 160

Cys Ile Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp

165 170 175

Gly Gly Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro

180 185 190

Val Ala Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr

195 200 205

Tyr Ala Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu

210 215 220

Leu Gln Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly

225 230 235 240

Trp Asn Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly

245 250 255

Pro Pro Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser

260 265 270

Cys Val Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu

275 280 285

Cys Ala Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro

290 295 300

Tyr Phe Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly

305 310 315 320

Asp Val Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp

325 330 335

Glu Ala Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg

340 345 350

Lys Pro Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser

355 360 365

His Ala Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp

370 375 380

Asn Leu Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro

385 390 395 400

Lys Phe Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe

405 410 415

Lys Asp Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser

420 425 430

Gly Leu Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg

435 440 445

Lys Ser Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys

450 455 460

Ala Val Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu

465 470 475 480

Ser Glu Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys

485 490 495

Ile Ala Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly

500 505 510

Gly Tyr Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala

515 520 525

Glu Asn Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val

530 535 540

Asp Arg Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser

545 550 555 560

Asp Thr Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His

565 570 575

Thr Ala Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu

580 585 590

Phe Asn Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser

595 600 605

Cys Ala Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile

610 615 620

Gly Asp Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg

625 630 635 640

Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly

645 650 655

Asp Val Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly

660 665 670

Asn Asn Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala

675 680 685

Leu Leu Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser

690 695 700

Cys His Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp

705 710 715 720

Lys Val Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe

725 730 735

Gly Arg Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser

740 745 750

Glu Thr Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg

755 760 765

Leu His Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val

770 775 780

Ala Gly Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu

785 790 795 800

Ala Cys Glu Phe Leu Arg Lys

805

<210> 18

<211> 2424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

gagaagccgt acaagtgccc ggagtgcggc aagagcttca gcgccagcgc cgccctggtg 60

gcgcaccagc gcacccacac cggcgagaag ccgtacaagt gcccggagtg cggcaagagc 120

ttcagcgcca gcgccgccct ggtggcgcac cagcgcaccc acaccggcga gaagccgtac 180

aagtgcccgg agtgcggcaa gagcttcagc gccagcgccg ccctggtggc gcaccagcgc 240

acccacaccg gcggcggctc cggcggctcc ggcggctccg gcggatccat gaagctggtg 300

ttcctggtgc tgctgttcct gggcgccctg ggcctgtgcc tggcgggccg gcgccgccgc 360

agcgtgcagt ggtgcaccgt gtcccagccg gaggccacca agtgcttcca gtggcagcgc 420

aacatgcgcc gcgtgcgcgg cccgccggtg tcctgcatca agcgcgacag cccgatccag 480

tgcatccagg cgatcgcgga gaaccgcgcc gacgccgtga ccctggacgg cggcttcatc 540

tacgaggcgg gcctggcccc gtacaagctg cgcccggtgg ccgccgaggt gtacggcacc 600

gagcgccagc cgcgcaccca ctactacgcc gtggccgtcg tgaagaaggg cggcagcttc 660

cagctgaacg agctgcaggg cctgaagtcc tgccacaccg gcctgcgccg caccgccggc 720

tggaacgtgc cgatcggcac cctgcgcccg ttcctgaact ggaccggccc gccggagccg 780

atcgaggccg ccgtggcgcg cttcttcagc gccagctgcg tgccgggcgc cgacaagggc 840

cagttcccga acctgtgccg cctgtgcgcc ggcaccggcg agaacaagtg cgccttcagc 900

agccaggagc cgtacttcag ctacagcggc gccttcaagt gcctgcgcga cggcgcgggc 960

gacgtggcct tcatccgcga gagcaccgtg ttcgaggacc tgagcgacga ggccgagcgc 1020

gacgagtacg agctgctgtg cccggacaac acccgcaagc cggtggacaa gttcaaggac 1080

tgccacctgg cccgcgtgcc gagccacgcc gtggtggccc gctccgtgaa cggcaaggag 1140

gacgccatct ggaacctgct gcgccaggcc caggagaagt tcggcaagga caagagcccg 1200

aagttccagc tgttcggcag cccgagcggc cagaaggacc tgctgttcaa ggacagcgcc 1260

atcggcttca gccgcgtgcc gccgcgcatc gacagcggcc tgtacctggg cagcggctac 1320

ttcaccgcca tccagaacct gcgcaagagc gaggaggagg tggccgcccg ccgcgcccgc 1380

gtcgtgtggt gcgccgtggg cgagcaggag ctgcgcaagt gcaaccagtg gagcggcctg 1440

agcgagggca gcgtgacctg ctccagcgcc tccaccaccg aggactgcat cgcgctggtg 1500

ctgaagggcg aggccgacgc catgtcgctg gacggcggct acgtgtacac cgccggcaag 1560

tgcggcctgg tgccggtgct ggccgagaac tacaagagcc agcagagcag cgacccggac 1620

ccgaactgcg tggaccgccc ggtggagggc tacctggccg tggccgtcgt gcgccgcagc 1680

gacaccagcc tgacctggaa cagcgtgaag ggcaagaagt cgtgccacac cgccgtggac 1740

cgcaccgcgg gctggaacat cccgatgggc ctgctgttca accagaccgg cagctgcaag 1800

ttcgacgagt acttcagcca gtcctgcgcc ccgggctccg acccgcgctc gaacctgtgc 1860

gccctgtgca tcggcgacga gcagggcgag aacaagtgcg tgccgaacag caacgagcgc 1920

tactacggct acaccggcgc gttccgctgc ctggcggaga acgccggcga cgtggcgttc 1980

gtgaaggacg tgaccgtgct gcagaacacc gacggcaaca acaacgaggc ctgggccaag 2040

gacctgaagc tggccgactt cgcgctgctg tgcctggacg gcaagcgcaa gccggtgacc 2100

gaggcccgca gctgccacct ggcgatggcc ccgaaccacg cggtggtgtc gcgcatggac 2160

aaggtggagc gcctgaagca ggtgctgctg caccagcagg ccaagttcgg ccgcaacggc 2220

agcgactgcc cggacaagtt ctgcctgttc cagagcgaga ccaagaacct gctgttcaac 2280

gacaacaccg agtgcctggc ccgcctgcac ggcaagacca cctacgagaa gtacctgggc 2340

ccgcagtacg tggccggcat caccaacctg aagaagtgca gcacctcgcc gctgctggag 2400

gcctgcgagt tcctgcgcaa gtaa 2424

<210> 19

<211> 821

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 19

Met His His His His His His Pro Lys Lys Lys Arg Lys Val Glu Lys

1 5 10 15

Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala

20 25 30

Leu Val Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys

35 40 45

Pro Glu Cys Gly Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His

50 55 60

Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly

65 70 75 80

Lys Ser Phe Ser Ala Ser Ala Ala Leu Val Ala His Gln Arg Thr His

85 90 95

Thr Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Lys

100 105 110

Leu Val Phe Leu Val Leu Leu Phe Leu Gly Ala Leu Gly Leu Cys Leu

115 120 125

Ala Gly Arg Arg Arg Arg Ser Val Gln Trp Cys Thr Val Ser Gln Pro

130 135 140

Glu Ala Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Arg Val Arg

145 150 155 160

Gly Pro Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln Cys Ile

165 170 175

Gln Ala Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp Gly Gly

180 185 190

Phe Ile Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro Val Ala

195 200 205

Ala Glu Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr Tyr Ala

210 215 220

Val Ala Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu Leu Gln

225 230 235 240

Gly Leu Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly Trp Asn

245 250 255

Val Pro Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Thr Gly Pro Pro

260 265 270

Glu Pro Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser Cys Val

275 280 285

Pro Gly Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu Cys Ala

290 295 300

Gly Thr Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro Tyr Phe

305 310 315 320

Ser Tyr Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly Asp Val

325 330 335

Ala Phe Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp Glu Ala

340 345 350

Glu Arg Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg Lys Pro

355 360 365

Val Asp Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser His Ala

370 375 380

Val Val Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp Asn Leu

385 390 395 400

Leu Arg Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro Lys Phe

405 410 415

Gln Leu Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe Lys Asp

420 425 430

Ser Ala Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser Gly Leu

435 440 445

Tyr Leu Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg Lys Ser

450 455 460

Glu Glu Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys Ala Val

465 470 475 480

Gly Glu Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu Ser Glu

485 490 495

Gly Ser Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys Ile Ala

500 505 510

Leu Val Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Tyr

515 520 525

Val Tyr Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn

530 535 540

Tyr Lys Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val Asp Arg

545 550 555 560

Pro Val Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser Asp Thr

565 570 575

Ser Leu Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His Thr Ala

580 585 590

Val Asp Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu Phe Asn

595 600 605

Gln Thr Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser Cys Ala

610 615 620

Pro Gly Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile Gly Asp

625 630 635 640

Glu Gln Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg Tyr Tyr

645 650 655

Gly Tyr Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly Asp Val

660 665 670

Ala Phe Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly Asn Asn

675 680 685

Asn Glu Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala Leu Leu

690 695 700

Cys Leu Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser Cys His

705 710 715 720

Leu Ala Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp Lys Val

725 730 735

Glu Arg Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe Gly Arg

740 745 750

Asn Gly Ser Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser Glu Thr

755 760 765

Lys Asn Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg Leu His

770 775 780

Gly Lys Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val Ala Gly

785 790 795 800

Ile Thr Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu Ala Cys

805 810 815

Glu Phe Leu Arg Lys

820

<210> 20

<211> 2466

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

atgcaccacc accaccacca cccgaagaag aagcgcaagg tcgagaagcc gtacaagtgc 60

ccggagtgcg gcaagagctt cagcgccagc gccgccctgg tggcgcacca gcgcacccac 120

accggcgaga agccgtacaa gtgcccggag tgcggcaaga gcttcagcgc cagcgccgcc 180

ctggtggcgc accagcgcac ccacaccggc gagaagccgt acaagtgccc ggagtgcggc 240

aagagcttca gcgccagcgc cgccctggtg gcgcaccagc gcacccacac cggcggcggc 300

tccggcggct ccggcggctc cggcggatcc atgaagctgg tgttcctggt gctgctgttc 360

ctgggcgccc tgggcctgtg cctggcgggc cggcgccgcc gcagcgtgca gtggtgcacc 420

gtgtcccagc cggaggccac caagtgcttc cagtggcagc gcaacatgcg ccgcgtgcgc 480

ggcccgccgg tgtcctgcat caagcgcgac agcccgatcc agtgcatcca ggcgatcgcg 540

gagaaccgcg ccgacgccgt gaccctggac ggcggcttca tctacgaggc gggcctggcc 600

ccgtacaagc tgcgcccggt ggccgccgag gtgtacggca ccgagcgcca gccgcgcacc 660

cactactacg ccgtggccgt cgtgaagaag ggcggcagct tccagctgaa cgagctgcag 720

ggcctgaagt cctgccacac cggcctgcgc cgcaccgccg gctggaacgt gccgatcggc 780

accctgcgcc cgttcctgaa ctggaccggc ccgccggagc cgatcgaggc cgccgtggcg 840

cgcttcttca gcgccagctg cgtgccgggc gccgacaagg gccagttccc gaacctgtgc 900

cgcctgtgcg ccggcaccgg cgagaacaag tgcgccttca gcagccagga gccgtacttc 960

agctacagcg gcgccttcaa gtgcctgcgc gacggcgcgg gcgacgtggc cttcatccgc 1020

gagagcaccg tgttcgagga cctgagcgac gaggccgagc gcgacgagta cgagctgctg 1080

tgcccggaca acacccgcaa gccggtggac aagttcaagg actgccacct ggcccgcgtg 1140

ccgagccacg ccgtggtggc ccgctccgtg aacggcaagg aggacgccat ctggaacctg 1200

ctgcgccagg cccaggagaa gttcggcaag gacaagagcc cgaagttcca gctgttcggc 1260

agcccgagcg gccagaagga cctgctgttc aaggacagcg ccatcggctt cagccgcgtg 1320

ccgccgcgca tcgacagcgg cctgtacctg ggcagcggct acttcaccgc catccagaac 1380

ctgcgcaaga gcgaggagga ggtggccgcc cgccgcgccc gcgtcgtgtg gtgcgccgtg 1440

ggcgagcagg agctgcgcaa gtgcaaccag tggagcggcc tgagcgaggg cagcgtgacc 1500

tgctccagcg cctccaccac cgaggactgc atcgcgctgg tgctgaaggg cgaggccgac 1560

gccatgtcgc tggacggcgg ctacgtgtac accgccggca agtgcggcct ggtgccggtg 1620

ctggccgaga actacaagag ccagcagagc agcgacccgg acccgaactg cgtggaccgc 1680

ccggtggagg gctacctggc cgtggccgtc gtgcgccgca gcgacaccag cctgacctgg 1740

aacagcgtga agggcaagaa gtcgtgccac accgccgtgg accgcaccgc gggctggaac 1800

atcccgatgg gcctgctgtt caaccagacc ggcagctgca agttcgacga gtacttcagc 1860

cagtcctgcg ccccgggctc cgacccgcgc tcgaacctgt gcgccctgtg catcggcgac 1920

gagcagggcg agaacaagtg cgtgccgaac agcaacgagc gctactacgg ctacaccggc 1980

gcgttccgct gcctggcgga gaacgccggc gacgtggcgt tcgtgaagga cgtgaccgtg 2040

ctgcagaaca ccgacggcaa caacaacgag gcctgggcca aggacctgaa gctggccgac 2100

ttcgcgctgc tgtgcctgga cggcaagcgc aagccggtga ccgaggcccg cagctgccac 2160

ctggcgatgg ccccgaacca cgcggtggtg tcgcgcatgg acaaggtgga gcgcctgaag 2220

caggtgctgc tgcaccagca ggccaagttc ggccgcaacg gcagcgactg cccggacaag 2280

ttctgcctgt tccagagcga gaccaagaac ctgctgttca acgacaacac cgagtgcctg 2340

gcccgcctgc acggcaagac cacctacgag aagtacctgg gcccgcagta cgtggccggc 2400

atcaccaacc tgaagaagtg cagcacctcg ccgctgctgg aggcctgcga gttcctgcgc 2460

aagtaa 2466

Claims

1.一种融合蛋白质，其结构域中包括锌指蛋白和人乳铁蛋白。

2.根据权利要求1所述的融合蛋白，其特征在于，还包括以下特征中的任一项或多项：

(1)所述锌指蛋白和人乳铁蛋白之间通过连接肽连接，优选地，所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白、连接肽、人乳铁蛋白；

(2)所述锌指蛋白的氨基酸序列如SEQ ID NO.2所示；

(3)所述人乳铁蛋白的氨基酸序列如SEQ ID NO.4所示。

3.根据权利要求2所述的融合蛋白，其特征在于，特征(1)中，所述融合蛋白结构域中，包括1个、2个或3个锌指蛋白，优选地，所述融合蛋白的结构域中从N端到C端依次包括锌指蛋白--连接肽-人乳铁蛋白，即ZFP1-hLF，或锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白，即ZFP2-hLF，或锌指蛋白-锌指蛋白-锌指蛋白-连接肽-人乳铁蛋白，即ZFP3-hLF。

4.根据权利要求3所述的融合蛋白，其特征在于，还包括以下特征中的任一项或多项：

(1)所述ZFP1-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.5所示；

(2)所述ZFP2-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.13所示；

(3)所述ZFP3-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.17所示；

(4)所述融合蛋白还包括标签。

5.根据权利要求4所述的融合蛋白，其特征在于，特征(4)中，还包括以下特征中的任一项或多项：

(1)带标签的ZFP1-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.6所示；

(2)带标签的ZFP2-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.15所示；

(3)带标签的ZFP3-hLF融合蛋白质结构域的氨基酸序列如SEQ ID NO.19所示。

6.一种分离的多核苷酸，其编码如权利要求1～5任一项所述的融合蛋白。

7.一种重组表达载体，其含有如权利要求6所述的分离的多核苷酸。

8.一种宿主细胞，所述细胞含有如权利要求7所述重组表达载体或基因组中整合有外源的如权利要求6所述的分离的多核苷酸。

9.一种制备如权利要求1～5任一项所述融合蛋白的方法，包括如下步骤：构建含有所述融合蛋白编码多核苷酸的重组表达载体，然后将所述重组表达载体转化至宿主细胞中表达，从表达产物中分离获得所述融合蛋白。

10.如权利要求1～5任一项所述融合蛋白在制备涉及乳铁蛋白所有生物学功能性的相关产品中的用途，优选地，所述功能性产品选自癌症治疗产品、抗病毒治疗产品、抑菌产品、抗氧化产品、调节免疫力产品、促进铁离子吸收产品、肠道相关疾病治疗产品。