CN113321718A

CN113321718A - 昆虫cpcfc家族表皮蛋白，编码核苷酸序列及其应用

Info

Publication number: CN113321718A
Application number: CN202110646579.9A
Authority: CN
Inventors: 杨青; 包涵
Original assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Current assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2021-08-31
Anticipated expiration: 2041-06-10
Also published as: CN113321718B

Abstract

本发明提供了一种昆虫CPCFC家族表皮蛋白，编码核苷酸序列及其应用，涉及生物工程技术领域。本发明以鞘翅目昆虫双叉犀金龟为研究对象，从中发现了两种CPCFC家族蛋白基因，命名为TdCPCFC1和TdCPCFC2，并成功获得两种基因的重组蛋白，有助于了解CPCFC类蛋白的性质，以及了解昆虫表皮组装方式中CPCFC家族表皮蛋白发挥的作用，为研究CPCFC家族表皮蛋白提供了新的基因资源。本发明提供重组表达的昆虫CPCFC家族表皮蛋白TdCPCFC1，能够结合金属离子，具有还原性，能够与几丁质结合，能够自组装形成团聚体，凝胶等，形成的团聚体和凝胶具有粘合等性质，可以用于开发相应的生物制品。

Description

昆虫CPCFC家族表皮蛋白，编码核苷酸序列及其应用

技术领域

本发明涉及生物工程技术领域，具体涉及昆虫CPCFC家族表皮蛋白，编码核苷酸序列及其应用。

背景技术

节肢动物是动物界最大且最丰富的类群，昆虫是节肢动物的最重要组成成分之一。昆虫在水生和陆生环境的生存、繁殖、发育等都具有非常优秀的适应性。他们的表皮结构对其成功的环境适应发挥了重要作用。昆虫表皮是由上皮细胞分泌沉积并组织的一种细胞外基质，其能保护昆虫，防止体内水分散失；同时作为生物毒剂，病原和捕食者捕食的一道屏障；其还可以作为昆虫外骨骼，帮助昆虫运动。昆虫表皮主要由几丁质和蛋白质构成，能够为仿生学提供非常多研究方向。例如不同的表面结构对表皮性质的影响，不同的颜色在伪装，识别，热吸收，求偶，防御等方面的作用。表皮还具有良好的机械性质，不同部位的表皮强度、刚性、弹性以及可塑性等方面都不同，这可能是由于几丁质排布，几丁质-蛋白质特异的相互作用或装配，蛋白质不同程度的修饰，硬化等因素决定的。

根据昆虫表皮中蛋白质的序列分类，已确定了13个表皮蛋白家族。每个物种的表皮蛋白在各个表皮蛋白家族中都含有许多成员，但CPCFC家族例外。大多数CPCFC家族成员在一个物种中至多存在2个，一般只存在一个。CPCFC家族最早在蜚蠊目中发现，命名为NcNCP1，它带有3个重复的基序(motif)；每个基序由16个氨基酸组成，带有2个保守的Cys(位于第10位和第16位)，两个Cys之间夹着5个氨基酸。在鳞翅目和鞘翅目中，只含有两个重复的CPCFC motif。但剩下的大部分生物种中含有三个重复。除CPCFC motif外，每个目的CPCFC序列都还有部分相似，每个目的序列长度也相似。

虽然CPCFC蛋白在双翅目，鳞翅目中的时空表达模式已有人研究过，但从蛋白水平进行CPCFC蛋白的研究至今未见报道。

发明内容

有鉴于此，本发明提供鞘翅目昆虫双叉犀金龟的CPCFC家族表皮蛋白及其编码核苷酸序列，有助于了解其他鞘翅目昆虫CPCFC类蛋白的性质。

本发明第一方面提供了昆虫CPCFC家族表皮蛋白，所述蛋白的氨基酸序列包含或由如下序列组成：

a)SEQ ID NO.1所示的氨基酸序列；或，

b)与SEQ ID NO.1所示的氨基酸序列具有至少50％序列同一性的功能性同源序列；或

c)在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。

所述昆虫选自鞘翅目，优选所述昆虫为双叉犀金龟。

双叉犀金龟是一种鞘翅目昆虫。成年的雄性甲虫具有带分支的特化的角，具有很强的机械性能。本发明以双叉犀金龟为研究对象，从中发现了两种CPCFC家族蛋白基因，命名为TdCPCFC1和TdCPCFC2，并成功获得该基因的编码蛋白(即CPCFC家族表皮蛋白，本发明中也命名为TdCPCFC1和TdCPCFC2)。

鞘翅目的CPCFC蛋白带有2个CPCFC motif的重复，并且序列较长，一般超过130个氨基酸序列，所以研究双叉犀金龟这一鞘翅目昆虫的CPCFC蛋白有助于理解CPCFC类蛋白的性质。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.1所示的氨基酸序列：GWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH，序列长度为155个氨基酸。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为与SEQ ID NO.1所示的氨基酸序列具有至少50％序列同一性的功能性同源序列。所述功能性同源序列包括但不限于SEQ ID NO.1所示的氨基酸具有约50％或以上、53％或以上、55％或以上、57％或以上、60％或以上、65％或以上、70％或以上、75％或以上、80％或以上、82％或以上、84％或以上、85％或以上、88％或以上、90％或以上、92％或以上、93％或以上、94％或以上、95％或以上、96％或以上、97％或以上、98％或以上、99％或以上、99.5％或以上、99.9％或以上同一性的氨基酸序列。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个(例如可以为1-10个，具体地，可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个)氨基酸且具有相同活性的氨基酸序列。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.2所示的氨基酸序列：MFVKLAVLACTFAVALAGWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH(下划线为信号肽区域)，序列长度为172个氨基酸。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.3所示的氨基酸序列：MGHHHHHHMGWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH，序列长度为164个氨基酸，其N端带有组氨酸标签。

在本发明的一种实施方式中，所述昆虫CPCFC家族表皮蛋白TdCPCFC2的氨基酸序列为SEQ ID NO.17所示的氨基酸序列：MLVQSDVLACALAIASAAWNGPLAGGVPASQIPAGISLQACPNYPHCNNPNVAVEPNSPAAQQAPQYQPAPQYQPAPQYQPAPQYQPAPQQSYNQNALDNGEYTGDGDYHGEGLAESGAFGSTGNSQAYNSAPAYQPAPAYQPASPQYNPAPAQPAAQLPAGVDAHACPNYPYCS(下划线为信号肽区域)，序列长度为175个氨基酸，与TdCPCFC1氨基酸序列相似性为57.1％。

本发明第二方面提供了编码所述CPCFC家族表皮蛋白的核苷酸序列。

进一步，编码CPCFC家族表皮蛋白的核苷酸序列包含或由如下序列组成：

i)SEQ ID NO.4所示的核苷酸序列；或，

ii)SEQ ID NO.4所示的核苷酸序列的互补序列、简并序列或同源序列；或，

iii)在严谨条件下与SEQ ID NO.4所示的核苷酸序列杂交，且能够编码CPCFC家族表皮蛋白的核苷酸序列。

在本发明的一种实施方式中，所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.4所示的核苷酸序列，序列长度为468个碱基，末三位为终止密码子，对应于编码具有SEQ ID NO.1所示氨基酸的表皮蛋白TdCPCFC1。

在本发明的一种实施方式中，所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.4所示的核苷酸序列按照碱基互补配对原则形成的互补序列，互补序列可以为具有编码表皮蛋白TdCPCFC1功能的不完全互补序列或完全互补序列。

在本发明的一种实施方式中，所述编码表皮蛋白TdCPCFC1的核苷酸序列为SEQ IDNO.4所示的核苷酸序列的简并序列。简并序列是指改变SEQ ID NO.4核苷酸某个或多个核苷酸序列后，改变的核苷酸序列位置对应编码的氨基酸种类不变，不会影响核苷酸序列的编码功能和表达水平。

在本发明的一种实施方式中，所述编码表皮蛋白TdCPCFC1的核苷酸序列为SEQ IDNO.4所示的核苷酸序列的同源序列。

所述同源核苷酸序列包括在SEQ ID NO.4所示的核苷酸序列中添加和/或取代和/或缺失一个或几个核苷酸而生成的可编码具有表皮蛋白TdCPCFC1相同活性的突变基因、等位基因或衍生物。

进一步优选同源序列为与SEQ ID NO.4所示的核苷酸序列约50％或以上、53％或以上、55％或以上、57％或以上、60％或以上、65％或以上、70％或以上、75％或以上、80％或以上、81％或以上、82％或以上、83％或以上、84％或以上、85％或以上、86％或以上、87％或以上、88％或以上、89％或以上、90％或以上、91％或以上、92％或以上、93％或以上、94％或以上、95％或以上、96％或以上、97％或以上、98％或以上、99％或以上、99.1或以上、99.2或以上、99.3％或以上、99.4％或以上、99.5％或以上、99.6％或以上、99.7％或以上、99.8％或以上、或99.9％或以上同一性且具备编码CPCFC家族表皮蛋白功能的多核苷酸。

在本发明的一种实施方式中，所述编码表皮蛋白TdCPCFC1的核苷酸序列为在严谨条件下与SEQ ID NO.4的核苷酸序列杂交，且能够编码表皮蛋白Tdcpcfc1的核苷酸序列。

示例性地，所述“严谨条件”是指探针将与其靶序列杂交至可探测程度超过与其它序列杂交(如至少2倍于背景)的条件。严谨条件具有序列依赖性，且因环境的不同而不同。通过控制杂交和/或洗涤条件的严谨性，可以鉴定与探针100％互补的靶序列。可选择地，可以调节严谨条件以允许一些序列错配，使得探测到较低程度的同一性。

进一步，所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.5所示的核苷酸序列，长度为519个碱基，对应于编码具有SEQ ID NO.2所示氨基酸的表皮蛋白TdCPCFC1。

进一步，所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.6所示的核苷酸序列，长度为495个碱基，对应于编码具有SEQ ID NO.3所示氨基酸的表皮蛋白TdCPCFC1。

进一步，所述编码CPCFC家族表皮蛋白TdCPCFC2的核苷酸序列为SEQ ID NO.18所示的核苷酸序列，长度为528个碱基，对应于编码具有SEQ ID NO.17所示氨基酸的表皮蛋白TdCPCFC2。

本发明第三方面提供了所述的CPCFC家族表皮蛋白，或，所述的编码核苷酸序列应用于研究CPCFC家族表皮蛋白在昆虫表皮组装方式中发挥的作用。

研究表皮蛋白TdCPCFC1和TdCPCFC2有助于了解昆虫表皮组装方式中，CPCFC家族蛋白在表皮中发挥的作用，也能研究鞘翅目所独有的长序列是否对鞘翅目表皮的坚硬度做出贡献。

进一步，所述的应用包括以下几个方面：(1)本发明所提供的表皮蛋白TdCPCFC1和TdCPCFC2的氨基酸序列或至少部分序列的蛋白可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性，或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质；(2)涉及表皮蛋白TdCPCFC1和TdCPCFC2及相关截短体，突变体，多肽的生物合成；(3)涉及表皮蛋白TdCPCFC1和TdCPCFC2在昆虫表皮组装方式中的应用。

所述的编码核苷酸序列的应用包括以下几个方面：(1)本发明所提供的核苷酸序列或至少部分核苷酸序列被修饰或突变，修饰或突变的途径包括插入、缺失，聚合酶链式反应(PCR)，易错PCR，不同序列的重新连接，序列的不同部分或与其他来源的同源序列进行定向进化，或通过化学试剂诱变等。(2)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因通过合适的表达体系在外源宿主中表达以得到相应的表皮蛋白或其他更高的生物活性或产量。(3)本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径，也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。

本发明第四方面提供了用于检测所述核苷酸序列的引物。

此处对扩增编码表皮蛋白TdCPCFC1和TdCPCFC2核苷酸序列的PCR产物的核苷酸序列不做具体的限定，能够满足特异性扩增出或特异性检测出所述的编码表皮蛋白TdCPCFC1和TdCPCFC2核苷酸序列的引物即可。

在本发明的一种优选地实施方式中，所述引物包括上游引物和/或下游引物；其中，所述上游引物的核苷酸序列如SEQ ID NO.7所示：5’-ATGTTTGTAAAACTGGCAGTATTAGCTTG-3’；所述下游引物的核苷酸序列如SEQ ID NO.8所示：5’-TTAATGGCAGAATGGGTAATTTGGACA-3’。

本发明第五方面提供了载体，所述载体导入了所述的核苷酸序列。

对于载体的种类不作具体限定，可以根据需要选择适合的载体。例如载体包括但不限于pET28a、pBR322、pUC18、pUC19、pcdna3.1、pESC-Ura或pGEX2T，优选pET28a。

本发明第六方面提供了遗传工程化的宿主细胞，其包含所述的氨基酸序列，或包含所述的核苷酸序列，或导入了所述的载体。

进一步，所述的宿主细胞包括植物细胞、动物细胞或微生物细胞；

进一步，所述微生物细胞包括但不限于大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。优选大肠杆菌BL21(DE3)。

进一步，在体内和体外将编码所述表皮蛋白的核苷酸序列，或所述的重组质粒，或所述的表达载体引入宿主细胞的方法包括但不限于电穿孔、聚乙二醇(PEG)转化、脂质转染、热休克、磷酸钙沉淀、病毒介导和显微注射。

本发明第七方面提供了制备所述表皮蛋白的方法，包括以下步骤：将所述的编码CPCFC家族表皮蛋白的核苷酸序列，或所述的载体导入宿主细胞中表达获得所述表皮蛋白；和/或，采用所述的遗传工程化的宿主细胞表达获得所述表皮蛋白。

在本发明一种优选地实施方式中，制备所述表皮蛋白的方法，包括以下步骤：

步骤一、合成SEQ ID NO.6所示的核苷酸序列；

步骤二、根据步骤一的核苷酸序列，构建pET28a-cpcfc1的重组载体以及相对应的重组表达基因工程菌；

步骤三、将步骤二获得的重组基因工程菌进行原核表达，并对获得的蛋白进行纯化，得到包含有氨基酸序列如SEQ ID NO.3所示的昆虫表皮蛋白Tdcpcfc1。

本发明第八方面提供了生物制品，包括所述的CPCFC家族表皮蛋白Tdcpcfc1/Tdcpcfc2，或所述表皮蛋白的功能性截短体，突变体，多肽，以及任选地其它组分和/或辅助组分。

进一步，所述生物制品包括结合金属离子制品、还原剂、凝胶、粘合剂中的至少一种。

本发明采用上述技术方案具有以下有益效果：

(1)本发明提供了一种新发现的昆虫CPCFC家族表皮蛋白，有助于了解CPCFC类蛋白的性质，以及了解昆虫表皮组装方式中CPCFC家族表皮蛋白发挥的作用，为研究CPCFC家族表皮蛋白提供了新的基因资源。基于蛋白本身性质为生物材料提供原料，也可以帮助体外重现仿生昆虫表皮。

(2)本发明提供的昆虫CPCFC家族表皮蛋白Tdcpcfc1，能够结合金属离子，具有还原性，能够与几丁质结合，能够形成团聚体，凝胶等，可以用于开发利用相应的生物制品。

附图说明

图1所示为实施例1获得的表皮蛋白TdCPCFC1的纯化电泳图。

图2所示为实施例3中TdCPCFC1蛋白检测Cu(I)的BCS曲线，其中Native指纯化的蛋白。

图3所示为实施例4中TdCPCFC1蛋白的几丁质结合电泳图，其中T：总蛋白，F：透过蛋白，E：结合蛋白。Maker(从上到下)：97.4、66.2、43、31、22、14.4(kDa)。

图4所示为实施例4中螯合金属元素后的TdCPCFC1蛋白与α-几丁质结合电泳图。Maker与图3相同。

图5所示为实施例5中加入NADA后促进TdCPCFC1蛋白交联电泳图，其中，input：未处理，S：交联后上清，P：交联后沉淀。Maker与图3相同。

图6所示为实施例5中TdCPCFC1蛋白Tyr交联电泳图。其中Native指纯化的蛋白，After chelation指螯合后蛋白。Maker与图3相同。

图7所示为实施例6中NaCl诱导的TdCPCFC1蛋白两种状态的浊度变化。

图8所示为实施例6中不同种类盐溶液诱导TdCPCFC1浊度变化。

图9所示为实施例6中螯合金属后的TdCPCFC1蛋白结合其它金属产生的浊度变化。

图10所示为实施例6中TdCPCFC1凝胶展现粘性与形成纤维的性质。

图11所示为实施例6中NaCl诱导产生凝胶的ThT染色图结果。

图12所示为实施例6中螯合金属后的TdCPCFC1蛋白与其它金属形成凝胶的ThT染色。

图13所示为实施例6中螯合金属后的TdCPCFC1蛋白再与Cu螯合产生的凝胶具有粘性并能拉出纤维。

图14所示为实施例7获得的TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体的纯化电泳图。WT表示野生型TdCPCFC1蛋白，M3表示TdCPCFC1-M3；M2表示TdCPCFC1-M2；M13表示TdCPCFC1-M13。Maker与图3相同。

图15所示为实施例8中TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体在盐离子条件下形成团聚体凝胶。

图16所示为实施例8中TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体形成的凝胶具有粘性并能拉出纤维。

图17为实施例9获得的表皮蛋白TdCPCFC2的纯化电泳图。Maker与图3相同。

图18实施例9中表皮蛋白TdCPCFC2蛋白形成的凝胶，具有粘性并能拉出纤维。

具体实施方式

本发明中，自定义“Tdcpcfc1或TdCPCFC1，Tdcpcfc2或TdCPCFC2，”均可以表示CPCFC家族表皮蛋白，或CPCFC家族表皮蛋白基因，或编码CPCFC家族表皮蛋白的核苷酸序列，具体所指的含义可以结合上下文判断。

本发明中，术语“基因”被定义为在染色体中占据特定位置并包含对植株潜在的表型特征或性状作出贡献的遗传指令的遗传单位(通常用DNA序列表示)。

本发明中，术语“核苷酸”以本领域技术人员理解的一般含义。

本发明中，术语“氨基酸”是指任何氨基酸(标准和非标准氨基酸二者)，包括但不限于α-氨基酸、β-氨基酸、γ-氨基酸和δ-氨基酸。适合的氨基酸的实例包括但不限于丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯基丙氨酸、苏氨酸、色氨酸和缬氨酸。

本发明中，所述的“严谨条件”可为低严谨条件、中严谨条件、高严谨条件中的任一种。“低严谨条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、32℃的条件。“中严谨条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、42℃的条件。“高严谨条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、50℃的条件。在上述条件中，越提高温度，越能期待高效地获得具有高同源性的DNA。影响杂交严谨性的因素可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素，本领域技术人员通过适宜选择这些因素，可实现同样的严谨条件。

除非另有定义，本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下面结合具体实施例详细描述本发明，这些实施例用于理解而不是限制本发明。

实施例1 Tdcpcfc1基因的克隆及表达纯化

一、合成SEQ ID NO.5所示的核苷酸序列

(1)从双叉犀金龟蛹末期的角中提取总RNA，并用反转录酶合成cDNA第一链；

(2)以cDNA为模板，利用上游引物1和下游引物2进行PCR(聚合酶链式反应)扩增；

上游引物1：5’-ATGTTTGTAAAACTGGCAGTATTAGCTTG-3’(SEQ ID NO.7)，

下游引物2：5’-TTAATGGCAGAATGGGTAATTTGGACA-3’(SEQ ID NO.8)。

PCR反应体系：1μL cDNA模板，25uL 2×exTaq Premix，1.5μL上游引物1，1.5uL下游引物2，补充ddH₂O(双蒸水)至总反应体系为50uL；

PCR反应条件为①98℃，10s；②55℃，30s；③72℃，1min；④重复步骤①-③30个循环；

(3)PCR产物经纯化回收后连接到T载体，测序验证，得到如SEQ ID NO.5所示核苷酸序列。

二、构建重组载体和重组表达基因工程菌

表达重组载体的载体骨架为pET28a原核表达载体；重组表达工程菌株为大肠杆菌BL21(DE3)。

(1)以上述步骤得到的SEQ ID NO.5所示核苷酸序列为模板，利用上游引物3和下游引物4进行PCR扩增；

上游引物3：5’ATCATCATCATCATATGGGATGGAACGGTCCACTCG 3’(SEQ ID NO.9)，

下游引物4：5’GGTGGTGGTGCTCGAGTTAATGGCAGAATGGGTAATTTGGACAAGAG 3’(SEQ IDNO.10)。

PCR反应体系：1uL cDNA模板，25uL 2×PrimerSTAR Max Premix，1.5μL上游引物1，1.5μL下游引物2，补充ddH₂O(双蒸水)至总反应体系为50uL；

PCR反应条件为①98℃，10s；②55℃，5s；③72℃，5s；④重复步骤①-③30个循环；

PCR产物经纯化回收；

(2)将pET28a载体进行改造，NcoI酶切位点后，NdeI酶切位点前添加6×His tag，之后利用NdeI与XhoI进行双酶切，双酶切产物经纯化回收后与步骤(1)的PCR产物利用In-Fusion HD Cloning Kit进行连接，得到重组表达载体连接产物；

(3)将重组表达载体连接产物与大肠杆菌感受态细胞(E.coli DH5α)混匀，冰浴30min，42℃热激60s，取出后再次冰浴2min；加入LB(Luria-Bertani)液体培养基，37℃，200rpm条件下，振荡培养1h；取菌液于含有50mg/L卡那霉素的LB固体培养基上，涂布均匀，37℃培养过夜，获得克隆菌落；

(4)挑取单克隆菌落接种于含卡那霉素的LB液体培养基中，取菌液进行菌落PCR初步鉴定，将阳性菌液抽提质粒送样测序，得到测序正确的重组工程菌株。

三、TdCPCFC1蛋白表达与纯化

(1)将获得的重组表达工程菌株单菌落接种于10mL含有浓度为50mg/L卡那霉素的LB液体培养基中，37℃过夜培养；将培养过夜的菌液接种于1L含有50mg/L卡那霉素的液体培养基中，37℃，200rpm培养至OD 600达到0.4-0.6后加入终浓度为0.1mM的异丙基-β-D-硫代半乳糖苷(IPTG)诱导培养5h；诱导后的菌液经4℃，8000rpm离心5min收集菌体；重悬于100mL Buffer A(20mM Tris-HCl，pH 7.5)中，高压匀浆破碎，～600bar，3-4个循环。4℃，17000×g，离心40min，收集上清液；

(2)将收集到的上清液用0.22μm低吸附滤膜去除杂质，利用GE 5ml Histrap FF分离纯化蛋白，并利用聚丙烯酰氨凝胶电泳(SDS-PAGE)检测(结果如图1)，获得纯化的重组昆虫表皮蛋白，其为SEQ ID NO.3所示氨基酸序列。

(3)纯化后的蛋白透析到Buffer A中，4℃保存。

实施例2 检测TdCPCFC1蛋白结合金属离子性质

重组大肠杆菌培养过程中结合Cu元素

实施例1获得的重组大肠杆菌利用LB培养基诱导后收菌，大肠杆菌加入诱导剂后表达蛋白过程中，会自动吸收培养基内Cu元素，菌体呈现砖红色，将分离得到的1.9mL，2.63mg/mL纯蛋白进行ICP-AES(电感耦合等离子体发射光谱)，测得TdCPCFC1蛋白结合0.023mg Cu元素，蛋白与Cu的摩尔比约为1:1。

实施例3 检测TdCPCFC1蛋白还原性

一、TdCPCFC1蛋白Cys数量测定

理论上1个TdCPCFC1蛋白含有4个Cys(不包括信号肽区)，以Cys标准品制备标准曲线，利用Ellman’s Reagent反应，检测412nm的UV吸收，测得完全还原状态为4个Cys，但不处理的蛋白中含有2个Cys。结果说明纯化得到的蛋白TdCPCFC1，4个Cys有2个形成了二硫键，另外两个游离，蛋白具有还原性。

二、TdCPCFC1蛋白还原Cu(II)

利用Bcs检测Cu(I)的产生，Bcs可以特异结合Cu(I)，在483nm下存在紫外吸收，分别利用纯化的蛋白与经过EDTA+TCEP(螯合剂+还原剂处理使蛋白不带Cu元素，且还原剂处理后还原全部Cys作为对照)处理的纯化蛋白检测其对Cu(II)的还原能力。结果显示两种蛋白都具有还原能力，还原曲线见图2。

实施例4 检测TdCPCFC1蛋白与几丁质结合能力

一、TdCPCFC1蛋白与不同类型几丁质结合能力

实验方法：利用3mg/mL溶于水中的不同类型几丁质浊液(α-几丁质、β-几丁质、胶体几丁质、壳聚糖)，0.5mg/mL蛋白溶液(Buffer A)，200μL体系，室温下旋转混合约3-4h。离心取上清，即为透过蛋白(F)，利用Buffer A洗涤5-6次，BSA作为对照，8M尿素洗脱结合在几丁质上的蛋白(E)。

实验结果见图3，TdCPCFC1蛋白与α-几丁质(α-chitin)具有结合能力，但基本不结合β-几丁质(β-chitin)，胶体几丁质(colloidal chitin)和壳聚糖(chitosan)。

二、TdCPCFC1蛋白螯合后与几丁质结合能力

实验方法参照Tdcpcfc1蛋白与不同类型几丁质结合的实验。

图4的实验结果显示，TdCPCFC1蛋白螯合Cu后，不影响TdCPCFC1蛋白与α-几丁质结合。

实施例5 检测TdCPCFC1蛋白交联

一、NADA促进TdCPCFC1蛋白交联

实验方法：5μg和10μg TdCPCFC1蛋白中分别加入10mM，20mM NADA(N-Arachidonyldopamine)，30℃孵育1h，检测TdCPCFC1蛋白中交联情况。

实验结果见图5，交联后上清的电泳图上方条带(大约43kDa处)加粗，说明了添加NADA可以促进TdCPCFC1蛋白交联。

二、TdCPCFC1蛋白中Tyr交联

实验方法：10mg/mL TdCPCFC1，0.2mM Ru(II)，2.5mM APS，100uL体系混合均匀。两次暴露于500W大灯下，持续照射3min，两次之间间隔15min。

实验结果见图6，交联后上清的电泳图上方出现新条带，说明了利用Ru(II)与APS能够促进TdCPCFC1蛋白进行Tyr交联。而且纯化蛋白中Tyr交联比螯合后的交联情况好，原因是Ru(II)与螯合后蛋白接触后会有一部分与蛋白结合，造成其催化作用减弱，故条带减弱。

实施例6 检测Tdcpcfc1蛋白团聚

一、盐离子促进Tdcpcfc1蛋白团聚

TdCPCFC1蛋白在盐离子强度变化时能够发生LLPS(液液相分离)，产生团聚体。但加入EDTA螯合金属元素后，失去LLPS能力。以加入NaCl后的浊度变化说明这个过程，结果见图7。

除了NaCl外，其它盐离子也能够促进团聚体的形成，以浊度变化说明这一过程，结果见图8。

二、金属离子促进TdCPCFC1蛋白团聚

螯合掉纯化TdCPCFC1蛋白本身存在的Cu后，去除EDTA，将蛋白加入其它过渡金属溶液中(存在过渡金属条件下，盐诱导才能形成团聚)，同样能形成团聚体，以浊度变化说明这一过程，结果见图9。

三、TdCPCFC1蛋白团聚体形成凝胶

TdCPCFC1蛋白团聚体适度脱水后能够形成具有黏性的凝胶，并拉出纤维，结果见图10。ThT染色说明，形成的凝胶具有β-sheet结构，结果见图11(左侧图为白光下凝胶的显微结构，右侧图出现明显的绿色荧光)。

螯合金属后的TdCPCFC1蛋白与其它金属形成凝胶经ThT染色具有荧光，说明其同样具有β-sheet结构，结果见图12(图右侧均可见明显的绿色荧光)。

重新添加Cu形成的凝胶同样具有粘性，并可以拉出纤维，结果见图13。

实施例7 制备TdCPCFC1蛋白的截短体

选取三种TdCPCFC1蛋白的截短体，分别命名为TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13，对应的氨基酸序列分别为SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13，对应的编码核苷酸序列分别为SEQ ID NO.14、SEQ ID NO.15、SEQ ID NO.16。

截短体蛋白的基因克隆及表达纯化与实施例1的野生型TdCPCFC1蛋白相同，电泳图如图14所示。

实施例8 检测TdCPCFC1蛋白的截短体的性质

参考实施例6的实验操作，TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13截短体蛋白同样都能在盐离子条件下形成团聚体凝胶，结果如图15所示，可以看出离心管底部均有黄色团聚体凝胶(黑白图中显示为白色凝胶)。

截短体蛋白形成的凝胶具有与野生型蛋白相似的形成纤维的性质，结果如图16所示。

实施例9 Tdcpcfc2基因的克隆及表达纯化

Tdcpcfc2基因的克隆及表达纯化的具体实验操作流程参考实施例1，最后获得纯化的重组Tdcpcfc2表皮蛋白，其N端带有组氨酸标签，用聚丙烯酰氨凝胶电泳(SDS-PAGE)检测结果如图17。

实施例10 检测Tdcpcfc2蛋白团聚

参考实施例6中Tdcpcfc1蛋白在盐离子存在条件下形成团聚体的实验操作，TdCPCFC1蛋白团聚体能够形成具有黏性的凝胶，并拉出纤维，结果见图18。

图18中左侧图的离心管底部形成了凝胶，如黑色箭头所指的凝胶，胶凝成浅黄色，颜色稍深于实施例6中TdCPCFC1蛋白形成的凝胶。图18中右侧能够明显的看到两手指中的胶凝能够拉出纤维状细丝。

由上述内容中的结果可以看出，虽然同属于鞘翅目CPCFC家族表皮蛋白的TdCPCFC1与TdCPCFC2的序列相似性仅为57.1％，两个蛋白的整体序列相似性较低，但两种表皮蛋白具有相似的性质(如形成团聚体、凝胶)。同理，通过本发明的研究可以推测其它鞘翅目的CPCFC蛋白可能也具有类似性质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换等，均应包含在本发明的保护范围之内。

序列表

<110> 中国农业科学院农业基因组研究所

<120> 昆虫CPCFC家族表皮蛋白，编码核苷酸序列及其应用

<141> 2021-06-10

<160> 18

<170> SIPOSequenceListing 1.0

<210> 1

<211> 155

<212> PRT

<213> Unknown

<400> 1

Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe Pro

1 5 10 15

Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn Asn

20 25 30

Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly Ala

35 40 45

Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Gln

50 55 60

Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn Ala Leu

65 70 75 80

Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu Gly Leu

85 90 95

Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn Asn Gly

100 105 110

Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala

115 120 125

Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly Val Asp

130 135 140

Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His

145 150 155

<210> 2

<211> 172

<212> PRT

<213> Unknown

<400> 2

Met Phe Val Lys Leu Ala Val Leu Ala Cys Thr Phe Ala Val Ala Leu

1 5 10 15

Ala Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe

20 25 30

Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn

35 40 45

Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly

50 55 60

Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala

65 70 75 80

Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn Ala

85 90 95

Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu Gly

100 105 110

Leu Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn Asn

115 120 125

Gly Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly

130 135 140

Ala Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly Val

145 150 155 160

Asp Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His

165 170

<210> 3

<211> 164

<212> PRT

<213> Unknown

<400> 3

Met Gly His His His His His His Met Gly Trp Asn Gly Pro Leu Ala

1 5 10 15

Gly Gly Val Pro Ala His Gln Phe Pro Ala Gly Val Ser Pro Gln Ala

20 25 30

Cys Pro Asn Tyr Pro Asn Cys Asn Asn Pro Ala Val Ala Val Ser Pro

35 40 45

Asn Ala Ala Ala Pro Tyr Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn

50 55 60

Pro Gly Ala Tyr Asn Pro Gly Ala Gln Asn Pro Gly Ala Tyr Asn Pro

65 70 75 80

Gly Ala Tyr Asn Gly Gly Asn Ala Leu Asp Asn Gly Glu Tyr Thr Gly

85 90 95

Asp Gly Asp Tyr Arg Gly Glu Gly Leu Ala Glu Ser Gly Ala Tyr Gly

100 105 110

Asn Ala Asp Gly Gly His Asn Asn Gly Gly Tyr Asn Pro Gly Ala Tyr

115 120 125

Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Ala Gly His Ala

130 135 140

Pro Gly Pro Val Pro Ala Gly Val Asp Pro His Ser Cys Pro Asn Tyr

145 150 155 160

Pro Phe Cys His

<210> 4

<211> 468

<212> DNA

<213> Unknown

<400> 4

ggatggaacg gtccactcgc gggaggagtc ccagcccacc agtttccagc tggagttagc 60

ccgcaagcct gccccaacta tcccaattgc aacaaccctg ccgtagcagt ttcgccgaat 120

gcggccgctc cgtatccggg cgcttataat ccaggtgcgt acaatccggg tgcatacaac 180

ccaggcgcgc agaatccggg cgcttacaat ccaggagcct ataatggcgg aaatgctttg 240

gataacggcg agtacactgg agacggtgac tatcgcggcg aaggacttgc cgaatccgga 300

gcgtacggaa atgctgatgg tggacacaat aacggtggct acaatccagg agcttacaat 360

ccaggcgcgt acaaccctgg cgcatacaac ccagcaggac acgcccctgg tccagtacct 420

gccggtgttg atccacactc ttgtccaaat tacccattct gccattaa 468

<210> 5

<211> 519

<212> DNA

<213> Unknown

<400> 5

atgtttgtaa aactggcagt attagcttgc accttcgccg tagcattggc aggatggaac 60

ggtccactcg cgggaggagt cccagcccac cagtttccag ctggagttag cccgcaagcc 120

tgccccaact atcccaattg caacaaccct gccgtagcag tttcgccgaa tgcggccgct 180

ccgtatccgg gcgcttataa tccaggtgcg tacaatccgg gtgcatacaa cccaggcgcg 240

cagaatccgg gcgcttacaa tccaggagcc tataatggcg gaaatgcttt ggataacggc 300

gagtacactg gagacggtga ctatcgcggc gaaggacttg ccgaatccgg agcgtacgga 360

aatgctgatg gtggacacaa taacggtggc tacaatccag gagcttacaa tccaggcgcg 420

tacaaccctg gcgcatacaa cccagcagga cacgcccctg gtccagtacc tgccggtgtt 480

gatccacact cttgtccaaa ttacccattc tgccattaa 519

<210> 6

<211> 495

<212> DNA

<213> Unknown

<400> 6

atgggccatc atcatcatca tcatatggga tggaacggtc cactcgcggg aggagtccca 60

gcccaccagt ttccagctgg agttagcccg caagcctgcc ccaactatcc caattgcaac 120

aaccctgccg tagcagtttc gccgaatgcg gccgctccgt atccgggcgc ttataatcca 180

ggtgcgtaca atccgggtgc atacaaccca ggcgcgcaga atccgggcgc ttacaatcca 240

ggagcctata atggcggaaa tgctttggat aacggcgagt acactggaga cggtgactat 300

cgcggcgaag gacttgccga atccggagcg tacggaaatg ctgatggtgg acacaataac 360

ggtggctaca atccaggagc ttacaatcca ggcgcgtaca accctggcgc atacaaccca 420

gcaggacacg cccctggtcc agtacctgcc ggtgttgatc cacactcttg tccaaattac 480

ccattctgcc attaa 495

<210> 7

<211> 29

<212> DNA

<213> Artificial Sequence

<400> 7

atgtttgtaa aactggcagt attagcttg 29

<210> 8

<211> 27

<212> DNA

<213> Artificial Sequence

<400> 8

ttaatggcag aatgggtaat ttggaca 27

<210> 9

<211> 36

<212> DNA

<213> Artificial Sequence

<400> 9

atcatcatca tcatatggga tggaacggtc cactcg 36

<210> 10

<211> 47

<212> DNA

<213> Artificial Sequence

<400> 10

ggtggtggtg ctcgagttaa tggcagaatg ggtaatttgg acaagag 47

<210> 11

<211> 141

<212> PRT

<213> Unknown

<400> 11

Phe Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys

1 5 10 15

Asn Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro

20 25 30

Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly

35 40 45

Ala Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn

50 55 60

Ala Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu

65 70 75 80

Gly Leu Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn

85 90 95

Asn Gly Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro

100 105 110

Gly Ala Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly

115 120 125

Val Asp Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His

130 135 140

<210> 12

<211> 77

<212> PRT

<213> Unknown

<400> 12

Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe Pro

1 5 10 15

Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn Asn

20 25 30

Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly Ala

35 40 45

Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Gln

50 55 60

Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly

65 70 75

<210> 13

<211> 63

<212> PRT

<213> Unknown

<400> 13

Phe Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys

1 5 10 15

Asn Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro

20 25 30

Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly

35 40 45

Ala Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly

50 55 60

<210> 14

<211> 426

<212> DNA

<213> Unknown

<400> 14

tttccagctg gagttagccc gcaagcctgc cccaactatc ccaattgcaa caaccctgcc 60

gtagcagttt cgccgaatgc ggccgctccg tatccgggcg cttataatcc aggtgcgtac 120

aatccgggtg catacaaccc aggcgcgcag aatccgggcg cttacaatcc aggagcctat 180

aatggcggaa atgctttgga taacggcgag tacactggag acggtgacta tcgcggcgaa 240

ggacttgccg aatccggagc gtacggaaat gctgatggtg gacacaataa cggtggctac 300

aatccaggag cttacaatcc aggcgcgtac aaccctggcg catacaaccc agcaggacac 360

gcccctggtc cagtacctgc cggtgttgat ccacactctt gtccaaatta cccattctgc 420

cattaa 426

<210> 15

<211> 234

<212> DNA

<213> Unknown

<400> 15

ggatggaacg gtccactcgc gggaggagtc ccagcccacc agtttccagc tggagttagc 60

ccgcaagcct gccccaacta tcccaattgc aacaaccctg ccgtagcagt ttcgccgaat 120

gcggccgctc cgtatccggg cgcttataat ccaggtgcgt acaatccggg tgcatacaac 180

ccaggcgcgc agaatccggg cgcttacaat ccaggagcct ataatggcgg atga 234

<210> 16

<211> 192

<212> DNA

<213> Unknown

<400> 16

tttccagctg gagttagccc gcaagcctgc cccaactatc ccaattgcaa caaccctgcc 60

gtagcagttt cgccgaatgc ggccgctccg tatccgggcg cttataatcc aggtgcgtac 120

aatccgggtg catacaaccc aggcgcgcag aatccgggcg cttacaatcc aggagcctat 180

aatggcggat ga 192

<210> 17

<211> 175

<212> PRT

<213> Unknown

<400> 17

Met Leu Val Gln Ser Asp Val Leu Ala Cys Ala Leu Ala Ile Ala Ser

1 5 10 15

Ala Ala Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala Ser Gln Ile

20 25 30

Pro Ala Gly Ile Ser Leu Gln Ala Cys Pro Asn Tyr Pro His Cys Asn

35 40 45

Asn Pro Asn Val Ala Val Glu Pro Asn Ser Pro Ala Ala Gln Gln Ala

50 55 60

Pro Gln Tyr Gln Pro Ala Pro Gln Tyr Gln Pro Ala Pro Gln Tyr Gln

65 70 75 80

Pro Ala Pro Gln Tyr Gln Pro Ala Pro Gln Gln Ser Tyr Asn Gln Asn

85 90 95

Ala Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr His Gly Glu

100 105 110

Gly Leu Ala Glu Ser Gly Ala Phe Gly Ser Thr Gly Asn Ser Gln Ala

115 120 125

Tyr Asn Ser Ala Pro Ala Tyr Gln Pro Ala Pro Ala Tyr Gln Pro Ala

130 135 140

Ser Pro Gln Tyr Asn Pro Ala Pro Ala Gln Pro Ala Ala Gln Leu Pro

145 150 155 160

Ala Gly Val Asp Ala His Ala Cys Pro Asn Tyr Pro Tyr Cys Ser

165 170 175

<210> 18

<211> 528

<212> DNA

<213> Unknown

<400> 18

atgcttgtcc aatcggacgt attagcttgc gctttggcaa tcgcttctgc cgcatggaac 60

ggtcctttgg cagggggagt accggcgtcc caaattccag ccggaattag tctgcaagct 120

tgtccaaatt atccccactg taacaatcca aacgtagcgg tcgaaccaaa ctcgccagct 180

gctcaacaag ctcctcaata ccaaccagca cctcaatatc agcctgctcc acaatatcaa 240

cctgccccgc aataccaacc tgccccacaa caatcttaca accaaaatgc tttggataat 300

ggagagtata ccggggacgg tgactatcat ggcgaaggtt tagcagaatc tggtgcattt 360

ggttcaactg gtaattcgca agcttacaac agcgcacccg cttaccaacc agcgccagcg 420

taccaaccag catcccccca atacaatcca gcaccagcac agcccgcggc tcaacttcca 480

gctggtgttg acgcacatgc atgccctaac tatccatact gcagttag 528

Claims

1.昆虫CPCFC家族表皮蛋白，其特征在于，所述蛋白的氨基酸序列包含或由如下序列组成：

a)SEQ ID NO.1所示的氨基酸序列；或，

2.如权利要求1所述的表皮蛋白，其特征在于，所述昆虫选自鞘翅目，优选双叉犀金龟；

优选地，所述b)和/或c)的氨基酸序列包含SEQ ID NO.2所示的氨基酸序列；

优选地，所述b)和/或c)的氨基酸序列包含SEQ ID NO.3所示的氨基酸序列；

优选地，所述b)和/或c)的氨基酸序列包含SEQ ID NO.17所示的氨基酸序列；

优选地，所述昆虫CPCFC家族表皮蛋白包括TdCPCFC1和TdCPCFC2表皮蛋白。

3.编码权利要求1或2所述的CPCFC家族表皮蛋白的核苷酸序列。

4.如权利要求3所述的编码CPCFC家族表皮蛋白的核苷酸序列，其特征在于，所述核苷酸序列包含或由如下序列组成：

i)SEQ ID NO.4所示的核苷酸序列；或，

ii)SEQ ID NO.4所示的核苷酸序列的互补序列、简并序列或同源序列(优选同源性50％以上)；或，

iii)在严谨条件下与SEQ ID NO.4所示的核苷酸序列杂交，且能够编码CPCFC家族表皮蛋白的核苷酸序列；

优选地，所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.5所示的核苷酸序列；

优选地，所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.6所示的核苷酸序列；

优选地，所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.18所示的核苷酸序列。

5.权利要求1或2所述的表皮蛋白，或，权利要求3或4所述的编码核苷酸序列应用于研究CPCFC家族表皮蛋白在昆虫表皮组装方式中发挥的作用。

6.用于检测权利要求3或4所述核苷酸序列的引物；

优选地，所述引物包括上游引物和/或下游引物；

优选地，所述上游引物的核苷酸序列如SEQ ID NO.7所示；和/或，所述下游引物的核苷酸序列如SEQ ID NO.8所示。

7.载体，其特征在于，包含权利要求3或4所述的核苷酸序列。

8.遗传工程化的宿主细胞，其特征在于，其包含权利要求1所述的氨基酸序列，或包含权利要求3或4所述的核苷酸序列，或导入了权利要求7所述的载体；

优选地，所述宿主细胞包括植物细胞、动物细胞或微生物细胞中的至少一种；

优选地，所述微生物细胞包括大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。

9.制备权利要求1或2所述表皮蛋白的方法，其特征在于，包括以下步骤：

将权利要求3或4所述的核苷酸序列，或权利要求6所述的载体导入宿主细胞中表达获得所述表皮蛋白；和/或，

采用权利要求7所述的遗传工程化的宿主细胞表达获得所述表皮蛋白。

10.一种生物制品，其特征在于，包括权利要求1或2所述的表皮蛋白，或所述表皮蛋白的功能性截短体，突变体，多肽；

优选地，所述生物制品包括结合金属离子制品、还原剂、凝胶、粘合剂中的至少一种。