CN113402596A

CN113402596A - 双叉犀金龟rr-2家族表皮蛋白，编码核苷酸序列及其应用

Info

Publication number: CN113402596A
Application number: CN202110577600.4A
Authority: CN
Inventors: 杨青; 刘晶; 刘田; 屈明博; 杨君
Original assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Current assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Priority date: 2021-05-26
Filing date: 2021-05-26
Publication date: 2021-09-17
Anticipated expiration: 2041-05-26
Also published as: CN113402596B

Abstract

本发明提供了一种双叉犀金龟RR‑2家族表皮蛋白，编码核苷酸序列及其应用，涉及生物工程技术领域。本发明以昆虫双叉犀金龟为研究对象，发现了一种新的RR‑2亚家族蛋白基因，命名为Td14144，并成功获得该基因的重组蛋白，具有在常温下发生液液相分离的特性，能够结合不同类型的几丁质，为研究RR‑2亚家族表皮蛋白提供了新的基因资源，将有助于阐明昆虫表皮的结构、生理功能及其在昆虫发育过程中所扮演的角色，可以用于开发具有质量轻、韧性强、抗断裂性能强、疏水等优异性能的仿生材料。

Description

双叉犀金龟RR-2家族表皮蛋白，编码核苷酸序列及其应用

技术领域

本发明涉及生物工程技术领域，具体涉及一种双叉犀金龟RR-2家族表皮蛋白，编码核苷酸序列及其应用。

背景技术

昆虫作为世界上最古老的生物，其强大的适应性以及特殊的身体构造是其如今拥有庞大数量的有力保障，表皮结构就是其中保障之一。昆虫表皮的主要组成成分是几丁质和表皮蛋白。几丁质是N-乙酰葡萄糖胺聚合而成，结构明晰。不同类型表皮的几丁质分子链长和乙酰化程度的差异很小，因而表皮蛋白基因种类和数量的变化是影响表皮结构及其机械性能的重要因素，所以，一直以来表皮蛋白被认为是昆虫重要的结构蛋白。根据昆虫表皮蛋白的序列特征，将其划分为CPR(有Rebers&Riddiford保守基序)、CPF(有一段长44个氨基酸的高度保守区域)、CPFL(CPF like)、Tweedle(含有4个保守的区域)、CPAPI(有1个ChBD2几丁质结合域)、CPAP3(有3个ChtBD2几丁质结合域)，CPG(有许多短的甘氨酸重复序列)、CPLC(一类含有低复杂序列的蛋白)和Apidermin等12个家族。其中，CRR家族可分成3个亚族，即RR-1，主要存在柔软表皮层，RR-2主要存在坚硬表皮层，RR-3，目前对其研究不多。

目前，对昆虫表皮蛋白的研究中，以模式昆虫的研究较为深入，如日本学者从家蚕翅原基化蛹前cDNA库中随机选出cDNA进行序列测定，鉴定了10种不同的表皮蛋白基因。韩国全南国立大学YasuyukiArakane课题组以赤拟谷盗为对象，研究鞘翅中高丰度的表皮蛋白功能。Nohr等利用双向电泳技术，发现飞蝗内外表皮蛋白组成具有明显的差异性。Andersen等利用MALDI–MS技术，从沙漠蝗中分析鉴定出8个内表皮蛋白；从飞蝗和蟑螂中鉴定出了多个蜕皮后蛋白(内表皮合成时期)，这些研究为表皮蛋白在昆虫变态发育和表皮形成过程的作用机制研究奠定了基础。

然而，目前对昆虫表皮蛋白的研究主要针对内外表皮差异、表皮蛋白的鉴定、分类、提取等方面，对于其生物学功能研究较少。

发明内容

本发明第一方面提供了一种双叉犀金龟(Trypoxylus dichotomu)RR-2家族表皮蛋白，所述表皮蛋白的氨基酸序列包含或由如下序列组成：

a)SEQ ID NO.1所示的氨基酸序列；或，

b)与SEQ ID NO.1所示的氨基酸序列具有至少70％序列同一性的功能性同源序列；或

c)在SEQ ID NO.1所示的氨基酸序列中缺失、添加、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。

双叉犀金龟的头角是由其表皮特化而来，它是一种天然的防御攻击武器，具有显著的抗断裂韧性和抗形变刚性。本发明以双叉犀金龟为研究对象，从其头角中发现了一种新的RR-2亚家族蛋白基因，自定义命名为Td14144，并成功获得该基因的重组蛋白(即上述的双叉犀金龟表皮蛋白，本发明中也命名为Td14144)。Td14144表皮蛋白具有在常温下发生液液相分离的特性，且能够结合不同类型的几丁质。

在本发明的一种实施方式中，所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为SEQ ID NO.1所示：GLIPAAPALSLGHAALAAPALSLGHAVGPALSLSHTALAAPAISLGHAVAAPALSLGHAAVAAPAYGIGHGLGLGYGLGHGAIAAPALVKAAPAIVKAAPAVDYVAYPKYEFNYGVSDAHTGDQKTQHEIRDGDVVKGSYSLHEADGTVRTVHYEADDHNGFNAVVTRSGHAAHPATPIAVAAPAKTIIAAPAIAHAAPVFAHAGPALAYGGLYGYKG，序列长度为218个氨基酸。

在本发明的一种实施方式中，所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为与SEQ ID NO.1所示的氨基酸序列具有至少70％序列同一性的功能性同源序列。所述功能性同源序列包括但不限于SEQ ID NO.1所示的氨基酸具有约70％或以上、72％或以上、74％或以上、76％或以上、78％或以上、80％或以上、82％或以上、84％或以上、85％或以上、88％或以上、90％或以上、92％或以上、93％或以上、94％或以上、95％或以上、96％或以上、97％或以上、98％或以上、99％或以上、99.5％或以上、99.9％或以上同一性的氨基酸序列。

在本发明的一种实施方式中，所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个(例如可以为1-10个，具体地，可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个)氨基酸且具有相同活性的氨基酸序列。例如，在SEQ ID NO.1所示的氨基酸序列的N端和/或C端连接标签得到的氨基酸序列。

在本发明的一种实施方式中，所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为SEQ ID NO.2所示：MFAKVFAIATFVATAQAGLIPAAPALSLGHAALAAPALSLGHAVGPALSLSHTALAAPAISLGHAVAAPALSLGHAAVAAPAYGIGHGLGLGYGLGHGAIAAPALVKAAPAIVKAAPAVDYVAYPKYEFNYGVSDAHTGDQKTQHEIRDGDVVKGSYSLHEADGTVRTVHYEADDHNGFNAVVTRSGHAAHPATPIAVAAPAKTIIAAPAIAHAAPVFAHAGPALAYGGLYGYKG，(划线部分为信号肽区域)，序列长度为235个氨基酸，其N端包含有长度为17个氨基酸的信号肽区域。

本发明第二方面提供了编码所述双叉犀金龟表皮蛋白Td14144的核苷酸序列。

进一步，编码表皮蛋白Td14144的核苷酸序列包含或由如下序列组成：

i)SEQ ID NO.3所示的核苷酸序列；或，

ii)SEQ ID NO.3所示的核苷酸序列的互补序列、简并序列或同源序列；或，

iii)在严紧条件下与SEQ ID NO.3所示的核苷酸序列杂交，且能够编码所述表皮蛋白的核苷

酸序列。

在本发明的一种实施方式中，所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.3所示：GGCCTAATACCAGCTGCACCAGCTCTTTCCCTTGGACATGCCGCCCTAGCAGCTCCAGCACTATCGCTTGGTCATGCTGTTGGACCGGCTCTTTCGCTTAGCCATACAGCGTTAGCCGCCCCAGCTATCTCTCTAGGTCATGCAGTTGCTGCCCCAGCTCTTTCTCTTGGTCACGCCGCTGTCGCTGCTCCAGCTTACGGAATAGGTCATGGATTGGGATTGGGGTATGGACTTGGACACGGAGCCATCGCCGCACCAGCTCTTGTTAAAGCCGCACCTGCTATCGTAAAGGCAGCTCCAGCTGTTGATTATGTGGCATATCCGAAATACGAATTCAACTACGGAGTCTCCGATGCCCACACCGGCGATCAAAAAACCCAACATGAAATCCGCGATGGTGACGTAGTAAAAGGCTCATACTCCCTCCACGAAGCCGATGGCACCGTCCGTACCGTCCACTACGAAGCCGATGATCATAACGGCTTCAACGCAGTTGTAACCAGATCAGGACACGCTGCGCATCCTGCTACACCAATTGCCGTCGCGGCTCCCGCCAAAACCATCATTGCAGCTCCAGCTATAGCGCACGCAGCCCCAGTCTTCGCGCACGCTGGTCCAGCGTTGGCGTACGGAGGATTGTACGGTTACAAGGGTTAG，序列长度为657个碱基，对应于编码具有SEQ ID NO.1所示氨基酸的双叉犀金龟表皮蛋白。

在本发明的一种实施方式中，所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.3所示的核苷酸序列按照碱基互补配对原则形成的互补序列，互补序列可以为具有编码表皮蛋白Td14144功能的不完全互补序列或完全互补序列。

在本发明的一种实施方式中，所述编码表皮蛋白Td14144的核苷酸序列为SEQ IDNO.3所示的核苷酸序列的简并序列。简并序列是指改变SEQ ID NO.3核苷酸某个或多个核苷酸序列后，改变的核苷酸序列位置对应编码的氨基酸种类不变，不会影响核苷酸序列的编码功能和表达水平。

在本发明的一种实施方式中，所述编码表皮蛋白Td14144的核苷酸序列为SEQ IDNO.3所示的核苷酸序列的同源序列。所述同源核苷酸序列包括在SEQ ID NO.3所示的核苷酸序列中添加和/或取代和/或缺失一个或几个核苷酸而生成的可编码具有表皮蛋白Td14144相同活性的突变基因、等位基因或衍生物。

进一步优选同源序列为与SEQ ID NO.3所示的核苷酸序列约70％或以上、71％或以上、72％或以上、73％或以上、74％或以上、75％或以上、76％或以上、77％或以上、78％或以上、79％或以上、80％或以上、81％或以上、82％或以上、83％或以上、84％或以上、85％或以上、86％或以上、87％或以上、88％或以上、89％或以上、90％或以上、91％或以上、92％或以上、93％或以上、94％或以上、95％或以上、96％或以上、97％或以上、98％或以上、99％或以上、99.1％或以上、99.2％或以上、99.3％或以上、99.4％或以上、99.5％或以上、99.6％或以上、99.7％或以上、99.8％或以上、或99.9％或以上同一性且具备编码表皮蛋白Td14144功能的多核苷酸。

在本发明的一种实施方式中，所述编码表皮蛋白Td14144的核苷酸序列为在严紧条件下与SEQ ID NO.3的核苷酸序列杂交，且能够编码表皮蛋白Td14144的核苷酸序列。示例性地，所述“严紧条件”是指探针将与其靶序列杂交至可探测程度超过与其它序列杂交(如至少2倍于背景)的条件。严紧条件具有序列依赖性，且因环境的不同而不同。通过控制杂交和/或洗涤条件的严紧性，可以鉴定与探针100％互补的靶序列。可选择地，可以调节严紧条件以允许一些序列错配，使得探测到较低程度的同一性。

进一步，所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.4所示：ATGTTCGCTAAGGTTTTCGCAATCGCTACATTTGTAGCCACCGCACAAGCTGGCCTAATACCAGCTGCACCAGCTCTTTCCCTTGGACATGCCGCCCTAGCAGCTCCAGCACTATCGCTTGGTCATGCTGTTGGACCGGCTCTTTCGCTTAGCCATACAGCGTTAGCCGCCCCAGCTATCTCTCTAGGTCATGCAGTTGCTGCCCCAGCTCTTTCTCTTGGTCACGCCGCTGTCGCTGCTCCAGCTTACGGAATAGGTCATGGATTGGGATTGGGGTATGGACTTGGACACGGAGCCATCGCCGCACCAGCTCTTGTTAAAGCCGCACCTGCTATCGTAAAGGCAGCTCCAGCTGTTGATTATGTGGCATATCCGAAATACGAATTCAACTACGGAGTCTCCGATGCCCACACCGGCGATCAAAAAACCCAACATGAAATCCGCGATGGTGACGTAGTAAAAGGCTCATACTCCCTCCACGAAGCCGATGGCACCGTCCGTACCGTCCACTACGAAGCCGATGATCATAACGGCTTCAACGCAGTTGTAACCAGATCAGGACACGCTGCGCATCCTGCTACACCAATTGCCGTCGCGGCTCCCGCCAAAACCATCATTGCAGCTCCAGCTATAGCGCACGCAGCCCCAGTCTTCGCGCACGCTGGTCCAGCGTTGGCGTACGGAGGATTGTACGGTTACAAGGGTTAG，序列长度为708个碱基，对应于编码具有SEQ ID NO.2所示氨基酸的双叉犀金龟表皮蛋白。

进一步，所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.5所示：

(其中，单实线下划线为T7启动子，虚线下划线为T7终止子，双实线下划线为酶切位点)序列长度为919个碱基。

本发明第三方面提供了用于检测或扩增所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列的引物。

在本发明的一种优选地实施方式中，所述引物包括上游克隆引物P1和/或下游克隆引物P2；其中，所述上游克隆引物P1的核苷酸序列如SEQ ID NO.6所示：5’-ATGTTCGCTAAGGTTTTCGCAATCG-3’；所述下游克隆引物P2的核苷酸序列如SEQ ID NO.7所示：5’-CTAACCCTTGTAACCGTACAATCCTCCG-3’。

在本发明的一种优选地实施方式中，所述引物包括上游连接引物P3和/或下游连接引物P4；其中，所述上游连接引物P3的核苷酸序列如SEQ ID NO.8所示：5’-AGGAGATATACCATGGGCTTAATACCAGCTGCACCAG-3’；所述下游连接引物P4的核苷酸序列如SEQ ID NO.9所示：5’-GACGGAGCTCGAATTCCTAACCCTTGTAACCGTACAATCCTCC-3’。

本发明中，所述双叉犀金龟表皮蛋白Td14144的应用包括以下几个方面：(1)表皮蛋白Td14144氨基酸序列或至少部分氨基酸序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性，或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质；(2)涉及表皮蛋白Td14144及相关截短体、突变体、多肽的生物合成；(3)涉及表皮蛋白Td14144开发相关生物材料的应用。

所述的编码核苷酸序列的应用包括以下几个方面：(1)本发明所提供的核苷酸序列或至少部分核苷酸序列被修饰或突变，修饰或突变的途径包括插入、缺失，聚合酶链式反应(PCR)，易错PCR，不同序列的重新连接，序列的不同部分或与其他来源的同源序列进行定向进化，或通过化学试剂诱变等。(2)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因通过合适的表达体系在外源宿主中表达以得到相应的表皮蛋白或其他更高的生物活性或产量。(3)本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径，也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。

本发明第四方面提供了与所述双叉犀金龟表皮蛋白Td14144，或所述编码核苷酸序列，或所述引物有关的生物材料或物质，其选自：

A1)：含有所述表皮蛋白Td14144的生物材料；

A2)：含有所述编码核苷酸的表达盒；

A3)：含有所述编码核苷酸的重组载体；

A4)：含有A2)所述表达盒的重组载体；

A5)：含有所述编码核苷酸的重组微生物；

A6)：含有A2)所述表达盒的重组微生物；

A7)：含有A3)所述重组载体的重组微生物；

A8)：含有A4)所述重组载体的重组微生物；

A9)：含有所述引物的试剂；

A10)含有A9)或所述引物的试剂盒。

进一步，对于重组载体的种类不作具体限定，可以根据需要选择适合的载体。例如载体包括但不限于pET28a、pcdna3.1、pUC18、pBR322、pUC19、pGEX2T或pESC-Ura，优选pET28a。

进一步，所述重组微生物包括但不限于大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。优选大肠杆菌BL21(DE3)。

本发明第五方面提供了制备所述表皮蛋白的方法，包括以下步骤：

将所述的编码表皮蛋白Td14144的核苷酸序列，或所述的相关生物材料或物质(例如所述的表达盒，所述的重组载体)导入宿主细胞中表达获得所述表皮蛋白。

本发明一种优选地实施方式中，制备所述表皮蛋白Td14144的方法，包括以下步骤：

步骤一：合成序列表SEQ ID NO.4所示的核苷酸序列；

步骤二：根据步骤一的核苷酸序列，构建的重组载体以及相对应的重组表达基因工程菌；

步骤三：将步骤二获得的重组基因工程菌进行原核表达，并对获得的蛋白进行纯化，得到所述的表皮蛋白Td14144。

本发明采用上述技术方案具有以下有益效果：

(1)本发明提供了一种新发现的双叉犀金龟RR-2亚族的表皮蛋白，为研究RR-2亚家族表皮蛋白提供了新的基因资源，将有助于阐明昆虫表皮的结构、生理功能及其在昆虫发育过程中所扮演的角色。

(2)本发明提供的双叉犀金龟表皮蛋白Td14144，具有液液相分离的特性，且能够结合不同类型的几丁质，可以用于开发具有质量轻、韧性强、抗断裂性能强、疏水等优异性能的仿生材料。

附图说明

图1所示为实施例1中表皮蛋白Td14144的基因克隆结果图。其中：M是标准核酸分子量MarkerDL2000，泳道1是大约708bp的Td14144表皮蛋白基因。

图2所示为实施例1中表皮蛋白Td14144的表达与纯化图。图中：M是标准蛋白质分子量Marker；泳道1是洗脱缓冲液为20mmol/L的咪唑浓度；泳道2是洗脱缓冲液为90mmol/L的咪唑浓度，泳道3是洗脱缓冲液为250mmol/L的咪唑浓度洗脱下来纯化的表皮蛋白Td14144；泳道4是表皮蛋白Td14144的western blot验证。

图3所示为实施例2中表皮蛋白Td14144与不同类型几丁质的选择性结合。其中，M是标准蛋白质分子量Marker；T表示全部的蛋白；E表示结合几丁质的蛋白；F表示未结合蛋白。

图4为实施例3中表皮蛋白Td14144的温度相变(LCST)。其中：左侧为4℃条件下表皮蛋白Td14144溶液，右侧是室温(25℃)下表皮蛋白Td14144溶液。

图5为实施例3中表皮蛋白Td14144在室温(25℃)条件下光学显微镜观察结果图。

具体实施方式

自定义“Td14144”可以表示双叉犀金龟的CPR家族RR-2亚族表皮蛋白，或表皮蛋白基因，或编码表皮蛋白的核苷酸序列，具体所指的含义可以结合上下文判断。

本发明中，术语“核苷酸”以本领域技术人员理解的一般含义。

本发明中，术语“氨基酸”是指任何氨基酸(标准和非标准氨基酸二者)，包括但不限于α-氨基酸、β-氨基酸、γ-氨基酸和δ-氨基酸。适合的氨基酸的实例包括但不限于丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯基丙氨酸、苏氨酸、色氨酸和缬氨酸。

本发明中，所述的“严紧条件”可为低严紧条件、中严紧条件、高严紧条件中的任一种。“低严紧条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、32℃的条件。“中严紧条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、42℃的条件。“高严紧条件”，例如，为5×SSC、5×Denhardt溶液、0.5％SDS、50％甲酰胺、50℃的条件。在上述条件中，越提高温度，越能期待高效地获得具有高同源性的DNA。影响杂交严紧性的因素可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素，本领域技术人员通过适宜选择这些因素，可实现同样的严紧条件。

除非另有定义，本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下面结合具体实施例详细描述本发明，这些实施例用于理解而不是限制本发明。

实施例1 Td14144基因的克隆及表达纯化

一.合成编码Td14144的核苷酸序列

1.双叉犀金龟总RNA的提取

本实验使用TRIzol试剂提取双叉犀金龟中的总RNA。

实验准备工作：

(1)清洗研钵、杵以及药匙，在烘箱烘干。

(2)用铝箔纸将研钵、杵以及药匙完全包裹，在电烘箱中180℃干热灭菌4h，并使之自然冷却。

(3)实验所需试剂事先遇冷处理，确保过程中于低温状态。

(4)取刚羽化成虫的双叉犀金龟，解剖并清洗后，液氮速冻2-3min，后于-80℃冰箱保存。实验操作：

(1)在超净工作台中将一套研钵、研杵、药匙用液氮充分预冷。

(2)取事先准备的双叉犀金龟样品加入研钵中。加液氮开始研磨(研磨过程中样品应时刻处于液氮保护之下)，待样品呈现出均一的粉末状，表示研磨完毕。

(3)往1.5mL离心管中加入Trizol试剂1mL，后使用预冷的药匙取一平勺样品(约100mg)于其中，震荡混匀，室温静置5min。

(4)用枪头吸取200μL酸性氯仿加入到(3)中的离心管中，在振荡器上充分震混匀，室温静置5min。再离心15min，4℃、12000rpm，用枪头吸取200μL上清，加入到新的1.5mL离心管中。

(5)用枪头吸取200μL酸性酚氯仿加入到(4)中的离心管中，在振荡器上充分震荡混匀，后室温静置5min。再离心20min，4℃、12000rpm，再用枪头吸取150μL上清，加入到新的1.5mL离心管中。

(6)用枪头吸取500μL异丙醇加入到(5)中的离心管中，反复颠倒10次。将离心管放入-20℃冰箱冷冻，促进RNA沉淀。

(7)将(6)中离心管20min，4℃、12000rpm。将上清倒掉。

(8)用RNase-free H₂O和无水乙醇配置75％乙醇1ml，清洗沉淀，离心5min，4℃，12000rpm，将上清倒掉。

(9)重复上述实验一次。

(10)室温开盖静置20min，再加入50μL RNase-free H₂O，使沉淀充分溶解。

(11)取上述产物5μL于PCR管中，其中2μL用于Nanoview测产物浓度，剩下3μL用1％琼脂糖凝胶电泳评价RNA质量。其余RNA放-80℃冰箱保存。

2.反转录合成cDNA(互补脱氧核糖核酸)第一链；

首先，在0.2mL离心管中加入：步骤1获得的3μL总RNA，1μLOligo(dT)引物(50μM)，5μL RNase free ddH₂O，混匀并短暂离心后，在65℃温浴5min后立即置于冰上10min以上，短暂离心数秒使混合好的溶液全部聚集于离心管底部，并加入4μL 5×Prime ScriptBuffer，0.5μL RNase Inhibitor(40U/μL)，1μL PrimeScipt II RTase(200U/μL)，4.5μLRNase-free Water。混匀后，在42℃下反应1h逆转录合成cDNA，随后95℃下5min使酶失活，得到的cDNA溶液用于PCR扩增。

3.PCR反应扩增表皮蛋白基因Td14144

(1)以上述步骤2获得的cDNA为模板，根据双叉犀金龟转录组测序基因序列设计引物，用于扩增表皮蛋白Td14144基因cDNA序列。

上游引物P1：5’-ATGTTCGCTAAGGTTTTCGCAATCG-3’(SEQ ID NO.6)；

下游引物P2：5’-CTAACCCTTGTAACCGTACAATCCTCCG-3’(SEQ ID NO.7)。

PCR反应体系：1μL cDNA模板，25μL 2×Premix Taq^TM，1.5μL引物P1，1.5μL引物P2，补ddH₂O至总反应体系为50μL。

PCR反应程序：①94℃，10s；②55℃，30s；③72℃，1min；30个循环。4℃保存。

(2)待PCR实验终止后，取其中的5μL PCR产物用1％琼脂糖凝胶电泳验证DNA片段大小。使用凝胶成像系统照相，并观察结果筛选基因片段大小与预测值相同的条带，按照琼脂糖凝胶DNA回收试剂盒说明书进行PCR扩增产物回收，获得合成序列表SEQ ID NO.4所示的核苷酸序列。

(3)待切胶回收完毕后，将回收的DNA片段用试剂盒连接到T载上，转化大肠杆菌感受态DH5α，选取单克隆进行测序。

二、构建重组载体和重组表达基因工程菌

重组表达载体的载体为pET-28a原核表达载体；重组表达工程菌株为大肠杆菌BL21(DE3)。

(1)通过信号肽预测确定信号肽编码序列的分割点位置，以T-vector为模板，根据信号肽之后的片段设计连接引物进行第二步PCR扩增，同时在序列两端引入20bp左右的与表达载体序列一致的同源区域，并同时在两端引入限制性内切酶的酶切位点。

连接引物P3:

5’-AGGAGATATACCATGGGCTTAATACCAGCTGCACCAG-3’(SEQ ID NO.8)；

连接引物P4:

5’-GACGGAGCTCGAATTCCTAACCCTTGTAACCGTACAATCCTCC-3’(SEQ ID NO.9).

PCR反应体系(50μL):T-vector模板1μL、2×Prime STAR HS 25μL、pET28a-14144F/R各1.5μL，补ddH2O至总反应体系为50μL。

反应条件：94℃10s,55℃30s,72℃1min，30个循环；4℃保存。

(2)利用限制性内切酶Ncol和EcoRI对表达载体质粒pET28a进行双酶切，通过In-Fusion同源重组的方法将携带目的基因的片段与切割好的载体连接成完整的连接产物pET28a-Td14144。

(3)将重组表达载体连接产物与大肠杆菌感受态细胞(E.coli BL21)混匀，放置在冰浴中30min，42℃水浴下45s，取出后再次冰浴2min；然后再加入900μL LB液体培养基，37℃，200rpm振荡培养1h；取200μL菌液于LB固体培养基(含卡那霉素50mg/L)上均匀的涂布，37℃过夜培养，得到克隆菌落。

(4)对克隆菌落进行检菌PCR，反应条件：94℃10s，55℃30s，72℃1min，30个循环；4℃保存。反应终止后，PCR产物用1％琼脂糖凝胶电泳检测大小，电泳结果见图1。

(5)挑选正确的基因片段大小的单克隆菌落接种于10ml LB(含卡那霉素)培养液中37℃、200rpm振荡过夜，用质粒提取试剂盒提取质粒，送样测序。获得测序正确的重组工程菌株。

三、Td14144蛋白表达与纯化

(1)将测序验证无误后的表达质粒pET28a-Td14144转化入大肠杆菌表达株BL21(DE3)，菌株活化后扩大培养到对数生长期OD600为0.5-0.6，加入诱导剂IPTG使终浓度为0.1mmol/L，37℃诱导5小时后离心收集细菌。取少量菌液室温12000g离心1min，收集菌体，弃去上清液；使用破碎缓冲液(20mM Tris，500mM NaCl，pH7.4)重悬菌体进行超声破碎，离心收集上清液，进行SDS-PAGE与western blot检测。

(2)将检测后的pET28a-Td14144/BL21重组工程菌株接种于10mL的LB(含卡那霉素50mg/L)液体培养基中，37℃，200rpm振荡过夜，按1:100比例接种于1000mL的LB(含卡那霉素50mg/L)液体培养基中，37℃培养至吸光值OD600为0.5-0.6，加入IPTG诱导重组蛋白的大量表达，诱导结束后10000g离心10min收集菌体；

(3)加破碎缓冲液(20mM Tris，500mM NaCl，pH7.4)重悬后，利用高压匀浆破碎仪破碎细菌，离心去除胞片沉淀上清过镍子亲和层析柱；用AKTA蛋白纯化仪对Td14144蛋白进行洗涤(20mMTris，500mM NaCl，20mM咪唑；20mMTris，500mM NaCl，90mM咪唑，pH 7.4)和洗脱(20mM Tris，500mM NaCl，250mM咪唑，pH7.4)。并进行聚丙烯酰胺凝胶电泳(SDS-PAGE)与免疫印迹试验(western blot)检测，获得纯化的重组表皮蛋白Td14144，其氨基酸序列如SEQ ID NO.1所示。

实施例2检测Td14144蛋白与几丁质结合能力

实验目的：检测表皮蛋白Td14144与不同类型的几丁质结合能力

实验过程：选择α-几丁质(α-chitin)、β-几丁质(β-chitin)、胶体几丁质(colloidal chitin)和壳聚糖(chitosan)4种类型的几丁质与重组表达的表皮蛋白Td14144进行体外结合实验。

具体操作：将纯化后的重组表达蛋白透析到结合缓冲液(20mM Tris，pH8.0)中。构建200μL反应体系，使蛋白终浓度为0.5mg/mL，几丁质终浓度为2mg/mL。反应在室温(25℃)进行，蛋白与不同类型几丁质在2mL离心管中持续颠倒混匀4h。反应结束后，12000r/min离心10min，将上清取出记为未结合几丁质的蛋白。向沉淀中加入1mL的结合缓冲液(20mMTris，pH8.0)，将沉淀重悬并颠倒混匀，而后13000g离心5min，弃上清，从而完成一次沉淀的清洗。重复3-5次。最后再沉淀中加入50μL的电泳上样缓冲液煮沸5min，13000g离心5min，弃沉淀，收集上清液记为结合几丁质蛋白。最后使用聚丙烯酰胺凝胶电泳检测各收集组分。

实验结论：重组蛋白Td14144与几丁质结合能力检测结果见图3，重组蛋白Td14144与α-几丁质、β-几丁质、壳聚糖和胶体几丁质4种类型的几丁质均能结合。

实施例3检测Td14144蛋白的液液相分离特性

实验过程：首先，用肉眼观察在不同温度下Td14144蛋白溶液产生液液相分离(Liquid-liquid phase separation，LLPS)的宏观情况。肉眼观察蛋白溶液发现Td14144蛋白在4℃条件下是清澈透明的状态，随着温度升高到室温(25℃)，蛋白溶液逐渐由澄清变浑浊，结果见图4。

在室温下用光学显微镜观察其蛋白溶液，发现Td14144蛋白出现团聚体(Ccoacervate)现象，结果见图5，蛋白溶液中出现的不均一的圆球即为团聚体。

团聚体具有流动形变性，并能够相互融合形成更大的团聚体；而且团聚体形成与消失是可逆的，温度升高至室温团聚体形成，当温度降低到4℃条件时团聚体会消失，蛋白溶液恢复澄清状态。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换等，均应包含在本发明的保护范围之内。

序列表

<110> 中国农业科学院农业基因组研究所

<120> 双叉犀金龟RR-2家族表皮蛋白，编码核苷酸序列及其应用

<141> 2021-05-26

<160> 9

<170> SIPOSequenceListing 1.0

<210> 1

<211> 218

<212> PRT

<213> Unknown

<400> 1

Gly Leu Ile Pro Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Leu

1 5 10 15

Ala Ala Pro Ala Leu Ser Leu Gly His Ala Val Gly Pro Ala Leu Ser

20 25 30

Leu Ser His Thr Ala Leu Ala Ala Pro Ala Ile Ser Leu Gly His Ala

35 40 45

Val Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Val Ala Ala Pro

50 55 60

Ala Tyr Gly Ile Gly His Gly Leu Gly Leu Gly Tyr Gly Leu Gly His

65 70 75 80

Gly Ala Ile Ala Ala Pro Ala Leu Val Lys Ala Ala Pro Ala Ile Val

85 90 95

Lys Ala Ala Pro Ala Val Asp Tyr Val Ala Tyr Pro Lys Tyr Glu Phe

100 105 110

Asn Tyr Gly Val Ser Asp Ala His Thr Gly Asp Gln Lys Thr Gln His

115 120 125

Glu Ile Arg Asp Gly Asp Val Val Lys Gly Ser Tyr Ser Leu His Glu

130 135 140

Ala Asp Gly Thr Val Arg Thr Val His Tyr Glu Ala Asp Asp His Asn

145 150 155 160

Gly Phe Asn Ala Val Val Thr Arg Ser Gly His Ala Ala His Pro Ala

165 170 175

Thr Pro Ile Ala Val Ala Ala Pro Ala Lys Thr Ile Ile Ala Ala Pro

180 185 190

Ala Ile Ala His Ala Ala Pro Val Phe Ala His Ala Gly Pro Ala Leu

195 200 205

Ala Tyr Gly Gly Leu Tyr Gly Tyr Lys Gly

210 215

<210> 2

<211> 235

<212> PRT

<213> Unknown

<400> 2

Met Phe Ala Lys Val Phe Ala Ile Ala Thr Phe Val Ala Thr Ala Gln

1 5 10 15

Ala Gly Leu Ile Pro Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala

20 25 30

Leu Ala Ala Pro Ala Leu Ser Leu Gly His Ala Val Gly Pro Ala Leu

35 40 45

Ser Leu Ser His Thr Ala Leu Ala Ala Pro Ala Ile Ser Leu Gly His

50 55 60

Ala Val Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Val Ala Ala

65 70 75 80

Pro Ala Tyr Gly Ile Gly His Gly Leu Gly Leu Gly Tyr Gly Leu Gly

85 90 95

His Gly Ala Ile Ala Ala Pro Ala Leu Val Lys Ala Ala Pro Ala Ile

100 105 110

Val Lys Ala Ala Pro Ala Val Asp Tyr Val Ala Tyr Pro Lys Tyr Glu

115 120 125

Phe Asn Tyr Gly Val Ser Asp Ala His Thr Gly Asp Gln Lys Thr Gln

130 135 140

His Glu Ile Arg Asp Gly Asp Val Val Lys Gly Ser Tyr Ser Leu His

145 150 155 160

Glu Ala Asp Gly Thr Val Arg Thr Val His Tyr Glu Ala Asp Asp His

165 170 175

Asn Gly Phe Asn Ala Val Val Thr Arg Ser Gly His Ala Ala His Pro

180 185 190

Ala Thr Pro Ile Ala Val Ala Ala Pro Ala Lys Thr Ile Ile Ala Ala

195 200 205

Pro Ala Ile Ala His Ala Ala Pro Val Phe Ala His Ala Gly Pro Ala

210 215 220

Leu Ala Tyr Gly Gly Leu Tyr Gly Tyr Lys Gly

225 230 235

<210> 3

<211> 657

<212> DNA

<213> Unknown

<400> 3

ggcctaatac cagctgcacc agctctttcc cttggacatg ccgccctagc agctccagca 60

ctatcgcttg gtcatgctgt tggaccggct ctttcgctta gccatacagc gttagccgcc 120

ccagctatct ctctaggtca tgcagttgct gccccagctc tttctcttgg tcacgccgct 180

gtcgctgctc cagcttacgg aataggtcat ggattgggat tggggtatgg acttggacac 240

ggagccatcg ccgcaccagc tcttgttaaa gccgcacctg ctatcgtaaa ggcagctcca 300

gctgttgatt atgtggcata tccgaaatac gaattcaact acggagtctc cgatgcccac 360

accggcgatc aaaaaaccca acatgaaatc cgcgatggtg acgtagtaaa aggctcatac 420

tccctccacg aagccgatgg caccgtccgt accgtccact acgaagccga tgatcataac 480

ggcttcaacg cagttgtaac cagatcagga cacgctgcgc atcctgctac accaattgcc 540

gtcgcggctc ccgccaaaac catcattgca gctccagcta tagcgcacgc agccccagtc 600

ttcgcgcacg ctggtccagc gttggcgtac ggaggattgt acggttacaa gggttag 657

<210> 4

<211> 708

<212> DNA

<213> Unknown

<400> 4

atgttcgcta aggttttcgc aatcgctaca tttgtagcca ccgcacaagc tggcctaata 60

ccagctgcac cagctctttc ccttggacat gccgccctag cagctccagc actatcgctt 120

ggtcatgctg ttggaccggc tctttcgctt agccatacag cgttagccgc cccagctatc 180

tctctaggtc atgcagttgc tgccccagct ctttctcttg gtcacgccgc tgtcgctgct 240

ccagcttacg gaataggtca tggattggga ttggggtatg gacttggaca cggagccatc 300

gccgcaccag ctcttgttaa agccgcacct gctatcgtaa aggcagctcc agctgttgat 360

tatgtggcat atccgaaata cgaattcaac tacggagtct ccgatgccca caccggcgat 420

caaaaaaccc aacatgaaat ccgcgatggt gacgtagtaa aaggctcata ctccctccac 480

gaagccgatg gcaccgtccg taccgtccac tacgaagccg atgatcataa cggcttcaac 540

gcagttgtaa ccagatcagg acacgctgcg catcctgcta caccaattgc cgtcgcggct 600

cccgccaaaa ccatcattgc agctccagct atagcgcacg cagccccagt cttcgcgcac 660

gctggtccag cgttggcgta cggaggattg tacggttaca agggttag 708

<210> 5

<211> 919

<212> DNA

<213> Unknown

<400> 5

taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60

tgtttaactt taagaaggag atataccatg ggcttaatac cagctgcacc agctctttcc 120

cttggacacg ccgccctagc agctccagca ctatcgcttg ggcatgctgt tggaccggct 180

ctttcgctta gccatacagc gttagccgcc ccagctatct ctctaggtca tgcagttgct 240

gctccagctc tttctcttgg tcacgccgct gtcgctgctc cagcttacgg aataggtcat 300

ggattgggat tgggttatgg acttggacac ggagccatcg ccgcaccagc tcttgttaaa 360

gccgcacctg ctatcgtaaa ggcagctcca gctgttgatt atgtggcata tccgaaatac 420

gaattcaact acggagtctc cgatgcccac accggcgatc aaaaaaccca acatgaaatc 480

cgcgatggtg acgtagtaaa aggctcatac tccctccacg aagctgatgg caccgtccgt 540

accgtccact acgaagccga tgatcataac ggcttcaacg cagttgtaac cagatcagga 600

cacgctgcgc atcctgctac accaattgcc gtcgcggctc ccgccaaaac catcattgca 660

gctccagcta tagcgcacgc agccccagtc ttcgcgcacg ctggtccagc gttggcgtac 720

ggaggattgt acggttacaa gggttaggaa ttcgagctcc gtcgacaagc ttgcggccgc 780

actcgagcac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 840

tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 900

ggtcttgagg ggttttttg 919

<210> 6

<211> 25

<212> DNA

<213> Artificial Sequence

<400> 6

atgttcgcta aggttttcgc aatcg 25

<210> 7

<211> 28

<212> DNA

<213> Artificial Sequence

<400> 7

ctaacccttg taaccgtaca atcctccg 28

<210> 8

<211> 37

<212> DNA

<213> Artificial Sequence

<400> 8

aggagatata ccatgggctt aataccagct gcaccag 37

<210> 9

<211> 43

<212> DNA

<213> Artificial Sequence

<400> 9

gacggagctc gaattcctaa cccttgtaac cgtacaatcc tcc 43

Claims

1.一种双叉犀金龟RR-2家族表皮蛋白，其特征在于，所述表皮蛋白的氨基酸序列包含或由如下序列组成：

a)SEQ ID NO.1所示的氨基酸序列；或，

2.根据权利要求1所述的表皮蛋白，其特征在于，所述b)和/或c)的氨基酸序列包含SEQID NO.2所示的氨基酸序列。

3.编码权利要求1或2所述的表皮蛋白的核苷酸序列。

4.根据权利要求3所述的编码表皮蛋白的核苷酸序列，其特征在于，所述核苷酸序列包含或由如下序列组成：

i)SEQ ID NO.3所示的核苷酸序列；或，

ii)SEQ ID NO.3所示的核苷酸序列的互补序列、简并序列或同源序列(优选同源性70％以上)；或，

iii)在严紧条件下与SEQ ID NO.3所示的核苷酸序列杂交，且能够编码所述表皮蛋白的核苷酸序列。

5.根据权利要求4所述的编码表皮蛋白的核苷酸序列，其特征在于，所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.4所示的核苷酸序列；

优选地，所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.5所示的核苷酸序列。

6.用于检测或扩增权利要求3-5任一项所述核苷酸序列的引物，所述引物包括上游引物和/或下游引物。

7.根据权利要求6所述的引物，其特征在于，所述上游引物P1的核苷酸序列如SEQ IDNO.6所示；和/或，所述下游引物P2的核苷酸序列如SEQ ID NO.7所示；

优选地，所述上游引物P3的核苷酸序列如SEQ ID NO.8所示；和/或，所述下游引物P4的核苷酸序列如SEQ ID NO.9所示。

8.与权利要求1或2所述表皮蛋白，或权利要求3-5任一项所述编码核苷酸序列，或权利要求6或7所述引物有关的生物材料或物质，其选自：

A1)：含有所述表皮蛋白的生物材料；

A2)：含有所述编码核苷酸的表达盒；

A3)：含有所述编码核苷酸的重组载体；

A4)：含有A2)所述表达盒的重组载体；

A5)：含有所述编码核苷酸的重组微生物；

A6)：含有A2)所述表达盒的重组微生物；

A7)：含有A3)所述重组载体的重组微生物；

A8)：含有A4)所述重组载体的重组微生物；

A9)：含有所述引物的试剂；

A10)含有A9)或所述引物的试剂盒。

9.根据权利要求8所述的生物材料或物质，其特征在于，所述重组载体包括pET28a、pcdna3.1、pUC18、pBR322、pUC19、pGEX2T、pESC-Ura中的至少一种；更优选pET28a；

优选地，所述重组微生物包括大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种；更优选大肠杆菌BL21(DE3)。

10.制备权利要求1或2所述表皮蛋白的方法，其特征在于，包括以下步骤：

将权利要求3-5任一项所述的核苷酸序列，或权利要求8中所述的相关生物材料或物质导入宿主细胞中表达获得所述表皮蛋白。