CN114106150A

CN114106150A - 重组胶原蛋白、制备方法及其应用

Info

Publication number: CN114106150A
Application number: CN202111470250.8A
Authority: CN
Inventors: 李佳佳; 王丽萍; 刘慧敏; 蒋雯雯; 钱晨明; 程鹏飞; 钱松
Original assignee: Jiangsu Chuangjian Medical Technology Co ltd
Current assignee: Jiangsu Chuangjian Medical Technology Co ltd
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2022-03-01
Anticipated expiration: 2041-12-03
Also published as: GB202407559D0; EP4428148A1; CN114106150B; GB2626519A; KR20240099399A; WO2023098523A1

Abstract

本发明涉及重组胶原蛋白、制备方法及其应用，尤其涉及重组表达的全长的胶原蛋白α1链、制备方法及其应用，属于胶原蛋白表达技术领域。本发明中构建的人Ⅰ型胶原蛋白α1链(α1(Ⅰ)链)的变体(记为α1(Ⅰ)M1)和人Ⅱ型胶原蛋白α1链(α1(Ⅱ)链)的变体(记为α1(Ⅱ)M6)于毕赤酵母中重组表达时，均消除了天然全长的α1(Ⅰ)链、α1(Ⅱ)链重组表达时出现的与全长α1链目的产物(目的条带)占比量基本相同的主降解产物(主降解条带)，提高了目的产物的产率，且与毕赤酵母中重组表达的天然全长的α1(Ⅰ)链胶原蛋白与α1(Ⅱ)链胶原蛋白相比有类似的理化特征和生物学活性，均有应用于生物医学材料领域的价值。

Description

重组胶原蛋白、制备方法及其应用

技术领域

本发明涉及重组胶原蛋白、制备方法及其应用，尤其涉及重组表达的全长的胶原蛋白α1链、制备方法及其应用，属于胶原蛋白表达技术领域。

背景技术

Ⅰ、Ⅱ型胶原蛋白是人体内中典型的成纤维胶原蛋白，均由3条α肽链构成，每条α肽链均包含由氨基端肽区、特征性(G-X-Y)n三联重复序列区、羧基端肽区三部分。

Ⅰ型胶原蛋白由两条α1链和一条α2链构成，是人体内所含的各种胶原蛋白中最丰富的一种，存在于肌肉、皮肤、动脉壁、纤维软骨中。Ⅱ型胶原蛋白由三条α1链构成，主要分布在软骨组织、玻璃体、眼角膜中，占成人软骨基质胶原蛋白总量的90％以上，是软骨和骨型形成、骨骼生长和成熟软骨维持等所必需的成份。

作为一种重要的天然生物蛋白，胶原蛋白有良好的生物相容性、生物活性和可降解性等独特功能特征，可广泛应用于化工、医药、食品、化妆品等众多领域，尤其适合制备多种生物器械，是最为理想的生物材料来源，具有广阔的应用前景。

市场上销售胶原蛋白主要是利用酸、碱、酶解法处理动物组织获得的胶原提取物：加工过程降解严重，使其生物活性丧失；提取的胶原肽长度不等、性质不均、质量不稳定且有疯牛病、口蹄疫等病毒感染的安全隐患；同时动物源与人的胶原蛋白的氨基酸序列差别较大，属于异源性蛋白，会导致免疫排斥和过敏症状。

基因工程技术生产重组胶原蛋白则可有效避免这些缺陷。现有重组胶原蛋白的表达方法中，哺乳动物细胞表达系统、昆虫细胞(杆状病毒)表达系统、转基因动植物等表达系统成本高、产量低、周期长，多用于科研阶实验；大规模工业化生产中主要由原核(大肠杆菌)表达系统、毕赤酵母表达系统来表达人胶原蛋白。大肠杆菌中没有蛋白质的翻译后修饰，大规模表达为胞内表达，需裂解菌体，产生的大量杂质宿主蛋白和天然带有的(细胞壁成分)内毒素、肽聚糖，均需经复杂纯化工艺方能去除。但对于毕赤酵母来说，人胶原蛋白毕竟是一种外源蛋白，表达时会占用较多的细胞内资源(其所依赖的甲醇代谢途径最多可表达细胞可溶性蛋白30％的蛋白)，细胞内会针对外源性的蛋白质进行相应调节，典型的状况是重组蛋白会出现严重的降解，人Ⅰ、Ⅱ型胶原蛋白的α1链均为1000个氨基酸以上的长肽链，更易产生降解。

成熟的人Ⅰ、Ⅱ型胶原蛋白的α1链序列均包含氨基端肽、三螺旋区域、羧基端肽三部分，人Ⅰ型胶原蛋白α1链(后文中按规范称之为α1(Ⅰ))全长1057AA，人Ⅱ型胶原蛋白α1链(后文中按规范称之为α1(Ⅱ))全长1060AA。以毕赤酵母表达人α1(Ⅰ)链的研究、专利较多，表达人α1(Ⅱ)链的研究、专利较少。现有毕赤酵母表达全长α1(Ⅰ)链、全长α1(Ⅱ)链的成果中，大部分研究中均只表达了α1(Ⅰ)链的部分序列，而非成熟的全长α1(Ⅰ)链序列。有一些公开的成果中虽然表达了全长的α1(Ⅰ)链，但均会于表达时产生与目的产物占比基本相同的主降解产物，于SDS-PAGE电泳上表现为一条几乎与全长α1链目的条带(目的产物)占比量基本相当的主降解条带(主降解产物)。这样的降解不但降低表达生产的全长α1链的产量，而且因其与全长α1链的相关性质接近，想获得高纯度的单一全长α1链产品还需要进行两步双亲和纯化方能获得，增加了纯化艺复杂程度，相应的提高了纯化成本。所以保持全长肽链完整、减少降解，同时保持胶原蛋白生物学活性不发生改变是以毕赤酵母生产重组胶原蛋白面临的重要挑战。

发明内容

本发明的目的在于，克服现有技术中存在的一些技术问题，提供毕赤酵母重组表达的全长的胶原蛋白α1链、制备方法及其应用。本发明中的重组人Ⅰ型胶原蛋白α1链的变体(记为α1(Ⅰ)M1)和重组人Ⅱ型胶原蛋白α1链的变体(记为α1(Ⅱ)M6)，相对于天然全长的α1(Ⅰ)链与α1(Ⅱ)链，在毕赤酵母中表达时均消除了几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物)，提高了目的产物的产率；与毕赤酵母表达的天然全长的α1(Ⅰ)链胶原蛋白与α1(Ⅱ)链胶原蛋白及商品化人胶原蛋白有类似的理化特征和相同的生物学活性，均有应用于生物医学材料领域的价值。

为实现上述目的，本发明采用了以下技术方案：

本发明提供了重组胶原蛋白α1链，所述重组胶原蛋白α1链为α1(Ⅰ)M1或α1(Ⅱ)M6，所述α1(Ⅰ)M1由人Ⅰ型胶原蛋白α1链的天然全长氨基酸序列经过氨基酸突变获得，所述α1(Ⅱ)M6由人Ⅱ型胶原蛋白α1链天然全长氨基酸序列经过氨基酸突变获得。

优选的，所述α1(Ⅰ)M1的氨基酸突变的位点数为4；所述α1(Ⅱ)M6的氨基酸突变位点数为9。

优选的，所述人Ⅰ型胶原蛋白α1链为SEQ.NO.ID.1所示，所述氨基酸突变的位点为第106位的M、109位的R、190位的M、193位的R，具体的，均改变为P；

所述人Ⅱ型胶原蛋白的α1链为SEQ.NO.ID.4所示，所述氨基酸突变的位点为第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R，具体的，均改变为P。

进一步的，所述α1(Ⅰ)M1的氨基酸序列如SEQ.NO.ID.2所示，所述α1(Ⅱ)M6的氨基酸序列如SEQ.NO.ID.5所示。

本发明中，氨基酸序列突变的位点上相应氨基酸变更的种类发生一些变化，即突变的位点相同，但变更的氨基酸种类不同，也会产生与本专利类似的技术效果；改变其中一处或几处进行突变处理，也有可能获得与本专利类似的技术效果。

本发明还提供编码所述重组胶原蛋白α1链的核苷酸，所述编码重组胶原蛋白α1链的核苷酸序列包括编码α1(Ⅰ)M1或α1(Ⅱ)M6的核苷酸序列。

进一步的，所述编码α1(Ⅰ)M1和核苷酸序列如SEQ.NO.ID.3所示，编码α1(Ⅱ)M6的核苷酸序列如SEQ.NO.ID.6所示。

本发明还提供了重组表达载体，含有编码所述重组胶原蛋白α1链的核苷酸。

本发明还提供由上述重组表达载体构建的工程菌，所述工程菌含有所述重组表达载体或表达所述重组胶原蛋白α1链。

所述工程菌的宿主菌优选为毕赤酵母，所述工程菌保藏日期为2021年03月11日，保藏编号为CGMCC NO.21891或CGMCCNO.21892，分类命名为巴斯德毕赤酵母Pichiapastoris，保藏单位为中国微生物菌种保藏管理委员会普通微生物中心，地址为北京市朝阳区北辰西路1号院3号。其中保藏编号为CGMCC NO.21891的工程菌表达的是重组α1(Ⅰ)M1胶原蛋白α1链，保藏编号为CGMCC CGMCCNO.21892的工程菌表达的是重组α1(Ⅱ)M6胶原蛋白α1链。

需要说明的是，本发明的宿主菌不限于毕赤酵母，只要根据本发明的方法，于毕赤酵母或其它种类的酵母菌中均可分泌表达，理论上均可获得与本专利类似的技术效果。

本发明还提供所述重组表达载体或所述的工程菌在表达所述重组胶原蛋白α1链中的应用。

本发明还提供了所述重组胶原蛋白α1链的制备方法，包括：

(1)合成编码重组胶原蛋白α1链的核苷酸序列：

将天然胶原蛋白α1链序列将其氨基酸序列位点上相应氨基酸进行改变，Ⅰ型胶原蛋白的α1链改变4个氨基酸得到α1(Ⅰ)M1，Ⅱ型胶原蛋白的α1链改变9个氨基酸得到α1(Ⅱ)M6；在序列的氨基端和羧基端添加亲和纯化标签，合成编码α1(Ⅰ)M1、α1(Ⅱ)M6的DNA序列，使其含有双特异性亲和纯化标记，这样便于以两种标签序列为基础进行免疫学抗体检测。

经检测表明，α1(Ⅰ)M1、α1(Ⅱ)M6分别消除了全长α1(Ⅰ)链、全长α1(Ⅱ)链于毕赤酵母中表达时所产生的一条几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物)。

α1(Ⅰ)M1、α1(Ⅱ)M6相对天然原始序列，其突变的氨基酸位于特征性的(G-X-Y)n三联重复区域，但均是位于X、Y上的氨基酸，并没有改变胶原蛋白(G-X-Y)n三联重复的氨基酸序列结构特征；且仍保持与原胶原蛋白类似的理化特征和生物学活性。

(2)构建重组表达载体：

将合成的DNA连接入表达载体pPIC9K中，分别构建表达重组α1(Ⅰ)M1胶原蛋白的pPIC9K-COL1A1M1和表达重组α1(Ⅱ)M6胶原蛋白的pPIC9K-COL2A1M6两种重组表达载体。

(3)构建重组工程菌株、诱导表达和菌株筛选：

以Sac I线性化重组表达载体，电转入毕赤酵母感受态细胞，转涂至MD平板初筛后，再经过含有不同浓度G418的YPD平板筛选，挑取菌落接入BMGY培养基中，再以BMMY培养基诱导表达；筛选表达量高的工程菌株。

所述筛选到的表达量高的工程菌为巴斯德毕赤酵母Pichia pastoris，保藏编号分别为CGMCC NO.21891、CGMCC NO.21892。

(4)高密度发酵培养：

将经过蛋白质表达鉴定表达量高的工程菌，采用发酵罐进行高密度发酵培养。

(5)蛋白质纯化：

使用一次阳离子交换层析对发酵上清液进行纯化，以冷冻干燥的方法获得纯度高的α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白。

本发明中将得到的重组胶原蛋白进行蛋白性质表征和体外实验，对获取的毕赤酵母表达的α1(Ⅰ)M1、α1(Ⅱ)M6进行分析验证，本发明得到的蛋白符合重组胶原蛋白结构特征，具有细胞粘附活性，与商品化的人胶原蛋白基本一致，更重要的是2种变体蛋白与未突变前的胶原蛋白的结构特征、细胞黏附活性是类似的或相同的。

本发明还提供一种组合物，所述组合物包含所述重组胶原蛋白α1链或上述方法制备的胶原蛋白α1链。

本发明还提供一种制品，所述制品包含所述重组胶原蛋白α1链或上述方法制备的胶原蛋白α1链或上述组合物。所述制品包括但不局限于药物、药物组合物、医疗器材、生物材料、组织工程产品、化妆品或保健品等。

进一步的，所述制品包括为细胞提供黏附、支撑、生长迁移空间的材料或作为输送营养物质与新陈代谢产物通道的材料。

进一步的，所述制品为胶原蛋白水凝胶。

本发明还提供所述重组胶原蛋白α1链、核苷酸、重组表达载体、工程菌、组合物等在制备制成品中的用途，包括但不限于药物、医疗器材、生物材料、组织工程产品、化妆品或保健品中的用途。

本发明还提供所述重组胶原蛋白α1链、核苷酸、重组表达载体、工程菌或组合物在制备促进创伤修复或组织再生的产品中的用途；进一步的，所述产品为胶原蛋白水凝胶。

本发明的有益效果：

(1)本发明中胶原蛋白α1链变体，改变的氨基酸位点于天然原始序列中占比极少(突变的氨基酸占比低于1％，突变前后氨基酸序列同源性均高于99％)、得到完整的重组α1链胶原蛋白的同时并没有改变原始蛋白本身的性质(理化特性、生物学活性)、并且制备成相关产品的时候与天然序列的重组蛋白有相同的性质、生物学活性等。

α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比，有类似的理化特征和生物学活性，均有应用于生物医学材料领域的价值。本发明通过进行α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)的细胞粘附实验发现，α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比，细胞粘附活性无明显差别，且均与商品化的人胶原蛋白基本一致。使用毕赤酵母表达的α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白制备胶原蛋白水凝胶，对水凝胶的液体力学特征进行检测，α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比，其所制备的水凝胶在黏度、弹性模量、溶胀度上均无明显区别。使用扫描电镜扫描冻干后的胶原蛋白水凝胶，均为多孔网状结构，孔径范围集中于100-200μm，有应用于生物医学材料领域的潜力。将四种胶原蛋白水凝胶与NIH/3T3细胞于体外共培养，加入钙黄黄绿AM后，可检测到黏附、生长于水凝胶中的发绿色荧光的活细胞；加入MTT检测，均可观察到黏附、迁移生长至水凝胶内部的活细胞形成的蓝紫色结晶。

(2)本发明通过SDS-PAGE电泳、Western Blot对表达的蛋白质进行鉴定，结果表明，相对于全长的α1(Ⅰ)链与α1(Ⅱ)链，α1(Ⅰ)M1与α1(Ⅱ)M6在毕赤酵母中表达时均消除了几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物)，提高了目的产物的产率。并且，通过采用发酵罐进行高密度发酵实验，发酵产物经SDS-PAGE电泳检测发现，α1(Ⅰ)M1、α1(Ⅱ)M6可于高密度发酵条件下仍能保持目的条带的完整性，主降解条带依然不会产生，而同样高密度发酵条件下发酵生产的重组人α1(Ⅰ)、α1(Ⅱ)则会产生明显的主降解条带。

并且，本发明的重组胶原蛋白只需要使用一次阳离子交换层析对发酵上清液进行纯化，以冷冻干燥的方法获得纯度高的α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白冻干海绵，经SDS-PAGE电泳检测，其主要是作为目的产物的单一条带，无主降解条带，获得了纯度高目的产物，降低了纯化的成本。而α1(Ⅰ)、α1(Ⅱ)同样以一步阳离子交换层析则只能获得目的条带(目的产物，全长α1链)、主降解条带(主降解产物)混合的纯化蛋白，需要两步亲和层析方能获得纯度高的α1(Ⅰ)、α1(Ⅱ)胶原蛋白。

附图说明

图1为α1(Ⅰ)M1与α1(Ⅰ)氨基酸序列的差异图，图中灰色背景、加粗的氨基酸所示为差异位点。

图2为α1(Ⅱ)M6与α1(Ⅱ)氨基酸序列的差异图，图中灰色背景、加粗的氨基酸所示为差异位点。

图3为pPIC9K-COL1A1M1载体图谱。

图4为pPIC9K-COL2A1M6载体图谱。

图5为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白诱导表达24h的上清的SDS-PAGE图。

图6为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白诱导表达24h的上清的WB图，图中，左边为抗6×His Tag抗体的WB图，右边为抗Strep-Tag II抗体的WB图。

图7为α1(Ⅰ)、α1(Ⅱ)胶原蛋白SDS-PAGE检测结果中目的条带、主降解条带质谱分析结果。

图8为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白SDS-PAGE检测结果中目的条带质谱分析结果。

图9为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白诱导48h发酵上清的SDS-PAGE图。

图10为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)纯化后冻干海绵的SDS-PAGE图。

图11为α1(Ⅰ)、α1(Ⅱ)胶原蛋白傅里叶变换红外光谱(FT-IR)分析图。

图12为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白傅里叶变换红外光谱(FT-IR)分析图。

图13为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白细胞黏附活性检测。

图14为冻干α1(Ⅰ)、α1(Ⅰ)M1胶原蛋白水凝胶表面扫描电镜图(上两图α1(Ⅰ)胶原蛋白水凝胶，下两图α1(Ⅰ)M1胶原蛋白水凝胶)。

图15为冻干α1(Ⅱ)、α1(Ⅱ)M6胶原蛋白水凝胶表面扫描电镜图(上两图α1(Ⅱ)胶原蛋白水凝胶，下两图α1(Ⅱ)M6胶原蛋白水凝胶)。

图16为α1(Ⅰ)、α1(Ⅰ)M1胶原蛋白水凝胶中NIH/3T3细胞黏附生长结果图。

图中，上三图从左至右分别为：α1(Ⅰ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅰ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色，明亮部分为发绿色荧光的细胞，荧光显微镜拍摄)、α1(Ⅰ)胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色，黑色部分为结晶，明场显微镜拍摄)；

下三图从左至右分别为：α1(Ⅰ)M1胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅰ)M1胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色，明亮部分为发绿色荧光的细胞，荧光显微镜拍摄)、α1(Ⅰ)M1胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色，黑色部分为结晶，明场显微镜拍摄)。

图17为α1(Ⅱ)、α1(Ⅱ)M6胶原蛋白水凝胶中NIH/3T3细胞黏附生长结果图。

图中，上三图从左至右分别为：α1(Ⅱ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅱ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色，明亮部分为发绿色荧光的细胞，荧光显微镜拍摄)、α1(Ⅱ)胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色，黑色部分为结晶，明场显微镜拍摄)；

下三图从左至右分别为：α1(Ⅱ)M6胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅱ)M6胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色，明亮部分为发绿色荧光的细胞，荧光显微镜拍摄)、α1(Ⅱ)M6胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色，黑色部分为结晶，明场显微镜拍摄)。

具体实施方式

为了使本领域技术人员更好的理解本发明的技术方案，下面对本发明的较佳实施例进行详细的阐述，但是如下实施例并不限制本发明的保护范围。

本发明的实施例中，没有多作说明的都是采用常规分子生物学实验方法完成，实施例中所涉及PCR、酶切、连接、密码子优化等过程都是本领域技术人员根据产品说明书或本领域基础知识可以理解并且容易实现的，因此不再详细描述。

实施例1.氨基酸序列的设计和合成

人Ⅰ型胶原蛋白α1链(记为α1(Ⅰ))的氨基酸序列参考Uniprot数据库P02452-1(https://www.uniprot.org/uniprot/P02452)序列中第162–1218部分(PRO_0000005720)，是成熟形态人Ⅰ型胶原蛋白α1链氨基酸序列，不含信号肽、C端前肽、N端前肽等α1(Ⅰ)前体蛋白中会加工脱落的部分，其序列如SEQ.ID.NO.1所示。

SEQ.ID.NO.1：

QLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPMGPRGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRA

经过长期的实验研究，获得了重组人Ⅰ型胶原蛋白α1链的变体，记为α1(Ⅰ)M1。α1(Ⅰ)M1相对于α1(Ⅰ)氨基酸序列中改变4个氨基酸，将这4个氨基酸突变为脯氨酸(Pro，简写为P)，在SEQ.NO.ID.1所示的氨基酸序列第106位的M、109位的R、190位的M、193位的R，均改变为P；其余部分的氨基酸序列不变。α1(Ⅰ)M1与α1(Ⅰ)的同源性为99.6％。

改变后的氨基酸序列(α1(Ⅰ)M1)全长1057AA，序列如SEQ.ID.NO.2所示。

SEQ.ID.NO.2：

QLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPPGPPGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQPGPPGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRA

α1(Ⅰ)M1与α1(Ⅰ)氨基酸序列的差异如图1中灰色背景、加粗的氨基酸所示。

编码SEQ.ID.NO.2所示的α1(1)M1的基因(记为COL1A1M1)DNA序列如SEQ.ID.NO.3所示：

SEQ.ID.NO.3：

CAACTTAGTTATGGATACGATGAAAAATCCACAGGTGGAATCAGTGTTCCTGGACCTATGGGTCCATCAGGTCCAAGAGGTTTACCAGGACCTCCAGGTGCCCCAGGTCCCCAGGGATTTCAAGGTCCACCAGGAGAGCCTGGTGAGCCAGGAGCTTCTGGTCCACCTGGTCCCCCTGGACCACCTGGTCCTCCAGGAAAGAATGGAGATGATGGTGAAGCTGGAAAACCTGGAAGACCTGGAGAAAGAGGACCACCAGGACCCCAGGGTGCCAGAGGACTGCCAGGTACCGCAGGTCTGCCTGGAATGAAAGGTCATAGAGGATTTTCAGGATTAGACGGTGCAAAGGGAGACGCTGGACCTGCAGGACCAAAGGGTGAGCCAGGAAGTCCAGGAGAGAATGGTGCACCAGGACAGCCAGGTCCACCTGGACTGCCCGGTGAAAGAGGTAGACCCGGAGCACCAGGACCAGCAGGTGCAAGAGGAAATGATGGAGCTACAGGTGCTGCAGGACCCCCAGGTCCAACAGGACCAGCCGGTCCTCCCGGTTTCCCAGGTGCCGTTGGAGCAAAAGGTGAAGCTGGTCCACAGGGTCCAAGAGGTTCTGAAGGTCCACAGGGAGTTAGAGGAGAACCAGGACCCCCTGGACCAGCTGGTGCAGCAGGACCAGCTGGTAACCCTGGTGCTGACGGTCAGCCAGGTGCTAAGGGAGCAAATGGAGCACCAGGAATAGCTGGTGCCCCAGGATTTCCCGGTGCTAGAGGTCCAAGTGGTCCACAAGGACCAGGAGGTCCACCCGGTCCCAAAGGAAACAGTGGAGAACCAGGTGCACCCGGTTCAAAGGGAGATACAGGAGCTAAAGGAGAGCCCGGTCCAGTGGGTGTTCAGGGACCACCCGGACCTGCTGGAGAGGAAGGTAAAAGAGGTGCAAGAGGTGAGCCAGGACCAACAGGTCTGCCTGGTCCCCCTGGTGAAAGAGGTGGTCCAGGTAGTAGAGGATTTCCAGGAGCTGATGGTGTTGCAGGACCAAAGGGACCCGCAGGTGAGAGAGGATCACCCGGTCCAGCCGGACCAAAAGGATCACCAGGAGAAGCTGGTAGACCAGGAGAAGCTGGTCTGCCAGGTGCTAAAGGATTGACAGGATCACCCGGTTCACCTGGTCCTGATGGAAAGACAGGACCTCCAGGTCCCGCTGGTCAGGACGGTAGACCAGGACCCCCAGGACCCCCAGGTGCAAGAGGTCAGGCAGGTGTAATGGGTTTCCCCGGACCTAAAGGAGCAGCTGGAGAACCTGGTAAAGCTGGAGAGAGAGGAGTGCCTGGACCCCCTGGAGCTGTTGGTCCAGCAGGAAAGGATGGTGAGGCAGGTGCACAAGGTCCACCTGGACCCGCTGGACCTGCAGGTGAGAGAGGAGAGCAAGGTCCCGCAGGTTCTCCAGGTTTTCAGGGTTTGCCAGGTCCAGCCGGTCCTCCTGGAGAGGCAGGAAAGCCAGGAGAACAAGGAGTTCCAGGAGACCTGGGTGCACCAGGACCCTCTGGTGCAAGAGGAGAGAGAGGATTTCCTGGAGAAAGAGGTGTGCAGGGACCACCAGGTCCCGCCGGTCCAAGAGGAGCAAATGGAGCCCCTGGAAATGACGGAGCTAAGGGTGACGCTGGTGCACCAGGAGCACCAGGTTCTCAAGGTGCTCCCGGATTGCAGGGTATGCCTGGAGAGAGAGGTGCAGCTGGACTGCCAGGTCCAAAAGGTGACAGAGGAGACGCCGGTCCTAAGGGAGCTGACGGTTCTCCTGGAAAGGACGGTGTGAGAGGTTTGACAGGACCAATAGGTCCACCCGGTCCTGCTGGAGCCCCTGGAGACAAAGGTGAATCAGGTCCTTCCGGTCCAGCCGGACCAACAGGAGCAAGAGGAGCACCTGGAGACAGAGGAGAGCCAGGTCCTCCAGGACCTGCAGGTTTCGCTGGTCCTCCCGGAGCAGATGGACAGCCAGGAGCTAAGGGAGAACCCGGTGACGCTGGTGCTAAGGGAGATGCAGGTCCACCAGGTCCTGCTGGTCCTGCTGGACCTCCCGGACCAATAGGTAATGTTGGAGCACCCGGAGCAAAAGGTGCCAGAGGTTCCGCAGGTCCTCCCGGAGCAACTGGTTTTCCAGGAGCTGCCGGAAGAGTGGGTCCACCTGGTCCTTCTGGAAATGCAGGACCACCAGGTCCTCCTGGTCCAGCCGGAAAGGAAGGTGGAAAGGGACCTAGAGGAGAAACAGGTCCCGCAGGTAGACCCGGTGAGGTGGGTCCACCTGGTCCACCCGGTCCAGCTGGTGAGAAAGGAAGTCCTGGAGCAGACGGACCAGCTGGTGCCCCTGGTACACCAGGACCCCAAGGAATAGCTGGTCAAAGAGGTGTTGTTGGTTTACCAGGTCAGAGAGGAGAAAGAGGTTTTCCAGGATTACCAGGTCCCTCAGGTGAGCCCGGAAAACAGGGTCCCTCAGGAGCAAGTGGTGAAAGAGGACCACCAGGACCAATGGGACCTCCAGGATTAGCTGGTCCACCAGGAGAATCAGGAAGAGAGGGTGCTCCTGGAGCAGAAGGTTCACCAGGAAGAGACGGTTCACCCGGAGCCAAGGGAGACAGAGGTGAAACAGGTCCCGCAGGTCCACCAGGAGCACCCGGAGCCCCTGGTGCTCCAGGACCTGTCGGACCAGCAGGAAAATCCGGTGACAGAGGTGAGACTGGACCCGCAGGTCCTGCTGGTCCTGTTGGACCAGTGGGTGCAAGAGGACCAGCAGGTCCACAAGGTCCAAGAGGTGACAAAGGTGAGACAGGTGAGCAGGGTGACAGAGGAATTAAAGGTCACAGAGGATTTTCAGGACTGCAGGGACCACCCGGTCCTCCCGGTTCCCCAGGAGAGCAAGGTCCATCCGGTGCATCCGGTCCAGCTGGACCCAGAGGACCACCTGGTTCTGCTGGTGCACCAGGTAAAGATGGATTGAACGGTTTGCCTGGTCCAATAGGACCTCCTGGTCCAAGAGGAAGAACTGGTGACGCCGGTCCCGTCGGACCACCCGGTCCACCAGGTCCCCCAGGTCCACCCGGACCACCATCCGCAGGATTTGATTTCTCATTCCTTCCTCAACCTCCTCAAGAGAAAGCACATGATGGAGGTAGATACTATAGAGCC

人Ⅱ型胶原蛋白α1链(记为α1(Ⅱ))的氨基酸序列参Uniprot数据库P02458(https://www.uniprot.org/uniprot/P02458)序列中第182–1241部分(PRO_0000005730)是成熟形态人Ⅱ型胶原蛋白α1链氨基酸序列，不含信号肽、C端前肽、N端前肽等α1(Ⅱ)前体蛋白中加工脱落的部分，其序列如SEQ.ID.NO.4所示：

SEQ.ID.NO.4：

QMAGGFDEKAGGAQLGVMQGPMGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPMGPRGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRA

经过长期的实验研究，获得重组人Ⅱ型胶原蛋白α1链的变体，记为α1(Ⅱ)M6。α1(Ⅱ)M6于α1(Ⅱ)的氨基酸序列中改变9个氨基酸，将这9个氨基酸突变为脯氨酸(Pro，简写为P)，在SEQ.NO.ID.4所示的氨基酸序列第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R，均改变为P；其余部分的氨基酸序列不变，α1(Ⅱ)M6与α1(Ⅱ)的同源性为99.2％。

改变后的序列(α1(Ⅱ)M6)全长1060AA，序列如SEQ.ID.NO.5所示：

SEQ.ID.NO.5：

QMAGGFDEKAGGAQLGPPQGPPGPPGPPGPPGPAGAPGPQGFQGNPGEPGEPGVSGPPGPPGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPPGPPGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRA

α1(Ⅱ)M6与α1(Ⅱ)氨基酸序列的差异如图2中灰色背景和加粗的氨基酸所示。

编码SEQ.ID.NO.5所示的α1(Ⅱ)M6的基因(记为COL2A1M6)DNA序列如SEQ.ID.NO.6所示：

SEQ.ID.NO.6：

CAAATGGCTGGTGGATTCGATGAAAAGGCTGGTGGAGCCCAATTAGGTCCTCCACAAGGTCCTCCCGGTCCACCTGGTCCTCCCGGTCCTCCAGGTCCCGCCGGTGCTCCTGGACCACAGGGTTTCCAAGGAAACCCCGGTGAACCAGGTGAGCCTGGTGTTTCAGGTCCTCCCGGTCCTCCAGGACCACCTGGACCACCAGGAAAGCCTGGTGACGACGGAGAAGCTGGTAAACCAGGAAAGGCAGGAGAGAGAGGTCCACCTGGACCTCAGGGTGCCAGAGGTTTCCCAGGTACCCCTGGTCTTCCTGGTGTCAAGGGTCATAGAGGTTACCCCGGTTTGGATGGTGCCAAGGGTGAAGCCGGTGCCCCTGGTGTTAAGGGTGAATCAGGAAGTCCCGGTGAAAATGGAAGTCCCGGTCCACCCGGTCCACCTGGACTGCCAGGTGAGAGAGGAAGAACCGGACCAGCTGGTGCTGCAGGTGCTAGAGGAAATGACGGACAGCCCGGACCAGCCGGACCTCCCGGTCCTGTTGGGCCCGCAGGTGGTCCTGGTTTCCCtgGTGCTCCTGGAGCCAAAGGAGAAGCCGGACCCACCGGAGCCAGAGGTCCCGAGGGAGCACAGGGACCTAGAGGAGAACCAGGTACACCAGGTAGTCCCGGTCCTGCTGGTGCATCAGGAAATCCCGGAACTGACGGTATTCCAGGAGCAAAGGGATCTGCAGGAGCACCAGGAATAGCTGGTGCTCCTGGATTTCCAGGTCCCAGAGGACCTCCCGGTCCTCAAGGAGCAACAGGTCCTTTGGGACCAAAAGGTCAAACAGGAGAACCAGGTATTGCTGGATTCAAAGGAGAGCAAGGTCCAAAGGGAGAGCCCGGTCCCGCAGGTCCCCAAGGAGCCCCAGGACCAGCTGGTGAAGAAGGAAAAAGAGGAGCCAGAGGTGAACCTGGAGGAGTAGGACCTATTGGTCCTCCTGGTGAGAGAGGTGCTCCCGGAAACAGAGGTTTTCCTGGTCAAGATGGTCTGGCTGGACCTAAAGGTGCTCCAGGAGAGAGAGGACCTTCAGGACTTGCTGGTCCAAAAGGTGCTAACGGAGATCCAGGAAGACCCGGTGAACCTGGTCTGCCTGGAGCTAGAGGATTAACAGGAAGACCAGGTGACGCAGGTCCCCAGGGTAAAGTGGGTCCCAGTGGTGCCCCAGGTGAAGATGGAAGACCTGGTCCTCCCGGACCCCAAGGTGCAAGAGGTCAGCCTGGAGTGATGGGATTTCCTGGACCCAAGGGTGCTAACGGAGAACCTGGAAAAGCTGGTGAGAAAGGACTGCCCGGTGCCCCAGGTCTTAGAGGTTTGCCAGGTAAAGATGGAGAAACAGGAGCCGCAGGACCACCCGGTCCAGCCGGACCAGCAGGAGAGAGAGGTGAACAAGGAGCACCTGGTCCAAGTGGTTTTCAGGGTCTTCCAGGTCCCCCTGGTCCACCAGGAGAGGGAGGTAAACCAGGTGACCAAGGTGTCCCTGGAGAAGCAGGTGCACCCGGTCTTGTGGGTCCAAGAGGTGAAAGAGGATTCCCTGGTGAGAGAGGATCTCCCGGAGCCCAGGGACTTCAAGGTCCTAGAGGTCTGCCAGGTACCCCTGGTACAGACGGACCAAAGGGAGCATCAGGACCCGCTGGACCTCCCGGAGCCCAAGGTCCTCCAGGTTTACAAGGTATGCCTGGTGAAAGAGGTGCTGCAGGTATAGCTGGACCAAAAGGAGACAGAGGTGACGTTGGTGAGAAGGGTCCCGAAGGAGCCCCTGGAAAAGATGGTGGAAGAGGATTAACAGGTCCTATAGGACCACCCGGTCCAGCCGGTGCTAATGGAGAAAAAGGAGAAGTAGGTCCTCCAGGTCCAGCAGGATCTGCAGGTGCTAGAGGTGCCCCTGGAGAGAGAGGTGAAACAGGACCACCTGGTCCAGCTGGTTTCGCTGGTCCCCCAGGAGCTGATGGACAGCCCGGTGCAAAAGGTGAACAAGGAGAAGCCGGACAGAAGGGAGATGCTGGAGCCCCCGGTCCACAAGGTCCCTCAGGAGCACCAGGTCCTCAAGGTCCAACTGGTGTGACCGGGCCAAAGGGTGCAAGAGGAGCACAGGGACCTCCAGGAGCAACAGGTTTCCCAGGAGCTGCTGGTAGAGTCGGTCCACCCGGATCTAATGGTAACCCCGGACCACCAGGACCACCTGGACCATCTGGAAAGGATGGACCCAAAGGAGCAAGAGGAGATTCAGGACCACCCGGAAGAGCAGGAGAACCTGGATTACAGGGTCCCGCCGGTCCACCAGGAGAGAAAGGAGAGCCCGGAGATGATGGTCCCTCAGGTGCAGAGGGACCCCCAGGACCCCAAGGTCTGGCAGGTCAAAGAGGTATAGTGGGTCTTCCAGGTCAAAGAGGTGAAAGAGGATTTCCAGGACTTCCAGGTCCTTCAGGTGAACCCGGTAAACAGGGAGCCCCCGGAGCCTCAGGTGACAGAGGTCCTCCAGGACCAGTAGGACCCCCAGGTTTAACCGGACCAGCAGGTGAGCCAGGAAGAGAAGGTTCTCCTGGAGCCGATGGACCTCCAGGAAGAGACGGTGCAGCTGGTGTTAAGGGTGACAGAGGTGAAACTGGAGCCGTAGGAGCCCCAGGTGCCCCCGGACCACCCGGATCACCCGGACCTGCAGGTCCTACTGGTAAACAAGGAGATAGAGGAGAAGCCGGTGCCCAGGGTCCTATGGGTCCTTCTGGTCCTGCAGGAGCAAGAGGTATACAAGGTCCACAGGGTCCCAGAGGTGACAAGGGTGAAGCAGGAGAACCCGGTGAGAGAGGTCTGAAGGGTCATAGAGGATTCACCGGGTTACAGGGTTTGCCAGGACCCCCTGGACCAAGTGGTGACCAGGGTGCATCCGGTCCAGCAGGTCCTTCTGGACCAAGAGGTCCTCCCGGTCCAGTTGGTCCATCAGGTAAAGACGGAGCCAACGGTATCCCAGGTCCCATCGGTCCTCCAGGTCCTAGAGGAAGAAGTGGAGAGACTGGTCCTGCTGGACCTCCTGGAAACCCTGGTCCTCCAGGACCTCCAGGTCCTCCAGGTCCCGGAATAGATATGTCCGCTTTCGCTGGATTGGGACCAAGAGAGAAAGGTCCTGACCCTCTTCAATATATGAGAGCA

在编码α1(Ⅰ)M1的DNA序列两端分别修饰添加氨基端添加编码Strep-Tag II标签的DNA序列、羧基端添加编码6×His Tag标签的DNA序列后，α1(Ⅰ)M1最终表达获得的是含有标签的蛋白，共1071个氨基酸，如SEQ.ID.NO.7所示：

SEQ.ID.NO.7：

WSHPQFEKQLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPPGPPGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQPGPPGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRAHHHHHH

经过优化设计后，编码SEQ.ID.NO.7氨基酸序列(α1(Ⅰ)M1)的基因(记为COL1A1M1)的DNA序列如SEQ.ID.NO.8所示：

SEQ.ID.NO.8：

TGGTCTCATCCACAATTTGAAAAGCAACTTAGTTATGGATACGATGAAAAATCCACAGGTGGAATCAGTGTTCCTGGACCTATGGGTCCATCAGGTCCAAGAGGTTTACCAGGACCTCCAGGTGCCCCAGGTCCCCAGGGATTTCAAGGTCCACCAGGAGAGCCTGGTGAGCCAGGAGCTTCTGGTCCACCTGGTCCCCCTGGACCACCTGGTCCTCCAGGAAAGAATGGAGATGATGGTGAAGCTGGAAAACCTGGAAGACCTGGAGAAAGAGGACCACCAGGACCCCAGGGTGCCAGAGGACTGCCAGGTACCGCAGGTCTGCCTGGAATGAAAGGTCATAGAGGATTTTCAGGATTAGACGGTGCAAAGGGAGACGCTGGACCTGCAGGACCAAAGGGTGAGCCAGGAAGTCCAGGAGAGAATGGTGCACCAGGACAGCCAGGTCCACCTGGACTGCCCGGTGAAAGAGGTAGACCCGGAGCACCAGGACCAGCAGGTGCAAGAGGAAATGATGGAGCTACAGGTGCTGCAGGACCCCCAGGTCCAACAGGACCAGCCGGTCCTCCCGGTTTCCCAGGTGCCGTTGGAGCAAAAGGTGAAGCTGGTCCACAGGGTCCAAGAGGTTCTGAAGGTCCACAGGGAGTTAGAGGAGAACCAGGACCCCCTGGACCAGCTGGTGCAGCAGGACCAGCTGGTAACCCTGGTGCTGACGGTCAGCCAGGTGCTAAGGGAGCAAATGGAGCACCAGGAATAGCTGGTGCCCCAGGATTTCCCGGTGCTAGAGGTCCAAGTGGTCCACAAGGACCAGGAGGTCCACCCGGTCCCAAAGGAAACAGTGGAGAACCAGGTGCACCCGGTTCAAAGGGAGATACAGGAGCTAAAGGAGAGCCCGGTCCAGTGGGTGTTCAGGGACCACCCGGACCTGCTGGAGAGGAAGGTAAAAGAGGTGCAAGAGGTGAGCCAGGACCAACAGGTCTGCCTGGTCCCCCTGGTGAAAGAGGTGGTCCAGGTAGTAGAGGATTTCCAGGAGCTGATGGTGTTGCAGGACCAAAGGGACCCGCAGGTGAGAGAGGATCACCCGGTCCAGCCGGACCAAAAGGATCACCAGGAGAAGCTGGTAGACCAGGAGAAGCTGGTCTGCCAGGTGCTAAAGGATTGACAGGATCACCCGGTTCACCTGGTCCTGATGGAAAGACAGGACCTCCAGGTCCCGCTGGTCAGGACGGTAGACCAGGACCCCCAGGACCCCCAGGTGCAAGAGGTCAGGCAGGTGTAATGGGTTTCCCCGGACCTAAAGGAGCAGCTGGAGAACCTGGTAAAGCTGGAGAGAGAGGAGTGCCTGGACCCCCTGGAGCTGTTGGTCCAGCAGGAAAGGATGGTGAGGCAGGTGCACAAGGTCCACCTGGACCCGCTGGACCTGCAGGTGAGAGAGGAGAGCAAGGTCCCGCAGGTTCTCCAGGTTTTCAGGGTTTGCCAGGTCCAGCCGGTCCTCCTGGAGAGGCAGGAAAGCCAGGAGAACAAGGAGTTCCAGGAGACCTGGGTGCACCAGGACCCTCTGGTGCAAGAGGAGAGAGAGGATTTCCTGGAGAAAGAGGTGTGCAGGGACCACCAGGTCCCGCCGGTCCAAGAGGAGCAAATGGAGCCCCTGGAAATGACGGAGCTAAGGGTGACGCTGGTGCACCAGGAGCACCAGGTTCTCAAGGTGCTCCCGGATTGCAGGGTATGCCTGGAGAGAGAGGTGCAGCTGGACTGCCAGGTCCAAAAGGTGACAGAGGAGACGCCGGTCCTAAGGGAGCTGACGGTTCTCCTGGAAAGGACGGTGTGAGAGGTTTGACAGGACCAATAGGTCCACCCGGTCCTGCTGGAGCCCCTGGAGACAAAGGTGAATCAGGTCCTTCCGGTCCAGCCGGACCAACAGGAGCAAGAGGAGCACCTGGAGACAGAGGAGAGCCAGGTCCTCCAGGACCTGCAGGTTTCGCTGGTCCTCCCGGAGCAGATGGACAGCCAGGAGCTAAGGGAGAACCCGGTGACGCTGGTGCTAAGGGAGATGCAGGTCCACCAGGTCCTGCTGGTCCTGCTGGACCTCCCGGACCAATAGGTAATGTTGGAGCACCCGGAGCAAAAGGTGCCAGAGGTTCCGCAGGTCCTCCCGGAGCAACTGGTTTTCCAGGAGCTGCCGGAAGAGTGGGTCCACCTGGTCCTTCTGGAAATGCAGGACCACCAGGTCCTCCTGGTCCAGCCGGAAAGGAAGGTGGAAAGGGACCTAGAGGAGAAACAGGTCCCGCAGGTAGACCCGGTGAGGTGGGTCCACCTGGTCCACCCGGTCCAGCTGGTGAGAAAGGAAGTCCTGGAGCAGACGGACCAGCTGGTGCCCCTGGTACACCAGGACCCCAAGGAATAGCTGGTCAAAGAGGTGTTGTTGGTTTACCAGGTCAGAGAGGAGAAAGAGGTTTTCCAGGATTACCAGGTCCCTCAGGTGAGCCCGGAAAACAGGGTCCCTCAGGAGCAAGTGGTGAAAGAGGACCACCAGGACCAATGGGACCTCCAGGATTAGCTGGTCCACCAGGAGAATCAGGAAGAGAGGGTGCTCCTGGAGCAGAAGGTTCACCAGGAAGAGACGGTTCACCCGGAGCCAAGGGAGACAGAGGTGAAACAGGTCCCGCAGGTCCACCAGGAGCACCCGGAGCCCCTGGTGCTCCAGGACCTGTCGGACCAGCAGGAAAATCCGGTGACAGAGGTGAGACTGGACCCGCAGGTCCTGCTGGTCCTGTTGGACCAGTGGGTGCAAGAGGACCAGCAGGTCCACAAGGTCCAAGAGGTGACAAAGGTGAGACAGGTGAGCAGGGTGACAGAGGAATTAAAGGTCACAGAGGATTTTCAGGACTGCAGGGACCACCCGGTCCTCCCGGTTCCCCAGGAGAGCAAGGTCCATCCGGTGCATCCGGTCCAGCTGGACCCAGAGGACCACCTGGTTCTGCTGGTGCACCAGGTAAAGATGGATTGAACGGTTTGCCTGGTCCAATAGGACCTCCTGGTCCAAGAGGAAGAACTGGTGACGCCGGTCCCGTCGGACCACCCGGTCCACCAGGTCCCCCAGGTCCACCCGGACCACCATCCGCAGGATTTGATTTCTCATTCCTTCCTCAACCTCCTCAAGAGAAAGCACATGATGGAGGTAGATACTATAGAGCCCATCACCACCATCATCATTAA

在编码α1(Ⅱ)M6的DNA序列两端分别修饰添加氨基端添加编码Strep-Tag II标签的DNA序列、羧基端添加编码6×His Tag标签的DNA序列后，α1(Ⅱ)M6最终表达获得的是含有标签的蛋白，共1076个氨基酸，序列如SEQ.ID.NO.9所示：

SEQ.ID.NO.9：

EFWSHPQFEKQMAGGFDEKAGGAQLGPPQGPPGPPGPPGPPGPAGAPGPQGFQGNPGEPGEPGVSGPPGPPGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPPGPPGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRAHHHHHH

经过优化设计后，编码SEQ.ID.NO.10(α1(Ⅱ)M6)氨基酸序列的基因(记为COL2A1M6)的DNA序列如SEQ.ID.NO.10所示：

SEQ.ID.NO.10：

GAATTCTGGAGTCATCCTCAATTCGAAAAACAAATGGCTGGTGGATTCGATGAAAAGGCTGGTGGAGCCCAATTAGGTCCTCCACAAGGTCCTCCCGGTCCACCTGGTCCTCCCGGTCCTCCAGGTCCCGCCGGTGCTCCTGGACCACAGGGTTTCCAAGGAAACCCCGGTGAACCAGGTGAGCCTGGTGTTTCAGGTCCTCCCGGTCCTCCAGGACCACCTGGACCACCAGGAAAGCCTGGTGACGACGGAGAAGCTGGTAAACCAGGAAAGGCAGGAGAGAGAGGTCCACCTGGACCTCAGGGTGCCAGAGGTTTCCCAGGTACCCCTGGTCTTCCTGGTGTCAAGGGTCATAGAGGTTACCCCGGTTTGGATGGTGCCAAGGGTGAAGCCGGTGCCCCTGGTGTTAAGGGTGAATCAGGAAGTCCCGGTGAAAATGGAAGTCCCGGTCCACCCGGTCCACCTGGACTGCCAGGTGAGAGAGGAAGAACCGGACCAGCTGGTGCTGCAGGTGCTAGAGGAAATGACGGACAGCCCGGACCAGCCGGACCTCCCGGTCCTGTTGGGCCCGCAGGTGGTCCTGGTTTCCCtgGTGCTCCTGGAGCCAAAGGAGAAGCCGGACCCACCGGAGCCAGAGGTCCCGAGGGAGCACAGGGACCTAGAGGAGAACCAGGTACACCAGGTAGTCCCGGTCCTGCTGGTGCATCAGGAAATCCCGGAACTGACGGTATTCCAGGAGCAAAGGGATCTGCAGGAGCACCAGGAATAGCTGGTGCTCCTGGATTTCCAGGTCCCAGAGGACCTCCCGGTCCTCAAGGAGCAACAGGTCCTTTGGGACCAAAAGGTCAAACAGGAGAACCAGGTATTGCTGGATTCAAAGGAGAGCAAGGTCCAAAGGGAGAGCCCGGTCCCGCAGGTCCCCAAGGAGCCCCAGGACCAGCTGGTGAAGAAGGAAAAAGAGGAGCCAGAGGTGAACCTGGAGGAGTAGGACCTATTGGTCCTCCTGGTGAGAGAGGTGCTCCCGGAAACAGAGGTTTTCCTGGTCAAGATGGTCTGGCTGGACCTAAAGGTGCTCCAGGAGAGAGAGGACCTTCAGGACTTGCTGGTCCAAAAGGTGCTAACGGAGATCCAGGAAGACCCGGTGAACCTGGTCTGCCTGGAGCTAGAGGATTAACAGGAAGACCAGGTGACGCAGGTCCCCAGGGTAAAGTGGGTCCCAGTGGTGCCCCAGGTGAAGATGGAAGACCTGGTCCTCCCGGACCCCAAGGTGCAAGAGGTCAGCCTGGAGTGATGGGATTTCCTGGACCCAAGGGTGCTAACGGAGAACCTGGAAAAGCTGGTGAGAAAGGACTGCCCGGTGCCCCAGGTCTTAGAGGTTTGCCAGGTAAAGATGGAGAAACAGGAGCCGCAGGACCACCCGGTCCAGCCGGACCAGCAGGAGAGAGAGGTGAACAAGGAGCACCTGGTCCAAGTGGTTTTCAGGGTCTTCCAGGTCCCCCTGGTCCACCAGGAGAGGGAGGTAAACCAGGTGACCAAGGTGTCCCTGGAGAAGCAGGTGCACCCGGTCTTGTGGGTCCAAGAGGTGAAAGAGGATTCCCTGGTGAGAGAGGATCTCCCGGAGCCCAGGGACTTCAAGGTCCTAGAGGTCTGCCAGGTACCCCTGGTACAGACGGACCAAAGGGAGCATCAGGACCCGCTGGACCTCCCGGAGCCCAAGGTCCTCCAGGTTTACAAGGTATGCCTGGTGAAAGAGGTGCTGCAGGTATAGCTGGACCAAAAGGAGACAGAGGTGACGTTGGTGAGAAGGGTCCCGAAGGAGCCCCTGGAAAAGATGGTGGAAGAGGATTAACAGGTCCTATAGGACCACCCGGTCCAGCCGGTGCTAATGGAGAAAAAGGAGAAGTAGGTCCTCCAGGTCCAGCAGGATCTGCAGGTGCTAGAGGTGCCCCTGGAGAGAGAGGTGAAACAGGACCACCTGGTCCAGCTGGTTTCGCTGGTCCCCCAGGAGCTGATGGACAGCCCGGTGCAAAAGGTGAACAAGGAGAAGCCGGACAGAAGGGAGATGCTGGAGCCCCCGGTCCACAAGGTCCCTCAGGAGCACCAGGTCCTCAAGGTCCAACTGGTGTGACCGGGCCAAAGGGTGCAAGAGGAGCACAGGGACCTCCAGGAGCAACAGGTTTCCCAGGAGCTGCTGGTAGAGTCGGTCCACCCGGATCTAATGGTAACCCCGGACCACCAGGACCACCTGGACCATCTGGAAAGGATGGACCCAAAGGAGCAAGAGGAGATTCAGGACCACCCGGAAGAGCAGGAGAACCTGGATTACAGGGTCCCGCCGGTCCACCAGGAGAGAAAGGAGAGCCCGGAGATGATGGTCCCTCAGGTGCAGAGGGACCCCCAGGACCCCAAGGTCTGGCAGGTCAAAGAGGTATAGTGGGTCTTCCAGGTCAAAGAGGTGAAAGAGGATTTCCAGGACTTCCAGGTCCTTCAGGTGAACCCGGTAAACAGGGAGCCCCCGGAGCCTCAGGTGACAGAGGTCCTCCAGGACCAGTAGGACCCCCAGGTTTAACCGGACCAGCAGGTGAGCCAGGAAGAGAAGGTTCTCCTGGAGCCGATGGACCTCCAGGAAGAGACGGTGCAGCTGGTGTTAAGGGTGACAGAGGTGAAACTGGAGCCGTAGGAGCCCCAGGTGCCCCCGGACCACCCGGATCACCCGGACCTGCAGGTCCTACTGGTAAACAAGGAGATAGAGGAGAAGCCGGTGCCCAGGGTCCTATGGGTCCTTCTGGTCCTGCAGGAGCAAGAGGTATACAAGGTCCACAGGGTCCCAGAGGTGACAAGGGTGAAGCAGGAGAACCCGGTGAGAGAGGTCTGAAGGGTCATAGAGGATTCACCGGGTTACAGGGTTTGCCAGGACCCCCTGGACCAAGTGGTGACCAGGGTGCATCCGGTCCAGCAGGTCCTTCTGGACCAAGAGGTCCTCCCGGTCCAGTTGGTCCATCAGGTAAAGACGGAGCCAACGGTATCCCAGGTCCCATCGGTCCTCCAGGTCCTAGAGGAAGAAGTGGAGAGACTGGTCCTGCTGGACCTCCTGGAAACCCTGGTCCTCCAGGACCTCCAGGTCCTCCAGGTCCCGGAATAGATATGTCCGCTTTCGCTGGATTGGGACCAAGAGAGAAAGGTCCTGACCCTCTTCAATATATGAGAGCACACCATCACCATCATCACTAA

DNA序列的合成委托南京金斯瑞生物科技股份有限公司完成，合成SEQ.ID.NO.8、SEQ.ID.NO.10两种基因的DNA片段。

实施例2.重组表达载体的构建、菌种筛选

(1)重组表达载体的构建

将合成后的基因片段SEQ.ID.NO.8、SEQ.ID.NO.10重组至pPIC9K空载体(购自赛默飞世尔科技公司)中，使目的片段准确插入到含有分泌信号α-因子的分泌型载体读码框内，获得表达α1(Ⅱ)M6的pPIC9K-COL2A1M6和表达α1(Ⅰ)M1的pPIC9K-COL1A1M1两种重组表达载体质粒。

将pPIC9K-COL2A1M6、pPIC9K-COL1A1M1质粒转化进入感受态大肠杆菌DH5α(购自生工生物工程(上海)股份有限公司)，在含有氨苄青霉素的LB抗性平板筛选阳性克隆，提取重组质粒进行测序鉴定(交由生工生物工程(上海)股份有限公司完成)，验证正确。pPIC9K-COL1A1M1、pPIC9K-COL2A1M6的质粒图谱分别如图3和图4所示。

(2)菌种筛选

将上述重组表达载体质粒10μg，用SacⅠ(购自大连TaKaRa公司，具体操作按试剂盒说明书进行)37℃酶切消化过夜，使其线性化，再使用以PCR产物纯化试剂盒(购自生工生物工程(上海)股份有限公司)，回收线性化质粒，使体积控制在10μL左右。

将线性化质粒电转化入宿主菌种毕赤酵母SMD1168(购自赛默飞世尔科技公司)感受态细胞中，将电转后的菌液涂布于MD平板上，每100μL～200μL涂布一块平板，室温静置10min，于30℃倒置培养2-5天，直至有单菌落(阳性转化子)出现。

向MD平板表面加入2mL无菌双蒸水，然后用无菌三角涂布器轻轻刮下平板表面的His⁺转化子，并转移到50mL离心管中。以无菌双蒸水稀释菌悬液，10⁵个细胞涂布于含有0.5mg/mLG418的YPD平板上，倒置，30℃培养3～4d后至单菌落出现。从YPD平板上挑取菌落至无菌96孔板中(200μL YPD/孔)，混匀，于30℃培养48h；混匀孔中菌液，各取10μL接入至一块新的无菌96孔板，于30℃培养24h后再重复一次此操作；24h后，从第三块96孔板中取出1μL分别点在含有1.0mg/mL和4mg/mL G418的YPD平板上，于30℃继续培养96h～120h。毕赤酵母转化子若能在含高浓度(4mg/mL)G418的平板上生长，说明该转化子含有多拷贝的目的基因，即有多个重组片段进入了酵母体内并通过同源重组整合到酵母的染色体上。经过这一步筛选可得到的高拷贝、可高效表达的重组酵母工程菌种。

构建含pPIC9K-COL1A1M1、pPIC9K-COL2A1M6的两种工程菌样本均送至中国微生物菌种保藏管理委员会普通微生物中心保藏。

含重组表达载体pPIC9K-COL1A1M1的工程菌表达重组α1(Ⅰ)M1胶原蛋白，保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号是：CGMCC NO.21891，地址：北京市朝阳区北辰西路1号院3号；保藏日期：2021年03月11日；分类命名：巴斯德毕赤酵母Pichia pastoris。

含重组表达载体pPIC9K-COL2A1M6的工程菌表达重组α1(Ⅱ)M6胶原蛋白，保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号是：CGMCC NO.21892。地址：北京市朝阳区北辰西路1号院3号；保藏日期：2021年03月11日；分类命名：巴斯德毕赤酵母Pichia pastoris。

实施例3.诱导表达与重组胶原蛋白的鉴定

分别取实施例2得到的表达α1(Ⅰ)M1、α1(Ⅱ)M6的重组工程菌，同时取已知专利中的表达全长Ⅰ型胶原α1链蛋白毕赤酵母工程菌株和表达全长Ⅱ型胶原α1链蛋白的毕赤酵母工程菌株作为对照，2个对照工程菌株均为发明人团队前期研究成果，所表达的全长胶原α1链同样于肽链氨基端添加Strep-Tag II标签、羧基端添加6×His Tag标签)，其分别来自于申请号201911135958.0(名称：酵母重组人源Ⅰ型胶原α1链蛋白、合成方法及其应用，专利中表达全长α1(Ⅰ)链的毕赤酵母工程菌种保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号：CGMCC NO.17150)、申请号201911088025.0(名称：毕赤酵母生产重组人源Ⅱ型胶原蛋白单链的方法，专利中表达全长α1(Ⅱ)链的毕赤酵母工程菌种保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号：CGMCC NO.17149)的专利。将4种工程菌置于装有10mL BMGY培养基的100mL三角瓶中，于28-30℃、220rpm培养至OD600为2～6(16-18h)。室温下1500～3000g离心5min，收集菌体，用BMMY培养基重悬菌体，使OD600为2左右，放置于28-30℃、220rpm的摇床上继续生长3天，每24h向培养基中添加100％甲醇至培养基中甲醇的终浓度为1.0％。加甲醇诱导16h以上，就可收取菌液样品，取样量为1mL，置于1.5mL EP管中，4℃下以12000g离心5min，收集表达上清，待检测样品于-80℃保存备用。

收取的表达上清，加入5×上样缓冲液(250mM Tris-HCl、pH值为6.8，10％SDS，0.5％溴酚蓝，50％甘油，5％β-巯基乙醇)，置于100℃金属浴加热10min，进行SDS-PAGE检测。因表达的目的蛋白氨基端有Srtep-TagⅡ标签，羧基端有6×His Tag标签，可以抗Srtep-TagⅡ、抗6×His Tag的抗体(购自南京金斯瑞生物科技股份有限公司)进行WesternBlot检测(具体操作参看说明书进行)。

表达上清的SDS-PAGE如下图5所示，α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)在诱导表达24h均可高效分泌表达于胞外的表达上清中，α1(Ⅰ)、α1(Ⅱ)在预期的目的条带(>116kDa)下出现了明确的主降解条带(<116kDa)，而本发明的α1(Ⅰ)M1、α1(Ⅱ)M6则只有预期的目的条带(>116kDa)。

使用Image Lab软件(Bio-Rad Gel Doc XR+成像仪)测算，结果如下：

(1)α1(Ⅰ)M1目的条带表观分子量(116.3kDa)与α1(Ⅰ)目的条带表观分子量(116.4kDa)、α1(Ⅱ)M6目的条带表观分子量(118.2kDa)与α1(Ⅱ)目的条带表观分子量(118.1kDa)相比基本一致，明显大于α1(Ⅰ)的主降解条带的表观分子量(104.5kDa)与α1(Ⅱ)的主降解条带的表观分子量(106.9kDa)。

(2)α1(Ⅰ)电泳结果中目的条带与主降解条带的比值为51.5％：48.3％；α1(Ⅱ)电泳结果中目的条带与主降解条带的比值为52.1％：47.8％，主降解产物与目的产物占比基本相同。

从图6的ECL化学发光显色结果(全自动化学发光图像分析系统Tanon 5200将蛋白质分子质量标准合成于图像)中可以看到，氨基端Srtep-TagⅡ标签，羧基端6×His Tag标签均可检测到，且目的条带均与SDS-PAGE中表观分子量大小相同，说明α1(Ⅰ)M1、α1(Ⅱ)M6两种重组胶原蛋白成功的进行了全长序列的高效分泌表达，目的条带的表达符合预期，而α1(Ⅰ)、α1(Ⅱ)两种胶原蛋白的目的条带序列虽然是全长完整的，但是主降解条带缺失了氨基端的序列，只能检测到羧基端6×His Tag标签。

将α1(Ⅰ)M1和α1(Ⅱ)M6在SDS-PAGE上的目的条带、α1(Ⅰ)和α1(Ⅱ)在SDS-PAGE上的目的条带与主降解带条带切割下来，用胰蛋白酶将其酶解，Nano-HPLC-MS/MS质谱检测重组胶原的胰蛋白酶解后肽段(委托苏州普泰生物技术有限公司完成)，并将检测到肽段进行序列比对(Uniprot数据库)，数据比对结果及鉴定肽段与天然序列比对覆盖图(底色为灰色部分：条带中质谱鉴定到肽段与天然序列相完全相同的部分)，如图7和图8所示，结果可见：

(1)α1(Ⅰ)M1、α1(Ⅰ)的目的条带及α1(Ⅰ)的主降解带被酶解后检测到的肽段均属于Ⅰ型胶原α1链上的序列。

(2)α1(Ⅱ)M6和α1(Ⅱ)的目的条带及α1(Ⅱ)的主降解带被酶解后检测到的肽段均属于人Ⅱ型胶原α1链上的序列。

以上结果说明α1(Ⅰ)M1、α1(Ⅱ)M6与α1(Ⅰ)、α1(Ⅱ)一样成功表达，分别属于人Ⅰ型胶原α1链、人Ⅱ型胶原α1链的重组胶原蛋白，但α1(Ⅰ)、α1(Ⅱ)表达时产生了降解，主降解条带也属于相应种类胶原蛋白。

实施例4.高密度发酵与纯化

(1)对基因工程菌进行高密度发酵

重组α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白规模化表达生产，获取含有重组胶原蛋白的发酵液。

种子培养基YPG(含酵母粉10g/L、酵母蛋白胨20g/L、无水甘油10g/L)；发酵培养基(含NH₄H₂PO₄ 190.4g/L、KH₂PO₄ 10.06g/L、CaSO₄·2H₂O 1.18g/L、K₂SO₄ 18.2g/L、MgSO₄·7H₂O 14.9g/L、甘油40g/L)；补料培养基(含50％W/V甘油，每升加12mL PTM1微量元素)；诱导培养基(含100％甲醇，每升加入12mL PTM1微量元素)；PTM1：用0.22μm的滤膜过滤除菌，4℃保存。发酵培养基高温灭菌后待温度降至室温后加入PTM1，用氨水调节pH值至5.0。

工程菌株分批培养条件和诱导表达条件为：

采用分批补料培养方法，培养温度30℃。

工程菌接入含种子培养基YPG的1L摇瓶，220rpm、30℃，培养18-20h，至OD600＝2～10。使用5L发酵罐(保兴生物)，装液量2L发酵培养基，2％甘油分开灭菌，接种前调节转速为300rpm，通气量4L/min，温度30℃，用浓氨水配制好的碱液调pH，设置pH至4.5。然后先接入0.9mL PTM1，然后再将制备好的200mL种子液接入罐内(火焰圈接种)，然后点击溶氧电极校百，校百后开始发酵。待生长溶氧第一次掉至30％时，采用溶氧串级转速功能，保持生长溶氧为30％；等待甘油耗完，溶氧反弹、溶氧大于70％(OD600值约20)，取消溶氧串级转速，调高搅拌650rpm，甘油采用30％联动补料，补料80mL。停止补甘油，溶氧反弹至70％以上后，设置pH值为4、温度29℃，以甲醇、甘油混合碳源(甲醇：50％甘油＝7：3)进行诱导培养。手动补加5mL，待溶氧反弹至70％以上后，设定补料速度为8mL/h，一小时后提高到为10mL/h，一小时后再次提高设定到20mL/h。待溶氧值低于30％，停止补料，等待溶氧反弹，溶氧回升至30％后联动补料。诱导40～60h，UV测量蛋白浓度增长幅度不明显或下降即可放罐。UV蛋白定量公式：C(mg/mL)＝0.144*(A215-A225)，A215<1.5。同时，分别同时取表达全长α1(Ⅰ)链的毕赤酵母工程菌种(中国微生物菌种保藏管理委员会普通微生物中心菌种保藏编号：CGMCC NO.17150)、表达全长α1(Ⅱ)链的毕赤酵母工程菌种(中国微生物菌种保藏管理委员会普通微生物中心菌种保藏编号：CGMCC NO.17149)进行高密度发酵。

结果如表1所示，在诱导48h后，α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比，菌浓度(OD600)、菌湿重、发酵液中表达蛋白浓度UV定量三个指标并无明显差异。但收集发酵上清进行SDS-PAGE电泳检测，结果如图9所示，可发现在高密度发酵的条件下，α1(Ⅰ)、α1(Ⅱ)的主降解条带极为明显，与摇瓶诱导表达无区别；而α1(Ⅰ)M1、α1(Ⅱ)M6最主要的产物仍是其目的条带，主降解条带没有出现，这说明α1(Ⅰ)M1、α1(Ⅱ)M6在消除主降解条带(主降解产物)的效果在高密度发酵的条件下仍能有效保持。

表1.发酵小试实验菌浓度、菌湿重、蛋白质表达量(UV定量)

种类	OD600	菌湿重(g/L)	蛋白质(UV，g/L)
				α1(Ⅱ)	189.0	260.0	17.8
α1(Ⅱ)M6	198.0	265.0	18.7
				α1(Ⅰ)	215.0	310.0	18.1
α1(Ⅰ)M1	201.0	301.0	17.3

(2)胶原蛋白纯化

缓冲液A：20mM KH₂PO₄，pH值为4.0；

缓冲液B：20mM KH₂PO₄、0.5M NaCl，pH值为4.0。

收集发酵液，2000g、30min、4℃离心分离菌体和发酵上清。以缓冲液A平衡阳离子交换介质(层析填料为苏州纳微产UniGel-80sp装载于利穗科技产GCC-50-400层析柱，使用GE AKTA Pure蛋白质分离层析纯化系统)至A215吸光值和电导率值都保持不变后，设置40us/cm的流速上样，上样体积0.5L/次，检测紫外A215吸光值，当其上升时，开始接样。待上样结束后，关闭接样，再以缓冲液A平衡阳离子层析介质，当A215吸光值下降时，直至紫外和电导降至最低且不再变化。收集洗脱液，分别检测确定好组份后，进行透析(透析液为超纯水)，随后浓缩、冷冻干燥，收集冻干胶原蛋白海绵。取纯化后冻干海绵溶于超纯水，进行SDS-PAGE电泳，如图10所示。α1(Ⅰ)M1、α1(Ⅱ)M6经一步离子交换纯化后，去除多数的杂蛋白和小降解条带等，即可获得纯度高的单一目的蛋白质(使用Image Lab软件测算，α1(Ⅰ)M1纯度为90.1％、α1(Ⅱ)M6纯度为88.3％)；而α1(Ⅰ)、α1(Ⅱ)经相同的纯化步骤后，主降解带依旧出现、无法消除，主降解产物与目的产物大小相差不多，性质相近，很难使用一步纯化将二者分离，根据申请号201911135958.0和申请号201911088025.0的专利内容可知，想获得单一目的全长α1(Ⅰ)链、全长α1(Ⅱ)链产物，需要利用全长α1(Ⅰ)链、全长α1(Ⅱ)链氨基端有Srtep-TagⅡ标签，羧基端有6×His标签的性质，使用Ni-NTA、Strep-Tactin亲和层析介质进行双亲和纯化才能做到，这样的话在SDS-PAGE上表现为主降解条带的主降解产物则被舍弃，浪费了菌体的生物合成资源，增加了纯化步骤，目的产物得率降低。

实施例5.重组胶原蛋白的检测

(1)傅里叶变换红外光谱(FT-IR)分析

试验取微量α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白纯化后冻干样品分别混合溴化钾(KBr)研磨成粉后压片，室温下，在4000～400cm^-1范围内扫描(Thermo Scientific，Nicolet^TM iS^TM 10FT-IR光谱仪)，方法及结果分析参照(Jeong,H.,J.Venkatesan andS.Kim,Isolation and characterization of collagen from marine fish(Thunnusobesus).Biotechnology and Bioprocess Engineering,2013.18(6):p.1185-1191.)。

从α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)蛋白纯化样品的红外光谱扫描见图11和图12，可以看到其特征吸收均波数均符合重组胶原蛋白结构特征：酰胺A(3299cm^-1左右)、酰胺B(3081cm^-1左右)、酰胺I(1650cm^-1左右)、酰胺II(1530～1550cm^-1左右)、酰胺III(1240cm^-1左右)，说明α1(Ⅰ)M1、α1(Ⅱ)M6中氨基酸的突变不影响胶原蛋白本身性质(参见文献[1].陈静涛等,重组胶原蛋白与牛源Ⅰ型胶原蛋白红外光谱研究.材料导报,2008(03):第119-121页.[2].Doyle,B.B.,E.G.Bendit and E.R.Blout,Infrared spectroscopy of collagenand collagen-like polypeptides.Biopolymers,1975.14(5):p.937-957.[3].周爱梅等,重组人源胶原蛋白的分离纯化及其结构表征.食品与发酵工业,2015(03):第46-52页.)。

(2)重组胶原蛋白细胞黏附活性检测

重组胶原蛋白的细胞黏附活检测方法参考文献Juming Yao,SatoshiYanagisawa,Tetsuo Asakura.Design,Expression and Characterization of Collagen-Like Proteins Based on the Cell Adhesive and Crosslinking Sequences Derivedfrom Native Collagens,J Biochem.136,643-649(2004)。委托常州大学药学院功能纳米材料与生物医学检测实验室完成。

具体实施方法：正常培养NIH/3T3细胞(购自中国科学院细胞库，货号GNM6，培养、传代方法参照细胞说明书执行)。取重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白冻干海绵、对照人胶原蛋白(购买自Sigma，货号C7774)及牛血清白蛋白(BSA，购自生工生物(上海)股份有限公司)溶解(用超纯水或1M HCl溶液)，以UV蛋白定量经验公式：C(mg/mL)＝0.144×(A215-A225)测定蛋白浓度，再以PBS(pH 7.4)稀释至0.5mg/mL。向96孔细胞培养板中加入100μL各种蛋白溶液和空白PBS溶液对照，室温静置60min；再向每孔中加入10⁵个培养状态良好的NIH/3T3细胞，37℃、5％CO₂孵育60min。以PBS清洗4次孔中细胞。使用LDH检测试剂盒(Roche，04744926001)检测OD492nm的吸光度值(具体操作参照说明书执行)。

OD492nm的吸光度相应的表征可以代表胶原蛋白样品的细胞粘附活性：OD492nm的吸光度越高，说明蛋白粘附的细胞越多，黏附活性越高，胶原蛋白越能在短时间内帮助细胞贴壁或粘附于细胞外基质之上，更利于构建更佳的细胞外环境。结果如图13所示，重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白均与商品化的天然人胶原蛋白有类似的细胞黏附活性，且都显著高于对照组；α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比，细胞黏附活性基本一致，无显著差异。

(3)重组胶原蛋白水凝胶的制备与检测

取重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白，以10％浓度溶于注射用水，调节pH值控制在4～6的范围内，0.22μm无菌滤器过滤除菌；以每1g胶原干粉的比例加入0.1g10％(w/w)无菌N-羟基琥珀酰亚胺(NHS)溶液，混匀；然后以每g胶原干粉的比例加入0.13g50％(w/w)无菌1-(3-二甲基氨丙基)-3-乙基碳二亚胺盐酸盐(EDC)溶液；室温(20-30℃)静置反应2-6h，形成水凝胶。将水凝胶置于无菌PBS溶液中(NaCl 8.5g/L、Na₂HPO₄ 0.5g/L、NaH₂PO₄ 0.15g/L，pH 7.2)透析，凝胶：PBS透析液＝1：6(m/m)，连续透析120h，每24h彻底更换一次透析液，去除NHS、EDC残留。将透析后的水凝胶装入无菌容器中，室温放置。

将水凝胶冷冻干燥去除水分，取冻干后水凝胶称重，再置于无菌PBS溶液中放置24h，待其彻底吸水溶胀，取出水凝胶，吸水纸将表面水分吸干后称重。参考文献中方法计算溶胀率：Q_溶胀率＝(W_{吸水溶胀质量}-W_{干凝胶重量})/W_{干凝胶重量}。流变仪(Discovery HR-2)检测水凝胶的弹性模量(储能模量，小振幅频率扫描，25℃、应力0.5％、0.1-100.0rad/s)、动力粘度(流动峰值保持，25℃、剪切速率2.0s^-1)。将冻干后水凝胶转入液氮中速冻，掰断，使用扫描电镜(日立TM3030PLUS)对冻干后水凝胶表面进行扫描。弹性模量、动力粘度、溶胀率结果如表2所示，α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比，相同条件下所制备的水凝胶的流体力学性质基本一致，并无明显改变。

表2.四种水凝胶的弹性模量、动力粘度、溶胀率检测

凝胶种类	弹性模量(Pa)	粘度(Pa·S)	溶胀率(g/g干凝胶)
				α1(Ⅱ)	104.63	82.87	14.18
α1(Ⅱ)M6	102.02	77.80	14.01
				α1(Ⅰ)	234.67	190.67	12.53
α1(Ⅰ)M1	292.68	170.97	12.22

如图14、15所示，由α1(Ⅰ)M1、α1(Ⅱ)M6所制备的水凝胶与由α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶一样，均为多孔网状结构，孔径范围集中于100-200μm，具有良好的通透性，具备保持大量水分的空间结构基础，可作为细胞提供黏附、支撑、生长迁移的空间和输送营养物质与新陈代谢产物的通道，有应用于生物医学材料领域的潜力。

(4)重组胶原蛋白水凝胶的细胞检测

无菌存放的水凝胶放置于24孔细胞培养板中。取正常培养NIH/3T3细胞(购自中国科学院细胞库，货号GNM6，培养、传代方法参照细胞说明书执行)，PBS清洗、胰酶消化、加培养基吹打均匀并计数，10⁵细胞/孔接入到含水凝胶的培养皿中，共培养24-72小时，观察细胞于水凝胶上的粘附与增值情况。

(1)取一块24孔板用DMSO制备1mM的钙黄黄绿AM(购于碧云天生物技术研究所)，并用D-PBS将其稀释成50μM的钙黄绿素工作液。吸去孔中培养基，用PBS清洗数次，加入1mL的含血清DMEM培养基，加入100μL钙黄绿素AM溶液(培养基的1/10)，孵育30min，对细胞进行染色，再更换生长培养基，培养30min，轻取出水凝胶，置入新的培养孔中，荧光显微镜下拍照(最大激发光波长为494nm，最大发射光波长为514nm)。

(2)另取一块24孔板中加入200μL MTT溶液(购于碧云天生物技术研究所)，培养NIH/3T3细胞4h后，观察细胞中蓝紫色结晶形成情况，弃培养基，用PBS清洗水凝胶，纵切开水凝胶，置入新的培养孔中，显微镜下拍照。

该实施例实验委托常州大学药学院功能纳米材料与生物医学检测实验室完成。

结果如图16、17所示，由α1(Ⅰ)M1、α1(Ⅱ)M6所制备的水凝胶与由α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶一样，明场显微镜下观察NIH/3T3细胞形态正常，为典型的成纤维细胞形态；水凝胶上黏附生长的NIH/3T3细胞被钙黄绿素AM染色后可检测到绿色荧光(照片中明亮部分)；水凝胶中生长的NIH/3T3细胞在加入MTT后，可形成的蓝紫色结晶(照片中黑色部分)；绿色荧光与蓝紫色结晶只能由活细胞形成，说明NIH/3T3细胞均能正常黏附、生长、迁移于水凝胶中，由α1(Ⅰ)M1、α1(Ⅱ)M6制备的水凝胶与天然序列的α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶有类似的生物学功能，可作为新型生物医疗器械应用于创伤修复、组织再生等领域。

序列表

<110> 江苏创健医疗科技有限公司

<120> 重组胶原蛋白、制备方法及其应用

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1057

<212> PRT

<213> 人(Homo sapiens)

<400> 1

Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser Val

1 5 10 15

Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro

20 25 30

Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly

35 40 45

Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro

50 55 60

Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro

65 70 75 80

Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly

85 90 95

Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly Leu

100 105 110

Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro

115 120 125

Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly Pro Arg Gly

130 135 140

Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala

145 150 155 160

Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr

165 170 175

Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys Gly

180 185 190

Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly Val

195 200 205

Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala

210 215 220

Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly

225 230 235 240

Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro

245 250 255

Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser

260 265 270

Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly

275 280 285

Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Glu

290 295 300

Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro

305 310 315 320

Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly

325 330 335

Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser

340 345 350

Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro

355 360 365

Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly

370 375 380

Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln

385 390 395 400

Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala

405 410 415

Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly

420 425 430

Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly Pro

435 440 445

Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala

450 455 460

Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly

465 470 475 480

Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys

485 490 495

Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser

500 505 510

Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln Gly

515 520 525

Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn

530 535 540

Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln

545 550 555 560

Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly

565 570 575

Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala

580 585 590

Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro Ile

595 600 605

Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly

610 615 620

Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp

625 630 635 640

Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro

645 650 655

Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly

660 665 670

Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro

675 680 685

Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala Arg

690 695 700

Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly

705 710 715 720

Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro

725 730 735

Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr

740 745 750

Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro Gly

755 760 765

Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala

770 775 780

Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val Val

785 790 795 800

Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly

805 810 815

Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu

820 825 830

Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro

835 840 845

Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly

850 855 860

Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro

865 870 875 880

Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val

885 890 895

Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly

900 905 910

Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly Pro

915 920 925

Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp Arg

930 935 940

Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro Gly

945 950 955 960

Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly Pro

965 970 975

Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys Asp

980 985 990

Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly

995 1000 1005

Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly Pro

1010 1015 1020

Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe Leu

1025 1030 1035 1040

Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr Arg

1045 1050 1055

Ala

<210> 2

<211> 1057

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser Val

1 5 10 15

Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro

20 25 30

Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly

35 40 45

Glu Pro Gly Ala Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro

50 55 60

Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro

65 70 75 80

Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly

85 90 95

Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly Leu

100 105 110

Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro

115 120 125

Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Pro Gly Pro Pro Gly

130 135 140

Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala

145 150 155 160

Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr

165 170 175

Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys Gly

180 185 190

Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly Val

195 200 205

Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala

210 215 220

Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly

225 230 235 240

Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro

245 250 255

Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser

260 265 270

Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly

275 280 285

Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Glu

290 295 300

Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro

305 310 315 320

Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly

325 330 335

Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser

340 345 350

Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro

355 360 365

Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly

370 375 380

Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln

385 390 395 400

Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala

405 410 415

Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly

420 425 430

Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly Pro

435 440 445

Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala

450 455 460

Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly

465 470 475 480

Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys

485 490 495

Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser

500 505 510

Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln Gly

515 520 525

Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn

530 535 540

Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln

545 550 555 560

Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly

565 570 575

Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala

580 585 590

Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro Ile

595 600 605

Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly

610 615 620

Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp

625 630 635 640

Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro

645 650 655

Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly

660 665 670

Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro

675 680 685

Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala Arg

690 695 700

Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly

705 710 715 720

Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro

725 730 735

Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr

740 745 750

Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro Gly

755 760 765

Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala

770 775 780

Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val Val

785 790 795 800

Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly

805 810 815

Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu

820 825 830

Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro

835 840 845

Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly

850 855 860

Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro

865 870 875 880

Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val

885 890 895

Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly

900 905 910

Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly Pro

915 920 925

Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp Arg

930 935 940

Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro Gly

945 950 955 960

Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly Pro

965 970 975

Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys Asp

980 985 990

Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly

995 1000 1005

Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly Pro

1010 1015 1020

Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe Leu

1025 1030 1035 1040

Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr Arg

1045 1050 1055

Ala

<210> 3

<211> 3171

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

caacttagtt atggatacga tgaaaaatcc acaggtggaa tcagtgttcc tggacctatg 60

ggtccatcag gtccaagagg tttaccagga cctccaggtg ccccaggtcc ccagggattt 120

caaggtccac caggagagcc tggtgagcca ggagcttctg gtccacctgg tccccctgga 180

ccacctggtc ctccaggaaa gaatggagat gatggtgaag ctggaaaacc tggaagacct 240

ggagaaagag gaccaccagg accccagggt gccagaggac tgccaggtac cgcaggtctg 300

cctggaatga aaggtcatag aggattttca ggattagacg gtgcaaaggg agacgctgga 360

cctgcaggac caaagggtga gccaggaagt ccaggagaga atggtgcacc aggacagcca 420

ggtccacctg gactgcccgg tgaaagaggt agacccggag caccaggacc agcaggtgca 480

agaggaaatg atggagctac aggtgctgca ggacccccag gtccaacagg accagccggt 540

cctcccggtt tcccaggtgc cgttggagca aaaggtgaag ctggtccaca gggtccaaga 600

ggttctgaag gtccacaggg agttagagga gaaccaggac cccctggacc agctggtgca 660

gcaggaccag ctggtaaccc tggtgctgac ggtcagccag gtgctaaggg agcaaatgga 720

gcaccaggaa tagctggtgc cccaggattt cccggtgcta gaggtccaag tggtccacaa 780

ggaccaggag gtccacccgg tcccaaagga aacagtggag aaccaggtgc acccggttca 840

aagggagata caggagctaa aggagagccc ggtccagtgg gtgttcaggg accacccgga 900

cctgctggag aggaaggtaa aagaggtgca agaggtgagc caggaccaac aggtctgcct 960

ggtccccctg gtgaaagagg tggtccaggt agtagaggat ttccaggagc tgatggtgtt 1020

gcaggaccaa agggacccgc aggtgagaga ggatcacccg gtccagccgg accaaaagga 1080

tcaccaggag aagctggtag accaggagaa gctggtctgc caggtgctaa aggattgaca 1140

ggatcacccg gttcacctgg tcctgatgga aagacaggac ctccaggtcc cgctggtcag 1200

gacggtagac caggaccccc aggaccccca ggtgcaagag gtcaggcagg tgtaatgggt 1260

ttccccggac ctaaaggagc agctggagaa cctggtaaag ctggagagag aggagtgcct 1320

ggaccccctg gagctgttgg tccagcagga aaggatggtg aggcaggtgc acaaggtcca 1380

cctggacccg ctggacctgc aggtgagaga ggagagcaag gtcccgcagg ttctccaggt 1440

tttcagggtt tgccaggtcc agccggtcct cctggagagg caggaaagcc aggagaacaa 1500

ggagttccag gagacctggg tgcaccagga ccctctggtg caagaggaga gagaggattt 1560

cctggagaaa gaggtgtgca gggaccacca ggtcccgccg gtccaagagg agcaaatgga 1620

gcccctggaa atgacggagc taagggtgac gctggtgcac caggagcacc aggttctcaa 1680

ggtgctcccg gattgcaggg tatgcctgga gagagaggtg cagctggact gccaggtcca 1740

aaaggtgaca gaggagacgc cggtcctaag ggagctgacg gttctcctgg aaaggacggt 1800

gtgagaggtt tgacaggacc aataggtcca cccggtcctg ctggagcccc tggagacaaa 1860

ggtgaatcag gtccttccgg tccagccgga ccaacaggag caagaggagc acctggagac 1920

agaggagagc caggtcctcc aggacctgca ggtttcgctg gtcctcccgg agcagatgga 1980

cagccaggag ctaagggaga acccggtgac gctggtgcta agggagatgc aggtccacca 2040

ggtcctgctg gtcctgctgg acctcccgga ccaataggta atgttggagc acccggagca 2100

aaaggtgcca gaggttccgc aggtcctccc ggagcaactg gttttccagg agctgccgga 2160

agagtgggtc cacctggtcc ttctggaaat gcaggaccac caggtcctcc tggtccagcc 2220

ggaaaggaag gtggaaaggg acctagagga gaaacaggtc ccgcaggtag acccggtgag 2280

gtgggtccac ctggtccacc cggtccagct ggtgagaaag gaagtcctgg agcagacgga 2340

ccagctggtg cccctggtac accaggaccc caaggaatag ctggtcaaag aggtgttgtt 2400

ggtttaccag gtcagagagg agaaagaggt tttccaggat taccaggtcc ctcaggtgag 2460

cccggaaaac agggtccctc aggagcaagt ggtgaaagag gaccaccagg accaatggga 2520

cctccaggat tagctggtcc accaggagaa tcaggaagag agggtgctcc tggagcagaa 2580

ggttcaccag gaagagacgg ttcacccgga gccaagggag acagaggtga aacaggtccc 2640

gcaggtccac caggagcacc cggagcccct ggtgctccag gacctgtcgg accagcagga 2700

aaatccggtg acagaggtga gactggaccc gcaggtcctg ctggtcctgt tggaccagtg 2760

ggtgcaagag gaccagcagg tccacaaggt ccaagaggtg acaaaggtga gacaggtgag 2820

cagggtgaca gaggaattaa aggtcacaga ggattttcag gactgcaggg accacccggt 2880

cctcccggtt ccccaggaga gcaaggtcca tccggtgcat ccggtccagc tggacccaga 2940

ggaccacctg gttctgctgg tgcaccaggt aaagatggat tgaacggttt gcctggtcca 3000

ataggacctc ctggtccaag aggaagaact ggtgacgccg gtcccgtcgg accacccggt 3060

ccaccaggtc ccccaggtcc acccggacca ccatccgcag gatttgattt ctcattcctt 3120

cctcaacctc ctcaagagaa agcacatgat ggaggtagat actatagagc c 3171

<210> 4

<211> 1060

<212> PRT

<213> 人(Homo sapiens)

<400> 4

Gln Met Ala Gly Gly Phe Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly

1 5 10 15

Val Met Gln Gly Pro Met Gly Pro Met Gly Pro Arg Gly Pro Pro Gly

20 25 30

Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu

35 40 45

Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly Pro Arg Gly Pro Pro

50 55 60

Gly Pro Pro Gly Lys Pro Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly

65 70 75 80

Lys Ala Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe

85 90 95

Pro Gly Thr Pro Gly Leu Pro Gly Val Lys Gly His Arg Gly Tyr Pro

100 105 110

Gly Leu Asp Gly Ala Lys Gly Glu Ala Gly Ala Pro Gly Val Lys Gly

115 120 125

Glu Ser Gly Ser Pro Gly Glu Asn Gly Ser Pro Gly Pro Met Gly Pro

130 135 140

Arg Gly Leu Pro Gly Glu Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala

145 150 155 160

Gly Ala Arg Gly Asn Asp Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly

165 170 175

Pro Val Gly Pro Ala Gly Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala

180 185 190

Lys Gly Glu Ala Gly Pro Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln

195 200 205

Gly Pro Arg Gly Glu Pro Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly

210 215 220

Ala Ser Gly Asn Pro Gly Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser

225 230 235 240

Ala Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg

245 250 255

Gly Pro Pro Gly Pro Gln Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly

260 265 270

Gln Thr Gly Glu Pro Gly Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro

275 280 285

Lys Gly Glu Pro Gly Pro Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala

290 295 300

Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Gly Val Gly

305 310 315 320

Pro Ile Gly Pro Pro Gly Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe

325 330 335

Pro Gly Gln Asp Gly Leu Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg

340 345 350

Gly Pro Ser Gly Leu Ala Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly

355 360 365

Arg Pro Gly Glu Pro Gly Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg

370 375 380

Pro Gly Asp Ala Gly Pro Gln Gly Lys Val Gly Pro Ser Gly Ala Pro

385 390 395 400

Gly Glu Asp Gly Arg Pro Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly

405 410 415

Gln Pro Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu

420 425 430

Pro Gly Lys Ala Gly Glu Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg

435 440 445

Gly Leu Pro Gly Lys Asp Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly

450 455 460

Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro

465 470 475 480

Ser Gly Phe Gln Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly

485 490 495

Gly Lys Pro Gly Asp Gln Gly Val Pro Gly Glu Ala Gly Ala Pro Gly

500 505 510

Leu Val Gly Pro Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser

515 520 525

Pro Gly Ala Gln Gly Leu Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro

530 535 540

Gly Thr Asp Gly Pro Lys Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly

545 550 555 560

Ala Gln Gly Pro Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala

565 570 575

Ala Gly Ile Ala Gly Pro Lys Gly Asp Arg Gly Asp Val Gly Glu Lys

580 585 590

Gly Pro Glu Gly Ala Pro Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly

595 600 605

Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu

610 615 620

Val Gly Pro Pro Gly Pro Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro

625 630 635 640

Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly

645 650 655

Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu

660 665 670

Ala Gly Gln Lys Gly Asp Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser

675 680 685

Gly Ala Pro Gly Pro Gln Gly Pro Thr Gly Val Thr Gly Pro Lys Gly

690 695 700

Ala Arg Gly Ala Gln Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala

705 710 715 720

Ala Gly Arg Val Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro

725 730 735

Gly Pro Pro Gly Pro Ser Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly

740 745 750

Asp Ser Gly Pro Pro Gly Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro

755 760 765

Ala Gly Pro Pro Gly Glu Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser

770 775 780

Gly Ala Glu Gly Pro Pro Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly

785 790 795 800

Ile Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu

805 810 815

Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser

820 825 830

Gly Asp Arg Gly Pro Pro Gly Pro Val Gly Pro Pro Gly Leu Thr Gly

835 840 845

Pro Ala Gly Glu Pro Gly Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro

850 855 860

Pro Gly Arg Asp Gly Ala Ala Gly Val Lys Gly Asp Arg Gly Glu Thr

865 870 875 880

Gly Ala Val Gly Ala Pro Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly

885 890 895

Pro Ala Gly Pro Thr Gly Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala

900 905 910

Gln Gly Pro Met Gly Pro Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln

915 920 925

Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly

930 935 940

Glu Arg Gly Leu Lys Gly His Arg Gly Phe Thr Gly Leu Gln Gly Leu

945 950 955 960

Pro Gly Pro Pro Gly Pro Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala

965 970 975

Gly Pro Ser Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Pro Ser Gly

980 985 990

Lys Asp Gly Ala Asn Gly Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro

995 1000 1005

Arg Gly Arg Ser Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro

1010 1015 1020

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Gly Ile Asp Met Ser

1025 1030 1035 1040

Ala Phe Ala Gly Leu Gly Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln

1045 1050 1055

Tyr Met Arg Ala

1060

<210> 5

<211> 1060

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 5

Gln Met Ala Gly Gly Phe Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly

1 5 10 15

Pro Pro Gln Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly

20 25 30

Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu

35 40 45

Pro Gly Glu Pro Gly Val Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro

50 55 60

Gly Pro Pro Gly Lys Pro Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly

65 70 75 80

Lys Ala Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe

85 90 95

Pro Gly Thr Pro Gly Leu Pro Gly Val Lys Gly His Arg Gly Tyr Pro

100 105 110

Gly Leu Asp Gly Ala Lys Gly Glu Ala Gly Ala Pro Gly Val Lys Gly

115 120 125

Glu Ser Gly Ser Pro Gly Glu Asn Gly Ser Pro Gly Pro Pro Gly Pro

130 135 140

Pro Gly Leu Pro Gly Glu Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala

145 150 155 160

Gly Ala Arg Gly Asn Asp Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly

165 170 175

Pro Val Gly Pro Ala Gly Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala

180 185 190

Lys Gly Glu Ala Gly Pro Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln

195 200 205

Gly Pro Arg Gly Glu Pro Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly

210 215 220

Ala Ser Gly Asn Pro Gly Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser

225 230 235 240

Ala Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg

245 250 255

Gly Pro Pro Gly Pro Gln Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly

260 265 270

Gln Thr Gly Glu Pro Gly Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro

275 280 285

Lys Gly Glu Pro Gly Pro Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala

290 295 300

Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Gly Val Gly

305 310 315 320

Pro Ile Gly Pro Pro Gly Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe

325 330 335

Pro Gly Gln Asp Gly Leu Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg

340 345 350

Gly Pro Ser Gly Leu Ala Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly

355 360 365

Arg Pro Gly Glu Pro Gly Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg

370 375 380

Pro Gly Asp Ala Gly Pro Gln Gly Lys Val Gly Pro Ser Gly Ala Pro

385 390 395 400

Gly Glu Asp Gly Arg Pro Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly

405 410 415

Gln Pro Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu

420 425 430

Pro Gly Lys Ala Gly Glu Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg

435 440 445

Gly Leu Pro Gly Lys Asp Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly

450 455 460

Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro

465 470 475 480

Ser Gly Phe Gln Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly

485 490 495

Gly Lys Pro Gly Asp Gln Gly Val Pro Gly Glu Ala Gly Ala Pro Gly

500 505 510

Leu Val Gly Pro Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser

515 520 525

Pro Gly Ala Gln Gly Leu Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro

530 535 540

Gly Thr Asp Gly Pro Lys Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly

545 550 555 560

Ala Gln Gly Pro Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala

565 570 575

Ala Gly Ile Ala Gly Pro Lys Gly Asp Arg Gly Asp Val Gly Glu Lys

580 585 590

Gly Pro Glu Gly Ala Pro Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly

595 600 605

Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu

610 615 620

Val Gly Pro Pro Gly Pro Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro

625 630 635 640

Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly

645 650 655

Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu

660 665 670

Ala Gly Gln Lys Gly Asp Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser

675 680 685

Gly Ala Pro Gly Pro Gln Gly Pro Thr Gly Val Thr Gly Pro Lys Gly

690 695 700

Ala Arg Gly Ala Gln Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala

705 710 715 720

Ala Gly Arg Val Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro

725 730 735

Gly Pro Pro Gly Pro Ser Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly

740 745 750

Asp Ser Gly Pro Pro Gly Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro

755 760 765

Ala Gly Pro Pro Gly Glu Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser

770 775 780

Gly Ala Glu Gly Pro Pro Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly

785 790 795 800

Ile Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu

805 810 815

Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser

820 825 830

Gly Asp Arg Gly Pro Pro Gly Pro Val Gly Pro Pro Gly Leu Thr Gly

835 840 845

Pro Ala Gly Glu Pro Gly Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro

850 855 860

Pro Gly Arg Asp Gly Ala Ala Gly Val Lys Gly Asp Arg Gly Glu Thr

865 870 875 880

Gly Ala Val Gly Ala Pro Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly

885 890 895

Pro Ala Gly Pro Thr Gly Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala

900 905 910

Gln Gly Pro Met Gly Pro Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln

915 920 925

Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly

930 935 940

Glu Arg Gly Leu Lys Gly His Arg Gly Phe Thr Gly Leu Gln Gly Leu

945 950 955 960

Pro Gly Pro Pro Gly Pro Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala

965 970 975

Gly Pro Ser Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Pro Ser Gly

980 985 990

Lys Asp Gly Ala Asn Gly Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro

995 1000 1005

Arg Gly Arg Ser Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro

1010 1015 1020

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Gly Ile Asp Met Ser

1025 1030 1035 1040

Ala Phe Ala Gly Leu Gly Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln

1045 1050 1055

Tyr Met Arg Ala

1060

<210> 6

<211> 3180

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

caaatggctg gtggattcga tgaaaaggct ggtggagccc aattaggtcc tccacaaggt 60

cctcccggtc cacctggtcc tcccggtcct ccaggtcccg ccggtgctcc tggaccacag 120

ggtttccaag gaaaccccgg tgaaccaggt gagcctggtg tttcaggtcc tcccggtcct 180

ccaggaccac ctggaccacc aggaaagcct ggtgacgacg gagaagctgg taaaccagga 240

aaggcaggag agagaggtcc acctggacct cagggtgcca gaggtttccc aggtacccct 300

ggtcttcctg gtgtcaaggg tcatagaggt taccccggtt tggatggtgc caagggtgaa 360

gccggtgccc ctggtgttaa gggtgaatca ggaagtcccg gtgaaaatgg aagtcccggt 420

ccacccggtc cacctggact gccaggtgag agaggaagaa ccggaccagc tggtgctgca 480

ggtgctagag gaaatgacgg acagcccgga ccagccggac ctcccggtcc tgttgggccc 540

gcaggtggtc ctggtttccc tggtgctcct ggagccaaag gagaagccgg acccaccgga 600

gccagaggtc ccgagggagc acagggacct agaggagaac caggtacacc aggtagtccc 660

ggtcctgctg gtgcatcagg aaatcccgga actgacggta ttccaggagc aaagggatct 720

gcaggagcac caggaatagc tggtgctcct ggatttccag gtcccagagg acctcccggt 780

cctcaaggag caacaggtcc tttgggacca aaaggtcaaa caggagaacc aggtattgct 840

ggattcaaag gagagcaagg tccaaaggga gagcccggtc ccgcaggtcc ccaaggagcc 900

ccaggaccag ctggtgaaga aggaaaaaga ggagccagag gtgaacctgg aggagtagga 960

cctattggtc ctcctggtga gagaggtgct cccggaaaca gaggttttcc tggtcaagat 1020

ggtctggctg gacctaaagg tgctccagga gagagaggac cttcaggact tgctggtcca 1080

aaaggtgcta acggagatcc aggaagaccc ggtgaacctg gtctgcctgg agctagagga 1140

ttaacaggaa gaccaggtga cgcaggtccc cagggtaaag tgggtcccag tggtgcccca 1200

ggtgaagatg gaagacctgg tcctcccgga ccccaaggtg caagaggtca gcctggagtg 1260

atgggatttc ctggacccaa gggtgctaac ggagaacctg gaaaagctgg tgagaaagga 1320

ctgcccggtg ccccaggtct tagaggtttg ccaggtaaag atggagaaac aggagccgca 1380

ggaccacccg gtccagccgg accagcagga gagagaggtg aacaaggagc acctggtcca 1440

agtggttttc agggtcttcc aggtccccct ggtccaccag gagagggagg taaaccaggt 1500

gaccaaggtg tccctggaga agcaggtgca cccggtcttg tgggtccaag aggtgaaaga 1560

ggattccctg gtgagagagg atctcccgga gcccagggac ttcaaggtcc tagaggtctg 1620

ccaggtaccc ctggtacaga cggaccaaag ggagcatcag gacccgctgg acctcccgga 1680

gcccaaggtc ctccaggttt acaaggtatg cctggtgaaa gaggtgctgc aggtatagct 1740

ggaccaaaag gagacagagg tgacgttggt gagaagggtc ccgaaggagc ccctggaaaa 1800

gatggtggaa gaggattaac aggtcctata ggaccacccg gtccagccgg tgctaatgga 1860

gaaaaaggag aagtaggtcc tccaggtcca gcaggatctg caggtgctag aggtgcccct 1920

ggagagagag gtgaaacagg accacctggt ccagctggtt tcgctggtcc cccaggagct 1980

gatggacagc ccggtgcaaa aggtgaacaa ggagaagccg gacagaaggg agatgctgga 2040

gcccccggtc cacaaggtcc ctcaggagca ccaggtcctc aaggtccaac tggtgtgacc 2100

gggccaaagg gtgcaagagg agcacaggga cctccaggag caacaggttt cccaggagct 2160

gctggtagag tcggtccacc cggatctaat ggtaaccccg gaccaccagg accacctgga 2220

ccatctggaa aggatggacc caaaggagca agaggagatt caggaccacc cggaagagca 2280

ggagaacctg gattacaggg tcccgccggt ccaccaggag agaaaggaga gcccggagat 2340

gatggtccct caggtgcaga gggaccccca ggaccccaag gtctggcagg tcaaagaggt 2400

atagtgggtc ttccaggtca aagaggtgaa agaggatttc caggacttcc aggtccttca 2460

ggtgaacccg gtaaacaggg agcccccgga gcctcaggtg acagaggtcc tccaggacca 2520

gtaggacccc caggtttaac cggaccagca ggtgagccag gaagagaagg ttctcctgga 2580

gccgatggac ctccaggaag agacggtgca gctggtgtta agggtgacag aggtgaaact 2640

ggagccgtag gagccccagg tgcccccgga ccacccggat cacccggacc tgcaggtcct 2700

actggtaaac aaggagatag aggagaagcc ggtgcccagg gtcctatggg tccttctggt 2760

cctgcaggag caagaggtat acaaggtcca cagggtccca gaggtgacaa gggtgaagca 2820

ggagaacccg gtgagagagg tctgaagggt catagaggat tcaccgggtt acagggtttg 2880

ccaggacccc ctggaccaag tggtgaccag ggtgcatccg gtccagcagg tccttctgga 2940

ccaagaggtc ctcccggtcc agttggtcca tcaggtaaag acggagccaa cggtatccca 3000

ggtcccatcg gtcctccagg tcctagagga agaagtggag agactggtcc tgctggacct 3060

cctggaaacc ctggtcctcc aggacctcca ggtcctccag gtcccggaat agatatgtcc 3120

gctttcgctg gattgggacc aagagagaaa ggtcctgacc ctcttcaata tatgagagca 3180

<210> 7

<211> 1071

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Trp Ser His Pro Gln Phe Glu Lys Gln Leu Ser Tyr Gly Tyr Asp Glu

1 5 10 15

Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro Ser Gly

20 25 30

Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln Gly Phe

35 40 45

Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly Pro Pro

50 55 60

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp Asp Gly

65 70 75 80

Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro Gly Pro

85 90 95

Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly Met Lys

100 105 110

Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp Ala Gly

115 120 125

Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn Gly Ala

130 135 140

Pro Gly Gln Pro Gly Pro Pro Gly Leu Pro Gly Glu Arg Gly Arg Pro

145 150 155 160

Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala Thr Gly

165 170 175

Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro Gly Phe

180 185 190

Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly Pro Arg

195 200 205

Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro Pro Gly

210 215 220

Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp Gly Gln

225 230 235 240

Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly Ala Pro

245 250 255

Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro Gly Gly

260 265 270

Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro Gly Ser

275 280 285

Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly Val Gln

290 295 300

Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly

305 310 315 320

Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg Gly Gly

325 330 335

Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly Pro Lys

340 345 350

Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro Lys Gly

355 360 365

Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro Gly Ala

370 375 380

Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly Lys Thr

385 390 395 400

Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro Pro Gly

405 410 415

Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro Gly Pro

420 425 430

Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly Val Pro

435 440 445

Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu Ala Gly

450 455 460

Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu

465 470 475 480

Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly Pro Ala

485 490 495

Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val Pro Gly

500 505 510

Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg Gly Phe

515 520 525

Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Pro Arg

530 535 540

Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp Ala Gly

545 550 555 560

Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln Gly Met

565 570 575

Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly Asp Arg

580 585 590

Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys Asp Gly

595 600 605

Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala

610 615 620

Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly Pro Thr

625 630 635 640

Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly

645 650 655

Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala

660 665 670

Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly Pro Pro

675 680 685

Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn Val Gly

690 695 700

Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro Gly Ala

705 710 715 720

Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly Pro Ser

725 730 735

Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu Gly

740 745 750

Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro Gly Glu

755 760 765

Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly Ser Pro

770 775 780

Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro Gln Gly

785 790 795 800

Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg Gly Glu

805 810 815

Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln

820 825 830

Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly Pro Met Gly

835 840 845

Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly Arg Glu Gly Ala

850 855 860

Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly Ser Pro Gly Ala Lys

865 870 875 880

Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Ala Pro Gly

885 890 895

Ala Pro Gly Ala Pro Gly Pro Val Gly Pro Ala Gly Lys Ser Gly Asp

900 905 910

Arg Gly Glu Thr Gly Pro Ala Gly Pro Ala Gly Pro Val Gly Pro Val

915 920 925

Gly Ala Arg Gly Pro Ala Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly

930 935 940

Glu Thr Gly Glu Gln Gly Asp Arg Gly Ile Lys Gly His Arg Gly Phe

945 950 955 960

Ser Gly Leu Gln Gly Pro Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln

965 970 975

Gly Pro Ser Gly Ala Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly

980 985 990

Ser Ala Gly Ala Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro

995 1000 1005

Ile Gly Pro Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val

1010 1015 1020

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser

1025 1030 1035 1040

Ala Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys Ala

1045 1050 1055

His Asp Gly Gly Arg Tyr Tyr Arg Ala His His His His His His

1060 1065 1070

<210> 8

<211> 3216

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

tggtctcatc cacaatttga aaagcaactt agttatggat acgatgaaaa atccacaggt 60

ggaatcagtg ttcctggacc tatgggtcca tcaggtccaa gaggtttacc aggacctcca 120

ggtgccccag gtccccaggg atttcaaggt ccaccaggag agcctggtga gccaggagct 180

tctggtccac ctggtccccc tggaccacct ggtcctccag gaaagaatgg agatgatggt 240

gaagctggaa aacctggaag acctggagaa agaggaccac caggacccca gggtgccaga 300

ggactgccag gtaccgcagg tctgcctgga atgaaaggtc atagaggatt ttcaggatta 360

gacggtgcaa agggagacgc tggacctgca ggaccaaagg gtgagccagg aagtccagga 420

gagaatggtg caccaggaca gccaggtcca cctggactgc ccggtgaaag aggtagaccc 480

ggagcaccag gaccagcagg tgcaagagga aatgatggag ctacaggtgc tgcaggaccc 540

ccaggtccaa caggaccagc cggtcctccc ggtttcccag gtgccgttgg agcaaaaggt 600

gaagctggtc cacagggtcc aagaggttct gaaggtccac agggagttag aggagaacca 660

ggaccccctg gaccagctgg tgcagcagga ccagctggta accctggtgc tgacggtcag 720

ccaggtgcta agggagcaaa tggagcacca ggaatagctg gtgccccagg atttcccggt 780

gctagaggtc caagtggtcc acaaggacca ggaggtccac ccggtcccaa aggaaacagt 840

ggagaaccag gtgcacccgg ttcaaaggga gatacaggag ctaaaggaga gcccggtcca 900

gtgggtgttc agggaccacc cggacctgct ggagaggaag gtaaaagagg tgcaagaggt 960

gagccaggac caacaggtct gcctggtccc cctggtgaaa gaggtggtcc aggtagtaga 1020

ggatttccag gagctgatgg tgttgcagga ccaaagggac ccgcaggtga gagaggatca 1080

cccggtccag ccggaccaaa aggatcacca ggagaagctg gtagaccagg agaagctggt 1140

ctgccaggtg ctaaaggatt gacaggatca cccggttcac ctggtcctga tggaaagaca 1200

ggacctccag gtcccgctgg tcaggacggt agaccaggac ccccaggacc cccaggtgca 1260

agaggtcagg caggtgtaat gggtttcccc ggacctaaag gagcagctgg agaacctggt 1320

aaagctggag agagaggagt gcctggaccc cctggagctg ttggtccagc aggaaaggat 1380

ggtgaggcag gtgcacaagg tccacctgga cccgctggac ctgcaggtga gagaggagag 1440

caaggtcccg caggttctcc aggttttcag ggtttgccag gtccagccgg tcctcctgga 1500

gaggcaggaa agccaggaga acaaggagtt ccaggagacc tgggtgcacc aggaccctct 1560

ggtgcaagag gagagagagg atttcctgga gaaagaggtg tgcagggacc accaggtccc 1620

gccggtccaa gaggagcaaa tggagcccct ggaaatgacg gagctaaggg tgacgctggt 1680

gcaccaggag caccaggttc tcaaggtgct cccggattgc agggtatgcc tggagagaga 1740

ggtgcagctg gactgccagg tccaaaaggt gacagaggag acgccggtcc taagggagct 1800

gacggttctc ctggaaagga cggtgtgaga ggtttgacag gaccaatagg tccacccggt 1860

cctgctggag cccctggaga caaaggtgaa tcaggtcctt ccggtccagc cggaccaaca 1920

ggagcaagag gagcacctgg agacagagga gagccaggtc ctccaggacc tgcaggtttc 1980

gctggtcctc ccggagcaga tggacagcca ggagctaagg gagaacccgg tgacgctggt 2040

gctaagggag atgcaggtcc accaggtcct gctggtcctg ctggacctcc cggaccaata 2100

ggtaatgttg gagcacccgg agcaaaaggt gccagaggtt ccgcaggtcc tcccggagca 2160

actggttttc caggagctgc cggaagagtg ggtccacctg gtccttctgg aaatgcagga 2220

ccaccaggtc ctcctggtcc agccggaaag gaaggtggaa agggacctag aggagaaaca 2280

ggtcccgcag gtagacccgg tgaggtgggt ccacctggtc cacccggtcc agctggtgag 2340

aaaggaagtc ctggagcaga cggaccagct ggtgcccctg gtacaccagg accccaagga 2400

atagctggtc aaagaggtgt tgttggttta ccaggtcaga gaggagaaag aggttttcca 2460

ggattaccag gtccctcagg tgagcccgga aaacagggtc cctcaggagc aagtggtgaa 2520

agaggaccac caggaccaat gggacctcca ggattagctg gtccaccagg agaatcagga 2580

agagagggtg ctcctggagc agaaggttca ccaggaagag acggttcacc cggagccaag 2640

ggagacagag gtgaaacagg tcccgcaggt ccaccaggag cacccggagc ccctggtgct 2700

ccaggacctg tcggaccagc aggaaaatcc ggtgacagag gtgagactgg acccgcaggt 2760

cctgctggtc ctgttggacc agtgggtgca agaggaccag caggtccaca aggtccaaga 2820

ggtgacaaag gtgagacagg tgagcagggt gacagaggaa ttaaaggtca cagaggattt 2880

tcaggactgc agggaccacc cggtcctccc ggttccccag gagagcaagg tccatccggt 2940

gcatccggtc cagctggacc cagaggacca cctggttctg ctggtgcacc aggtaaagat 3000

ggattgaacg gtttgcctgg tccaatagga cctcctggtc caagaggaag aactggtgac 3060

gccggtcccg tcggaccacc cggtccacca ggtcccccag gtccacccgg accaccatcc 3120

gcaggatttg atttctcatt ccttcctcaa cctcctcaag agaaagcaca tgatggaggt 3180

agatactata gagcccatca ccaccatcat cattaa 3216

<210> 9

<211> 1076

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

Glu Phe Trp Ser His Pro Gln Phe Glu Lys Gln Met Ala Gly Gly Phe

1 5 10 15

Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly Pro Pro Gln Gly Pro Pro

20 25 30

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly

35 40 45

Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val

50 55 60

Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Lys Pro

65 70 75 80

Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Lys Ala Gly Glu Arg Gly

85 90 95

Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr Pro Gly Leu

100 105 110

Pro Gly Val Lys Gly His Arg Gly Tyr Pro Gly Leu Asp Gly Ala Lys

115 120 125

Gly Glu Ala Gly Ala Pro Gly Val Lys Gly Glu Ser Gly Ser Pro Gly

130 135 140

Glu Asn Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Leu Pro Gly Glu

145 150 155 160

Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala Gly Ala Arg Gly Asn Asp

165 170 175

Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly Pro Val Gly Pro Ala Gly

180 185 190

Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala Lys Gly Glu Ala Gly Pro

195 200 205

Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln Gly Pro Arg Gly Glu Pro

210 215 220

Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly Ala Ser Gly Asn Pro Gly

225 230 235 240

Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser Ala Gly Ala Pro Gly Ile

245 250 255

Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg Gly Pro Pro Gly Pro Gln

260 265 270

Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly Gln Thr Gly Glu Pro Gly

275 280 285

Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro Lys Gly Glu Pro Gly Pro

290 295 300

Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg

305 310 315 320

Gly Ala Arg Gly Glu Pro Gly Gly Val Gly Pro Ile Gly Pro Pro Gly

325 330 335

Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe Pro Gly Gln Asp Gly Leu

340 345 350

Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg Gly Pro Ser Gly Leu Ala

355 360 365

Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly Arg Pro Gly Glu Pro Gly

370 375 380

Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg Pro Gly Asp Ala Gly Pro

385 390 395 400

Gln Gly Lys Val Gly Pro Ser Gly Ala Pro Gly Glu Asp Gly Arg Pro

405 410 415

Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Gln Pro Gly Val Met Gly

420 425 430

Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu Pro Gly Lys Ala Gly Glu

435 440 445

Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg Gly Leu Pro Gly Lys Asp

450 455 460

Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly

465 470 475 480

Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro Ser Gly Phe Gln Gly Leu

485 490 495

Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly Gly Lys Pro Gly Asp Gln

500 505 510

Gly Val Pro Gly Glu Ala Gly Ala Pro Gly Leu Val Gly Pro Arg Gly

515 520 525

Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser Pro Gly Ala Gln Gly Leu

530 535 540

Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro Gly Thr Asp Gly Pro Lys

545 550 555 560

Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly Ala Gln Gly Pro Pro Gly

565 570 575

Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly Ile Ala Gly Pro

580 585 590

Lys Gly Asp Arg Gly Asp Val Gly Glu Lys Gly Pro Glu Gly Ala Pro

595 600 605

Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly

610 615 620

Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu Val Gly Pro Pro Gly Pro

625 630 635 640

Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro Gly Glu Arg Gly Glu Thr

645 650 655

Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly

660 665 670

Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu Ala Gly Gln Lys Gly Asp

675 680 685

Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser Gly Ala Pro Gly Pro Gln

690 695 700

Gly Pro Thr Gly Val Thr Gly Pro Lys Gly Ala Arg Gly Ala Gln Gly

705 710 715 720

Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro

725 730 735

Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Pro Pro Gly Pro Ser

740 745 750

Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly Asp Ser Gly Pro Pro Gly

755 760 765

Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro Ala Gly Pro Pro Gly Glu

770 775 780

Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser Gly Ala Glu Gly Pro Pro

785 790 795 800

Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly Ile Val Gly Leu Pro Gly

805 810 815

Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu

820 825 830

Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser Gly Asp Arg Gly Pro Pro

835 840 845

Gly Pro Val Gly Pro Pro Gly Leu Thr Gly Pro Ala Gly Glu Pro Gly

850 855 860

Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro Pro Gly Arg Asp Gly Ala

865 870 875 880

Ala Gly Val Lys Gly Asp Arg Gly Glu Thr Gly Ala Val Gly Ala Pro

885 890 895

Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly Pro Ala Gly Pro Thr Gly

900 905 910

Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala Gln Gly Pro Met Gly Pro

915 920 925

Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln Gly Pro Gln Gly Pro Arg

930 935 940

Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly Glu Arg Gly Leu Lys Gly

945 950 955 960

His Arg Gly Phe Thr Gly Leu Gln Gly Leu Pro Gly Pro Pro Gly Pro

965 970 975

Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala Gly Pro Ser Gly Pro Arg

980 985 990

Gly Pro Pro Gly Pro Val Gly Pro Ser Gly Lys Asp Gly Ala Asn Gly

995 1000 1005

Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Arg Ser Gly Glu

1010 1015 1020

Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro Gly Pro Pro Gly Pro Pro

1025 1030 1035 1040

Gly Pro Pro Gly Pro Gly Ile Asp Met Ser Ala Phe Ala Gly Leu Gly

1045 1050 1055

Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln Tyr Met Arg Ala His His

1060 1065 1070

His His His His

1075

<210> 10

<211> 3231

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gaattctgga gtcatcctca attcgaaaaa caaatggctg gtggattcga tgaaaaggct 60

ggtggagccc aattaggtcc tccacaaggt cctcccggtc cacctggtcc tcccggtcct 120

ccaggtcccg ccggtgctcc tggaccacag ggtttccaag gaaaccccgg tgaaccaggt 180

gagcctggtg tttcaggtcc tcccggtcct ccaggaccac ctggaccacc aggaaagcct 240

ggtgacgacg gagaagctgg taaaccagga aaggcaggag agagaggtcc acctggacct 300

cagggtgcca gaggtttccc aggtacccct ggtcttcctg gtgtcaaggg tcatagaggt 360

taccccggtt tggatggtgc caagggtgaa gccggtgccc ctggtgttaa gggtgaatca 420

ggaagtcccg gtgaaaatgg aagtcccggt ccacccggtc cacctggact gccaggtgag 480

agaggaagaa ccggaccagc tggtgctgca ggtgctagag gaaatgacgg acagcccgga 540

ccagccggac ctcccggtcc tgttgggccc gcaggtggtc ctggtttccc tggtgctcct 600

ggagccaaag gagaagccgg acccaccgga gccagaggtc ccgagggagc acagggacct 660

agaggagaac caggtacacc aggtagtccc ggtcctgctg gtgcatcagg aaatcccgga 720

actgacggta ttccaggagc aaagggatct gcaggagcac caggaatagc tggtgctcct 780

ggatttccag gtcccagagg acctcccggt cctcaaggag caacaggtcc tttgggacca 840

aaaggtcaaa caggagaacc aggtattgct ggattcaaag gagagcaagg tccaaaggga 900

gagcccggtc ccgcaggtcc ccaaggagcc ccaggaccag ctggtgaaga aggaaaaaga 960

ggagccagag gtgaacctgg aggagtagga cctattggtc ctcctggtga gagaggtgct 1020

cccggaaaca gaggttttcc tggtcaagat ggtctggctg gacctaaagg tgctccagga 1080

gagagaggac cttcaggact tgctggtcca aaaggtgcta acggagatcc aggaagaccc 1140

ggtgaacctg gtctgcctgg agctagagga ttaacaggaa gaccaggtga cgcaggtccc 1200

cagggtaaag tgggtcccag tggtgcccca ggtgaagatg gaagacctgg tcctcccgga 1260

ccccaaggtg caagaggtca gcctggagtg atgggatttc ctggacccaa gggtgctaac 1320

ggagaacctg gaaaagctgg tgagaaagga ctgcccggtg ccccaggtct tagaggtttg 1380

ccaggtaaag atggagaaac aggagccgca ggaccacccg gtccagccgg accagcagga 1440

gagagaggtg aacaaggagc acctggtcca agtggttttc agggtcttcc aggtccccct 1500

ggtccaccag gagagggagg taaaccaggt gaccaaggtg tccctggaga agcaggtgca 1560

cccggtcttg tgggtccaag aggtgaaaga ggattccctg gtgagagagg atctcccgga 1620

gcccagggac ttcaaggtcc tagaggtctg ccaggtaccc ctggtacaga cggaccaaag 1680

ggagcatcag gacccgctgg acctcccgga gcccaaggtc ctccaggttt acaaggtatg 1740

cctggtgaaa gaggtgctgc aggtatagct ggaccaaaag gagacagagg tgacgttggt 1800

gagaagggtc ccgaaggagc ccctggaaaa gatggtggaa gaggattaac aggtcctata 1860

ggaccacccg gtccagccgg tgctaatgga gaaaaaggag aagtaggtcc tccaggtcca 1920

gcaggatctg caggtgctag aggtgcccct ggagagagag gtgaaacagg accacctggt 1980

ccagctggtt tcgctggtcc cccaggagct gatggacagc ccggtgcaaa aggtgaacaa 2040

ggagaagccg gacagaaggg agatgctgga gcccccggtc cacaaggtcc ctcaggagca 2100

ccaggtcctc aaggtccaac tggtgtgacc gggccaaagg gtgcaagagg agcacaggga 2160

cctccaggag caacaggttt cccaggagct gctggtagag tcggtccacc cggatctaat 2220

ggtaaccccg gaccaccagg accacctgga ccatctggaa aggatggacc caaaggagca 2280

agaggagatt caggaccacc cggaagagca ggagaacctg gattacaggg tcccgccggt 2340

ccaccaggag agaaaggaga gcccggagat gatggtccct caggtgcaga gggaccccca 2400

ggaccccaag gtctggcagg tcaaagaggt atagtgggtc ttccaggtca aagaggtgaa 2460

agaggatttc caggacttcc aggtccttca ggtgaacccg gtaaacaggg agcccccgga 2520

gcctcaggtg acagaggtcc tccaggacca gtaggacccc caggtttaac cggaccagca 2580

ggtgagccag gaagagaagg ttctcctgga gccgatggac ctccaggaag agacggtgca 2640

gctggtgtta agggtgacag aggtgaaact ggagccgtag gagccccagg tgcccccgga 2700

ccacccggat cacccggacc tgcaggtcct actggtaaac aaggagatag aggagaagcc 2760

ggtgcccagg gtcctatggg tccttctggt cctgcaggag caagaggtat acaaggtcca 2820

cagggtccca gaggtgacaa gggtgaagca ggagaacccg gtgagagagg tctgaagggt 2880

catagaggat tcaccgggtt acagggtttg ccaggacccc ctggaccaag tggtgaccag 2940

ggtgcatccg gtccagcagg tccttctgga ccaagaggtc ctcccggtcc agttggtcca 3000

tcaggtaaag acggagccaa cggtatccca ggtcccatcg gtcctccagg tcctagagga 3060

agaagtggag agactggtcc tgctggacct cctggaaacc ctggtcctcc aggacctcca 3120

ggtcctccag gtcccggaat agatatgtcc gctttcgctg gattgggacc aagagagaaa 3180

ggtcctgacc ctcttcaata tatgagagca caccatcacc atcatcacta a 3231

Claims

1.重组胶原蛋白α1链，其特征在于，所述重组胶原蛋白α1链包括α1(Ⅰ)M1或α1(Ⅱ)M6，所述α1(Ⅰ)M1由人Ⅰ型胶原蛋白α1链的天然全长氨基酸序列经过氨基酸突变获得，所述α1(Ⅱ)M6由人Ⅱ型胶原蛋白α1链天然全长氨基酸序列经过氨基酸突变获得。

2.根据权利要求1所述的重组胶原蛋白α1链，其特征在于，所述α1(Ⅰ)M1的氨基酸突变的位点数为4；所述α1(Ⅱ)M6的氨基酸突变位点数为9。

3.根据权利要求2所述的重组胶原蛋白α1链，其特征在于，所述人Ⅰ型胶原蛋白α1链为SEQ.NO.ID.1所示，所述氨基酸突变的位点为第106位的M、109位的R、190位的M、193位的R；所述人Ⅱ型胶原蛋白α1链为SEQ.NO.ID.4所示，所述氨基酸突变的位点为第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R。

4.根据权利要求3所述的重组胶原蛋白α1链，其特征在于，所述人Ⅰ型胶原蛋白α1链氨基酸突变具体为第106位的M、109位的R、190位的M、193位的R，均改变为P；所述人Ⅱ型胶原蛋白α1链氨基酸突变具体为第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R，均改变为P。

5.根据权利要求4所述的重组胶原蛋白α1链，其特征在于，所述α1(Ⅰ)M1的序列如SEQ.NO.ID.2所示，所述α1(Ⅱ)M6的序列如SEQ.NO.ID.5所示。

6.编码权利要求1-5任一项所述重组胶原蛋白α1链的核苷酸。

7.根据权利要求6所述的核苷酸，其特征在于，所述编码α1(Ⅰ)M1的核苷酸序列如SEQ.NO.ID.3；所述编码α1(Ⅱ)M6的核苷酸序列如SEQ.NO.ID.6所示。

8.重组表达载体，含有权利要求6所述的核苷酸。

9.工程菌，所述工程菌含有权利要求8所述的重组表达载体或表达权利要求1-5任一项所述重组胶原蛋白α1链，所述工程菌为巴斯德毕赤酵母(Pichia pastoris)。

10.根据权利要求10所述的工程菌，其特征在于，所述工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号为CGMCC NO.21891或CGMCCNO.21892，其中保藏编号为CGMCC NO.21891的工程菌表达的是重组α1(Ⅰ)M1胶原蛋白α1链，保藏编号为CGMCCCGMCCNO.21892的工程菌表达的是重组α1(Ⅱ)M6胶原蛋白α1链。

11.权利要求8所述的重组表达载体或权利要求9-10任一项所述的工程菌在制备所述重组胶原蛋白α1链中的应用。

12.权利要求1-5任一项所述重组胶原蛋白α1链的制备方法，其特征在于，包括如下步骤：

(1)合成编码权利要求1-5任一项所述重组胶原蛋白α1链的核苷酸序列；

(2)构建重组表达载体；

(3)构建工程菌、诱导表达和菌株筛选，得到表达量高的工程菌株；

(4)将筛选得到的表达量高的工程菌，高密度发酵培养；

(5)发酵上清液纯化后，冷冻干燥获得重组胶原蛋白α1链。

13.根据权利要求12所述的制备方法，其特征在于，所述表达量高的工程菌为巴斯德毕赤酵母(Pichia pastoris)，保藏于中国微生物菌种保藏管理委员会普通微生物中心，保藏编号为CGMCC NO.21891或CGMCCNO.21892。

14.组合物，其特征在于，所述组合物包含权利要求1-5任一项所述重组胶原蛋白α1链或权利要求12-13任一项所述方法制备的重组胶原蛋白α1链。

15.制品，其特征在于，所述制品包含权利要求1-5任一项所述重组胶原蛋白α1链、权利要求12-13任一项所述方法制备的重组胶原蛋白α1链或权利要求14所述的组合物，所述制品包括但不局限于药物、医疗器材、生物材料、组织工程产品、化妆品或保健品。

16.根据权利要求15所述的制品，其特征在于，所述制品为为细胞提供黏附、支撑、生长迁移空间的材料或作为输送营养物质与新陈代谢产物通道的材料。

17.根据权利要求16所述的制品，其特征在于，所述制品为胶原蛋白水凝胶。

18.权利要求1-5任一项所述重组胶原蛋白α1链、权利要求6-7任一项所述的核苷酸、权利要求8所述的重组表达载体、权利要求9-10任一项所述的工程菌、权利要求12-13任一项所述方法制备的重组胶原蛋白α1链或权利要求14所述的组合物在制备制成品中的用途，所述制成品包括但不限于药物、医疗器材、生物材料、组织工程产品、化妆品或保健品。

19.权利要求1-5任一项所述重组胶原蛋白α1链、权利要求6-7任一项所述的核苷酸、权利要求8所述的重组表达载体、权利要求9-10任一项所述的工程菌、权利要求12-13任一项所述方法制备的重组胶原蛋白α1链或权利要求14所述的组合物在制备促进创伤修复或组织再生的产品中的用途。

20.根据权利要求18或19所述的用途，其特征在于，所述制成品或产品为胶原蛋白水凝胶。