CN114106150B - 重组胶原蛋白、制备方法及其应用 - Google Patents

重组胶原蛋白、制备方法及其应用 Download PDF

Info

Publication number
CN114106150B
CN114106150B CN202111470250.8A CN202111470250A CN114106150B CN 114106150 B CN114106150 B CN 114106150B CN 202111470250 A CN202111470250 A CN 202111470250A CN 114106150 B CN114106150 B CN 114106150B
Authority
CN
China
Prior art keywords
gly
pro
ala
alpha
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111470250.8A
Other languages
English (en)
Other versions
CN114106150A (zh
Inventor
李佳佳
王丽萍
刘慧敏
蒋雯雯
钱晨明
程鹏飞
钱松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Chuangjian Medical Technology Co ltd
Original Assignee
Jiangsu Chuangjian Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Chuangjian Medical Technology Co ltd filed Critical Jiangsu Chuangjian Medical Technology Co ltd
Priority to CN202111470250.8A priority Critical patent/CN114106150B/zh
Publication of CN114106150A publication Critical patent/CN114106150A/zh
Application granted granted Critical
Publication of CN114106150B publication Critical patent/CN114106150B/zh
Priority to PCT/CN2022/133595 priority patent/WO2023098523A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61LMETHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
    • A61L27/00Materials for grafts or prostheses or for coating grafts or prostheses
    • A61L27/14Macromolecular materials
    • A61L27/22Polypeptides or derivatives thereof, e.g. degradation products
    • A61L27/24Collagen
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61LMETHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
    • A61L27/00Materials for grafts or prostheses or for coating grafts or prostheses
    • A61L27/50Materials characterised by their function or physical properties, e.g. injectable or lubricating compositions, shape-memory materials, surface modified materials
    • A61L27/52Hydrogels or hydrocolloids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0656Adult fibroblasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2533/00Supports or coatings for cell culture, characterised by material
    • C12N2533/50Proteins
    • C12N2533/54Collagen; Gelatin
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Dermatology (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Transplantation (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Dispersion Chemistry (AREA)
  • Rheumatology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及重组胶原蛋白、制备方法及其应用,尤其涉及重组表达的全长的胶原蛋白α1链、制备方法及其应用,属于胶原蛋白表达技术领域。本发明中构建的人Ⅰ型胶原蛋白α1链(α1(Ⅰ)链)的变体(记为α1(Ⅰ)M1)和人Ⅱ型胶原蛋白α1链(α1(Ⅱ)链)的变体(记为α1(Ⅱ)M6)于毕赤酵母中重组表达时,均消除了天然全长的α1(Ⅰ)链、α1(Ⅱ)链重组表达时出现的与全长α1链目的产物(目的条带)占比量基本相同的主降解产物(主降解条带),提高了目的产物的产率,且与毕赤酵母中重组表达的天然全长的α1(Ⅰ)链胶原蛋白与α1(Ⅱ)链胶原蛋白相比有类似的理化特征和生物学活性,均有应用于生物医学材料领域的价值。

Description

重组胶原蛋白、制备方法及其应用
技术领域
本发明涉及重组胶原蛋白、制备方法及其应用,尤其涉及重组表达的全长的胶原蛋白α1链、制备方法及其应用,属于胶原蛋白表达技术领域。
背景技术
Ⅰ、Ⅱ型胶原蛋白是人体内中典型的成纤维胶原蛋白,均由3条α肽链构成,每条α肽链均包含由氨基端肽区、特征性(G-X-Y)n三联重复序列区、羧基端肽区三部分。
Ⅰ型胶原蛋白由两条α1链和一条α2链构成,是人体内所含的各种胶原蛋白中最丰富的一种,存在于肌肉、皮肤、动脉壁、纤维软骨中。Ⅱ型胶原蛋白由三条α1链构成,主要分布在软骨组织、玻璃体、眼角膜中,占成人软骨基质胶原蛋白总量的90%以上,是软骨和骨型形成、骨骼生长和成熟软骨维持等所必需的成份。
作为一种重要的天然生物蛋白,胶原蛋白有良好的生物相容性、生物活性和可降解性等独特功能特征,可广泛应用于化工、医药、食品、化妆品等众多领域,尤其适合制备多种生物器械,是最为理想的生物材料来源,具有广阔的应用前景。
市场上销售胶原蛋白主要是利用酸、碱、酶解法处理动物组织获得的胶原提取物:加工过程降解严重,使其生物活性丧失;提取的胶原肽长度不等、性质不均、质量不稳定且有疯牛病、口蹄疫等病毒感染的安全隐患;同时动物源与人的胶原蛋白的氨基酸序列差别较大,属于异源性蛋白,会导致免疫排斥和过敏症状。
基因工程技术生产重组胶原蛋白则可有效避免这些缺陷。现有重组胶原蛋白的表达方法中,哺乳动物细胞表达系统、昆虫细胞(杆状病毒)表达系统、转基因动植物等表达系统成本高、产量低、周期长,多用于科研阶实验;大规模工业化生产中主要由原核(大肠杆菌)表达系统、毕赤酵母表达系统来表达人胶原蛋白。大肠杆菌中没有蛋白质的翻译后修饰,大规模表达为胞内表达,需裂解菌体,产生的大量杂质宿主蛋白和天然带有的(细胞壁成分)内毒素、肽聚糖,均需经复杂纯化工艺方能去除。但对于毕赤酵母来说,人胶原蛋白毕竟是一种外源蛋白,表达时会占用较多的细胞内资源(其所依赖的甲醇代谢途径最多可表达细胞可溶性蛋白30%的蛋白),细胞内会针对外源性的蛋白质进行相应调节,典型的状况是重组蛋白会出现严重的降解,人Ⅰ、Ⅱ型胶原蛋白的α1链均为1000个氨基酸以上的长肽链,更易产生降解。
成熟的人Ⅰ、Ⅱ型胶原蛋白的α1链序列均包含氨基端肽、三螺旋区域、羧基端肽三部分,人Ⅰ型胶原蛋白α1链(后文中按规范称之为α1(Ⅰ))全长1057AA,人Ⅱ型胶原蛋白α1链(后文中按规范称之为α1(Ⅱ))全长1060AA。以毕赤酵母表达人α1(Ⅰ)链的研究、专利较多,表达人α1(Ⅱ)链的研究、专利较少。现有毕赤酵母表达全长α1(Ⅰ)链、全长α1(Ⅱ)链的成果中,大部分研究中均只表达了α1(Ⅰ)链的部分序列,而非成熟的全长α1(Ⅰ)链序列。有一些公开的成果中虽然表达了全长的α1(Ⅰ)链,但均会于表达时产生与目的产物占比基本相同的主降解产物,于SDS-PAGE电泳上表现为一条几乎与全长α1链目的条带(目的产物)占比量基本相当的主降解条带(主降解产物)。这样的降解不但降低表达生产的全长α1链的产量,而且因其与全长α1链的相关性质接近,想获得高纯度的单一全长α1链产品还需要进行两步双亲和纯化方能获得,增加了纯化艺复杂程度,相应的提高了纯化成本。所以保持全长肽链完整、减少降解,同时保持胶原蛋白生物学活性不发生改变是以毕赤酵母生产重组胶原蛋白面临的重要挑战。
发明内容
本发明的目的在于,克服现有技术中存在的一些技术问题,提供毕赤酵母重组表达的全长的胶原蛋白α1链、制备方法及其应用。本发明中的重组人Ⅰ型胶原蛋白α1链的变体(记为α1(Ⅰ)M1)和重组人Ⅱ型胶原蛋白α1链的变体(记为α1(Ⅱ)M6),相对于天然全长的α1(Ⅰ)链与α1(Ⅱ)链,在毕赤酵母中表达时均消除了几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物),提高了目的产物的产率;与毕赤酵母表达的天然全长的α1(Ⅰ)链胶原蛋白与α1(Ⅱ)链胶原蛋白及商品化人胶原蛋白有类似的理化特征和相同的生物学活性,均有应用于生物医学材料领域的价值。
为实现上述目的,本发明采用了以下技术方案:
本发明提供了重组胶原蛋白α1链,所述重组胶原蛋白α1链为α1(Ⅰ)M1或α1(Ⅱ)M6,所述α1(Ⅰ)M1由人Ⅰ型胶原蛋白α1链的天然全长氨基酸序列经过氨基酸突变获得,所述α1(Ⅱ)M6由人Ⅱ型胶原蛋白α1链天然全长氨基酸序列经过氨基酸突变获得。
优选的,所述α1(Ⅰ)M1的氨基酸突变的位点数为4;所述α1(Ⅱ)M6的氨基酸突变位点数为9。
优选的,所述人Ⅰ型胶原蛋白α1链为SEQ.NO.ID.1所示,所述氨基酸突变的位点为第106位的M、109位的R、190位的M、193位的R,具体的,均改变为P;
所述人Ⅱ型胶原蛋白的α1链为SEQ.NO.ID.4所示,所述氨基酸突变的位点为第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R,具体的,均改变为P。
进一步的,所述α1(Ⅰ)M1的氨基酸序列如SEQ.NO.ID.2所示,所述α1(Ⅱ)M6的氨基酸序列如SEQ.NO.ID.5所示。
本发明中,氨基酸序列突变的位点上相应氨基酸变更的种类发生一些变化,即突变的位点相同,但变更的氨基酸种类不同,也会产生与本专利类似的技术效果;改变其中一处或几处进行突变处理,也有可能获得与本专利类似的技术效果。
本发明还提供编码所述重组胶原蛋白α1链的核苷酸,所述编码重组胶原蛋白α1链的核苷酸序列包括编码α1(Ⅰ)M1或α1(Ⅱ)M6的核苷酸序列。
进一步的,所述编码α1(Ⅰ)M1和核苷酸序列如SEQ.NO.ID.3所示,编码α1(Ⅱ)M6的核苷酸序列如SEQ.NO.ID.6所示。
本发明还提供了重组表达载体,含有编码所述重组胶原蛋白α1链的核苷酸。
本发明还提供由上述重组表达载体构建的工程菌,所述工程菌含有所述重组表达载体或表达所述重组胶原蛋白α1链。
所述工程菌的宿主菌优选为毕赤酵母,所述工程菌保藏日期为2021年03月11日,保藏编号为CGMCC NO.21891或CGMCCNO.21892,分类命名为巴斯德毕赤酵母Pichiapastoris,保藏单位为中国微生物菌种保藏管理委员会普通微生物中心,地址为北京市朝阳区北辰西路1号院3号。其中保藏编号为CGMCC NO.21891的工程菌表达的是重组α1(Ⅰ)M1胶原蛋白α1链,保藏编号为CGMCC CGMCCNO.21892的工程菌表达的是重组α1(Ⅱ)M6胶原蛋白α1链。
需要说明的是,本发明的宿主菌不限于毕赤酵母,只要根据本发明的方法,于毕赤酵母或其它种类的酵母菌中均可分泌表达,理论上均可获得与本专利类似的技术效果。
本发明还提供所述重组表达载体或所述的工程菌在表达所述重组胶原蛋白α1链中的应用。
本发明还提供了所述重组胶原蛋白α1链的制备方法,包括:
(1)合成编码重组胶原蛋白α1链的核苷酸序列:
将天然胶原蛋白α1链序列将其氨基酸序列位点上相应氨基酸进行改变,Ⅰ型胶原蛋白的α1链改变4个氨基酸得到α1(Ⅰ)M1,Ⅱ型胶原蛋白的α1链改变9个氨基酸得到α1(Ⅱ)M6;在序列的氨基端和羧基端添加亲和纯化标签,合成编码α1(Ⅰ)M1、α1(Ⅱ)M6的DNA序列,使其含有双特异性亲和纯化标记,这样便于以两种标签序列为基础进行免疫学抗体检测。
经检测表明,α1(Ⅰ)M1、α1(Ⅱ)M6分别消除了全长α1(Ⅰ)链、全长α1(Ⅱ)链于毕赤酵母中表达时所产生的一条几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物)。
α1(Ⅰ)M1、α1(Ⅱ)M6相对天然原始序列,其突变的氨基酸位于特征性的(G-X-Y)n三联重复区域,但均是位于X、Y上的氨基酸,并没有改变胶原蛋白(G-X-Y)n三联重复的氨基酸序列结构特征;且仍保持与原胶原蛋白类似的理化特征和生物学活性。
(2)构建重组表达载体:
将合成的DNA连接入表达载体pPIC9K中,分别构建表达重组α1(Ⅰ)M1胶原蛋白的pPIC9K-COL1A1M1和表达重组α1(Ⅱ)M6胶原蛋白的pPIC9K-COL2A1M6两种重组表达载体。
(3)构建重组工程菌株、诱导表达和菌株筛选:
以Sac I线性化重组表达载体,电转入毕赤酵母感受态细胞,转涂至MD平板初筛后,再经过含有不同浓度G418的YPD平板筛选,挑取菌落接入BMGY培养基中,再以BMMY培养基诱导表达;筛选表达量高的工程菌株。
所述筛选到的表达量高的工程菌为巴斯德毕赤酵母Pichia pastoris,保藏编号分别为CGMCC NO.21891、CGMCC NO.21892。
(4)高密度发酵培养:
将经过蛋白质表达鉴定表达量高的工程菌,采用发酵罐进行高密度发酵培养。
(5)蛋白质纯化:
使用一次阳离子交换层析对发酵上清液进行纯化,以冷冻干燥的方法获得纯度高的α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白。
本发明中将得到的重组胶原蛋白进行蛋白性质表征和体外实验,对获取的毕赤酵母表达的α1(Ⅰ)M1、α1(Ⅱ)M6进行分析验证,本发明得到的蛋白符合重组胶原蛋白结构特征,具有细胞粘附活性,与商品化的人胶原蛋白基本一致,更重要的是2种变体蛋白与未突变前的胶原蛋白的结构特征、细胞黏附活性是类似的或相同的。
本发明还提供一种组合物,所述组合物包含所述重组胶原蛋白α1链或上述方法制备的胶原蛋白α1链。
本发明还提供一种制品,所述制品包含所述重组胶原蛋白α1链或上述方法制备的胶原蛋白α1链或上述组合物。所述制品包括但不局限于药物、药物组合物、医疗器材、生物材料、组织工程产品、化妆品或保健品等。
进一步的,所述制品包括为细胞提供黏附、支撑、生长迁移空间的材料或作为输送营养物质与新陈代谢产物通道的材料。
进一步的,所述制品为胶原蛋白水凝胶。
本发明还提供所述重组胶原蛋白α1链、核苷酸、重组表达载体、工程菌、组合物等在制备制成品中的用途,包括但不限于药物、医疗器材、生物材料、组织工程产品、化妆品或保健品中的用途。
本发明还提供所述重组胶原蛋白α1链、核苷酸、重组表达载体、工程菌或组合物在制备促进创伤修复或组织再生的产品中的用途;进一步的,所述产品为胶原蛋白水凝胶。
本发明的有益效果:
(1)本发明中胶原蛋白α1链变体,改变的氨基酸位点于天然原始序列中占比极少(突变的氨基酸占比低于1%,突变前后氨基酸序列同源性均高于99%)、得到完整的重组α1链胶原蛋白的同时并没有改变原始蛋白本身的性质(理化特性、生物学活性)、并且制备成相关产品的时候与天然序列的重组蛋白有相同的性质、生物学活性等。
α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比,有类似的理化特征和生物学活性,均有应用于生物医学材料领域的价值。本发明通过进行α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)的细胞粘附实验发现,α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比,细胞粘附活性无明显差别,且均与商品化的人胶原蛋白基本一致。使用毕赤酵母表达的α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白制备胶原蛋白水凝胶,对水凝胶的液体力学特征进行检测,α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比,其所制备的水凝胶在黏度、弹性模量、溶胀度上均无明显区别。使用扫描电镜扫描冻干后的胶原蛋白水凝胶,均为多孔网状结构,孔径范围集中于100-200μm,有应用于生物医学材料领域的潜力。将四种胶原蛋白水凝胶与NIH/3T3细胞于体外共培养,加入钙黄黄绿AM后,可检测到黏附、生长于水凝胶中的发绿色荧光的活细胞;加入MTT检测,均可观察到黏附、迁移生长至水凝胶内部的活细胞形成的蓝紫色结晶。
(2)本发明通过SDS-PAGE电泳、Western Blot对表达的蛋白质进行鉴定,结果表明,相对于全长的α1(Ⅰ)链与α1(Ⅱ)链,α1(Ⅰ)M1与α1(Ⅱ)M6在毕赤酵母中表达时均消除了几乎与全长α1链目的条带(目的产物)占比量基本相同的主降解条带(主降解产物),提高了目的产物的产率。并且,通过采用发酵罐进行高密度发酵实验,发酵产物经SDS-PAGE电泳检测发现,α1(Ⅰ)M1、α1(Ⅱ)M6可于高密度发酵条件下仍能保持目的条带的完整性,主降解条带依然不会产生,而同样高密度发酵条件下发酵生产的重组人α1(Ⅰ)、α1(Ⅱ)则会产生明显的主降解条带。
并且,本发明的重组胶原蛋白只需要使用一次阳离子交换层析对发酵上清液进行纯化,以冷冻干燥的方法获得纯度高的α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白冻干海绵,经SDS-PAGE电泳检测,其主要是作为目的产物的单一条带,无主降解条带,获得了纯度高目的产物,降低了纯化的成本。而α1(Ⅰ)、α1(Ⅱ)同样以一步阳离子交换层析则只能获得目的条带(目的产物,全长α1链)、主降解条带(主降解产物)混合的纯化蛋白,需要两步亲和层析方能获得纯度高的α1(Ⅰ)、α1(Ⅱ)胶原蛋白。
附图说明
图1为α1(Ⅰ)M1与α1(Ⅰ)氨基酸序列的差异图,图中灰色背景、加粗的氨基酸所示为差异位点。
图2为α1(Ⅱ)M6与α1(Ⅱ)氨基酸序列的差异图,图中灰色背景、加粗的氨基酸所示为差异位点。
图3为pPIC9K-COL1A1M1载体图谱。
图4为pPIC9K-COL2A1M6载体图谱。
图5为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白诱导表达24h的上清的SDS-PAGE图。
图6为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白诱导表达24h的上清的WB图,图中,左边为抗6×His Tag抗体的WB图,右边为抗Strep-Tag II抗体的WB图。
图7为α1(Ⅰ)、α1(Ⅱ)胶原蛋白SDS-PAGE检测结果中目的条带、主降解条带质谱分析结果。
图8为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白SDS-PAGE检测结果中目的条带质谱分析结果。
图9为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白诱导48h发酵上清的SDS-PAGE图。
图10为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)纯化后冻干海绵的SDS-PAGE图。
图11为α1(Ⅰ)、α1(Ⅱ)胶原蛋白傅里叶变换红外光谱(FT-IR)分析图。
图12为α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白傅里叶变换红外光谱(FT-IR)分析图。
图13为α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白细胞黏附活性检测。
图14为冻干α1(Ⅰ)、α1(Ⅰ)M1胶原蛋白水凝胶表面扫描电镜图(上两图α1(Ⅰ)胶原蛋白水凝胶,下两图α1(Ⅰ)M1胶原蛋白水凝胶)。
图15为冻干α1(Ⅱ)、α1(Ⅱ)M6胶原蛋白水凝胶表面扫描电镜图(上两图α1(Ⅱ)胶原蛋白水凝胶,下两图α1(Ⅱ)M6胶原蛋白水凝胶)。
图16为α1(Ⅰ)、α1(Ⅰ)M1胶原蛋白水凝胶中NIH/3T3细胞黏附生长结果图。
图中,上三图从左至右分别为:α1(Ⅰ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅰ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色,明亮部分为发绿色荧光的细胞,荧光显微镜拍摄)、α1(Ⅰ)胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色,黑色部分为结晶,明场显微镜拍摄);
下三图从左至右分别为:α1(Ⅰ)M1胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅰ)M1胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色,明亮部分为发绿色荧光的细胞,荧光显微镜拍摄)、α1(Ⅰ)M1胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色,黑色部分为结晶,明场显微镜拍摄)。
图17为α1(Ⅱ)、α1(Ⅱ)M6胶原蛋白水凝胶中NIH/3T3细胞黏附生长结果图。
图中,上三图从左至右分别为:α1(Ⅱ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅱ)胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色,明亮部分为发绿色荧光的细胞,荧光显微镜拍摄)、α1(Ⅱ)胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色,黑色部分为结晶,明场显微镜拍摄);
下三图从左至右分别为:α1(Ⅱ)M6胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(明场显微镜拍摄)、α1(Ⅱ)M6胶原蛋白水凝胶上黏附生长的NIH/3T3细胞(钙黄绿素AM染色,明亮部分为发绿色荧光的细胞,荧光显微镜拍摄)、α1(Ⅱ)M6胶原蛋白水凝胶中生长的NIH/3T3细胞形成的蓝紫色结晶(MTT染色,黑色部分为结晶,明场显微镜拍摄)。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案,下面对本发明的较佳实施例进行详细的阐述,但是如下实施例并不限制本发明的保护范围。
本发明的实施例中,没有多作说明的都是采用常规分子生物学实验方法完成,实施例中所涉及PCR、酶切、连接、密码子优化等过程都是本领域技术人员根据产品说明书或本领域基础知识可以理解并且容易实现的,因此不再详细描述。
实施例1.氨基酸序列的设计和合成
人Ⅰ型胶原蛋白α1链(记为α1(Ⅰ))的氨基酸序列参考Uniprot数据库P02452-1(https://www.uniprot.org/uniprot/P02452)序列中第162–1218部分(PRO_0000005720),是成熟形态人Ⅰ型胶原蛋白α1链氨基酸序列,不含信号肽、C端前肽、N端前肽等α1(Ⅰ)前体蛋白中会加工脱落的部分,其序列如SEQ.ID.NO.1所示。
SEQ.ID.NO.1:
QLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPMGPRGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRA
经过长期的实验研究,获得了重组人Ⅰ型胶原蛋白α1链的变体,记为α1(Ⅰ)M1。α1(Ⅰ)M1相对于α1(Ⅰ)氨基酸序列中改变4个氨基酸,将这4个氨基酸突变为脯氨酸(Pro,简写为P),在SEQ.NO.ID.1所示的氨基酸序列第106位的M、109位的R、190位的M、193位的R,均改变为P;其余部分的氨基酸序列不变。α1(Ⅰ)M1与α1(Ⅰ)的同源性为99.6%。
改变后的氨基酸序列(α1(Ⅰ)M1)全长1057AA,序列如SEQ.ID.NO.2所示。
SEQ.ID.NO.2:
QLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPPGPPGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQPGPPGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRA
α1(Ⅰ)M1与α1(Ⅰ)氨基酸序列的差异如图1中灰色背景、加粗的氨基酸所示。
编码SEQ.ID.NO.2所示的α1(1)M1的基因(记为COL1A1M1)DNA序列如SEQ.ID.NO.3所示:
SEQ.ID.NO.3:
CAACTTAGTTATGGATACGATGAAAAATCCACAGGTGGAATCAGTGTTCCTGGACCTATGGGTCCATCAGGTCCAAGAGGTTTACCAGGACCTCCAGGTGCCCCAGGTCCCCAGGGATTTCAAGGTCCACCAGGAGAGCCTGGTGAGCCAGGAGCTTCTGGTCCACCTGGTCCCCCTGGACCACCTGGTCCTCCAGGAAAGAATGGAGATGATGGTGAAGCTGGAAAACCTGGAAGACCTGGAGAAAGAGGACCACCAGGACCCCAGGGTGCCAGAGGACTGCCAGGTACCGCAGGTCTGCCTGGAATGAAAGGTCATAGAGGATTTTCAGGATTAGACGGTGCAAAGGGAGACGCTGGACCTGCAGGACCAAAGGGTGAGCCAGGAAGTCCAGGAGAGAATGGTGCACCAGGACAGCCAGGTCCACCTGGACTGCCCGGTGAAAGAGGTAGACCCGGAGCACCAGGACCAGCAGGTGCAAGAGGAAATGATGGAGCTACAGGTGCTGCAGGACCCCCAGGTCCAACAGGACCAGCCGGTCCTCCCGGTTTCCCAGGTGCCGTTGGAGCAAAAGGTGAAGCTGGTCCACAGGGTCCAAGAGGTTCTGAAGGTCCACAGGGAGTTAGAGGAGAACCAGGACCCCCTGGACCAGCTGGTGCAGCAGGACCAGCTGGTAACCCTGGTGCTGACGGTCAGCCAGGTGCTAAGGGAGCAAATGGAGCACCAGGAATAGCTGGTGCCCCAGGATTTCCCGGTGCTAGAGGTCCAAGTGGTCCACAAGGACCAGGAGGTCCACCCGGTCCCAAAGGAAACAGTGGAGAACCAGGTGCACCCGGTTCAAAGGGAGATACAGGAGCTAAAGGAGAGCCCGGTCCAGTGGGTGTTCAGGGACCACCCGGACCTGCTGGAGAGGAAGGTAAAAGAGGTGCAAGAGGTGAGCCAGGACCAACAGGTCTGCCTGGTCCCCCTGGTGAAAGAGGTGGTCCAGGTAGTAGAGGATTTCCAGGAGCTGATGGTGTTGCAGGACCAAAGGGACCCGCAGGTGAGAGAGGATCACCCGGTCCAGCCGGACCAAAAGGATCACCAGGAGAAGCTGGTAGACCAGGAGAAGCTGGTCTGCCAGGTGCTAAAGGATTGACAGGATCACCCGGTTCACCTGGTCCTGATGGAAAGACAGGACCTCCAGGTCCCGCTGGTCAGGACGGTAGACCAGGACCCCCAGGACCCCCAGGTGCAAGAGGTCAGGCAGGTGTAATGGGTTTCCCCGGACCTAAAGGAGCAGCTGGAGAACCTGGTAAAGCTGGAGAGAGAGGAGTGCCTGGACCCCCTGGAGCTGTTGGTCCAGCAGGAAAGGATGGTGAGGCAGGTGCACAAGGTCCACCTGGACCCGCTGGACCTGCAGGTGAGAGAGGAGAGCAAGGTCCCGCAGGTTCTCCAGGTTTTCAGGGTTTGCCAGGTCCAGCCGGTCCTCCTGGAGAGGCAGGAAAGCCAGGAGAACAAGGAGTTCCAGGAGACCTGGGTGCACCAGGACCCTCTGGTGCAAGAGGAGAGAGAGGATTTCCTGGAGAAAGAGGTGTGCAGGGACCACCAGGTCCCGCCGGTCCAAGAGGAGCAAATGGAGCCCCTGGAAATGACGGAGCTAAGGGTGACGCTGGTGCACCAGGAGCACCAGGTTCTCAAGGTGCTCCCGGATTGCAGGGTATGCCTGGAGAGAGAGGTGCAGCTGGACTGCCAGGTCCAAAAGGTGACAGAGGAGACGCCGGTCCTAAGGGAGCTGACGGTTCTCCTGGAAAGGACGGTGTGAGAGGTTTGACAGGACCAATAGGTCCACCCGGTCCTGCTGGAGCCCCTGGAGACAAAGGTGAATCAGGTCCTTCCGGTCCAGCCGGACCAACAGGAGCAAGAGGAGCACCTGGAGACAGAGGAGAGCCAGGTCCTCCAGGACCTGCAGGTTTCGCTGGTCCTCCCGGAGCAGATGGACAGCCAGGAGCTAAGGGAGAACCCGGTGACGCTGGTGCTAAGGGAGATGCAGGTCCACCAGGTCCTGCTGGTCCTGCTGGACCTCCCGGACCAATAGGTAATGTTGGAGCACCCGGAGCAAAAGGTGCCAGAGGTTCCGCAGGTCCTCCCGGAGCAACTGGTTTTCCAGGAGCTGCCGGAAGAGTGGGTCCACCTGGTCCTTCTGGAAATGCAGGACCACCAGGTCCTCCTGGTCCAGCCGGAAAGGAAGGTGGAAAGGGACCTAGAGGAGAAACAGGTCCCGCAGGTAGACCCGGTGAGGTGGGTCCACCTGGTCCACCCGGTCCAGCTGGTGAGAAAGGAAGTCCTGGAGCAGACGGACCAGCTGGTGCCCCTGGTACACCAGGACCCCAAGGAATAGCTGGTCAAAGAGGTGTTGTTGGTTTACCAGGTCAGAGAGGAGAAAGAGGTTTTCCAGGATTACCAGGTCCCTCAGGTGAGCCCGGAAAACAGGGTCCCTCAGGAGCAAGTGGTGAAAGAGGACCACCAGGACCAATGGGACCTCCAGGATTAGCTGGTCCACCAGGAGAATCAGGAAGAGAGGGTGCTCCTGGAGCAGAAGGTTCACCAGGAAGAGACGGTTCACCCGGAGCCAAGGGAGACAGAGGTGAAACAGGTCCCGCAGGTCCACCAGGAGCACCCGGAGCCCCTGGTGCTCCAGGACCTGTCGGACCAGCAGGAAAATCCGGTGACAGAGGTGAGACTGGACCCGCAGGTCCTGCTGGTCCTGTTGGACCAGTGGGTGCAAGAGGACCAGCAGGTCCACAAGGTCCAAGAGGTGACAAAGGTGAGACAGGTGAGCAGGGTGACAGAGGAATTAAAGGTCACAGAGGATTTTCAGGACTGCAGGGACCACCCGGTCCTCCCGGTTCCCCAGGAGAGCAAGGTCCATCCGGTGCATCCGGTCCAGCTGGACCCAGAGGACCACCTGGTTCTGCTGGTGCACCAGGTAAAGATGGATTGAACGGTTTGCCTGGTCCAATAGGACCTCCTGGTCCAAGAGGAAGAACTGGTGACGCCGGTCCCGTCGGACCACCCGGTCCACCAGGTCCCCCAGGTCCACCCGGACCACCATCCGCAGGATTTGATTTCTCATTCCTTCCTCAACCTCCTCAAGAGAAAGCACATGATGGAGGTAGATACTATAGAGCC
人Ⅱ型胶原蛋白α1链(记为α1(Ⅱ))的氨基酸序列参Uniprot数据库P02458(https://www.uniprot.org/uniprot/P02458)序列中第182–1241部分(PRO_0000005730)是成熟形态人Ⅱ型胶原蛋白α1链氨基酸序列,不含信号肽、C端前肽、N端前肽等α1(Ⅱ)前体蛋白中加工脱落的部分,其序列如SEQ.ID.NO.4所示:
SEQ.ID.NO.4:
QMAGGFDEKAGGAQLGVMQGPMGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPMGPRGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRA
经过长期的实验研究,获得重组人Ⅱ型胶原蛋白α1链的变体,记为α1(Ⅱ)M6。α1(Ⅱ)M6于α1(Ⅱ)的氨基酸序列中改变9个氨基酸,将这9个氨基酸突变为脯氨酸(Pro,简写为P),在SEQ.NO.ID.4所示的氨基酸序列第67位的V、68位的M、72位的M、75位的M、78位的R、108位的M、111位的R、162位的M、165位的R,均改变为P;其余部分的氨基酸序列不变,α1(Ⅱ)M6与α1(Ⅱ)的同源性为99.2%。
改变后的序列(α1(Ⅱ)M6)全长1060AA,序列如SEQ.ID.NO.5所示:
SEQ.ID.NO.5:
QMAGGFDEKAGGAQLGPPQGPPGPPGPPGPPGPAGAPGPQGFQGNPGEPGEPGVSGPPGPPGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPPGPPGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRA
α1(Ⅱ)M6与α1(Ⅱ)氨基酸序列的差异如图2中灰色背景和加粗的氨基酸所示。
编码SEQ.ID.NO.5所示的α1(Ⅱ)M6的基因(记为COL2A1M6)DNA序列如SEQ.ID.NO.6所示:
SEQ.ID.NO.6:
CAAATGGCTGGTGGATTCGATGAAAAGGCTGGTGGAGCCCAATTAGGTCCTCCACAAGGTCCTCCCGGTCCACCTGGTCCTCCCGGTCCTCCAGGTCCCGCCGGTGCTCCTGGACCACAGGGTTTCCAAGGAAACCCCGGTGAACCAGGTGAGCCTGGTGTTTCAGGTCCTCCCGGTCCTCCAGGACCACCTGGACCACCAGGAAAGCCTGGTGACGACGGAGAAGCTGGTAAACCAGGAAAGGCAGGAGAGAGAGGTCCACCTGGACCTCAGGGTGCCAGAGGTTTCCCAGGTACCCCTGGTCTTCCTGGTGTCAAGGGTCATAGAGGTTACCCCGGTTTGGATGGTGCCAAGGGTGAAGCCGGTGCCCCTGGTGTTAAGGGTGAATCAGGAAGTCCCGGTGAAAATGGAAGTCCCGGTCCACCCGGTCCACCTGGACTGCCAGGTGAGAGAGGAAGAACCGGACCAGCTGGTGCTGCAGGTGCTAGAGGAAATGACGGACAGCCCGGACCAGCCGGACCTCCCGGTCCTGTTGGGCCCGCAGGTGGTCCTGGTTTCCCtgGTGCTCCTGGAGCCAAAGGAGAAGCCGGACCCACCGGAGCCAGAGGTCCCGAGGGAGCACAGGGACCTAGAGGAGAACCAGGTACACCAGGTAGTCCCGGTCCTGCTGGTGCATCAGGAAATCCCGGAACTGACGGTATTCCAGGAGCAAAGGGATCTGCAGGAGCACCAGGAATAGCTGGTGCTCCTGGATTTCCAGGTCCCAGAGGACCTCCCGGTCCTCAAGGAGCAACAGGTCCTTTGGGACCAAAAGGTCAAACAGGAGAACCAGGTATTGCTGGATTCAAAGGAGAGCAAGGTCCAAAGGGAGAGCCCGGTCCCGCAGGTCCCCAAGGAGCCCCAGGACCAGCTGGTGAAGAAGGAAAAAGAGGAGCCAGAGGTGAACCTGGAGGAGTAGGACCTATTGGTCCTCCTGGTGAGAGAGGTGCTCCCGGAAACAGAGGTTTTCCTGGTCAAGATGGTCTGGCTGGACCTAAAGGTGCTCCAGGAGAGAGAGGACCTTCAGGACTTGCTGGTCCAAAAGGTGCTAACGGAGATCCAGGAAGACCCGGTGAACCTGGTCTGCCTGGAGCTAGAGGATTAACAGGAAGACCAGGTGACGCAGGTCCCCAGGGTAAAGTGGGTCCCAGTGGTGCCCCAGGTGAAGATGGAAGACCTGGTCCTCCCGGACCCCAAGGTGCAAGAGGTCAGCCTGGAGTGATGGGATTTCCTGGACCCAAGGGTGCTAACGGAGAACCTGGAAAAGCTGGTGAGAAAGGACTGCCCGGTGCCCCAGGTCTTAGAGGTTTGCCAGGTAAAGATGGAGAAACAGGAGCCGCAGGACCACCCGGTCCAGCCGGACCAGCAGGAGAGAGAGGTGAACAAGGAGCACCTGGTCCAAGTGGTTTTCAGGGTCTTCCAGGTCCCCCTGGTCCACCAGGAGAGGGAGGTAAACCAGGTGACCAAGGTGTCCCTGGAGAAGCAGGTGCACCCGGTCTTGTGGGTCCAAGAGGTGAAAGAGGATTCCCTGGTGAGAGAGGATCTCCCGGAGCCCAGGGACTTCAAGGTCCTAGAGGTCTGCCAGGTACCCCTGGTACAGACGGACCAAAGGGAGCATCAGGACCCGCTGGACCTCCCGGAGCCCAAGGTCCTCCAGGTTTACAAGGTATGCCTGGTGAAAGAGGTGCTGCAGGTATAGCTGGACCAAAAGGAGACAGAGGTGACGTTGGTGAGAAGGGTCCCGAAGGAGCCCCTGGAAAAGATGGTGGAAGAGGATTAACAGGTCCTATAGGACCACCCGGTCCAGCCGGTGCTAATGGAGAAAAAGGAGAAGTAGGTCCTCCAGGTCCAGCAGGATCTGCAGGTGCTAGAGGTGCCCCTGGAGAGAGAGGTGAAACAGGACCACCTGGTCCAGCTGGTTTCGCTGGTCCCCCAGGAGCTGATGGACAGCCCGGTGCAAAAGGTGAACAAGGAGAAGCCGGACAGAAGGGAGATGCTGGAGCCCCCGGTCCACAAGGTCCCTCAGGAGCACCAGGTCCTCAAGGTCCAACTGGTGTGACCGGGCCAAAGGGTGCAAGAGGAGCACAGGGACCTCCAGGAGCAACAGGTTTCCCAGGAGCTGCTGGTAGAGTCGGTCCACCCGGATCTAATGGTAACCCCGGACCACCAGGACCACCTGGACCATCTGGAAAGGATGGACCCAAAGGAGCAAGAGGAGATTCAGGACCACCCGGAAGAGCAGGAGAACCTGGATTACAGGGTCCCGCCGGTCCACCAGGAGAGAAAGGAGAGCCCGGAGATGATGGTCCCTCAGGTGCAGAGGGACCCCCAGGACCCCAAGGTCTGGCAGGTCAAAGAGGTATAGTGGGTCTTCCAGGTCAAAGAGGTGAAAGAGGATTTCCAGGACTTCCAGGTCCTTCAGGTGAACCCGGTAAACAGGGAGCCCCCGGAGCCTCAGGTGACAGAGGTCCTCCAGGACCAGTAGGACCCCCAGGTTTAACCGGACCAGCAGGTGAGCCAGGAAGAGAAGGTTCTCCTGGAGCCGATGGACCTCCAGGAAGAGACGGTGCAGCTGGTGTTAAGGGTGACAGAGGTGAAACTGGAGCCGTAGGAGCCCCAGGTGCCCCCGGACCACCCGGATCACCCGGACCTGCAGGTCCTACTGGTAAACAAGGAGATAGAGGAGAAGCCGGTGCCCAGGGTCCTATGGGTCCTTCTGGTCCTGCAGGAGCAAGAGGTATACAAGGTCCACAGGGTCCCAGAGGTGACAAGGGTGAAGCAGGAGAACCCGGTGAGAGAGGTCTGAAGGGTCATAGAGGATTCACCGGGTTACAGGGTTTGCCAGGACCCCCTGGACCAAGTGGTGACCAGGGTGCATCCGGTCCAGCAGGTCCTTCTGGACCAAGAGGTCCTCCCGGTCCAGTTGGTCCATCAGGTAAAGACGGAGCCAACGGTATCCCAGGTCCCATCGGTCCTCCAGGTCCTAGAGGAAGAAGTGGAGAGACTGGTCCTGCTGGACCTCCTGGAAACCCTGGTCCTCCAGGACCTCCAGGTCCTCCAGGTCCCGGAATAGATATGTCCGCTTTCGCTGGATTGGGACCAAGAGAGAAAGGTCCTGACCCTCTTCAATATATGAGAGCA
在编码α1(Ⅰ)M1的DNA序列两端分别修饰添加氨基端添加编码Strep-Tag II标签的DNA序列、羧基端添加编码6×His Tag标签的DNA序列后,α1(Ⅰ)M1最终表达获得的是含有标签的蛋白,共1071个氨基酸,如SEQ.ID.NO.7所示:
SEQ.ID.NO.7:
WSHPQFEKQLSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPPGPPGPPGPPGKNGDDGEAGKPGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQPGPPGLPGERGRPGAPGPAGARGNDGATGAAGPPGPTGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGKRGARGEPGPTGLPGPPGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKGSPGEAGRPGEAGLPGAKGLTGSPGSPGPDGKTGPPGPAGQDGRPGPPGPPGARGQAGVMGFPGPKGAAGEPGKAGERGVPGPPGAVGPAGKDGEAGAQGPPGPAGPAGERGEQGPAGSPGFQGLPGPAGPPGEAGKPGEQGVPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGDRGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAGPPGPAGPAGPPGPIGNVGAPGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRPGEVGPPGPPGPAGEKGSPGADGPAGAPGTPGPQGIAGQRGVVGLPGQRGERGFPGLPGPSGEPGKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPGRDGSPGAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPAGPRGPPGSAGAPGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEKAHDGGRYYRAHHHHHH
经过优化设计后,编码SEQ.ID.NO.7氨基酸序列(α1(Ⅰ)M1)的基因(记为COL1A1M1)的DNA序列如SEQ.ID.NO.8所示:
SEQ.ID.NO.8:
TGGTCTCATCCACAATTTGAAAAGCAACTTAGTTATGGATACGATGAAAAATCCACAGGTGGAATCAGTGTTCCTGGACCTATGGGTCCATCAGGTCCAAGAGGTTTACCAGGACCTCCAGGTGCCCCAGGTCCCCAGGGATTTCAAGGTCCACCAGGAGAGCCTGGTGAGCCAGGAGCTTCTGGTCCACCTGGTCCCCCTGGACCACCTGGTCCTCCAGGAAAGAATGGAGATGATGGTGAAGCTGGAAAACCTGGAAGACCTGGAGAAAGAGGACCACCAGGACCCCAGGGTGCCAGAGGACTGCCAGGTACCGCAGGTCTGCCTGGAATGAAAGGTCATAGAGGATTTTCAGGATTAGACGGTGCAAAGGGAGACGCTGGACCTGCAGGACCAAAGGGTGAGCCAGGAAGTCCAGGAGAGAATGGTGCACCAGGACAGCCAGGTCCACCTGGACTGCCCGGTGAAAGAGGTAGACCCGGAGCACCAGGACCAGCAGGTGCAAGAGGAAATGATGGAGCTACAGGTGCTGCAGGACCCCCAGGTCCAACAGGACCAGCCGGTCCTCCCGGTTTCCCAGGTGCCGTTGGAGCAAAAGGTGAAGCTGGTCCACAGGGTCCAAGAGGTTCTGAAGGTCCACAGGGAGTTAGAGGAGAACCAGGACCCCCTGGACCAGCTGGTGCAGCAGGACCAGCTGGTAACCCTGGTGCTGACGGTCAGCCAGGTGCTAAGGGAGCAAATGGAGCACCAGGAATAGCTGGTGCCCCAGGATTTCCCGGTGCTAGAGGTCCAAGTGGTCCACAAGGACCAGGAGGTCCACCCGGTCCCAAAGGAAACAGTGGAGAACCAGGTGCACCCGGTTCAAAGGGAGATACAGGAGCTAAAGGAGAGCCCGGTCCAGTGGGTGTTCAGGGACCACCCGGACCTGCTGGAGAGGAAGGTAAAAGAGGTGCAAGAGGTGAGCCAGGACCAACAGGTCTGCCTGGTCCCCCTGGTGAAAGAGGTGGTCCAGGTAGTAGAGGATTTCCAGGAGCTGATGGTGTTGCAGGACCAAAGGGACCCGCAGGTGAGAGAGGATCACCCGGTCCAGCCGGACCAAAAGGATCACCAGGAGAAGCTGGTAGACCAGGAGAAGCTGGTCTGCCAGGTGCTAAAGGATTGACAGGATCACCCGGTTCACCTGGTCCTGATGGAAAGACAGGACCTCCAGGTCCCGCTGGTCAGGACGGTAGACCAGGACCCCCAGGACCCCCAGGTGCAAGAGGTCAGGCAGGTGTAATGGGTTTCCCCGGACCTAAAGGAGCAGCTGGAGAACCTGGTAAAGCTGGAGAGAGAGGAGTGCCTGGACCCCCTGGAGCTGTTGGTCCAGCAGGAAAGGATGGTGAGGCAGGTGCACAAGGTCCACCTGGACCCGCTGGACCTGCAGGTGAGAGAGGAGAGCAAGGTCCCGCAGGTTCTCCAGGTTTTCAGGGTTTGCCAGGTCCAGCCGGTCCTCCTGGAGAGGCAGGAAAGCCAGGAGAACAAGGAGTTCCAGGAGACCTGGGTGCACCAGGACCCTCTGGTGCAAGAGGAGAGAGAGGATTTCCTGGAGAAAGAGGTGTGCAGGGACCACCAGGTCCCGCCGGTCCAAGAGGAGCAAATGGAGCCCCTGGAAATGACGGAGCTAAGGGTGACGCTGGTGCACCAGGAGCACCAGGTTCTCAAGGTGCTCCCGGATTGCAGGGTATGCCTGGAGAGAGAGGTGCAGCTGGACTGCCAGGTCCAAAAGGTGACAGAGGAGACGCCGGTCCTAAGGGAGCTGACGGTTCTCCTGGAAAGGACGGTGTGAGAGGTTTGACAGGACCAATAGGTCCACCCGGTCCTGCTGGAGCCCCTGGAGACAAAGGTGAATCAGGTCCTTCCGGTCCAGCCGGACCAACAGGAGCAAGAGGAGCACCTGGAGACAGAGGAGAGCCAGGTCCTCCAGGACCTGCAGGTTTCGCTGGTCCTCCCGGAGCAGATGGACAGCCAGGAGCTAAGGGAGAACCCGGTGACGCTGGTGCTAAGGGAGATGCAGGTCCACCAGGTCCTGCTGGTCCTGCTGGACCTCCCGGACCAATAGGTAATGTTGGAGCACCCGGAGCAAAAGGTGCCAGAGGTTCCGCAGGTCCTCCCGGAGCAACTGGTTTTCCAGGAGCTGCCGGAAGAGTGGGTCCACCTGGTCCTTCTGGAAATGCAGGACCACCAGGTCCTCCTGGTCCAGCCGGAAAGGAAGGTGGAAAGGGACCTAGAGGAGAAACAGGTCCCGCAGGTAGACCCGGTGAGGTGGGTCCACCTGGTCCACCCGGTCCAGCTGGTGAGAAAGGAAGTCCTGGAGCAGACGGACCAGCTGGTGCCCCTGGTACACCAGGACCCCAAGGAATAGCTGGTCAAAGAGGTGTTGTTGGTTTACCAGGTCAGAGAGGAGAAAGAGGTTTTCCAGGATTACCAGGTCCCTCAGGTGAGCCCGGAAAACAGGGTCCCTCAGGAGCAAGTGGTGAAAGAGGACCACCAGGACCAATGGGACCTCCAGGATTAGCTGGTCCACCAGGAGAATCAGGAAGAGAGGGTGCTCCTGGAGCAGAAGGTTCACCAGGAAGAGACGGTTCACCCGGAGCCAAGGGAGACAGAGGTGAAACAGGTCCCGCAGGTCCACCAGGAGCACCCGGAGCCCCTGGTGCTCCAGGACCTGTCGGACCAGCAGGAAAATCCGGTGACAGAGGTGAGACTGGACCCGCAGGTCCTGCTGGTCCTGTTGGACCAGTGGGTGCAAGAGGACCAGCAGGTCCACAAGGTCCAAGAGGTGACAAAGGTGAGACAGGTGAGCAGGGTGACAGAGGAATTAAAGGTCACAGAGGATTTTCAGGACTGCAGGGACCACCCGGTCCTCCCGGTTCCCCAGGAGAGCAAGGTCCATCCGGTGCATCCGGTCCAGCTGGACCCAGAGGACCACCTGGTTCTGCTGGTGCACCAGGTAAAGATGGATTGAACGGTTTGCCTGGTCCAATAGGACCTCCTGGTCCAAGAGGAAGAACTGGTGACGCCGGTCCCGTCGGACCACCCGGTCCACCAGGTCCCCCAGGTCCACCCGGACCACCATCCGCAGGATTTGATTTCTCATTCCTTCCTCAACCTCCTCAAGAGAAAGCACATGATGGAGGTAGATACTATAGAGCCCATCACCACCATCATCATTAA
在编码α1(Ⅱ)M6的DNA序列两端分别修饰添加氨基端添加编码Strep-Tag II标签的DNA序列、羧基端添加编码6×His Tag标签的DNA序列后,α1(Ⅱ)M6最终表达获得的是含有标签的蛋白,共1076个氨基酸,序列如SEQ.ID.NO.9所示:
SEQ.ID.NO.9:
EFWSHPQFEKQMAGGFDEKAGGAQLGPPQGPPGPPGPPGPPGPAGAPGPQGFQGNPGEPGEPGVSGPPGPPGPPGPPGKPGDDGEAGKPGKAGERGPPGPQGARGFPGTPGLPGVKGHRGYPGLDGAKGEAGAPGVKGESGSPGENGSPGPPGPPGLPGERGRTGPAGAAGARGNDGQPGPAGPPGPVGPAGGPGFPGAPGAKGEAGPTGARGPEGAQGPRGEPGTPGSPGPAGASGNPGTDGIPGAKGSAGAPGIAGAPGFPGPRGPPGPQGATGPLGPKGQTGEPGIAGFKGEQGPKGEPGPAGPQGAPGPAGEEGKRGARGEPGGVGPIGPPGERGAPGNRGFPGQDGLAGPKGAPGERGPSGLAGPKGANGDPGRPGEPGLPGARGLTGRPGDAGPQGKVGPSGAPGEDGRPGPPGPQGARGQPGVMGFPGPKGANGEPGKAGEKGLPGAPGLRGLPGKDGETGAAGPPGPAGPAGERGEQGAPGPSGFQGLPGPPGPPGEGGKPGDQGVPGEAGAPGLVGPRGERGFPGERGSPGAQGLQGPRGLPGTPGTDGPKGASGPAGPPGAQGPPGLQGMPGERGAAGIAGPKGDRGDVGEKGPEGAPGKDGGRGLTGPIGPPGPAGANGEKGEVGPPGPAGSAGARGAPGERGETGPPGPAGFAGPPGADGQPGAKGEQGEAGQKGDAGAPGPQGPSGAPGPQGPTGVTGPKGARGAQGPPGATGFPGAAGRVGPPGSNGNPGPPGPPGPSGKDGPKGARGDSGPPGRAGEPGLQGPAGPPGEKGEPGDDGPSGAEGPPGPQGLAGQRGIVGLPGQRGERGFPGLPGPSGEPGKQGAPGASGDRGPPGPVGPPGLTGPAGEPGREGSPGADGPPGRDGAAGVKGDRGETGAVGAPGAPGPPGSPGPAGPTGKQGDRGEAGAQGPMGPSGPAGARGIQGPQGPRGDKGEAGEPGERGLKGHRGFTGLQGLPGPPGPSGDQGASGPAGPSGPRGPPGPVGPSGKDGANGIPGPIGPPGPRGRSGETGPAGPPGNPGPPGPPGPPGPGIDMSAFAGLGPREKGPDPLQYMRAHHHHHH
经过优化设计后,编码SEQ.ID.NO.10(α1(Ⅱ)M6)氨基酸序列的基因(记为COL2A1M6)的DNA序列如SEQ.ID.NO.10所示:
SEQ.ID.NO.10:
GAATTCTGGAGTCATCCTCAATTCGAAAAACAAATGGCTGGTGGATTCGATGAAAAGGCTGGTGGAGCCCAATTAGGTCCTCCACAAGGTCCTCCCGGTCCACCTGGTCCTCCCGGTCCTCCAGGTCCCGCCGGTGCTCCTGGACCACAGGGTTTCCAAGGAAACCCCGGTGAACCAGGTGAGCCTGGTGTTTCAGGTCCTCCCGGTCCTCCAGGACCACCTGGACCACCAGGAAAGCCTGGTGACGACGGAGAAGCTGGTAAACCAGGAAAGGCAGGAGAGAGAGGTCCACCTGGACCTCAGGGTGCCAGAGGTTTCCCAGGTACCCCTGGTCTTCCTGGTGTCAAGGGTCATAGAGGTTACCCCGGTTTGGATGGTGCCAAGGGTGAAGCCGGTGCCCCTGGTGTTAAGGGTGAATCAGGAAGTCCCGGTGAAAATGGAAGTCCCGGTCCACCCGGTCCACCTGGACTGCCAGGTGAGAGAGGAAGAACCGGACCAGCTGGTGCTGCAGGTGCTAGAGGAAATGACGGACAGCCCGGACCAGCCGGACCTCCCGGTCCTGTTGGGCCCGCAGGTGGTCCTGGTTTCCCtgGTGCTCCTGGAGCCAAAGGAGAAGCCGGACCCACCGGAGCCAGAGGTCCCGAGGGAGCACAGGGACCTAGAGGAGAACCAGGTACACCAGGTAGTCCCGGTCCTGCTGGTGCATCAGGAAATCCCGGAACTGACGGTATTCCAGGAGCAAAGGGATCTGCAGGAGCACCAGGAATAGCTGGTGCTCCTGGATTTCCAGGTCCCAGAGGACCTCCCGGTCCTCAAGGAGCAACAGGTCCTTTGGGACCAAAAGGTCAAACAGGAGAACCAGGTATTGCTGGATTCAAAGGAGAGCAAGGTCCAAAGGGAGAGCCCGGTCCCGCAGGTCCCCAAGGAGCCCCAGGACCAGCTGGTGAAGAAGGAAAAAGAGGAGCCAGAGGTGAACCTGGAGGAGTAGGACCTATTGGTCCTCCTGGTGAGAGAGGTGCTCCCGGAAACAGAGGTTTTCCTGGTCAAGATGGTCTGGCTGGACCTAAAGGTGCTCCAGGAGAGAGAGGACCTTCAGGACTTGCTGGTCCAAAAGGTGCTAACGGAGATCCAGGAAGACCCGGTGAACCTGGTCTGCCTGGAGCTAGAGGATTAACAGGAAGACCAGGTGACGCAGGTCCCCAGGGTAAAGTGGGTCCCAGTGGTGCCCCAGGTGAAGATGGAAGACCTGGTCCTCCCGGACCCCAAGGTGCAAGAGGTCAGCCTGGAGTGATGGGATTTCCTGGACCCAAGGGTGCTAACGGAGAACCTGGAAAAGCTGGTGAGAAAGGACTGCCCGGTGCCCCAGGTCTTAGAGGTTTGCCAGGTAAAGATGGAGAAACAGGAGCCGCAGGACCACCCGGTCCAGCCGGACCAGCAGGAGAGAGAGGTGAACAAGGAGCACCTGGTCCAAGTGGTTTTCAGGGTCTTCCAGGTCCCCCTGGTCCACCAGGAGAGGGAGGTAAACCAGGTGACCAAGGTGTCCCTGGAGAAGCAGGTGCACCCGGTCTTGTGGGTCCAAGAGGTGAAAGAGGATTCCCTGGTGAGAGAGGATCTCCCGGAGCCCAGGGACTTCAAGGTCCTAGAGGTCTGCCAGGTACCCCTGGTACAGACGGACCAAAGGGAGCATCAGGACCCGCTGGACCTCCCGGAGCCCAAGGTCCTCCAGGTTTACAAGGTATGCCTGGTGAAAGAGGTGCTGCAGGTATAGCTGGACCAAAAGGAGACAGAGGTGACGTTGGTGAGAAGGGTCCCGAAGGAGCCCCTGGAAAAGATGGTGGAAGAGGATTAACAGGTCCTATAGGACCACCCGGTCCAGCCGGTGCTAATGGAGAAAAAGGAGAAGTAGGTCCTCCAGGTCCAGCAGGATCTGCAGGTGCTAGAGGTGCCCCTGGAGAGAGAGGTGAAACAGGACCACCTGGTCCAGCTGGTTTCGCTGGTCCCCCAGGAGCTGATGGACAGCCCGGTGCAAAAGGTGAACAAGGAGAAGCCGGACAGAAGGGAGATGCTGGAGCCCCCGGTCCACAAGGTCCCTCAGGAGCACCAGGTCCTCAAGGTCCAACTGGTGTGACCGGGCCAAAGGGTGCAAGAGGAGCACAGGGACCTCCAGGAGCAACAGGTTTCCCAGGAGCTGCTGGTAGAGTCGGTCCACCCGGATCTAATGGTAACCCCGGACCACCAGGACCACCTGGACCATCTGGAAAGGATGGACCCAAAGGAGCAAGAGGAGATTCAGGACCACCCGGAAGAGCAGGAGAACCTGGATTACAGGGTCCCGCCGGTCCACCAGGAGAGAAAGGAGAGCCCGGAGATGATGGTCCCTCAGGTGCAGAGGGACCCCCAGGACCCCAAGGTCTGGCAGGTCAAAGAGGTATAGTGGGTCTTCCAGGTCAAAGAGGTGAAAGAGGATTTCCAGGACTTCCAGGTCCTTCAGGTGAACCCGGTAAACAGGGAGCCCCCGGAGCCTCAGGTGACAGAGGTCCTCCAGGACCAGTAGGACCCCCAGGTTTAACCGGACCAGCAGGTGAGCCAGGAAGAGAAGGTTCTCCTGGAGCCGATGGACCTCCAGGAAGAGACGGTGCAGCTGGTGTTAAGGGTGACAGAGGTGAAACTGGAGCCGTAGGAGCCCCAGGTGCCCCCGGACCACCCGGATCACCCGGACCTGCAGGTCCTACTGGTAAACAAGGAGATAGAGGAGAAGCCGGTGCCCAGGGTCCTATGGGTCCTTCTGGTCCTGCAGGAGCAAGAGGTATACAAGGTCCACAGGGTCCCAGAGGTGACAAGGGTGAAGCAGGAGAACCCGGTGAGAGAGGTCTGAAGGGTCATAGAGGATTCACCGGGTTACAGGGTTTGCCAGGACCCCCTGGACCAAGTGGTGACCAGGGTGCATCCGGTCCAGCAGGTCCTTCTGGACCAAGAGGTCCTCCCGGTCCAGTTGGTCCATCAGGTAAAGACGGAGCCAACGGTATCCCAGGTCCCATCGGTCCTCCAGGTCCTAGAGGAAGAAGTGGAGAGACTGGTCCTGCTGGACCTCCTGGAAACCCTGGTCCTCCAGGACCTCCAGGTCCTCCAGGTCCCGGAATAGATATGTCCGCTTTCGCTGGATTGGGACCAAGAGAGAAAGGTCCTGACCCTCTTCAATATATGAGAGCACACCATCACCATCATCACTAA
DNA序列的合成委托南京金斯瑞生物科技股份有限公司完成,合成SEQ.ID.NO.8、SEQ.ID.NO.10两种基因的DNA片段。
实施例2.重组表达载体的构建、菌种筛选
(1)重组表达载体的构建
将合成后的基因片段SEQ.ID.NO.8、SEQ.ID.NO.10重组至pPIC9K空载体(购自赛默飞世尔科技公司)中,使目的片段准确插入到含有分泌信号α-因子的分泌型载体读码框内,获得表达α1(Ⅱ)M6的pPIC9K-COL2A1M6和表达α1(Ⅰ)M1的pPIC9K-COL1A1M1两种重组表达载体质粒。
将pPIC9K-COL2A1M6、pPIC9K-COL1A1M1质粒转化进入感受态大肠杆菌DH5α(购自生工生物工程(上海)股份有限公司),在含有氨苄青霉素的LB抗性平板筛选阳性克隆,提取重组质粒进行测序鉴定(交由生工生物工程(上海)股份有限公司完成),验证正确。pPIC9K-COL1A1M1、pPIC9K-COL2A1M6的质粒图谱分别如图3和图4所示。
(2)菌种筛选
将上述重组表达载体质粒10μg,用SacⅠ(购自大连TaKaRa公司,具体操作按试剂盒说明书进行)37℃酶切消化过夜,使其线性化,再使用以PCR产物纯化试剂盒(购自生工生物工程(上海)股份有限公司),回收线性化质粒,使体积控制在10μL左右。
将线性化质粒电转化入宿主菌种毕赤酵母SMD1168(购自赛默飞世尔科技公司)感受态细胞中,将电转后的菌液涂布于MD平板上,每100μL~200μL涂布一块平板,室温静置10min,于30℃倒置培养2-5天,直至有单菌落(阳性转化子)出现。
向MD平板表面加入2mL无菌双蒸水,然后用无菌三角涂布器轻轻刮下平板表面的His+转化子,并转移到50mL离心管中。以无菌双蒸水稀释菌悬液,105个细胞涂布于含有0.5mg/mLG418的YPD平板上,倒置,30℃培养3~4d后至单菌落出现。从YPD平板上挑取菌落至无菌96孔板中(200μL YPD/孔),混匀,于30℃培养48h;混匀孔中菌液,各取10μL接入至一块新的无菌96孔板,于30℃培养24h后再重复一次此操作;24h后,从第三块96孔板中取出1μL分别点在含有1.0mg/mL和4mg/mL G418的YPD平板上,于30℃继续培养96h~120h。毕赤酵母转化子若能在含高浓度(4mg/mL)G418的平板上生长,说明该转化子含有多拷贝的目的基因,即有多个重组片段进入了酵母体内并通过同源重组整合到酵母的染色体上。经过这一步筛选可得到的高拷贝、可高效表达的重组酵母工程菌种。
构建含pPIC9K-COL1A1M1、pPIC9K-COL2A1M6的两种工程菌样本均送至中国微生物菌种保藏管理委员会普通微生物中心保藏。
含重组表达载体pPIC9K-COL1A1M1的工程菌表达重组α1(Ⅰ)M1胶原蛋白,保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号是:CGMCC NO.21891,地址:北京市朝阳区北辰西路1号院3号;保藏日期:2021年03月11日;分类命名:巴斯德毕赤酵母Pichia pastoris。
含重组表达载体pPIC9K-COL2A1M6的工程菌表达重组α1(Ⅱ)M6胶原蛋白,保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号是:CGMCC NO.21892。地址:北京市朝阳区北辰西路1号院3号;保藏日期:2021年03月11日;分类命名:巴斯德毕赤酵母Pichia pastoris。
实施例3.诱导表达与重组胶原蛋白的鉴定
分别取实施例2得到的表达α1(Ⅰ)M1、α1(Ⅱ)M6的重组工程菌,同时取已知专利中的表达全长Ⅰ型胶原α1链蛋白毕赤酵母工程菌株和表达全长Ⅱ型胶原α1链蛋白的毕赤酵母工程菌株作为对照,2个对照工程菌株均为发明人团队前期研究成果,所表达的全长胶原α1链同样于肽链氨基端添加Strep-Tag II标签、羧基端添加6×His Tag标签),其分别来自于申请号201911135958.0(名称:酵母重组人源Ⅰ型胶原α1链蛋白、合成方法及其应用,专利中表达全长α1(Ⅰ)链的毕赤酵母工程菌种保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号:CGMCC NO.17150)、申请号201911088025.0(名称:毕赤酵母生产重组人源Ⅱ型胶原蛋白单链的方法,专利中表达全长α1(Ⅱ)链的毕赤酵母工程菌种保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号:CGMCC NO.17149)的专利。将4种工程菌置于装有10mL BMGY培养基的100mL三角瓶中,于28-30℃、220rpm培养至OD600为2~6(16-18h)。室温下1500~3000g离心5min,收集菌体,用BMMY培养基重悬菌体,使OD600为2左右,放置于28-30℃、220rpm的摇床上继续生长3天,每24h向培养基中添加100%甲醇至培养基中甲醇的终浓度为1.0%。加甲醇诱导16h以上,就可收取菌液样品,取样量为1mL,置于1.5mL EP管中,4℃下以12000g离心5min,收集表达上清,待检测样品于-80℃保存备用。
收取的表达上清,加入5×上样缓冲液(250mM Tris-HCl、pH值为6.8,10%SDS,0.5%溴酚蓝,50%甘油,5%β-巯基乙醇),置于100℃金属浴加热10min,进行SDS-PAGE检测。因表达的目的蛋白氨基端有Srtep-TagⅡ标签,羧基端有6×His Tag标签,可以抗Srtep-TagⅡ、抗6×His Tag的抗体(购自南京金斯瑞生物科技股份有限公司)进行WesternBlot检测(具体操作参看说明书进行)。
表达上清的SDS-PAGE如下图5所示,α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)在诱导表达24h均可高效分泌表达于胞外的表达上清中,α1(Ⅰ)、α1(Ⅱ)在预期的目的条带(>116kDa)下出现了明确的主降解条带(<116kDa),而本发明的α1(Ⅰ)M1、α1(Ⅱ)M6则只有预期的目的条带(>116kDa)。
使用Image Lab软件(Bio-Rad Gel Doc XR+成像仪)测算,结果如下:
(1)α1(Ⅰ)M1目的条带表观分子量(116.3kDa)与α1(Ⅰ)目的条带表观分子量(116.4kDa)、α1(Ⅱ)M6目的条带表观分子量(118.2kDa)与α1(Ⅱ)目的条带表观分子量(118.1kDa)相比基本一致,明显大于α1(Ⅰ)的主降解条带的表观分子量(104.5kDa)与α1(Ⅱ)的主降解条带的表观分子量(106.9kDa)。
(2)α1(Ⅰ)电泳结果中目的条带与主降解条带的比值为51.5%:48.3%;α1(Ⅱ)电泳结果中目的条带与主降解条带的比值为52.1%:47.8%,主降解产物与目的产物占比基本相同。
从图6的ECL化学发光显色结果(全自动化学发光图像分析系统Tanon 5200将蛋白质分子质量标准合成于图像)中可以看到,氨基端Srtep-TagⅡ标签,羧基端6×His Tag标签均可检测到,且目的条带均与SDS-PAGE中表观分子量大小相同,说明α1(Ⅰ)M1、α1(Ⅱ)M6两种重组胶原蛋白成功的进行了全长序列的高效分泌表达,目的条带的表达符合预期,而α1(Ⅰ)、α1(Ⅱ)两种胶原蛋白的目的条带序列虽然是全长完整的,但是主降解条带缺失了氨基端的序列,只能检测到羧基端6×His Tag标签。
将α1(Ⅰ)M1和α1(Ⅱ)M6在SDS-PAGE上的目的条带、α1(Ⅰ)和α1(Ⅱ)在SDS-PAGE上的目的条带与主降解带条带切割下来,用胰蛋白酶将其酶解,Nano-HPLC-MS/MS质谱检测重组胶原的胰蛋白酶解后肽段(委托苏州普泰生物技术有限公司完成),并将检测到肽段进行序列比对(Uniprot数据库),数据比对结果及鉴定肽段与天然序列比对覆盖图(底色为灰色部分:条带中质谱鉴定到肽段与天然序列相完全相同的部分),如图7和图8所示,结果可见:
(1)α1(Ⅰ)M1、α1(Ⅰ)的目的条带及α1(Ⅰ)的主降解带被酶解后检测到的肽段均属于Ⅰ型胶原α1链上的序列。
(2)α1(Ⅱ)M6和α1(Ⅱ)的目的条带及α1(Ⅱ)的主降解带被酶解后检测到的肽段均属于人Ⅱ型胶原α1链上的序列。
以上结果说明α1(Ⅰ)M1、α1(Ⅱ)M6与α1(Ⅰ)、α1(Ⅱ)一样成功表达,分别属于人Ⅰ型胶原α1链、人Ⅱ型胶原α1链的重组胶原蛋白,但α1(Ⅰ)、α1(Ⅱ)表达时产生了降解,主降解条带也属于相应种类胶原蛋白。
实施例4.高密度发酵与纯化
(1)对基因工程菌进行高密度发酵
重组α1(Ⅰ)M1、α1(Ⅱ)M6胶原蛋白规模化表达生产,获取含有重组胶原蛋白的发酵液。
种子培养基YPG(含酵母粉10g/L、酵母蛋白胨20g/L、无水甘油10g/L);发酵培养基(含NH4H2PO4 190.4g/L、KH2PO4 10.06g/L、CaSO4·2H2O 1.18g/L、K2SO4 18.2g/L、MgSO4·7H2O 14.9g/L、甘油40g/L);补料培养基(含50%W/V甘油,每升加12mL PTM1微量元素);诱导培养基(含100%甲醇,每升加入12mL PTM1微量元素);PTM1:用0.22μm的滤膜过滤除菌,4℃保存。发酵培养基高温灭菌后待温度降至室温后加入PTM1,用氨水调节pH值至5.0。
工程菌株分批培养条件和诱导表达条件为:
采用分批补料培养方法,培养温度30℃。
工程菌接入含种子培养基YPG的1L摇瓶,220rpm、30℃,培养18-20h,至OD600=2~10。使用5L发酵罐(保兴生物),装液量2L发酵培养基,2%甘油分开灭菌,接种前调节转速为300rpm,通气量4L/min,温度30℃,用浓氨水配制好的碱液调pH,设置pH至4.5。然后先接入0.9mL PTM1,然后再将制备好的200mL种子液接入罐内(火焰圈接种),然后点击溶氧电极校百,校百后开始发酵。待生长溶氧第一次掉至30%时,采用溶氧串级转速功能,保持生长溶氧为30%;等待甘油耗完,溶氧反弹、溶氧大于70%(OD600值约20),取消溶氧串级转速,调高搅拌650rpm,甘油采用30%联动补料,补料80mL。停止补甘油,溶氧反弹至70%以上后,设置pH值为4、温度29℃,以甲醇、甘油混合碳源(甲醇:50%甘油=7:3)进行诱导培养。手动补加5mL,待溶氧反弹至70%以上后,设定补料速度为8mL/h,一小时后提高到为10mL/h,一小时后再次提高设定到20mL/h。待溶氧值低于30%,停止补料,等待溶氧反弹,溶氧回升至30%后联动补料。诱导40~60h,UV测量蛋白浓度增长幅度不明显或下降即可放罐。UV蛋白定量公式:C(mg/mL)=0.144*(A215-A225),A215<1.5。同时,分别同时取表达全长α1(Ⅰ)链的毕赤酵母工程菌种(中国微生物菌种保藏管理委员会普通微生物中心菌种保藏编号:CGMCC NO.17150)、表达全长α1(Ⅱ)链的毕赤酵母工程菌种(中国微生物菌种保藏管理委员会普通微生物中心菌种保藏编号:CGMCC NO.17149)进行高密度发酵。
结果如表1所示,在诱导48h后,α1(Ⅰ)与α1(Ⅰ)M1相比、α1(Ⅱ)M6与α1(Ⅱ)相比,菌浓度(OD600)、菌湿重、发酵液中表达蛋白浓度UV定量三个指标并无明显差异。但收集发酵上清进行SDS-PAGE电泳检测,结果如图9所示,可发现在高密度发酵的条件下,α1(Ⅰ)、α1(Ⅱ)的主降解条带极为明显,与摇瓶诱导表达无区别;而α1(Ⅰ)M1、α1(Ⅱ)M6最主要的产物仍是其目的条带,主降解条带没有出现,这说明α1(Ⅰ)M1、α1(Ⅱ)M6在消除主降解条带(主降解产物)的效果在高密度发酵的条件下仍能有效保持。
表1.发酵小试实验菌浓度、菌湿重、蛋白质表达量(UV定量)
种类 OD600 菌湿重(g/L) 蛋白质(UV,g/L)
α1(Ⅱ) 189.0 260.0 17.8
α1(Ⅱ)M6 198.0 265.0 18.7
α1(Ⅰ) 215.0 310.0 18.1
α1(Ⅰ)M1 201.0 301.0 17.3
(2)胶原蛋白纯化
缓冲液A:20mM KH2PO4,pH值为4.0;
缓冲液B:20mM KH2PO4、0.5M NaCl,pH值为4.0。
收集发酵液,2000g、30min、4℃离心分离菌体和发酵上清。以缓冲液A平衡阳离子交换介质(层析填料为苏州纳微产UniGel-80sp装载于利穗科技产GCC-50-400层析柱,使用GE AKTA Pure蛋白质分离层析纯化系统)至A215吸光值和电导率值都保持不变后,设置40us/cm的流速上样,上样体积0.5L/次,检测紫外A215吸光值,当其上升时,开始接样。待上样结束后,关闭接样,再以缓冲液A平衡阳离子层析介质,当A215吸光值下降时,直至紫外和电导降至最低且不再变化。收集洗脱液,分别检测确定好组份后,进行透析(透析液为超纯水),随后浓缩、冷冻干燥,收集冻干胶原蛋白海绵。取纯化后冻干海绵溶于超纯水,进行SDS-PAGE电泳,如图10所示。α1(Ⅰ)M1、α1(Ⅱ)M6经一步离子交换纯化后,去除多数的杂蛋白和小降解条带等,即可获得纯度高的单一目的蛋白质(使用Image Lab软件测算,α1(Ⅰ)M1纯度为90.1%、α1(Ⅱ)M6纯度为88.3%);而α1(Ⅰ)、α1(Ⅱ)经相同的纯化步骤后,主降解带依旧出现、无法消除,主降解产物与目的产物大小相差不多,性质相近,很难使用一步纯化将二者分离,根据申请号201911135958.0和申请号201911088025.0的专利内容可知,想获得单一目的全长α1(Ⅰ)链、全长α1(Ⅱ)链产物,需要利用全长α1(Ⅰ)链、全长α1(Ⅱ)链氨基端有Srtep-TagⅡ标签,羧基端有6×His标签的性质,使用Ni-NTA、Strep-Tactin亲和层析介质进行双亲和纯化才能做到,这样的话在SDS-PAGE上表现为主降解条带的主降解产物则被舍弃,浪费了菌体的生物合成资源,增加了纯化步骤,目的产物得率降低。
实施例5.重组胶原蛋白的检测
(1)傅里叶变换红外光谱(FT-IR)分析
试验取微量α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白纯化后冻干样品分别混合溴化钾(KBr)研磨成粉后压片,室温下,在4000~400cm-1范围内扫描(Thermo Scientific,NicoletTM iSTM 10FT-IR光谱仪),方法及结果分析参照(Jeong,H.,J.Venkatesan andS.Kim,Isolation and characterization of collagen from marine fish(Thunnusobesus).Biotechnology and Bioprocess Engineering,2013.18(6):p.1185-1191.)。
从α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)蛋白纯化样品的红外光谱扫描见图11和图12,可以看到其特征吸收均波数均符合重组胶原蛋白结构特征:酰胺A(3299cm-1左右)、酰胺B(3081cm-1左右)、酰胺I(1650cm-1左右)、酰胺II(1530~1550cm-1左右)、酰胺III(1240cm-1左右),说明α1(Ⅰ)M1、α1(Ⅱ)M6中氨基酸的突变不影响胶原蛋白本身性质(参见文献[1].陈静涛等,重组胶原蛋白与牛源Ⅰ型胶原蛋白红外光谱研究.材料导报,2008(03):第119-121页.[2].Doyle,B.B.,E.G.Bendit and E.R.Blout,Infrared spectroscopy of collagenand collagen-like polypeptides.Biopolymers,1975.14(5):p.937-957.[3].周爱梅等,重组人源胶原蛋白的分离纯化及其结构表征.食品与发酵工业,2015(03):第46-52页.)。
(2)重组胶原蛋白细胞黏附活性检测
重组胶原蛋白的细胞黏附活检测方法参考文献Juming Yao,SatoshiYanagisawa,Tetsuo Asakura.Design,Expression and Characterization of Collagen-Like Proteins Based on the Cell Adhesive and Crosslinking Sequences Derivedfrom Native Collagens,J Biochem.136,643-649(2004)。委托常州大学药学院功能纳米材料与生物医学检测实验室完成。
具体实施方法:正常培养NIH/3T3细胞(购自中国科学院细胞库,货号GNM6,培养、传代方法参照细胞说明书执行)。取重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白冻干海绵、对照人胶原蛋白(购买自Sigma,货号C7774)及牛血清白蛋白(BSA,购自生工生物(上海)股份有限公司)溶解(用超纯水或1M HCl溶液),以UV蛋白定量经验公式:C(mg/mL)=0.144×(A215-A225)测定蛋白浓度,再以PBS(pH 7.4)稀释至0.5mg/mL。向96孔细胞培养板中加入100μL各种蛋白溶液和空白PBS溶液对照,室温静置60min;再向每孔中加入105个培养状态良好的NIH/3T3细胞,37℃、5%CO2孵育60min。以PBS清洗4次孔中细胞。使用LDH检测试剂盒(Roche,04744926001)检测OD492nm的吸光度值(具体操作参照说明书执行)。
OD492nm的吸光度相应的表征可以代表胶原蛋白样品的细胞粘附活性:OD492nm的吸光度越高,说明蛋白粘附的细胞越多,黏附活性越高,胶原蛋白越能在短时间内帮助细胞贴壁或粘附于细胞外基质之上,更利于构建更佳的细胞外环境。结果如图13所示,重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白均与商品化的天然人胶原蛋白有类似的细胞黏附活性,且都显著高于对照组;α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比,细胞黏附活性基本一致,无显著差异。
(3)重组胶原蛋白水凝胶的制备与检测
取重组α1(Ⅰ)M1、α1(Ⅱ)M6、α1(Ⅰ)、α1(Ⅱ)胶原蛋白,以10%浓度溶于注射用水,调节pH值控制在4~6的范围内,0.22μm无菌滤器过滤除菌;以每1g胶原干粉的比例加入0.1g10%(w/w)无菌N-羟基琥珀酰亚胺(NHS)溶液,混匀;然后以每g胶原干粉的比例加入0.13g50%(w/w)无菌1-(3-二甲基氨丙基)-3-乙基碳二亚胺盐酸盐(EDC)溶液;室温(20-30℃)静置反应2-6h,形成水凝胶。将水凝胶置于无菌PBS溶液中(NaCl 8.5g/L、Na2HPO4 0.5g/L、NaH2PO4 0.15g/L,pH 7.2)透析,凝胶:PBS透析液=1:6(m/m),连续透析120h,每24h彻底更换一次透析液,去除NHS、EDC残留。将透析后的水凝胶装入无菌容器中,室温放置。
将水凝胶冷冻干燥去除水分,取冻干后水凝胶称重,再置于无菌PBS溶液中放置24h,待其彻底吸水溶胀,取出水凝胶,吸水纸将表面水分吸干后称重。参考文献中方法计算溶胀率:Q溶胀率=(W吸水溶胀质量-W干凝胶重量)/W干凝胶重量。流变仪(Discovery HR-2)检测水凝胶的弹性模量(储能模量,小振幅频率扫描,25℃、应力0.5%、0.1-100.0rad/s)、动力粘度(流动峰值保持,25℃、剪切速率2.0s-1)。将冻干后水凝胶转入液氮中速冻,掰断,使用扫描电镜(日立TM3030PLUS)对冻干后水凝胶表面进行扫描。弹性模量、动力粘度、溶胀率结果如表2所示,α1(Ⅰ)M1与α1(Ⅰ)相比、α1(Ⅱ)M6与α1(Ⅱ)相比,相同条件下所制备的水凝胶的流体力学性质基本一致,并无明显改变。
表2.四种水凝胶的弹性模量、动力粘度、溶胀率检测
凝胶种类 弹性模量(Pa) 粘度(Pa·S) 溶胀率(g/g干凝胶)
α1(Ⅱ) 104.63 82.87 14.18
α1(Ⅱ)M6 102.02 77.80 14.01
α1(Ⅰ) 234.67 190.67 12.53
α1(Ⅰ)M1 292.68 170.97 12.22
如图14、15所示,由α1(Ⅰ)M1、α1(Ⅱ)M6所制备的水凝胶与由α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶一样,均为多孔网状结构,孔径范围集中于100-200μm,具有良好的通透性,具备保持大量水分的空间结构基础,可作为细胞提供黏附、支撑、生长迁移的空间和输送营养物质与新陈代谢产物的通道,有应用于生物医学材料领域的潜力。
(4)重组胶原蛋白水凝胶的细胞检测
无菌存放的水凝胶放置于24孔细胞培养板中。取正常培养NIH/3T3细胞(购自中国科学院细胞库,货号GNM6,培养、传代方法参照细胞说明书执行),PBS清洗、胰酶消化、加培养基吹打均匀并计数,105细胞/孔接入到含水凝胶的培养皿中,共培养24-72小时,观察细胞于水凝胶上的粘附与增值情况。
(1)取一块24孔板用DMSO制备1mM的钙黄黄绿AM(购于碧云天生物技术研究所),并用D-PBS将其稀释成50μM的钙黄绿素工作液。吸去孔中培养基,用PBS清洗数次,加入1mL的含血清DMEM培养基,加入100μL钙黄绿素AM溶液(培养基的1/10),孵育30min,对细胞进行染色,再更换生长培养基,培养30min,轻取出水凝胶,置入新的培养孔中,荧光显微镜下拍照(最大激发光波长为494nm,最大发射光波长为514nm)。
(2)另取一块24孔板中加入200μL MTT溶液(购于碧云天生物技术研究所),培养NIH/3T3细胞4h后,观察细胞中蓝紫色结晶形成情况,弃培养基,用PBS清洗水凝胶,纵切开水凝胶,置入新的培养孔中,显微镜下拍照。
该实施例实验委托常州大学药学院功能纳米材料与生物医学检测实验室完成。
结果如图16、17所示,由α1(Ⅰ)M1、α1(Ⅱ)M6所制备的水凝胶与由α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶一样,明场显微镜下观察NIH/3T3细胞形态正常,为典型的成纤维细胞形态;水凝胶上黏附生长的NIH/3T3细胞被钙黄绿素AM染色后可检测到绿色荧光(照片中明亮部分);水凝胶中生长的NIH/3T3细胞在加入MTT后,可形成的蓝紫色结晶(照片中黑色部分);绿色荧光与蓝紫色结晶只能由活细胞形成,说明NIH/3T3细胞均能正常黏附、生长、迁移于水凝胶中,由α1(Ⅰ)M1、α1(Ⅱ)M6制备的水凝胶与天然序列的α1(Ⅰ)、α1(Ⅱ)所制备的水凝胶有类似的生物学功能,可作为新型生物医疗器械应用于创伤修复、组织再生等领域。
序列表
<110> 江苏创健医疗科技有限公司
<120> 重组胶原蛋白、制备方法及其应用
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1057
<212> PRT
<213> 人(Homo sapiens)
<400> 1
Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser Val
1 5 10 15
Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro
20 25 30
Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly
35 40 45
Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro
50 55 60
Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro
65 70 75 80
Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly
85 90 95
Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly Leu
100 105 110
Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro
115 120 125
Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly Pro Arg Gly
130 135 140
Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala
145 150 155 160
Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr
165 170 175
Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys Gly
180 185 190
Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly Val
195 200 205
Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala
210 215 220
Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly
225 230 235 240
Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro
245 250 255
Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser
260 265 270
Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly
275 280 285
Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Glu
290 295 300
Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro
305 310 315 320
Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly
325 330 335
Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser
340 345 350
Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro
355 360 365
Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly
370 375 380
Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln
385 390 395 400
Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala
405 410 415
Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly
420 425 430
Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly Pro
435 440 445
Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala
450 455 460
Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly
465 470 475 480
Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys
485 490 495
Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser
500 505 510
Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln Gly
515 520 525
Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn
530 535 540
Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln
545 550 555 560
Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly
565 570 575
Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala
580 585 590
Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro Ile
595 600 605
Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly
610 615 620
Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp
625 630 635 640
Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro
645 650 655
Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly
660 665 670
Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro
675 680 685
Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala Arg
690 695 700
Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly
705 710 715 720
Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro
725 730 735
Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr
740 745 750
Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro Gly
755 760 765
Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala
770 775 780
Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val Val
785 790 795 800
Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly
805 810 815
Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu
820 825 830
Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro
835 840 845
Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly
850 855 860
Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro
865 870 875 880
Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val
885 890 895
Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly
900 905 910
Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly Pro
915 920 925
Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp Arg
930 935 940
Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro Gly
945 950 955 960
Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly Pro
965 970 975
Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys Asp
980 985 990
Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly
995 1000 1005
Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly Pro
1010 1015 1020
Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe Leu
1025 1030 1035 1040
Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr Arg
1045 1050 1055
Ala
<210> 2
<211> 1057
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser Val
1 5 10 15
Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro
20 25 30
Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly
35 40 45
Glu Pro Gly Ala Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro
50 55 60
Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro
65 70 75 80
Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly
85 90 95
Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly Leu
100 105 110
Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro
115 120 125
Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Pro Gly Pro Pro Gly
130 135 140
Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala
145 150 155 160
Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr
165 170 175
Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys Gly
180 185 190
Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly Val
195 200 205
Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala
210 215 220
Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly
225 230 235 240
Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro
245 250 255
Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser
260 265 270
Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly
275 280 285
Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Glu
290 295 300
Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro
305 310 315 320
Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly
325 330 335
Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser
340 345 350
Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro
355 360 365
Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly
370 375 380
Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln
385 390 395 400
Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala
405 410 415
Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly
420 425 430
Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly Pro
435 440 445
Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala
450 455 460
Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly
465 470 475 480
Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys
485 490 495
Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser
500 505 510
Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln Gly
515 520 525
Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn
530 535 540
Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln
545 550 555 560
Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly
565 570 575
Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala
580 585 590
Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro Ile
595 600 605
Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly
610 615 620
Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp
625 630 635 640
Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro
645 650 655
Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly
660 665 670
Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro
675 680 685
Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala Arg
690 695 700
Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly
705 710 715 720
Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro
725 730 735
Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr
740 745 750
Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro Gly
755 760 765
Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala
770 775 780
Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val Val
785 790 795 800
Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly
805 810 815
Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu
820 825 830
Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro
835 840 845
Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly
850 855 860
Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro
865 870 875 880
Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val
885 890 895
Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly
900 905 910
Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly Pro
915 920 925
Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp Arg
930 935 940
Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro Gly
945 950 955 960
Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly Pro
965 970 975
Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys Asp
980 985 990
Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly
995 1000 1005
Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly Pro
1010 1015 1020
Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe Leu
1025 1030 1035 1040
Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr Arg
1045 1050 1055
Ala
<210> 3
<211> 3171
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caacttagtt atggatacga tgaaaaatcc acaggtggaa tcagtgttcc tggacctatg 60
ggtccatcag gtccaagagg tttaccagga cctccaggtg ccccaggtcc ccagggattt 120
caaggtccac caggagagcc tggtgagcca ggagcttctg gtccacctgg tccccctgga 180
ccacctggtc ctccaggaaa gaatggagat gatggtgaag ctggaaaacc tggaagacct 240
ggagaaagag gaccaccagg accccagggt gccagaggac tgccaggtac cgcaggtctg 300
cctggaatga aaggtcatag aggattttca ggattagacg gtgcaaaggg agacgctgga 360
cctgcaggac caaagggtga gccaggaagt ccaggagaga atggtgcacc aggacagcca 420
ggtccacctg gactgcccgg tgaaagaggt agacccggag caccaggacc agcaggtgca 480
agaggaaatg atggagctac aggtgctgca ggacccccag gtccaacagg accagccggt 540
cctcccggtt tcccaggtgc cgttggagca aaaggtgaag ctggtccaca gggtccaaga 600
ggttctgaag gtccacaggg agttagagga gaaccaggac cccctggacc agctggtgca 660
gcaggaccag ctggtaaccc tggtgctgac ggtcagccag gtgctaaggg agcaaatgga 720
gcaccaggaa tagctggtgc cccaggattt cccggtgcta gaggtccaag tggtccacaa 780
ggaccaggag gtccacccgg tcccaaagga aacagtggag aaccaggtgc acccggttca 840
aagggagata caggagctaa aggagagccc ggtccagtgg gtgttcaggg accacccgga 900
cctgctggag aggaaggtaa aagaggtgca agaggtgagc caggaccaac aggtctgcct 960
ggtccccctg gtgaaagagg tggtccaggt agtagaggat ttccaggagc tgatggtgtt 1020
gcaggaccaa agggacccgc aggtgagaga ggatcacccg gtccagccgg accaaaagga 1080
tcaccaggag aagctggtag accaggagaa gctggtctgc caggtgctaa aggattgaca 1140
ggatcacccg gttcacctgg tcctgatgga aagacaggac ctccaggtcc cgctggtcag 1200
gacggtagac caggaccccc aggaccccca ggtgcaagag gtcaggcagg tgtaatgggt 1260
ttccccggac ctaaaggagc agctggagaa cctggtaaag ctggagagag aggagtgcct 1320
ggaccccctg gagctgttgg tccagcagga aaggatggtg aggcaggtgc acaaggtcca 1380
cctggacccg ctggacctgc aggtgagaga ggagagcaag gtcccgcagg ttctccaggt 1440
tttcagggtt tgccaggtcc agccggtcct cctggagagg caggaaagcc aggagaacaa 1500
ggagttccag gagacctggg tgcaccagga ccctctggtg caagaggaga gagaggattt 1560
cctggagaaa gaggtgtgca gggaccacca ggtcccgccg gtccaagagg agcaaatgga 1620
gcccctggaa atgacggagc taagggtgac gctggtgcac caggagcacc aggttctcaa 1680
ggtgctcccg gattgcaggg tatgcctgga gagagaggtg cagctggact gccaggtcca 1740
aaaggtgaca gaggagacgc cggtcctaag ggagctgacg gttctcctgg aaaggacggt 1800
gtgagaggtt tgacaggacc aataggtcca cccggtcctg ctggagcccc tggagacaaa 1860
ggtgaatcag gtccttccgg tccagccgga ccaacaggag caagaggagc acctggagac 1920
agaggagagc caggtcctcc aggacctgca ggtttcgctg gtcctcccgg agcagatgga 1980
cagccaggag ctaagggaga acccggtgac gctggtgcta agggagatgc aggtccacca 2040
ggtcctgctg gtcctgctgg acctcccgga ccaataggta atgttggagc acccggagca 2100
aaaggtgcca gaggttccgc aggtcctccc ggagcaactg gttttccagg agctgccgga 2160
agagtgggtc cacctggtcc ttctggaaat gcaggaccac caggtcctcc tggtccagcc 2220
ggaaaggaag gtggaaaggg acctagagga gaaacaggtc ccgcaggtag acccggtgag 2280
gtgggtccac ctggtccacc cggtccagct ggtgagaaag gaagtcctgg agcagacgga 2340
ccagctggtg cccctggtac accaggaccc caaggaatag ctggtcaaag aggtgttgtt 2400
ggtttaccag gtcagagagg agaaagaggt tttccaggat taccaggtcc ctcaggtgag 2460
cccggaaaac agggtccctc aggagcaagt ggtgaaagag gaccaccagg accaatggga 2520
cctccaggat tagctggtcc accaggagaa tcaggaagag agggtgctcc tggagcagaa 2580
ggttcaccag gaagagacgg ttcacccgga gccaagggag acagaggtga aacaggtccc 2640
gcaggtccac caggagcacc cggagcccct ggtgctccag gacctgtcgg accagcagga 2700
aaatccggtg acagaggtga gactggaccc gcaggtcctg ctggtcctgt tggaccagtg 2760
ggtgcaagag gaccagcagg tccacaaggt ccaagaggtg acaaaggtga gacaggtgag 2820
cagggtgaca gaggaattaa aggtcacaga ggattttcag gactgcaggg accacccggt 2880
cctcccggtt ccccaggaga gcaaggtcca tccggtgcat ccggtccagc tggacccaga 2940
ggaccacctg gttctgctgg tgcaccaggt aaagatggat tgaacggttt gcctggtcca 3000
ataggacctc ctggtccaag aggaagaact ggtgacgccg gtcccgtcgg accacccggt 3060
ccaccaggtc ccccaggtcc acccggacca ccatccgcag gatttgattt ctcattcctt 3120
cctcaacctc ctcaagagaa agcacatgat ggaggtagat actatagagc c 3171
<210> 4
<211> 1060
<212> PRT
<213> 人(Homo sapiens)
<400> 4
Gln Met Ala Gly Gly Phe Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly
1 5 10 15
Val Met Gln Gly Pro Met Gly Pro Met Gly Pro Arg Gly Pro Pro Gly
20 25 30
Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu
35 40 45
Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly Pro Arg Gly Pro Pro
50 55 60
Gly Pro Pro Gly Lys Pro Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly
65 70 75 80
Lys Ala Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe
85 90 95
Pro Gly Thr Pro Gly Leu Pro Gly Val Lys Gly His Arg Gly Tyr Pro
100 105 110
Gly Leu Asp Gly Ala Lys Gly Glu Ala Gly Ala Pro Gly Val Lys Gly
115 120 125
Glu Ser Gly Ser Pro Gly Glu Asn Gly Ser Pro Gly Pro Met Gly Pro
130 135 140
Arg Gly Leu Pro Gly Glu Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala
145 150 155 160
Gly Ala Arg Gly Asn Asp Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly
165 170 175
Pro Val Gly Pro Ala Gly Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala
180 185 190
Lys Gly Glu Ala Gly Pro Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln
195 200 205
Gly Pro Arg Gly Glu Pro Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly
210 215 220
Ala Ser Gly Asn Pro Gly Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser
225 230 235 240
Ala Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg
245 250 255
Gly Pro Pro Gly Pro Gln Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly
260 265 270
Gln Thr Gly Glu Pro Gly Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro
275 280 285
Lys Gly Glu Pro Gly Pro Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala
290 295 300
Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Gly Val Gly
305 310 315 320
Pro Ile Gly Pro Pro Gly Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe
325 330 335
Pro Gly Gln Asp Gly Leu Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg
340 345 350
Gly Pro Ser Gly Leu Ala Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly
355 360 365
Arg Pro Gly Glu Pro Gly Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg
370 375 380
Pro Gly Asp Ala Gly Pro Gln Gly Lys Val Gly Pro Ser Gly Ala Pro
385 390 395 400
Gly Glu Asp Gly Arg Pro Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly
405 410 415
Gln Pro Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu
420 425 430
Pro Gly Lys Ala Gly Glu Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg
435 440 445
Gly Leu Pro Gly Lys Asp Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly
450 455 460
Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro
465 470 475 480
Ser Gly Phe Gln Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly
485 490 495
Gly Lys Pro Gly Asp Gln Gly Val Pro Gly Glu Ala Gly Ala Pro Gly
500 505 510
Leu Val Gly Pro Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser
515 520 525
Pro Gly Ala Gln Gly Leu Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro
530 535 540
Gly Thr Asp Gly Pro Lys Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly
545 550 555 560
Ala Gln Gly Pro Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala
565 570 575
Ala Gly Ile Ala Gly Pro Lys Gly Asp Arg Gly Asp Val Gly Glu Lys
580 585 590
Gly Pro Glu Gly Ala Pro Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly
595 600 605
Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu
610 615 620
Val Gly Pro Pro Gly Pro Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro
625 630 635 640
Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly
645 650 655
Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu
660 665 670
Ala Gly Gln Lys Gly Asp Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser
675 680 685
Gly Ala Pro Gly Pro Gln Gly Pro Thr Gly Val Thr Gly Pro Lys Gly
690 695 700
Ala Arg Gly Ala Gln Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala
705 710 715 720
Ala Gly Arg Val Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro
725 730 735
Gly Pro Pro Gly Pro Ser Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly
740 745 750
Asp Ser Gly Pro Pro Gly Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro
755 760 765
Ala Gly Pro Pro Gly Glu Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser
770 775 780
Gly Ala Glu Gly Pro Pro Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly
785 790 795 800
Ile Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu
805 810 815
Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser
820 825 830
Gly Asp Arg Gly Pro Pro Gly Pro Val Gly Pro Pro Gly Leu Thr Gly
835 840 845
Pro Ala Gly Glu Pro Gly Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro
850 855 860
Pro Gly Arg Asp Gly Ala Ala Gly Val Lys Gly Asp Arg Gly Glu Thr
865 870 875 880
Gly Ala Val Gly Ala Pro Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly
885 890 895
Pro Ala Gly Pro Thr Gly Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala
900 905 910
Gln Gly Pro Met Gly Pro Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln
915 920 925
Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly
930 935 940
Glu Arg Gly Leu Lys Gly His Arg Gly Phe Thr Gly Leu Gln Gly Leu
945 950 955 960
Pro Gly Pro Pro Gly Pro Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala
965 970 975
Gly Pro Ser Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Pro Ser Gly
980 985 990
Lys Asp Gly Ala Asn Gly Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro
995 1000 1005
Arg Gly Arg Ser Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro
1010 1015 1020
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Gly Ile Asp Met Ser
1025 1030 1035 1040
Ala Phe Ala Gly Leu Gly Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln
1045 1050 1055
Tyr Met Arg Ala
1060
<210> 5
<211> 1060
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Gln Met Ala Gly Gly Phe Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly
1 5 10 15
Pro Pro Gln Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly
20 25 30
Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu
35 40 45
Pro Gly Glu Pro Gly Val Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro
50 55 60
Gly Pro Pro Gly Lys Pro Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly
65 70 75 80
Lys Ala Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe
85 90 95
Pro Gly Thr Pro Gly Leu Pro Gly Val Lys Gly His Arg Gly Tyr Pro
100 105 110
Gly Leu Asp Gly Ala Lys Gly Glu Ala Gly Ala Pro Gly Val Lys Gly
115 120 125
Glu Ser Gly Ser Pro Gly Glu Asn Gly Ser Pro Gly Pro Pro Gly Pro
130 135 140
Pro Gly Leu Pro Gly Glu Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala
145 150 155 160
Gly Ala Arg Gly Asn Asp Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly
165 170 175
Pro Val Gly Pro Ala Gly Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala
180 185 190
Lys Gly Glu Ala Gly Pro Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln
195 200 205
Gly Pro Arg Gly Glu Pro Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly
210 215 220
Ala Ser Gly Asn Pro Gly Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser
225 230 235 240
Ala Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg
245 250 255
Gly Pro Pro Gly Pro Gln Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly
260 265 270
Gln Thr Gly Glu Pro Gly Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro
275 280 285
Lys Gly Glu Pro Gly Pro Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala
290 295 300
Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Gly Val Gly
305 310 315 320
Pro Ile Gly Pro Pro Gly Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe
325 330 335
Pro Gly Gln Asp Gly Leu Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg
340 345 350
Gly Pro Ser Gly Leu Ala Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly
355 360 365
Arg Pro Gly Glu Pro Gly Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg
370 375 380
Pro Gly Asp Ala Gly Pro Gln Gly Lys Val Gly Pro Ser Gly Ala Pro
385 390 395 400
Gly Glu Asp Gly Arg Pro Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly
405 410 415
Gln Pro Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu
420 425 430
Pro Gly Lys Ala Gly Glu Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg
435 440 445
Gly Leu Pro Gly Lys Asp Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly
450 455 460
Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro
465 470 475 480
Ser Gly Phe Gln Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly
485 490 495
Gly Lys Pro Gly Asp Gln Gly Val Pro Gly Glu Ala Gly Ala Pro Gly
500 505 510
Leu Val Gly Pro Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser
515 520 525
Pro Gly Ala Gln Gly Leu Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro
530 535 540
Gly Thr Asp Gly Pro Lys Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly
545 550 555 560
Ala Gln Gly Pro Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala
565 570 575
Ala Gly Ile Ala Gly Pro Lys Gly Asp Arg Gly Asp Val Gly Glu Lys
580 585 590
Gly Pro Glu Gly Ala Pro Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly
595 600 605
Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu
610 615 620
Val Gly Pro Pro Gly Pro Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro
625 630 635 640
Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly
645 650 655
Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu
660 665 670
Ala Gly Gln Lys Gly Asp Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser
675 680 685
Gly Ala Pro Gly Pro Gln Gly Pro Thr Gly Val Thr Gly Pro Lys Gly
690 695 700
Ala Arg Gly Ala Gln Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala
705 710 715 720
Ala Gly Arg Val Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro
725 730 735
Gly Pro Pro Gly Pro Ser Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly
740 745 750
Asp Ser Gly Pro Pro Gly Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro
755 760 765
Ala Gly Pro Pro Gly Glu Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser
770 775 780
Gly Ala Glu Gly Pro Pro Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly
785 790 795 800
Ile Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu
805 810 815
Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser
820 825 830
Gly Asp Arg Gly Pro Pro Gly Pro Val Gly Pro Pro Gly Leu Thr Gly
835 840 845
Pro Ala Gly Glu Pro Gly Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro
850 855 860
Pro Gly Arg Asp Gly Ala Ala Gly Val Lys Gly Asp Arg Gly Glu Thr
865 870 875 880
Gly Ala Val Gly Ala Pro Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly
885 890 895
Pro Ala Gly Pro Thr Gly Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala
900 905 910
Gln Gly Pro Met Gly Pro Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln
915 920 925
Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly
930 935 940
Glu Arg Gly Leu Lys Gly His Arg Gly Phe Thr Gly Leu Gln Gly Leu
945 950 955 960
Pro Gly Pro Pro Gly Pro Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala
965 970 975
Gly Pro Ser Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Pro Ser Gly
980 985 990
Lys Asp Gly Ala Asn Gly Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro
995 1000 1005
Arg Gly Arg Ser Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro
1010 1015 1020
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Gly Ile Asp Met Ser
1025 1030 1035 1040
Ala Phe Ala Gly Leu Gly Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln
1045 1050 1055
Tyr Met Arg Ala
1060
<210> 6
<211> 3180
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
caaatggctg gtggattcga tgaaaaggct ggtggagccc aattaggtcc tccacaaggt 60
cctcccggtc cacctggtcc tcccggtcct ccaggtcccg ccggtgctcc tggaccacag 120
ggtttccaag gaaaccccgg tgaaccaggt gagcctggtg tttcaggtcc tcccggtcct 180
ccaggaccac ctggaccacc aggaaagcct ggtgacgacg gagaagctgg taaaccagga 240
aaggcaggag agagaggtcc acctggacct cagggtgcca gaggtttccc aggtacccct 300
ggtcttcctg gtgtcaaggg tcatagaggt taccccggtt tggatggtgc caagggtgaa 360
gccggtgccc ctggtgttaa gggtgaatca ggaagtcccg gtgaaaatgg aagtcccggt 420
ccacccggtc cacctggact gccaggtgag agaggaagaa ccggaccagc tggtgctgca 480
ggtgctagag gaaatgacgg acagcccgga ccagccggac ctcccggtcc tgttgggccc 540
gcaggtggtc ctggtttccc tggtgctcct ggagccaaag gagaagccgg acccaccgga 600
gccagaggtc ccgagggagc acagggacct agaggagaac caggtacacc aggtagtccc 660
ggtcctgctg gtgcatcagg aaatcccgga actgacggta ttccaggagc aaagggatct 720
gcaggagcac caggaatagc tggtgctcct ggatttccag gtcccagagg acctcccggt 780
cctcaaggag caacaggtcc tttgggacca aaaggtcaaa caggagaacc aggtattgct 840
ggattcaaag gagagcaagg tccaaaggga gagcccggtc ccgcaggtcc ccaaggagcc 900
ccaggaccag ctggtgaaga aggaaaaaga ggagccagag gtgaacctgg aggagtagga 960
cctattggtc ctcctggtga gagaggtgct cccggaaaca gaggttttcc tggtcaagat 1020
ggtctggctg gacctaaagg tgctccagga gagagaggac cttcaggact tgctggtcca 1080
aaaggtgcta acggagatcc aggaagaccc ggtgaacctg gtctgcctgg agctagagga 1140
ttaacaggaa gaccaggtga cgcaggtccc cagggtaaag tgggtcccag tggtgcccca 1200
ggtgaagatg gaagacctgg tcctcccgga ccccaaggtg caagaggtca gcctggagtg 1260
atgggatttc ctggacccaa gggtgctaac ggagaacctg gaaaagctgg tgagaaagga 1320
ctgcccggtg ccccaggtct tagaggtttg ccaggtaaag atggagaaac aggagccgca 1380
ggaccacccg gtccagccgg accagcagga gagagaggtg aacaaggagc acctggtcca 1440
agtggttttc agggtcttcc aggtccccct ggtccaccag gagagggagg taaaccaggt 1500
gaccaaggtg tccctggaga agcaggtgca cccggtcttg tgggtccaag aggtgaaaga 1560
ggattccctg gtgagagagg atctcccgga gcccagggac ttcaaggtcc tagaggtctg 1620
ccaggtaccc ctggtacaga cggaccaaag ggagcatcag gacccgctgg acctcccgga 1680
gcccaaggtc ctccaggttt acaaggtatg cctggtgaaa gaggtgctgc aggtatagct 1740
ggaccaaaag gagacagagg tgacgttggt gagaagggtc ccgaaggagc ccctggaaaa 1800
gatggtggaa gaggattaac aggtcctata ggaccacccg gtccagccgg tgctaatgga 1860
gaaaaaggag aagtaggtcc tccaggtcca gcaggatctg caggtgctag aggtgcccct 1920
ggagagagag gtgaaacagg accacctggt ccagctggtt tcgctggtcc cccaggagct 1980
gatggacagc ccggtgcaaa aggtgaacaa ggagaagccg gacagaaggg agatgctgga 2040
gcccccggtc cacaaggtcc ctcaggagca ccaggtcctc aaggtccaac tggtgtgacc 2100
gggccaaagg gtgcaagagg agcacaggga cctccaggag caacaggttt cccaggagct 2160
gctggtagag tcggtccacc cggatctaat ggtaaccccg gaccaccagg accacctgga 2220
ccatctggaa aggatggacc caaaggagca agaggagatt caggaccacc cggaagagca 2280
ggagaacctg gattacaggg tcccgccggt ccaccaggag agaaaggaga gcccggagat 2340
gatggtccct caggtgcaga gggaccccca ggaccccaag gtctggcagg tcaaagaggt 2400
atagtgggtc ttccaggtca aagaggtgaa agaggatttc caggacttcc aggtccttca 2460
ggtgaacccg gtaaacaggg agcccccgga gcctcaggtg acagaggtcc tccaggacca 2520
gtaggacccc caggtttaac cggaccagca ggtgagccag gaagagaagg ttctcctgga 2580
gccgatggac ctccaggaag agacggtgca gctggtgtta agggtgacag aggtgaaact 2640
ggagccgtag gagccccagg tgcccccgga ccacccggat cacccggacc tgcaggtcct 2700
actggtaaac aaggagatag aggagaagcc ggtgcccagg gtcctatggg tccttctggt 2760
cctgcaggag caagaggtat acaaggtcca cagggtccca gaggtgacaa gggtgaagca 2820
ggagaacccg gtgagagagg tctgaagggt catagaggat tcaccgggtt acagggtttg 2880
ccaggacccc ctggaccaag tggtgaccag ggtgcatccg gtccagcagg tccttctgga 2940
ccaagaggtc ctcccggtcc agttggtcca tcaggtaaag acggagccaa cggtatccca 3000
ggtcccatcg gtcctccagg tcctagagga agaagtggag agactggtcc tgctggacct 3060
cctggaaacc ctggtcctcc aggacctcca ggtcctccag gtcccggaat agatatgtcc 3120
gctttcgctg gattgggacc aagagagaaa ggtcctgacc ctcttcaata tatgagagca 3180
<210> 7
<211> 1071
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Trp Ser His Pro Gln Phe Glu Lys Gln Leu Ser Tyr Gly Tyr Asp Glu
1 5 10 15
Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro Ser Gly
20 25 30
Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln Gly Phe
35 40 45
Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly Pro Pro
50 55 60
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp Asp Gly
65 70 75 80
Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro Gly Pro
85 90 95
Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly Met Lys
100 105 110
Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp Ala Gly
115 120 125
Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn Gly Ala
130 135 140
Pro Gly Gln Pro Gly Pro Pro Gly Leu Pro Gly Glu Arg Gly Arg Pro
145 150 155 160
Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala Thr Gly
165 170 175
Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro Gly Phe
180 185 190
Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly Pro Arg
195 200 205
Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro Pro Gly
210 215 220
Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp Gly Gln
225 230 235 240
Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly Ala Pro
245 250 255
Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro Gly Gly
260 265 270
Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro Gly Ser
275 280 285
Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly Val Gln
290 295 300
Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly
305 310 315 320
Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg Gly Gly
325 330 335
Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly Pro Lys
340 345 350
Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro Lys Gly
355 360 365
Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro Gly Ala
370 375 380
Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly Lys Thr
385 390 395 400
Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro Pro Gly
405 410 415
Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro Gly Pro
420 425 430
Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly Val Pro
435 440 445
Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu Ala Gly
450 455 460
Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu
465 470 475 480
Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly Pro Ala
485 490 495
Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val Pro Gly
500 505 510
Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg Gly Phe
515 520 525
Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Pro Arg
530 535 540
Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp Ala Gly
545 550 555 560
Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln Gly Met
565 570 575
Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly Asp Arg
580 585 590
Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys Asp Gly
595 600 605
Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala
610 615 620
Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly Pro Thr
625 630 635 640
Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly
645 650 655
Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala
660 665 670
Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly Pro Pro
675 680 685
Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn Val Gly
690 695 700
Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro Gly Ala
705 710 715 720
Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly Pro Ser
725 730 735
Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu Gly
740 745 750
Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro Gly Glu
755 760 765
Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly Ser Pro
770 775 780
Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro Gln Gly
785 790 795 800
Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg Gly Glu
805 810 815
Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln
820 825 830
Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly Pro Met Gly
835 840 845
Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly Arg Glu Gly Ala
850 855 860
Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly Ser Pro Gly Ala Lys
865 870 875 880
Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro Pro Gly Ala Pro Gly
885 890 895
Ala Pro Gly Ala Pro Gly Pro Val Gly Pro Ala Gly Lys Ser Gly Asp
900 905 910
Arg Gly Glu Thr Gly Pro Ala Gly Pro Ala Gly Pro Val Gly Pro Val
915 920 925
Gly Ala Arg Gly Pro Ala Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly
930 935 940
Glu Thr Gly Glu Gln Gly Asp Arg Gly Ile Lys Gly His Arg Gly Phe
945 950 955 960
Ser Gly Leu Gln Gly Pro Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln
965 970 975
Gly Pro Ser Gly Ala Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly
980 985 990
Ser Ala Gly Ala Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro
995 1000 1005
Ile Gly Pro Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val
1010 1015 1020
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser
1025 1030 1035 1040
Ala Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys Ala
1045 1050 1055
His Asp Gly Gly Arg Tyr Tyr Arg Ala His His His His His His
1060 1065 1070
<210> 8
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tggtctcatc cacaatttga aaagcaactt agttatggat acgatgaaaa atccacaggt 60
ggaatcagtg ttcctggacc tatgggtcca tcaggtccaa gaggtttacc aggacctcca 120
ggtgccccag gtccccaggg atttcaaggt ccaccaggag agcctggtga gccaggagct 180
tctggtccac ctggtccccc tggaccacct ggtcctccag gaaagaatgg agatgatggt 240
gaagctggaa aacctggaag acctggagaa agaggaccac caggacccca gggtgccaga 300
ggactgccag gtaccgcagg tctgcctgga atgaaaggtc atagaggatt ttcaggatta 360
gacggtgcaa agggagacgc tggacctgca ggaccaaagg gtgagccagg aagtccagga 420
gagaatggtg caccaggaca gccaggtcca cctggactgc ccggtgaaag aggtagaccc 480
ggagcaccag gaccagcagg tgcaagagga aatgatggag ctacaggtgc tgcaggaccc 540
ccaggtccaa caggaccagc cggtcctccc ggtttcccag gtgccgttgg agcaaaaggt 600
gaagctggtc cacagggtcc aagaggttct gaaggtccac agggagttag aggagaacca 660
ggaccccctg gaccagctgg tgcagcagga ccagctggta accctggtgc tgacggtcag 720
ccaggtgcta agggagcaaa tggagcacca ggaatagctg gtgccccagg atttcccggt 780
gctagaggtc caagtggtcc acaaggacca ggaggtccac ccggtcccaa aggaaacagt 840
ggagaaccag gtgcacccgg ttcaaaggga gatacaggag ctaaaggaga gcccggtcca 900
gtgggtgttc agggaccacc cggacctgct ggagaggaag gtaaaagagg tgcaagaggt 960
gagccaggac caacaggtct gcctggtccc cctggtgaaa gaggtggtcc aggtagtaga 1020
ggatttccag gagctgatgg tgttgcagga ccaaagggac ccgcaggtga gagaggatca 1080
cccggtccag ccggaccaaa aggatcacca ggagaagctg gtagaccagg agaagctggt 1140
ctgccaggtg ctaaaggatt gacaggatca cccggttcac ctggtcctga tggaaagaca 1200
ggacctccag gtcccgctgg tcaggacggt agaccaggac ccccaggacc cccaggtgca 1260
agaggtcagg caggtgtaat gggtttcccc ggacctaaag gagcagctgg agaacctggt 1320
aaagctggag agagaggagt gcctggaccc cctggagctg ttggtccagc aggaaaggat 1380
ggtgaggcag gtgcacaagg tccacctgga cccgctggac ctgcaggtga gagaggagag 1440
caaggtcccg caggttctcc aggttttcag ggtttgccag gtccagccgg tcctcctgga 1500
gaggcaggaa agccaggaga acaaggagtt ccaggagacc tgggtgcacc aggaccctct 1560
ggtgcaagag gagagagagg atttcctgga gaaagaggtg tgcagggacc accaggtccc 1620
gccggtccaa gaggagcaaa tggagcccct ggaaatgacg gagctaaggg tgacgctggt 1680
gcaccaggag caccaggttc tcaaggtgct cccggattgc agggtatgcc tggagagaga 1740
ggtgcagctg gactgccagg tccaaaaggt gacagaggag acgccggtcc taagggagct 1800
gacggttctc ctggaaagga cggtgtgaga ggtttgacag gaccaatagg tccacccggt 1860
cctgctggag cccctggaga caaaggtgaa tcaggtcctt ccggtccagc cggaccaaca 1920
ggagcaagag gagcacctgg agacagagga gagccaggtc ctccaggacc tgcaggtttc 1980
gctggtcctc ccggagcaga tggacagcca ggagctaagg gagaacccgg tgacgctggt 2040
gctaagggag atgcaggtcc accaggtcct gctggtcctg ctggacctcc cggaccaata 2100
ggtaatgttg gagcacccgg agcaaaaggt gccagaggtt ccgcaggtcc tcccggagca 2160
actggttttc caggagctgc cggaagagtg ggtccacctg gtccttctgg aaatgcagga 2220
ccaccaggtc ctcctggtcc agccggaaag gaaggtggaa agggacctag aggagaaaca 2280
ggtcccgcag gtagacccgg tgaggtgggt ccacctggtc cacccggtcc agctggtgag 2340
aaaggaagtc ctggagcaga cggaccagct ggtgcccctg gtacaccagg accccaagga 2400
atagctggtc aaagaggtgt tgttggttta ccaggtcaga gaggagaaag aggttttcca 2460
ggattaccag gtccctcagg tgagcccgga aaacagggtc cctcaggagc aagtggtgaa 2520
agaggaccac caggaccaat gggacctcca ggattagctg gtccaccagg agaatcagga 2580
agagagggtg ctcctggagc agaaggttca ccaggaagag acggttcacc cggagccaag 2640
ggagacagag gtgaaacagg tcccgcaggt ccaccaggag cacccggagc ccctggtgct 2700
ccaggacctg tcggaccagc aggaaaatcc ggtgacagag gtgagactgg acccgcaggt 2760
cctgctggtc ctgttggacc agtgggtgca agaggaccag caggtccaca aggtccaaga 2820
ggtgacaaag gtgagacagg tgagcagggt gacagaggaa ttaaaggtca cagaggattt 2880
tcaggactgc agggaccacc cggtcctccc ggttccccag gagagcaagg tccatccggt 2940
gcatccggtc cagctggacc cagaggacca cctggttctg ctggtgcacc aggtaaagat 3000
ggattgaacg gtttgcctgg tccaatagga cctcctggtc caagaggaag aactggtgac 3060
gccggtcccg tcggaccacc cggtccacca ggtcccccag gtccacccgg accaccatcc 3120
gcaggatttg atttctcatt ccttcctcaa cctcctcaag agaaagcaca tgatggaggt 3180
agatactata gagcccatca ccaccatcat cattaa 3216
<210> 9
<211> 1076
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Glu Phe Trp Ser His Pro Gln Phe Glu Lys Gln Met Ala Gly Gly Phe
1 5 10 15
Asp Glu Lys Ala Gly Gly Ala Gln Leu Gly Pro Pro Gln Gly Pro Pro
20 25 30
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly
35 40 45
Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val
50 55 60
Ser Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Lys Pro
65 70 75 80
Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Lys Ala Gly Glu Arg Gly
85 90 95
Pro Pro Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr Pro Gly Leu
100 105 110
Pro Gly Val Lys Gly His Arg Gly Tyr Pro Gly Leu Asp Gly Ala Lys
115 120 125
Gly Glu Ala Gly Ala Pro Gly Val Lys Gly Glu Ser Gly Ser Pro Gly
130 135 140
Glu Asn Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Leu Pro Gly Glu
145 150 155 160
Arg Gly Arg Thr Gly Pro Ala Gly Ala Ala Gly Ala Arg Gly Asn Asp
165 170 175
Gly Gln Pro Gly Pro Ala Gly Pro Pro Gly Pro Val Gly Pro Ala Gly
180 185 190
Gly Pro Gly Phe Pro Gly Ala Pro Gly Ala Lys Gly Glu Ala Gly Pro
195 200 205
Thr Gly Ala Arg Gly Pro Glu Gly Ala Gln Gly Pro Arg Gly Glu Pro
210 215 220
Gly Thr Pro Gly Ser Pro Gly Pro Ala Gly Ala Ser Gly Asn Pro Gly
225 230 235 240
Thr Asp Gly Ile Pro Gly Ala Lys Gly Ser Ala Gly Ala Pro Gly Ile
245 250 255
Ala Gly Ala Pro Gly Phe Pro Gly Pro Arg Gly Pro Pro Gly Pro Gln
260 265 270
Gly Ala Thr Gly Pro Leu Gly Pro Lys Gly Gln Thr Gly Glu Pro Gly
275 280 285
Ile Ala Gly Phe Lys Gly Glu Gln Gly Pro Lys Gly Glu Pro Gly Pro
290 295 300
Ala Gly Pro Gln Gly Ala Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg
305 310 315 320
Gly Ala Arg Gly Glu Pro Gly Gly Val Gly Pro Ile Gly Pro Pro Gly
325 330 335
Glu Arg Gly Ala Pro Gly Asn Arg Gly Phe Pro Gly Gln Asp Gly Leu
340 345 350
Ala Gly Pro Lys Gly Ala Pro Gly Glu Arg Gly Pro Ser Gly Leu Ala
355 360 365
Gly Pro Lys Gly Ala Asn Gly Asp Pro Gly Arg Pro Gly Glu Pro Gly
370 375 380
Leu Pro Gly Ala Arg Gly Leu Thr Gly Arg Pro Gly Asp Ala Gly Pro
385 390 395 400
Gln Gly Lys Val Gly Pro Ser Gly Ala Pro Gly Glu Asp Gly Arg Pro
405 410 415
Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Gln Pro Gly Val Met Gly
420 425 430
Phe Pro Gly Pro Lys Gly Ala Asn Gly Glu Pro Gly Lys Ala Gly Glu
435 440 445
Lys Gly Leu Pro Gly Ala Pro Gly Leu Arg Gly Leu Pro Gly Lys Asp
450 455 460
Gly Glu Thr Gly Ala Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly
465 470 475 480
Glu Arg Gly Glu Gln Gly Ala Pro Gly Pro Ser Gly Phe Gln Gly Leu
485 490 495
Pro Gly Pro Pro Gly Pro Pro Gly Glu Gly Gly Lys Pro Gly Asp Gln
500 505 510
Gly Val Pro Gly Glu Ala Gly Ala Pro Gly Leu Val Gly Pro Arg Gly
515 520 525
Glu Arg Gly Phe Pro Gly Glu Arg Gly Ser Pro Gly Ala Gln Gly Leu
530 535 540
Gln Gly Pro Arg Gly Leu Pro Gly Thr Pro Gly Thr Asp Gly Pro Lys
545 550 555 560
Gly Ala Ser Gly Pro Ala Gly Pro Pro Gly Ala Gln Gly Pro Pro Gly
565 570 575
Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly Ile Ala Gly Pro
580 585 590
Lys Gly Asp Arg Gly Asp Val Gly Glu Lys Gly Pro Glu Gly Ala Pro
595 600 605
Gly Lys Asp Gly Gly Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly
610 615 620
Pro Ala Gly Ala Asn Gly Glu Lys Gly Glu Val Gly Pro Pro Gly Pro
625 630 635 640
Ala Gly Ser Ala Gly Ala Arg Gly Ala Pro Gly Glu Arg Gly Glu Thr
645 650 655
Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly
660 665 670
Gln Pro Gly Ala Lys Gly Glu Gln Gly Glu Ala Gly Gln Lys Gly Asp
675 680 685
Ala Gly Ala Pro Gly Pro Gln Gly Pro Ser Gly Ala Pro Gly Pro Gln
690 695 700
Gly Pro Thr Gly Val Thr Gly Pro Lys Gly Ala Arg Gly Ala Gln Gly
705 710 715 720
Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro
725 730 735
Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Pro Pro Gly Pro Ser
740 745 750
Gly Lys Asp Gly Pro Lys Gly Ala Arg Gly Asp Ser Gly Pro Pro Gly
755 760 765
Arg Ala Gly Glu Pro Gly Leu Gln Gly Pro Ala Gly Pro Pro Gly Glu
770 775 780
Lys Gly Glu Pro Gly Asp Asp Gly Pro Ser Gly Ala Glu Gly Pro Pro
785 790 795 800
Gly Pro Gln Gly Leu Ala Gly Gln Arg Gly Ile Val Gly Leu Pro Gly
805 810 815
Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu
820 825 830
Pro Gly Lys Gln Gly Ala Pro Gly Ala Ser Gly Asp Arg Gly Pro Pro
835 840 845
Gly Pro Val Gly Pro Pro Gly Leu Thr Gly Pro Ala Gly Glu Pro Gly
850 855 860
Arg Glu Gly Ser Pro Gly Ala Asp Gly Pro Pro Gly Arg Asp Gly Ala
865 870 875 880
Ala Gly Val Lys Gly Asp Arg Gly Glu Thr Gly Ala Val Gly Ala Pro
885 890 895
Gly Ala Pro Gly Pro Pro Gly Ser Pro Gly Pro Ala Gly Pro Thr Gly
900 905 910
Lys Gln Gly Asp Arg Gly Glu Ala Gly Ala Gln Gly Pro Met Gly Pro
915 920 925
Ser Gly Pro Ala Gly Ala Arg Gly Ile Gln Gly Pro Gln Gly Pro Arg
930 935 940
Gly Asp Lys Gly Glu Ala Gly Glu Pro Gly Glu Arg Gly Leu Lys Gly
945 950 955 960
His Arg Gly Phe Thr Gly Leu Gln Gly Leu Pro Gly Pro Pro Gly Pro
965 970 975
Ser Gly Asp Gln Gly Ala Ser Gly Pro Ala Gly Pro Ser Gly Pro Arg
980 985 990
Gly Pro Pro Gly Pro Val Gly Pro Ser Gly Lys Asp Gly Ala Asn Gly
995 1000 1005
Ile Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Arg Ser Gly Glu
1010 1015 1020
Thr Gly Pro Ala Gly Pro Pro Gly Asn Pro Gly Pro Pro Gly Pro Pro
1025 1030 1035 1040
Gly Pro Pro Gly Pro Gly Ile Asp Met Ser Ala Phe Ala Gly Leu Gly
1045 1050 1055
Pro Arg Glu Lys Gly Pro Asp Pro Leu Gln Tyr Met Arg Ala His His
1060 1065 1070
His His His His
1075
<210> 10
<211> 3231
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gaattctgga gtcatcctca attcgaaaaa caaatggctg gtggattcga tgaaaaggct 60
ggtggagccc aattaggtcc tccacaaggt cctcccggtc cacctggtcc tcccggtcct 120
ccaggtcccg ccggtgctcc tggaccacag ggtttccaag gaaaccccgg tgaaccaggt 180
gagcctggtg tttcaggtcc tcccggtcct ccaggaccac ctggaccacc aggaaagcct 240
ggtgacgacg gagaagctgg taaaccagga aaggcaggag agagaggtcc acctggacct 300
cagggtgcca gaggtttccc aggtacccct ggtcttcctg gtgtcaaggg tcatagaggt 360
taccccggtt tggatggtgc caagggtgaa gccggtgccc ctggtgttaa gggtgaatca 420
ggaagtcccg gtgaaaatgg aagtcccggt ccacccggtc cacctggact gccaggtgag 480
agaggaagaa ccggaccagc tggtgctgca ggtgctagag gaaatgacgg acagcccgga 540
ccagccggac ctcccggtcc tgttgggccc gcaggtggtc ctggtttccc tggtgctcct 600
ggagccaaag gagaagccgg acccaccgga gccagaggtc ccgagggagc acagggacct 660
agaggagaac caggtacacc aggtagtccc ggtcctgctg gtgcatcagg aaatcccgga 720
actgacggta ttccaggagc aaagggatct gcaggagcac caggaatagc tggtgctcct 780
ggatttccag gtcccagagg acctcccggt cctcaaggag caacaggtcc tttgggacca 840
aaaggtcaaa caggagaacc aggtattgct ggattcaaag gagagcaagg tccaaaggga 900
gagcccggtc ccgcaggtcc ccaaggagcc ccaggaccag ctggtgaaga aggaaaaaga 960
ggagccagag gtgaacctgg aggagtagga cctattggtc ctcctggtga gagaggtgct 1020
cccggaaaca gaggttttcc tggtcaagat ggtctggctg gacctaaagg tgctccagga 1080
gagagaggac cttcaggact tgctggtcca aaaggtgcta acggagatcc aggaagaccc 1140
ggtgaacctg gtctgcctgg agctagagga ttaacaggaa gaccaggtga cgcaggtccc 1200
cagggtaaag tgggtcccag tggtgcccca ggtgaagatg gaagacctgg tcctcccgga 1260
ccccaaggtg caagaggtca gcctggagtg atgggatttc ctggacccaa gggtgctaac 1320
ggagaacctg gaaaagctgg tgagaaagga ctgcccggtg ccccaggtct tagaggtttg 1380
ccaggtaaag atggagaaac aggagccgca ggaccacccg gtccagccgg accagcagga 1440
gagagaggtg aacaaggagc acctggtcca agtggttttc agggtcttcc aggtccccct 1500
ggtccaccag gagagggagg taaaccaggt gaccaaggtg tccctggaga agcaggtgca 1560
cccggtcttg tgggtccaag aggtgaaaga ggattccctg gtgagagagg atctcccgga 1620
gcccagggac ttcaaggtcc tagaggtctg ccaggtaccc ctggtacaga cggaccaaag 1680
ggagcatcag gacccgctgg acctcccgga gcccaaggtc ctccaggttt acaaggtatg 1740
cctggtgaaa gaggtgctgc aggtatagct ggaccaaaag gagacagagg tgacgttggt 1800
gagaagggtc ccgaaggagc ccctggaaaa gatggtggaa gaggattaac aggtcctata 1860
ggaccacccg gtccagccgg tgctaatgga gaaaaaggag aagtaggtcc tccaggtcca 1920
gcaggatctg caggtgctag aggtgcccct ggagagagag gtgaaacagg accacctggt 1980
ccagctggtt tcgctggtcc cccaggagct gatggacagc ccggtgcaaa aggtgaacaa 2040
ggagaagccg gacagaaggg agatgctgga gcccccggtc cacaaggtcc ctcaggagca 2100
ccaggtcctc aaggtccaac tggtgtgacc gggccaaagg gtgcaagagg agcacaggga 2160
cctccaggag caacaggttt cccaggagct gctggtagag tcggtccacc cggatctaat 2220
ggtaaccccg gaccaccagg accacctgga ccatctggaa aggatggacc caaaggagca 2280
agaggagatt caggaccacc cggaagagca ggagaacctg gattacaggg tcccgccggt 2340
ccaccaggag agaaaggaga gcccggagat gatggtccct caggtgcaga gggaccccca 2400
ggaccccaag gtctggcagg tcaaagaggt atagtgggtc ttccaggtca aagaggtgaa 2460
agaggatttc caggacttcc aggtccttca ggtgaacccg gtaaacaggg agcccccgga 2520
gcctcaggtg acagaggtcc tccaggacca gtaggacccc caggtttaac cggaccagca 2580
ggtgagccag gaagagaagg ttctcctgga gccgatggac ctccaggaag agacggtgca 2640
gctggtgtta agggtgacag aggtgaaact ggagccgtag gagccccagg tgcccccgga 2700
ccacccggat cacccggacc tgcaggtcct actggtaaac aaggagatag aggagaagcc 2760
ggtgcccagg gtcctatggg tccttctggt cctgcaggag caagaggtat acaaggtcca 2820
cagggtccca gaggtgacaa gggtgaagca ggagaacccg gtgagagagg tctgaagggt 2880
catagaggat tcaccgggtt acagggtttg ccaggacccc ctggaccaag tggtgaccag 2940
ggtgcatccg gtccagcagg tccttctgga ccaagaggtc ctcccggtcc agttggtcca 3000
tcaggtaaag acggagccaa cggtatccca ggtcccatcg gtcctccagg tcctagagga 3060
agaagtggag agactggtcc tgctggacct cctggaaacc ctggtcctcc aggacctcca 3120
ggtcctccag gtcccggaat agatatgtcc gctttcgctg gattgggacc aagagagaaa 3180
ggtcctgacc ctcttcaata tatgagagca caccatcacc atcatcacta a 3231

Claims (17)

1.重组胶原蛋白α1链,其特征在于,所述重组胶原蛋白α1链为α1(Ⅰ)M1或α1(Ⅱ)M6,所述α1(Ⅰ)M1由人Ⅰ型胶原蛋白α1链的天然全长氨基酸序列经过氨基酸突变获得,所述α1(Ⅱ)M6由人Ⅱ型胶原蛋白α1链天然全长氨基酸序列经过氨基酸突变获得;所述α1(Ⅰ)M1的序列如SEQ.NO.ID.2所示,所述α1(Ⅱ)M6的序列如SEQ.NO.ID.5所示。
2.编码权利要求1所述重组胶原蛋白α1链的核苷酸。
3.根据权利要求2所述的核苷酸,其特征在于,所述编码α1(Ⅰ)M1的核苷酸序列如SEQ.NO.ID.3所示;所述编码α1(Ⅱ)M6的核苷酸序列如SEQ.NO.ID.6所示。
4.重组表达载体,含有权利要求2所述的核苷酸。
5.工程菌,所述工程菌含有权利要求4所述的重组表达载体或表达权利要求1所述重组胶原蛋白α1链,所述工程菌为巴斯德毕赤酵母(Pichia pastoris)。
6.根据权利要求5所述的工程菌,其特征在于,所述工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为 CGMCC NO.21891或CGMCCNO. 21892,其中保藏编号为CGMCC NO.21891的工程菌表达的是重组α1(Ⅰ)M1胶原蛋白α1链,保藏编号为 CGMCCCGMCCNO. 21892的工程菌表达的是重组α1(Ⅱ)M6胶原蛋白α1链。
7.权利要求4所述的重组表达载体或权利要求5-6任一项所述的工程菌在制备所述重组胶原蛋白α1链中的应用。
8.权利要求1所述重组胶原蛋白α1链的制备方法,其特征在于,包括如下步骤:
(1)合成编码权利要求1所述重组胶原蛋白α1链的核苷酸序列;
(2)构建重组表达载体;
(3)构建工程菌、诱导表达和菌株筛选,得到表达量高的工程菌株;
(4)将筛选得到的表达量高的工程菌,高密度发酵培养;
(5)发酵上清液纯化后,冷冻干燥获得重组胶原蛋白α1链。
9.根据权利要求8所述的制备方法,其特征在于,所述表达量高的工程菌为巴斯德毕赤酵母(Pichia pastoris),保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为 CGMCC NO.21891或CGMCCNO. 21892。
10.组合物,其特征在于,所述组合物包含权利要求1所述重组胶原蛋白α1链或权利要求8-9任一项所述方法制备的重组胶原蛋白α1链。
11.制品,其特征在于,所述制品包含权利要求1所述重组胶原蛋白α1链、权利要求8-9任一项所述方法制备的重组胶原蛋白α1链或权利要求10所述的组合物,所述制品为药物、医疗器械、生物材料、组织工程产品或化妆品。
12.根据权利要求11所述的制品,其特征在于,所述制品为为细胞提供黏附、支撑、生长迁移空间的材料或作为输送营养物质与新陈代谢产物通道的材料。
13.根据权利要求12所述的制品,其特征在于,所述制品为胶原蛋白水凝胶。
14.权利要求1所述重组胶原蛋白α1链、权利要求2-3任一项所述的核苷酸、权利要求4所述的重组表达载体、权利要求5-6任一项所述的工程菌、权利要求8-9任一项所述方法制备的重组胶原蛋白α1链或权利要求10所述的组合物在制备制成品中的用途,所述制成品为药物、医疗器械、生物材料、组织工程产品或化妆品。
15.权利要求1所述重组胶原蛋白α1链、权利要求2-3任一项所述的核苷酸、权利要求4所述的重组表达载体、权利要求5-6任一项所述的工程菌、权利要求8-9任一项所述方法制备的重组胶原蛋白α1链或权利要求10所述的组合物在制备促进创伤修复或组织再生的产品中的用途。
16.根据权利要求14所述的用途,其特征在于,所述制成品为胶原蛋白水凝胶。
17.根据权利要求15所述的用途,其特征在于,所述产品为胶原蛋白水凝胶。
CN202111470250.8A 2021-12-03 2021-12-03 重组胶原蛋白、制备方法及其应用 Active CN114106150B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111470250.8A CN114106150B (zh) 2021-12-03 2021-12-03 重组胶原蛋白、制备方法及其应用
PCT/CN2022/133595 WO2023098523A1 (zh) 2021-12-03 2022-11-23 重组胶原蛋白、制备方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111470250.8A CN114106150B (zh) 2021-12-03 2021-12-03 重组胶原蛋白、制备方法及其应用

Publications (2)

Publication Number Publication Date
CN114106150A CN114106150A (zh) 2022-03-01
CN114106150B true CN114106150B (zh) 2022-08-16

Family

ID=80366732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111470250.8A Active CN114106150B (zh) 2021-12-03 2021-12-03 重组胶原蛋白、制备方法及其应用

Country Status (2)

Country Link
CN (1) CN114106150B (zh)
WO (1) WO2023098523A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114106150B (zh) * 2021-12-03 2022-08-16 江苏创健医疗科技有限公司 重组胶原蛋白、制备方法及其应用
CN116082493B (zh) * 2022-08-10 2023-11-07 江苏创健医疗科技股份有限公司 高稳定性重组胶原蛋白、构建方法及其应用
CN115154356B (zh) * 2022-09-07 2022-12-06 广州集妍化妆品科技有限公司 一组胶原蛋白组合在制备抗衰老产品中的应用以及包括其的外用化妆品
CN116948013B (zh) * 2023-04-28 2024-04-09 江苏创健医疗科技股份有限公司 重组小分子胶原蛋白及其表达系统与制备方法
CN116640206B (zh) * 2023-07-19 2023-10-10 山东福瑞达生物股份有限公司 一种重组人源化ⅲ型胶原蛋白及其制备方法和应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020098578A1 (en) * 1992-10-22 2002-07-25 Darwin J. Prockop Synthesis of human procollagens and collagens in recombinant dna systems
US6653450B1 (en) * 1993-01-28 2003-11-25 Cohesion Technologies, Inc. Mutated recombinant collagens
US5710252A (en) * 1995-02-03 1998-01-20 Eastman Kodak Company Method for recombinant yeast expression and isolation of water-soluble collagen-type polypeptides
EP1787995A1 (en) * 2005-11-17 2007-05-23 Technische Universität München Recombinant mussel byssus protein
CN103725622A (zh) * 2013-12-19 2014-04-16 西安巨子生物基因技术股份有限公司 一种转基因毕赤酵母基因工程菌及其构建方法与应用
CN106554410B (zh) * 2016-06-02 2019-11-26 陕西东大生化科技有限责任公司 一种重组人源胶原蛋白及其编码基因和制备方法
CN110029111A (zh) * 2019-01-30 2019-07-19 江苏悦智生物医药有限公司 毕赤酵母生产重组人源ⅱ型胶原蛋白单链的方法
CN109988234A (zh) * 2019-02-20 2019-07-09 江苏悦智生物医药有限公司 酵母重组人源I型胶原α1链蛋白、合成方法及其应用
CN110003324A (zh) * 2019-03-19 2019-07-12 江苏悦智生物医药有限公司 重组人源胶原蛋白及其应用
CN113683679B (zh) * 2021-09-15 2023-10-31 山西锦波生物医药股份有限公司 一种重组i型人源化胶原蛋白c1l6t及其制备方法和用途
CN114106150B (zh) * 2021-12-03 2022-08-16 江苏创健医疗科技有限公司 重组胶原蛋白、制备方法及其应用

Also Published As

Publication number Publication date
CN114106150A (zh) 2022-03-01
WO2023098523A1 (zh) 2023-06-08

Similar Documents

Publication Publication Date Title
CN114106150B (zh) 重组胶原蛋白、制备方法及其应用
KR102559311B1 (ko) 재조합 인간 xvii형 콜라겐, 제조방법 및 응용
CN110606896B (zh) 重组人源III型胶原蛋白α1链及其应用
US11396537B2 (en) Polypeptide, process for the production thereof and use thereof
AU2016101562A4 (en) Genetic recombinant human collagen, gene encoding the same, and preparation method thereof
CN112626074B (zh) 一种含羟脯氨酸修饰化的重组人iii型胶原蛋白成熟肽及其制备方法与应用
CN110845603B (zh) 人胶原蛋白17型多肽、其生产方法和用途
US11780905B2 (en) Preparation method for collagen hydrogel
CN114805551B (zh) 一种重组iii型胶原蛋白及其制备方法
CN115558612A (zh) 重组全长ⅲ型人源化胶原蛋白酵母工程菌株及构建方法
CN112521491B (zh) 一种用于制备水凝胶的胶原蛋白及其制备方法
CN114276435A (zh) 一种重组人源ⅲ型胶原蛋白及其应用
CN116082493B (zh) 高稳定性重组胶原蛋白、构建方法及其应用
CN116948013B (zh) 重组小分子胶原蛋白及其表达系统与制备方法
CN116333094B (zh) 一种重组人源化I型胶原蛋白α1及表达载体和应用
US20210079064A1 (en) Preparation of Type I Collagen-Like Fiber and Method for Regulating and Controlling the D-periodic of Fiber Thereof
CN110627889A (zh) 重组蜘蛛丝蛋白及其制备方法和产业化应用
CN116789804B (zh) 一种生物合成人体结构性材料的制备方法
CN118146354A (zh) 重组vii型胶原蛋白及其制备方法和应用
CN115960211A (zh) 一种重组人源ⅵ型胶原蛋白及其制备方法和应用
CN116082667A (zh) 一种可以使任意重组蛋白自组装成超分子胶体的方法
CN117069863A (zh) 一种无标签ogp自组装多肽及其制备方法、应用
CN117924522A (zh) 一种重组抗菌多肽及其制备方法和应用
CN116254212A (zh) 一种类丝弹性蛋白水凝胶的制备方法及其应用
CN117247942A (zh) 人源胶原蛋白的基因、该胶原蛋白的生产方法和检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 213163 No. 28, Shuanglong Road, Jintan District, Changzhou City, Jiangsu Province

Patentee after: Jiangsu Chuangjian Medical Technology Co.,Ltd.

Address before: 213163 No. 28, Shuanglong Road, Jintan District, Changzhou City, Jiangsu Province

Patentee before: Jiangsu chuangjian Medical Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder