CN116948013B - 重组小分子胶原蛋白及其表达系统与制备方法 - Google Patents

重组小分子胶原蛋白及其表达系统与制备方法 Download PDF

Info

Publication number
CN116948013B
CN116948013B CN202310481706.3A CN202310481706A CN116948013B CN 116948013 B CN116948013 B CN 116948013B CN 202310481706 A CN202310481706 A CN 202310481706A CN 116948013 B CN116948013 B CN 116948013B
Authority
CN
China
Prior art keywords
seq
collagen
sequence
recombinant
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310481706.3A
Other languages
English (en)
Other versions
CN116948013A (zh
Inventor
李佳佳
程鹏飞
刘慧敏
钱晨明
蒋雯雯
凡孝菊
李海航
钱松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Chuangjian Medical Technology Co ltd
Original Assignee
Jiangsu Chuangjian Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Chuangjian Medical Technology Co ltd filed Critical Jiangsu Chuangjian Medical Technology Co ltd
Priority to CN202310481706.3A priority Critical patent/CN116948013B/zh
Publication of CN116948013A publication Critical patent/CN116948013A/zh
Application granted granted Critical
Publication of CN116948013B publication Critical patent/CN116948013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/17Amino acids, peptides or proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/64Proteins; Peptides; Derivatives or degradation products thereof
    • A61K8/65Collagen; Gelatin; Keratin; Derivatives or degradation products thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Dermatology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Birds (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nutrition Science (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了重组小分子胶原蛋白及其表达系统与制备方法,属于合成生物学、基因工程与生物技术领域。本发明提供了多种Ⅲ型、XVII型胶原蛋白来源的重组小分子胶原蛋白,并成功表达;本发明建立了一个小分子胶原蛋白的表达体系和小分子胶原蛋白的制备方法,包括构建的专属底盘细胞和设计小分子胶原蛋白串联重复序列及重组载体。本发明的小分子胶原蛋白在透皮吸收与生物学活性上做到兼顾平衡,本发明的表达体系或方法使得小分子胶原蛋白的表达极大提升了产量;本发明的方案避免了体外使用蛋白酶酶切带来的成本及外源蛋白残留风险,同时也能缩短后续纯化工艺流程的时间及成本。

Description

重组小分子胶原蛋白及其表达系统与制备方法
技术领域
本发明涉及重组小分子胶原蛋白及其表达系统与制备方法,属于合成生物学、基因工程与生物技术领域。
背景技术
胶原蛋白(collagen),有多种生物学功能、良好的生物相容性、生物活性和可降解性等独特功能特征,是最为理想的生物材料来源,可广泛应用于化工、医药、食品、化妆品等众多领域,具有广阔的应用前景。现在市场中以动物源性的胶原蛋白占主导地位,近几年基因工程制备的重组重组胶原蛋白开始兴起,但无论是动物源性胶原蛋白还是重组胶原蛋白,多为长氨基酸序列、大分子量的蛋白质,动物源性胶原蛋白分子量一般为100~300KDa及以上,重组胶原蛋白分子量一般也都在20KDa以上(200个氨基酸以上),以50KDa居多。这样大分子量的胶原蛋白作为生物材料应用于组织再生修复、植入类的医疗器械、导入类的医美产品都是适宜的,但并不适合于一些需要透皮吸收的应用场景。
动物源性来源的分子量比较小的胶原蛋白多为小分子胶原多肽,在需要透皮吸收的应用场景中使用较多,如水产品来源的小分子胶原蛋白多肽,但这些产品多以酶解、水解、酸碱降解等方式制备获得,所获得的小分子胶原蛋白多肽并不是一种氨基酸序列、分子量明确、大小单一的小分子蛋白,而是一种统称,分子量从极小的几肽到一定氨基酸序列长度的小分子胶原多肽均有分布,几乎无法确知种类、数目时,氨基酸序列也是随机的(未知的),不同批次制备的小分子胶原多肽的质量也基本上随机的,其氨基酸序列、分子量大小均分布、比例均无法控制。综上,现有小分子胶原种类的产品,研究也较多,但多为动物源胶经过处理(酶解、水解)后获得的复合物,有用于透皮吸收相关的应用,但氨基酸序列、分子量、批次间差异等均不可有效控制。
申请号CN202211579848.5的专利,公开了一种小分子重组胶原蛋白肽及其制备方法,本质是仍是一种类似于动物源小胶原肽的制备方法,获得的小分子重组胶原蛋白肽是很多种氨基酸序列不同、分子量大小不同(只能计算其平均分子量)的胶原蛋白多肽的混合物,并不是一种氨基酸序列、分子量明确单一的重组小分子胶原蛋白(多肽)。而其它现有重组小分子胶原蛋白多肽,难以做到小分子量与生物学活性的平衡。合成生物学、基因工程制备的重组胶原蛋白多为中、大分子量的产品(有一部分研发成果称为多肽,但氨基酸数目已远大于100个,已不属于小分子的范畴),只有极少数重组小分子胶原多肽的研究成果,其重组胶原蛋白的氨基酸序列分子量比较小。胶原蛋白作为一种活性物质,需要一定的氨基酸序列和序列长度才能支撑其生物学活性,即小分子量与生物学活性需要达到一种平衡的状态方有意义,而现有小分子的重组胶原多肽却没有相应的证据表明其有好的生物学活性。
其它的小分子蛋白质或多肽在进行重组表达时相同,重组小分子胶原蛋白整体氨基酸数目少、分子量小,在基因重组表达系统中,尤其是真核表达体系(比如毕赤酵母表达体系、哺乳动物细胞表达体系)中,其表达效率、产量受到极大的限制。有一些技术手段,比如串联表达提高基因拷贝数,但往往会在小分子蛋白质或多肽上引入非必要的氨基酸。胶原蛋白是一种特殊的蛋白质,其典型的特征是其氨基酸序列为G-X-Y三联体重复结构,引入非必要的氨基酸往往会破坏这种三联体重复结构,影响其功能活性等。
现有重组小分子胶原蛋白或多重组小分子胶原多肽的研究很少,明确的重组小分子胶原蛋白的产品基本处于空白,并且表达量的问题涉及更少。有研究使用融合前导肽的方法提高小分子蛋白质的表达量,如公开号为CN108148114B的专利,但需要表达的小分子蛋白质于体外(细胞)使用蛋白酶酶切才能去除前导肽,在表达产物中人为引入了外源性的蛋白,增加后续纯化工艺的步骤、成本,也会带来外源蛋白残留的风险。另外有一些研究使用小分子蛋白质串联表达的方法来提高表达效率以达到提高产量的目的,比如CN110305890A,使用对5种抗菌肽串联表达重组,但使用的是甲酸切割串联的多肽,切割位点只能位DP两个氨基酸残基之间,设计空间受限,且切割后DP也无法有效去除,成为非自身氨基酸,同样属于人为引入了外源性蛋白。这些方案也未见其用于重组小分子胶原蛋白的表达生产。
所以,该技术领域关于重组小分子胶原蛋白的表达,需要做到小分子量、具有生物学活性、可规模化的量产、表达量高且其氨基序列与分子量需单一明确而非混合物等多方面的平衡,亟需一种有效的解决方式。
发明内容
本发明的目的在于,克服现有技术中存在的一些技术问题,提供一种重组小分子胶原蛋白、其表达系统及其制备方法。
为实现上述目的,本发明采用了以下技术方案:
本发明首先提供了一种重组小分子胶原蛋白,所述重组小分子胶原蛋白包括SEQID NO.1、SEQ ID NO.3、SEQ ID NO.5、SEQ ID NO.7、SEQ ID NO.63或SEQ ID NO.67所示的氨基酸序列、或与SEQ ID NO.1、SEQ ID NO.3、SEQ ID NO.5、SEQ ID NO.7、SEQ ID NO.63或SEQ ID NO.67具有80%以上、85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上同一性的氨基酸序列,并维持胶原蛋白生物学活性。
进一步的,所述重组小分子胶原蛋白的羧基端有多个His,可形成6×His Tag标签。
进一步的,所述重组小分子胶原蛋白包括SEQ ID NO.2、SEQ ID NO.4、SEQ IDNO.6或SEQ ID NO.8所示的氨基酸序列、或与SEQ ID NO.2、SEQ ID NO.4、SEQ ID NO.6或SEQ ID NO.8具有80%以上、85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上同一性的氨基酸序列,并维持胶原蛋白生物学活性。
本发明还提供了一种编码所述重组小分子胶原蛋白的核酸。
进一步的,所述核酸包括SEQ ID NO.9-16所示的核苷酸序列、或其简并序列。
本发明还提供了一种包含所述核酸的重组载体,所述载体包括pPICZαB、pFLDα、pPIC9K,连接位点为Kex2酶切位点序列与NotI酶切位点之间。
本发明还提供了一种包含所述核酸、或包含所述的重组载体、或表达所述重组小分子胶原蛋白的重组工程菌。
进一步的,所述工程菌的宿主菌包括毕赤酵母、酿酒酵母、汉逊酵母等,优选毕赤酵母。
根据本发明的实施例,所述工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为CGMCC No.25811、CGMCC No.25823、CGMCC No.25812、CGMCCNo.25824、CGMCC No.25825、CGMCC No.25813、CGMCC No.25826、CGMCC No.25814。
本发明还提供重组小分子胶原蛋白的串联重复表达序列,所述串联重复表达序列以所述的重组小分子胶原蛋白、或人工设计的具有典型的G-X-Y三联体结构的胶原蛋白、或以人胶原蛋白序列的两个或多个区域组合的蛋白为基础单元串联重复;所述串联重复表达序列中每相邻的2个所述重组小分子胶原蛋白之间有Kex2酶、CPB酶识别切割的位点,还可以同时有Ste13酶的识别、切割的位点。
所述串联重复表达序列包括SEQ ID NO.30、SEQ ID NO.33、SEQ ID NO.36、SEQ IDNO.39、SEQ ID NO.42、SEQ ID NO.45、SEQ ID NO.48、SEQ ID NO.51、SEQ ID NO.54、SEQ IDNO.57、SEQ ID NO.60、SEQ ID NO.64、SEQ ID NO.68所示序列、或与上述具有80%以上、85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上同一性的氨基酸序列。
根据本发明的实施例,所述Kex2酶识别和切割的位点包括KR或RR双碱性氨基酸残基,双碱性氨基酸残基之后,是EA、EAEA或其它有有助于Kex2酶或Ste 13酶识别和切割的氨基酸残基。
根据本发明的实施例,所述CPB酶识别和切割的位点包括蛋白羧基末端的碱性氨基酸残基,包括K、R。
根据本发明的实施例,所述串联重复的小分子胶原蛋白单体(或片段)的氨基酸序列可以是任一序列,其氨基酸残基的具体排序、序列长度、单体(或片段)串联重复的次数不受限制,但需具有典型的G-X-Y三联体结构。
本发明还提供一种编码所述串联重复表达序列的核酸,进一步的,所述核酸包括SEQ ID NO.71-81所示序列、或其简并序列。
本发明还提供一种包含编码所述串联重复表达序列的核酸的重组载体。根据本发明的实施例,所述载体包括但不限于pPICZαB、pFLDα、pPIC9K等表达载体。
本发明还提供包含所述核酸、或重组载体的工程菌。
根据本发明的实施例,所述工程菌的宿主菌包括毕赤酵母、酿酒酵母、汉逊酵母等,优选毕赤酵母。根据本发明的实施例,所述工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCC No.25819、CGMCC No.25821、CGMCC No.25827、CGMCC No.25829、CGMCC No.25828、CGMCC No.25820、CGMCC No.25822。
本发明还提供了一种获得重组小分子胶原蛋白的方法,所述方法包括:
构建本发明所述的重组小分子胶原蛋白的串联重复表达序列;
构建定位融合功能蛋白,将定位融合功能蛋白连接载体转化宿主菌得到底盘细胞或底盘工程菌;
将重组小分子胶原蛋白的串联重复表达序列连接到表达载体后转入底盘细胞或底盘工程菌中,得到包含或表达重组小分子胶原蛋白的重组工程菌,发酵诱导表达,得到重组小分子胶原蛋白。
根据本发明的实施例,所述定位融合功能蛋白包括CPB酶、有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域。
进一步的,所述定位融合功能蛋白还包括连接序列,所述连接序列用于CPB酶与有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列融合表达时的连接。优选的,所述连接序列为Linker序列,如SEQ ID NO.21所示:GGSGSGSGGS。
根据本发明的实施例,优选的,所述CPB酶来源于人或大鼠;所述CPB酶序列如SEQID NO.17-18所示。
所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列来源于酿酒酵母或毕赤酵母的Kex2酶、或其它有类似功能的蛋白质功能区域如Ste13蛋白酶。
进一步的,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列如SEQ ID NO.19-20所示。
根据本发明的实施例,所述串联重复表达序列中每相邻的2个所述重组小分子胶原蛋白之间有Kex2酶、CPB酶的识别、切割的位点,还可以包括Ste13酶的识别、切割的位点;所述小分子胶原蛋白优选本发明所述的重组小分子胶原蛋白。
根据本发明的实施例,所述Kex2酶识别和切割的位点包括KR或RR双碱性氨基酸残基,双碱性氨基酸残基之后,是EA、EAEA或其它有有助于Kex2酶或Ste 13酶识别和切割的氨基酸残基。
根据本发明的实施例,所述CPB酶识别和切割的位点包括蛋白羧基末端的碱性氨基酸残基,包括K、R。
进一步的,所述重组小分子胶原蛋白具有典型的G-X-Y三联体结构;优选的,所述小分子胶原蛋白为本发明所述的重组小分子胶原蛋白、或人工设计的具有典型的G-X-Y三联体结构的胶原蛋白、或以人胶原蛋白序列的两个或多个区域组合的胶原蛋白。。
根据本发明的实施例,所述载体包括但不限于pPICZαB、pFLDα、pPIC9K等表达载体。
根据本发明的实施例,所述包含或表达重组小分子胶原蛋白的重组工程菌的重组工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCCNo.25819、CGMCCNo.25821、CGMCC No.25827、CGMCC No.25828、CGMCC No.25829、CGMCCNo.25820、CGMCCNo.25822。
根据本发明的实施例,上述的方法表达得到的重组小分子胶原蛋白,包括SEQ IDNO.32、SEQ ID NO.35、SEQ ID NO.38、SEQ ID NO.41、SEQ ID NO.44、SEQ ID NO.47、SEQ IDNO.50、SEQ ID NO.53、SEQ ID NO.56、SEQ ID NO.59、SEQ ID NO.62、SEQ ID NO.66、或SEQID NO.70所示的氨基酸序列或与SEQ ID NO.32、SEQ ID NO.35、SEQ ID NO.38、SEQ IDNO.41、SEQ ID NO.44、SEQ ID NO.47、SEQ ID NO.50、SEQ ID NO.53、SEQ ID NO.56、SEQ IDNO.59、SEQ ID NO.62、SEQ ID NO.66、或SEQ ID NO.70具有80%以上、85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上同一性的氨基酸序列。
本发明还提供一种定位融合功能蛋白,所述定位融合功能蛋白用于串联重复的多个重组小分子胶原蛋白被Kex2酶切割为单体后其C端碱性氨基酸残基(K、R)的切割去除。
所述定位融合功能蛋白包括CPB酶成熟肽序列、有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列。
进一步的,所述定位融合功能蛋白还包括连接序列,所述连接序列用于CPB酶与有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列融合表达时的连接。
根据本发明的实施例,所述CPB酶来源于人或大鼠;进一步的,所述CPB酶优选SEQID NO.17-18所示的序列。
根据本发明的实施例,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列来源于酿酒酵母或毕赤酵母的Kex2酶、或其它有类似功能的蛋白质功能区域如Ste13蛋白酶。
进一步的,所述CPB酶序列如SEQ ID NO.17-18所示;所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列如SEQ ID NO.19-20所示。
根据本发明的实施例,所述连接序列为Linker序列,如SEQ ID NO.21所示:GGSGSGSGGS。
根据本发明的实施例,所述定位融合功能蛋白包括如SEQ ID NO.22、SEQ IDNO.24、SEQ ID NO.26或SEQ ID NO.28所示的氨基酸序列或与SEQ ID NO.22、SEQ IDNO.24、SEQ ID NO.26或SEQ ID NO.28具有80%以上、85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上同一性的氨基酸序列。
本发明还提供编码本发明所述定位融合功能蛋白的核酸。
根据本发明的实施例,所述编码本发明所述定位融合功能蛋白的核酸包括SEQ IDNO.23、SEQ ID NO.25、SEQ ID NO.27或SEQ ID NO.29所示的核苷酸序列、或其简并序列。
本发明还提供一种包含编码本发明所述定位融合功能蛋白的核酸的重组载体。
根据本发明的实施例,所述载体包括但不限于pPICZαB、pFLDα、pPIC9K等表达载体,连接位置为Kex2酶切位点序列与载体上终止密码子“TGA”之间。
本发明还提供一种底盘细胞或底盘工程菌,所述底盘细胞或底盘工程菌包含所述编码本发明定位融合功能蛋白的核酸、或包含编码本发明所述定位融合功能蛋白的核酸的重组载体、或表达所述定位融合功能蛋白。
根据本发明的实施例,所述工程菌的宿主菌包括毕赤酵母、酿酒酵母、汉逊酵母等,优选毕赤酵母;所述构建的底盘细胞或工底盘程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCC No.25815、CGMCC No.25817、CGMCC No.25816、CGMCC No.25818。
本发明还提供一种重组小分子胶原蛋白的表达系统,所述表达系统包括所述定位融合功能蛋白、所述底盘细胞或底盘工程菌、所述重组小分子胶原蛋白的串联重复表达序列。
本发明还提供所述定位融合功能蛋白、所述底盘细胞或底盘工程菌、所述重组小分子胶原蛋白的串联重复表达序列在表达重组小分子胶原蛋白中的应用。
本发明所述的重组小分子胶原蛋白、或上述获得小分子胶原蛋白的方法表达得到的小分子胶原蛋白具有细胞粘附活性、促细胞增殖活性、良好的皮肤渗透性。
本发明还提供所述重组小分子胶原蛋白、或所述核酸、或所述重组载体、或所述的宿主细胞或重组工程菌、或所述的组合物、或所述的制品在制备药物、医疗器材、生物材料、组织工程产品、化妆品或保健品中的用途。
本发明的有益效果:
(1)本发明首先提供了多种Ⅲ型、XVII型胶原蛋白来源的重组小分子胶原蛋白,并表达了多种Ⅲ型、XVII型胶原蛋白来源的重组小分子胶原蛋白,其氨基酸序列长度、分子量大小虽不相同,都可表达获得为条带单一、氨基酸序列明确的小分子胶原蛋白,同时都有很好的透皮吸收性、生物学活性,在小分子与透皮吸收及生物学活性上做到兼顾平衡。进一步的在500L级的发酵罐上实现了规模化量产,使重组小分子胶原蛋白的大量应用成为可能。解决了重组小分子胶原蛋白现有的产品缺失的问题,尤其是Ⅲ型、XVII型胶原蛋白来源的重组小分子胶原蛋白。
(2)本发明建立了一个重组小分子胶原的表达体系和小分子胶原的制备方法,包括构建了专属的底盘细胞和胶原蛋白串联重复序列设计方法。本发明的技术方案使得小分子胶原蛋白的表达极大提升了产量;本发明的技术方案不引入外源蛋白质、不使用任何的体外酶切的方式,小分子胶原蛋白在细胞内分泌的过程中,就会去除重复串联设计时酶切位点的残留氨基酸残基,获得无非胶原序列或与天然胶原蛋白相应区域同源性100%的重组小分子胶原蛋白;整个表达体系避免了体外使用蛋白酶酶切带来的成本及外源蛋白残留风险,同时也能缩短后续纯化工艺流程的时间及成本。
本发明取得的小分子胶原蛋白进行了N、C端及全序列测序验证,证明整个表达体系,尤其是底盘细胞工程菌作为宿主菌表达重组小分子胶原的有效性;进一步以500L级发酵罐进行了具有大规模工业化生产可能性的发酵、纯化验证,结果表明重复串联表达策略构建的表达体系可以提升重组小分子胶原蛋白的产量4-5倍。
(3)对本发明的重组小分子的细胞粘附活性、促细胞增殖活性及透皮吸收性进行了检测,结果表明,重组小分子胶原除去具有良好的透皮吸收性外,还有不弱于天然胶原蛋白及同源的大分子量重组胶原的细胞粘附活性,有促细胞增殖的活性。
附图说明
图1为8种重组小分子胶原蛋白3A5D1NT、3A5D1、3A5D2NT、3A5D2、17S1NNT、17S1N、17S3NT、17S3纯化后进行Tricine-PAGE检测的结果。
图2为本发明表达得到的重组小分子胶原蛋白3A5D1NT、3A5D1经LC-MS分析获取的其去卷积分子量结果。
图3为本发明表达得到的重组小分子胶原蛋白3A5D2经LC-MS分析获取的其去卷积分子量结果。
图4为本发明表达得到的重组小分子胶原蛋白17S1NNT、17S1N经LC-MS分析获取的其去卷积分子量结果。
图5为本发明表达得到的重组小分子胶原蛋白17S3NT、17S3经LC-MS分析获取的其去卷积分子量结果。
图6为3A5D1、3A5D2、17S1N、17S3羧基端6×His标签用抗6×His Tag的抗体进行Western Blot检测的结果;图中,+为阳性对照,-为阴性对照。
图7为本发明实施例1中重组小分子胶原蛋白3A5D1、3A5D1NT冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图8为本发明实施例1中重组小分子胶原蛋白3A5D2、3A5D2NT冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图9为本发明实施例1中重组小分子胶原蛋白17S1N、17S1NNT冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图10为本发明实施例1中重组小分子胶原蛋白17S3、17S3NT冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图11为本发明中重组表达载体pPICZαB-RCPB-SCKEX2的图谱。
图12为本发明中重组表达载体pPICZαB-HCPB-SCKEX2的图谱。
图13为本发明中重组表达载体pPICZαB-RCPB-PPKEX2的图谱。
图14为本发明中重组表达载体pPICZαB-HCPB-PPKEX2的图谱。
图15为CPB定位融合功能蛋白HCPB-PPKEX2、HCPB-SCKEX2、RCPB-PPKEX2、RCPB-SCKEX2在胞内裂解液和培养上清中表达的检测结果;
左图中泳道,1:HCPB-SCKEX2菌体裂解液;2:HCPB-SCKEX2菌培养上清;3、6:HCPB-PPKEX2培养上清;4、5:HCPB-PPKEX2菌体裂解液;(-):阴性对照;(+):阳性对照,重组人CPB酶;/:无样品孔。
右图中泳道,(-):阴性对照;(+):阳性对照,重组大鼠CPB酶;/:无样品孔;7:RCPB-SCKEX2菌培养上清;8:RCPB-SCKEX2菌体裂解液;9、10、12、13:RCPB-PPKEX2培养上清;11、14:RCPB-PPKEX2菌体裂解液。
图16为3A5D29N-9和17S28-8分别于HCPB-PPKEX2和RCPB-PPKEX2底盘细胞工程菌株表达上清SDS-PAGE检测结果;
图中各泳道为,1:3A5D29N-9于HCPB-PPKEX2底盘细胞工程菌株中表达上清;2:3A5D29N-9于RCPB-PPKEX2底盘细胞工程菌株中表达上清;3:17S28-8于HCPB-PPKEX2底盘细胞工程菌株中表达上清;4:17S28-8于RCPB-PPKEX2底盘细胞工程菌株中表达上清。
图17为17S1N6-6、17S1N7-7和17S1NK-7分别于HCPB-PPKEX2和RCPB-PPKEX2底盘细胞工程菌株表达上清SDS-PAGE检测结果;
图中各泳道为,1:17S1N6-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清;2:17S1N6-6于RCPB-PPKEX2底盘细胞工程菌株中表达上清;3:17S1N7-7于HCPB-PPKEX2底盘细胞工程菌株中表达上清;4:17S1N7-7于RCPB-PPKEX2底盘细胞工程菌株中表达上清;5:17S1NK-7于HCPB-PPKEX2底盘细胞工程菌株中表达上清;6:17S1NK-7于RCPB-PPKEX2底盘细胞工程菌株中表达上清;(-):阴性对照,pPIC9K空载体转入HCPB-PPKEX2底盘细胞工程菌株中表达上清。
图18为3A5D15D-5、3A5D15E-5、3A5D15G-6和3A5D15EKR-6分别于RCPB-PPKEX2底盘细胞工程菌株表达上清,和3A5D15R-6于HCPB-RPKEX2底盘细胞工程菌株中表达上清SDS-PAGE检测结果;
图中各泳道为,1:3A5D15D-5于RCPB-PPKEX2底盘细胞工程菌株中表达上清;2:3A5D15E-5于RCPB-PPKEX2底盘细胞工程菌株中表达上清;3:3A5D15G-6于RCPB-PPKEX2底盘细胞工程菌株中表达上清;4:3A5D15EKR-6于RCPB-PPKEX2底盘细胞工程菌株中表达上清;5:3A5D15KR-6于RCPB-PPKEX2底盘细胞工程菌株中表达上清;6:3A5D15R-6于HCPB-RPKEX2底盘细胞工程菌株中表达上清;(-):阴性对照,pPIC9K空载体转入RCPB-RPKEX2底盘细胞工程菌株中表达上清。
图19为3A5D15D-5、3A5D15E-5、3A5D15G-6、A5D15EKR-6、3A5D15KR-6、3A5D15R-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清SDS-PAGE检测结果;
图中各泳道为,1:3A5D15D-5于HCPB-PPKEX2底盘细胞工程菌株中表达上清;2:3A5D15E-5于HCPB-PPKEX2底盘细胞工程菌株中表达上清;3:3A5D15G-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清;4:3A5D15EKR-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清;5:3A5D15KR-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清;6:3A5D15R-6于HCPB-PPKEX2底盘细胞工程菌株中表达上清。
图20为3A5D29N、33A5D15D的冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图21为17S28、17S1N6的冻干品用胰蛋白酶酶解后的肽段经Nano-HPLC-MS/MS质谱检测后与原序列比对的结果。
图22为3A5D29N、17S28经LC-MS分析获取的其去卷积分子量结果。
图23为HCPB-PPKEX2和RCPB-PPKEX2底盘细胞工程菌株中表达的重组小分子胶原蛋白3A5D29N的C端肽段的二级质谱图。
图24为HCPB-PPKEX2和RCPB-PPKEX2底盘细胞工程菌株中表达的重组小分子胶原蛋白17S28的C端肽段的二级质谱图。
图25表达3A5D2NT和表达3A5D29N的工程菌株诱导一定时间后的发酵液上清SDS-PAGE检测结果。
图中各泳道为,泳道1:表达3A5D2NT的工程菌株(CGMCC No.25812)诱导48h时发酵液上清;泳道2:表达3A5D29N的工程菌株(CGMCC No.25819)诱导43h时发酵液上清。
图26为重组小分子胶原蛋白3A5D29N、3A5D2NT、3A5D1NT、17S1NNT、17S3NT、17S28、重组Ⅲ型胶原蛋白、重组XVII型胶原蛋白和天然人胶原蛋白的细胞黏附活性对比结果。
图27为重组小分子胶原蛋白3A5D29N、17S28促细胞增殖作用的验证结果。
图28为1mg/mL的重组小分子胶原蛋白3A5D29N、重组Ⅲ型胶原蛋白、水解透明质酸、鱼皮胶原于涂抹1h时全层皮肤模型组织中的检测的荧光IOD平均值,其中*表示与1mg/mL重组小分子胶原蛋白3A5D29N相比的显著性(*表示差异显著P<0.05,**表示差异极显著P<0.01),#表示与重组Ⅲ型胶原蛋白相比的显著性(#表示差异显著P<0.05,##表示差异极显著P<0.01)。
图29为不同浓度重组小分子胶原蛋白3A5D29N及1mg/mL的水解透明质酸涂抹12h于渗透至培养液中的样品扩散百分比(即累积渗透率),其中2#代表重组小分子胶原蛋白3A5D29N,4#代表水解透明质酸。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案,下面对本发明的较佳实施例进行详细的阐述,但是如下实施例并不限制本发明的保护范围。
本发明的实施例中,没有多作说明的都是采用常规实验方法完成,实施例中所涉及过程没有多作说明的都是本领域技术人员根据产品说明书或本领域基础知识可以理解并且容易实现的,因此不再详细描述。
实施例1:重组小分子胶原蛋白单序列重组表达
(1)重组小分子胶原蛋白单序列重组表达策略的氨基酸序列设计
选择人Ⅲ型胶原蛋白全长(包含N前肽、成熟肽链、C前肽)序列(参照Uniprot数据库中ID为P02461的蛋白质序列,https://www.uniprot.org/uniprotkb/P02461)的第990-1085位氨基酸序列,将此段序列表达获得的重组小分子胶原蛋白命名为3A5D1NT,共96个氨基酸,理论分子量8596.08Da,其序列如SEQ ID NO.1所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAG PAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGH
在3A5D1NT序列的羧基端添加5个组氨酸(H),将此段序列表达获得的重组小分子胶原蛋白命名为3A5D1,共101个氨基酸,理论分子量9281.78Da,其序列如SEQ ID NO.2所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAG PAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHHHHHH
选择人Ⅲ型胶原蛋白全长(包含N前肽、成熟肽链、C前肽)序列(参照Uniprot数据库中ID为P02461的蛋白质序列,https://www.uniprot.org/uniprotkb/P02461)第1036-1085位氨基酸序列,将此段序列表达获得的重组小分子胶原蛋白命名为3A5D2NT,共50个氨基酸,理论分子量为4532.83Da,其序列如SEQ ID NO.3所示:
GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGH
在3A5D2NT序列的羧基端添加5个组氨酸(H),将此段序列表达获得的重组小分子胶原蛋白命名为3A5D2,共55个氨基酸,理论分子量5218.54Da,其序列如SEQ ID NO.4所示:
GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHHHHHH
选择人XVII胶原蛋白序列全长序列(参照Uniprot数据库中ID为Q9UMD9-1的蛋白质,https://www.uniprot.org/uniprot/Q9UMD9)中第636-718位氨基酸,将此段序列表达获得的重组小分子胶原蛋白命名为17S1NNT,共82个氨基酸,理论分子量为7483.28Da,其序列如SEQ ID NO.5所示:
GPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGP
在17S1NNT序列的羧基端添加6个组氨酸(H),将此段序列表达获得的重组小分子胶原蛋白命名为17S1N,共88个氨基酸,理论分子量8306.13Da,其序列如SEQ ID NO.6所示:
GPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPHHHHHH
选择人XVII胶原蛋白序列全长序列(参照Uniprot数据库中ID为Q9UMD9-1的蛋白质,https://www.uniprot.org/uniprot/Q9UMD9)中第659-717位氨基酸,将此段序列表达获得的重组小分子胶原蛋白命名为17S3NT,共59个氨基酸,理论分子量为5406.08Da,其序列如SEQ ID NO.7所示:
GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGP
在17S3NT序列的羧基端添加6个组氨酸(H),将此段序列表达获得的重组小分子胶原蛋白命名为17S3,共65个氨基酸,理论分子量6228.93Da,其序列如SEQ ID NO.8所示:
GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPHHHHHH
(2)重组小分子胶原蛋白单序列重组表达策略的重组表达载体、工程菌株的构建
编码3A5D1NT的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQID NO.9所示:
gacgggaacccagggagtgatggcctgccaggacgcgatggctccccgggagggaagggggaccggggcgaaaatggttcgcccggagcgccgggtgctcctggtcaccctggtccgcccgggcctgtcggaccagccggcaaatctggcgatcgaggagagagcggcccagctggtcccgctggggcaccaggtccggctgggtcaaggggtgcacctggccctcagggacccagaggagacaagggcgagaccggtgaacgtggagccgcgggtattaaaggtcactaa
编码3A5D1的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQ IDNO.10所示:
gacgggaacccagggagtgatggcctgccaggacgcgatggctccccgggagggaagggggaccggggcgaaaatggttcgcccggagcgccgggtgctcctggtcaccctggtccgcccgggcctgtcggaccagccggcaaatctggcgatcgaggagagagcggcccagctggtcccgctggggcaccaggtccggctgggtcaaggggtgcacctggccctcagggacccagaggagacaagggcgagaccggtgaacgtggagccgcgggtattaaaggtcaccatcatcatcaccactaa
编码3A5D2NT的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQID NO.11所示:
gaggcagggaagtccggtgacaggggggagagcggacctgctggtcctgctggagccccgggtcctgctggctctcgcggcgcgccag gaccgcaaggcccacgtggtgataaaggagaaacaggggaaagaggggccgcaggtattaaaggtcactaa
编码3A5D2的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQ IDNO.12所示:
gaggcagggaagtccggtgacaggggggagagcggacctgctggtcctgctggagccccgggtcctgctggctctcgcggcgcgccag gaccgcaaggcccacgtggtgataaaggagaaacaggggaaagaggggccgcaggtattaaaggtcaccatcaccatcatcactaa
编码17S1NNT的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQID NO.13所示:
gaggccggccctccaggttcgggcgagaaaggggaaagaggggcggcaggagaacccggaccccacggtcctcctggagtcccgggttccgtaggcccaaaaggcagctctggaagtccggggccacaagggcctccaggccccgttggtttacagggtctacgcggcgaagtgggattgccaggggtaaagggcgacaagggtccgatgggacctcccggtcctaagggtgatcaaggggagaaaggaccgtaa
编码17S1N的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQ IDNO.14所示:
gaggccggccctccaggttcgggcgagaaaggggaaagaggggcggcaggagaacccggaccccacggtcctcctggagtcccgggttccgtaggcccaaaaggcagctctggaagtccggggccacaagggcctccaggccccgttggtttacagggtctacgcggcgaagtgggattgccaggggtaaagggcgacaagggtccgatgggacctcccggtcctaagggtgatcaaggggagaaaggaccgcatcaccaccatcatcattaa
编码17S3NT的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQID NO.15所示:
gaagccggtgtccctggctctgttggaccgaagggtagttcgggaagcccagggcctcaggggccgcccggacccgtaggtctgcaggggctcagaggagaggtgggcctacctggcgtcaagggcgacaaaggtccaatggggccgcctggaccaaaaggggatcaaggtgaaaaaggcccctaa
编码17S3的DNA序列以毕赤酵母为宿主进行密码子优化,优化后的序列如SEQ IDNO.16所示:
gaagccggtgtccctggctctgttggaccgaagggtagttcgggaagcccagggcctcaggggccgcccggacccgtaggtctgcaggggctcagaggagaggtgggcctacctggcgtcaagggcgacaaaggtccaatggggccgcctggaccaaaaggggatcaaggtgaaaaaggcccccaccatcatcaccatcactaa
DNA序列SEQ ID NO.9~SEQ ID NO.16均由南京金斯瑞生物科技有限公司合成。将合成的基因克隆于pPIC9K表达载体(赛默飞世尔科技(中国)有限公司)上,克隆位置为α-factor secretion signal(分泌信号肽)序列中Kex2酶切位点序列(Kex2酶切位点末端DNA序列为AAAGAAGAAGGGGTATCTCTCGAGAAAAGA)与NotI酶切位点之间。获得重组表达载体pPIC9K-3A5D1NT、pPIC9K-3A5D1、pPIC9K-3A5D2NT、pPIC9K-3A5D2、pPIC9K-17S1NNT、pPIC9K-17S1N、pPIC9K-17S3NT、pPIC9K-17S3。理论而言,其它可用于毕赤酵母的表达载体如pPICZαB、pFLDα也与pPIC9K有类似的效果,相应重组表达载体均在本发明保护范围之内。
分别将上述重组表达载体质粒(pPIC9K-3A5D1NT、pPIC9K-3A5D1、pPIC9K-3A5D2NT、pPIC9K-3A5D2、pPIC9K-17S1NNT、pPIC9K-17S1N、pPIC9K-17S3NT、pPIC9K-17S3)10μg用SacⅠ(购自大连TaKaRa公司,具体操作按试剂盒说明书进行)37℃酶切消化过夜,使其线性化,再使用PCR产物纯化试剂盒(购自生工生物工程(上海)股份有限公司)回收线性化质粒,使体积控制在10μL左右。
将线性化质粒电转化入空宿主菌种毕赤酵母GS115(购自中国工业微生物菌种保藏管理中心)感受态细胞中,将电转后的菌液涂布于MD平板上,每100μL~200μL涂布一块平板,室温静置10min,于30℃倒置培养2-5天,直至有单菌落(阳性转化子)出现。
向MD平板表面加入2mL无菌双蒸水,然后用无菌三角涂布器轻轻刮下平板表面的His+转化子,并转移到50mL离心管中。以无菌双蒸水稀释菌悬液,105个细胞涂布于含有0.5mg/mL G418的YPD平板上,倒置,30℃培养3~4d后至单菌落出现。从YPD平板上挑取菌落至无菌96孔板中(200μL YPD/孔),混匀,于30℃培养48h;混匀孔中菌液,各取10μL接入至一块新的无菌96孔板,于30℃培养24h后再重复一次此操作;24h后,从第三块96孔板中取出1μL分别点在含有1.0mg/mL和4mg/mL G418的YPD平板上,于30℃继续培养96h~120h。毕赤酵母转化子若能在含高浓度G418的平板上生长,说明该转化子能够高效率表达外源基因,经过这一步筛选可得到高效表达的重组酵母工程菌种。
构建的8种工程菌株样本均送至中国微生物菌种保藏管理委员会普通微生物中心保藏,菌种保藏编号分别对应的是:
表达重组小分子胶原蛋白3A5D1NT的菌株,保藏编号为:CGMCC No.25823;
表达重组小分子胶原蛋白3A5D1的菌株,保藏编号为:CGMCC No.25811;
表达重组小分子胶原蛋白3A5D2NT的菌株,保藏编号为:CGMCC No.25824;
表达重组小分子胶原蛋白3A5D2的菌株,保藏编号为:CGMCC No.25812;
表达重组小分子胶原蛋白17S1NNT的菌株,保藏编号为:CGMCC No.25825;
表达重组小分子胶原蛋白17S1N的菌株,保藏编号为:CGMCC No.25813;
表达重组小分子胶原蛋白17S3NT的菌株,保藏编号为:CGMCC No.25826;
表达重组小分子胶原蛋白17S3的菌株,保藏编号为:CGMCC No.25814;
上述8种工程菌保藏地址均为:北京市朝阳区北辰西路1号院3号;保藏日期均为:2022年9月26日。分类命名均为:巴斯德毕赤酵母Komagataella phaffii。
(3)重组小分子胶原蛋白单序列重组表达策略的表达、纯化与鉴定
使用步骤(2)中得到的8种高效表达的重组酵母工程菌株,采用分批补料培养方法,进行重组小分子胶原蛋白高密度发酵表达生产,获取含有重组胶原蛋白的发酵液,纯化获得高纯度的重组小分子胶原冻干海绵。具体操作如下:
分别挑选步骤(2)中得到的8种高效表达的重组酵母工程菌株接入含种子培养基YPG的1L摇瓶,220rpm、30℃,培养18-20h,至OD600=2~10;将200mL种子液接入5L发酵罐(购自上海保兴生物设备工程有限公司),装液量2L发酵培养基,以甲醇、甘油混合碳源(甲醇:50%甘油=7:3)进行诱导培养。诱导40~60h,UV测量蛋白浓度增长幅度不明显或下降即可放罐。UV测量蛋白浓度公式:C(mg/mL)=0.144*(A215-A225)。
收集发酵液,2000g、30min、4℃离心分离菌体和发酵上清,取发酵上清进行阳离子交换层析纯化(层析填料为苏州纳微产UniGel-80sp装载于利穗科技产GCC-50-400层析柱,使用GE AKTA Pure蛋白质分离层析纯化系统),再进行超滤(使用山东博纳生物科技集团有限公司的1KDa有机膜过滤系统,型号BNUF402-2-A)、脱盐、浓缩,随后冷冻干燥,收集重组小分子胶原蛋白冻干海绵。
取纯化后冻干海绵溶于超纯水,加入2×小分子蛋白上样缓冲液,置于100℃金属浴加热10min,进行Tricine-PAGE检测(小分子蛋白适用的Tricine-PAGE电泳所需全套试剂均购自上海万生昊天生物技术有限公司,电泳方法参照说明书执行)。检测结果如图1所示,图中可见,8种重组小分子胶原蛋白,有效分泌表达于上清中,且电泳条带单一,无水解小分子胶原蛋白大小无法控制的问题(胶原蛋白于电泳时会有一定的电泳迁移延迟,所以在电泳时其表观分子量会偏大)。
取纯度高的8种重组小分子胶原蛋白冻干品进行LC-MS分析获取其去卷积分子量(委托北京百泰派克生物科技有限公司完成)。结果如图2-图5所示,其中部分结果图中去卷积分子量值显示值保留小数点后1位,有四舍五入处理,图中可见,3A5D1NT理论分子量8596.08Da,实测去卷积分子量为8796.68Da;3A5D1理论分子量9281.78Da,实测去卷积分子量为9333.96Da;3A5D2NT理论分子量为4532.83Da,实测去卷积分子量为4591.46Da;3A5D2理论分子量5218.54Da,实测去卷积分子量为5173.04Da;17S1NNT理论分子量为7483.28Da,实测去卷积分子量为7648.41Da;17S1N理论分子量8306.13Da,实测去卷积分子量为8306.00Da;17S3NT理论分子量为5406.08Da,实测去卷积分子量为5499.72Da;17S3理论分子量6228.93Da,实测去卷积分子量为6503.79Da;误差的产生是由于蛋白质在表达过程可能产生的糖基化修饰以及检测误差产生的,所以,本发明的重组小分子胶原蛋白3A5D1NT、3A5D1、3A5D2NT、3A5D2、17S1NNT、17S1N、17S3NT、17S3的实测去卷积分子量与理论值基本一致。
因3A5D1、3A5D2、17S1N、17S3羧基端有6×His标签,可以用抗6×His Tag的抗体(购自南京金斯瑞生物科技股份有限公司)进行Western Blot检测,使用ECL化学发光显色,全自动化学发光图像分析系统(Tanon 5200)检测。检测结果如图6所示,3A5D1、3A5D2、17S1N、17S3成功检测到6×His标签(阴性对照(-)为GS115空菌株的培养上清、阳性对照(+)为带His标签的重组人MIF,购于生工生物工程(上海)股份有限公司,均正常),其条带相应位置也与预期大小相符。
将冻干品用胰蛋白酶将其酶解,Nano-HPLC-MS/MS质谱检测重组胶原的胰蛋白酶解后的肽段(委托苏州普泰生物技术有限公司完成),并将检测到的肽段与Uniprot数据库中各天然蛋白序列进行比对。结果如图7-图10,质谱检测结果表明3A5D1、3A5D2、17S1N、17S3、3A5D1NT、3A5D2NT、17S1NNT、17S3NT这几种重组小分子胶原蛋白酶解后得到的肽段及其所覆盖序列均属于人胶原蛋白序列的相关区域,说明本发明的重组小分子胶原蛋白成功表达。
实施例2:高表达系统或高表达底盘细胞或底盘工程菌的构建
(1)CPB定位融合功能蛋白的设计
本发明中以毕赤酵母为出发细胞,配合特殊的表达序列设计,首先构建一种专属的底盘细胞或底盘工程菌,所述的底盘细胞或底盘工程菌包括定位融合功能蛋白,所述定位融合功能蛋白用于串联重复的多个所述的重组小分子胶原蛋白被Kex2酶切割为单体后其C端碱性氨基酸残基(K、R)的切割去除。
所述定位融合功能蛋白包括CPB酶成熟肽序列、有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列和连接序列,所述连接序列用于CPB酶与有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列融合表达时的连接。
其中所述CPB酶可以是来源于任何物种的,本发明优选来源于人或大鼠。
所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列优选来源于酿酒酵母或毕赤酵母,所述功能区域优选Kex2酶、或其它有类似功能的蛋白质功能区域,如Ste13蛋白酶。
所述的连接序列即Linker序列不限,只要能起到连接且不影响CPB酶与有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域的连接作用即可。
本实施例中,所述CPB酶优选人CPB酶全长(包含信号肽、前肽、成熟肽)序列(Uniprot数据库ID为P15086,https://www.uniprot.org/uniprotkb/P15086)中第111-417位氨基酸序列(即人CPB酶成熟肽序列)为本发明中优选的人CPB酶氨基酸序列,如SEQ IDNO.17所示:ATGHSYEKYNKWETIEAWTQQVATENPALISRSVIGTTFEGRAIYLLKVGKAGQNKPAIFMDCGFHAREWISPAFCQWFVREAVRTYGREIQVTELLDKLDFYVLPVLNIDGYIYTWTKSRFWRKTRSTHTGSSCIGTDPNRNFDAGWCEIGASRNPCDETYCGPAAESEKETKALADFIRNKLSSIKAYLTIHSYSQMMIYPYSYAYKLGENNAELNALAKATVKELASLHGTKYTYGPGATTIYPAAGGSDDWAYDQGIRYSFTFELRDTGRYGFLLPESQIRATCEETFLAIKYVASYVLEHLY
本实施例中,所述CPB酶还优选大鼠CPB酶全长(包含信号肽、前肽、成熟肽)序列(Uniprot数据库ID为P19223,https://www.uniprot.org/uniprotkb/P19223)中第109-415位氨基酸序列(即大鼠CPB酶成熟肽序列)为本发明中优选的大鼠CPB酶氨基酸序列,如SEQID NO.18所示:
ASGHSYTKYNKWETIEAWIQQVATDNPDLVTQSVIGTTFEGRNMYVLKIGKTRPNKPAIFIDCGFHAREWISPAFCQWFVREAVRTYNQEIHMKQLLDELDFYVLPVVNIDGYVYTWTKDRMWRKTRSTMAGSSCLGVRPNRNFNAGWCEVGASRSPCSETYCGPAPESEKETKALADFIRNNLSTIKAYLTIHSYSQMMLYPYSYDYKLPENYEELNALVKGAAKELATLHGTKYTYGPGATTIYPAAGGSDDWSYDQGIKYSFTFELRDTGFFGFLLPESQIRQTCEETMLAVKYIANYVREHLY
本实施例中,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域优选酿酒酵母(Saccharomyces cerevisiae)Kex2酶全长氨基酸序列(Uniprot数据库ID为P13134蛋白质,https://www.uniprot.org/uniprotkb/P13134)中第679-814位氨基酸序列,即位于羧基端有内膜定位及各细胞器之间的转换与运输作用的区域,序列如SEQ IDNO.19所示:
YFLTIFLIGATFLVLYFMFFMKSRRRIRRSRAETYEFDIIDTDSEYDSTLDNGTSGITEPEEVEDFDFDLSDEDHLASLSSSENGDAEHTIDSVLTNENPFSDPIKQKFPNDANAESASNKLQELQPDVPPSSGRS
本实施例中,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域还优选毕赤酵母(Komagataella phaffii,即Pichia pastoris)Kex2酶全长氨基酸序列(Uniprot数据库ID为C4R095蛋白质,https://www.uniprot.org/uniprotkb/C4R095)中第681-777位氨基酸序列,即位于羧基端有内膜定位及各细胞器之间的转换与运输作用的区域,如SEQ ID NO.20所示:
YLAFLLGLGFLICIIFLFTNRNKLERRQRRNRRDEYEFDLIPADDDFDTEEDQEANSQFTLD SDAELMFEDTSQREASPHEYQDSLGSNEHPKRAAL
作为CPB酶与Kex2酶羧基端序列融合表达时的连接,使用Linker序列,如序列SEQID NO.21所示:GGSGSGSGGS
本发明构建的CPB定位融合功能蛋白如下:
本发明构建的融合表达的人CPB酶与毕赤酵母Kex2酶羧基端序列的CPB定位融合功能蛋白,命名为HCPB-PPKEX2,其序列如SEQ ID NO.22所示:
ATGHSYEKYNKWETIEAWTQQVATENPALISRSVIGTTFEGRAIYLLKVGKAGQNKPAIFMDCGFHAREWISPAFCQWFVREAVRTYGREIQVTELLDKLDFYVLPVLNIDGYIYTWTKSRFWRKTRSTHTGSSCIGTDPNRNFDAGWCEIGASRNPCDETYCGPAAESEKETKALADFIRNKLSSIKAYLTIHSYSQMMIYPYSYAYKLGENNAELNALAKATVKELASLHGTKYTYGPGATTIYPAAGGSDDWAYDQGIRYSFTFELRDTGRYGFLLPESQIRATCEETFLAIKYVASYVLEHLYGGSGSGSGGSYLAFLLGLGFLICIIFLFTNRNKLERRQRRNRRDEYEFDLIPADDDFDTEEDQEANSQFTLDSDAELMFEDTSQREASPHEYQDSLGSNEHPKRAAL
编码SEQ ID NO.22的DNA序列,如SEQ ID NO.23所示:
gcgacaggacacagctatgagaaatacaacaaatgggagacaatagaggcgtggacgcagcaggtggccaccgaaaacccggctcttatatctcgttctgtcatcggaaccactttcgaaggccgagccatctacctacttaaggtcggcaaagcaggtcaaaacaaaccagcaatctttatggactgtggattccatgctagggagtggatctcaccagcattctgtcagtggttcgtacgggaggcggttcgaacgtatggtagagaaattcaggtcacagagctgttggacaagctcgatttttatgtactacctgtgctgaacattgatgggtatatttatacctggactaagtcccgcttttggcgcaagacgcggagtacgcacactgggtcctcttgcatcggaacagaccccaaccgtaatttcgatgcaggctggtgcgagataggggctagtcgtaatccgtgcgacgagacgtactgcgggcccgcggctgaatcagaaaaggaaactaaggcgcttgcggatttcattagaaataaactttccagtatcaaagcgtatttgaccatacactcgtatagccaaatgatgatctacccctactcctacgcgtataaacttggtgaaaacaacgccgaactgaatgccctcgccaaggcaactgtgaaggagctagcaagcttgcatggaactaaatacacttacgggcctggtgccacaaccatatacccggctgccgggggtagtgacgattgggcttatgatcagggtataaggtatagctttacgttcgagctgcgtgatacgggccgttatggattcttgctccctgagtctcaaattagggctacctgtgaagaaacatttctggctattaaatatgttgcatcttacgtattagaacatttatacggaggctcgggatctgggtcgggtggctcatacctagccttcttactgggcctcggttttttaatatgtattatcttcctctttacaaaccggaataagttggaacgccggcaaaggcgaaatcgccgagatgaatatgaatttgaccttattcccgcagatgacgactttgatactgaggaagatcaagaagcgaattcacaatttaccttagactcagacgccgagctaatgtttgaagatacctcgcaacgagaggcgtccccacatgagtaccaggactcgttgggcagcaatgagcacccaaaaagagctgcattataa
融合表达的人CPB酶与酿酒酵母Kex2酶羧基端序列的CPB定位融合功能蛋白,命名为HCPB-SCKEX2,其序列如SEQ ID NO.24所示:
ATGHSYEKYNKWETIEAWTQQVATENPALISRSVIGTTFEGRAIYLLKVGKAGQNKPAIFMDCGFHAREWISPAFCQWFVREAVRTYGREIQVTELLDKLDFYVLPVLNIDGYIYTWTKSRFWRKTRSTHTGSSCIGTDPNRNFDAGWCEIGASRNPCDETYCGPAAESEKETKALADFIRNKLSSIKAYLTIHSYSQMMIYPYSYAYKLGENNAELNALAKATVKELASLHGTKYTYGPGATTIYPAAGGSDDWAYDQGIRYSFTFELRDTGRYGFLLPESQIRATCEETFLAIKYVASYVLEHLYGGSGSGSGGSYFLTIFLIGATFLVLYFMFFMKSRRRIRRSRAETYEFDIIDTDSEYDSTLDNGTSGITEPEEVEDFDFDLSDEDHLASLSSSENGDAEHTIDSVLTNENPFSDPIKQKFPNDANAESASNKLQELQPDVPPSSGRS
编码SEQ ID NO.24的DNA序列,如SEQ ID NO.25所示:
gcgacaggacacagctatgagaaatacaacaaatgggagacaatagaggcgtggacgcagcaggtggccaccgaaaacccggctcttatatctcgttctgtcatcggaaccactttcgaaggccgagccatctacctacttaaggtcggcaaagcaggtcaaaacaaaccagcaatctttatggactgtggattccatgctagggagtggatctcaccagcattctgtcagtggttcgtacgggaggcggttcgaacgtatggtagagaaattcaggtcacagagctgttggacaagctcgatttttatgtactacctgtgctgaacattgatgggtatatttatacctggactaagtcccgcttttggcgcaagacgcggagtacgcacactgggtcctcttgcatcggaacagaccccaaccgtaatttcgatgcaggctggtgcgagataggggctagtcgtaatccgtgcgacgagacgtactgcgggcccgcggctgaatcagaaaaggaaactaaggcgcttgcggatttcattagaaataaactttccagtatcaaagcgtatttgaccatacactcgtatagccaaatgatgatctacccctactcctacgcgtataaacttggtgaaaacaacgccgaactgaatgccctcgccaaggcaactgtgaaggagctagcaagcttgcatggaactaaatacacttacgggcctggtgccacaaccatatacccggctgccgggggtagtgacgattgggcttatgatcagggtataaggtatagctttacgttcgagctgcgtgatacgggccgttatggattcttgctccctgagtctcaaattagggctacctgtgaagaaacatttctggctattaaatatgttgcatcttacgtattagaacatttatacggaggctcgggatctgggtcgggtggctcatatttcctcacaatattcttaataggcgcaacgtttttagtgctgtattttatgtttttcatgaaatcaaggcggagaatccggcgttcacgcgcggagacctacgagttcgacatcatagatactgactcggaatacgattcaaccctggataacgggacctcgggtattactgaacccgaggaggtagaggatttcgatttcgacctctctgacgaagatcatctagccagtctatcgtccagtgaaaatggagatgctgaacacacaatcgacagcgtccttacgaatgagaacccgttttccgatcctattaaacaaaagtttcccaacgacgcgaatgcagagagcgccagtaacaagttgcaggaattgcagccagacgttccgccatcctctggtcgatcttaa
融合表达的大鼠CPB酶与毕赤酵母Kex2酶羧基端序列的CPB定位融合功能蛋白,命名为RCPB-PPKEX2,其序列如SEQ ID NO.26所示:
ASGHSYTKYNKWETIEAWIQQVATDNPDLVTQSVIGTTFEGRNMYVLKIGKTRPNKPAIFIDCGFHAREWISPAFCQWFVREAVRTYNQEIHMKQLLDELDFYVLPVVNIDGYVYTWTKDRMWRKTRSTMAGSSCLGVRPNRNFNAGWCEVGASRSPCSETYCGPAPESEKETKALADFIRNNLSTIKAYLTIHSYSQMMLYPYSYDYKLPENYEELNALVKGAAKELATLHGTKYTYGPGATTIYPAAGGSDDWSYDQGIKYSFTFELRDTGFFGFLLPESQIRQTCEETMLAVKYIANYVREHLYGGSGSGSGGSYLAFLLGLGFLICIIFLFTNRNKLERRQRRNRRDEYEFDLIPADDDFDTEEDQEANSQFTLDSDAELMFEDTSQREASPHEYQDSLGSNEHPKRAAL
编码SEQ ID NO.26的DNA序列,如SEQ ID NO.27所示:
gcaagcggtcactcgtacacaaagtataacaaatgggaaactatcgaggcctggattcaacaagtagccacggataaccctgatttagtcacgcaatcggtcatagggacaaccttcgagggcagaaacatgtacgtattaaagataggaaagactcgtcccaataaacctgctatttttatcgactgtggcttccacgctagagaatggattagccctgccttctgccaatggttcgtgagggaagcagtacggacgtacaaccaggaaattcatatgaagcaactgctcgacgaattagatttctatgttttaccggtagttaacatcgatggctacgtttacacatggacaaaagaccgtatgtggcggaagactagatcgacgatggcaggctcatcctgtctgggtgtgcgtccgaataggaacttcaatgcgggttggtgtgaagtgggggcgtcccgctctccctgttcagagacatactgcggacctgccccagaatccgaaaaagagacgaaagctcttgctgattttattaggaacaacctaagtaccattaaagcatacttaaccatccatagttacagccagatgatgctgtatccctattcctacgactataagctaccggagaactatgaagaactcaatgctttagttaaaggagcggccaaggagttggcgacattgcatggaacgaagtacacttatggtccaggggccactaccatctatccggcagctggtggatcagacgactggagttatgaccaaggtataaagtactctttcacctttgaattacgtgatactggtttttttggctttctgcttccagagtcacagatccgccagacttgcgaggaaaccatgcttgcggtgaagtatatagctaattacgtccgtgaacatctatacggcggatccgggtcggggagtggtgggagttatctagcatttttgctagggctcggcttcctgatctgcataatattcttgtttaccaaccgcaataaattggaacgaaggcagcgacgaaatcggcgagacgaatatgagtttgacctcattccggcggatgatgattttgatacggaggaggaccaggaggccaatagccaattcacattggactctgacgcggaacttatgttcgaagatacgtcacagagagaggcctcgccccacgagtatcaagattctctgggatctaatgaacacccaaaacgggctgcactttaa
融合表达的大鼠CPB酶与酿酒酵母Kex2酶羧基端序列的CPB定位融合功能蛋白,命名为RCPB-SCKEX2,其序列如SEQ ID NO.28所示:
ASGHSYTKYNKWETIEAWIQQVATDNPDLVTQSVIGTTFEGRNMYVLKIGKTRPNKPAIFIDCGFHAREWISPAFCQWFVREAVRTYNQEIHMKQLLDELDFYVLPVVNIDGYVYTWTKDRMWRKTRSTMAGSSCLGVRPNRNFNAGWCEVGASRSPCSETYCGPAPESEKETKALADFIRNNLSTIKAYLTIHSYSQMMLYPYSYDYKLPENYEELNALVKGAAKELATLHGTKYTYGPGATTIYPAAGGSDDWSYDQGIKYSFTFELRDTGFFGFLLPESQIRQTCEETMLAVKYIANYVREHLYGGSGSGSGGSYFLTIFLIGATFLVLYFMFFMKSRRRIRRSRAETYEFDIIDTDSEYDSTLDNGTSGITEPEEVEDFDFDLSDEDHLASLSSSENGDAEHTIDSVLTNENPFSDPIKQKFPNDANAESASNKLQELQPDVPPSSGRS
编码SEQ ID NO.28的DNA序列,如SEQ ID NO.29所示:
gcaagcggtcactcgtacacaaagtataacaaatgggaaactatcgaggcctggattcaacaagtagccacggataaccctgatttagtcacgcaatcggtcatagggacaaccttcgagggcagaaacatgtacgtattaaagataggaaagactcgtcccaataaacctgctatttttatcgactgtggcttccacgctagagaatggattagccctgccttctgccaatggttcgtgagggaagcagtacggacgtacaaccaggaaattcatatgaagcaactgctcgacgaattagatttctatgttttaccggtagttaacatcgatggctacgtttacacatggacaaaagaccgtatgtggcggaagactagatcgacgatggcaggctcatcctgtctgggtgtgcgtccgaataggaacttcaatgcgggttggtgtgaagtgggggcgtcccgctctccctgttcagagacatactgcggacctgccccagaatccgaaaaagagacgaaagctcttgctgattttattaggaacaacctaagtaccattaaagcatacttaaccatccatagttacagccagatgatgctgtatccctattcctacgactataagctaccggagaactatgaagaactcaatgctttagttaaaggagcggccaaggagttggcgacattgcatggaacgaagtacacttatggtccaggggccactaccatctatccggcagctggtggatcagacgactggagttatgaccaaggtataaagtactctttcacctttgaattacgtgatactggtttttttggctttctgcttccagagtcacagatccgccagacttgcgaggaaaccatgcttgcggtgaagtatatagctaattacgtccgtgaacatctatacggcggatccgggtcggggagtggtgggagttatttcctcacaatattcttaataggcgcaacgtttttagtgctgtattttatgtttttcatgaaatcaaggcggagaatccggcgttcacgcgcggagacctacgagttcgacatcatagatactgactcggaatacgattcaaccctggataacgggacctcgggtattactgaacccgaggaggtagaggatttcgatttcgacctctctgacgaagatcatctagccagtctatcgtccagtgaaaatggagatgctgaacacacaatcgacagcgtccttacgaatgagaacccgttttccgatcctattaaacaaaagtttcccaacgacgcgaatgcagagagcgccagtaacaagttgcaggaattgcagccagacgttccgccatcctctggtcgatcttaa
在本发明的定位融合功能蛋白设计中,优选的Kex2酶,是酵母类微生物(自然包括毕赤酵母)自身表达的一种钙离子依赖型的丝氨酸蛋白酶,能特异性识别和切割氨基酸序列中的RR、KR等双碱性氨基酸羧基端肽键,在酵母的蛋白质分泌途径中起关键作用。同时,酵母类微生物有STE 13基因,于胞内会表达Ste 13蛋白酶(严格来说,属于Dipeptidylaminopeptidase二肽氨肽酶),可以切割蛋白质氨基末端的EA、EAEA的氨基酸序列。
Kex2酶在基因工程中应用最多的是在酵母外源分泌途径中,切割外源蛋白前体中的信号肽或前肽序列,释放成熟态的分泌蛋白,Kex2酶会在外源蛋白KR或RR双碱基氨基酸羧基端将肽键切割,同时为了提高切割效率,KR或RR之后往往会添加EA、EAEA等氨基酸序列(非必须,也可以是外源蛋白的序列,但切割效率会根据KR、RR之后1-4个氨基酸残基种类有所不同)。另外Kex2酶还可作为融合蛋白之间的酶切位点将表达的一整条肽段切割为两条或多条肽段,这在表达不同亚基的蛋白质情形下使用比较多。相应的,这样的应用也可以迁移到蛋白质多序列重复串联表达时,于其中添加Kex2酶切位点,可达到间接增长拷贝数的目的,以实现外源蛋白表达量的提高。但是,如上的Kex2酶作用时,KR、RR等双碱基氨基酸是有效切割的前提条件,但是切割后KR、RR无法去除,为了切割效率的提高,KR、RR之前往往也要添加1-2个氨基酸残基(非必须,可以根据实际情况进行调节、设计),对于重组表达的蛋白质而言,引入的非自身氨基酸会更多。而胶原蛋白,其典型的序列结构是G-X-Y不断重复的三联体结构,非自身氨基酸的引入往往会破坏这样的结构特征。
在本发明的定位融合蛋白设计过程中,需要考虑KR、RR的去除。
重组羧肽酶B(CPB酶,一种外分泌蛋白酶)能特异性切割蛋白质羧基末端的碱性氨基酸(尤其是K、R),直至C端的碱性氨基酸切完,其它非碱性氨基酸裸露于蛋白质的C端。在生物工程或生物制药领域一般使用CPB酶,基本上都是将重组蛋白质或蛋白质药物表达、纯化后,额外添加CPB酶以去除蛋白质的C端的K、R等碱性氨基酸,这相当于在重组蛋白的表达纯化工作中又加了一种外源性物质,除去购买CPB酶的成本增加外,还要添加CPB去除、残留量检测的工艺流程,必要的情况下还要对CPB酶残留进行相应的评估,整个工艺的难度、流程、成本、时间也会在增加,还会有可能CPB酶去除不净而残留的隐患。
所以本发明也需要在细胞内尤其是蛋白质表达分泌途径中,建立CPB酶的合成代谢途径,使CPB酶定位于胞内(内质网腔、高尔基体(trans-Golgi network,TGN)等构成的蛋白质表达分泌途径)中,在Kex2酶将经过设计的长序列重组胶原蛋白氨基酸切割为小片段小分子量的蛋白质后,CPB酶可以和Ste 13蛋白酶协同分别把C端、N端的KR、EA等非胶原氨基酸切除,保持胶原蛋白G-X-Y三联体重复结构。
综上,本发明需要解决CPB酶不仅仅是在细胞内表达,更要设法让它能够进入分泌表达途径(其方式与分泌表达完全一致)却仍可以保留于由内质网腔、高尔基体等蛋白质分泌途径之中而不分泌于胞外,且能与Kex2酶的活化时间保持时间、空间上的持续性。
所以,本发明将CPB酶与一段有内膜定位或细胞中分泌细胞器之间转换与运输作用的序列融合表达,形成一个全新的CPB定位融合功能蛋白,能分泌、能定位于细胞内膜上、也能伴随Kex2酶与重组胶原蛋白在胞内分泌细胞器之间转换与运输、不分泌(定位细胞内膜上无法脱离)。
Kex2酶整体上包括信号肽、前体肽、催化结构域、P结构域、Ser/Thr富集结构域、跨膜区以及胞外结构域七部分,其酶活性主要由催化结构域、P结构域、Ser/Thr富集结构域实现,保留这三部分仍能保持Kex2酶的活性,而C端的膜区以及胞外结构域主要负责Kex2蛋白酶在细胞内各细胞器之间的转换与运输,本发明选择了Kex2酶C端的相关功能区域与CPB酶融合表达,为了不影响融合两部分的结构与活性,于中间添加了具有柔性的Linker序列(非必须)。而且相同的C端序列,会将Kex2酶与的CPB定位融合功能蛋白集中定位于同一区域,Kex2酶的作用产物则是CPB定位融合功能蛋白的作用底物,集中于同一区域更有利于两种酶的协同作用。
(2)CPB定位融合功能蛋白的表达载体及底盘细胞的构建与鉴定
CPB底盘细胞需要将CPB定位融合功能蛋白表达且定位于内质网、高尔基体等构成的细胞蛋白质分泌途径之中,与酵母自身的Kex2、Ste13等蛋白酶进行协同作用,因此构建CPB定位融合功能蛋白的表达载体时,需要于其前添加信号肽序列以使其得以分泌进行内质网及后续的蛋白质分泌途径中,而能进入内质网腔的蛋白质所使用的信号肽都有类似的作用,本发明以常用的α-factor secretion signal作为信号肽序列进行示例。
毕赤酵母能使用的表达载体众多,载体中含有的启动子作用很重要,常用的启动子有:(1)AOX1启动子、FLD1启动子、FDH1启动子、DAS1启动子和DAS2启动子等诱导型启动子,使用甲醇或甲胺才可诱导启动蛋白质的表达,可以采用诱导剂的添加调节CPB定位融合功能蛋白转录表达的时机;(2)GAP、GCW14等不依赖诱导剂的组成型启动子,只要细胞处于生存状态,它们就会启动蛋白质的转录表达,即CPB定位融合功能蛋白是一直转录表达的;(3)THI4启动子、THI11等不需要特定的诱导剂的启动子,只要减少部分培养物质(如减少硫胺素)即可启动蛋白质表达,在一定程度上也可调节CPB定位融合功能蛋白转录表达的时机;(4)调节培养环境其它条件的启动子,如HSP82启动子,是一种热诱导启动子,在菌株正常生长时,更改生长温度,进行热刺激,便可以诱导HSP82启动子进行转录启动,从调节CPB定位融合功能蛋白转录表达。但无论哪种启动子,最终的作用是一样的,即启动CPB定位融合功能蛋白转录表达,最终作用并无区别,均在本发明保护的范围内,本发明以常见的AOX1启动子作为示例。毕赤酵母或酵母类的表达载体众多,最终目的只要是完成CPB定位融合功能蛋白的表达,其作用都是相同的,本发明使用常用的表达载体构建了多种表达载体。
DNA序列SEQ ID NO.23、SEQ ID NO.25、SEQ ID NO.27、SEQ ID NO.29均由南京金斯瑞生物科技有限公司合成。将合成的基因分别克隆于pPICZαB、pFLDα、pPIC9K等表达载体(均购自赛默飞世尔科技(中国)有限公司)上,克隆位置为α-factor secretion signal序列中kex2酶切位点序列(其末端DNA序列为AAAGAAGAAGGGGTATCTCTCGAGAAAAGA)与载体上终止密码子“TGA”之间。可获得3组构建底盘微生物所需要重组表达载体:
(1)pPICZαB-HCPB-PPKEX2、pPICZαB-HCPB-SCKEX2、pPICZαB-RCPB-PPKEX2、pPICZαB-RCPB-SCKEX2,使用AOX1启动子和α-factor secretion signal信号肽序列;
(2)pFLDα-HCPB-PPKEX2、pFLDα-HCPB-SCKEX2、pFLDα-RCPB-PPKEX2、pFLDα-RCPB-SCKEX2,用FLD启动子和α-factor secretion signal信号肽序列;
(3)pPIC9K-HCPB-PPKEX2、pPIC9K-HCPB-SCKEX2、pPIC9K-RCPB-PPKEX2、pPIC9K-RCPB-SCKEX2,使用AOX1启动子和α-factor secretion signal信号肽序列。
这三组重组表达载体中每个均可单独使用,且均使用α-factor secretionsignal信号肽序列,虽然启动子有所不同,但均可使用甲醇进行诱导(FLD启动子也可使用甲胺),其最终效果是相同的,本发明示例中使用第一组作为后续工程菌株构建的示例,如图11-图14所示,为该实施例构建的其中4种重组表达载体。
底盘细胞使用的空白出发菌株可以是原始毕赤酵母菌株或商品化的X-33、SMD1168、GS115等菌株,或者其它的酵母菌,最终达的效果是相同的,即于细胞蛋白质分泌途径中构建了CPB定位融合功能蛋白的表达,并与酵母自身的Kex2、Ste13等蛋白酶进行协同作用,将长的蛋白质进行表达并分割,本发明使用了商品化空白出发菌株GS115作为示例。
将pPICZαB-HCPB-PPKEX2、pPICZαB-HCPB-SCKEX2、pPICZαB-RCPB-PPKEX2、pPICZαB-RCPB-SCKEX2载体质粒用Pme I(购自大连TaKaRa公司)37℃酶切消化过夜,使其线性化,再使用PCR产物纯化试剂盒(购自生工生物工程(上海)股份有限公司)回收线性化质粒,使体积控制在10μL左右。将线性化质粒电转化入空宿主菌种毕赤酵母GS115(购自中国工业微生物菌种保藏管理中心)感受态细胞中,涂至Zeocin(购自赛默飞世尔科技(中国)有限公司)为0.1mg/mL的YPD平板中,待单菌落长出后,用牙签挑取单克隆接种至96孔板中,于30℃培养48h后,分别点板于含0.5mg/mL、1mg/mL Zeocin的YPD平板,挑选于高浓度(1mg/mL)Zeocin平板上生长的菌株接入BMGY培养基摇瓶中,30℃、220rpm过夜培养后,更换为BMMY培养基进行诱导表达,每24h补充100%甲醇至终浓度为1.0%,培养36h以上,收集培养上清和菌体,用8M尿素裂解菌体,制备样品后进行SDS-PAGE检测,使用抗人或鼠CPB酶的抗体(购自生工生物工程(上海)股份有限公司),以重组人或大鼠CPB酶蛋白(购自生工生物工程(上海)股份有限公司)作为阳性对照,空宿主菌的培养上清为阴性对照,使用ECL化学发光显色,全自动化学发光图像分析系统(Tanon 5200)进行结果检测合成图像。
结果如图15所示,图15为CPB定位融合功能蛋白HCPB-PPKEX2、HCPB-SCKEX2、RCPB-PPKEX2、RCPB-SCKEX2在胞内裂解液和培养上清中表达的检测结果;左图中泳道,1:HCPB-SCKEX2菌体裂解液;2:HCPB-SCKEX2菌培养上清;3、6:HCPB-PPKEX2培养上清;4、5:HCPB-PPKEX2菌体裂解液;(-):阴性对照;(+):阳性对照,重组人CPB酶;/:无样品孔。右图中泳道,(-):阴性对照;(+):阳性对照,重组大鼠CPB酶;/:无样品孔;7:RCPB-SCKEX2菌培养上清;8:RCPB-SCKEX2菌体裂解液;9、10、12、13:RCPB-PPKEX2培养上清;11、14:RCPB-PPKEX2菌体裂解液。
作为阳性对照的人CPB酶成功检测,而HCPB-PPKEX2、HCPB-SCKEX2、RCPB-PPKEX2、RCPB-SCKEX2,均只于胞内裂解液中检测出,且条带均大于阳性对照,条带大小符合融合蛋白的预期(融合其它蛋白,电泳表观分子量自然就更大)。最主要的是,培养上清中没检测出相应的条带,这说明作为融合蛋白表达的HCPB-PPKEX2、HCPB-SCKEX2、RCPB-PPKEX2、RCPB-SCKEX2均未分泌于胞外,而是都位于胞内,这与4种CPB定位融合功能蛋白设计目的相符,即人或大鼠的CPB酶与来源于Kex2酶羧基端有内膜定位及各细胞器之间的转换与运输作用区域序列融合表达,在信号肽的作用下,它们能够进入内质网腔及高尔基体等构成的细胞内蛋白质分泌途径之中,但与Kex2酶一样,也只能存于细胞内,而无法分泌出细胞外。
参照Invitrogen的操作手册以不同浓度的Zeocin抗生素的YPD平板梯度,点板筛选的方法,结合胞内WB检测结果,陆续筛选出HCPB-PPKEX2、HCPB-SCKEX2、RCPB-PPKEX2、RCPB-SCKEX2这4种融合功能蛋白合成代谢途径的底盘细胞的工程菌株,作为后续进行重组串联表达策略的宿主菌。
构建的CPB定位融合功能蛋白功能途径的4种底盘细胞的工程菌株样本均送至中国微生物菌种保藏管理委员会普通微生物中心保藏,菌种保藏编号分别对应的是:
表达HCPB-PPKEX2的菌株,保藏编号为:CGMCC No.25815;
表达RCPB-PPKEX2的菌株,保藏编号为:CGMCC No.25817;
表达HCPB-SCKEX2的菌株,保藏编号为:CGMCC No.25816;
表达RCPB-SCKEX2的菌株,保藏编号为:CGMCC No.25818;
上述工程菌保藏地址均为:北京市朝阳区北辰西路1号院3号;保藏日期均为:2022年9月26日。分类命名均为:巴斯德毕赤酵母Komagataella phaffii。
实施例3:小分子胶原蛋白氨基酸序列设计与串联重复表达的小分子胶原白的表征
为达到本发明所述的小分子胶原蛋白的高效表达的目的,本发明中对目标小分子胶原蛋白的氨基酸序列进行了设计,设计要求:
(1)重复串联的小分子胶原蛋白单体(或片段)之间设计酵母Kex2酶能够有效识别和切割的位点,其突出特征是有KR、RR等双碱性氨基酸。
(2)于双碱性氨基酸残基之后,可以是EA、EAEA或其它有有助于Kex2酶识别和切割的氨基酸序列,比如D或A等氨基酸序列,或直接是小分子胶原蛋白蛋白单体(或片段)自身的氨基酸(发明中有相关的示例)。
(3)重复串联的小分子胶原蛋白单体(或片段)的氨基酸序列可以是任一序列,其氨基酸残基的具体排序、序列长度、单体(或片段)串联重复的次数都是可以自由安排、不受限制的,当然,作为小分子胶原蛋白,一般需要有典型的G-X-Y三联体结构,且氨基酸序列长度控制在100个氨基酸以内。
本发明示例如下:
(1)参考3A5D2NT的氨基酸序列,设计重复串联序列,重复9次,命名为3A5D29N-9,共522个氨基酸,其序列如SEQ ID NO.30所示:
EAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAG
KSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSG
DRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRG
ESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRGESGP
AGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRGESGPAGPA
GAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRGESGPAGPAGAP
GPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRGESGPAGPAGAPGPAG
SRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREAGKSGDRGESGPAGPAGAPGPAGSRGA
PGPQGPRGDKGETGERGAAGIKGHRGLEKR
当3A5D29N-9经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.31所示:
EAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段54个氨基酸的重组小分子胶原蛋白(记为3A5D29N),氨基酸序列均为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQ ID NO.32所示:
GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE
(2)参考17S3NT的氨基酸序列,设计重复串联序列,重复8次,命名为17S28-8,共536个氨基酸,其序列如SEQ ID NO.33所示:
EAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKR
当17S28-8经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.34所示:
EAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKR其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段63个(记为17S28),且氨基酸序列均为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQ ID NO.35所示:
GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLE
(3)参考17S1NNT的氨基酸序列,设计重复串联序列,重复6次,命名为17S1N6-6,共540个氨基酸,其序列如SEQ ID NO.36所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKR
当17S1N6-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.37所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLEKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段86个(记为17S1N6),且氨基酸序列均为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQ ID NO.38所示:
GPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGLE
(4)参考17S1NNT的氨基酸序列,设计重复串联序列,重复7次,命名为17S1N7-7,共528个氨基酸,其序列如SEQ ID NO.39所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKREAGPPGSG
EKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKR
当17S1N7-7,经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.40所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRGKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段84个(记为17S1N7),其序列如SEQ ID NO.41所示:
GPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRG
(5)参考17S1NNT的氨基酸序列,设计重复串联序列,重复7次,命名为17S1NK-7,共595个氨基酸,其序列如SEQ ID NO.42所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKREAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKR
当17S1NK-7经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.43所示:
EAGPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段84个氨基酸的重组小分子胶原蛋白(记为17S1NK),其序列如SEQ ID NO.44所示:
GPPGSGEKGERGAAGEPGPHGPPGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGPRG
(6)参考3A5D1的氨基酸序列,设计重复串联序列,重复5次,命名为3A5D15D-5,共510个氨基酸,其序列如SEQ ID NO.45所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR
当3A5D15D-5经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与D之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.46所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR
羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段100个氨基酸的重组小分子胶原蛋白(记为3A5D15D),为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQID NO.47所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE
(7)同样的,使用其它的酶切位点也可以达到与3A5D15D相同的作用,将酶切位点区域序列设计为KREA,设计重复串联序列,重复5次,命名为3A5D15E-5,共520个氨基酸,其序列如SEQ ID NO.48所示:
EADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKREADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR
当3A5D15E-5经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.49所示:
EADGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段100个氨基酸的重组小分子胶原蛋白(与3A5D15D表达切割后获得的序列相同,这里记为3A5D15E),为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQ ID NO.50所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE
(8)参考3A5D1NT的氨基酸序列,设计重复串联序列,重复6次,命名为3A5D15R-6,共570个氨基酸,其序列如SEQ ID NO.51所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKR
当3A5D15R-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与D之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.52所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKR
羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段93个氨基酸的重组小分子胶原蛋白(记为3A5D15R),其序列如SEQ ID NO.53所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGI
(9)参考3A5D1NT的氨基酸序列,设计重复串联序列,重复6次,命名为3A5D15KR-6,共582个氨基酸,其序列如SEQ ID NO.54所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKR
当3A5D15KR-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与D之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.55所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGKR
羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段95个氨基酸的重组小分子胶原蛋白(记为3A5D15KR),其序列如SEQ ID NO.56所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKG
(10)参考3A5D1NT的氨基酸序列,设计重复串联序列,重复6次,命名为3A5D15EKR-6,共576个氨基酸,其序列如SEQ ID NO.57所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGP
RGDKGETGERGAAGIEKR
当3A5D15EKR-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与D之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.58所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIEKR
羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段94个氨基酸的重组小分子胶原蛋白(记为3A5D15EKR),为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQ ID NO.59所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIE
(11)参考3A5D1NT的氨基酸序列,设计重复串联序列,重复6次,命名为3A5D15G-6,共576个氨基酸,其序列如SEQ ID NO.60所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKR
当3A5D15G-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KRD中的KR与D之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.61所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIGKR
羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段94个氨基酸的重组小分子胶原蛋白(记为3A5D15G),为典型的G-X-Y三联体胶原蛋白序列,其序列如SEQID NO.62所示:
DGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIG
除去以上所描述的以人Ⅲ型胶原蛋白序列或人XVII胶原蛋白序列中一个区域为基础进行重复串联序列的设计外,以人胶原蛋白序列的两个或多个区域的组合拼接的序列作为单体,进行串联重复,也可以应用于本发明所述重复串联表达体系(包括重复串联表达序列设计方法与底盘细胞的使用)和单体表达体系。
(12)参考人Ⅲ型胶原蛋白序列(参照Uniprot数据库中ID为P02461的蛋白质序列,https://www.uniprot.org/uniprotkb/P02461)的几个不同功能区域,第880-915位氨基酸序列、第949-966位氨基酸序列、第1012-1038位氨基酸序列、第1060-1074位氨基酸序列组合设计重组小分子胶原蛋白,共96个氨基酸,可用于串联的单体,其序列如SEQ ID NO.63所示,GPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGET
以此为基础设计重复串联序列,重复6次,命名为3A5D16M-6,共500个氨基酸,其序列如SEQ ID NO.64所示:
EAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKR
当3A5D16M-6经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQ IDNO.65所示:
EAGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段96个氨基酸的重组小分子胶原蛋白,命名为3A5D16M,其序列如SEQ ID NO.66所示:
GPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPQGVKGESGKPGANGLSGENGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLE
(13)参考人Ⅲ型胶原蛋白序列(参照Uniprot数据库中ID为P02461的蛋白质序列,https://www.uniprot.org/uniprotkb/P02461)两个功能区域,即第1060-1074位氨基酸序列与1015-1038位氨基酸序列组合,共39个氨基酸,可用于单体表达,其序列如SEQ IDNO.67所示,
GSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGET
以此为基础设计重复串联序列,重复12次,命名为3A5D15M-12,共516个氨基酸,其序列如SEQ ID NO.68所示:
EAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKREAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKR
当3A5D15M-12经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会在每个KREA中的KR与EA之间,将其分割为相同的小分子蛋白序列,其序列如SEQID NO.69所示:
EAGSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLEKR
其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段39个氨基酸的重组小分子胶原蛋白,命名为3A5D15M,其序列如SEQ ID NO.70所示:
GSPGAPGAPGHPGPPGPVGPAGKSGAPGPQGPRGDKGLE
人工设计的非天然胶原蛋白序列理论上也可以应用本发明的重复串联表达体系,原理如上,在此不再赘述。
重复串联表达体系重组表达载体的构建与表达效果的验证:
本实施例中基于底盘细胞和上述氨基酸序列的设计,重组小分子胶原蛋白的使用的表达载体并不受限制,只要所选用的表达载体有信号肽序列,能将翻译表达的蛋白质导入内质网即可,常用的表达载体如pPICZαB、pFLDα、pPIC9K均可,其它基于有类似作用的表达载体的构建也在本发明的保护范围内。同样,编码相应重组小分子胶原蛋白的DNA序列可以进行优化,只要最终编码氨基酸序列相同,则于本发明保护范围内。
编码3A5D29N-9的DNA序列,如SEQ ID NO.71所示:
gaagctggaaagtccggcgaccggggagagtcagggcctgcagggcctgctggtgccccaggaccggccggcagtagaggtgctcctggtcctcaaggaccacggggcgacaaaggtgaaacaggtgaacgaggtgcggcaggtataaaagggcacagagggctagaaaagcgggaagcaggaaaaagtggcgatcgcggggaatcaggtcccgcggggccggcgggtgcgcccggaccggcggggtccagaggtgcccctggaccgcagggacctcggggtgacaaaggtgaaactggggaaaggggggctgcgggcataaagggacaccgcggactcgagaagagagaggcaggtaaaagtggggatagaggcgaatctggtccggcaggaccagcgggcgcccccggtcctgctggatcacgaggtgccccgggtccgcaaggtcctaggggtgacaaaggcgagacgggcgaacgaggggcagcaggaattaaaggccaccgagggctggagaagcgggaagcaggtaaatcaggagataggggggaaagcggaccggccggacccgctggtgcgccgggacctgctggatcgagaggtgcaccgggtccccaagggcctcgtggagataaaggggagaccggggagcgcggggctgcagggattaagggacaccgcggcttggagaagcgagaggctggtaaaagcggcgaccgcggcgaatcgggtccggcgggtcccgcgggcgcacctgggcctgctgggtctaggggagcgccagggcctcaaggtcctcgcggtgacaagggagaaacaggcgagcgtggggcagcgggcattaaaggtcatcgtgggttagaaaagcgtgaggctggcaaatctggcgatcgcggggagagcggtccagcaggtccggctggtgctccaggtccagctggtagccgtggcgccccaggtcctcaaggtcctcgtggcgacaaaggggagaccggcgagcgtggagcggcaggcatcaaaggtcatcgtggacttgaaaagagggaggcgggaaagtcgggcgatcggggtgaatccggcccagcgggtcctgctggagccccaggccccgctggatcgcggggcgcacctggcccccaaggaccgcgtggggataaaggggagactggcgagagaggcgccgccggaatcaaaggtcaccggggattagaaaagagggaggcagggaagtcgggtgatcgaggcgaatcaggtcctgctggacccgctggcgcgccgggtcctgctggtagcagaggagcccctgggcctcaaggcccgaggggtgataagggtgaaaccggagaacgaggcgccgctggtataaagggacatcgtggactcgagaagcgagaagcggggaaaagtggggacagaggagagtctggtcctgccggacccgccggtgctcctggtccagcaggctcccgcggcgcgcctggtccgcaaggtcctaggggagacaaaggagaaacgggcgagcgaggcgccgccgggatcaaggggcatcgggggttggagaagaggtaa
编码17S28-8的DNA序列,如SEQ ID NO.72所示:
gaggccggtgtacccggaagcgtggggccgaagggcagctcgggttcaccaggcccacaggggccaccaggcccggtaggcctacaaggtttgcgcggtgaggtggggttacccggagtaaaaggtgataaggggcctatggggcctcccggtcctaaaggcgaccagggtgaaaagggtccgcggggactggagaaaagagaagcgggtgttccagggtcggttggtcctaagggaagttcgggttctccggggccgcaaggtcctccaggtcccgtcggtttacagggcctacgtggagaagtcggactccccggagttaagggcgataagggacccatgggtcctcctggtcccaaaggtgaccaaggcgagaaaggcccaaggggactcgagaagcgggaagcgggagtccctggctccgttggccctaagggaagttccggaagtccgggaccgcaaggtcctcctggccctgtcggcctccaaggtttgaggggagaggttggactccccggcgtcaagggcgacaaaggccctatggggccacctgggcctaagggcgaccaaggcgagaaaggccctcgcgggcttgagaagcgtgaagctggagtgcctgggtcagtaggcccaaaaggatcgtccggatcaccgggacctcaggggccaccgggtcctgtaggtctacagggcctcaggggcgaggtaggtttacctggagtcaagggagataagggacctatggggccgccaggtccgaaaggcgatcaaggggaaaaagggcctcgtggactagaaaaacgtgaggcaggcgtccctggatcggttggtcctaaaggttcttcaggtagtcccggtccccagggacctcccgggccggtagggctacagggcttacgaggggaggtgggcctcccaggggttaaaggggataaaggtcctatgggtcctccgggtccaaaaggtgatcagggtgagaagggtcctcgtgggctggaaaagagagaagcaggtgttccaggctctgttggaccgaaggggtcttctggaagccctggtcctcaaggtcctcctggtccggtcggacttcagggattgcgaggcgaggtaggtctgcccggggttaagggtgacaaagggccaatgggaccgccagggccgaaaggcgaccaaggtgaaaaaggccctcgaggtctggaaaaaagagaagctggagtaccagggagcgtcggccccaaaggaagttcggggtcccctggaccgcaagggccaccaggtcccgtagggttacaaggtctgcggggggaggttgggcttcccggagttaaaggtgataagggaccaatgggtcctcccggtccaaagggtgatcaaggagagaaaggaccgcgcgggctagaaaagagggaggccggtgtcccaggtagcgttggtcctaagggcagctcaggctccccaggaccccaagggccgccggggcctgtggggttgcaaggtttgcgaggagaagtgggccttcccggggtgaagggggacaagggacctatgggaccacccggtcccaaaggtgaccagggtgaaaagggtcctcgtggacttgaaaaaagataa
编码17S1N6-6的DNA序列,如SEQ ID NO.73所示:
gaagcgggacctcccggcagtggtgaaaagggcgaacgaggcgcagccggagagcctggacctcatgggcctccgggcgtcccgggaagtgttggtcctaaaggtagctccggatctccaggtccacagggaccacctggcccggtaggccttcaaggactgagaggtgaggtcggccttccaggcgtgaagggcgataaaggtcctatgggtccacctggacccaagggagatcagggggagaaagggccgaggggcttagaaaaacgcgaagcagggcctcctgggagcggagaaaagggcgagcgcggagccgcaggcgagccaggtcctcatggtcctccaggagtgcctgggtccgtcggcccaaaggggtcttctggttcgcctgggcctcaaggaccaccaggtcccgttggtttgcagggtctgcgtggagaagtgggccttccgggagttaagggcgacaagggtcctatggggcctccggggccgaagggcgatcagggcgaaaaaggcccccgcgggttagaaaaaagagaggcaggaccacccggctcaggtgagaagggtgaaagaggagccgctggggagccaggaccacacggcccccccggagtcccgggatctgttggacccaaaggttcttctgggagcccgggtccccagggaccgccaggcccagtaggtctacaaggactcagaggggaggtgggtctaccgggggtcaaaggagataagggtcctatgggtcctcccggtccaaaaggggaccaaggagagaagggacctcggggtttggaaaaacgggaagctggtcctcccggtagcggtgagaaaggcgagcgaggtgctgctggggaaccggggccacacggtcctcctggcgtgcccggctcggtcggacctaaaggttcttctggttctccgggtcctcaggggccgcctggtcctgtcgggcttcaaggtctccgcggtgaggttgggctccccggtgtcaagggagacaaagggccgatggggccgccaggtcccaagggagaccagggagaaaaaggtcctcgtgggttagaaaaacgggaggcgggaccgcctggttccggcgagaagggggaacgaggcgcggccggggaaccaggaccccatggaccgccaggtgttccggggtccgtaggtccgaaaggctcatcgggttcgcctggcccacaaggaccaccaggcccagtgggcctacaaggtctgaggggggaagttgggctccctggcgtaaagggagacaaagggccgatgggtcctcctggacccaaaggtgaccaaggagaaaaaggtccgaggggcttagagaaacgtgaagcaggtccgccaggttcaggtgagaagggggaacgtggagctgccggggagcctggcccgcacggccctcccggcgttcccggctcagttggaccaaagggatcgagtggaagtcctggtcctcaaggcccacctggtccagtaggtctacagggcttgaggggggaggtaggactgccgggcgtaaagggcgataagggtcccatgggtcctccagggcctaaaggtgatcagggggagaagggtccccgagggttggagaagcggtaa
编码17S1N7-7的DNA序列,如SEQ ID NO.74所示:
gaggcaggtcctccgggttctggtgagaagggcgaaaggggagctgcgggagaacctggcccacatggtcctcctggtgtacccgggtcggttggtcctaaagggtcttcaggctcccccggtccccagggaccaccgggtcctgttggtctccagggcctgcgaggggaggtgggacttccgggagtcaaaggagacaaaggtcctatgggtcctcctggtcctaaaggcgatcagggtgaaaagggaccgcgaggcaagagagaggctggtcctcccggaagcggtgagaagggtgagcgaggggctgctggagagccaggtccacacggacctcccggtgttcccggcagcgtaggcccaaaagggtcgtctgggtccccggggccacaaggtccccctggacccgtagggttgcaaggcctacggggagaagtaggattaccgggtgtgaagggcgacaaaggtcctatgggaccccccggtcccaagggtgatcagggtgagaagggtccgaggggtaaacgcgaagctggtccaccaggatctggcgaaaagggagaacgtggtgctgcgggagagcctgggccacacggtcccccgggagtacctgggagtgttgggccgaagggcagtagtggctcaccggggccgcaaggcccccccggaccggtaggactacaaggcttacggggggaggtaggtcttcctggggtgaagggggataaaggtcctatgggaccacccggcccaaaaggggaccagggagagaaagggccacgcggaaaaagggaggcaggcccaccggggtcgggtgaaaagggtgaacgcggagcggcgggggaaccggggcctcatgggccaccgggcgtgccaggttcggttggtcctaagggttcaagcggatctccaggcccgcagggacctcctggacccgttgggcttcagggactgcgtggcgaggtcggtctgcccggcgtcaagggagacaagggtcctatgggtcctccgggtccaaagggagatcagggtgagaagggacccagagggaaaagagaagctggccctccggggtccggggagaagggggaacgtggggcagccggtgagccgggacctcacggcccaccaggcgtgcctgggtccgttggcccaaaggggtcctcgggctcgccaggccctcagggaccaccgggtccagtcggattacaaggtttgcggggagaggttgggctccctggagttaaaggtgacaaaggccctatgggtcccccgggtcctaaaggcgaccaaggcgaaaaaggaccgagagggaaacgtgaagcaggtccacctgggtcaggtgagaaaggcgagcgcggggccgccggggaaccggggccacacggtcctcctggcgtccccggcagcgtcggcccgaaaggaagttctggaagtccgggaccacagggtccgcccggtcctgtagggctacaaggtttaagaggcgaagtgggactccctggcgtgaaaggtgacaaaggccccatgggaccaccaggtcctaaaggggatcagggagaaaaggggcctaggggtaaacgagaggcaggtccccccgggagcggagaaaagggtgagcgaggggccgccggtgaaccaggcccgcatggtccaccaggcgtccccggatcagtcggaccaaaaggcagttctggctcacctggaccgcaaggtccgcctggacctgtaggacttcaaggcctgcgtggtgaagttgggttgcctggggttaagggggataagggtcctatgggtccccctgggccaaaaggggatcaaggcgaaaagggtccccggggaaaaaggtaa
编码17S1NK-7的DNA序列,如SEQ ID NO.75所示:
gaagcaggtccgccagggagcggtgaaaaaggagaacgcggagcggcgggcgagccaggcccgcacgggccgcccggtgttcccggctctgttggaccgaaaggtagttctggttcacccggacctcaaggtcctcctgggcctgttggacttcaggggcttagaggtgaggtcggactccctggtgtgaaaggggataaagggcctatgggtcctcctgggccaaaaggggaccagggagagaaggggaagagggaggctggtcctccaggatcgggggaaaaaggagaacgtggagctgccggcgagccggggccacacggtccaccgggcgtccccgggtccgtgggacccaagggctcatcaggatcgccaggaccgcagggtcctccaggtcctgttgggttgcaggggttacgtggagaagtgggtctccccggtgttaaaggtgacaagggtcccatgggaccccccggtcctaaaggagaccaaggagagaaaggtaaacgagaggccgggccacctgggtccggcgagaagggcgaacgtggtgccgctggcgagcccgggcctcacggtccaccgggagtgcccgggtcagtaggcccgaaaggaagttccggaagtccaggtcctcaaggtcccccgggacctgtaggcctgcaagggttgcgtggtgaggtcggtctccctggggttaagggtgacaaaggtcctatgggtcctcccggacctaaaggggatcaaggggaaaaaggaaaacgagaggctggaccaccaggttctggcgaaaaaggtgagcgaggcgccgcgggcgaacccggcccgcatggccccccaggcgtaccaggctctgtgggtccgaagggctcgagcggttcacctggacctcaagggccacctggaccggttgggctacaaggcctacggggggaggtgggactaccgggcgtcaaaggtgacaaaggcccgatgggaccaccaggccctaagggagatcagggcgagaagggtaagagagaagcaggaccgccgggaagcggcgaaaaaggtgagcgcggagcagcaggggaacccgggccgcatggtccccctggcgtacctggtagcgttggtcctaaagggtcgtcgggttccccaggtcctcagggtccccctggtcctgtcggtctgcaagggttaaggggggaagtaggattaccgggcgtgaaaggagataaaggtcctatggggccacctggtcctaagggcgaccagggtgagaagggtaagcgcgaagctggcccgccgggtagtggtgagaaaggcgagcggggggcagcgggcgaaccaggtcctcatggtcctcctggtgtgccaggctccgtcggccctaagggatctagcggaagcccgggtccgcagggaccaccaggtcctgttggccttcaagggttgagaggtgaagtcggcttaccaggggtcaaaggtgataaaggcccgatgggtccacctgggcctaagggggatcagggggagaagggaaagcgggaagccggtccccccggaagtggagaaaagggggagaggggggctgcaggtgaacctgggcctcacggaccaccgggtgttccaggatcagttggacccaagggtagttcgggatctcctggccctcaaggcccccctggtcctgtaggacttcaagggctgcggggggaggtaggtctccctggtgtcaaaggagacaaaggaccgatgggtcctcctggtcctaagggagatcaaggagaaaaagggaagcgctaa
编码3A5D15D-5的DNA序列,如SEQ ID NO.76所示:
gatgggaacccggggtcggacggcctgccgggtcgcgacggctcaccaggtggcaaaggcgaccgtggtgagaatggatctccgggagcacccggtgcccctggacatcctggtccccccgggcctgtcggtcctgctggcaagtcgggtgatagaggagaatccgggcctgccggtcctgctggggcaccagggccagcaggaagccgtggggctcccggtcctcaaggtccccggggggacaagggtgagaccggagaacgcggagctgcgggaatcaaggggcatcgcggcttagagaaacgtgatggcaacccgggctctgacgggcttcccggtcgggacggcagccccggtgggaaaggtgatcgaggggaaaacggctcgcctggggctccaggtgcccccggccaccctggaccgccaggtcctgtcggccctgccggtaagagcggagatcgaggtgaatcaggacctgccggcccagccggtgctcctggtccagctggaagccgtggtgctcccggcccgcagggtcctcgtggcgataaaggcgagacgggtgaacggggcgcagccggaattaaaggacacagaggtcttgaaaagagggatggaaacccaggctcagatggtctaccaggcagggacgggtcacccggaggaaagggtgatcggggcgaaaacggctccccgggagcgccaggtgcccctgggcatcccgggccacccggaccggtgggtcccgcagggaaatcgggggataggggcgagtctggaccagcggggcctgcgggagcacctgggccagcaggtagtaggggggcgccgggtccgcaagggccacggggcgacaaaggggagactggcgagaggggggctgccggcatcaagggccaccgcggcctagaaaagagagacggcaatcctggttctgacggattgcctggtcgagatggttctcctggtggaaagggggatagaggggagaatggatctcctggcgccccaggtgcgccggggcatccaggcccgcccgggccggttggaccagcgggtaaatcgggcgacaggggggaaagcggtcctgcaggaccagcgggcgcaccggggcctgctgggagtagaggcgctccaggtccgcaaggtccccgaggggacaagggcgaaactggggagcgtggtgcggccggcataaagggacaccgaggactcgaaaaacgcgatggaaatcccggctccgacggactccctgggcgggatggcagtcccggaggtaagggagacagaggcgagaatggaagtcctggggcgcctggcgctccgggacatccagggccacccggaccggtaggaccggcaggaaaatccggtgaccgcggcgagtcaggtcccgcaggaccagcgggtgcacctgggccggcgggtagtcgtggggctcccgggccgcagggtccgagaggtgataagggagagacaggagaacgcggtgccgccggcattaaagggcaccgaggcctggagaaacgataa
编码3A5D15E-5的DNA序列,如SEQ ID NO.77所示:
gaagccgatggtaacccaggaagtgatggcctcccggggcgcgacggttctcctggcggaaaaggcgatcgtggagaaaatgggtcgccaggtgccccgggagcgcccgggcatcctggtccaccaggcccggttggtcctgcagggaagagtggggaccgcggagagtcgggtccagcgggacctgcaggcgctcctggcccagccggcagtcgcggtgcccctgggccacagggtcccagaggagacaagggggaaaccggggaaagaggagctgctggaataaagggacaccgggggctagagaaaagggaggccgacgggaacccaggatcagacggtctgccgggtcgggatgggagccctggcggaaaaggggatagaggcgaaaacggtagtccgggggcgcctggagcacccggccacccaggtcctcctggaccagttggtccggcaggtaaatccggggatcgcggcgagagcggccccgctggacctgcgggggcgccaggcccggcgggatcgcgaggtgcccctggtccgcaggggccgcgtggcgataagggtgagacaggtgagcggggagccgcgggcatcaaaggtcataggggcttagagaagcgtgaagcagatggaaatcccggatctgatggactgccgggacgagatggctcccctgggggcaaaggcgacagaggagaaaatggttcaccgggcgcaccaggtgctccaggccatccaggtccccccggcccagttggtcctgctggcaaaagtggagacagaggtgagtcgggacccgctgggcctgcgggagcaccaggtccggccggctcgcgcggtgctccaggcccccagggtccgcggggcgataagggcgagacaggagagcggggagccgcaggtattaaagggcatcgaggtttggagaaacgtgaagcagacggaaacccgggttcagatggactaccaggccgtgacggcagcccggggggaaagggtgaccgaggtgaaaacggttctcctggagcccccggtgccccggggcatcctgggcctccaggccccgtaggacccgcaggcaaatctggggaccgaggggaaagcggccccgctggtcctgcgggcgcccccggtcccgcgggttctcgtggtgcacctggcccccaaggtcctaggggtgacaagggggaaacgggggagcgtggggcagctgggataaaaggccaccggggtcttgaaaaacgcgaggcggatgggaatccgggaagcgacggcttaccgggacgggacggctcacccggggggaagggtgatcgcggggagaatggttcccccggtgctcctggggctcctgggcaccctggtccgcctggtcccgtcggaccggcagggaaatcaggggacagaggggaatccggacctgctggtcctgccggggctcccggtcctgctggttctcgtggagcccctggtcctcaagggccaaggggtgataagggtgaaactggcgagaggggagctgcagggatcaagggccaccgaggactcgaaaagaggtaa编码3A5D15R-6的DNA序列,如SEQ ID NO.78所示:
gacggaaatcccggaagcgacggtcttcccggaagggatggctcccctggcgggaaaggtgatcgcggcgaaaacgggtctcccggcgcgcccggcgccccgggccaccctgggccacctggtccggttggtcctgctggcaaatcaggtgaccgtggggaatcggggccagctggtcctgctggggcgccaggacccgcaggcagtcgtggcgcgcccgggcctcaagggccacgaggtgataagggagagaccggcgagaggggggcggctggaatcaaacgggacggtaatcccggttcagacggcctcccgggacgcgacggctccccggggggtaaaggggatcgcggtgaaaacggatcgccaggtgcgccaggggcgcccggacaccctggtcctccggggcctgtcggcccggcaggcaagtctggcgacaggggcgagtctggtcctgcaggccccgcaggtgctcctggcccagcaggatcacgtggcgcccccggaccacaggggccgagaggggataagggcgaaactggtgaacggggggcggctggaattaagagagatggtaatcccggtagtgatgggctaccgggacgagacggttcacccgggggtaagggagatcgaggtgagaatggcagtccaggcgcccctggtgctcctgggcatcccggcccacccggtccggttggacccgcgggcaaatccggggaccggggggagagtggcccggccggtcctgcgggtgccccgggaccagcgggaagtaggggggctccggggccacaaggtcctcgtggagataagggcgaaacaggtgagagaggagctgcagggattaagagggacggaaatcccgggtcggatgggttgcctggacgggatggtagccccggtggtaaaggagaccgaggcgaaaacggatctcccggtgcgcctggagccccaggtcacccggggccacctggtcctgtaggccctgcaggtaagtcgggtgaccgcggagagagcggaccggccggtcctgcaggagcccctggacctgccggttcccggggagcaccaggcccccaaggaccgagaggtgacaagggggagacaggtgagcgtggggctgctgggataaaaagagatggtaacccgggctctgatgggctgcctggaagggatgggagcccaggtggaaaaggagatcggggtgagaacggttctcctggagccccgggagcccccggccatccggggccgccgggacctgtcggtcctgctggaaaatcaggcgatcgtggggaatcaggaccagctgggcctgctggagcaccggggccagcagggagcagaggtgctcctggacctcagggaccgcgaggcgacaaaggggagacgggcgaacgcggtgcggcaggtataaaacgagacgggaacccaggctctgatggtttaccaggtcgtgacggctcgcctggaggcaagggagatcgcggtgaaaatggttcccccggtgctcctggagcgcctgggcatccggggcctccaggtccggtaggtccagcaggcaagagcggggacaggggagaatccggaccagctggtcctgccggagcgccaggccccgcaggaagtcgaggggctcctggtccccaaggtcctcgtggcgacaaaggcgagaccggtgaacgcggcgctgcaggcatcaagagataa
编码3A5D15KR-6的DNA序列,如SEQ ID NO.79所示:
gacggtaaccctggaagtgacggattgccggggcgagacggttcacccggaggaaagggcgatcgcggcgaaaatgggtcaccgggcgctcctggggcaccagggcatccgggtccccccggtcctgttgggccggcgggtaagtctggtgatcgaggcgagtctggccctgcgggtcctgctggtgcacctggacctgccggatcgagaggggctccagggccgcaaggacctaggggtgacaaaggcgaaacgggtgagcgaggagccgccggaattaaggggaaaagggatggcaaccccgggtccgatggcctgccaggacgcgatgggtcgcccggaggcaagggtgacagaggggagaatggctctccaggtgcaccaggtgccccggggcaccccggtccgcctggaccagttggaccggcgggaaagtctggagatcgcggggagagtggaccggctggtcctgcaggggcaccgggtcccgctgggtctcgcggagcgcctggcccccaaggacccagaggggataagggcgaaactggagagcgtggcgcggcaggaataaagggcaaacgtgatggcaatccagggtcggacggacttcctggccgggacggttccccagggggaaagggtgacagaggcgaaaacggctcgcccggtgcgccaggggcgcctggtcatccggggcctccgggtccagtgggaccagccggaaaaagcggggatcggggggaatctggaccggctggaccagccggcgcaccaggccccgccggatcgaggggggcgcccggaccgcagggtcctagaggggataaaggtgagaccggcgagaggggcgcagctgggataaagggtaagcgggacggtaaccccggctccgacggtctcccaggacgagacgggtcaccgggtggtaagggagaccgaggcgaaaatgggtcacctggtgcacccggcgcccctggacaccccggtcctcctggaccagtgggacccgcagggaagagcggtgacagaggggagagtgggcctgcaggaccagctggcgctccgggaccggccggaagtcggggtgctcccggcccccaagggcctagaggggataaaggtgagaccggggaacgtggcgcggccggtatcaagggcaaacgcgacggcaacccaggttcggatggactaccagggcgagatggttcacctggcggtaaaggcgatcggggggaaaatggcagccccggtgctcctggagcaccgggtcatcctggtccgcctggtcctgttggaccggctgggaaatccggtgaccgcggagaatccggcccggccggtccggctggagcccctgggccggctggcagtcgtggcgcgcctggcccacagggtccgcgtggagataaaggggaaacaggtgagaggggcgcagcgggaatcaaggggaaacgggatggcaacccggggagcgacgggttacccgggcgagacggttccccaggaggcaagggcgatcgtggcgagaatggtagccccggtgctccaggagcacctggccacccagggccaccaggaccggtaggacccgctggtaaatcaggcgatcggggtgagagtggccctgcgggacccgcgggcgcccccggacctgccgggagccgcggtgctcctggaccacaaggtcctaggggcgacaaaggtgaaacaggggaacgtggcgctgcggggattaaaggaaaaaggtaa
编码3A5D15EKR-6的DNA序列,如SEQ ID NO.80所示:
gacggaaaccctggctcggatggtcttccaggacgggatggcagtcccggcggaaaaggcgaccggggagaaaacggttcacccggtgctcctggagcaccaggacatcctgggccacccggccccgttggtccggcggggaaatcaggcgacaggggcgaaagtgggcctgccgggcctgcgggagccccgggtccggcaggtagccgaggggcaccaggccctcaagggccacgaggtgacaagggagaaacaggcgaaaggggtgctgctggaatcgagaaacgtgatgggaatcccgggtcagacggcctaccgggacgggatgggtcccccggcggcaaaggggaccgaggggagaatggttcgcctggtgccccaggcgcgccgggtcatcctggtcccccgggacccgtcggtcctgctggcaaaagtggggatcgtggagaaagtggacctgccggacctgccggggctcctggtcctgctggatcgcgcggcgcaccaggacctcaaggtcctagaggagacaaaggggagacgggagaaagaggagctgcagggatagaaaaacgggatgggaatcctggaagcgatgggttaccaggcagggacggaagccccggcgggaagggggacaggggggagaatggttcaccaggtgcgcccggagccccgggacatcccgggccgcctggtccggtagggcctgcaggtaaatccggtgatagaggagaatccggacctgcggggccagccggagcgccggggccggcgggtagcaggggcgcaccgggacctcaagggccacggggtgataagggagaaaccggtgagaggggcgcggctggaattgagaagcgtgatggtaaccctgggtccgatggactgcccggccgagacggctcgcctggcggcaagggcgaccgcggcgagaatgggtctcccggtgctcctggtgctcctggacaccctggtcctcccggtccggtgggtcctgccggcaagagtggggacagaggggaatcggggccggctggaccggcgggtgcaccgggtcccgctggctcacgaggtgcgccggggccacaaggcccacgcggcgataagggggagactggtgagcgtggagctgcaggaatcgagaagcgcgatggcaacccaggtagcgacggattgccaggtcgtgacggatctcctgggggtaagggtgatcgaggagaaaatggctcaccgggtgctcctggggcgcccggccacccgggacctcctggtcctgtaggtcccgccggcaaatcgggcgaccggggtgagtctgggcctgcaggcccggccggtgccccaggtccagcagggtctcgtggcgcgcccggtccccagggtcctcgtggggataagggcgagacgggagaaagaggtgcggcaggcatagaaaagcgcgatgggaaccctggatctgatgggctcccagggagagacggaagccccggcggaaaaggtgatcggggcgaaaacggaagtccaggtgcgcccggagcacccggccacccaggtccacccggaccggttggtcccgctgggaaatctggtgacagaggggagtccgggccagcagggccggccggcgcaccaggaccagctggttctcgtggtgcccctggacctcaaggtcctaggggggacaaaggcgagaccggggaacgcggtgcggctgggattgagaagcgctaa
编码3A5D15G-6的DNA序列,如SEQ ID NO.81所示:
gacggcaatcctggatctgacgggctgcctggccgtgacgggagcccagggggtaaaggcgaccgcggagaaaatggtagccctggcgctcctggtgctcccggtcatcctggtcccccgggaccagtggggccggctggaaaaagcggtgaccgtggtgaatctggcccagcgggacctgcgggagcccctggtcctgccggttctcgtggcgcacccggacctcaaggtccgcggggtgataaaggcgagacaggggagcgaggtgccgcaggcattggaaaaagggacggcaatccgggttcagacggcttgccaggaagggatggctcgccgggtggtaagggagacaggggagaaaacggttccccaggtgctcctggcgcacctggccaccctggtcctccggggcctgtaggaccagctggcaagagtggagatcgcggagagtctgggcctgcgggtccggcaggtgctcccggacccgccggatcacgcggtgctcctggaccgcaaggtccgcggggtgacaagggagagactggggagaggggtgcggcgggtattggtaagcgtgatggcaatccaggcagcgacggtctaccggggcgggatgggagtcccggtgggaagggggataggggtgagaacggctctccaggggctcccggtgcccctgggcatcctggtcctcctgggcctgtgggtcctgccggcaagtcaggggatcgaggcgagagtggtcctgctggtcctgctggggcgccaggaccagcggggtctcgaggcgcccctggcccgcagggtccaagaggtgataagggggagaccggggaacgaggagccgctgggatagggaagcgcgacggaaatcccgggagtgatgggcttccaggccgtgatggaagtcccggagggaagggagatcggggcgaaaacggttctcccggtgctcctggagcgcccggacaccccggcccaccaggccctgttgggccggccgggaaaagcggcgatcgtggcgaatctggtcctgcgggtccagctggtgctcctgggccggcaggttctcgtggtgcacccggaccgcagggacccagaggagataaaggggaaacgggtgagcgaggggcagcaggtatcgggaaaagggacggtaaccctggctccgatggcttaccggggcgagacggatcgccggggggtaaaggagaccggggagagaacggttcaccaggcgcacccggcgctccagggcatcctgggccacccggcccagttggtcctgctggtaaatcgggggaccgaggcgaatcaggacctgcaggccctgcgggtgcccccggccccgctgggagtcgtggtgcacctgggccacaaggcccgcgcggcgacaagggggagacgggagagcgcggtgccgctggaatcggcaagagagatggtaaccccgggagcgacggactcccaggcagagatgggtccccgggcggcaaaggagacagaggtgaaaatggatcacctggtgcgcctggtgctcctggacacccaggaccgccaggtccagtcggtcctgccgggaaatcgggtgatcgtggtgaatccgggcctgcaggtcccgctggagcgccgggtcccgcagggtcgaggggcgcgccaggtccacaaggtcctcggggcgataagggcgaaacaggtgaaagaggcgcggccggcataggaaaaagataa
以上DNA序列SEQ ID NO.71~SEQ ID NO.81均由南京金斯瑞生物科技有限公司合成。将合成的基因克隆于pPIC9K载体上,克隆位置为第1203bp(即α-factor secretionsignal/cleavage site1203,查找序列为AAAGAAGAAGGGGTATCTCTCGAGAAAAGA)与酶切位点Not I之间。获得重组表达载体pPIC9K-3A5D29N-9、pPIC9K-17S28-8、pPIC9K-17S1N6-6、pPIC9K-17S1N7-7、pPIC9K-17S1NK-7、pPIC9K-3A5D15D-5、pPIC9K-3A5D15E-5、pPIC9K-3A5D15G-6、pPIC9K-3A5D15EKR-6、pPIC9K-3A5D15KR-6、pPIC9K-3A5D15R-6。其它可用于毕赤酵母的表达载体如pPICZαB、pFLDα也与pPIC9K有类似的效果。
分别将上述重组表达载体质粒(pPIC9K-3A5D29N-9、pPIC9K-17S28-8、pPIC9K-17S1N6-6、pPIC9K-17S1N7-7、pPIC9K-17S1NK-7、pPIC9K-3A5D15D-5、pPIC9K-3A5D15E-5、pPIC9K-3A5D15G-6、pPIC9K-3A5D15EKR-6、pPIC9K-3A5D15KR-6、pPIC9K-3A5D15R-6)10μg用SacⅠ(购自大连TaKaRa公司)37℃酶切消化过夜,使其线性化,再使用PCR产物纯化试剂盒(购自生工生物工程(上海)股份有限公司)回收线性化质粒,使体积控制在10μL左右。
将线性化质粒电转化入本发明实施例2中构建的CPB定位融合功能蛋白功能途径的4种底盘工程菌株(HCPB-PPKEX2菌株,保藏编号CGMCC No.25815;RCPB-PPKEX2菌株,保藏编号CGMCC No.25817;HCPB-SCKEX2菌株,保藏编号CGMCC No.25816;RCPB-SCKEX2菌株,保藏编号CGMCC No.25818)的感受态细胞中,将电转后的菌液涂布于MD平板上,每100μL~200μL涂布一块平板,室温静置10min,于30℃倒置培养2-5天,直至有单菌落(阳性转化子)出现。
向MD平板表面加入2mL无菌双蒸水,然后用无菌三角涂布器轻轻刮下平板表面的His+转化子,并转移到50mL离心管中。以无菌双蒸水稀释菌悬液,105个细胞涂布于含有0.5mg/mL G418的YPD平板上,倒置,30℃培养3~4d后至单菌落出现。从YPD平板上挑取菌落至无菌96孔板中(200μL YPD/孔),混匀,于30℃培养48h;混匀孔中菌液,各取10μL接入至一块新的无菌96孔板,于30℃培养24h后再重复一次此操作;24h后,从第三块96孔板中取出1μL分别点在含有1.0mg/mL和4mg/mL G418的YPD平板上,于30℃继续培养96h~120h。毕赤酵母转化子若能在含高浓度G418的平板上生长,说明该转化子能够高效率表达外源基因,经过这一步筛选可得到高效表达的重组酵母工程菌种。
后续以表达HCPB-PPKEX2的底盘细胞工程菌株(保藏编号CGMCC No.25815)和表达RCPB-PPKEX2的底盘细胞工程菌株(保藏编号CGMCC No.25817)为表达宿主细胞来进行说明。
本发明的重复串联表达体系构建了多种表达重组小分子胶原蛋白的工程菌株,其以5种表达HCPB-PPKEX2的底盘细胞工程菌株为表达宿主细胞构建的工程菌株送至中国微生物菌种保藏管理委员会普通微生物中心保藏,菌种保藏编号分别对应的是:
表达重组小分子胶原蛋白3A5D29N的菌株,保藏编号为:CGMCC No.25819;
表达重组小分子胶原蛋白17S28的菌株,保藏编号为:CGMCC No.25821;
表达重组小分子胶原蛋白3A5D15D的菌株,保藏编号为:CGMCC No.25827;
表达重组小分子胶原蛋白17S1N6的菌株,保藏编号为:CGMCC No.25829;
表达重组小分子胶原蛋白3A5D15E的菌株,保藏编号为:CGMCC No.25828。
其以2种表达RCPB-PPKEX2的底盘细胞工程菌株为表达宿主细胞构建的工程菌株送至中国微生物菌种保藏管理委员会普通微生物中心保藏,菌种保藏编号分别对应的是:
表达重组小分子胶原蛋白3A5D29N的菌株,保藏编号为:CGMCC No.25820;
表达重组小分子胶原蛋白17S28的菌株,保藏编号为:CGMCC No.25822;
以上工程菌株的保藏地址均为:北京市朝阳区北辰西路1号院3号;保藏日期均为:2022年9月26日。分类命名均为:巴斯德毕赤酵母Komagataella phaffii。
分别挑选高浓度G418的平板上生长的单菌落,置于装有10mL BMGY培养基的100mL三角瓶中,于28-30℃、220rpm培养至OD600为2~6(16-18h)。室温下1500~3000g离心5min,收集菌体,用BMMY培养基重悬菌体,使OD600为2左右,放置于28-30℃、220rpm的摇床上继续生长3天,每24h向培养基中添加100%甲醇至终浓度为1.0%。按时间点(开始诱导后每24小时取样一次)分别取菌液样品,取样量为1mL,置于1.5mL EP管中,12000rpm离心2~3min,收集上清,加入5×上样缓冲液(250mM Tris-HCl、pH 6.8,10%SDS,0.5%溴酚蓝,50%甘油,5%β-巯基乙醇),置于100℃金属浴加热10min,进行SDS-PAGE检测。
SDS-PAGE检测结果如图16-19中所示结果,pPIC9K-3A5D29N-9、pPIC9K-17S28-8、pPIC9K-17S1N6-6、pPIC9K-17S1N7-7、pPIC9K-17S1NK-7、pPIC9K-3A5D15D-5、pPIC9K-3A5D15E-5、pPIC9K-3A5D15G-6、pPIC9K-3A5D15EKR-6、pPIC9K-3A5D15KR-6、pPIC9K-3A5D15R-6均于两种底盘细胞工程菌株中,成功有效表达相应大小的重组小分子胶原蛋白,且有效分泌表达于上清中,且电泳条带单一,说明本发明小分子胶原蛋白串联重复氨基酸序列设计的目的实现:即表达多达几百个以上氨基酸序列的大分子蛋白(小分子胶原蛋白单体串联重复结构),在底盘细胞工程菌株中,最终可表达获得序列相同且条带单一的重组小分子胶原蛋白(胶原蛋白于电泳时会有一定的电泳迁移延迟,所以在电泳时其表观分子量会偏大)。
对得到的小分子胶原蛋白3A5D29N、17S28、3A5D15D、17S1N6的冻干品用胰蛋白酶将其酶解,Nano-HPLC-MS/MS质谱检测重组胶原的胰蛋白酶解后肽段(交由苏州普泰生物技术有限公司完成),并将检测到的肽段进行序列比对(Uniprot数据库)。如图20和21所示,质谱检测结果表明3A5D29N、17S28、3A5D15D、17S1N6这几种重组小分子胶原蛋白酶解后检测到的肽段及其所覆盖序列均属于氨基酸序列设计时选择的人胶原蛋白序列的相关区域,说明其成功表达。
取3A5D29N、17S28的冻干品进行LC-MS分析(毛细管高效液相色谱仪ThermoFisher Scientific Ultimate 3000、电喷雾-四极杆飞行时间质谱仪质谱仪AB SCIEXTripleTOF 5600Mass Spectrometer,色谱柱ACQUITY UPLC Protein BEH C4 Column)获取其去卷积分子量(委托北京百泰派克生物科技有限公司完成)。结果如图22所示部分结果(图中去卷积分子量值显示值保留小数点后1位,有四舍五入处理),3A5D29N理论分子量4988.35Da,实测去卷积分子量为4987.5Da;17S28理论分子量5861.60Da,实测去卷积分子量为5833.92Da;蛋白质在表达过程可能产生的糖基化修饰以及检测产生的误差,重组小分子胶原蛋白3A5D29N、17S28实测去卷积分子量与理论值基本一致。
底盘细胞工程菌株效果及表达体系的验证:
本发明构建的底盘细胞工程菌除去有将序列长的蛋白质序列切割为单一且短的小分子胶原蛋白外,还有一个重要的作用就是将切割后单一且短的小分子胶蛋白单体的氨基、羧基两端的非胶原蛋白氨基酸序列进行切割,以3A5D29N-9、17S28-8于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株的表达示例,将表达的重组小分子胶原蛋白3A5D29N、17S28进行氨基、羧基两端的检测,以验证底盘细胞工程菌株中Kex2、Ste 13及CPB酶的协同作用是否建立。委托北京百泰派克生物科技有限公司对3A5D29N-9、17S28-8分别于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株的表达重组小分子胶原蛋白冻干品进行N端(氨基端)、C端(羧基端)的测序验证以及基于LC-MS/MS的蛋白全序列分析。
N端测序:通过岛津全自动蛋白质多肽测序仪(PPSQ-33A)对样品的N端序列进行分析(Edman降解法):取适量重组小分子胶原冻干品样品溶解,将样品溶液滴在PVDF膜上,放置到反应器中,组装好反应器后将其放置于仪器固定位置,通过软件PPSQ-30Analysis设置:样品名称、样品号、测试循环数、选择方法文件,设置完成后开始测试,PPSQ-33A产生的原始数据及图谱由PPSQ-30DataProcessing软件识别标峰并导出对应图谱,数据分析后,确定蛋白质N端序列。
结果检测到3A5D29N-9于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株的表达重组小分子胶原蛋白的N端序列均为:NH2-Gly-Lys-Ser-Gly-Asp-Arg-Gly,即GKSGDRG,与理论序列
(GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE)的N端氨基酸序列一致。检测到17S28-8于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株的表达重组小分子胶原蛋白的N端序列均为:NH2-Gly-Val-Pro-Gly-Ser-Val-Gly,即GVPGSVG,与理论序列
(GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEK GPRGLE)的N端氨基酸序列一致。
C端测序:取适量重组小分子胶原冻干品样品溶解后进行胰蛋白酶(Trypsin)、胃蛋白酶(Pepsin)酶解处理,之后将处理好的样品通过液质联用(LC-MS/MS)分析,得到质谱原始结果的raw文件,经过软件Byonic分析,匹配数据,质谱数据经过数据库检索,得到鉴定结果,其检测C端肽段的二级质谱图如下图23和24所示。
结果表明:(1)检测3A5D29N-9于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株中表达得到的重组小分子胶原蛋白的检测C端序列均列为:GHRGLE,与理论序列
(GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE)的C端一致;(2)检测17S28-8于HCPB-PPKEX2底盘细胞工程菌株中表达重组小分子胶原蛋白的检测C端序列为VGLPGVKGDKGPMGPPGPKGDQGEKGPRGLE,检测17S28-8于RCPB-PPKEX2底盘细胞工程菌株中表达重组小分子胶原蛋白的检测C端序列为KGPMGPPGPKGDQGEKGPRGLE,均与理论序列
(GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEK GPRGLE)的C端一致。
基于LC-MS/MS的蛋白全序列分析:进一步的,取重组小分子胶原冻干品样品进行胰蛋白酶(Trypsin)、糜蛋白酶(Chymotrypsin)、胃蛋白酶(Pepsin)、胰蛋白酶(Trypsin)&Glu-C蛋白酶、胰蛋白酶(Trypsin)&Asp-N蛋白酶酶解处理,之后将处理好的样品通过液质联用(LC-MS/MS)分析,得到质谱原始结果的raw文件,经过软件Byonic分析,匹配数据,得到全序列测序验证的结果。综合检测结果分析,3A5D29N-9、17S28-8分别于HCPB-PPKEX2底盘细胞工程菌株、RCPB-PPKEX2底盘细胞工程菌株中表达重组小分子胶原蛋白冻干品样品的氨基酸序列总覆盖率均为100%,本发明表达得到的小分子胶原蛋白的氨基酸序列与目标小分子胶原蛋白氨基酸序列一致。
在本实施例中,3A5D29N-9经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会将其分割为相同的小分子蛋白序列单体:
EAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLEKR。其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段54个氨基酸的重组小分子胶原蛋白3A5D29N:
GKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGLE。
在本实施例中,当17S28-8经转录翻译进入内质网、高尔基体构成的蛋白质分泌途径中时,Kex2酶会将其分割为相同的小分子蛋白序列单体:
EAGVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEK GPRGLEKR。其中氨基端的EA两个氨基酸会被Ste 13蛋白酶切割去除,羧基端的KR两个氨基酸会被CPB酶切割去除,最终分泌获得的是一段63个氨基酸的重组小分子胶原蛋白17S28:
GVPGSVGPKGSSGSPGPQGPPGPVGLQGLRGEVGLPGVKGDKGPMGPPGPKGDQGEKGP RGLE。
N、C端的氨基酸序列是否正确直接说明了底盘细胞工程菌株中CPB酶的合成代谢途径是否有效建立、建立后其是否有生物学活性及与其酵母自身Kex2酶、Ste13蛋白酶的协同作用如何。本实施例的结果表明,底盘细胞工程菌株中CPB酶(无论是人CPB酶还是大鼠的CPB酶),均成功的在毕赤酵母中建立了合成代谢途径并正常能发挥其生物学酶活性,并与酵母自身Kex2酶、Ste13蛋白酶协同作用,将经过特定氨基酸设计的长序列的大分子重组胶原蛋白在表达后成功的切割后并去除两端非胶原序列,分泌获得重组小分子胶原蛋白。
实施例4:小分子胶原蛋白的500L级的生产验证
小型发酵罐或摇瓶难以体现大规模工业化生产的实际情况,500L级的发酵罐才具有放大的可能性及表征大规模工业化生产的实际情况。本发明通过对高表达工程菌株进行发酵工艺的优化,在500L级的发酵罐上对各工程菌株的产量进行验证。
3A5D2NT、3A5D29N两种重组小分子胶原蛋白长度高度相似、序列高度同源且纯化方法一致,本发明具体以这2种菌进行小分子胶原蛋白表达的对比。
如下表所示,两种工程菌(表达3A5D29N工程菌株为CGMCC No.25819,表达3A5D2NT工程菌株为CGMCC No.25812)的发酵参数优化后相应的各项指标基本能达到一致,但发酵上清中胶原蛋白表达量(UV法,UV蛋白定量经验公式:C(mg/mL)=0.144*(A215-A225)测定蛋白浓度)及最终纯化冻干品的产量有较大的差异,3A5D29N的发酵上清表达量一般是3A5D2NT的2倍左右(UV法受发酵液中色素干扰大,倍比值偏低),最终得到的纯化冻干品产量是3A5D2NT的4~5倍(直接称重);最佳批次发酵时,发酵上清中蛋白产量(UV法)3A5D29N是3A5D2NT的2倍,其发酵上清液的SDS-PAGE如图25所示,相同体积发酵液得到的纯化冻干品产量比较,3A5D29N的产量接近3A5D2NT的5倍(直接称重),产量得到巨大的提升。其它重组小分子胶原蛋白的重复串联表达体系中的重组小分子胶原蛋白产量也是小分子胶原蛋白单体序列表达的4~6倍。
实施例5:重组小分子胶原蛋白生物学活性与透皮吸收性检测
(1)细胞黏附活检测
重组小分子胶原蛋白的细胞黏附活检测方法参考文献Juming Yao,SatoshiYanagisawa,Tetsuo Asakura.Design,Expression and Characterization of Collagen-Like Proteins Based on the Cell Adhesive and Crosslinking Sequences Derivedfrom Native Collagens,J Biochem.136,643-649(2004)。
具体实施方法:正常培养NIH/3T3细胞(购自中国科学院细胞库,货号GNM6,培养、传代方法参照细胞说明书执行)。取重组小分子胶原蛋白3A5D29N、3A5D2NT、3A5D1NT、17S1NNT、17S3NT、17S28冻干品,对照本公司(江苏创健医疗生物科技股份有限公司)生产的重组Ⅲ型胶原蛋白(专利申请号CN201310033299.6,公开日2013年5月15日,分子量43.6KDa)和重组XVII型胶原蛋白冻干海绵(专利申请号CN202110520499.9,公开日2021年7月30日,分子量23.8KDa)、对照天然人胶原蛋白(Sigma,货号C7774)及牛血清白蛋白(BSA,购自生工生物(上海)股份有限公司)溶解(超纯水或1M HCl溶液),以UV蛋白定量经验公式:C(mg/mL)=0.144*(A215-A225)测定蛋白浓度,再以PBS(pH 7.4)稀释至0.5mg/mL。
向96孔细胞培养板中加入100μL各种蛋白溶液和空白PBS溶液对照,室温静置60min;再向每孔中加入105个培养状态良好的NIH/3T3细胞,37℃、5%CO2孵育60min。以PBS清洗4次孔中细胞。使用LDH检测试剂盒(Roche,04744926001)检测OD492nm的吸光度值,分析数据并进行显著性差异分析(SPSS 22软件,Ducan法,P<0.05)。
OD492nm的吸光度相应的表征出胶原蛋白样品的细胞粘附活性:黏附活性越高,说明蛋白粘附的细胞越多,胶原蛋白能在短时间内帮助细胞贴壁或粘附于细胞外基质之上,更利于构建更佳的细胞外环境。如图26所示,重组小分子胶原蛋白3A5D29N、3A5D2NT、3A5D1NT、17S1NNT、17S3NT、17S28的细胞粘附活性均不低或优于天然人胶原蛋白;同样浓度下3A5D29N、3A5D2NT、3A5D1NT三种重组小分子胶原蛋白的细胞粘附活显著优于更大分子量的重组Ⅲ型胶原蛋白,同样浓度下17S1NNT、17S3NT、17S28的细胞粘附活与更大分子量的重组XVII型胶原蛋白无显著差异。这说明,虽然重组小分子胶原蛋白的氨基酸残基数目更少、序列更短,但它们的氨基酸序列设计实现了分子量小(即序列短)与保持生物学活性(即保持一定的生物学活性位点序列)之间的平衡。
(2)细胞增殖检测
重组小分子胶原蛋白的细胞增殖活检测方法参考2020版《中华人民共和国药典》“三部通则3528人表皮生长因子生物学活性测定法“。
具体实施方法简述:
取重组小分子胶原蛋白3A5D29N、17S28冻干品溶于纯水,调节pH值于7.2-7.4,0.22μm滤膜过滤除菌,以无菌的维持培养液(0.5%FBS+95.5%DMEM(H))稀释至1mg/mL、0.5mg/mL、0.25mg/mL、0.125mg/mL;以hEGF(购自Lonza公司)为阳性对照,设置浓度为1ng/mL、0.5ng/mL、0.25ng/mL、0.125ng/mL,以维持培养液为阴性对照。取HaCat细胞株(购自中国科学院细胞库,货号SCSP-5091)用完全培养液(88%DMEM+10%FBS+1%谷氨酰胺+1%丙酮酸钠)于37℃、5%二氧化碳条件下培养,控制细胞浓度为每1mL含1.0×105~5.0×105个细胞,传代后24~36小时用于生物学活性测定。弃去培养瓶中的培养液,消化和收集细胞,用完全培养液配成每1mL含5.0×104个细胞的细胞悬液,接种于96孔细胞培养板中,每孔100μL,于37℃、5%CO2条件下培养。24小时后换成维持培养液,于37℃、5%二氧化碳条件下培养24小时。制备的细胞培养板弃去维持培养液,加入对照样品溶液和供试品溶液,每孔100μL,于37℃、5%CO2条件下培养24~72小时。取出96孔板,在显微镜下观察细胞形态,然后去除液体,每孔加入50μLMTT溶液(购自上海碧云天生物技术有限公司,以DPBS配置,浓度为1mg/mL),置37℃,5%CO2培养箱中培养。4小时后去除上清,每孔加入100μL异丙醇溶解结晶,在酶标仪上以650nm为参比波长,在波长570nm处测定吸光度值,记录测定结果。
如图27所示,作为阳性对照的hEGF有促HaCat细胞增殖的作用,重组小分子胶原蛋白3A5D29N、17S28在0.125~1mg/mL的浓度下也具有促HaCat细胞增殖的作用,尤其是17S28促HaCat细胞增殖活性呈现随样品浓度增长而增长的趋势,较高浓度的17S28与0.5ng/mLhEGF的促增殖效果基本相当。
(3)透皮吸收性检测
以全层皮肤模型作为载体,对检测样品以FITC荧光标记后,采用表面给药方式,将样品均匀涂抹于模型表面,通过统计荧光切片荧光强度、荧光酶标仪检测接收液计算扩散百分比,观察样品的皮肤渗透行为。委托陕西博溪通用检测科技有限公司完成检测。
具体实施方法简述:
以FITC(异硫氰酸荧光素)标记重组小分子胶原蛋白3A5D29N、重组Ⅲ型胶原蛋白(江苏创健医疗科技股份有限公司,专利申请号CN201310033299.6,公开日2013年5月15日,分子量43.6KDa)、水解透明质酸(分子量≤5000Da)、鱼皮胶原(Nitta GelatinInc.Maringen SP03(PF)),分子筛纯化去除未偶联的FITC。将全层皮肤模型组织(广东博溪生物科技有限公司)组织转移到6孔板中,每孔加入2mL的3D全层皮肤模型培养液。
根据测试分组,进行不同浓度的样品配置。样品组采用表面给药,给药体积为20μL。培养至合适时间时,可用无菌PBS溶液的洗瓶清洗模型表面残留的受试物,用无菌棉签轻轻拭去模型内、外残留液体,环切模型后浸于4%多聚甲醛溶液中固定(固定时间≥24h),冷冻切片后荧光拍照,使用IPP软件对图片中的目的物质进行累积光密度值(IOD)的数据统计,组间比较采用t-test统计分析(双尾)。收集培养液,进行荧光IOD值检测,依据不同样品的荧光标准曲线,计算样品12h时渗透至培养液中的样品量,扩散百分比=样品量/样品的理论含量×100%,即累积透皮率。
如图28所示,1h时1mg/mL的重组小分子胶原蛋白3A5D29N和重组Ⅲ型胶原蛋白已于全皮肤模型中检测到荧光信号,而相同浓度的水解透明质酸、鱼皮胶原则未检测到荧光信号,此时FTIC标记的重组小分子胶原蛋白样品已渗透进入表皮,进入皮肤但尚未完全穿透全层皮肤模型组织,荧光信号强度分析显示,重组小分子胶原蛋白3A5D29N的荧光信号极显著强于其余三种样品,说明其透皮速度极显著优于重组Ⅲ型胶原蛋白、水解透明质酸与鱼皮胶原。同时,如图29所示,12h时,重组小分子胶原蛋白样品已完全穿透全层皮肤模型组织,随着给药浓度的增加,重组小分子胶原蛋白3A5D29N的扩散百分率(即累积透皮率)不断增加,且在1mg/mL时与相同浓度水解透明质酸的扩散百分率(即累积透皮率)基本一致,均超过40%。以上结果说明:重组小分子胶原蛋白可在短时间内实现快速透皮且较长时间内有较高的累积透皮率。本实施例中全层皮肤模型组织实验结果验证了本发明的小分子胶原蛋白具有良好的皮肤渗透性能,这也有助于重组小分子胶原在相关的产品开发,如在化妆品方面的应用有着极为广阔的前景。

Claims (22)

1.一种重组小分子胶原蛋白表达系统,其特征在于,所述表达系统包括定位融合功能蛋白连接载体转化宿主菌得到的底盘细胞或底盘工程菌和重组小分子胶原蛋白的串联重复表达序列;
其中所述串联重复表达序列以重组小分子胶原蛋白、或人工设计的具有典型的G-X-Y三联体结构的胶原蛋白、或以人胶原蛋白序列的两个或多个区域组合的胶原蛋白为基础单元串联重复;所述串联重复表达序列中每相邻的2个基础单元之间有Kex2酶、CPB酶的识别、切割的位点;
所述定位融合功能蛋白包括CPB酶、有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域;所述定位融合功能蛋白还包括连接序列,所述连接序列用于 CPB 酶与有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列融合表达时的连接;
所述定位融合功能蛋白为如SEQ ID NO.22、SEQ ID NO.24、SEQ ID NO.26或SEQ IDNO.28所示的氨基酸序列;
所述底盘细胞或底盘工程菌选自酵母。
2. 根据权利要求1所述的表达系统,其特征在于,所述串联重复表达序列中每相邻的2 个基础单元之间还可包括 Ste13 酶的识别、切割的位点。
3. 根据权利要求2所述的表达系统,其特征在于,所述 Kex2酶识别切割的位点包括KR 或 RR 双碱性氨基酸残基,双碱性氨基酸残基之后,是 EA、EAEA 或其它有助于 Kex2酶或 Ste 13 酶识别和切割的氨基酸残基。
4. 根据权利要求1所述的表达系统,其特征在于,所述 CPB酶识别和切割的位点包括蛋白羧基末端的碱性氨基酸残基,包括 K、R。
5. 根据权利要求1~4任一项所述的表达系统,其特征在于,所述重组小分子胶原蛋白为 SEQ ID NO.1、SEQ ID NO.3、SEQ ID NO.5、SEQ ID NO.7、SEQ ID NO.63 或 SEQ IDNO.67 所示的氨基酸序列。
6. 根据权利要求5所述的表达系统,其特征在于,所述重组小分子胶原蛋白的羧基端有多个 His。
7. 根据权利要求6所述的表达系统,其特征在于,所述重组小分子胶原蛋白为SEQ IDNO.2、SEQ ID NO.4、SEQ ID NO.6、SEQ ID NO.8 所示的氨基酸序列。
8. 根据权利要求1所述的表达系统,其特征在于,所述串联重复表达序列为 SEQ IDNO.30、SEQ ID NO.33、SEQ ID NO.36、SEQ ID NO.39、SEQ ID NO.42、SEQ ID NO.45、SEQ IDNO.48、SEQ ID NO.51、SEQ ID NO.54、SEQ ID NO.57、SEQ ID NO.60、SEQ ID NO.64或SEQID NO.68 所示序列。
9. 根据权利要求8所述的表达系统,其特征在于,编码所述串联重复表达序列的核酸为SEQ ID NO.71-81 所示序列、或其简并序列。
10. 根据权利要求 1所述的表达系统,其特征在于,所述 CPB 酶来源于人或大鼠。
11. 根据权利要求 10所述的表达系统,其特征在于,所述 CPB 酶序列如 SEQ IDNO.17-18 所示。
12. 根据权利要求1所述的表达系统,其特征在于,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列来源于酿酒酵母或毕赤酵母的 Kex2 酶。
13. 根据权利要求 12所述的表达系统,其特征在于,所述有细胞内膜定位或各细胞器之间的转换与运输作用的功能区域序列如 SEQ ID NO.19-20 所示。
14. 根据权利要求 1所述的表达系统,其特征在于,所述连接序列为 Linker 序列,如SEQ ID NO.21所示:GGSGSGSGGS。
15.根据权利要求1所述的表达系统,其特征在于,编码所述定位融合功能蛋白的核酸为SEQ ID NO.23、SEQ ID NO.25、SEQ ID NO.27或SEQ ID NO.29所示的核苷酸序列、或其简并序列。
16. 根据权利要求1所述的表达系统,其特征在于,所述底盘细胞或底盘工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCC No.25815、CGMCCNo.25817、CGMCC No.25816、CGMCC No.25818。
17.权利要求1-16任一项所述的表达系统在获取重组小分子胶原蛋白中的应用。
18.一种制备重组小分子胶原蛋白的方法,其特征在于,所述方法采用权利要求1-16任一项所述的表达系统,所述方法包括:
构建重组小分子胶原蛋白的串联重复表达序列;所述串联重复表达序列以重组小分子胶原蛋白、或人工设计的具有典型的G-X-Y三联体结构的胶原蛋白、或以人胶原蛋白序列的两个或多个区域组合的胶原蛋白为基础单元串联重复;所述串联重复表达序列中每相邻的2个基础单元之间有Kex2酶、CPB酶的识别、切割的位点;
构建定位融合功能蛋白,将定位融合功能蛋白连接载体转化宿主菌得到底盘细胞或底盘工程菌;
将重组小分子胶原蛋白的串联重复表达序列连接到表达载体后转入底盘细胞或底盘工程菌中,得到包含或表达重组小分子胶原蛋白的重组工程菌,发酵诱导表达,得到重组小分子胶原蛋白。
19. 根据权利要求18所述的方法,其特征在于,所述包含或表达重组小分子胶原蛋白的重组工程菌保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCCNo.25819、CGMCC No.25821、CGMCC No.25827、CGMCC No.25829、CGMCC No.25828、CGMCCNo.25820、CGMCC No.25822。
20. 根据权利要求18所述的方法,其特征在于,所述方法得到的重组小分子胶原蛋白为SEQ ID NO.32、SEQ ID NO.35、SEQ ID NO.38、SEQ ID NO.41、SEQ ID NO.44、SEQ IDNO.47、SEQ ID NO.50、SEQ ID NO.53、SEQ ID NO.56、SEQ ID NO.59、SEQ ID NO.62、SEQ IDNO.66或SEQ ID NO.70所示的氨基酸序列。
21. 根据权利要求 18-20任一项所述的方法得到的重组小分子胶原蛋白。
22. 权利要求 18-20任一项所述的方法得到的重组小分子胶原蛋白、或权利要求21所述重组小分子胶原蛋白在制备生物材料、组织工程产品、化妆品中的用途。
CN202310481706.3A 2023-04-28 2023-04-28 重组小分子胶原蛋白及其表达系统与制备方法 Active CN116948013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310481706.3A CN116948013B (zh) 2023-04-28 2023-04-28 重组小分子胶原蛋白及其表达系统与制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310481706.3A CN116948013B (zh) 2023-04-28 2023-04-28 重组小分子胶原蛋白及其表达系统与制备方法

Publications (2)

Publication Number Publication Date
CN116948013A CN116948013A (zh) 2023-10-27
CN116948013B true CN116948013B (zh) 2024-04-09

Family

ID=88446821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310481706.3A Active CN116948013B (zh) 2023-04-28 2023-04-28 重组小分子胶原蛋白及其表达系统与制备方法

Country Status (1)

Country Link
CN (1) CN116948013B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116655808B (zh) * 2023-06-01 2024-02-06 江苏创健医疗科技股份有限公司 梯度分子量重组胶原蛋白及其制备方法和应用
CN117801095B (zh) * 2023-12-30 2024-09-20 江苏创健医疗科技股份有限公司 一种重组人iv型胶原蛋白及其制备方法
CN118146354A (zh) * 2024-03-05 2024-06-07 江苏创健医疗科技股份有限公司 重组vii型胶原蛋白及其制备方法和应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110305223A (zh) * 2019-06-26 2019-10-08 重庆派金生物科技有限公司 重组串联融合蛋白制备目标多肽的方法
CN111072783A (zh) * 2019-12-27 2020-04-28 万新医药科技(苏州)有限公司 一种采用大肠杆菌表达串联序列制备glp-1或其类似物多肽的方法
CN114106150A (zh) * 2021-12-03 2022-03-01 江苏创健医疗科技有限公司 重组胶原蛋白、制备方法及其应用
CN115975047A (zh) * 2022-10-24 2023-04-18 扬州奥锐特药业有限公司 一种重组融合蛋白生产多肽的方法及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110305223A (zh) * 2019-06-26 2019-10-08 重庆派金生物科技有限公司 重组串联融合蛋白制备目标多肽的方法
CN111072783A (zh) * 2019-12-27 2020-04-28 万新医药科技(苏州)有限公司 一种采用大肠杆菌表达串联序列制备glp-1或其类似物多肽的方法
CN114106150A (zh) * 2021-12-03 2022-03-01 江苏创健医疗科技有限公司 重组胶原蛋白、制备方法及其应用
CN115975047A (zh) * 2022-10-24 2023-04-18 扬州奥锐特药业有限公司 一种重组融合蛋白生产多肽的方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
P02461· COL3A1 - Collagen alpha-1(III) chain - Homo sapiens (Human);无;《Uniprot》;Sequence & Isoform部分 *
Q9UMD9-1· Collagen alpha-1(XVII) chain - Homo sapiens (Human);无;《Uniprot》;Sequence & Isoform部分 *

Also Published As

Publication number Publication date
CN116948013A (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN116948013B (zh) 重组小分子胶原蛋白及其表达系统与制备方法
KR102559311B1 (ko) 재조합 인간 xvii형 콜라겐, 제조방법 및 응용
CN110606896B (zh) 重组人源III型胶原蛋白α1链及其应用
CN111334512B (zh) 含羟脯氨酸与羟赖氨酸的重组类人胶原蛋白及其生产方法
CN112626074B (zh) 一种含羟脯氨酸修饰化的重组人iii型胶原蛋白成熟肽及其制备方法与应用
JP4341859B2 (ja) 酵母での異種タンパク質の発現の方法
WO2017206326A1 (zh) 一种重组人源胶原蛋白及其编码基因和制备方法
EP4428148A1 (en) Recombinant collagen, preparation method therefor and application thereof
RU2429243C2 (ru) Производство белков
CN110343183B (zh) 一种重组表达载体及其构建方法和应用
WO2024031921A1 (zh) 一种强化乳铁蛋白表达的毕赤酵母及其构建方法与应用
CN116375847A (zh) 酵母重组xvii型人源化胶原蛋白及其制备方法
CN116082493B (zh) 高稳定性重组胶原蛋白、构建方法及其应用
WO2024131080A1 (zh) 一种重组人源vi型胶原蛋白及其制备方法和应用
KR100798894B1 (ko) 재조합단백질 생산용 단백질융합인자
CN117126874B (zh) 大规模制备164.88°三螺旋结构胶原蛋白生物方法
CN110643521A (zh) 毕赤酵母菌及其发酵的角蛋白酶、角蛋白酶的应用
CN114657196B (zh) 一种猪胰蛋白酶原突变体及其在毕赤酵母中的表达
CN117867007B (zh) 一种合成人源乳铁蛋白的马克斯克鲁维酵母的构建方法与应用
CN117777276B (zh) 一种促进马克斯克鲁维酵母分泌表达人乳铁蛋白的方法
CN117801095B (zh) 一种重组人iv型胶原蛋白及其制备方法
CN117230103B (zh) 17型人源化胶原蛋白及其蛋白支架、填充材料及应用
WO2024148818A1 (zh) 一种含一种或多种细胞因子的酿酒酵母裂解物及其制备方法和细胞培养肉应用
CN118146354A (zh) 重组vii型胶原蛋白及其制备方法和应用
CN117384959A (zh) 一种生产胶原细胞株的构建及其生产方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant