CN118048361A - 重组iii型人源胶原蛋白的编码基因及其应用 - Google Patents

重组iii型人源胶原蛋白的编码基因及其应用 Download PDF

Info

Publication number
CN118048361A
CN118048361A CN202410299624.1A CN202410299624A CN118048361A CN 118048361 A CN118048361 A CN 118048361A CN 202410299624 A CN202410299624 A CN 202410299624A CN 118048361 A CN118048361 A CN 118048361A
Authority
CN
China
Prior art keywords
recombinant
human collagen
iii
type
collagen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410299624.1A
Other languages
English (en)
Inventor
李羽帆
马凯
高岩华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Weiming Shiguang Biotechnology Co ltd
Hangzhou Shiguang Xinya Biotechnology Co ltd
Suzhou Shiguang Pharmaceutical Biotechnology Co ltd
Original Assignee
Beijing Weiming Shiguang Biotechnology Co ltd
Hangzhou Shiguang Xinya Biotechnology Co ltd
Suzhou Shiguang Pharmaceutical Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Weiming Shiguang Biotechnology Co ltd, Hangzhou Shiguang Xinya Biotechnology Co ltd, Suzhou Shiguang Pharmaceutical Biotechnology Co ltd filed Critical Beijing Weiming Shiguang Biotechnology Co ltd
Priority to CN202410299624.1A priority Critical patent/CN118048361A/zh
Publication of CN118048361A publication Critical patent/CN118048361A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Reproductive Health (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于人胶原蛋白生产领域,具体涉及重组III型人源胶原蛋白的编码基因及其应用。本发明的重组III型人源胶原蛋白的编码基因的核苷酸序列如SEQ ID NO.4所示。本发明的重组III型人源胶原蛋白具有和人类细胞几乎完全一致的羟基化翻译后修饰方式,从而克服酵母、大肠杆菌生产的III型人源胶原蛋白和来自牛、鼠等动物组织提取的胶原蛋白与人源III型胶原蛋白不完全一致的翻译后修饰方式,提高III型人源胶原蛋白的活性与功能。

Description

重组III型人源胶原蛋白的编码基因及其应用
技术领域
本发明属于人胶原蛋白的生产领域,具体涉及重组III型人源胶原蛋白的编码基因及其应用。
背景技术
胶原是包括皮肤、骨骼、肌腱和软骨在内的所有结缔组织中的主要蛋白质。例如,它在皮肤中形成大的纤维束,每个纤维束又包含许多单个的胶原原纤维,使得皮肤结构强壮且灵活。成熟的三螺旋的胶原蛋白在人体中含量非常丰富,对一系列工业和医学应用非常有价值。胶原蛋白已被广泛应用于临床应用领域,其在包括软性组织扩张、创口和烧伤的修复、骨科和心血管等方面被证明安全有效。
人类III型胶原蛋白(hCOL3A1)属于形成纤维的胶原蛋白,广泛分布于皮肤、内脏器官或血管系统等可伸展的结缔组织中。它在人体伤口愈合,胶原纤维形成和心血管正常发育中起着关键作用。
重组蛋白是应用基因工程技术产生的蛋白质,近年来,重组蛋白已经成为生物药物、医美蛋白开发的重要组成部分。重组蛋白药物的生产主要包括四大系统:原核蛋白表达,酵母蛋白表达、昆虫细胞蛋白表达及哺乳动物细胞蛋白表达。与其他表达系统相比较,哺乳动物细胞生产的重组蛋白质能够进行正确折叠、装配和翻译后修饰,具有与人源蛋白分子结构更为接近的优势,因此哺乳动物细胞已经成为蛋白药物尤其是人源化蛋白的主要表达宿主。目前近70%批准上市的重组蛋白药物来自于中国仓鼠卵巢细胞(Chinesehamster ovary cells,CHO)。
目前已有III型人源胶原蛋白在大肠杆菌、酵母来表达生产III型人源胶原蛋白。而利用以上表达系统以及CHO表达系统生产完全人源化的重组III型人源胶原蛋白尚未成功,这是因为大肠杆菌、酵母系统的不适合生产人源胶原蛋白,例如,中国发明专利申请CN110606896 A中公开了重组III型人源胶原蛋白在酵母表达系统中的应用,但由于酵母表达系统的限制,其生产的蛋白往往活性较差,而且酵母表达系统缺乏强有力的受严格调控的启动子,分泌效率低,尤其是对于分子质量大于30KD的目的蛋白分子几乎不分泌。此外,酵母表达系统不适于高密度培养。
CHO表达系统没有上述缺点,III型人源胶原蛋白全长作为一个高分子量且需要保持高活性的复杂蛋白,也更适合应用CHO表达系统进行表达与生产,但是III型人源胶原蛋白在CHO中生产存在表达水平仍较低,获得高表达工程细胞株所需的时间长、细胞大规模培养的成本高等缺陷,导致哺乳动物细胞生产III型人源胶原蛋白的成本较高。
发明内容
本发明的目的在于提供一种重组III型人源胶原蛋白的编码基因。
本发明的再一目的在于提供上述基因编码的重组III型人源胶原蛋白。
本发明的再一目的在于提供一种提高重组III型人源胶原蛋白表达量的方法。
根据本发明具体实施方式的重组III型人源胶原蛋白的编码基因,其核苷酸序列如SEQ ID NO.4所示:
ATGATGTCCTTCGTGCAGAAGGGCAGCTGGCTGCTGCTAGCGCTGCTCCACCCTACCATCATTCTTGCTCAGCAAGAAGCGGTGGAGGGTGGATGCAGCCATTTGGGCCAGTCTTACGCTGACCGGGACGTGTGGAAACCTGAACCTTGCCAGATCTGCGTATGCGACAGCGGGAGCGTGCTCTGTGATGACATCATTTGTGACGATCAGGAACTTGACTGCCCTAATCCTGAGATCCCCTTCGGGGAATGTTGCGCTGTATGTCCTCAGCCACCTACTGCCCCCACAAGACCACCCAATGGCCAGGGTCCACAAGGTCCCAAAGGAGATCCAGGACCTCCTGGAATTCCCGGACGTAATGGAGACCCTGGCATCCCAGGACAACCAGGATCTCCTGGATCTCCAGGCCCTCCTGGTATCTGTGAGAGCTGCCCAACCGGTCCCCAGAACTACTCTCCTCAATATGATTCCTACGATGTCAAAAGTGGTGTAGCTGTGGGCGGCCTTGCTGGTTATCCTGGTCCTGCAGGACCTCCTGGACCTCCTGGTCCACCTGGAACATCTGGTCACCCTGGATCACCAGGATCTCCAGGTTACCAAGGACCTCCAGGCGAACCTGGACAGGCTGGACCTAGTGGTCCTCCTGGCCCTCCTGGTGCAATAGGCCCTAGTGGACCAGCTGGCAAAGACGGAGAATCTGGTAGACCAGGGAGACCAGGGGAACGAGGCCTTCCTGGTCCTCCTGGTATAAAAGGACCTGCCGGCATTCCTGGCTTCCCAGGTATGAAGGGCCACCGGGGATTTGATGGTAGGAACGGTGAGAAAGGAGAGACCGGAGCACCCGGCTTGAAAGGAGAGAACGGACTGCCTGGTGAAAATGGTGCTCCTGGCCCAATGGGACCAAGAGGTGCACCCGGTGAACGAGGACGTCCTGGATTGCCAGGAGCAGCAGGCGCTAGAGGTAATGATGGAGCACGCGGTTCTGATGGACAACCAGGACCCCCTGGACCACCTGGTACTGCAGGTTTTCCTGGAAGTCCAGGCGCTAAAGGCGAAGTGGGACCTGCTGGAAGTCCAGGTTCAAATGGAGCACCAGGACAGAGAGGTGAGCCTGGTCCTCAGGGTCATGCTGGTGCTCAGGGTCCACCTGGACCTCCTGGAATTAATGGTTCCCCAGGAGGAAAGGGCGAGATGGGACCAGCTGGCATTCCAGGTGCTCCAGGTTTGATGGGTGCTAGAGGTCCTCCAGGACCTGCAGGTGCTAACGGAGCACCTGGTCTTAGAGGAGGTGCCGGAGAGCCAGGTAAAAACGGTGCCAAAGGCGAACCAGGACCCAGAGGAGAAAGAGGCGAAGCTGGCATTCCTGGAGTCCCTGGTGCTAAAGGAGAGGATGGAAAAGACGGAAGCCCTGGTGAACCCGGTGCCAATGGATTGCCAGGAGCAGCCGGAGAAAGAGGTGCCCCTGGATTTCGAGGGCCTGCTGGACCTAACGGAATCCCAGGGGAAAAAGGACCTGCAGGTGAAAGAGGAGCACCAGGACCTGCTGGACCTAGAGGAGCAGCTGGAGAACCAGGGAGAGATGGTGTGCCAGGTGGCCCTGGAATGAGGGGAATGCCAGGATCTCCTGGAGGTCCAGGGTCCGATGGTAAACCCGGACCACCAGGCAGTCAAGGAGAAAGTGGGAGACCTGGACCACCTGGACCTTCCGGACCTAGAGGGCAACCAGGAGTGATGGGGTTTCCTGGACCAAAGGGCAACGACGGAGCCCCTGGTAAAAATGGTGAAAGAGGAGGTCCTGGAGGACCAGGACCACAGGGACCACCTGGAAAGAATGGCGAAACTGGTCCACAAGGTCCTCCTGGACCAACTGGACCTGGAGGCGACAAAGGAGATACCGGACCACCTGGGCCTCAAGGCTTGCAGGGTTTGCCTGGAACTGGCGGTCCTCCAGGGGAGAATGGCAAGCCAGGAGAACCTGGTCCCAAAGGTGATGCAGGTGCACCAGGTGCTCCTGGAGGCAAAGGAGACGCTGGTGCACCAGGTGAAAGAGGACCTCCTGGCCTTGCAGGAGCACCTGGTTTGAGAGGTGGTGCTGGACCTCCAGGACCTGAAGGTGGAAAAGGTGCTGCTGGACCACCTGGACCACCTGGTGCAGCAGGTACTCCAGGTTTGCAGAGGATGCCAGGGGAGAGAGGCGGACTTGGCTCTCCAGGACCTAAGGGTGATAAAGGAGAACCAGGCGGACCAGGAGCTGATGGCGTTCCAGGAAAGGACGGCCCTAGAGGACCAACTGGACCTATCGGTCCTCCCGGTCCTGCTGGTCAACCAGGTGATAAGGGAGAAGGTGGTGCACCCGGACTGCCTGGAATTGCTGGCCCAAGAGGTAGCCCAGGCGAACGAGGAGAGACAGGACCTCCTGGACCTGCTGGTTTTCCCGGCGCTCCAGGTCAGAACGGTGAACCTGGTGGAAAAGGAGAAAGAGGTGCACCAGGTGAAAAGGGAGAGGGAGGCCCACCTGGAGTTGCTGGTCCTCCTGGTGGATCAGGTCCTGCCGGTCCACCAGGTCCTCAAGGTGTTAAAGGCGAAAGGGGTTCACCTGGTGGACCTGGCGCTGCAGGTTTTCCAGGAGCAAGAGGCTTGCCAGGTCCTCCTGGCTCTAATGGAAACCCAGGTCCTCCTGGTCCATCTGGGTCACCAGGAAAAGATGGACCCCCTGGACCTGCTGGTAATACAGGTGCACCAGGCTCACCTGGAGTGTCAGGACCTAAGGGAGATGCTGGTCAGCCAGGAGAAAAGGGATCTCCTGGTGCACAAGGTCCACCTGGAGCACCTGGTCCTTTGGGAATAGCTGGTATTACAGGAGCTAGGGGATTGGCAGGTCCACCAGGTATGCCAGGACCACGAGGATCACCTGGTCCCCAGGGAGTGAAGGGAGAAAGTGGCAAACCTGGAGCAAACGGGTTGTCTGGAGAAAGAGGACCTCCTGGTCCTCAAGGACTGCCCGGTCTTGCAGGCACTGCTGGAGAACCTGGGAGAGATGGAAATCCCGGAAGTGATGGCTTGCCAGGTAGAGATGGTTCCCCTGGAGGTAAGGGAGATAGAGGAGAGAATGGGTCACCAGGTGCTCCAGGTGCACCTGGTCATCCCGGACCACCAGGACCAGTAGGTCCAGCTGGTAAGAGCGGAGACAGAGGGGAATCTGGACCTGCTGGACCTGCTGGTGCTCCTGGACCTGCTGGATCTAGGGGTGCACCAGGTCCACAGGGACCAAGAGGTGACAAAGGAGAGACAGGAGAACGAGGCGCTGCCGGTATCAAGGGCCACAGAGGATTTCCAGGCAATCCAGGAGCACCTGGAAGTCCAGGACCAGCTGGTCAGCAGGGCGCAATAGGATCACCAGGCCCTGCTGGCCCAAGAGGACCTGTAGGTCCTAGTGGCCCACCTGGAAAGGATGGAACAAGCGGACATCCCGGCCCTATCGGTCCACCTGGACCAAGAGGTAATAGAGGCGAGAGGGGAAGCGAAGGAAGCCCAGGACACCCTGGACAACCTGGTCCTCCAGGACCTCCTGGTGCTCCAGGACCTTGTTGTGGAGGAGTGGGAGCTGCCGCAATAGCTGGTATTGGCGGCGAAAAGGCTGGAGGCTTTGCTCCATATTATGGCGACGAGCCTATGGATTTTAAGATCAATACAGACGAGATTATGACCTCTTTGAAGTCCGTGAATGGGCAGATCGAATCTCTTATCTCACCTGACGGGTCAAGAAAAAATCCTGCACGCAACTGCAGAGATCTGAAGTTTTGTCATCCCGAATTGAAGAGCGGCGAGTATTGGGTAGACCCAAATCAGGGGTGTAAGTTGGACGCCATCAAGGTGTTTTGCAACATGGAAACTGGCGAGACTTGCATTAGCGCCAACCCCCTCAACGTCCCACGCAAGCACTGGTGGACTGATTCCTCCGCTGAGAAAAAACATGTGTGGTTTGGGGAATCCATGGATGGAGGCTTTCAGTTCTCTTATGGAAACCCCGAACTGCCTGAGGATGTGCTGGATGTGCATCTGGCTTTTCTGCGTCTTCTCTCTAGCCGCGCTTCTCAGAACATCACATATCACTGCAAGAACTCCATTGCTTACATGGATCAGGCCAGCGGTAACGTCAAAAAAGCCCTTAAACTGATGGGCTCAAATGAAGGCGAGTTTAAGGCAGAAGGCAATAGCAAGTTTACTTATACCGTGCTCGAGGATGGGTGCACCAAGCATACAGGCGAGTGGTCTAAAACTGTCTTCGAATACCGGACCAGGAAGGCTGTGCGTTTGCCCATTGTGGACATTGCCCCCTACGACATTGGCGGTCCTGACCAGGAGTTCGGTGTGGACGTCGGCCCAGTGTGTTTCTTG
本发明的核苷酸序列,根据CHO细胞密码子偏爱性,对III型人源胶原蛋白基因进行密码子优化,能够提高目的基因的基础表达量。
上述SEQ ID NO .4序列中包含经优化的信号肽序列,SEQ ID NO.6:
ATGATGTCCTTCGTGCAGAAGGGCAGCTGGCTGCTGCTAGCGCTGCTCCACCCTACCATCATTCTTGCT;
不含信号肽的重组III型人源胶原蛋白的编码基因,其核苷酸序列如SEQ ID NO.7所示:
CAGCAAGAAGCGGTGGAGGGTGGATGCAGCCATTTGGGCCAGTCTTACGCTGACCGGGACGTGTGGAAACCTGAACCTTGCCAGATCTGCGTATGCGACAGCGGGAGCGTGCTCTGTGATGACATCATTTGTGACGATCAGGAACTTGACTGCCCTAATCCTGAGATCCCCTTCGGGGAATGTTGCGCTGTATGTCCTCAGCCACCTACTGCCCCCACAAGACCACCCAATGGCCAGGGTCCACAAGGTCCCAAAGGAGATCCAGGACCTCCTGGAATTCCCGGACGTAATGGAGACCCTGGCATCCCAGGACAACCAGGATCTCCTGGATCTCCAGGCCCTCCTGGTATCTGTGAGAGCTGCCCAACCGGTCCCCAGAACTACTCTCCTCAATATGATTCCTACGATGTCAAAAGTGGTGTAGCTGTGGGCGGCCTTGCTGGTTATCCTGGTCCTGCAGGACCTCCTGGACCTCCTGGTCCACCTGGAACATCTGGTCACCCTGGATCACCAGGATCTCCAGGTTACCAAGGACCTCCAGGCGAACCTGGACAGGCTGGACCTAGTGGTCCTCCTGGCCCTCCTGGTGCAATAGGCCCTAGTGGACCAGCTGGCAAAGACGGAGAATCTGGTAGACCAGGGAGACCAGGGGAACGAGGCCTTCCTGGTCCTCCTGGTATAAAAGGACCTGCCGGCATTCCTGGCTTCCCAGGTATGAAGGGCCACCGGGGATTTGATGGTAGGAACGGTGAGAAAGGAGAGACCGGAGCACCCGGCTTGAAAGGAGAGAACGGACTGCCTGGTGAAAATGGTGCTCCTGGCCCAATGGGACCAAGAGGTGCACCCGGTGAACGAGGACGTCCTGGATTGCCAGGAGCAGCAGGCGCTAGAGGTAATGATGGAGCACGCGGTTCTGATGGACAACCAGGACCCCCTGGACCACCTGGTACTGCAGGTTTTCCTGGAAGTCCAGGCGCTAAAGGCGAAGTGGGACCTGCTGGAAGTCCAGGTTCAAATGGAGCACCAGGACAGAGAGGTGAGCCTGGTCCTCAGGGTCATGCTGGTGCTCAGGGTCCACCTGGACCTCCTGGAATTAATGGTTCCCCAGGAGGAAAGGGCGAGATGGGACCAGCTGGCATTCCAGGTGCTCCAGGTTTGATGGGTGCTAGAGGTCCTCCAGGACCTGCAGGTGCTAACGGAGCACCTGGTCTTAGAGGAGGTGCCGGAGAGCCAGGTAAAAACGGTGCCAAAGGCGAACCAGGACCCAGAGGAGAAAGAGGCGAAGCTGGCATTCCTGGAGTCCCTGGTGCTAAAGGAGAGGATGGAAAAGACGGAAGCCCTGGTGAACCCGGTGCCAATGGATTGCCAGGAGCAGCCGGAGAAAGAGGTGCCCCTGGATTTCGAGGGCCTGCTGGACCTAACGGAATCCCAGGGGAAAAAGGACCTGCAGGTGAAAGAGGAGCACCAGGACCTGCTGGACCTAGAGGAGCAGCTGGAGAACCAGGGAGAGATGGTGTGCCAGGTGGCCCTGGAATGAGGGGAATGCCAGGATCTCCTGGAGGTCCAGGGTCCGATGGTAAACCCGGACCACCAGGCAGTCAAGGAGAAAGTGGGAGACCTGGACCACCTGGACCTTCCGGACCTAGAGGGCAACCAGGAGTGATGGGGTTTCCTGGACCAAAGGGCAACGACGGAGCCCCTGGTAAAAATGGTGAAAGAGGAGGTCCTGGAGGACCAGGACCACAGGGACCACCTGGAAAGAATGGCGAAACTGGTCCACAAGGTCCTCCTGGACCAACTGGACCTGGAGGCGACAAAGGAGATACCGGACCACCTGGGCCTCAAGGCTTGCAGGGTTTGCCTGGAACTGGCGGTCCTCCAGGGGAGAATGGCAAGCCAGGAGAACCTGGTCCCAAAGGTGATGCAGGTGCACCAGGTGCTCCTGGAGGCAAAGGAGACGCTGGTGCACCAGGTGAAAGAGGACCTCCTGGCCTTGCAGGAGCACCTGGTTTGAGAGGTGGTGCTGGACCTCCAGGACCTGAAGGTGGAAAAGGTGCTGCTGGACCACCTGGACCACCTGGTGCAGCAGGTACTCCAGGTTTGCAGAGGATGCCAGGGGAGAGAGGCGGACTTGGCTCTCCAGGACCTAAGGGTGATAAAGGAGAACCAGGCGGACCAGGAGCTGATGGCGTTCCAGGAAAGGACGGCCCTAGAGGACCAACTGGACCTATCGGTCCTCCCGGTCCTGCTGGTCAACCAGGTGATAAGGGAGAAGGTGGTGCACCCGGACTGCCTGGAATTGCTGGCCCAAGAGGTAGCCCAGGCGAACGAGGAGAGACAGGACCTCCTGGACCTGCTGGTTTTCCCGGCGCTCCAGGTCAGAACGGTGAACCTGGTGGAAAAGGAGAAAGAGGTGCACCAGGTGAAAAGGGAGAGGGAGGCCCACCTGGAGTTGCTGGTCCTCCTGGTGGATCAGGTCCTGCCGGTCCACCAGGTCCTCAAGGTGTTAAAGGCGAAAGGGGTTCACCTGGTGGACCTGGCGCTGCAGGTTTTCCAGGAGCAAGAGGCTTGCCAGGTCCTCCTGGCTCTAATGGAAACCCAGGTCCTCCTGGTCCATCTGGGTCACCAGGAAAAGATGGACCCCCTGGACCTGCTGGTAATACAGGTGCACCAGGCTCACCTGGAGTGTCAGGACCTAAGGGAGATGCTGGTCAGCCAGGAGAAAAGGGATCTCCTGGTGCACAAGGTCCACCTGGAGCACCTGGTCCTTTGGGAATAGCTGGTATTACAGGAGCTAGGGGATTGGCAGGTCCACCAGGTATGCCAGGACCACGAGGATCACCTGGTCCCCAGGGAGTGAAGGGAGAAAGTGGCAAACCTGGAGCAAACGGGTTGTCTGGAGAAAGAGGACCTCCTGGTCCTCAAGGACTGCCCGGTCTTGCAGGCACTGCTGGAGAACCTGGGAGAGATGGAAATCCCGGAAGTGATGGCTTGCCAGGTAGAGATGGTTCCCCTGGAGGTAAGGGAGATAGAGGAGAGAATGGGTCACCAGGTGCTCCAGGTGCACCTGGTCATCCCGGACCACCAGGACCAGTAGGTCCAGCTGGTAAGAGCGGAGACAGAGGGGAATCTGGACCTGCTGGACCTGCTGGTGCTCCTGGACCTGCTGGATCTAGGGGTGCACCAGGTCCACAGGGACCAAGAGGTGACAAAGGAGAGACAGGAGAACGAGGCGCTGCCGGTATCAAGGGCCACAGAGGATTTCCAGGCAATCCAGGAGCACCTGGAAGTCCAGGACCAGCTGGTCAGCAGGGCGCAATAGGATCACCAGGCCCTGCTGGCCCAAGAGGACCTGTAGGTCCTAGTGGCCCACCTGGAAAGGATGGAACAAGCGGACATCCCGGCCCTATCGGTCCACCTGGACCAAGAGGTAATAGAGGCGAGAGGGGAAGCGAAGGAAGCCCAGGACACCCTGGACAACCTGGTCCTCCAGGACCTCCTGGTGCTCCAGGACCTTGTTGTGGAGGAGTGGGAGCTGCCGCAATAGCTGGTATTGGCGGCGAAAAGGCTGGAGGCTTTGCTCCATATTATGGCGACGAGCCTATGGATTTTAAGATCAATACAGACGAGATTATGACCTCTTTGAAGTCCGTGAATGGGCAGATCGAATCTCTTATCTCACCTGACGGGTCAAGAAAAAATCCTGCACGCAACTGCAGAGATCTGAAGTTTTGTCATCCCGAATTGAAGAGCGGCGAGTATTGGGTAGACCCAAATCAGGGGTGTAAGTTGGACGCCATCAAGGTGTTTTGCAACATGGAAACTGGCGAGACTTGCATTAGCGCCAACCCCCTCAACGTCCCACGCAAGCACTGGTGGACTGATTCCTCCGCTGAGAAAAAACATGTGTGGTTTGGGGAATCCATGGATGGAGGCTTTCAGTTCTCTTATGGAAACCCCGAACTGCCTGAGGATGTGCTGGATGTGCATCTGGCTTTTCTGCGTCTTCTCTCTAGCCGCGCTTCTCAGAACATCACATATCACTGCAAGAACTCCATTGCTTACATGGATCAGGCCAGCGGTAACGTCAAAAAAGCCCTTAAACTGATGGGCTCAAATGAAGGCGAGTTTAAGGCAGAAGGCAATAGCAAGTTTACTTATACCGTGCTCGAGGATGGGTGCACCAAGCATACAGGCGAGTGGTCTAAAACTGTCTTCGAATACCGGACCAGGAAGGCTGTGCGTTTGCCCATTGTGGACATTGCCCCCTACGACATTGGCGGTCCTGACCAGGAGTTCGGTGTGGACGTCGGCCCAGTGTGTTTCTTG
本发明还提供上述编码基因编码的重组III型人源胶原蛋白,其氨基酸序列如SEQID NO.5所示:
MMSFVQKGSWLLLALLHPTIILAQQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSGPAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPGPSGSPGKDGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGPRGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGFPGNPGAPGSPGPAGQQGAIGSPGPAGPRGPVGPSGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVHLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL
不含信号肽的重组III型人源胶原蛋白,其氨基酸序列如SEQ ID NO.8所示:
QQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQRMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSGPAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPGPSGSPGKDGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGPRGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGFPGNPGAPGSPGPAGQQGAIGSPGPAGPRGPVGPSGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVHLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL
本发明还提供包含重组III型人源胶原蛋白的编码基因的重组表达载体。所述表达载体可以通过本领域常规方法将含有SEQ ID NO.4所示基因序列插入出发载体的多克隆位点构建获得。
具体的,人工合成如SEQ ID NO.4所示的III型人源胶原蛋白基因序列,用克隆技术将含有III型人源胶原蛋白基因序列连接至出发载体,通过序列鉴定筛选,获得重组表达载体。优选的,构建所述表达载体的出发载体为pWTY9.3。
或者,将含有信号肽的SEQ ID NO.7所示基因序列插入到出发载体的多克隆位点构建获得也可获得包含重组III型人源胶原蛋白的编码基因的重组表达载体,本领域技术人员可根据需要选择所用的信号肽,并对其进行一定的优化。
本发明还提供含有上述重组III型人源胶原蛋白的编码基因的重组细胞,优选为所述细胞为CHO细胞。
本发明还提供含有上述表达载体的表达系统,使用所述表达载体转染CHO细胞获得。优选的,所述CHO细胞为CHO-S、CHO-K1、CHO-DG44、CHO-GS中的一种或多种。
优选的,将上述含重组III型人源胶原蛋白的编码基因的表达载体pWTY9.3转染CHO-S细胞株,通过培养、筛选获得稳定CHO细胞池,该稳定CHO细胞池能够高表达III型人源胶原蛋白。
根据本发明具体实施方式的提高III型人源胶原蛋白表达量的生产方法,所述方法包括以下步骤:
(1)构建包含III型人源胶原蛋白的编码基因的重组表达载体;
(2)用重组表达载体转染CHO细胞株,通过培养、筛选,获得稳定CHO细胞池;
(3)将稳定CHO细胞池进行悬浮无血清培养,其中,先将稳定CHO细胞池在37℃条件下培养到对数期,然后转到33℃条件下培养。
优选的,III型人源胶原蛋白的编码基因如SEQ ID NO.4或SEQ ID NO.7所示。
本发明的III型人源胶原蛋白的生产方法,通过构建含有所述III型人源胶原蛋白编码基因的表达载体,构建稳定CHO细胞池,实现III型人源胶原蛋白目的基因在CHO细胞的高效表达。
CHO细胞池的培养方法是将细胞株从96孔板到24孔板再到6孔板扩大培养,采用悬浮无血清培养。
根据本发明具体实施方式的提高III型人源胶原蛋白表达量的生产方法,步骤(3)中,悬浮无血清培养时,向培养基中加入丙戊酸钠和氢化肉桂酸,丙戊酸钠的终浓度分别为0.05~3.0mmol/L,氢化肉桂酸的终浓度为0.1~1.5mmol/L。
根据本发明具体实施方式的提高III型人源胶原蛋白表达量的生产方法步骤(3)中,悬浮无血清培养时所用的培养基为CHO Pro Grow无血清培养基。
本发明的有益效果:
本发明可以成功生产完整的重组III型人源胶原蛋白全长,与天然的III型人源胶原蛋白大小最为接近,利用修饰能力强的CHO细胞进行生产,具有和人类细胞完全一致的羟基化修饰,从而解决了酵母、大肠杆菌表达系统中无法生产完整的重组III型人源胶原蛋白全长的不足,为大规模生产有活性的III型人源胶原蛋白完整片段提供了有力支撑。
本发明的方法将III型人源胶原蛋白能够在CHO细胞成功表达,通过低温培养和加入丙戊酸钠和氢化肉桂酸小分子添加剂,能够显著提高CHO细胞重组III型人源胶原蛋白的表达水平。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例2所用的表达载体pWTY9.3模式图;
图2为本发明中实施例3中III型人源胶原蛋白在CHO细胞表达的Western blot结果;其中,泳道1为未转染的空白对照组细胞,泳道2为COL3A1标准品,泳道3为密码子优化前的野生型重组III型人源胶原蛋白,泳道4为密码子优化后的重组III型人源胶原蛋白;
图3为本发明中III型人源胶原蛋白在不同温度调节下的细胞密度图;
图4为本发明中III型人源胶原蛋白在不同温度调节下的细胞活性图;
图5为本发明中III型人源胶原蛋白在不同温度调节下的III型人源胶原蛋白表达水平图;
图6为本发明中III型人源胶原蛋白在不同的添加剂作用下的细胞密度图;
图7为本发明中III型人源胶原蛋白在不同的添加剂作用下的细胞活性图;
图8为本发明中III型人源胶原蛋白在不同的添加剂作用下的III型人源胶原蛋白表达水平图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
本发明实施例及试验例中所用的各类培养基、试剂、大肠杆菌(E .coli DH5α)、细胞系试剂、工具酶等均为市售商品。
pWTY9.3质粒、CHO Pro Grow无血清培养基为河南普诺易生物制品研究院有限公司产品。
未特别指明的,实施例及试验例中相关操作均为领域内常规技术手段,比如参照Sambrook等编著的分子克隆实验手册 (Sambrook J&Russell DW .Molecular cloning:alaboratory manual .2001),或者产品制造厂商提供的说明书等。
1实施例 1获得 III型人源胶原蛋白基因序列
选择根据文献报道的III型人源胶原蛋白氨基酸序列(Genbank no:KAI5770041.1),III型人源胶原蛋白基因序列如SEQ ID NO.1所示:
CAACAGGAAGCTGTTGAAGGAGGATGTTCCCATCTTGGTCAGTCCTATGCGGATAGAGATGTCTGGAAGCCAGAACCATGCCAAATATGTGTCTGTGACTCAGGATCCGTTCTCTGCGATGACATAATATGTGACGATCAAGAATTAGACTGCCCCAACCCAGAAATTCCATTTGGAGAATGTTGTGCAGTTTGCCCACAGCCTCCAACTGCTCCTACTCGCCCTCCTAATGGTCAAGGACCTCAAGGCCCCAAGGGAGATCCAGGCCCTCCTGGTATTCCTGGGAGAAATGGTGACCCTGGTATTCCAGGACAACCAGGGTCCCCTGGTTCTCCTGGCCCCCCTGGAATCTGTGAATCATGCCCTACTGGTCCTCAGAACTATTCTCCCCAGTATGATTCATATGATGTCAAGTCTGGAGTAGCAGTAGGAGGACTCGCAGGCTATCCTGGACCAGCTGGCCCCCCAGGCCCTCCCGGTCCCCCTGGTACATCTGGTCATCCTGGTTCCCCTGGATCTCCAGGATACCAAGGACCCCCTGGTGAACCTGGGCAAGCTGGTCCTTCAGGCCCTCCAGGACCTCCTGGTGCTATAGGTCCATCTGGTCCTGCTGGAAAAGATGGAGAATCAGGTAGACCCGGACGACCTGGAGAGCGAGGATTGCCTGGACCTCCAGGTATCAAAGGTCCAGCTGGGATACCTGGATTCCCTGGTATGAAAGGACACAGAGGCTTCGATGGACGAAATGGAGAAAAGGGTGAAACAGGTGCTCCTGGATTAAAGGGTGAAAATGGTCTTCCAGGCGAAAATGGAGCTCCTGGACCCATGGGTCCAAGAGGGGCTCCTGGTGAGCGAGGACGGCCAGGACTTCCTGGGGCTGCAGGTGCTCGGGGTAATGACGGTGCTCGAGGCAGTGATGGTCAACCAGGCCCTCCTGGTCCTCCTGGAACTGCCGGATTCCCTGGATCCCCTGGTGCTAAGGGTGAAGTTGGACCTGCAGGGTCTCCTGGTTCAAATGGTGCCCCTGGACAAAGAGGAGAACCTGGACCTCAGGGACACGCTGGTGCTCAAGGTCCTCCTGGCCCTCCTGGGATTAATGGTAGTCCTGGTGGTAAAGGCGAAATGGGTCCCGCTGGCATTCCTGGAGCTCCTGGACTGATGGGAGCCCGGGGTCCTCCAGGACCAGCCGGTGCTAATGGTGCTCCTGGACTGCGAGGTGGTGCAGGTGAGCCTGGTAAGAATGGTGCCAAAGGAGAGCCCGGACCACGTGGTGAACGCGGTGAGGCTGGTATTCCAGGTGTTCCAGGAGCTAAAGGCGAAGATGGCAAGGATGGATCACCTGGAGAACCTGGTGCAAATGGGCTTCCAGGAGCTGCAGGAGAAAGGGGTGCCCCTGGGTTCCGAGGACCTGCTGGACCAAATGGCATCCCAGGAGAAAAGGGTCCTGCTGGAGAGCGTGGTGCTCCAGGCCCTGCAGGGCCCAGAGGAGCTGCTGGAGAACCTGGCAGAGATGGCGTCCCTGGAGGTCCAGGAATGAGGGGCATGCCCGGAAGTCCAGGAGGACCAGGAAGTGATGGGAAACCAGGGCCTCCCGGAAGTCAAGGAGAAAGTGGTCGACCAGGTCCTCCTGGGCCATCTGGTCCCCGAGGTCAGCCTGGTGTCATGGGCTTCCCCGGTCCTAAAGGAAATGATGGTGCTCCTGGTAAGAATGGAGAACGAGGTGGCCCTGGAGGACCTGGCCCTCAGGGTCCTCCTGGAAAGAATGGTGAAACTGGACCTCAGGGACCCCCAGGGCCTACTGGGCCTGGTGGTGACAAAGGAGACACAGGACCCCCTGGTCCACAAGGATTACAAGGCTTGCCTGGTACAGGTGGTCCTCCAGGAGAAAATGGAAAACCTGGGGAACCAGGTCCAAAGGGTGATGCCGGTGCACCTGGAGCTCCAGGAGGCAAGGGTGATGCTGGTGCCCCTGGTGAACGTGGACCTCCTGGATTGGCAGGGGCCCCAGGACTTAGAGGTGGAGCTGGTCCCCCTGGTCCCGAAGGAGGAAAGGGTGCTGCTGGTCCTCCTGGGCCACCTGGTGCTGCTGGTACTCCTGGTCTGCAACGAATGCCTGGAGAAAGAGGAGGTCTTGGAAGTCCTGGTCCAAAGGGTGACAAGGGTGAACCAGGCGGTCCAGGTGCTGATGGTGTCCCAGGGAAAGATGGCCCAAGGGGTCCTACTGGTCCTATTGGTCCTCCTGGCCCAGCTGGCCAGCCTGGAGATAAGGGTGAAGGTGGTGCCCCCGGACTTCCAGGTATAGCTGGACCTCGTGGTAGCCCTGGTGAGAGAGGTGAAACTGGCCCTCCAGGACCTGCTGGTTTCCCTGGTGCTCCTGGACAGAATGGTGAACCTGGTGGTAAAGGAGAAAGAGGGGCTCCGGGTGAGAAAGGTGAAGGAGGCCCTCCTGGAGTTGCAGGACCCCCTGGAGGTTCTGGACCTGCTGGTCCTCCTGGTCCCCAAGGTGTCAAAGGTGAACGTGGCAGTCCTGGTGGACCTGGTGCTGCTGGCTTCCCTGGTGCTCGTGGTCTTCCTGGTCCTCCTGGTAGTAATGGTAACCCAGGACCCCCAGGTCCCAGCGGTTCTCCAGGCAAGGATGGGCCCCCAGGTCCTGCGGGTAACACTGGTGCTCCTGGCAGCCCTGGAGTGTCTGGACCAAAAGGTGATGCTGGCCAACCAGGAGAGAAGGGATCGCCTGGTGCCCAGGGCCCACCAGGAGCTCCAGGCCCACTTGGGATTGCTGGGATCACTGGAGCACGGGGTCTTGCAGGACCACCAGGCATGCCAGGTCCTAGGGGAAGCCCTGGCCCTCAGGGTGTCAAGGGTGAAAGTGGGAAACCAGGAGCTAACGGTCTCAGTGGAGAACGTGGTCCCCCTGGACCCCAGGGTCTTCCTGGTCTGGCTGGTACAGCTGGTGAACCTGGAAGAGATGGAAACCCTGGATCAGATGGTCTTCCAGGCCGAGATGGATCTCCTGGTGGCAAGGGTGATCGTGGTGAAAATGGCTCTCCTGGTGCCCCTGGCGCTCCTGGTCATCCAGGCCCACCTGGTCCTGTCGGTCCAGCTGGAAAGAGTGGTGACAGAGGAGAAAGTGGCCCTGCTGGCCCTGCTGGTGCTCCCGGTCCTGCTGGTTCCCGAGGTGCTCCTGGTCCTCAAGGCCCACGTGGTGACAAAGGTGAAACAGGTGAACGTGGAGCTGCTGGCATCAAAGGACATCGAGGATTCCCTGGTAATCCAGGTGCCCCAGGTTCTCCAGGCCCTGCTGGTCAGCAGGGTGCAATCGGCAGTCCAGGACCTGCAGGCCCCAGAGGACCTGTTGGACCCAGTGGACCTCCTGGCAAAGATGGAACCAGTGGACATCCAGGTCCCATTGGACCACCAGGGCCTCGAGGTAACAGAGGTGAAAGAGGATCTGAGGGCTCCCCAGGCCACCCAGGGCAACCAGGCCCTCCTGGACCTCCTGGTGCCCCTGGTCCTTGCTGTGGTGGTGTTGGAGCCGCTGCCATTGCTGGGATTGGAGGTGAAAAAGCTGGCGGTTTTGCCCCGTATTATGGAGATGAACCAATGGATTTCAAAATCAACACCGATGAGATTATGACTTCACTCAAGTCTGTTAATGGACAAATAGAAAGCCTCATTAGTCCTGATGGTTCTCGTAAAAACCCCGCTAGAAACTGCAGAGACCTGAAATTCTGCCATCCTGAACTCAAGAGTGGAGAATACTGGGTTGACCCTAACCAAGGATGCAAATTGGATGCTATCAAGGTATTCTGTAATATGGAAACTGGGGAAACATGCATAAGTGCCAATCCTTTGAATGTTCCACGGAAACACTGGTGGACAGATTCTAGTGCTGAGAAGAAACACGTTTGGTTTGGAGAGTCCATGGATGGTGGTTTTCAGTTTAGCTACGGCAATCCTGAACTTCCTGAAGATGTCCTTGATGTGCATCTGGCATTCCTTCGACTTCTCTCCAGCCGAGCTTCCCAGAACATCACATATCACTGCAAAAATAGCATTGCATACATGGATCAGGCCAGTGGAAATGTAAAGAAGGCCCTGAAGCTGATGGGGTCAAATGAAGGTGAATTCAAGGCTGAAGGAAATAGCAAATTCACCTACACAGTTCTGGAGGATGGTTGCACGAAACACACTGGGGAATGGAGCAAAACAGTCTTTGAATATCGAACACGCAAGGCTGTGAGACTACCTATTGTAGATATTGCACCCTATGACATTGGTGGTCCTGATCAAGAATTTGGTGTGGACGTTGGCCCTGTTTGCTTTTTA
选用如SEQ ID NO.2所示信号肽序列作为优化前的序列,SEQ ID NO.2:
ATGATGAGCTTTGTGCAAAAGGGGAGCTGGCTACTTCTCGCTCTGCTTCATCCCACTATTATTTTGGCA
得到完整的hCOL3A1基因表达序列如SEQ ID NO.3所示:
ATGATGAGCTTTGTGCAAAAGGGGAGCTGGCTACTTCTCGCTCTGCTTCATCCCACTATTATTTTGGCACAACAGGAAGCTGTTGAAGGAGGATGTTCCCATCTTGGTCAGTCCTATGCGGATAGAGATGTCTGGAAGCCAGAACCATGCCAAATATGTGTCTGTGACTCAGGATCCGTTCTCTGCGATGACATAATATGTGACGATCAAGAATTAGACTGCCCCAACCCAGAAATTCCATTTGGAGAATGTTGTGCAGTTTGCCCACAGCCTCCAACTGCTCCTACTCGCCCTCCTAATGGTCAAGGACCTCAAGGCCCCAAGGGAGATCCAGGCCCTCCTGGTATTCCTGGGAGAAATGGTGACCCTGGTATTCCAGGACAACCAGGGTCCCCTGGTTCTCCTGGCCCCCCTGGAATCTGTGAATCATGCCCTACTGGTCCTCAGAACTATTCTCCCCAGTATGATTCATATGATGTCAAGTCTGGAGTAGCAGTAGGAGGACTCGCAGGCTATCCTGGACCAGCTGGCCCCCCAGGCCCTCCCGGTCCCCCTGGTACATCTGGTCATCCTGGTTCCCCTGGATCTCCAGGATACCAAGGACCCCCTGGTGAACCTGGGCAAGCTGGTCCTTCAGGCCCTCCAGGACCTCCTGGTGCTATAGGTCCATCTGGTCCTGCTGGAAAAGATGGAGAATCAGGTAGACCCGGACGACCTGGAGAGCGAGGATTGCCTGGACCTCCAGGTATCAAAGGTCCAGCTGGGATACCTGGATTCCCTGGTATGAAAGGACACAGAGGCTTCGATGGACGAAATGGAGAAAAGGGTGAAACAGGTGCTCCTGGATTAAAGGGTGAAAATGGTCTTCCAGGCGAAAATGGAGCTCCTGGACCCATGGGTCCAAGAGGGGCTCCTGGTGAGCGAGGACGGCCAGGACTTCCTGGGGCTGCAGGTGCTCGGGGTAATGACGGTGCTCGAGGCAGTGATGGTCAACCAGGCCCTCCTGGTCCTCCTGGAACTGCCGGATTCCCTGGATCCCCTGGTGCTAAGGGTGAAGTTGGACCTGCAGGGTCTCCTGGTTCAAATGGTGCCCCTGGACAAAGAGGAGAACCTGGACCTCAGGGACACGCTGGTGCTCAAGGTCCTCCTGGCCCTCCTGGGATTAATGGTAGTCCTGGTGGTAAAGGCGAAATGGGTCCCGCTGGCATTCCTGGAGCTCCTGGACTGATGGGAGCCCGGGGTCCTCCAGGACCAGCCGGTGCTAATGGTGCTCCTGGACTGCGAGGTGGTGCAGGTGAGCCTGGTAAGAATGGTGCCAAAGGAGAGCCCGGACCACGTGGTGAACGCGGTGAGGCTGGTATTCCAGGTGTTCCAGGAGCTAAAGGCGAAGATGGCAAGGATGGATCACCTGGAGAACCTGGTGCAAATGGGCTTCCAGGAGCTGCAGGAGAAAGGGGTGCCCCTGGGTTCCGAGGACCTGCTGGACCAAATGGCATCCCAGGAGAAAAGGGTCCTGCTGGAGAGCGTGGTGCTCCAGGCCCTGCAGGGCCCAGAGGAGCTGCTGGAGAACCTGGCAGAGATGGCGTCCCTGGAGGTCCAGGAATGAGGGGCATGCCCGGAAGTCCAGGAGGACCAGGAAGTGATGGGAAACCAGGGCCTCCCGGAAGTCAAGGAGAAAGTGGTCGACCAGGTCCTCCTGGGCCATCTGGTCCCCGAGGTCAGCCTGGTGTCATGGGCTTCCCCGGTCCTAAAGGAAATGATGGTGCTCCTGGTAAGAATGGAGAACGAGGTGGCCCTGGAGGACCTGGCCCTCAGGGTCCTCCTGGAAAGAATGGTGAAACTGGACCTCAGGGACCCCCAGGGCCTACTGGGCCTGGTGGTGACAAAGGAGACACAGGACCCCCTGGTCCACAAGGATTACAAGGCTTGCCTGGTACAGGTGGTCCTCCAGGAGAAAATGGAAAACCTGGGGAACCAGGTCCAAAGGGTGATGCCGGTGCACCTGGAGCTCCAGGAGGCAAGGGTGATGCTGGTGCCCCTGGTGAACGTGGACCTCCTGGATTGGCAGGGGCCCCAGGACTTAGAGGTGGAGCTGGTCCCCCTGGTCCCGAAGGAGGAAAGGGTGCTGCTGGTCCTCCTGGGCCACCTGGTGCTGCTGGTACTCCTGGTCTGCAACGAATGCCTGGAGAAAGAGGAGGTCTTGGAAGTCCTGGTCCAAAGGGTGACAAGGGTGAACCAGGCGGTCCAGGTGCTGATGGTGTCCCAGGGAAAGATGGCCCAAGGGGTCCTACTGGTCCTATTGGTCCTCCTGGCCCAGCTGGCCAGCCTGGAGATAAGGGTGAAGGTGGTGCCCCCGGACTTCCAGGTATAGCTGGACCTCGTGGTAGCCCTGGTGAGAGAGGTGAAACTGGCCCTCCAGGACCTGCTGGTTTCCCTGGTGCTCCTGGACAGAATGGTGAACCTGGTGGTAAAGGAGAAAGAGGGGCTCCGGGTGAGAAAGGTGAAGGAGGCCCTCCTGGAGTTGCAGGACCCCCTGGAGGTTCTGGACCTGCTGGTCCTCCTGGTCCCCAAGGTGTCAAAGGTGAACGTGGCAGTCCTGGTGGACCTGGTGCTGCTGGCTTCCCTGGTGCTCGTGGTCTTCCTGGTCCTCCTGGTAGTAATGGTAACCCAGGACCCCCAGGTCCCAGCGGTTCTCCAGGCAAGGATGGGCCCCCAGGTCCTGCGGGTAACACTGGTGCTCCTGGCAGCCCTGGAGTGTCTGGACCAAAAGGTGATGCTGGCCAACCAGGAGAGAAGGGATCGCCTGGTGCCCAGGGCCCACCAGGAGCTCCAGGCCCACTTGGGATTGCTGGGATCACTGGAGCACGGGGTCTTGCAGGACCACCAGGCATGCCAGGTCCTAGGGGAAGCCCTGGCCCTCAGGGTGTCAAGGGTGAAAGTGGGAAACCAGGAGCTAACGGTCTCAGTGGAGAACGTGGTCCCCCTGGACCCCAGGGTCTTCCTGGTCTGGCTGGTACAGCTGGTGAACCTGGAAGAGATGGAAACCCTGGATCAGATGGTCTTCCAGGCCGAGATGGATCTCCTGGTGGCAAGGGTGATCGTGGTGAAAATGGCTCTCCTGGTGCCCCTGGCGCTCCTGGTCATCCAGGCCCACCTGGTCCTGTCGGTCCAGCTGGAAAGAGTGGTGACAGAGGAGAAAGTGGCCCTGCTGGCCCTGCTGGTGCTCCCGGTCCTGCTGGTTCCCGAGGTGCTCCTGGTCCTCAAGGCCCACGTGGTGACAAAGGTGAAACAGGTGAACGTGGAGCTGCTGGCATCAAAGGACATCGAGGATTCCCTGGTAATCCAGGTGCCCCAGGTTCTCCAGGCCCTGCTGGTCAGCAGGGTGCAATCGGCAGTCCAGGACCTGCAGGCCCCAGAGGACCTGTTGGACCCAGTGGACCTCCTGGCAAAGATGGAACCAGTGGACATCCAGGTCCCATTGGACCACCAGGGCCTCGAGGTAACAGAGGTGAAAGAGGATCTGAGGGCTCCCCAGGCCACCCAGGGCAACCAGGCCCTCCTGGACCTCCTGGTGCCCCTGGTCCTTGCTGTGGTGGTGTTGGAGCCGCTGCCATTGCTGGGATTGGAGGTGAAAAAGCTGGCGGTTTTGCCCCGTATTATGGAGATGAACCAATGGATTTCAAAATCAACACCGATGAGATTATGACTTCACTCAAGTCTGTTAATGGACAAATAGAAAGCCTCATTAGTCCTGATGGTTCTCGTAAAAACCCCGCTAGAAACTGCAGAGACCTGAAATTCTGCCATCCTGAACTCAAGAGTGGAGAATACTGGGTTGACCCTAACCAAGGATGCAAATTGGATGCTATCAAGGTATTCTGTAATATGGAAACTGGGGAAACATGCATAAGTGCCAATCCTTTGAATGTTCCACGGAAACACTGGTGGACAGATTCTAGTGCTGAGAAGAAACACGTTTGGTTTGGAGAGTCCATGGATGGTGGTTTTCAGTTTAGCTACGGCAATCCTGAACTTCCTGAAGATGTCCTTGATGTGCATCTGGCATTCCTTCGACTTCTCTCCAGCCGAGCTTCCCAGAACATCACATATCACTGCAAAAATAGCATTGCATACATGGATCAGGCCAGTGGAAATGTAAAGAAGGCCCTGAAGCTGATGGGGTCAAATGAAGGTGAATTCAAGGCTGAAGGAAATAGCAAATTCACCTACACAGTTCTGGAGGATGGTTGCACGAAACACACTGGGGAATGGAGCAAAACAGTCTTTGAATATCGAACACGCAAGGCTGTGAGACTACCTATTGTAGATATTGCACCCTATGACATTGGTGGTCCTGATCAAGAATTTGGTGTGGACGTTGGCCCTGTTTGCTTTTTA
本发明首先综合hCOL3A1基因序列中密码子使用偏爱性以及在哺乳动物细胞密码子使用偏爱性,对hCOL3A1基因进行密码子优化;然后,对hCOL3A1基因序列中前99bp的序列进行优化,以提高翻译过程中mRNA的稳定性。
为了避免直接使用天然密码子容易因为序列稳定性、密码子偏好性、mRNA的结构等造成翻译表达效率低下的问题,本发明进行综合优化,III型人源胶原蛋白基因序列的密码子适应指数(codon adaptation index,CAI)为0.81,GC含量为0.576,其序列如SEQ IDNO.4所示:
ATGATGTCCTTCGTGCAGAAGGGCAGCTGGCTGCTGCTAGCGCTGCTCCACCCTACCATCATTCTTGCTCAGCAAGAAGCGGTGGAGGGTGGATGCAGCCATTTGGGCCAGTCTTACGCTGACCGGGACGTGTGGAAACCTGAACCTTGCCAGATCTGCGTATGCGACAGCGGGAGCGTGCTCTGTGATGACATCATTTGTGACGATCAGGAACTTGACTGCCCTAATCCTGAGATCCCCTTCGGGGAATGTTGCGCTGTATGTCCTCAGCCACCTACTGCCCCCACAAGACCACCCAATGGCCAGGGTCCACAAGGTCCCAAAGGAGATCCAGGACCTCCTGGAATTCCCGGACGTAATGGAGACCCTGGCATCCCAGGACAACCAGGATCTCCTGGATCTCCAGGCCCTCCTGGTATCTGTGAGAGCTGCCCAACCGGTCCCCAGAACTACTCTCCTCAATATGATTCCTACGATGTCAAAAGTGGTGTAGCTGTGGGCGGCCTTGCTGGTTATCCTGGTCCTGCAGGACCTCCTGGACCTCCTGGTCCACCTGGAACATCTGGTCACCCTGGATCACCAGGATCTCCAGGTTACCAAGGACCTCCAGGCGAACCTGGACAGGCTGGACCTAGTGGTCCTCCTGGCCCTCCTGGTGCAATAGGCCCTAGTGGACCAGCTGGCAAAGACGGAGAATCTGGTAGACCAGGGAGACCAGGGGAACGAGGCCTTCCTGGTCCTCCTGGTATAAAAGGACCTGCCGGCATTCCTGGCTTCCCAGGTATGAAGGGCCACCGGGGATTTGATGGTAGGAACGGTGAGAAAGGAGAGACCGGAGCACCCGGCTTGAAAGGAGAGAACGGACTGCCTGGTGAAAATGGTGCTCCTGGCCCAATGGGACCAAGAGGTGCACCCGGTGAACGAGGACGTCCTGGATTGCCAGGAGCAGCAGGCGCTAGAGGTAATGATGGAGCACGCGGTTCTGATGGACAACCAGGACCCCCTGGACCACCTGGTACTGCAGGTTTTCCTGGAAGTCCAGGCGCTAAAGGCGAAGTGGGACCTGCTGGAAGTCCAGGTTCAAATGGAGCACCAGGACAGAGAGGTGAGCCTGGTCCTCAGGGTCATGCTGGTGCTCAGGGTCCACCTGGACCTCCTGGAATTAATGGTTCCCCAGGAGGAAAGGGCGAGATGGGACCAGCTGGCATTCCAGGTGCTCCAGGTTTGATGGGTGCTAGAGGTCCTCCAGGACCTGCAGGTGCTAACGGAGCACCTGGTCTTAGAGGAGGTGCCGGAGAGCCAGGTAAAAACGGTGCCAAAGGCGAACCAGGACCCAGAGGAGAAAGAGGCGAAGCTGGCATTCCTGGAGTCCCTGGTGCTAAAGGAGAGGATGGAAAAGACGGAAGCCCTGGTGAACCCGGTGCCAATGGATTGCCAGGAGCAGCCGGAGAAAGAGGTGCCCCTGGATTTCGAGGGCCTGCTGGACCTAACGGAATCCCAGGGGAAAAAGGACCTGCAGGTGAAAGAGGAGCACCAGGACCTGCTGGACCTAGAGGAGCAGCTGGAGAACCAGGGAGAGATGGTGTGCCAGGTGGCCCTGGAATGAGGGGAATGCCAGGATCTCCTGGAGGTCCAGGGTCCGATGGTAAACCCGGACCACCAGGCAGTCAAGGAGAAAGTGGGAGACCTGGACCACCTGGACCTTCCGGACCTAGAGGGCAACCAGGAGTGATGGGGTTTCCTGGACCAAAGGGCAACGACGGAGCCCCTGGTAAAAATGGTGAAAGAGGAGGTCCTGGAGGACCAGGACCACAGGGACCACCTGGAAAGAATGGCGAAACTGGTCCACAAGGTCCTCCTGGACCAACTGGACCTGGAGGCGACAAAGGAGATACCGGACCACCTGGGCCTCAAGGCTTGCAGGGTTTGCCTGGAACTGGCGGTCCTCCAGGGGAGAATGGCAAGCCAGGAGAACCTGGTCCCAAAGGTGATGCAGGTGCACCAGGTGCTCCTGGAGGCAAAGGAGACGCTGGTGCACCAGGTGAAAGAGGACCTCCTGGCCTTGCAGGAGCACCTGGTTTGAGAGGTGGTGCTGGACCTCCAGGACCTGAAGGTGGAAAAGGTGCTGCTGGACCACCTGGACCACCTGGTGCAGCAGGTACTCCAGGTTTGCAGAGGATGCCAGGGGAGAGAGGCGGACTTGGCTCTCCAGGACCTAAGGGTGATAAAGGAGAACCAGGCGGACCAGGAGCTGATGGCGTTCCAGGAAAGGACGGCCCTAGAGGACCAACTGGACCTATCGGTCCTCCCGGTCCTGCTGGTCAACCAGGTGATAAGGGAGAAGGTGGTGCACCCGGACTGCCTGGAATTGCTGGCCCAAGAGGTAGCCCAGGCGAACGAGGAGAGACAGGACCTCCTGGACCTGCTGGTTTTCCCGGCGCTCCAGGTCAGAACGGTGAACCTGGTGGAAAAGGAGAAAGAGGTGCACCAGGTGAAAAGGGAGAGGGAGGCCCACCTGGAGTTGCTGGTCCTCCTGGTGGATCAGGTCCTGCCGGTCCACCAGGTCCTCAAGGTGTTAAAGGCGAAAGGGGTTCACCTGGTGGACCTGGCGCTGCAGGTTTTCCAGGAGCAAGAGGCTTGCCAGGTCCTCCTGGCTCTAATGGAAACCCAGGTCCTCCTGGTCCATCTGGGTCACCAGGAAAAGATGGACCCCCTGGACCTGCTGGTAATACAGGTGCACCAGGCTCACCTGGAGTGTCAGGACCTAAGGGAGATGCTGGTCAGCCAGGAGAAAAGGGATCTCCTGGTGCACAAGGTCCACCTGGAGCACCTGGTCCTTTGGGAATAGCTGGTATTACAGGAGCTAGGGGATTGGCAGGTCCACCAGGTATGCCAGGACCACGAGGATCACCTGGTCCCCAGGGAGTGAAGGGAGAAAGTGGCAAACCTGGAGCAAACGGGTTGTCTGGAGAAAGAGGACCTCCTGGTCCTCAAGGACTGCCCGGTCTTGCAGGCACTGCTGGAGAACCTGGGAGAGATGGAAATCCCGGAAGTGATGGCTTGCCAGGTAGAGATGGTTCCCCTGGAGGTAAGGGAGATAGAGGAGAGAATGGGTCACCAGGTGCTCCAGGTGCACCTGGTCATCCCGGACCACCAGGACCAGTAGGTCCAGCTGGTAAGAGCGGAGACAGAGGGGAATCTGGACCTGCTGGACCTGCTGGTGCTCCTGGACCTGCTGGATCTAGGGGTGCACCAGGTCCACAGGGACCAAGAGGTGACAAAGGAGAGACAGGAGAACGAGGCGCTGCCGGTATCAAGGGCCACAGAGGATTTCCAGGCAATCCAGGAGCACCTGGAAGTCCAGGACCAGCTGGTCAGCAGGGCGCAATAGGATCACCAGGCCCTGCTGGCCCAAGAGGACCTGTAGGTCCTAGTGGCCCACCTGGAAAGGATGGAACAAGCGGACATCCCGGCCCTATCGGTCCACCTGGACCAAGAGGTAATAGAGGCGAGAGGGGAAGCGAAGGAAGCCCAGGACACCCTGGACAACCTGGTCCTCCAGGACCTCCTGGTGCTCCAGGACCTTGTTGTGGAGGAGTGGGAGCTGCCGCAATAGCTGGTATTGGCGGCGAAAAGGCTGGAGGCTTTGCTCCATATTATGGCGACGAGCCTATGGATTTTAAGATCAATACAGACGAGATTATGACCTCTTTGAAGTCCGTGAATGGGCAGATCGAATCTCTTATCTCACCTGACGGGTCAAGAAAAAATCCTGCACGCAACTGCAGAGATCTGAAGTTTTGTCATCCCGAATTGAAGAGCGGCGAGTATTGGGTAGACCCAAATCAGGGGTGTAAGTTGGACGCCATCAAGGTGTTTTGCAACATGGAAACTGGCGAGACTTGCATTAGCGCCAACCCCCTCAACGTCCCACGCAAGCACTGGTGGACTGATTCCTCCGCTGAGAAAAAACATGTGTGGTTTGGGGAATCCATGGATGGAGGCTTTCAGTTCTCTTATGGAAACCCCGAACTGCCTGAGGATGTGCTGGATGTGCATCTGGCTTTTCTGCGTCTTCTCTCTAGCCGCGCTTCTCAGAACATCACATATCACTGCAAGAACTCCATTGCTTACATGGATCAGGCCAGCGGTAACGTCAAAAAAGCCCTTAAACTGATGGGCTCAAATGAAGGCGAGTTTAAGGCAGAAGGCAATAGCAAGTTTACTTATACCGTGCTCGAGGATGGGTGCACCAAGCATACAGGCGAGTGGTCTAAAACTGTCTTCGAATACCGGACCAGGAAGGCTGTGCGTTTGCCCATTGTGGACATTGCCCCCTACGACATTGGCGGTCCTGACCAGGAGTTCGGTGTGGACGTCGGCCCAGTGTGTTTCTTG
“ATGATGTCCTTCGTGCAGAAGGGCAGCTGGCTGCTGCTAGCGCTGCTCCACCCTACCATCATTCTTGCT”为优化后的信号肽序列,SEQ ID NO.6。
本发明的重组III型人源胶原蛋白的氨基酸序列如SEQ ID NO.5或SEQ ID NO.8所示。
SEQ ID NO.5:
QQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQRMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSGPAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPGPSGSPGKDGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGPRGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGFPGNPGAPGSPGPAGQQGAIGSPGPAGPRGPVGPSGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVHLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL 。
SEQ ID NO.8:
MMSFVQKGSWLLLALLHPTIILAQQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSGPAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPGPSGSPGKDGPPGPAGNTGAPGSPGVSGPKGDAGQPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGPRGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGSPGGKGDRGENGSPGAPGAPGHPGPPGPVGPAGKSGDRGESGPAGPAGAPGPAGSRGAPGPQGPRGDKGETGERGAAGIKGHRGFPGNPGAPGSPGPAGQQGAIGSPGPAGPRGPVGPSGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVHLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL
实施例 2构建表达载体
本实施例中III型人源胶原蛋白编码基因的重组表达载体的构建方法,包括如下步骤:
人工合成优化后的III型人源胶原蛋白基因序列SEQ ID NO.4,为实现定向克隆,在序列的5′端、3′端分别引入HindIII(AAGCTT)、NheI(GCTAGC)酶切位点,并在HindIII酶切位点下游加入Kozak序列。
用HindIII/NheI分别双酶切合成的III型人源胶原蛋白序列,同时用HindIII/NheI双酶切pWTY9.3质粒DNA载体(载体结构见图1)。琼脂糖凝胶电泳鉴定酶切结果,凝胶回收酶切后的III型人源胶原蛋白序列片段和pWTY9.3线形质粒DNA。
III型人源胶原蛋白序列的双酶切体系为:III型人源胶原蛋白序列10μL(1μg/μL),10×NEBuffer 2.1 Buffer 3.0μL,HindIII/NheI(10U/μL)各1.0μL,补足水至30μL;酶切条件为:37℃,酶切3h。
pWTY9.3质粒的双酶切体系为:pWTY9.3质粒5μL (1μg/μL),10×NEBuffer 2.1Buffer2.0μL,HindIII/NheI(10U/μL)各0.5μL,补足水至20μL;酶切条件为:37℃,酶切3h。
取酶切后的III型人源胶原蛋白序列片段和pWTY9.3线形质粒DNA(摩尔比5:1),使用NEB公司TM的连接试剂盒,25℃连接5min。将连接产物加入到大肠杆菌(E.coli)DH5α菌株感受态细胞悬液中转化,取150μL转化菌液接种到含有氨苄青霉素的LB平板上,37℃培养过夜,挑取单菌落继代培养。
提取重组质粒并进行双酶切(HindIII/NheI)验证,取酶切验证正确的质粒进行测序验证,构建正确的质粒分别命名为pWTY9.3-III型人源胶原蛋白。
2实施例 3细胞转染及稳定细胞池筛选
本实施例表达系统的构建过程如下:
(1)用含10%胎牛血清的完全培养基培养CHO细胞,待细胞处于对数生长期时,收集细胞以15万/ml接种到24孔板。次日细胞快长满时用1μl脂质体转染试剂转染含有载体1μg的pWTY9.3-COL3A1。
(2)转染过载体的CHO细胞用含有杀稻瘟菌素(15μg/ml)的DMEM/F12培养基进行加压筛选。待未转染的对照细胞用杀稻瘟菌素完全杀死后,实验组存活的细胞为稳定转染的细胞株。降低培养基杀稻瘟菌素浓度为10μg/ml进行传代扩大培养,此过程细胞一直在37℃、5%CO2培养箱中培养,培养到20代,获得稳定转染III型人源胶原蛋白的CHO细胞池,命名为CHO-COL3A1细胞池。
Western bolt分析III型人源胶原蛋白的表达,结果见图2。
从图2结果可以看出,泳道1为未转染的空白对照组细胞,几乎检测不到重组III型人源胶原蛋白;泳道2、3、4分别COL3A1标准品、密码子优化前的野生型重组III型人源胶原蛋白、密码子优化后的重组III型人源胶原蛋白,III型人源胶原蛋白在稳定CHO细胞池成功表达。与密码子优化前的野生型胶原蛋白表达相比,密码子优化后的重组III型人源胶原蛋白表达量大幅提高。
本实施例所使用的CHO细胞为CHO-S细胞。在其他实施情形下,可使用CHO-K1、CHO-DG44、CHO-GS等细胞系,可达到相应的改善效果。
实施例 4生产III型人源胶原蛋白
实验例:本发明的III型人源胶原蛋白的生产方法,包括以下步骤:
将实施例3中稳定转染的密码子优化后的III型人源胶原蛋白的CHO-COL3A1细胞池(稳定CHO-III型人源胶原蛋白细胞池)转入125mL悬浮培养瓶中,初始细胞量为3~6×105个/mL,加入30ml CHO Pro Grow 无血清培养基,120rpm悬浮培养,每天用血清细胞计数器分析细胞密度,台盼蓝染色分析细胞的活性。
将稳定CHO-COL3A1细胞池在37℃下培养到对数期,然后转到33℃低温培养。培养至第七天收集细胞上清,ELISA检测各组III型人源胶原蛋白的表达量。
1.对比例1
本对比例与实验例的区别在于:将实施例3中稳定转染III型人源胶原蛋白的CHO-COL3A1细胞池的悬浮培养条件设为常温37℃培养;培养至第七天收集细胞上清,ELISA检测III型人源胶原蛋白的表达量。
2.对比例2
本对比例与实验例的区别在于:将实施例3中稳定转染III型人源胶原蛋白的CHO-COL3A1细胞池的悬浮培养条件设为低温33℃培养;培养至第七天收集细胞上清,ELISA检测III型人源胶原蛋白的表达量。
按照实验例、对比例1和对比例2的方法生产野生型重组III型人源胶原蛋白。对比本实施例中实验例方法与对比例1、2方法所得的细胞密度、细胞活性、III型人源胶原蛋白体积表达量,结果如图3~图5所示。
由图3~图5可知,各组的细胞活性没有显著差异;实验例中野生型和优化型III型人源胶原蛋白的体积表达量分别为60.23mg/L 、140.46mg/L;对比例1中野生型和优化型III型人源胶原蛋白的体积表达量分别为35.32mg/L 、90.25mg/L;对比例2中野生型和优化型III型人源胶原蛋白的体积表达量分别为45.56mg/L 、110.55mg/L。相较对比野生型与优化型,优化型表达量更高,相较对比1、2方法优化型的90.25mg/L、110.55mg/L,本发明实验例方法所得的胶原蛋白表达量最高。
3.对比例3-7
按照实验例的方法进行密码子优化后的稳定CHO-III型人源胶原蛋白细胞池的培养和分析,区别在于:在细胞培养第四天分别加入不同量的丙戊酸钠和氢化肉桂酸,各对比例的加量终浓度如下表1所示。
每天用血清细胞计数器分析细胞密度,台盼蓝染色分析细胞的活性。培养至第七天收集细胞上清,ELISA检测各组III型人源胶原蛋白的表达量。
4.对比例8
本对比例与实验例的区别在于:使用的是实施例3中稳定转染密码子优化前的野生型III型人源胶原蛋白的CHO-COL3A1细胞池。
5.对比例9
本对比例与实验例的区别在于:按照实施例3中稳定转染密码子优化前的III型人源胶原蛋白的CHO-COL3A1细胞池的培养和分析,区别在于:在细胞培养第四天分别加入丙戊酸钠和氢化肉桂酸,各实施例的加量终浓度如下表1所示。
对比上述方法所得的细胞密度、细胞活性、III型人源胶原蛋白体积表达量,结果如图6~图8所示。
由图6~图8可知,上述各组细胞的细胞密度、细胞活性没有显著差异。对照组在不加丙戊酸钠和氢化肉桂酸的情况下,胶原蛋白的表达量为139.12mg/L,加入丙戊酸钠和氢化肉桂酸后,各对比例所得胶原蛋白表达量均有一定提高,其中,对比例3~9 III型人源胶原蛋白的体积表达量分别为143.25mg/L、209.46mg/L、326.34mg/L、307.49mg/L、203.08mg/L、60.23 mg/L、122.35 mg/L,即第三组(对比例5)表达量最高,即当无血清培养基中丙戊酸钠的终浓度为0.5 mmol/L,氢化肉桂酸的终浓度为0.4m mol/L时,III型人源胶原蛋白的体积表达量最优。
除了本实施例中提到的丙戊酸钠和氢化肉桂酸,本发明还对丁酸钠、枸杞多糖、黄芪提取物、重酒石酸胆碱等添加物进行了筛选,结果显示,按照实验例方法将上述物质添加进无血清培养基后,重组III型人源胶原蛋白体积表达量并未获得显著提高。
从而,本发明的III型人源胶原蛋白的生产方法为:使用优化后的密码子序列进行载体构建;使用包括但不限于病毒转染、脂质体转染、阳离子聚合物转染等方法将载体转染到CHO细胞中(包括但不限于CHO-S、CHO-K1、CHO-DG44、CHO-GS等细胞系及其变体);使用包括但不限于杀稻瘟菌素、遗传霉素、甲氨蝶呤、蛋氨酸亚氨基代砜等药物进行加压筛选;使用包括但不限于有限稀释法、半固体培养基筛选法、流式细胞分选等方法对稳定细胞系进行筛选;使用商业化的培养基对稳定细胞系进行分批培养或分批补料培养或流加培养或灌流培养等方法对细胞进行表达培养。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1. 重组III型人源胶原蛋白的编码基因,其特征在于,其核苷酸序列如SEQ ID NO.4或SEQ ID NO.7所示。
2.由权利要求1所述的重组III型人源胶原蛋白的编码基因编码的重组III型人源胶原蛋白。
3.包含权利要求1所示的重组III型人源胶原蛋白的编码基因的重组表达载体。
4.根据权利要求3所示的重组表达载体,其特征在于,所述重组表达载体为pWTY9.3。
5.包含权利要求1所示的重组III型人源胶原蛋白的编码基因的重组细胞。
6.根据权利要求5所述的重组细胞,其特征在于,所述细胞为CHO细胞。
7.根据权利要求5所述的重组细胞,其特征在于,所述细胞为CHO-S、CHO-K1、CHO-DG44、CHO-GS中的一种或多种。
8.提高III型人源胶原蛋白表达量的生产方法,其特征在于,所述生产方法包括以下步骤:
(1)构建包含III型人源胶原蛋白的编码基因的重组表达载体;
(2)用重组表达载体转染CHO细胞株,通过培养、筛选,获得稳定CHO细胞池;
(3)将稳定CHO细胞池进行悬浮无血清培养,其中,先将稳定CHO细胞池在37℃条件下培养到对数期,然后转到33℃条件下培养。
9.根据权利要求8所述的提高III型人源胶原蛋白表达量的生产方法,其特征在于,步骤(3)中,稳定CHO细胞池进行悬浮无血清培养时,向无血清培养基中加入丙戊酸钠和氢化肉桂酸,丙戊酸钠的终浓度为0.05~3.0mmol/L,氢化肉桂酸的终浓度为0.1~1.5mmol/L。
10. 根据权利要求8或9所述的提高III型人源胶原蛋白表达量的生产方法,其特征在于,步骤(3)中,稳定CHO细胞池进行悬浮无血清培养时,所用的无血清培养基为CHO ProGrow无血清培养基。
CN202410299624.1A 2024-03-15 2024-03-15 重组iii型人源胶原蛋白的编码基因及其应用 Pending CN118048361A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410299624.1A CN118048361A (zh) 2024-03-15 2024-03-15 重组iii型人源胶原蛋白的编码基因及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410299624.1A CN118048361A (zh) 2024-03-15 2024-03-15 重组iii型人源胶原蛋白的编码基因及其应用

Publications (1)

Publication Number Publication Date
CN118048361A true CN118048361A (zh) 2024-05-17

Family

ID=91053680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410299624.1A Pending CN118048361A (zh) 2024-03-15 2024-03-15 重组iii型人源胶原蛋白的编码基因及其应用

Country Status (1)

Country Link
CN (1) CN118048361A (zh)

Similar Documents

Publication Publication Date Title
EP4119573B1 (en) Recombinant human type xvii collagen, preparation method and application thereof
CN112552393B (zh) 一种重组人源iii型胶原蛋白及其毕赤酵母重组表达系统
US4693973A (en) DNA sequences, recombinant DNA molecules and processes for producing bovine growth hormone-like polypeptides in high yield
CN112194720A (zh) 一种重组人源iii型胶原蛋白及其生产方法
KR20220058619A (ko) 인간 콜라겐 17형 폴리펩티드, 이의 생산 방법 및 용도
CN103842517A (zh) 胶原蛋白7及相关方法
CN110484538A (zh) 识别猪ROSA26基因的sgRNA及其编码DNA、基因编辑方法、试剂盒和应用
CN116333094B (zh) 一种重组人源化I型胶原蛋白α1及表达载体和应用
CN114480471A (zh) 酵母重组人源iii型三螺旋胶原蛋白及其制备方法
Pääbo et al. Association between transplantation antigens and a viral membrane protein synthesized from a mammalian expression vector
US10508279B2 (en) Recombinant Escherichia coli for high efficiency production of fructosylated chondroitin and method for making thereof
CN113150173A (zh) 一种重组人胶原蛋白肽及其制备方法和应用
CN112239760B (zh) 高效表达重组hGH的重组工程菌及构建方法和应用
CN116855500A (zh) 翻译调控元件在促进重组蛋白表达方面的应用、表达盒、载体、表达系统、试剂盒
CN118048361A (zh) 重组iii型人源胶原蛋白的编码基因及其应用
CN112592388A (zh) 一种2a肽、双顺反子表达载体、重组蛋白表达系统及应用
CN113637675B (zh) 一种人血清白蛋白的生产方法、核苷酸序列、表达载体及表达系统
CN107574172B (zh) 抗癌、抗炎多肽Lunasin在哺乳动物细胞CHO-S中的表达、纯化方法
CN107177611B (zh) 编码组织型纤溶酶原激活剂的dna分子及其重组细胞株
CN114561430B (zh) 人源化细胞瞬时表达用表达载体、表达系统、构建方法及其应用
CN106337043B (zh) 高稳定性的人胰蛋白酶突变体
CN109097357B (zh) 一种人工合成的mar共有序列、表达载体、表达系统及其应用
CN118324899B (zh) 一种重组xvii型人源化胶原蛋白、制备方法及其应用
CN117126874B (zh) 大规模制备164.88°三螺旋结构胶原蛋白生物方法
CN118546240A (zh) 一种重组人纤连蛋白及其制备方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination