KR20200119237A - 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자 - Google Patents

인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자 Download PDF

Info

Publication number
KR20200119237A
KR20200119237A KR1020207020915A KR20207020915A KR20200119237A KR 20200119237 A KR20200119237 A KR 20200119237A KR 1020207020915 A KR1020207020915 A KR 1020207020915A KR 20207020915 A KR20207020915 A KR 20207020915A KR 20200119237 A KR20200119237 A KR 20200119237A
Authority
KR
South Korea
Prior art keywords
nucleic acid
acid molecule
seq
human insulin
molecule encoding
Prior art date
Application number
KR1020207020915A
Other languages
English (en)
Inventor
페이페이 왕
레이 첸
홍웨이 왕
Original Assignee
지앙수 헨그루이 메디슨 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지앙수 헨그루이 메디슨 컴퍼니 리미티드 filed Critical 지앙수 헨그루이 메디슨 컴퍼니 리미티드
Publication of KR20200119237A publication Critical patent/KR20200119237A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자의 핵산 분자가 제공된다. 핵산 분자는 융합체 인슐린 유사체의 전구체를 암호화하는 핵산 분자 및 효모 분비 신호 펩티드 α-인자를 암호화하는 핵산 분자를 포함한다. 핵산 분자는 피키아 파스토리스에서 인슐린 유사체의 전구체의 발현을 개선하고, 인간 인슐린 유사체의 생산 비용을 감소시킨다.

Description

인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자
본 발명은 코돈 최적화된 인간 인슐린 유사체 전구체 유전자 및 코돈 최적화된 α-인자 신호 펩티드 유전자에 관한 것으로, 인간 인슐린 유사체 전구체 유전자를 발현시키는 방법을 제공한다.
인간 인슐린은 51개의 아미노산으로 구성된 폴리펩티드이며, 각각 사슬 A 및 사슬 B의 2개의 사슬을 포함한다. 인슐린의 주요 효능은 포도당 대사를 조절하는 것이다. 인슐린 중재(intervention)는 당뇨병에 대한 대안적 또는 보충적 치료로서 가장 직접적이고 효과적인 방법이다. 인슐린은 또한 지방 합성 촉진, 지방 분해 억제 및 케톤체 생성 감소에 영향을 미치므로, 인슐린 관련 케톤증(ketosis) 및 산증(acidosis)의 다양한 증상을 교정하는 데에도 사용된다.
인슐린은 이전에 돼지, 소 및 기타 동물의 췌장으로부터 추출되었지만, 이들 생성물은 인간 인슐린과 구조적으로 다르기 때문에 면역원성이 있다. 인간 인슐린의 생산을 위한 유전자 재조합 기술이 Eli Lilly & Co. USA와 Novo Nordisk Denmark에 의해 1980년대 초중반에 잇따라 개발되었으므로, 인간 인슐린 및 이의 유사체를 유전적으로 발현시키는 것이 당업계에서 주요 수단이 되었다. 그러나 인슐린의 단기 효과로 인해 인간 인슐린을 자주 주사해야 할 필요가 있는 환자에게 이는 매우 불편하다. 따라서, 인간에서 장기 효과를 나타내는 인슐린 유사체 및 유도체를 얻기 위한 노력이 이루어졌다. 그 중에서도, 아실화 기를 갖는 인간 인슐린 또는 이의 유사체의 변형은 이의 반감기를 증가시키는 효과적인 방법이다. 인간 인슐린 유사체는 WO2018024186에 개시되어 있으며, 여기에서 위치 B29는 장쇄 지방산으로 치환되었고, 위치 B30의 아미노산은 결실되었으며, 인간 인슐린 유사체의 구조 및 생물학적 활성이 개시되어 있다. 위치 B29에 연결된 14-아실 측쇄 및 위치 B30에서 아미노산 결실을 갖는 인슐린 유사체 및 이의 제조 방법이 WO9507931에 개시되어 있다. B29 위치가 글루탐산 및 장쇄 지방산으로 치환되고, B30 위치의 아미노산이 결실된 인간 인슐린 유사체가 WO2005012347에 개시되어 있다. 현재, 인간 인슐린 및 이의 유사체를 발현시키기 위하여 가장 일반적으로 사용되는 발현 시스템은 에스케리키아 콜라이(Escherichia coli), 사카로마이세스 세레비지애(Saccharomyces Cerevisiae) 및 피키아 파스토리스(Pichia Pastoris)로, 이 중에서 인간 인슐린 및 이의 유사체는 E. 콜라이에서 봉입체(inclusion body) 형태로 발현되며, 봉입체의 절단 및 복원(renaturation)이 필요하고, 이는 공정을 번거롭게 만들고 수율이 낮다; S. 세레비지애 및 P. 파스토리스는 조작 용이성, 배양 용이성, 외래 단백질의 변형, 및 분비 발현 능력 등으로 인한 장점이 있다. 그러나 사카로마이세스 세레비지애의 분비 효율은 낮고, 발현 균주는 안정적이지 않다. 대조적으로, 피키아 파스토리스는 재조합 단백질의 산업적 생산에서 보다 널리 사용되는 발현 시스템이다. 산업적으로, 생산 공정 중의 발효 수율은 생산 비용을 제어하는 핵심 인자이다. 상업용 인슐린의 큰 수요로 인해, 주요 생산업체인 Novo Nordisk에서는 효모 발현 시스템에서 생산하기 위한 탱크의 규모가 수십 톤에 이르며, 이는 공장과 설비 둘 다에 대한 높은 요구조건을 수반하고 결국 고비용을 초래한다. 따라서, 산업적 생산에서 인간 인슐린 및 이의 유사체의 발효 수율을 증가시키는 것이 매우 중요하다.
유전자 코돈은 메신저 리보핵산(messenger ribonucleic acid, mRNA)의 인접한 3개의 염기로 구성된 트리플렛 코드이다. 유전자 코돈에는 64개의 유형이 있다. 그러나 코돈 사용 빈도는 유기체마다, 심지어 동일한 유기체의 상이한 단백질 암호화 유전자마다 상이하다. 즉, 코돈 선호도가 있다. 외래 유전자의 코돈은 주로 번역 수준에서 유전자 발현에 영향을 미친다. 코돈 최적화가 피키아 파스토리스에서 외래 단백질의 발현을 증가시키는 데 상당한 영향을 미침을 보여주는 문헌이 많다. 외인성 유전자는 세포 내 발현 및 분비 발현의 형태로 피키아 파스토리스에서 발현된다. 후자의 경우, 외인성 유전자에 의해 발현되는 생성물의 분비를 지시하기 위하여 신호 펩티드가 필요하다. 현재, 가장 일반적으로 사용되는 신호 펩티드는 사카로마이세스 세레비지애의 α-인자 신호 펩티드로부터 유래되며, 이의 뉴클레오티드 서열 또한 사카로마이세스 세레비지애로부터 유래된다. 피키아 파스토리스에 대해 최적화된 α-인자 신호 펩티드 뉴클레오티드 서열은 현재까지 보고되지 않았다. 인슐린 전구체의 코돈 최적화, 예를 들어, Gurramkonda 등(Gurramkonda et al. Application of simple fed-batch technique to high-level secretory production of insulin precursor using Pichia pastoris with subsequent purification and conversion to human insulin. Microbial Cell Factories, 2010, 9:31)에 의한 피키아 파스토리스에서의 최적화된 인간 인슐린 전구체 유전자 서열 및 이의 발현에 대한 여러 관련 문헌이 있으며, 특허 공보 WO1998028429는 인간 인슐린 유사체 전구체를 발현하는 유전자 서열을 개시하고 있으며, 이 유전자에 의해 암호화된 인슐린 전구체 아미노산 서열은 EEGEPK-B(1-29)-AAK-A(1-21)이고, 여기에서 EEGEPK는 스페이서 펩티드 또는 리더 펩티드라 지칭되는 인슐린 전구체의 N 말단 연장부로, 효모 프로테아제를 통한 가수분해로부터 인슐린 전구체의 N 말단을 보호할 수 있고, 인슐린 전구체의 발현 효율을 개선할 수 있다; B (1-29)는 B30 트레오닌의 결실을 갖는 인간 인슐린 사슬 B이고, A (1-21)은 인간 인슐린 사슬 A의 아미노산 서열이다; AAK는 사슬 B를 사슬 A에 연결하는 링커 펩티드로, C 펩티드로도 지칭된다.
인간 인슐린 및 이의 유사체 전구체의 수율을 더 증가시키기 위하여, 본 발명자들은 피키아 파스토리스의 코돈 선호도에 따라 인슐린 유사체 전구체 유전자 및 피키아 파스토리스에서의 분비 발현을 위한 α-인자 신호 펩티드 유전자를 최적화하였다. 결과는 인간 인슐린 유사체 전구체의 수율이 (대조군으로서) 선행 기술에서 공지된 인간 인슐린 유사체 전구체 유전자와 비교할 때, 본 발명에 따른 코돈 최적화된 유전자 발현에 의해 거의 2배 증가되었음을 보여준다. 인간 인슐린 및 이의 유사체의 산업적 생산 비용은 후기 단계에서 크게 감소될 것이다.
본 발명의 일부 구현예에서, 다음의 구조를 포함하는 핵산 분자가 제공된다:
5'- (PS)a - (SP)b - (LS)c - GE - (P'S)d - 3',
여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 0 또는 1이고;
LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;
GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이다.
일부 구현예에서, 다음의 구조를 포함하는 핵산 분자가 제공된다:
5'- (PS)a - (SP)b - (LS)c - GE - (P'S)d - 3',
여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 1이고;
LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 1이고;
GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이다.
일부 구현예에서, 신호 펩티드를 암호화하는 핵산 분자는 서열번호 1로서 제시된 서열을 포함한다.
일부 구현예에서, 관심 폴리펩티드는 인간 인슐린 유사체 전구체 폴리펩티드이고; 인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자는 서열번호 3으로서 제시된 서열을 포함한다.
일부 구현예에서, 신호 펩티드를 암호화하는 핵산 분자(SP)의 핵산 서열은 서열번호 1로서 제시되며, 이의 아미노산 서열은 서열번호 2로서 제시된다:
ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGA
서열번호 1;
MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKR
서열번호 2.
일부 구현예에서, 관심 폴리펩티드를 암호화하는 핵산 분자(GE)는 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자일 수 있고, 여기에서 인간 인슐린 유사체 전구체는 위치 B30에서 트레오닌의 결실을 갖는 인간 인슐린일 수 있다. 인간 인슐린 유사체 전구체의 핵산 분자 서열은 서열번호 3으로서 제시되고, 이의 아미노산 서열은 서열번호 4로서 제시된다:
TTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 3;
FVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN
서열번호 4.
일부 구현예에서, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자의 위치 88 내지 96(즉, GCTGCTAAG)은 링커 펩티드(C 펩티드로도 지칭됨)를 암호화하는 핵산 분자를 나타내고, 이는 다음을 포함하나 이에 한정되지 않는 서열로 치환될 수 있다: GCCGCTAAG, GCTGCCAAG, GCTGCTAAA, GCCGCCAAG.
일부 구현예에서, 스페이서 펩티드를 암호화하는 핵산 분자(LS)의 서열은 서열번호 5로서 제시된다:
gaagaaggtgaaccaaag
서열번호 5.
일부 구현예에서, PS 및/또는 P'S는 제한 부위를 암호화하는 핵산 분자이다.
바람직하게는, PS는 EcoR I 제한 부위를 암호화하는 핵산 분자이고/분자이거나, P'S는 Not I 제한 부위를 암호화하는 핵산 분자이다.
일부 구현예에서, 인간 인슐린 유사체 전구체를 발현할 수 있는 핵산 분자가 제공되며, 여기에서 핵산 분자는 스페이서 펩티드를 암호화하는 핵산 분자 및 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자를 포함하고, 신호 펩티드를 포함하는 벡터와 재조합 후, 인간 인슐린 유사체 전구체를 발현할 수 있다.
일부 구현예에서, 인간 인슐린 유사체 전구체 핵산 분자에 의해 암호화된 인간 인슐린 유사체 전구체의 아미노산 서열은 다음과 같으며:
EEGEPK-B(1-29)-AAK-A(1-21)
여기에서, "EEGEPK(서열번호 16)"는 스페이서 펩티드 또는 리더 펩티드라 지칭되는 인슐린 전구체의 N-말단 연장부일 수 있고; "B(1-29)"는 위치 B30에 트레오닌의 결실을 갖는 인간 인슐린 사슬 B일 수 있고; "A(1-21)"은 인간 인슐린 사슬 A 아미노산 서열일 수 있고, "AAK"는 사슬 B를 사슬 A에 연결하는 링커 펩티드로, C 펩티드로도 지칭된다.
일부 구현예에서, 인간 인슐린 유사체 전구체 핵산 분자의 서열은 서열번호 6으로서 제시될 수 있고, 이의 아미노산 서열은 서열번호 7로서 제시된다:
GAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 6;
EEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN
서열번호 7.
일부 구현예에서, 인간 인슐린 유사체 전구체를 발현할 수 있는 또 다른 핵산 분자가 제공된다. 이 핵산 분자 서열은 신호 펩티드 서열, 스페이서 펩티드 서열, 및 인간 인슐린 유사체 전구체를 암호화하는 서열을 포함하고, 핵산 분자는 신호 펩티드 서열을 포함하지 않는 벡터와 재조합 후, 인간 인슐린 유사체 전구체를 발현할 수 있다.
일부 구현예에서, 인간 인슐린 유사체 전구체를 발현하는 핵산 분자의 핵산 서열은 서열번호 8로서 제시되고, 암호화된 아미노산 서열은 서열번호 9로서 제시된다:
ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 8;
MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKREEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN
서열번호 9.
일부 구현예에서, 인간 인슐린 유사체 전구체를 발현하는 핵산 분자는 또한 제한 부위(들)를 포함할 수 있고, 바람직하게는 제한 부위(들)는 EcoR I 제한 부위 및/또는 Not I 제한 부위이다.
일부 구현예에서, 진핵 또는 원핵 세포에서 발현될 수 있는 벡터가 제공되며, 이는 분비 발현을 통해 원핵 또는 진핵 세포에서 인간 인슐린 유사체 전구체를 발현할 수 있다.
일부 구현예에서, 숙주 세포가 또한 제공된다. 바람직하게는, 숙주 세포는 분비 발현을 통해 인간 인슐린 유사체 전구체를 발현할 수 있는 효모, 더욱 바람직하게는 피키아이다.
일부 구현예에서, 위에 기술된 바와 같은 핵산 분자, 벡터, 및/또는 숙주 세포를 이용하는 단계를 포함하는, 인간 인슐린 유사체의 제조 방법이 또한 제공된다.
방법은 다음의 단계를 더 포함할 수 있다:
1) 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자에 의해 진핵 세포에서 인간 인슐린 유사체 전구체를 발현시키는 단계;
2) 인간 인슐린 유사체 전구체를 효소적으로 분해시켜 인간 인슐린 유사체를 수득하는 단계, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 6으로서 제시될 수 있고, 인슐린 유사체 전구체는 당업자에게 잘 알려져 있는 방법을 이용하여 효소적으로 분해될 수 있다.
일부 구현예에서, 단계 1)은 신호 펩티드 서열을 포함하는 발현 벡터에 의해 인간 인슐린 유사체 전구체를 발현시키는 단계를 포함하며, 상기 신호 펩티드 서열은 서열번호 1로서 제시된다.
일부 구현예에서, 인간 인슐린 유사체는 B30의 결실을 갖는 인간 인슐린이고, 인간 인슐린 유사체는 아실화된 기로 더 치환된다.
일부 구현예에서, B30의 결실을 갖는 상기 인간 인슐린 내에서, 위치 B29의 리신은 아실화된 기로 치환된다.
바람직하게는, 위의 치환 후에 수득되는 생성물은 리신 B29 (Nε-(Nα-헥사데칸 지방 이산-L-리신-Nε-옥소부틸일)) 데스(B30) 인간 인슐린이다.
약어 및 용어
"코돈 최적화"는 숙주 세포에 대한 코돈 선호도의 규칙에 따라 낮은 빈도 또는 희귀한 코돈 대신 선호되는 코돈을 갖는 유전자의 합성을 지칭한다.
"대조군 1"은 아래에 서열번호 10으로서 제시되며, 여기에서 "EEGEPK"를 암호화하는 핵산 분자(GAAGAAGGTGAACCAAAG, 이중 밑줄 친 부분)가 WO1998028429에 의해 교시된 인슐린 전구체 유전자를 암호화하는 핵산 분자에 연결된다:
GAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA
서열번호 10.
"대조군 2"는 아래에 서열번호 11로서 제시되며, 여기에서 "EEGEPK"를 암호화하는 핵산 분자(이중 밑줄 친 부분)가 Gurramkonda 등(Microbial Cell Factories, 2010, 9:31)에 의해 교시된 최적화된 인슐린 전구체 유전자를 암호화하는 핵산 분자에 연결된다:
GAAGAAGGTGAACCAAAGTTTGTTAACCAACATTTGTGTGGTTCTCATTTGGTTGAAGCTTTGTACTTGGTTTGTGGTGAAAGAGGTTTCTTCTACACTCCAAAGGCTGCTAAGGGTATTGTTGAACAATGTTGTACTTCTATTTGTTCTTTGTACCAATTGGAAAACTACTGTAACTAA
서열번호 11.
"IP-S"는 코돈 최적화 후 인슐린 전구체 유전자에 상응하는 핵산 분자이다.
"α-인자"는 사카로마이세스 세레비지애로부터 유래된, Invitrogen사가 제공한 pPIC9K 발현 벡터에 포함된 α-인자 신호 펩티드 유전자에 상응하는 핵산 분자이다.
"α-인자-S"는 코돈 최적화된 α-인자 신호 펩티드 유전자에 상응하는 핵산 분자이다.
"벡터"는 플라스미드 및 바이러스 벡터를 포함하나 이에 한정되지 않는, 핵산 분자가 연결되는 또 다른 핵산 분자를 운반할 수 있는 핵산 분자를 포함한다. 일부 벡터는 이들이 도입되는 숙주 세포에서 자율적으로 복제될 수 있으나, 다른 벡터는 숙주 세포로 도입될 때 숙주 세포의 게놈에 통합되어 숙주 게놈과 함께 복제될 수 있다. 또한, 일부 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있으며, 이러한 벡터는 본원에서 "재조합 발현 벡터"(또는 간단히 "발현 벡터")로 지칭된다. 전통적인 벡터는 당해 분야에 잘 알려져 있다.
"관심 폴리펩티드"는 효소, 항체, 인터페론, 인슐린, 인터루킨 등을 포함하나 이에 한정되지 않는, 효모에서 발현될 수 있는 폴리펩티드 및 이의 변이체, 전구체, 중간체이다. 예를 들어, 관심 폴리펩티드는 인슐린 전구체일 수 있다.
"세포" 및 "숙주 세포"는 상호교환적으로 사용될 수 있다.
"폴리뉴클레오티드 분자", "핵산 분자"는 상호교환적으로 사용될 수 있고, 이의 서열은 DNA 서열일 수 있다.
다음의 실시예는 발명을 더 설명하기 위하여 제공되는 것으로, 발명의 범위를 제한하려는 것은 아니다.
본 발명의 실시예에 사용되는 벡터, 숙주 박테리아 및 배양 배지는 Invitrogen으로부터 구입하였다. 피키아 파스토리스 발현 벡터인 pPIC9K는 메탄올에 의해 유도될 수 있는 알코올 산화효소 AOX1 프로모터를 함유하고, 또한 α-인자 신호 펩티드 서열을 함유하며, 분비 발현을 통해 외래 단백질을 발현할 수 있다. 또 다른 피키아 파스토리스 발현 벡터인 pPIC3.5K는 메탄올에 의해 유도될 수 있는 알코올 산화효소 AOX1 프로모터를 함유하나, α-인자 신호 펩티드 서열은 함유하지 않는다. 피키아 파스토리스 GS115 균주를 숙주 박테리아로 사용하였다. 배양 배지의 구성 성분(formulation)은 피키아 파스토리스 매뉴얼에 의해 제공되었다.
실시예 1 인슐린 전구체를 위한 재조합 발현 벡터의 구축
EcoR I 및 Not I 제한 부위를 대조군 1(서열번호 10), 대조군 2(서열번호 11) 및 IP-S(서열번호 6)의 5' 말단과 3' 말단에 각각 부가하고, Nanjing Kingsray Biotech Co., Ltd.가 합성하였다. 합성된 핵산 분자 서열을 T 벡터에 연결하였다.
GAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 6;
GAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA
서열번호 10;
GAAGAAGGTGAACCAAAGTTTGTTAACCAACATTTGTGTGGTTCTCATTTGGTTGAAGCTTTGTACTTGGTTTGTGGTGAAAGAGGTTTCTTCTACACTCCAAAGGCTGCTAAGGGTATTGTTGAACAATGTTGTACTTCTATTTGTTCTTTGTACCAATTGGAAAACTACTGTAACTAA
서열번호 11.
인슐린 전구체 핵산 분자를 갖는 T 벡터 및 발현 벡터 pPIC9K를 EcoR I 및 Not I으로 분해한 다음, 표적 단편 및 벡터 단편을 겔 회수 키트로 개별적으로 회수하였다. 분해된 단편의 정제 후, 표적 단편을 T4 리가아제로 벡터 pPIC9K에 연결시켰다.
위에 언급된 연결 용액으로 E. 콜라이 TOP10 컴피턴트 세포를 형질전환시키고, 암피실린 저항성을 구비한 플레이트에 도말하였다. 배양 후, 박테리아 콜로니를 떼어내어, 플라스미드를 추출하고, 두 제한효소를 이용한 분해에 의해 검증하였다. 대조군 1, 대조군 2 및 IP-S 서열을 각각 포함하는 3개의 재조합 발현 벡터를 최종적으로 수득하였다.
실시예 2 피키아 파스토리스 재조합 균주에 의한 인슐린 전구체의 발현
실시예 1에서 구축된 3개의 재조합 발현 벡터로 각각 피키아 파스토리스 GS115를 형질전환시키고, 대조군 1 및 대조군 2를 발현하는 재조합 균주를 대조 균주로 사용하였고, IP-S를 발현하는 재조합 균주를 시험 균주로 사용하였다.
3개의 재조합 박테리아로부터의 콜로니를 5 mL의 YPD 배지에 접종하고, OD600의 값이 약 10에 도달할 때까지(16 내지 18시간) 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였다. 세포를 수집하고 50 mL의 BMGY 배지에 재현탁시키고, OD600의 값이 약 30에 도달할 때까지 250 rpm에서 진탕하면서 30℃의 항온에서 밤새 배양하였다. 1500 rpm에서 5분 동안 원심분리하여 세포를 수집하고, 25 mL의 BMMY 배지에 재현탁시켰다. 1/200 부피의 메탄올(최종 농도 0.5%)을 배지에 첨가하고, 96시간 동안 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였고, 24시간마다 1/200 부피의 메탄올을 보충하였다. 발현이 완료되면, 10,000 rpm에서 원심분리 후 상청액을 수득하였다. 상청액에 포함된 인슐린 전구체의 수율을 HPLC로 측정하고, 대조 균주에 의해 발현된 인슐린 전구체의 발현량에 대한 백분율로 변환하였다. 인슐린 전구체의 발현 수준의 백분율을 표 1에 나타내었다.
박테리아 균주 벡터 신호 펩티드 발현 유전자 수율(%)
대조 박테리아 pPIC9K α-인자 대조군 1 100
대조 박테리아 pPIC9K α-인자 대조군 2 125
시험 박테리아 pPIC9K α-인자 IP-S 225
표 1의 데이터는 최적화된 인슐린 전구체 유전자에 의해 발현된 인슐린 전구체의 양이 2개의 대조군과 비교하여 1.8 내지 2.25배 증가되었음을 보여준다. 최적화된 인슐린 전구체 유전자는 우수한 발현 효율을 가지며, 발현된 인슐린 전구체의 수율을 현저히 개선할 수 있음을 알 수 있다.
실시예 3 상이한 α-인자에 융합된 인슐린 전구체 유전자를 포함하는 재조합 발현 벡터의 구축
α-인자(서열번호 12) 및 α-인자-S(서열번호 1)가 IP-S의 상류의 부위에 개별적으로 융합된 서열번호 13 및 서열번호 8로 제시된 핵산 분자를 합성하였다. EcoR I 및 Not I 제한 부위를 또한 합성된 핵산 분자의 5' 및 3' 말단 둘 다에 포함시켰다. 합성된 핵산 분자를 T 벡터에 연결하였다.
ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGA
서열번호 12
ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGA
서열번호 1
ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 13
ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA
서열번호 8
α-인자(서열번호 12) 및 α-인자-S(서열번호 1)가 대조군 1의 상류의 부위에 개별적으로 융합된 서열번호 14 및 서열번호 15로서 제시된 핵산 분자를 합성하였다. EcoR I 및 Not I 제한 부위를 또한 합성된 핵산 분자의 5' 및 3' 말단 둘 다에 포함시켰다. 합성된 핵산 분자를 T 벡터에 연결하였다.
ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA
서열번호 14
ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA
서열번호 15.
위의 T 벡터 및 발현 벡터 pPIC3.5K를 엔도뉴클레아제 EcoR I 및 Not I으로 분해시킨 다음, 표적 단편 및 벡터 단편을 겔 회수 키트로 개별적으로 회수하였다. 소화된 단편의 정제 후, 표적 단편을 T4 리가아제로 벡터 pPIC3.5K에 연결시켰다.
위에 언급된 연결 용액으로 E. 콜라이 TOP10 컴피턴트 세포를 형질전환시키고, 암피실린 저항성을 구비한 플레이트에 도말하였다. 배양 후, 박테리아 콜로니를 떼어내어, 플라스미드를 추출하고, 두 제한효소를 이용한 분해에 의해 검증하였다. 상이한 뉴클레오티드 서열을 갖는 인슐린 전구체 유전자를 발현시키기 위하여 α-인자 또는 α-인자-S 신호 펩티드를 개별적으로 포함하는 네 개의 재조합 발현 벡터를 최종적으로 수득하였다.
실시예 4 최적화 전과 후, 피키아 파스토리스 재조합 균주에 의한 인슐린 전구체의 발현
실시예 3에서 구축된 재조합 발현 벡터로 피키아 파스토리스 GS115를 개별적으로 형질전환시켰다.
재조합 박테리아 콜로니를 5 mL의 YPD 배지에 접종하고, OD600의 값이 약 10에 도달할 때까지(16 내지 18시간) 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였다. 세포를 수집하고 50 mL의 BMGY 배지에 재현탁시키고, OD600의 값이 약 30에 도달할 때까지 250 rpm에서 진탕하면서 30℃의 항온에서 밤새 배양하였다. 1500 rpm에서 5분 동안 원심분리하여 세포를 수집하고, 25 mL의 BMMY 배지에 재현탁시켰다. 1/200 부피의 메탄올(최종 농도 0.5%)을 배지에 첨가하고, 96시간 동안 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였고, 24시간마다 1/200 부피의 메탄올을 보충하였다. 발현이 완료되면, 10,000 rpm에서 원심분리 후 상청액을 수득하였다. 상청액에 포함된 인슐린 전구체의 수율을 HPLC에 의해 측정하였다.
α-인자에 융합된 대조군 1 유전자를 발현하는 재조합 박테리아를 대조 박테리아로 사용하였다. 다른 균주에 의한 인슐린 전구체의 수율을 표 2에 나타낸 바와 같이, 대조 균주에 의해 발현된 인슐린 전구체의 수율에 대한 백분율로 변환하였다.
박테리아 균주 벡터 신호 펩티드 발현 유전자 수율(%)
대조 박테리아 pPIC3.5K α-인자 대조군 1 100
시험 박테리아 pPIC3.5K α-인자-S 대조군 1 150
시험 박테리아 pPIC3.5K α-인자 IP-S 225
시험 박테리아 pPIC3.5K α-인자-S IP-S 275
표 2의 데이터는, 단지 핵산 분자의 신호 펩티드를 최적화한 후에는 인슐린 전구체의 수율이 1.5배 증가되었으며, 단지 인슐린 전구체 유전자를 최적화한 후에는 이러한 수율이 2.25배 증가되었음을 보여준다. 대조적으로, 신호 펩티드와 인슐린 전구체 유전자 둘 다를 최적화한 후에는 인슐린 전구체의 수율은 2.75배 증가되었다. 종합하면, 코돈 최적화는 인슐린 전구체의 발현 수준을 1.5 내지 2.75배까지 증가시킬 수 있다.
<110> JIANGSU HENGRUI MEDICINE CO.,LTD <120> CODON OPTIMIZED PRECURSOR GENE AND SIGNAL PEPTIDE GENE OF HUMAN INSULIN ANALOGUE <130> P20-065-INP-GC <150> CN 201810131794.3 <151> 2018-02-09 <160> 16 <170> KoPatentIn 3.0 <210> 1 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding signal peptide <220> <221> gene <222> (1)..(255) <400> 1 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaaga 255 <210> 2 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> signal peptide <220> <221> PEPTIDE <222> (1)..(85) <400> 2 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg 85 <210> 3 <211> 162 <212> DNA <213> Homo sapiens <220> <221> gene <222> (1)..(162) <223> nucleic acid molecule encoding human insulin analogue precursor <400> 3 ttcgtcaacc agcacttgtg tggttcccat ttggttgagg ctctgtactt ggtctgtgga 60 gaaagaggtt tcttttacac cccaaaggct gctaagggta tcgttgagca atgttgcacc 120 tctatttgtt ccctgtatca gttggaaaac tactgcaact aa 162 <210> 4 <211> 53 <212> PRT <213> Homo sapiens <220> <221> PEPTIDE <222> (1)..(53) <223> human insulin analogue precursor <400> 4 Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys 20 25 30 Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu 35 40 45 Glu Asn Tyr Cys Asn 50 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding spacer peptide <220> <221> gene <222> (1)..(18) <400> 5 gaagaaggtg aaccaaag 18 <210> 6 <211> 180 <212> DNA <213> Homo sapiens <400> 6 gaagaaggtg aaccaaagtt cgtcaaccag cacttgtgtg gttcccattt ggttgaggct 60 ctgtacttgg tctgtggaga aagaggtttc ttttacaccc caaaggctgc taagggtatc 120 gttgagcaat gttgcacctc tatttgttcc ctgtatcagt tggaaaacta ctgcaactaa 180 180 <210> 7 <211> 59 <212> PRT <213> Homo sapiens <400> 7 Glu Glu Gly Glu Pro Lys Phe Val Asn Gln His Leu Cys Gly Ser His 1 5 10 15 Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr 20 25 30 Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile 35 40 45 Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 50 55 <210> 8 <211> 435 <212> DNA <213> Homo sapiens <400> 8 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaagagaaga aggtgaacca aagttcgtca accagcactt gtgtggttcc 300 catttggttg aggctctgta cttggtctgt ggagaaagag gtttctttta caccccaaag 360 gctgctaagg gtatcgttga gcaatgttgc acctctattt gttccctgta tcagttggaa 420 aactactgca actaa 435 <210> 9 <211> 144 <212> PRT <213> Homo sapiens <400> 9 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Glu Gly Glu Pro Lys Phe Val Asn Gln His 85 90 95 Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu 100 105 110 Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln 115 120 125 Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 130 135 140 <210> 10 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding spacer peptide <220> <221> misc_feature <222> (1)..(18) <400> 10 gaagaaggtg aaccaaagtt cgttaaccaa cacttgtgcg gttcccactt ggttgaagct 60 ttgtacttgg tttgcggtga aagaggtttc ttctacactc ctaaggctgc taagggtatt 120 gtcgaacaat gctgtacctc catctgctcc ttgtaccaat tggaaaacta ctgcaactaa 180 180 <210> 11 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding spacer peptide <220> <221> misc_feature <222> (1)..(18) <400> 11 gaagaaggtg aaccaaagtt tgttaaccaa catttgtgtg gttctcattt ggttgaagct 60 ttgtacttgg tttgtggtga aagaggtttc ttctacactc caaaggctgc taagggtatt 120 gttgaacaat gttgtacttc tatttgttct ttgtaccaat tggaaaacta ctgtaactaa 180 180 <210> 12 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding a-factor <220> <221> gene <222> (1)..(255) <400> 12 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaaga 255 <210> 13 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 13 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaaga aggtgaacca aagttcgtca accagcactt gtgtggttcc 300 catttggttg aggctctgta cttggtctgt ggagaaagag gtttctttta caccccaaag 360 gctgctaagg gtatcgttga gcaatgttgc acctctattt gttccctgta tcagttggaa 420 aactactgca actaa 435 <210> 14 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 14 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaaga aggtgaacca aagttcgtta accaacactt gtgcggttcc 300 cacttggttg aagctttgta cttggtttgc ggtgaaagag gtttcttcta cactcctaag 360 gctgctaagg gtattgtcga acaatgctgt acctccatct gctccttgta ccaattggaa 420 aactactgca actaa 435 <210> 15 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 15 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaagagaaga aggtgaacca aagttcgtta accaacactt gtgcggttcc 300 cacttggttg aagctttgta cttggtttgc ggtgaaagag gtttcttcta cactcctaag 360 gctgctaagg gtattgtcga acaatgctgt acctccatct gctccttgta ccaattggaa 420 aactactgca actaa 435 <210> 16 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> spacer peptide <220> <221> PEPTIDE <222> (1)..(6) <400> 16 Glu Glu Gly Glu Pro Lys 1 5

Claims (13)

  1. 다음의 일반 식을 갖는 분자 또는 구조를 포함하는 핵산 분자:
    5'- (PS)a - (SP)b - (LS)c - GE - (P'S)d - 3',
    여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
    SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 0 또는 1이고;
    LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;
    GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
    P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이고; 그리고
    신호 펩티드를 암호화하는 핵산 분자는 서열번호 1로서 제시된 서열을 포함함.
  2. 다음의 일반 식을 갖는 분자 또는 구조를 포함하는 핵산 분자:
    5'- (PS)a - (SP)b - (LS)c - GE - (P'S)d - 3',
    여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
    SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 1이고;
    LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;
    GE는 인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
    P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이고; 그리고
    인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자는 서열번호 3으로서 제시된 서열을 포함함.
  3. 제1항에 있어서,
    관심 폴리펩티드는 인간 인슐린 유사체 전구체이고, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 4로서 제시된 아미노산 서열을 암호화하는 핵산 분자를 포함하고, 바람직하게는 서열번호 3으로서 제시된 핵산 서열을 포함하는 것인, 핵산 분자.
  4. 제2항에 있어서,
    신호 펩티드를 암호화하는 핵산 분자는 서열번호 2로서 제시된 아미노산 서열을 암호화하는 핵산 분자를 포함하고, 바람직하게는 서열번호 1 또는 서열번호 12로서 제시된 핵산 서열을 포함하는 것인, 핵산 분자.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서,
    인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 3의 위치 88 내지 96에서의 치환을 포함하고, 바람직하게는 GCCGCTAAG, GCTGCCAAG, GCTGCTAAA 또는 GCCGCCAAG로 치환되는 것인, 핵산 분자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    스페이서 펩티드의 아미노산 서열은 EEGEPK(Glu-Glu-Gly-Glu-Pro-Lys)를 포함하고, 바람직하게는 스페이서 펩티드를 암호화하는 핵산 분자는 서열번호 5로서 제시된 서열을 포함하는 것인, 핵산 분자.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    서열번호 1, 서열번호 3, 서열번호 6, 서열번호 8, 서열번호 13 및 서열번호 15로 이루어진 군으로부터 선택되는 어느 하나를 포함하거나, 또는 서열번호 1, 서열번호 3, 서열번호 6, 서열번호 8, 서열번호 13 및 서열번호 15로 이루어진 군으로부터 선택되는 어느 하나로 이루어지는, 핵산 분자.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    프로세싱 부위는 제한 부위이고, 바람직하게는, PS는 EcoR I 제한 부위를 암호화하는 핵산 분자이고/분자이거나, P'S는 Not I 제한 부위를 암호화하는 핵산 분자인 것인, 핵산 분자.
  9. 제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터로서,
    바람직하게는 벡터는 진핵세포 발현 벡터 또는 원핵세포 발현 벡터인, 벡터.
  10. 제1항 내지 제8항 중 어느 한 항의 핵산 분자 및/또는 제9항의 벡터를 포함하는 숙주 세포로서,
    바람직하게는 숙주 세포는 효모; 더욱 바람직하게는, 피키아 파스토리스(Pichia Pastoris)인, 숙주 세포.
  11. 제1항 내지 제8항 중 어느 한 항의 핵산 분자, 제9항의 벡터, 및/또는 제10항의 숙주 세포의 사용을 포함하는, 인간 인슐린 유사체의 생산 방법.
  12. 제11항에 있어서,
    1) 인간 인슐린 유사체 전구체를 발현시키는 단계; 및
    2) 단계 1)에서 수득된 인간 인슐린 유사체 전구체를 효소적으로 분해시켜 인간 인슐린 유사체를 수득하는 단계를 더 포함하는, 방법.
  13. 제11항 또는 제12항에 있어서,
    인간 인슐린 유사체는 B30의 결실을 갖는 인간 인슐린이고/이거나, 인간 인슐린 유사체는 아실화된 기로 더 치환되고; 바람직하게는, 위치 B29의 리신이 아실화된 기로 치환되고; 더욱 바람직하게는, 치환 후의 생성물이 리신 B29 (Nε-(Nα-헥사데칸 지방 이산-L-리신-Nε-옥소부틸일)) 데스(B30) 인간 인슐린인 것인, 방법.
KR1020207020915A 2018-02-09 2019-02-01 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자 KR20200119237A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810131794.3 2018-02-09
CN201810131794 2018-02-09
PCT/CN2019/074384 WO2019154311A1 (zh) 2018-02-09 2019-02-01 一种密码子优化的人胰岛素类似物前体基因和信号肽基因

Publications (1)

Publication Number Publication Date
KR20200119237A true KR20200119237A (ko) 2020-10-19

Family

ID=67548783

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207020915A KR20200119237A (ko) 2018-02-09 2019-02-01 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자

Country Status (12)

Country Link
US (1) US20210032307A1 (ko)
EP (1) EP3750998A4 (ko)
JP (1) JP2021513330A (ko)
KR (1) KR20200119237A (ko)
CN (1) CN111094572B (ko)
AU (1) AU2019218315A1 (ko)
BR (1) BR112020015238A2 (ko)
CA (1) CA3086618A1 (ko)
MX (1) MX2020007929A (ko)
RU (1) RU2020128190A (ko)
TW (1) TW201934752A (ko)
WO (1) WO2019154311A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111560379B (zh) * 2020-05-26 2022-09-13 北京惠之衡生物科技有限公司 密码子优化的门冬胰岛素前体基因、重组载体、基因工程菌及其应用
CN117384275B (zh) * 2023-12-13 2024-03-15 北京科为博生物科技有限公司 胰岛素样生长因子突变体igf1m及其应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1340772C (en) * 1987-12-30 1999-09-28 Patricia Tekamp-Olson Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences
BR9407508A (pt) 1993-09-17 1997-01-07 Novo Nordisk As Derivado de insulina composição farmaceutica e processo para o tratamento de diabete em um paciente com necessidade deste tratamento
US5639642A (en) * 1994-06-16 1997-06-17 Novo Nordisk A/S Synthetic leader peptide sequences
JP4187796B2 (ja) * 1996-12-20 2008-11-26 ノボ ノルディスク アクティーゼルスカブ 酵母で発現されたn末端伸長タンパク質
CN1302333A (zh) * 1998-01-23 2001-07-04 诺沃挪第克公司 在酵母中制备目的多肽的方法
AR025646A1 (es) * 2000-09-13 2002-12-04 Beta Lab Sa Cepa de levaduras metilotroficas recombinantes productoras de un precursor de insulina, construcciones de adn y metodo para obtener la cepa.
EA014887B1 (ru) * 2003-06-17 2011-02-28 Сембайосиз Джинетикс Инк. Способ экспрессии инсулина в семенах растения, способ получения семян растений, содержащих инсулин, и растения, способные производить семена, содержащие инсулин
BRPI0413276B8 (pt) 2003-08-05 2021-05-25 Novo Nordisk As derivado de insulina, complexo de zinco do mesmo, e, composição farmacêutica
CN1873006A (zh) * 2005-05-30 2006-12-06 上海新生源医药研究有限公司 一种重组人胰岛素原的生产方法
WO2010103546A2 (en) * 2009-03-12 2010-09-16 Bigtec Private Limited A polynucleotide and polypeptide sequence and methods thereof
AR087433A1 (es) * 2011-08-08 2014-03-26 Merck Sharp & Dohme Analogos de insulina n-glicosilados
RU2014127270A (ru) * 2011-12-15 2016-02-10 Шанхай Хэнжуй Фармасьютикал Ко., Лтд. Аналог человеческого инсулина и его ацилированное производное
EP3495384A4 (en) 2016-08-02 2020-02-26 Jiangsu Hengrui Medicine Co., Ltd. ACYLATED DERIVATIVE OF HUMAN INSULIN OR ANALOGUE OF IT

Also Published As

Publication number Publication date
EP3750998A4 (en) 2022-02-23
CA3086618A1 (en) 2019-08-15
BR112020015238A2 (pt) 2020-12-29
RU2020128190A3 (ko) 2022-03-09
RU2020128190A (ru) 2022-03-09
US20210032307A1 (en) 2021-02-04
AU2019218315A1 (en) 2020-07-09
MX2020007929A (es) 2020-10-01
EP3750998A1 (en) 2020-12-16
CN111094572A (zh) 2020-05-01
JP2021513330A (ja) 2021-05-27
WO2019154311A1 (zh) 2019-08-15
CN111094572B (zh) 2023-04-04
TW201934752A (zh) 2019-09-01

Similar Documents

Publication Publication Date Title
JP5027812B2 (ja) トリプシンの変異体によるインスリン前駆体の切断
CN113502296B (zh) 一种表达司美鲁肽前体的重组工程菌及其构建方法
CN110724187B (zh) 一种高效表达利拉鲁肽前体的重组工程菌及其应用
CN111793126A (zh) Glp-1类似物多肽的制备方法及在ⅱ型糖尿病中应用
CN112584853A (zh) 一种新型门冬胰岛素原的结构和制备门冬胰岛素的方法
JPH0847393A (ja) 酵母からタンパク質を分泌させるためのシグナル配列
KR20200119237A (ko) 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자
Lennick et al. High-level expression of α-human atrial natriuretic peptide from multiple joined genes in Escherichia coli
ES2258371B1 (es) Levadura transformante productora de hormona paratiroidea humana y procedimiento para producir la hormona.
WO2020187270A1 (zh) 含有荧光蛋白片段的融合蛋白及其用途
EP1185675B1 (en) Escherichia coli strain secreting human granulocyte colony stimulating factor (g-csf)
KR100659671B1 (ko) 신규한 융합단백질로부터 재조합 인슐린을 제조하는 방법
CN116554309A (zh) 一种重组人源ⅲ型胶原蛋白及其制备方法和应用
CN115029404B (zh) 用于lpp单基因敲除或突变的大肠杆菌分泌表达短肽类蛋白的发酵培养基及应用
CN105884901A (zh) 具持续控制血糖含量功能的重组人血清白蛋白/胰高糖素类肽融合蛋白
KR20220058631A (ko) 재조합 치료 펩타이드의 발현을 위한 n-말단 연장부 서열
CN100429226C (zh) 胰岛素及胰岛素类似物的基因工程制备新方法
CN114805610B (zh) 一种高表达甘精胰岛素前体的重组基因工程菌及其构建方法
CN114805544B (zh) 一种赖脯胰岛素前体、其重组基因工程菌及其构建方法
RU2729737C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pF882, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ В30-ДЕЗТРЕОНИН-ИНСУЛИН, И ШТАММ БАКТЕРИЙ Escherichia coli - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО В30-ДЕЗТРЕОНИН-ИНСУЛИН
WO2012048856A1 (en) Proinsulin with helper sequence
RU2729353C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pF646, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН АСПАРТ, И ШТАММ БАКТЕРИЙ Escherichia coli - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН АСПАРТ
RU2729381C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pF644, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН ГЛАРГИН, И ШТАММ БАКТЕРИЙ Escherichia coli - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН ГЛАРГИН
RU2728611C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pF265, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН ЧЕЛОВЕКА, И ШТАММ БАКТЕРИЙ Escherichia coli - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН ЧЕЛОВЕКА
RU2515061C1 (ru) РЕКОМБИНАТНАЯ ПЛАЗМИДНАЯ ДНК рНI03 КОДИРУЮЩАЯ, ГИБРИДНЫЙ БЕЛОК С ПРОИНСУЛИНОМ ЧЕЛОВЕКА, КЛЕТКА Escherichia coli, ТРАНСФОРМИРОВАННАЯ РЕКОМБИНАНТНОЙ ПЛАЗМИДНОЙ ДНК рНI03, И ШТАММ БАКТЕРИЙ Escherichia coli JM109/pHI03-ПРОДУЦЕНТ ГИБРИДНОГО БЕЛКА-ПРЕДШЕСТВЕННИКА ИНСУЛИНА ЧЕЛОВЕКА

Legal Events

Date Code Title Description
A201 Request for examination
WITB Written withdrawal of application