KR20200119237A

KR20200119237A - 인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자

Info

Publication number: KR20200119237A
Application number: KR1020207020915A
Authority: KR
Inventors: 페이페이 왕; 레이 첸; 홍웨이 왕
Original assignee: 지앙수 헨그루이 메디슨 컴퍼니 리미티드
Priority date: 2018-02-09
Filing date: 2019-02-01
Publication date: 2020-10-19
Also published as: MX2020007929A; TW201934752A; RU2020128190A; CA3086618A1; CN111094572A; JP2021513330A; US20210032307A1; EP3750998A4; RU2020128190A3; CN111094572B; BR112020015238A2; EP3750998A1; WO2019154311A1; AU2019218315A1

Abstract

인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자의 핵산 분자가 제공된다. 핵산 분자는 융합체 인슐린 유사체의 전구체를 암호화하는 핵산 분자 및 효모 분비 신호 펩티드 α-인자를 암호화하는 핵산 분자를 포함한다. 핵산 분자는 피키아 파스토리스에서 인슐린 유사체의 전구체의 발현을 개선하고, 인간 인슐린 유사체의 생산 비용을 감소시킨다.

Description

인간 인슐린 유사체의 코돈 최적화된 전구체 유전자 및 신호 펩티드 유전자

본 발명은 코돈 최적화된 인간 인슐린 유사체 전구체 유전자 및 코돈 최적화된 α-인자 신호 펩티드 유전자에 관한 것으로, 인간 인슐린 유사체 전구체 유전자를 발현시키는 방법을 제공한다.

인간 인슐린은 51개의 아미노산으로 구성된 폴리펩티드이며, 각각 사슬 A 및 사슬 B의 2개의 사슬을 포함한다. 인슐린의 주요 효능은 포도당 대사를 조절하는 것이다. 인슐린 중재(intervention)는 당뇨병에 대한 대안적 또는 보충적 치료로서 가장 직접적이고 효과적인 방법이다. 인슐린은 또한 지방 합성 촉진, 지방 분해 억제 및 케톤체 생성 감소에 영향을 미치므로, 인슐린 관련 케톤증(ketosis) 및 산증(acidosis)의 다양한 증상을 교정하는 데에도 사용된다.

인슐린은 이전에 돼지, 소 및 기타 동물의 췌장으로부터 추출되었지만, 이들 생성물은 인간 인슐린과 구조적으로 다르기 때문에 면역원성이 있다. 인간 인슐린의 생산을 위한 유전자 재조합 기술이 Eli Lilly & Co. USA와 Novo Nordisk Denmark에 의해 1980년대 초중반에 잇따라 개발되었으므로, 인간 인슐린 및 이의 유사체를 유전적으로 발현시키는 것이 당업계에서 주요 수단이 되었다. 그러나 인슐린의 단기 효과로 인해 인간 인슐린을 자주 주사해야 할 필요가 있는 환자에게 이는 매우 불편하다. 따라서, 인간에서 장기 효과를 나타내는 인슐린 유사체 및 유도체를 얻기 위한 노력이 이루어졌다. 그 중에서도, 아실화 기를 갖는 인간 인슐린 또는 이의 유사체의 변형은 이의 반감기를 증가시키는 효과적인 방법이다. 인간 인슐린 유사체는 WO2018024186에 개시되어 있으며, 여기에서 위치 B29는 장쇄 지방산으로 치환되었고, 위치 B30의 아미노산은 결실되었으며, 인간 인슐린 유사체의 구조 및 생물학적 활성이 개시되어 있다. 위치 B29에 연결된 14-아실 측쇄 및 위치 B30에서 아미노산 결실을 갖는 인슐린 유사체 및 이의 제조 방법이 WO9507931에 개시되어 있다. B29 위치가 글루탐산 및 장쇄 지방산으로 치환되고, B30 위치의 아미노산이 결실된 인간 인슐린 유사체가 WO2005012347에 개시되어 있다. 현재, 인간 인슐린 및 이의 유사체를 발현시키기 위하여 가장 일반적으로 사용되는 발현 시스템은 에스케리키아 콜라이(Escherichia coli), 사카로마이세스 세레비지애(Saccharomyces Cerevisiae) 및 피키아 파스토리스(Pichia Pastoris)로, 이 중에서 인간 인슐린 및 이의 유사체는 E. 콜라이에서 봉입체(inclusion body) 형태로 발현되며, 봉입체의 절단 및 복원(renaturation)이 필요하고, 이는 공정을 번거롭게 만들고 수율이 낮다; S. 세레비지애 및 P. 파스토리스는 조작 용이성, 배양 용이성, 외래 단백질의 변형, 및 분비 발현 능력 등으로 인한 장점이 있다. 그러나 사카로마이세스 세레비지애의 분비 효율은 낮고, 발현 균주는 안정적이지 않다. 대조적으로, 피키아 파스토리스는 재조합 단백질의 산업적 생산에서 보다 널리 사용되는 발현 시스템이다. 산업적으로, 생산 공정 중의 발효 수율은 생산 비용을 제어하는 핵심 인자이다. 상업용 인슐린의 큰 수요로 인해, 주요 생산업체인 Novo Nordisk에서는 효모 발현 시스템에서 생산하기 위한 탱크의 규모가 수십 톤에 이르며, 이는 공장과 설비 둘 다에 대한 높은 요구조건을 수반하고 결국 고비용을 초래한다. 따라서, 산업적 생산에서 인간 인슐린 및 이의 유사체의 발효 수율을 증가시키는 것이 매우 중요하다.

유전자 코돈은 메신저 리보핵산(messenger ribonucleic acid, mRNA)의 인접한 3개의 염기로 구성된 트리플렛 코드이다. 유전자 코돈에는 64개의 유형이 있다. 그러나 코돈 사용 빈도는 유기체마다, 심지어 동일한 유기체의 상이한 단백질 암호화 유전자마다 상이하다. 즉, 코돈 선호도가 있다. 외래 유전자의 코돈은 주로 번역 수준에서 유전자 발현에 영향을 미친다. 코돈 최적화가 피키아 파스토리스에서 외래 단백질의 발현을 증가시키는 데 상당한 영향을 미침을 보여주는 문헌이 많다. 외인성 유전자는 세포 내 발현 및 분비 발현의 형태로 피키아 파스토리스에서 발현된다. 후자의 경우, 외인성 유전자에 의해 발현되는 생성물의 분비를 지시하기 위하여 신호 펩티드가 필요하다. 현재, 가장 일반적으로 사용되는 신호 펩티드는 사카로마이세스 세레비지애의 α-인자 신호 펩티드로부터 유래되며, 이의 뉴클레오티드 서열 또한 사카로마이세스 세레비지애로부터 유래된다. 피키아 파스토리스에 대해 최적화된 α-인자 신호 펩티드 뉴클레오티드 서열은 현재까지 보고되지 않았다. 인슐린 전구체의 코돈 최적화, 예를 들어, Gurramkonda 등(Gurramkonda et al. Application of simple fed-batch technique to high-level secretory production of insulin precursor using Pichia pastoris with subsequent purification and conversion to human insulin. Microbial Cell Factories, 2010, 9:31)에 의한 피키아 파스토리스에서의 최적화된 인간 인슐린 전구체 유전자 서열 및 이의 발현에 대한 여러 관련 문헌이 있으며, 특허 공보 WO1998028429는 인간 인슐린 유사체 전구체를 발현하는 유전자 서열을 개시하고 있으며, 이 유전자에 의해 암호화된 인슐린 전구체 아미노산 서열은 EEGEPK-B(1-29)-AAK-A(1-21)이고, 여기에서 EEGEPK는 스페이서 펩티드 또는 리더 펩티드라 지칭되는 인슐린 전구체의 N 말단 연장부로, 효모 프로테아제를 통한 가수분해로부터 인슐린 전구체의 N 말단을 보호할 수 있고, 인슐린 전구체의 발현 효율을 개선할 수 있다; B (1-29)는 B30 트레오닌의 결실을 갖는 인간 인슐린 사슬 B이고, A (1-21)은 인간 인슐린 사슬 A의 아미노산 서열이다; AAK는 사슬 B를 사슬 A에 연결하는 링커 펩티드로, C 펩티드로도 지칭된다.

인간 인슐린 및 이의 유사체 전구체의 수율을 더 증가시키기 위하여, 본 발명자들은 피키아 파스토리스의 코돈 선호도에 따라 인슐린 유사체 전구체 유전자 및 피키아 파스토리스에서의 분비 발현을 위한 α-인자 신호 펩티드 유전자를 최적화하였다. 결과는 인간 인슐린 유사체 전구체의 수율이 (대조군으로서) 선행 기술에서 공지된 인간 인슐린 유사체 전구체 유전자와 비교할 때, 본 발명에 따른 코돈 최적화된 유전자 발현에 의해 거의 2배 증가되었음을 보여준다. 인간 인슐린 및 이의 유사체의 산업적 생산 비용은 후기 단계에서 크게 감소될 것이다.

본 발명의 일부 구현예에서, 다음의 구조를 포함하는 핵산 분자가 제공된다:

5'- (PS)_a - (SP)_b - (LS)_c - GE - (P'S)_d - 3',

여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;

SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 0 또는 1이고;

LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;

GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고

P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이다.

일부 구현예에서, 다음의 구조를 포함하는 핵산 분자가 제공된다:

5'- (PS)_a - (SP)_b - (LS)_c - GE - (P'S)_d - 3',

SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 1이고;

LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 1이고;

GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고

일부 구현예에서, 신호 펩티드를 암호화하는 핵산 분자는 서열번호 1로서 제시된 서열을 포함한다.

일부 구현예에서, 관심 폴리펩티드는 인간 인슐린 유사체 전구체 폴리펩티드이고; 인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자는 서열번호 3으로서 제시된 서열을 포함한다.

일부 구현예에서, 신호 펩티드를 암호화하는 핵산 분자(SP)의 핵산 서열은 서열번호 1로서 제시되며, 이의 아미노산 서열은 서열번호 2로서 제시된다:

ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGA

서열번호 1;

MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKR

서열번호 2.

일부 구현예에서, 관심 폴리펩티드를 암호화하는 핵산 분자(GE)는 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자일 수 있고, 여기에서 인간 인슐린 유사체 전구체는 위치 B30에서 트레오닌의 결실을 갖는 인간 인슐린일 수 있다. 인간 인슐린 유사체 전구체의 핵산 분자 서열은 서열번호 3으로서 제시되고, 이의 아미노산 서열은 서열번호 4로서 제시된다:

TTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA

서열번호 3;

FVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN

서열번호 4.

일부 구현예에서, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자의 위치 88 내지 96(즉, GCTGCTAAG)은 링커 펩티드(C 펩티드로도 지칭됨)를 암호화하는 핵산 분자를 나타내고, 이는 다음을 포함하나 이에 한정되지 않는 서열로 치환될 수 있다: GCCGCTAAG, GCTGCCAAG, GCTGCTAAA, GCCGCCAAG.

일부 구현예에서, 스페이서 펩티드를 암호화하는 핵산 분자(LS)의 서열은 서열번호 5로서 제시된다:

gaagaaggtgaaccaaag

서열번호 5.

일부 구현예에서, PS 및/또는 P'S는 제한 부위를 암호화하는 핵산 분자이다.

바람직하게는, PS는 EcoR I 제한 부위를 암호화하는 핵산 분자이고/분자이거나, P'S는 Not I 제한 부위를 암호화하는 핵산 분자이다.

일부 구현예에서, 인간 인슐린 유사체 전구체를 발현할 수 있는 핵산 분자가 제공되며, 여기에서 핵산 분자는 스페이서 펩티드를 암호화하는 핵산 분자 및 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자를 포함하고, 신호 펩티드를 포함하는 벡터와 재조합 후, 인간 인슐린 유사체 전구체를 발현할 수 있다.

일부 구현예에서, 인간 인슐린 유사체 전구체 핵산 분자에 의해 암호화된 인간 인슐린 유사체 전구체의 아미노산 서열은 다음과 같으며:

EEGEPK-B(1-29)-AAK-A(1-21)

여기에서, "EEGEPK(서열번호 16)"는 스페이서 펩티드 또는 리더 펩티드라 지칭되는 인슐린 전구체의 N-말단 연장부일 수 있고; "B(1-29)"는 위치 B30에 트레오닌의 결실을 갖는 인간 인슐린 사슬 B일 수 있고; "A(1-21)"은 인간 인슐린 사슬 A 아미노산 서열일 수 있고, "AAK"는 사슬 B를 사슬 A에 연결하는 링커 펩티드로, C 펩티드로도 지칭된다.

일부 구현예에서, 인간 인슐린 유사체 전구체 핵산 분자의 서열은 서열번호 6으로서 제시될 수 있고, 이의 아미노산 서열은 서열번호 7로서 제시된다:

GAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA

서열번호 6;

EEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN

서열번호 7.

일부 구현예에서, 인간 인슐린 유사체 전구체를 발현할 수 있는 또 다른 핵산 분자가 제공된다. 이 핵산 분자 서열은 신호 펩티드 서열, 스페이서 펩티드 서열, 및 인간 인슐린 유사체 전구체를 암호화하는 서열을 포함하고, 핵산 분자는 신호 펩티드 서열을 포함하지 않는 벡터와 재조합 후, 인간 인슐린 유사체 전구체를 발현할 수 있다.

일부 구현예에서, 인간 인슐린 유사체 전구체를 발현하는 핵산 분자의 핵산 서열은 서열번호 8로서 제시되고, 암호화된 아미노산 서열은 서열번호 9로서 제시된다:

ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA

서열번호 8;

MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKREEGEPKFVNQHLCGSHLVEALYLVCGERGFFYTPKAAKGIVEQCCTSICSLYQLENYCN

서열번호 9.

일부 구현예에서, 인간 인슐린 유사체 전구체를 발현하는 핵산 분자는 또한 제한 부위(들)를 포함할 수 있고, 바람직하게는 제한 부위(들)는 EcoR I 제한 부위 및/또는 Not I 제한 부위이다.

일부 구현예에서, 진핵 또는 원핵 세포에서 발현될 수 있는 벡터가 제공되며, 이는 분비 발현을 통해 원핵 또는 진핵 세포에서 인간 인슐린 유사체 전구체를 발현할 수 있다.

일부 구현예에서, 숙주 세포가 또한 제공된다. 바람직하게는, 숙주 세포는 분비 발현을 통해 인간 인슐린 유사체 전구체를 발현할 수 있는 효모, 더욱 바람직하게는 피키아이다.

일부 구현예에서, 위에 기술된 바와 같은 핵산 분자, 벡터, 및/또는 숙주 세포를 이용하는 단계를 포함하는, 인간 인슐린 유사체의 제조 방법이 또한 제공된다.

방법은 다음의 단계를 더 포함할 수 있다:

1) 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자에 의해 진핵 세포에서 인간 인슐린 유사체 전구체를 발현시키는 단계;

2) 인간 인슐린 유사체 전구체를 효소적으로 분해시켜 인간 인슐린 유사체를 수득하는 단계, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 6으로서 제시될 수 있고, 인슐린 유사체 전구체는 당업자에게 잘 알려져 있는 방법을 이용하여 효소적으로 분해될 수 있다.

일부 구현예에서, 단계 1)은 신호 펩티드 서열을 포함하는 발현 벡터에 의해 인간 인슐린 유사체 전구체를 발현시키는 단계를 포함하며, 상기 신호 펩티드 서열은 서열번호 1로서 제시된다.

일부 구현예에서, 인간 인슐린 유사체는 B30의 결실을 갖는 인간 인슐린이고, 인간 인슐린 유사체는 아실화된 기로 더 치환된다.

일부 구현예에서, B30의 결실을 갖는 상기 인간 인슐린 내에서, 위치 B29의 리신은 아실화된 기로 치환된다.

바람직하게는, 위의 치환 후에 수득되는 생성물은 리신 B29 (N^ε-(N^α-헥사데칸 지방 이산-L-리신-N^ε-옥소부틸일)) 데스(B30) 인간 인슐린이다.

약어 및 용어

"코돈 최적화"는 숙주 세포에 대한 코돈 선호도의 규칙에 따라 낮은 빈도 또는 희귀한 코돈 대신 선호되는 코돈을 갖는 유전자의 합성을 지칭한다.

"대조군 1"은 아래에 서열번호 10으로서 제시되며, 여기에서 "EEGEPK"를 암호화하는 핵산 분자(GAAGAAGGTGAACCAAAG, 이중 밑줄 친 부분)가 WO1998028429에 의해 교시된 인슐린 전구체 유전자를 암호화하는 핵산 분자에 연결된다:

GAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA

서열번호 10.

"대조군 2"는 아래에 서열번호 11로서 제시되며, 여기에서 "EEGEPK"를 암호화하는 핵산 분자(이중 밑줄 친 부분)가 Gurramkonda 등(Microbial Cell Factories, 2010, 9:31)에 의해 교시된 최적화된 인슐린 전구체 유전자를 암호화하는 핵산 분자에 연결된다:

GAAGAAGGTGAACCAAAGTTTGTTAACCAACATTTGTGTGGTTCTCATTTGGTTGAAGCTTTGTACTTGGTTTGTGGTGAAAGAGGTTTCTTCTACACTCCAAAGGCTGCTAAGGGTATTGTTGAACAATGTTGTACTTCTATTTGTTCTTTGTACCAATTGGAAAACTACTGTAACTAA

서열번호 11.

"IP-S"는 코돈 최적화 후 인슐린 전구체 유전자에 상응하는 핵산 분자이다.

"α-인자"는 사카로마이세스 세레비지애로부터 유래된, Invitrogen사가 제공한 pPIC9K 발현 벡터에 포함된 α-인자 신호 펩티드 유전자에 상응하는 핵산 분자이다.

"α-인자-S"는 코돈 최적화된 α-인자 신호 펩티드 유전자에 상응하는 핵산 분자이다.

"벡터"는 플라스미드 및 바이러스 벡터를 포함하나 이에 한정되지 않는, 핵산 분자가 연결되는 또 다른 핵산 분자를 운반할 수 있는 핵산 분자를 포함한다. 일부 벡터는 이들이 도입되는 숙주 세포에서 자율적으로 복제될 수 있으나, 다른 벡터는 숙주 세포로 도입될 때 숙주 세포의 게놈에 통합되어 숙주 게놈과 함께 복제될 수 있다. 또한, 일부 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있으며, 이러한 벡터는 본원에서 "재조합 발현 벡터"(또는 간단히 "발현 벡터")로 지칭된다. 전통적인 벡터는 당해 분야에 잘 알려져 있다.

"관심 폴리펩티드"는 효소, 항체, 인터페론, 인슐린, 인터루킨 등을 포함하나 이에 한정되지 않는, 효모에서 발현될 수 있는 폴리펩티드 및 이의 변이체, 전구체, 중간체이다. 예를 들어, 관심 폴리펩티드는 인슐린 전구체일 수 있다.

"세포" 및 "숙주 세포"는 상호교환적으로 사용될 수 있다.

"폴리뉴클레오티드 분자", "핵산 분자"는 상호교환적으로 사용될 수 있고, 이의 서열은 DNA 서열일 수 있다.

다음의 실시예는 발명을 더 설명하기 위하여 제공되는 것으로, 발명의 범위를 제한하려는 것은 아니다.

본 발명의 실시예에 사용되는 벡터, 숙주 박테리아 및 배양 배지는 Invitrogen으로부터 구입하였다. 피키아 파스토리스 발현 벡터인 pPIC9K는 메탄올에 의해 유도될 수 있는 알코올 산화효소 AOX1 프로모터를 함유하고, 또한 α-인자 신호 펩티드 서열을 함유하며, 분비 발현을 통해 외래 단백질을 발현할 수 있다. 또 다른 피키아 파스토리스 발현 벡터인 pPIC3.5K는 메탄올에 의해 유도될 수 있는 알코올 산화효소 AOX1 프로모터를 함유하나, α-인자 신호 펩티드 서열은 함유하지 않는다. 피키아 파스토리스 GS115 균주를 숙주 박테리아로 사용하였다. 배양 배지의 구성 성분(formulation)은 피키아 파스토리스 매뉴얼에 의해 제공되었다.

실시예 1 인슐린 전구체를 위한 재조합 발현 벡터의 구축

EcoR I 및 Not I 제한 부위를 대조군 1(서열번호 10), 대조군 2(서열번호 11) 및 IP-S(서열번호 6)의 5' 말단과 3' 말단에 각각 부가하고, Nanjing Kingsray Biotech Co., Ltd.가 합성하였다. 합성된 핵산 분자 서열을 T 벡터에 연결하였다.

서열번호 6;

서열번호 10;

서열번호 11.

인슐린 전구체 핵산 분자를 갖는 T 벡터 및 발현 벡터 pPIC9K를 EcoR I 및 Not I으로 분해한 다음, 표적 단편 및 벡터 단편을 겔 회수 키트로 개별적으로 회수하였다. 분해된 단편의 정제 후, 표적 단편을 T4 리가아제로 벡터 pPIC9K에 연결시켰다.

위에 언급된 연결 용액으로 E. 콜라이 TOP10 컴피턴트 세포를 형질전환시키고, 암피실린 저항성을 구비한 플레이트에 도말하였다. 배양 후, 박테리아 콜로니를 떼어내어, 플라스미드를 추출하고, 두 제한효소를 이용한 분해에 의해 검증하였다. 대조군 1, 대조군 2 및 IP-S 서열을 각각 포함하는 3개의 재조합 발현 벡터를 최종적으로 수득하였다.

실시예 2 피키아 파스토리스 재조합 균주에 의한 인슐린 전구체의 발현

실시예 1에서 구축된 3개의 재조합 발현 벡터로 각각 피키아 파스토리스 GS115를 형질전환시키고, 대조군 1 및 대조군 2를 발현하는 재조합 균주를 대조 균주로 사용하였고, IP-S를 발현하는 재조합 균주를 시험 균주로 사용하였다.

3개의 재조합 박테리아로부터의 콜로니를 5 mL의 YPD 배지에 접종하고, OD₆₀₀의 값이 약 10에 도달할 때까지(16 내지 18시간) 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였다. 세포를 수집하고 50 mL의 BMGY 배지에 재현탁시키고, OD₆₀₀의 값이 약 30에 도달할 때까지 250 rpm에서 진탕하면서 30℃의 항온에서 밤새 배양하였다. 1500 rpm에서 5분 동안 원심분리하여 세포를 수집하고, 25 mL의 BMMY 배지에 재현탁시켰다. 1/200 부피의 메탄올(최종 농도 0.5%)을 배지에 첨가하고, 96시간 동안 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였고, 24시간마다 1/200 부피의 메탄올을 보충하였다. 발현이 완료되면, 10,000 rpm에서 원심분리 후 상청액을 수득하였다. 상청액에 포함된 인슐린 전구체의 수율을 HPLC로 측정하고, 대조 균주에 의해 발현된 인슐린 전구체의 발현량에 대한 백분율로 변환하였다. 인슐린 전구체의 발현 수준의 백분율을 표 1에 나타내었다.

박테리아 균주	벡터	신호 펩티드	발현 유전자	수율(%)
대조 박테리아	pPIC9K	α-인자	대조군 1	100
대조 박테리아	pPIC9K	α-인자	대조군 2	125
시험 박테리아	pPIC9K	α-인자	IP-S	225

표 1의 데이터는 최적화된 인슐린 전구체 유전자에 의해 발현된 인슐린 전구체의 양이 2개의 대조군과 비교하여 1.8 내지 2.25배 증가되었음을 보여준다. 최적화된 인슐린 전구체 유전자는 우수한 발현 효율을 가지며, 발현된 인슐린 전구체의 수율을 현저히 개선할 수 있음을 알 수 있다.

실시예 3 상이한 α-인자에 융합된 인슐린 전구체 유전자를 포함하는 재조합 발현 벡터의 구축

α-인자(서열번호 12) 및 α-인자-S(서열번호 1)가 IP-S의 상류의 부위에 개별적으로 융합된 서열번호 13 및 서열번호 8로 제시된 핵산 분자를 합성하였다. EcoR I 및 Not I 제한 부위를 또한 합성된 핵산 분자의 5' 및 3' 말단 둘 다에 포함시켰다. 합성된 핵산 분자를 T 벡터에 연결하였다.

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGA

서열번호 12

서열번호 1

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTCAACCAGCACTTGTGTGGTTCCCATTTGGTTGAGGCTCTGTACTTGGTCTGTGGAGAAAGAGGTTTCTTTTACACCCCAAAGGCTGCTAAGGGTATCGTTGAGCAATGTTGCACCTCTATTTGTTCCCTGTATCAGTTGGAAAACTACTGCAACTAA

서열번호 13

서열번호 8

α-인자(서열번호 12) 및 α-인자-S(서열번호 1)가 대조군 1의 상류의 부위에 개별적으로 융합된 서열번호 14 및 서열번호 15로서 제시된 핵산 분자를 합성하였다. EcoR I 및 Not I 제한 부위를 또한 합성된 핵산 분자의 5' 및 3' 말단 둘 다에 포함시켰다. 합성된 핵산 분자를 T 벡터에 연결하였다.

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTCAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA

서열번호 14

ATGAGATTTCCTTCTATTTTCACTGCTGTTTTGTTTGCCGCTTCCTCTGCTTTGGCAGCTCCAGTTAATACAACCACTGAAGATGAGACTGCTCAAATCCCAGCCGAAGCAGTTATTGGTTACTCCGACTTGGAAGGAGATTTTGACGTCGCTGTTTTACCATTCTCTAATTCCACTAATAACGGTCTGTTGTTTATTAATACTACCATTGCTTCTATCGCCGCTAAGGAGGAAGGTGTGTCCCTCGAGAAAAGAGAAGAAGGTGAACCAAAGTTCGTTAACCAACACTTGTGCGGTTCCCACTTGGTTGAAGCTTTGTACTTGGTTTGCGGTGAAAGAGGTTTCTTCTACACTCCTAAGGCTGCTAAGGGTATTGTCGAACAATGCTGTACCTCCATCTGCTCCTTGTACCAATTGGAAAACTACTGCAACTAA

서열번호 15.

위의 T 벡터 및 발현 벡터 pPIC3.5K를 엔도뉴클레아제 EcoR I 및 Not I으로 분해시킨 다음, 표적 단편 및 벡터 단편을 겔 회수 키트로 개별적으로 회수하였다. 소화된 단편의 정제 후, 표적 단편을 T4 리가아제로 벡터 pPIC3.5K에 연결시켰다.

위에 언급된 연결 용액으로 E. 콜라이 TOP10 컴피턴트 세포를 형질전환시키고, 암피실린 저항성을 구비한 플레이트에 도말하였다. 배양 후, 박테리아 콜로니를 떼어내어, 플라스미드를 추출하고, 두 제한효소를 이용한 분해에 의해 검증하였다. 상이한 뉴클레오티드 서열을 갖는 인슐린 전구체 유전자를 발현시키기 위하여 α-인자 또는 α-인자-S 신호 펩티드를 개별적으로 포함하는 네 개의 재조합 발현 벡터를 최종적으로 수득하였다.

실시예 4 최적화 전과 후, 피키아 파스토리스 재조합 균주에 의한 인슐린 전구체의 발현

실시예 3에서 구축된 재조합 발현 벡터로 피키아 파스토리스 GS115를 개별적으로 형질전환시켰다.

재조합 박테리아 콜로니를 5 mL의 YPD 배지에 접종하고, OD₆₀₀의 값이 약 10에 도달할 때까지(16 내지 18시간) 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였다. 세포를 수집하고 50 mL의 BMGY 배지에 재현탁시키고, OD₆₀₀의 값이 약 30에 도달할 때까지 250 rpm에서 진탕하면서 30℃의 항온에서 밤새 배양하였다. 1500 rpm에서 5분 동안 원심분리하여 세포를 수집하고, 25 mL의 BMMY 배지에 재현탁시켰다. 1/200 부피의 메탄올(최종 농도 0.5%)을 배지에 첨가하고, 96시간 동안 250 rpm에서 진탕하면서 30℃의 항온에서 배양하였고, 24시간마다 1/200 부피의 메탄올을 보충하였다. 발현이 완료되면, 10,000 rpm에서 원심분리 후 상청액을 수득하였다. 상청액에 포함된 인슐린 전구체의 수율을 HPLC에 의해 측정하였다.

α-인자에 융합된 대조군 1 유전자를 발현하는 재조합 박테리아를 대조 박테리아로 사용하였다. 다른 균주에 의한 인슐린 전구체의 수율을 표 2에 나타낸 바와 같이, 대조 균주에 의해 발현된 인슐린 전구체의 수율에 대한 백분율로 변환하였다.

박테리아 균주	벡터	신호 펩티드	발현 유전자	수율(%)
대조 박테리아	pPIC3.5K	α-인자	대조군 1	100
시험 박테리아	pPIC3.5K	α-인자-S	대조군 1	150
시험 박테리아	pPIC3.5K	α-인자	IP-S	225
시험 박테리아	pPIC3.5K	α-인자-S	IP-S	275

표 2의 데이터는, 단지 핵산 분자의 신호 펩티드를 최적화한 후에는 인슐린 전구체의 수율이 1.5배 증가되었으며, 단지 인슐린 전구체 유전자를 최적화한 후에는 이러한 수율이 2.25배 증가되었음을 보여준다. 대조적으로, 신호 펩티드와 인슐린 전구체 유전자 둘 다를 최적화한 후에는 인슐린 전구체의 수율은 2.75배 증가되었다. 종합하면, 코돈 최적화는 인슐린 전구체의 발현 수준을 1.5 내지 2.75배까지 증가시킬 수 있다.

<110> JIANGSU HENGRUI MEDICINE CO.,LTD <120> CODON OPTIMIZED PRECURSOR GENE AND SIGNAL PEPTIDE GENE OF HUMAN INSULIN ANALOGUE <130> P20-065-INP-GC <150> CN 201810131794.3 <151> 2018-02-09 <160> 16 <170> KoPatentIn 3.0 <210> 1 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding signal peptide <220> <221> gene <222> (1)..(255) <400> 1 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaaga 255 <210> 2 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> signal peptide <220> <221> PEPTIDE <222> (1)..(85) <400> 2 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg 85 <210> 3 <211> 162 <212> DNA <213> Homo sapiens <220> <221> gene <222> (1)..(162) <223> nucleic acid molecule encoding human insulin analogue precursor <400> 3 ttcgtcaacc agcacttgtg tggttcccat ttggttgagg ctctgtactt ggtctgtgga 60 gaaagaggtt tcttttacac cccaaaggct gctaagggta tcgttgagca atgttgcacc 120 tctatttgtt ccctgtatca gttggaaaac tactgcaact aa 162 <210> 4 <211> 53 <212> PRT <213> Homo sapiens <220> <221> PEPTIDE <222> (1)..(53) <223> human insulin analogue precursor <400> 4 Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys 20 25 30 Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu 35 40 45 Glu Asn Tyr Cys Asn 50 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding spacer peptide <220> <221> gene <222> (1)..(18) <400> 5 gaagaaggtg aaccaaag 18 <210> 6 <211> 180 <212> DNA <213> Homo sapiens <400> 6 gaagaaggtg aaccaaagtt cgtcaaccag cacttgtgtg gttcccattt ggttgaggct 60 ctgtacttgg tctgtggaga aagaggtttc ttttacaccc caaaggctgc taagggtatc 120 gttgagcaat gttgcacctc tatttgttcc ctgtatcagt tggaaaacta ctgcaactaa 180 180 <210> 7 <211> 59 <212> PRT <213> Homo sapiens <400> 7 Glu Glu Gly Glu Pro Lys Phe Val Asn Gln His Leu Cys Gly Ser His 1 5 10 15 Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr 20 25 30 Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile 35 40 45 Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 50 55 <210> 8 <211> 435 <212> DNA <213> Homo sapiens <400> 8 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaagagaaga aggtgaacca aagttcgtca accagcactt gtgtggttcc 300 catttggttg aggctctgta cttggtctgt ggagaaagag gtttctttta caccccaaag 360 gctgctaagg gtatcgttga gcaatgttgc acctctattt gttccctgta tcagttggaa 420 aactactgca actaa 435 <210> 9 <211> 144 <212> PRT <213> Homo sapiens <400> 9 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Glu Gly Glu Pro Lys Phe Val Asn Gln His 85 90 95 Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu 100 105 110 Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln 115 120 125 Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 130 135 140 <210> 10 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding spacer peptide <220> <221> misc_feature <222> (1)..(18) <400> 10 gaagaaggtg aaccaaagtt cgttaaccaa cacttgtgcg gttcccactt ggttgaagct 60 ttgtacttgg tttgcggtga aagaggtttc ttctacactc ctaaggctgc taagggtatt 120 gtcgaacaat gctgtacctc catctgctcc ttgtaccaat tggaaaacta ctgcaactaa 180 180 <210> 11 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding spacer peptide <220> <221> misc_feature <222> (1)..(18) <400> 11 gaagaaggtg aaccaaagtt tgttaaccaa catttgtgtg gttctcattt ggttgaagct 60 ttgtacttgg tttgtggtga aagaggtttc ttctacactc caaaggctgc taagggtatt 120 gttgaacaat gttgtacttc tatttgttct ttgtaccaat tggaaaacta ctgtaactaa 180 180 <210> 12 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid molecule encoding a-factor <220> <221> gene <222> (1)..(255) <400> 12 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaaga 255 <210> 13 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 13 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaaga aggtgaacca aagttcgtca accagcactt gtgtggttcc 300 catttggttg aggctctgta cttggtctgt ggagaaagag gtttctttta caccccaaag 360 gctgctaagg gtatcgttga gcaatgttgc acctctattt gttccctgta tcagttggaa 420 aactactgca actaa 435 <210> 14 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 14 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaaga aggtgaacca aagttcgtta accaacactt gtgcggttcc 300 cacttggttg aagctttgta cttggtttgc ggtgaaagag gtttcttcta cactcctaag 360 gctgctaagg gtattgtcga acaatgctgt acctccatct gctccttgta ccaattggaa 420 aactactgca actaa 435 <210> 15 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding a-factor + nucleic acid encoding insulin analogue precursor <220> <221> gene <222> (1)..(435) <400> 15 atgagatttc cttctatttt cactgctgtt ttgtttgccg cttcctctgc tttggcagct 60 ccagttaata caaccactga agatgagact gctcaaatcc cagccgaagc agttattggt 120 tactccgact tggaaggaga ttttgacgtc gctgttttac cattctctaa ttccactaat 180 aacggtctgt tgtttattaa tactaccatt gcttctatcg ccgctaagga ggaaggtgtg 240 tccctcgaga aaagagaaga aggtgaacca aagttcgtta accaacactt gtgcggttcc 300 cacttggttg aagctttgta cttggtttgc ggtgaaagag gtttcttcta cactcctaag 360 gctgctaagg gtattgtcga acaatgctgt acctccatct gctccttgta ccaattggaa 420 aactactgca actaa 435 <210> 16 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> spacer peptide <220> <221> PEPTIDE <222> (1)..(6) <400> 16 Glu Glu Gly Glu Pro Lys 1 5

Claims

다음의 일반 식을 갖는 분자 또는 구조를 포함하는 핵산 분자:
5'- (PS)_a - (SP)_b - (LS)_c - GE - (P'S)_d - 3',
여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 0 또는 1이고;
LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;
GE는 관심 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이고; 그리고
신호 펩티드를 암호화하는 핵산 분자는 서열번호 1로서 제시된 서열을 포함함.
다음의 일반 식을 갖는 분자 또는 구조를 포함하는 핵산 분자:
5'- (PS)_a - (SP)_b - (LS)_c - GE - (P'S)_d - 3',
여기에서, PS는 프로세싱 부위를 암호화하는 핵산 분자로서, a는 0 또는 1이고;
SP는 신호 펩티드를 암호화하는 핵산 분자로서, b는 1이고;
LS는 스페이서 펩티드를 암호화하는 핵산 분자로서, c는 0 또는 1이고;
GE는 인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자이고; 그리고
P'S는 프로세싱 부위를 암호화하는 핵산 분자로서, d는 0 또는 1이고; 그리고
인간 인슐린 유사체 전구체 폴리펩티드를 암호화하는 핵산 분자는 서열번호 3으로서 제시된 서열을 포함함.
제1항에 있어서,
관심 폴리펩티드는 인간 인슐린 유사체 전구체이고, 인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 4로서 제시된 아미노산 서열을 암호화하는 핵산 분자를 포함하고, 바람직하게는 서열번호 3으로서 제시된 핵산 서열을 포함하는 것인, 핵산 분자.
제2항에 있어서,
신호 펩티드를 암호화하는 핵산 분자는 서열번호 2로서 제시된 아미노산 서열을 암호화하는 핵산 분자를 포함하고, 바람직하게는 서열번호 1 또는 서열번호 12로서 제시된 핵산 서열을 포함하는 것인, 핵산 분자.
제2항 내지 제4항 중 어느 한 항에 있어서,
인간 인슐린 유사체 전구체를 암호화하는 핵산 분자는 서열번호 3의 위치 88 내지 96에서의 치환을 포함하고, 바람직하게는 GCCGCTAAG, GCTGCCAAG, GCTGCTAAA 또는 GCCGCCAAG로 치환되는 것인, 핵산 분자.
제1항 내지 제5항 중 어느 한 항에 있어서,
스페이서 펩티드의 아미노산 서열은 EEGEPK(Glu-Glu-Gly-Glu-Pro-Lys)를 포함하고, 바람직하게는 스페이서 펩티드를 암호화하는 핵산 분자는 서열번호 5로서 제시된 서열을 포함하는 것인, 핵산 분자.
제1항 내지 제6항 중 어느 한 항에 있어서,
서열번호 1, 서열번호 3, 서열번호 6, 서열번호 8, 서열번호 13 및 서열번호 15로 이루어진 군으로부터 선택되는 어느 하나를 포함하거나, 또는 서열번호 1, 서열번호 3, 서열번호 6, 서열번호 8, 서열번호 13 및 서열번호 15로 이루어진 군으로부터 선택되는 어느 하나로 이루어지는, 핵산 분자.
제1항 내지 제7항 중 어느 한 항에 있어서,
프로세싱 부위는 제한 부위이고, 바람직하게는, PS는 EcoR I 제한 부위를 암호화하는 핵산 분자이고/분자이거나, P'S는 Not I 제한 부위를 암호화하는 핵산 분자인 것인, 핵산 분자.
제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터로서,
바람직하게는 벡터는 진핵세포 발현 벡터 또는 원핵세포 발현 벡터인, 벡터.
제1항 내지 제8항 중 어느 한 항의 핵산 분자 및/또는 제9항의 벡터를 포함하는 숙주 세포로서,
바람직하게는 숙주 세포는 효모; 더욱 바람직하게는, 피키아 파스토리스(Pichia Pastoris)인, 숙주 세포.
제1항 내지 제8항 중 어느 한 항의 핵산 분자, 제9항의 벡터, 및/또는 제10항의 숙주 세포의 사용을 포함하는, 인간 인슐린 유사체의 생산 방법.
제11항에 있어서,
1) 인간 인슐린 유사체 전구체를 발현시키는 단계; 및
2) 단계 1)에서 수득된 인간 인슐린 유사체 전구체를 효소적으로 분해시켜 인간 인슐린 유사체를 수득하는 단계를 더 포함하는, 방법.
제11항 또는 제12항에 있어서,
인간 인슐린 유사체는 B30의 결실을 갖는 인간 인슐린이고/이거나, 인간 인슐린 유사체는 아실화된 기로 더 치환되고; 바람직하게는, 위치 B29의 리신이 아실화된 기로 치환되고; 더욱 바람직하게는, 치환 후의 생성물이 리신 B29 (N^ε-(N^α-헥사데칸 지방 이산-L-리신-N^ε-옥소부틸일)) 데스(B30) 인간 인슐린인 것인, 방법.