KR20230165291A

KR20230165291A - 폴리펩티드의 발현 증가를 위한 구축물 및 방법

Info

Publication number: KR20230165291A
Application number: KR1020237037447A
Authority: KR
Inventors: 파반 레디 레가티; 라메시 벤캣 마투르; 나렌더 데브 만테나; 마히마 다트라
Original assignee: 바이오로지칼 이 리미티드
Priority date: 2021-03-31
Filing date: 2022-03-31
Publication date: 2023-12-05
Also published as: JP2024513203A; AU2022247419A1; WO2022208554A2; CA3213580A1; CN117916254A; AU2022247419A9; BR112023019824A2; WO2022208554A3; EP4314034A2

Abstract

본 발명은 단백질 발현 분야에 관한 것이다. 이는 재조합 단백질의 발현 증가를 위한 발현 구축물 및 방법을 제공한다. 보다 구체적으로, 이는 재조합 숙주 세포에서 리라 펩티드의 발현 향상을 위한 구축물 및 방법을 제공한다.

Description

폴리펩티드의 발현 증가를 위한 구축물 및 방법

관련 출원에 대한 상호 참조

본 출원은 2021년 3월 31일에 출원된 인도 가특허출원 번호 202141014741에 대한 우선권의 이익을 주장하며, 이의 전체 내용은 참조로 본원에 포함된다.

발명의 분야

본 발명은 단백질 발현 분야에 관한 것이다. 보다 구체적으로, 이는 재조합 폴리펩티드 및 단백질의 발현 증가를 위한 구축물 및 방법에 관한 것이다.

펩티드 치료제는 1920년대 인슐린 요법이 등장한 이후 의료 업무에서 주목할만한 역할을 해왔다. 현재, 시장에는 60개 초과의 승인된 펩티드 약물이 있으며, 그 수는 크게 늘어날 것으로 예상된다.

상업적으로 유용한 단백질 및 펩티드는 합성적으로 생성되거나 천연 공급원으로부터 단리될 수 있다. 그러나, 이러한 방법은 종종 비용이 많이 들고 시간이 많이 걸리며 생성 능력이 제한되는 특징이 있다. 단백질 및 펩티드 생성의 바람직한 방법은 관심 단백질 또는 펩티드를 과발현하도록 조작된 재조합적으로 구축된 유기체의 발효를 통하는 것이다.

그러나, 펩티드의 재조합 발현은 비용 효과적인 생성 수단이 되기 위해서는 극복해야 할 많은 장애물을 가지고 있다. 장애물은 일반적으로 재조합 단백질의 낮은 발현 수준 또는 세포 내에 함유된 단백질분해 효소에 의한 발현된 폴리펩티드의 파괴와 관련된다.

짧은 펩티드는 숙주 세포 프로테아제에 의해 세포 환경에서 분해되기 쉽기 때문에 재조합적으로 생성하기가 어렵다. 따라서, 단리된 생성물은 상이한 아미노산 쇄 길이를 갖는 원하는 폴리펩티드 종의 비균질 혼합물일 수 있다.

또한, 정제가 어려울 수 있어 관심 단백질 또는 펩티드의 특성에 따라 수율이 저조하다. 상기 문제점을 극복하기 위해 소형 펩티드를 대형 융합 태그에 융합시켜 발현하고 있다. 또한, 현재 방법은 융합 단백질을 발현하기 위해 대형 융합 태그를 사용하며 이는 관심 펩티드의 잠재적인 수율을 감소시킨다. 이는 관심 단백질 또는 펩티드의 크기가 작은 상황에서는 문제가 된다.

이러한 상황에서는 관심 펩티드의 수율을 최대화하기 위해 소형 크기의 융합 태그를 사용하는 것이 유리하다. 그러나, 소형 태그가 대형 태그만큼 제대로 작동하는 경우는 거의 없다.

이러한 문제는 과거에 캐리어 폴리펩티드에 융합된 원하는 폴리펩티드를 함유하는 융합 단백질을 생성함으로써 해결되었다. 세포에서 융합 단백질로서 원하는 폴리펩티드의 발현은 종종 파괴적인 효소로부터 원하는 폴리펩티드를 보호하고 융합 단백질이 높은 수율로 정제되도록 할 것이다. 이어서, 융합 단백질을 캐리어 폴리펩티드로부터 원하는 폴리펩티드를 절단하도록 처리하고 원하는 폴리펩티드를 단리한다.

미국 특허 번호 7572884에는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)에서 리라글루티드의 전구체인 재조합 리라 펩티드(Lira-peptide)를 제조하는 방법이 개시되어 있다.

미국 특허 번호 7662913에는 불용성 융합 펩티드를 생성하는 데 사용되는 시스타틴 기반 펩티드 태그의 사용이 개시되어 있다.

미국 특허 번호 8796431에는 봉입체 파트너로서 케토-스테로이드 이소머라제(KSI)를 사용하여 GLP1을 포함하는 펩티드를 효율적으로 생성하는 방법 및 공정이 개시되어 있다.

WO 2003/100021 A1에는 프로모터, 번역 개시 서열, 봉입체 융합 파트너 및 이종 단백질에 작동적으로 연결된 절단 가능한 링커를 포함하는 이종 펩티드/단백질의 생성을 증가시키기 위한 발현 카세트가 개시되어 있다.

WO 2017/021819 A1에는 유비퀴틴 융합 구축물로서 원핵 세포에서 원하는 단백질 또는 펩티드를 코딩하는 합성 올리고뉴클레오티드의 발현에 의해 펩티드 또는 단백질 또는 이의 유도체를 제조하는 방법이 개시되어 있다.

IN 201741024763 A에는 효모 세포에서 신호 펩티드의 올리고뉴클레오티드 서열에 작동적으로 연결된 리라 펩티드를 코딩하는 합성 올리고뉴클레오티드의 발현에 의한 리라글루티드의 제조 방법이 개시되어 있다.

문헌(Yang Liu et al., Biotechnol Lett 36, 1675-1680 (2014))은 이. 콜리(E. coli)의 융합 접합부에서 엔테로키나제 절단 부위와 함께 23 kDa의 글루타티온 S-트랜스퍼라제(GST) 융합 태그를 사용하는 기능성 GLP-1 펩티드의 발현 및 정제 전략을 설명한다.

문헌(Zhao et al., Microb Cell Fact 15, 136 (2016))은 에쉐리키아 콜리(Escherichia coli)에서 GLP1을 포함한 중대형 크기의 펩티드의 절단 가능한 자가 응집 태그의 재조합 발현 및 인테인 매개된 절단을 연구한다.

문헌(Zhao et al., Microb Cell Fact 18, 91 (2019))은 재조합 효소 생성을 증강시키기 위해 발현 태그로서 자가 조립 양친매성 펩티드(SAP)의 사용을 연구한다.

문헌(Ki et al., Appl Microbiol Biotechnol. 2020 Mar;104(6):2411-2425)은 이. 콜리에서 이종 단백질의 발현을 증가시키는 융합 태그에 대한 자세한 검토를 제공한다.

글루카곤 유사 펩티드-1(GLP-1)은 프로글루카곤 펩티드의 조직 특이적 번역 후 처리로부터 유래된 31개 아미노산 길이의 펩티드 호르몬이다. 이는 음식 섭취 시 장의 장내분비 L 세포 및 뇌간의 고립로의 핵 내 특정 뉴런에 의해 생성되고 분비된다. 리라글루티드는 인슐린 분비를 자극하는 내인성 대사 호르몬 GLP-1과 동일한 수용체에 결합하는 장기간 작용하는 글루카곤 유사 펩티드-1 수용체 효능제로 사용되는 인간 인크레틴(대사 호르몬), 글루카곤 유사 펩티드-1(GLP-1)의 유도체이다. 따라서, 숙주에서 재조합 단백질의 발현을 증가시키기 위한 새로운 발현 전략이 필요하다. 본 발명의 발명자들은 재조합 치료 펩티드의 발현을 몇 배로 증강시키려는 노력의 일환으로 재조합 단백질의 고수율 생성을 가능하게 하는 발현 구축물을 제공하였다.

발명의 목적

본 발명의 주요 목적은 관심 단백질을 높은 수율로 생성하기 위한 발현 카세트를 제공하는 것이다.

본 발명의 또 다른 목적은 관심 단백질의 발현을 증가시키는 방법을 제공하는 것이다.

발명의 요약

본 발명은 리라 펩티드와 같은 생물학적 활성 펩티드의 발현 증가 및 효율적 생성을 위한 발현 구축물, 벡터 및 재조합 숙주 세포를 제공한다.

일 실시양태에서, 본 발명은

a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;

b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;

c) 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및

d) 관심 단백질을 코딩하는 폴리뉴클레오티드

를 포함하는 관심 단백질의 발현을 위한 발현 카세트를 제공하며,

발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된다.

특정 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된

a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;

b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및

c) 절단 가능한 펩티드 링커

를 포함하는 융합 폴리펩티드를 제공한다.

본 발명은

c) 절단 가능한 링커를 코딩하는 폴리뉴클레오티드; 및

d) 서열번호 12에 제시된 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드

를 포함하는 리라 펩티드의 발현을 위한 발현 카세트를 제공하며,

일 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 서열번호 12의 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체의 아미노 말단에 융합된

c) 절단 가능한 링커 펩티드

를 포함하는 융합 폴리펩티드를 제공한다.

본 발명의 일 실시양태에서, 관심 단백질의 발현 수준은 적어도 85% 증가된다.

도 1a: N-말단 발현 태그 융합이 없는 발현 카세트의 개략도
도 1b: T7 리더와 함께 N-말단 발현 태그(LP2 내지 LP10)를 갖는 발현 카세트의 개략도.
도 1c: T7 리더 없이 N-말단 발현 태그(LP2)를 갖는 발현 카세트의 개략도.
도 1d: T7 리더 없이 N-말단 발현 태그(LP8)를 갖는 발현 카세트의 개략도.
도 2a: 발현 벡터 LP1의 개략도(어떠한 N-말단 발현 태그도 없음)
도 2b: T7 리더 및 N-말단 발현 태그(LP-2)를 갖는 발현 벡터의 개략도.
도 2c: T7 리더는 없고 N-말단 발현 태그(LP-2)는 갖는 발현 벡터의 개략도.
도 2d: T7 리더 및 N-말단 발현 태그(LP-8)를 갖는 발현 벡터의 개략도.
도 2e: T7 리더는 없고 N-말단 발현 태그(LP-8)는 갖는 발현 벡터의 개략도.
도 3a: 리라 펩티드의 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
도 3b: 표는 각각의 카세트의 분자량 및 밀도계측 분석에 기초한 레인당 태그부착된 리라 펩티드의 백분율을 나타낸다.
도 4a: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 4b: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 4c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP2)의 발현 증가 백분율.
도 5a: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 5b: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 5c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP8)의 발현 증가 백분율.
도 6a: Ni-NTA 크로마토그래피를 이용한 N-말단 융합을 함유하는 리라 펩티드의 정제.
도 6b: 역상 크로마토그래피를 이용한 리라 펩티드의 정제.
도 7: 가용성 및 불용성 분획의 리라 펩티드 발현.
도 8: 테리파라티드 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
서열 목록 설명
서열번호 1 (T7 리더 서열)

서열번호 2 (발현 태그 LP-2의 아미노산)

서열번호 3 (발현 태그 LP-3의 아미노산 서열)

서열번호 4 (발현 태그 LP-4의 아미노산 서열)

서열번호 5 (발현 태그 LP-5의 아미노산 서열)

서열번호 6 (발현 태그 LP-6의 아미노산 서열)

서열번호 7 (발현 태그 LP-7의 아미노산 서열)

서열번호 8 (발현 태그 LP-8의 아미노산 서열)

서열번호 9 (발현 태그 LP-9의 아미노산 서열)

서열번호 10 (발현 태그 LP-10의 아미노산 서열)

서열번호 11 (TEV 절단 부위의 아미노산 서열)

서열번호 12 (리라 펩티드의 아미노산 서열)

서열번호 13 (발현 카세트 LP1) T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 14 (발현 카세트 LP2) T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 15 (발현 카세트 LP3) T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 16 (발현 카세트 LP4) T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 17 (발현 카세트 LP5) T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 18 (발현 카세트 LP6) T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 19 (발현 카세트 LP7) T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 20 (발현 카세트 LP8) T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 21 (발현 카세트 LP9) T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 22 (발현 카세트 LP10) T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 23 (발현 카세트 LP11) T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 24 (T7 리더 없는 발현 카세트 LP2) 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 25 (T7 리더 없는 발현 카세트 LP8) 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 26 (서열번호 2를 코딩하는 핵산 서열 - 발현 태그 LP-2)

서열번호 27 (서열번호 3을 코딩하는 핵산 서열 - 발현 태그 LP-3)

서열번호 28 (서열번호 4를 코딩하는 핵산 서열 - 발현 태그 LP-4)

서열번호 29 (서열번호 5를 코딩하는 핵산 서열 - 발현 태그 LP-5)

서열번호 30 (서열번호 6을 코딩하는 핵산 서열 - 발현 태그 LP-6)

서열번호 31 (서열번호 7을 코딩하는 핵산 서열 - 발현 태그 LP-7)

서열번호 32 (서열번호 8을 코딩하는 핵산 서열 - 발현 태그 LP-8)

서열번호 33 (서열번호 9를 코딩하는 핵산 서열 - 발현 태그 LP-9)

서열번호 34 (서열번호 10을 코딩하는 핵산 서열 - 발현 태그 LP-10)

서열번호 35 (서열번호 13을 코딩하는 발현 카세트 - LP1 핵산 서열은 T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 36 (서열번호 14를 코딩하는 발현 카세트 - LP2 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 37 (서열번호 15를 코딩하는 발현 카세트 - LP3 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 38 (서열번호 16을 코딩하는 발현 카세트 - LP4 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 39 (서열번호 17을 코딩하는 발현 카세트 - LP5 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 40 (서열번호 18을 코딩하는 발현 카세트 - LP6 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 41 (서열번호 19를 코딩하는 발현 카세트 - LP7 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 42 (서열번호 20을 코딩하는 발현 카세트 - LP8 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 43 (서열번호 21을 코딩하는 발현 카세트 - LP9 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 44 (서열번호 22를 코딩하는 발현 카세트 - LP10 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 45 (서열번호 23을 코딩하는 발현 카세트 - LP11 핵산 서열은 T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 46 (서열번호 24를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP2는 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 47 (서열번호 25를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP8은 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)

서열번호 48 (리라 펩티드를 코딩하는 코돈 최적화된 핵산 서열)

서열번호 49 (테리파라티드의 아미노산 서열)

서열번호 50 (테리파라티드를 코딩하는 코돈 최적화된 핵산 서열)

정의

다르게 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 방법이 속하는 기술 분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 등가인 임의의 벡터, 숙주 세포, 방법 및 조성물이 또한 벡터, 숙주 세포, 방법 및 조성물의 실시 또는 시험에 사용될 수 있지만, 대표적인 예시가 이제 기술된다.

값의 범위가 제공되는 경우, 그 범위의 상한과 하한 사이의 각각의 개재하는 값 및 그 언급된 범위 내의 임의의 다른 언급된 또는 개재하는 값이 방법 및 조성물에 의해 그 내에 포괄되는 것으로 이해된다. 이러한 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 또한 언급된 범위에서 구체적으로 배제된 임의의 한계에 따라 방법 및 조성물에 의해 그 내에 포괄된다. 언급된 범위에 한계 중 하나 또는 둘 모두가 포함되는 경우, 포함된 한계 중 하나 또는 둘 모두를 제외하는 범위도 방법 및 조성물에 포함된다.

명확성을 위해 별도의 실시양태의 맥락에서 기재된 방법의 특정 특색이 단일 실시양태에서 조합되어 제공될 수도 있다는 것이 이해된다. 반대로, 간략화를 위해 단일 실시양태의 맥락에서 기재된 방법 및 조성물의 다양한 특색이 별도로 또는 임의의 적합한 하위 조합으로 제공될 수도 있다. 본원 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태는 문맥에서 명백하게 달리 나타내지 않는 한 복수의 지시대상을 포함한다는 점에 유의한다. 임의의 선택적인 요소를 배제하기 위해 청구범위가 작성될 수 있다는 점도 추가로 언급된다. 따라서, 이 진술은 청구 요소의 인용 또는 "부정적" 제한의 사용과 관련하여 "유일하게", "오직" 등과 같은 독점적인 용어를 사용하기 위한 선행 근거로 사용하기 위한 것이다.

본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기재되고 예시된 개별 실시양태 각각은 본 방법의 범위 또는 취지를 벗어나지 않으면서 임의의 다른 실시양태의 특색으로부터 쉽게 분리되거나 특색과 조합될 수 있는 별개의 성분 및 특색을 갖는다. 임의의 인용된 방법은 인용된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.

용어 "숙주 세포"는 발현 구축물의 대상에 대한 수용자일 수 있거나 수용자였던 개별 세포 또는 세포 배양물을 포함한다. 숙주 세포는 단일 숙주 세포의 자손을 포함한다. 바람직한 숙주 세포는 온혈 유기체의 하부 장에서 흔히 발견되는 에쉐리키아 속의 그람 음성, 통성 혐기성, 막대 모양의 대장균 박테리아인, 이. 콜리로도 알려진 에쉐리키아 콜리 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 및 바실루스 서브틸리스(Bacillus subtilis)이다.

용어 "재조합 균주" 또는 "재조합 숙주 세포"는 본 발명의 발현 구축물 또는 벡터로 형질감염되거나 형질전환된 숙주 세포를 지칭한다.

용어 "발현"은 코딩 서열에 의해 코딩된 생성물의 생물학적 생성을 지칭한다. 대부분의 경우, 코딩 서열을 포함한 DNA 서열은 전사되어 메신저 RNA(mRNA)를 형성한다. 이어서, 메신저 RNA는 번역되어 관련된 생물학적 활성을 갖는 폴리펩티드 생성물을 형성한다. 또한, 발현 과정은 인트론을 제거하기 위한 스플라이싱 및/또는 폴리펩티드 생성물의 번역 후 처리와 같은 RNA 전사 생성물에 대한 추가 처리 단계를 포함할 수 있다.

용어 "발현 벡터" 또는 "발현 구축물"은 숙주로의 형질전환 후 삽입된 핵산 서열의 발현을 가능하게 하도록 설계된 임의의 벡터, 플라스미드 또는 비히클을 지칭한다.

용어 "카세트" 또는 "발현 카세트"는 특정 제한 부위에서 핵산 또는 폴리뉴클레오티드에 삽입될 수 있는 DNA 세그먼트를 지칭한다. DNA 세그먼트는 관심 단백질을 코딩하는 폴리뉴클레오티드를 포함한다. "카세트" 또는 "발현 카세트"는 또한 숙주 세포에서 관심 단백질을 코딩하는 폴리뉴클레오티드의 증강된 발현을 허용하는 요소를 포함할 수 있다. 이러한 요소는 프로모터, 인핸서, 반응 요소, 터미네이터 서열, 폴리아데닐화 서열 등이 포함할 수 있으나 이에 제한되지 않는다.

용어 "프로모터"는 유전자의 전사가 시작되는 위치를 정의하는 DNA 서열을 지칭한다. 프로모터 서열은 전형적으로 전사 개시 부위의 직접 상류 또는 5' 말단에 위치된다. RNA 폴리머라제 및 필요한 전사 인자는 프로모터 서열에 결합하여 전사를 개시한다. 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 구성적 프로모터는 발현이 일반적으로 환경 및 발달 요인에 의해 조절되지 않기 때문에 관련된 유전자의 지속적인 전사를 허용하는 프로모터이다. 구성적 프로모터는 유도제가 없는 조건에서 유전자 발현을 유도하고 종종 일반적으로 사용되는 유도성 프로모터보다 더 나은 특징을 나타내기 때문에 유전공학에서 매우 유용한 도구이다. 유도성 프로모터는 생물적 또는 비생물적 요인 및 화학적 또는 물리적 요인의 존재 또는 부재에 의해 유도되는 프로모터이다. 유도성 프로모터는 이에 작동적으로 연결된 유전자의 발현이 유기체의 특정 발달 또는 성장 단계 또는 특정 조직 또는 세포에서 켜지거나 꺼질 수 있기 때문에 유전 공학에서 매우 강력한 도구이다.

용어 "작동적으로 연결된"은 하나의 기능이 다른 것에 의해 영향을 받도록 단일 핵산 단편 상의 핵산 서열의 회합을 지칭한다. 예컨대, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 제어 하에 있는 경우) 코딩 서열과 작동적으로 연결된다.

본원에 사용된 용어 "발현 태그"는 관심 단백질에 부착될 수 있고 관심 재조합 단백질의 용해도, 안정성 및/또는 발현을 지원하는 것으로 추정되는 임의의 펩티드 또는 폴리펩티드를 지칭한다.

"절단 가능한 링커 펩티드"는 절단 인식 서열을 갖는 펩티드 서열을 지칭한다. 절단 가능한 펩티드 링커는 효소적 또는 화학적 절단제에 의해 절단될 수 있다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 2개 이상의 아미노산 잔기를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 이 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 모방체인 아미노산 중합체 뿐만 아니라 자연 발생 아미노산 중합체, 변형된 잔기를 함유하는 아미노산 중합체 및 비-자연 발생 아미노산 중합체에도 적용된다. "폴리펩티드"는 일반적으로 펩티드, 올리고펩티드 또는 올리고머로 지칭되는 단쇄 및 일반적으로 단백질로 지칭되는 장쇄를 모두 지칭한다. 폴리펩티드는 20개 유전자 코딩된 아미노산 이외의 아미노산을 함유할 수 있다. 마찬가지로, "단백질"은 단백질, 폴리펩티드, 올리고펩티드 및 펩티드를 포함하는 적어도 2개의 공유적으로 부착된 아미노산을 지칭한다. 단백질은 자연 발생 아미노산 및 펩티드 결합 또는 합성 펩티드모방 구조로 구성될 수 있다. 따라서, 본원에 사용된 "아미노산" 또는 "펩티드 잔기"는 자연 발생 아미노산 및 합성 아미노산 모두를 의미한다. "아미노산"은 프롤린 및 히드록시프롤린과 같은 이미노산 잔기를 포함한다. 측쇄는 (R) 또는 (S) 구성일 수 있다.

발명의 상세한 설명

본 발명에 따라 생성된 펩티드는 짧은 융합 태그를 사용하기 때문에 선행 기술 공정에 따라 생성된 펩티드보다 더 효율적으로 생성될 수 있다. 현재 방법은 융합 단백질의 발현을 위해 원하는 관심 펩티드의 잠재적 수율을 감소시키는 대형 융합 태그를 사용한다. 이는 원하는 펩티드가 31개 아미노산인 리라 펩티드와 같이 소형인 상황에서 특히 문제가 된다. 이러한 상황에서는 수율을 최대화하기 위해 가능한 가장 작은 융합 태그를 사용하는 것이 유리하다.

본 발명은 관심 단백질을 코딩하는 핵산이 N-말단에서 T7 리더 펩티드 및 발현 태그에 작동적으로 융합된 발현 구축물을 제공함으로써 숙주 세포에서 관심 단백질의 높은 수율을 달성하기 위한 다차원적 접근법을 고려한다.

일 실시양태에서, 발현 카세트는 관심 단백질을 코딩하는 핵산을 포함한다.

중요한 실시양태에서, 발현 카세트는 또한 관심 단백질의 N-말단에 융합된 T7 리더 펩티드, 발현 태그 및 절단 가능한 링커를 포함하는 융합 폴리펩티드를 코딩할 수 있다.

일 실시양태에서, 발현 카세트는 또한 관심 단백질의 N-말단에 융합된 T7 리더 펩티드, 폴리히스티딘 태그, 발현 태그 및 절단 가능한 링커를 포함하는 융합 폴리펩티드를 코딩할 수 있다.

관심 단백질은 바람직하게는 생체활성 폴리펩티드이다. 더욱 바람직하게는, 이는 인간 또는 동물의 질환을 치료하는 데 유용한 치료 단백질을 포함한다.

본 발명의 일 실시양태에서, 관심 단백질의 발현 수준은 적어도 85% 증가한다.

또 다른 실시양태에서, 관심 단백질은 100개 미만의 아미노산인 치료 펩티드를 포함한다. 바람직한 실시양태에서, 관심 펩티드는 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드, 및 세마글루티드와 같으나 이에 제한되지 않는 펩티드를 포함한다.

발현 태그는 관심 단백질에 부착될 수 있고 관심 재조합 단백질의 용해도, 안정성 및/또는 발현을 지원하는 것으로 추정되는 임의의 펩티드 또는 폴리펩티드를 지칭한다.

추가 실시양태에서, 발현 카세트는 서열번호 2-10에 제시된 아미노산 서열을 갖는 발현 태그를 코딩하는 핵산 서열을 포함한다.

바람직한 실시양태에서, 발현 카세트는 서열번호 2(LP-2) 또는 서열번호 8(LP-8)에 제시된 아미노산 서열을 포함한다.

또 다른 실시양태에서, 핵산 서열은 코돈 최적화로 알려진 희귀 코돈 대신 숙주 세포에서의 발현을 위한 바람직한 코돈을 함유한다. 본원에 사용된 용어 "코돈 최적화된"은 핵산 분자의 유전자 또는 코딩 영역의 코돈이 숙주 유기체와 관련하여 바람직한 코돈으로 변경되는 것을 지칭한다.

특정 실시양태에서, 핵산은 "코돈 축퇴성"을 나타낼 수 있다. "코돈 축퇴성"은 구조적으로 상이한 뉴클레오티드와 동일한 기능을 수행하거나 동일한 결과를 산출할 수 있는 뉴클레오티드를 지칭한다.

한 실시양태에서, 코돈 최적화된 발현 태그는 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 및 서열번호 34에 제시된 뉴클레오티드 서열을 포함한다.

한 실시양태에서, 코돈 최적화 발현 카세트는 발현 태그를 코딩하는 핵산, HIS 태그, TEV 인식 부위 및 리라 펩티드를 코딩하는 핵산을 포함한다. 코돈 최적화된 발현 카세트는 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 및 서열번호 46에 제시된 뉴클레오티드 서열을 포함한다.

일 실시양태에서, 발현 카세트는 절단 가능한 링커 펩티드를 코딩하는 뉴클레오티드를 포함한다. 바람직하게는, 발현 카세트는 세린 프로테아제, 아스파르트산 프로테아제, 시스테인 프로테아제 또는 메탈로프로테아제로 절단 가능한 절단 가능한 링커 펩티드를 코딩한다.

바람직한 실시양태에서, 발현 카세트는 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 코딩한다.

일 실시양태에서, 본 발명은

d) 관심 단백질을 코딩하는 폴리뉴클레오티드

의 작동적으로 연결된 핵산 서열을 포함하는 관심 단백질의 고수준 발현을 위한 발현 카세트를 제공하며,

또 다른 실시양태에서, 본 발명은

c) 절단 가능한 링커를 코딩하는 폴리뉴클레오티드; 및

의 작동적으로 연결된 핵산 서열을 포함하는 리라 펩티드의 발현을 위한 발현 카세트를 제공한다.

본 발명의 발현 카세트는 프로모터를 포함한다. 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 당업자에게 알려진 구성적 또는 유도성 프로모터가 본 발명의 하나 이상의 실시양태에서 발현 카세트에 사용될 수 있다.

일 실시양태에서, 본 발명은 관심 단백질을 발현하기 위한 발현 벡터를 제공하며, 발현 벡터는 상기 기재된 발현 카세트의 적어도 하나의 카피를 포함한다.

발현 벡터는 발현 카세트의 발현을 조절하기 위한 조절 서열, 전사 종결 서열, 선별 마커, 및 다중 클로닝 부위를 추가로 포함할 수 있다. 벡터는 또한 코딩된 폴리펩티드의 직접 수송을 위한 신호 서열을 추가로 포함할 수 있다.

일 실시양태에서, 본 발명에 적합한 벡터는 pD451.SR, pD431.SR, pET28, pET36, pGEX, pBAD, pQE9, pRSET 등을 포함하지만 이에 제한되지 않는다.

일 실시양태에서, 본 발명은 상기 기재된 발현 벡터를 포함하는 재조합 숙주를 제공한다. 적합한 숙주 세포는 이. 콜리, 코리네박테리움 글루타미쿰 및 바실루스 서브틸리스를 포함하지만 이에 제한되지 않는다. 바람직한 실시양태에서, 이. 콜리가 재조합 숙주로 사용된다.

일 실시양태에서, 재조합 숙주 세포는 이. 콜리이고, 이는 BL21(DE3), BL21 Al, HMS174(DE3), DH5ct, W31 10, B834, 오리가미, 로제타, 노바블루(DE3), Lemo21(DE3), T7, ER2566 및 C43(DE3)으로부터 선택되는 균주를 포함한다.

일 실시양태에서, 본 발명의 발현 벡터는 융합 펩티드를 생성하기 위해 재조합 벡터에서 발현된다.

일 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된

c) 절단 가능한 펩티드 링커

를 포함하는 융합 폴리펩티드를 제공한다.

c) 절단 가능한 링커 펩티드

를 포함하는 융합 폴리펩티드를 제공한다.

한 실시양태에서, 본 발명은 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 및 서열번호 22에 제시된 융합 폴리펩티드를 제공한다.

본 발명은 또한 절단 가능한 링커에서 융합 단백질을 절단함으로써 수득되는 관심 단백질의 생성을 증가시키는 방법을 제공한다.

일 실시양태에서, 본 발명은 또한 관심 단백질을 생성하는 방법을 제공하며, 상기 방법은

a) 발현 구축물을 구축하는 단계로서, 발현 구축물은

i. 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;

ii. 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;

iii. 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및

iv. 관심 단백질을 코딩하는 폴리뉴클레오티드

를 포함하는 단계;

b) 발현 구축물을 발현 벡터에 삽입하는 단계;

c) 재조합 숙주를 발현 벡터로 형질전환시키는 단계;

d) 재조합 숙주를 융합 단백질을 발현하기 위한 최적 조건 하에서 성장시키는 단계로서, 융합 단백질은 관심 단백질의 N-말단에 융합된 T7 리더 폴리펩티드, 발현 태그, 및 절단 가능한 펩티드 링커를 포함하는 단계;

e) 융합 단백질을 세포로부터 단리하는 단계; 및

f) 융합 단백질을 절단 가능한 링커 펩티드에서 절단하여 관심 단백질을 수득하는 단계

를 포함한다.

일 실시양태에서, 본 발명은 또한 리라 펩티드를 생성하는 방법을 제공하며, 상기 방법은

a) 발현 구축물을 구축하는 단계로서, 발현 구축물은

iv. 서열번호 12의 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드

를 포함하는 단계;

b) 발현 구축물을 발현 벡터에 삽입하는 단계;

c) 재조합 숙주를 발현 벡터로 형질전환시키는 단계;

d) 재조합 숙주를 융합 단백질을 발현하기 위한 최적 조건 하에서 성장시키는 단계로서, 융합 단백질은 리라 단백질의 N-말단에 융합된 T7 리더 폴리펩티드, 발현 태그, 및 절단 가능한 펩티드 링커를 포함하는 단계;

e) 융합 단백질을 세포로부터 단리하는 단계; 및

f) 융합 단백질을 절단 가능한 링커 펩티드에서 절단하여 리라 펩티드를 수득하는 단계

를 포함한다.

인간 GLP-1의 유사체인 리라글루티드는 GLP-1 수용체 효능제로서 역할을 한다. 리라글루티드는 펩티드 전구체(서열번호 12에 제시된 리라 펩티드)의 위치 26에 남아있는 리신 잔기에 글루탐산 스페이서로 C-16 지방산(팔미트산)을 부착함으로써 만들어진다.

또 다른 실시양태에서, 본 발명은 리라 펩티드를 생성하는 방법을 제공하며, 상기 방법은

a) 재조합 벡터(발현 구축물)의 구축 단계,

b) 발현 구축물의 에쉐리키아 콜리로의 형질전환 단계,

c) 펩티드 발현을 위한 클론의 평가 단계,

d) 태그부착된 리라 펩티드의 정제 단계,

e) N-말단 융합 태그의 절단 및 리라 펩티드의 정제 단계

를 포함한다.

본원에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 잘 알려져 있으며, 문헌(Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2001))에 기재되어 있다.

상기 개시내용은 일반적으로 본 발명을 설명한다. 하기의 구체적인 실시예를 참조하면 보다 완전한 이해를 얻을 수 있다. 이 실시예는 예시의 목적으로만 기재되었으며, 본 발명의 범위를 제한하려는 의도가 아니다. 본원에 특정한 용어가 사용되었으나, 이러한 용어는 설명적인 의미로 사용된 것이지 제한하려는 목적으로 사용된 것은 아니다.

본 발명의 상이한 실시양태는 하기 실시예를 통해 추가로 정의된다. 하기 실시예는 본 발명을 예시하기 위한 것이며 어떠한 방식으로든 본 발명의 범위를 제한하려는 의도는 아니다.

실시예:

실시예 1: 리라 펩티드 발현 플라스미드 구축

N-말단 융합(도 1a, 1b, 1c, 1d) 및 (서열번호 13 내지 23)의 조합을 갖는 리라 펩티드를 코딩하는 DNA를 이. 콜리에 대해 코돈 최적화하고 합성하였다.

이. 콜리 발현 플라스미드 pD451.SR은 선형화된 형태(SapI 분해됨)로 ATUM에서 구입하였다. 상이한 N-말단 융합과 조합된 리라 펩티드의 합성된 DNA를 SapI 제한 효소로 분해하였다. 제한 분해된 단편을 pD451.SR 선형 플라스미드와 리게이션하고, 이. 콜리 균주로 형질전환시켰다. 리라 펩티드 발현 카세트를 함유하는 생성된 플라스미드(도 2a, 2b, 2c, 2d 및 2e)는 뉴클레오티드 시퀀싱으로 확인되었다.

코돈 최적화된 발현 태그는 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 및 서열번호 34에 제시된 뉴클레오티드 서열을 포함한다.

코돈 최적화된 발현 카세트는 발현 태그를 코딩하는 핵산, HIS 태그, TEV 인식 부위 및 리라 펩티드를 코딩하는 핵산을 포함한다. 코돈 최적화된 발현 카세트는 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46 및 서열번호 47에 제시된 뉴클레오티드 서열을 포함한다.

실시예 2: 이. 콜리의 형질전환 및 펩티드 발현

카세트 LP1 내지 LP11을 함유하는 서열 확인된 플라스미드 DNA를 염화칼슘 열 충격 형질전환 방법을 통해 이. 콜리 BL21(DE3)에 형질전환시킨 후, 50 μg/ml 카나마이신 항생제를 함유하는 LB 한천에 도말하였다. 형질전환된 이. 콜리 세포를 50 μg/ml 카나마이신을 함유한 5 ml LB 배지에서 37℃의 진탕 인큐베이터에서 밤새 배양한 후, 새로운 배지로 1:100 비율로 희석하여 OD가 ~0.6에 도달할 때까지 성장시켰다.

이어서, IPTG를 1 mM의 최종 농도로 되도록 첨가하고, 진탕 인큐베이터에서 37℃에서 4시간 동안 인큐베이션하였다. 배양된 세포 OD는 펩티드 발현 분석을 위해 SDS-PAGE 겔에 로딩하기 전에 정규화되었다(도 3a). LP1(서열번호 35), LP3(서열번호 37), LP11(서열번호 45)을 제외한 모든 카세트의 겔에서 리라 펩티드의 발현이 관찰되었다.

각각의 레인의 총 단백질 중 리라 펩티드 밴드 밀도를 정량화하기 위해 GE로부터의 이미지-퀀트(Image-Quant) 800 겔 문서화 시스템 및 이의 소프트웨어를 사용하여 겔에 대해 밀도계측 분석을 실시하였다.

클론의 선택은 발현 태그의 가장 작은 크기 및 리라 펩티드 수율이 더 높을 것으로 예상되는 겔 상의 리라 펩티드 밴드의 더 높은 밀도에 근거하였다.

발현 태그가 없는 리라 펩티드는 겔에서 어떠한 발현도 나타내지 않는 것으로 확인되었으며, 이는 발현 태그가 발현에 필수적임을 나타낸다. LP2 및 LP8 클론은 발현 태그 크기가 비교적 작고 리라 펩티드 밴드 밀도가 더 높기 때문에 추가 분석을 위해 선택되었다(도 3b).

LP2 및 LP8 클론에서 리라 펩티드 발현에 대한 T7 리더와 발현 태그 사이에 시너지 효과가 있는지를 확인하기 위해, 본 발명자들은 T7 리더가 없는 LP2 및 LP8 카세트(서열번호 24 및 25)를 구축하고 평가하였다(도 2c & 2e).

T7 리더를 갖는 LP2 및 LP8의 펩티드 발현은 T7 리더가 없는 LP2 및 LP8보다 적어도 85% 더 높은 것으로 확인되었다(도 4a, b, c & 5a, b, c).

실시예 3: N-말단 융합을 함유하는 리라 펩티드의 정제

음파 절차를 이용하여 세포를 용해시키고 이어 용해물을 원심분리한 후, 불용성 펠릿을 8M 우레아에 용해시켰다.

샘플을 Ni-NTA 매트릭스에 로딩하였다. His 태그부착된 단백질은 결합하고 다른 단백질은 매트릭스를 통과한다. 세척 후, His 태그부착된 펩티드를 단계 구배를 갖는 이미다졸을 사용하여 용출하여 펩티드를 불순물로부터 분리하였다(도 6a).

실시예 4: N-말단 융합 태그의 제거 및 리라 펩티드의 정제

정제된 태그부착된 리라 펩티드를 TEV 프로테아제에 적용하여 N-말단 융합 태그를 절단하였다. 이어서, 샘플을 역상 컬럼 크로마토그래피에 로딩하여 리라 펩티드를 정제하였다(도 6b). 정제된 리라 펩티드 아미노산 서열 및 온전한 매쓰을 LC/MS를 사용하여 확인하였다.

실시예 5: 테리파라티드의 발현

T7 리더 펩티드, 폴리히스티딘 태그, 발현 태그(서열번호 26-34) 및 변형된 TEV 절단 가능한 링커를 포함하는 N-말단 융합의 조합과 서열번호 49의 아미노산 서열을 갖는 테리파라티드를 코딩하는 DNA를 이. 콜리에 대해 코돈 최적화하고 합성하였다. 서열번호 26-34의 발현 태그를 포함하는 발현 구축물을 TP2-TP10으로 명명한다. 발현 구축물 TP1은 어떠한 발현 태그도 함유하지 않으며, 발현 구축물 TP11은 T7 리더 + 6XArg + TEV 인식 부위 + 테리파라티드를 포함한다.

이. 콜리 발현 플라스미드 pD451.SR은 선형화된 형태(SapI 분해됨)로 ATUM에서 구입하였다. 상이한 N-말단 융합과 조합된 테리파라티드의 합성된 DNA를 SapI 제한 효소로 분해하였다. 제한 분해된 단편을 pD451.SR 선형 플라스미드와 리게이션하고, 이. 콜리 균주로 형질전환시켰다. 테리파라티드 발현 카세트를 함유하는 생성된 플라스미드는 뉴클레오티드 시퀀싱에 의해 확인되었다.

카세트 TP1 내지 TP11을 함유하는 서열 확인된 플라스미드 DNA를 염화칼슘 열 충격 형질전환 방법을 통해 이. 콜리 BL21(DE3)에 형질전환시킨 후, 50 μg/ml 카나마이신 항생제를 함유하는 LB 한천에 플레이팅하였다. 형질전환된 이. 콜리 세포를 50 μg/ml 카나마이신을 함유한 5 ml LB 배지에서 37℃의 진탕 인큐베이터에서 밤새 배양한 후, 새로운 배지로 1:100 비율로 희석하고 OD가 ~0.6에 도달할 때까지 성장시켰다.

이어서, IPTG를 1 mM의 최종 농도로 첨가하고, 진탕 인큐베이터에서 37℃에서 4시간 동안 인큐베이션하였다. 배양된 세포 OD는 펩티드 발현 분석을 위해 SDS-PAGE 겔에 로딩하기 전에 정규화되었다(도 8). 유도되지 않은(UI) 샘플을 대조군으로 사용하였다. TP3를 제외한 모든 카세트의 겔에서 테리파라티드의 발현이 관찰되었다.

발명의 이점

본 연구에서 T7 리더와 조합된 태그 LP-2(23AA) 및 태그 LP-8(12AA)과 같은 매우 짧은 융합 태그를 사용하여 리라 펩티드의 높은 발현 수준을 달성하였다. 융합 태그는 봉입체로의 응집을 유도하고, 단백질의 안정성을 증가시키고, 숙주 세포 분해 효소의 작용으로부터 펩티드를 보호하고, 발현 후 정제에도 도움을 준다. 수용성 및 불용성 분획에서 리라 펩티드의 발현을 나타내는 도 7은 융합 펩티드의 대부분이 불용성 분획에서 확인되었음을 나타낸다. 본 발명의 태그는 GST (26 kDa), 티오렉독신 Trx(12 kDa), MBP 태그(42 kDa), 케토스테로이드 이소머라제(KSI) 14 kDa, 및 SUMO 14 kDa와 같은 일반적으로 사용되는 융합 태그와 비교하여 크기가 매우 작다. 관심 펩티드의 발현을 개선하기 위해 가능한 가장 짧은 펩티드 태그를 사용하면 대형 융합 태그 사용의 한계를 극복하고 수율을 개선하여 제조 비용을 절감할 수 있다.

SEQUENCE LISTING <110> Biological E Limited <120> CONSTRUCTS AND METHODS FOR INCREASED EXPRESSION OF POLYPEPTIDES <130> IP58562 <140> 202141014741 <141> 2021-03-31 <160> 50 <170> PatentIn version 3.5 <210> 1 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Peptide Sequence <400> 1 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg 1 5 10 <210> 2 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 2 Gly Ser Gly Gln Gly Gln Ala Gln Tyr Leu Ala Ala Ser Leu Val Val 1 5 10 15 Phe Thr Asn Tyr Ser Gly Asp 20 <210> 3 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 3 Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala 1 5 10 15 Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu 20 25 30 Thr Pro Arg Arg Ala Ser Ala 35 <210> 4 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 4 Met Val Leu Thr Lys Lys Lys Leu Gln Asp Leu Val Arg Glu Val Ala 1 5 10 15 Pro Asn Glu Gln Leu Asp Glu Asp Val Glu Glu Met Leu Leu Gln Ile 20 25 30 Ala Asp Asp Phe Ile Glu Ser Val Val Thr Ala Ala Cys Gln Leu Ala 35 40 45 Arg His Arg Lys Ser Ser Thr Leu Glu Val Lys Asp Val Gln Leu His 50 55 60 Leu Glu Arg Gln Trp Asn Met Trp Ile 65 70 <210> 5 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 5 Ser Arg Arg Pro Arg Gln Leu Gln Gln Arg Gln 1 5 10 <210> 6 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 6 Ser Glu Glu Pro Glu Gln Leu Gln Gln Glu Gln Ser Arg Arg Pro Arg 1 5 10 15 Gln Leu Gln Gln Arg Gln 20 <210> 7 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 7 Ala Glu Glu Glu Glu Ile Leu Leu Glu Val Ser Leu Val Phe Lys Val 1 5 10 15 Lys Glu Phe Ala Pro Asp Ala Pro Leu Phe Thr Gly Pro Ala Tyr 20 25 30 <210> 8 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 8 Ser Ala Gly Asp Leu Lys Phe Val Lys Val Val Ala 1 5 10 <210> 9 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 9 Lys Thr Lys Gln Leu Met Ser Phe Ala Pro Ser His Asn 1 5 10 <210> 10 <211> 125 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 10 Met His Thr Pro Glu His Ile Thr Ala Val Val Gln Arg Phe Val Ala 1 5 10 15 Ala Leu Asn Ala Gly Asp Leu Asp Gly Ile Val Ala Leu Phe Ala Asp 20 25 30 Asp Ala Thr Val Glu Asp Pro Val Gly Ser Glu Pro Arg Ser Gly Thr 35 40 45 Ala Ala Ile Arg Glu Phe Tyr Ala Asn Ser Leu Lys Leu Pro Leu Ala 50 55 60 Val Glu Leu Thr Gln Glu Val Arg Ala Val Ala Asn Glu Ala Ala Phe 65 70 75 80 Ala Phe Thr Val Ser Phe Glu Tyr Gln Gly Arg Lys Thr Val Val Ala 85 90 95 Pro Ile Asp His Phe Arg Phe Asn Gly Ala Gly Lys Val Val Ser Ile 100 105 110 Arg Ala Leu Phe Gly Glu Lys Asn Ile His Ala Cys Gln 115 120 125 <210> 11 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 11 Glu Asn Leu Tyr Phe Gln 1 5 <210> 12 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 12 His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly 20 25 30 <210> 13 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 13 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser 20 25 30 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 35 40 45 Trp Leu Val Arg Gly Arg Gly 50 55 <210> 14 <211> 78 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 14 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Gly Ser Gly Gln Gly Gln Ala Gln Tyr Leu Ala Ala Ser Leu 20 25 30 Val Val Phe Thr Asn Tyr Ser Gly Asp Glu Asn Leu Tyr Phe Gln His 35 40 45 Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln 50 55 60 Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly 65 70 75 <210> 15 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 15 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe 20 25 30 Leu Ala Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser 35 40 45 Leu Leu Thr Pro Arg Arg Ala Ser Ala Glu Asn Leu Tyr Phe Gln His 50 55 60 Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln 65 70 75 80 Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly 85 90 <210> 16 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 16 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Met Val Leu Thr Lys Lys Lys Leu Gln Asp Leu Val Arg Glu 20 25 30 Val Ala Pro Asn Glu Gln Leu Asp Glu Asp Val Glu Glu Met Leu Leu 35 40 45 Gln Ile Ala Asp Asp Phe Ile Glu Ser Val Val Thr Ala Ala Cys Gln 50 55 60 Leu Ala Arg His Arg Lys Ser Ser Thr Leu Glu Val Lys Asp Val Gln 65 70 75 80 Leu His Leu Glu Arg Gln Trp Asn Met Trp Ile Glu Asn Leu Tyr Phe 85 90 95 Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu 100 105 110 Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly 115 120 125 <210> 17 <211> 66 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 17 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Ser Arg Arg Pro Arg Gln Leu Gln Gln Arg Gln Glu Asn Leu 20 25 30 Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr 35 40 45 Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly 50 55 60 Arg Gly 65 <210> 18 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 18 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Ser Glu Glu Pro Glu Gln Leu Gln Gln Glu Gln Ser Arg Arg 20 25 30 Pro Arg Gln Leu Gln Gln Arg Gln Glu Asn Leu Tyr Phe Gln His Ala 35 40 45 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 50 55 60 Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly 65 70 75 <210> 19 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 19 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Ala Glu Glu Glu Glu Ile Leu Leu Glu Val Ser Leu Val Phe 20 25 30 Lys Val Lys Glu Phe Ala Pro Asp Ala Pro Leu Phe Thr Gly Pro Ala 35 40 45 Tyr Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp 50 55 60 Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp 65 70 75 80 Leu Val Arg Gly Arg Gly 85 <210> 20 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 20 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Ser Ala Gly Asp Leu Lys Phe Val Lys Val Val Ala Glu Asn 20 25 30 Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser 35 40 45 Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg 50 55 60 Gly Arg Gly 65 <210> 21 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 21 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Lys Thr Lys Gln Leu Met Ser Phe Ala Pro Ser His Asn Glu 20 25 30 Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser 35 40 45 Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val 50 55 60 Arg Gly Arg Gly 65 <210> 22 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 22 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His 1 5 10 15 His His Met His Thr Pro Glu His Ile Thr Ala Val Val Gln Arg Phe 20 25 30 Val Ala Ala Leu Asn Ala Gly Asp Leu Asp Gly Ile Val Ala Leu Phe 35 40 45 Ala Asp Asp Ala Thr Val Glu Asp Pro Val Gly Ser Glu Pro Arg Ser 50 55 60 Gly Thr Ala Ala Ile Arg Glu Phe Tyr Ala Asn Ser Leu Lys Leu Pro 65 70 75 80 Leu Ala Val Glu Leu Thr Gln Glu Val Arg Ala Val Ala Asn Glu Ala 85 90 95 Ala Phe Ala Phe Thr Val Ser Phe Glu Tyr Gln Gly Arg Lys Thr Val 100 105 110 Val Ala Pro Ile Asp His Phe Arg Phe Asn Gly Ala Gly Lys Val Val 115 120 125 Ser Ile Arg Ala Leu Phe Gly Glu Lys Asn Ile His Ala Cys Gln Glu 130 135 140 Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser 145 150 155 160 Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val 165 170 175 Arg Gly Arg Gly 180 <210> 23 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 23 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Arg Arg Arg Arg 1 5 10 15 Arg Arg Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser 20 25 30 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 35 40 45 Trp Leu Val Arg Gly Arg Gly 50 55 <210> 24 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 24 Met His His His His His His Gly Ser Gly Gln Gly Gln Ala Gln Tyr 1 5 10 15 Leu Ala Ala Ser Leu Val Val Phe Thr Asn Tyr Ser Gly Asp Glu Asn 20 25 30 Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser 35 40 45 Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg 50 55 60 Gly Arg Gly 65 <210> 25 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide sequence <400> 25 Met His His His His His His Ser Ala Gly Asp Leu Lys Phe Val Lys 1 5 10 15 Val Val Ala Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr 20 25 30 Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile 35 40 45 Ala Trp Leu Val Arg Gly Arg Gly 50 55 <210> 26 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 26 ggtagcggtc agggtcaagc acagtatctg gcagcaagcc tggttgtttt taccaattat 60 agcggtgat 69 <210> 27 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 27 atgaataaca acgacctgtt tcaggcaagc cgtcgtcgtt ttctggcaca gttaggtggt 60 ctgaccgttg caggtatgct gggtccgagc ctgctgacac cgcgtcgtgc aagcgca 117 <210> 28 <211> 219 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 28 atggttctga ccaaaaaaaa gctgcaggat ctggttcgtg aagttgcacc gaatgaacag 60 ctggatgaag atgttgaaga aatgctgctg cagattgccg atgattttat tgaaagcgtt 120 gttaccgcag catgtcagct ggcacgtcat cgtaaaagca gcaccctgga agttaaagat 180 gttcagctgc atctggaacg tcagtggaat atgtggatt 219 <210> 29 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 29 agccgtcgtc cgcgtcagct gcagcagcgt caa 33 <210> 30 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 30 agcgaagaac cggaacagct gcagcaagaa cagagccgtc gtccgcgtca gctgcaacag 60 cgtcaa 66 <210> 31 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 31 gccgaagaag aagaaattct gctggaagtt agcctggtgt ttaaggtgaa agaatttgca 60 ccggatgcac cgctgtttac cggtccggca tat 93 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 32 tcagccggtg atctgaaatt tgttaaagtt gttgcc 36 <210> 33 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 33 aaaaccaaac agctgatgag ctttgcaccg agccataat 39 <210> 34 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 34 atgcatacac cggaacatat taccgcagtt gttcagcgtt ttgttgcagc actgaatgcc 60 ggtgatctgg atggtattgt tgcactgttt gcagatgatg caaccgttga agatccggtt 120 ggtagcgaac cgcgtagcgg caccgcagca attcgtgaat tttatgcaaa tagcctgaaa 180 ctgccgctgg ccgttgaact gacccaagaa gttcgcgcag ttgcaaatga agcagcattt 240 gcatttaccg tgagctttga atatcagggt cgtaaaaccg ttgttgcacc gattgatcat 300 tttcgtttta atggtgccgg taaagttgtt agcattcgtg ccctgtttgg cgaaaaaaac 360 attcatgcat gtcaa 375 <210> 35 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 35 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcatcatca ccatgaaaac 60 ctgtattttc agcatgcaga aggcaccttt acctcagatg ttagcagcta tctggaaggt 120 caggcagcaa aagaatttat tgcatggctg gttcgtggtc gtggttaa 168 <210> 36 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 36 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatggtagc 60 ggtcagggtc aagcacagta tctggcagca agcctggttg tttttaccaa ttatagcggt 120 gatgagaacc tgtattttca gcatgcagaa ggcaccttta cctcagatgt tagcagctat 180 ctggaaggtc aggcagcaaa agaatttatt gcatggctgg ttcgtggtcg tggttaa 237 <210> 37 <211> 285 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 37 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatgaat 60 aacaacgacc tgtttcaggc aagccgtcgt cgttttctgg cacagttagg tggtctgacc 120 gttgcaggta tgctgggtcc gagcctgctg acaccgcgtc gtgcaagcgc agaaaatctg 180 tattttcagc atgcagaagg cacctttacc tcagatgtta gcagctatct ggaaggtcag 240 gcagcaaaag aatttattgc atggctggtt cgtggtcgtg gttaa 285 <210> 38 <211> 387 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 38 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatggtt 60 ctgaccaaaa aaaagctgca ggatctggtt cgtgaagttg caccgaatga acagctggat 120 gaagatgttg aagaaatgct gctgcagatt gccgatgatt ttattgaaag cgttgttacc 180 gcagcatgtc agctggcacg tcatcgtaaa agcagcaccc tggaagttaa agatgttcag 240 ctgcatctgg aacgtcagtg gaatatgtgg attgaaaacc tgtattttca gcatgcagaa 300 ggcaccttta cctcagatgt tagcagttat ctggaaggcc aggcagcaaa agaatttatt 360 gcatggctgg tgcgtggtcg tggttaa 387 <210> 39 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 39 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatagccgt 60 cgtccgcgtc agctgcagca gcgtcaagaa aatctgtatt ttcagcatgc agaaggcacc 120 tttacctcag atgttagcag ctatctggaa ggtcaggcag caaaagaatt tattgcatgg 180 ctggttcgtg gtcgtggtta a 201 <210> 40 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 40 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatagcgaa 60 gaaccggaac agctgcagca agaacagagc cgtcgtccgc gtcagctgca acagcgtcaa 120 gaaaatctgt attttcagca tgcagaaggc acctttacct cagatgttag cagctatctg 180 gaaggtcagg cagcaaaaga atttattgca tggctggttc gtggtcgtgg ttaa 234 <210> 41 <211> 261 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 41 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatgccgaa 60 gaagaagaaa ttctgctgga agttagcctg gtgtttaagg tgaaagaatt tgcaccggat 120 gcaccgctgt ttaccggtcc ggcatatgaa aatctgtatt ttcagcatgc agaaggcacc 180 tttacctcag atgttagcag ctatctggaa ggtcaggcag caaaagaatt tattgcatgg 240 ctggttcgtg gtcgtggtta a 261 <210> 42 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 42 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcattcagcc 60 ggtgatctga aatttgttaa agttgttgcc gagaacctgt attttcagca tgcagaaggc 120 acctttacct cagatgttag cagctatctg gaaggtcagg cagcaaaaga atttattgca 180 tggctggttc gtggtcgtgg ttaa 204 <210> 43 <211> 207 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 43 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcataaaacc 60 aaacagctga tgagctttgc accgagccat aatgaaaatc tgtattttca gcatgccgaa 120 ggcaccttta ccagtgatgt tagcagctat ctggaaggtc aggcagcaaa agaatttatt 180 gcatggctgg ttcgtggtcg tggttaa 207 <210> 44 <211> 543 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 44 atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatgcat 60 acaccggaac atattaccgc agttgttcag cgttttgttg cagcactgaa tgccggtgat 120 ctggatggta ttgttgcact gtttgcagat gatgcaaccg ttgaagatcc ggttggtagc 180 gaaccgcgta gcggcaccgc agcaattcgt gaattttatg caaatagcct gaaactgccg 240 ctggccgttg aactgaccca agaagttcgc gcagttgcaa atgaagcagc atttgcattt 300 accgtgagct ttgaatatca gggtcgtaaa accgttgttg caccgattga tcattttcgt 360 tttaatggtg ccggtaaagt tgttagcatt cgtgccctgt ttggcgaaaa aaacattcat 420 gcatgtcaag aaaacctgta ttttcagcat gcagaaggca cctttacctc agatgttagc 480 agctatctgg aaggtcaggc agcaaaagaa tttattgcat ggctggttcg tggtcgtggt 540 taa 543 <210> 45 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 45 atggcaagca tgaccggtgg tcagcagatg ggtcgtcgtc gccgtcgtcg gcgtgaaaat 60 ctgtattttc agcatgcaga aggcaccttt acctcagatg ttagcagcta tctggaaggt 120 caggcagcaa aagaatttat tgcatggctg gttcgtggtc gtggttaa 168 <210> 46 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 46 atgcatcatc accatcatca tggtagcggt cagggtcaag cacagtatct ggcagcaagc 60 ctggttgttt ttaccaatta tagcggtgat gagaacctgt attttcagca tgcagaaggc 120 acctttacct cagatgttag cagctatctg gaaggtcagg cagcaaaaga atttattgca 180 tggctggttc gtggtcgtgg ttaa 204 <210> 47 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 47 atgcatcatc accatcatca ttcagccggt gatctgaaat ttgttaaagt tgttgccgag 60 aacctgtatt ttcagcatgc agaaggcacc tttacctcag atgttagcag ctatctggaa 120 ggtcaggcag caaaagaatt tattgcatgg ctggttcgtg gtcgtggtta a 171 <210> 48 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 48 catgcagaag gcacctttac ctcagatgtt agcagctatc tggaaggtca ggcagcaaaa 60 gaatttattg catggctggt tcgtggtcgt ggt 93 <210> 49 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence <400> 49 Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn 1 5 10 15 Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His 20 25 30 Asn Phe <210> 50 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence <400> 50 agcgttagcg aaattcagct gatgcataat ctgggcaaac atctgaatag catggaacgt 60 gttgaatggc tgcgtaaaaa actgcaggat gtgcacaact tt 102

Claims

관심 단백질의 발현을 위한 발현 카세트로서, 상기 발현 카세트는
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c) 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d) 관심 단백질을 코딩하는 폴리뉴클레오티드
를 포함하고,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된, 발현 카세트.
제1항에 있어서, 상기 발현 카세트가 폴리히스티딘 태그를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 발현 카세트.
제1항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 발현 카세트.
제1항에 있어서, 관심 단백질이 100개 미만의 아미노산인 치료 펩티드를 포함하는 것인 발현 카세트.
제1항에 있어서, 관심 단백질이 리라 펩티드(Lira-peptide), 테리파라티드(Teriparatide), 엑세나티드(Exenatide), 릭시세나티드(Lixisenatide), 테두글루티드(Teduglutide) 및 세마글루티드(Semaglutide)를 포함하는 군으로부터 선택되는 것인 발현 카세트.
제1항에 있어서, 관심 단백질이 리라 펩티드인 발현 카세트.
제1항에 있어서, 관심 단백질의 발현 수준이 적어도 85% 증가하는 것인 발현 카세트.
리라 펩티드의 발현을 위한 발현 카세트로서, 상기 발현 카세트는
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c) 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d) 서열번호 12에 제시된 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드
를 포함하고,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된, 발현 카세트.
제8항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 발현 카세트.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 발현 카세트가 서열번호 36-44에 제시된 폴리뉴클레오티드 서열을 포함하는 것인 발현 카세트.
제1항 내지 제10항 중 어느 한 항의 발현 카세트의 적어도 하나의 카피를 포함하는, 관심 단백질의 발현을 위한 발현 벡터.
제1항 또는 제11항에 있어서, 관심 단백질의 발현에 사용하기 위한 것인 바현 카세트 또는 발현 벡터.
제1항 내지 제10항 중 어느 한 항의 발현 카세트를 포함하는 발현 벡터를 포함하는, 관심 단백질의 생성을 증강시키기 위한 숙주 세포.
제13항에 있어서, 상기 숙주 세포가 이. 콜리(E. coli), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 및 바실루스 서브틸리스(Bacillus subtilis)를 포함하는 군으로부터 선택되는 것인 숙주 세포.
제14항에 있어서, 이. 콜리 균주가 BL21(DE3), BL21 Al, HMS174(DE3), DH5ct, W31 10, B834, 오리가미, 로제타, 노바블루(DE3), Lemo21(DE3), T7, ER2566 및 C43(DE3)을 포함하는 군으로부터 선택되는 것인 숙주 세포.
융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c) 절단 가능한 펩티드 링커
를 포함하는 융합 단백질.
제16항에 있어서, 상기 융합 폴리펩티드가 폴리히스티딘 태그를 추가로 포함하는 것인 융합 폴리펩티드.
제16항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 융합 폴리펩티드.
제16항에 있어서, 관심 단백질이 아미노산 길이가 100개 미만인 치료 펩티드를 포함하는 것인 융합 폴리펩티드.
제16항에 있어서, 관심 단백질이 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드, 및 세마글루티드를 포함하는 군으로부터 선택되는 것인 융합 폴리펩티드.
제16항에 있어서, 관심 단백질이 서열번호 12의 아미노산 서열에 제시된 리라 펩티드 또는 이의 기능적 등가물인 융합 폴리펩티드.
제16항에 있어서, 상기 융합 폴리펩티드가 서열번호 14-22에 제시된 아미노산 서열을 포함하는 것인 융합 폴리펩티드.
관심 단백질을 생성하는 방법으로서,
a) 제13항 내지 제15항 중 어느 한 항의 숙주 세포를 유리한 조건 하에서 배양하여 제16항 내지 제22항 중 어느 한 항의 융합 폴리펩티드를 수득하는 단계;
b) 단계 a)에서 수득된 융합 폴리펩티드를 단리하는 단계; 및
c) 단계 b)에서 수득된 융합 폴리펩티드를 절단 가능한 링커에서 절단하여 관심 단백질을 수득하는 단계
를 포함하는, 관심 단백질을 생성하는 방법.
제23항에 있어서, 관심 단백질이 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드 및 세마글루티드를 포함하는 군으로부터 선택되는 것인 방법.
제23항에 있어서, 관심 단백질이 서열번호 12의 아미노산 서열에 제시된 리라 펩티드 또는 이의 기능적 등가물인 방법.