KR20180072715A

KR20180072715A - 조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법

Info

Publication number: KR20180072715A
Application number: KR1020187012404A
Authority: KR
Inventors: 켈리 티. 휴스; 파비안느 셰번스
Original assignee: 유니버시티 오브 유타 리서치 파운데이션
Priority date: 2015-10-02
Filing date: 2016-10-03
Publication date: 2018-06-29
Also published as: US11293028B2; MA43056A; EP3356525A4; WO2017059424A1; CN108368500B; CN108368500A; JP2018529365A; EP3356525A1; JP6938482B2; US20180282738A1

Abstract

본 발명은 mRNA 번역에 대한 코돈 컨텍스트 및 동의 코돈 변화의 효과에 관한 것이다.

Description

조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법

1961년에, 크릭 등(Crick et al.)은 이들의 랜드마크를 공개했다[참조: Nature paper, "General nature of the genetic code for proteins" (Crick, F. H., et al. Nature 192:1227-32 (1961)]. +1 및 -1 프레임쉬프트 돌연변이를 조합하는 단순하면서 여전히 교묘한 유전적 접근법을 사용하여, 크릭 등은 분자 생물학의 중심 교리의 일부인 삼중항 코드에 대한 증거를 제공했다: DNA는 RNA 폴리머라제에 의해 mRNA로 전사되고, 이는 리보솜에 의해 단백질로 번역된다. 단백질의 아미노산 서열에 대한 유전자 코드는, 20개 아미노산 및 번역 종결(정지 코돈) 부위를 특정하는 64개 삼중항 코돈으로 이루어져 있다. 번역되는 mRNA 중의 특정 코돈 및 동족 아미노아실-tRNA의 안티코돈을 규정하는 3개 염기(안티코돈 루프 내의 염기 36, 35 및 34) 사이의 상호작용은 디코딩 프로세스를 결정한다[참조: Grosjean, H., et al., FEBS Lett. 584:252-264 (2010)].

디코딩 프로세스는 보다 복잡하다는 것이 현재 공지되어 있다. 소정 코돈을 번역하는 리보솜의 능력은 이의 인접하는 코돈(번역에 대한 코돈 컨텍스트 효과로서 지칭됨) 및 아마도 mRNA 이차 구조에 의해 매우 영향을 받는다[참조: Goodman, D. B., et al., Science 342:475-478 (2013)]. 소정 코돈의 번역은 또한 mRNA 개방 판독 프레임 내의 코돈 위치에 의해 영향을 받는다. 추가로, 동의 돌연변이(코딩된 아미노산을 변화시키지 않는 코돈 내의 뉴클레오티드 변화)는 장기간 진화론적으로 침묵인 것으로 생각되지만[참조: Nei, M. Mol. Biol. Evol. 22:2318-2342 (2005)], 동의 코돈은 번역 속도 및 정확성, 공번역 폴딩, 단백질 분비 및 전체 발현 수준에 의해 영향을 받는다[참조: Hunt, R. C., et al., Trends Genet. 30:308-321 (2014)]. 최근의 증거는 동의 코돈을 제공하는 돌연변이와 인간 질환, 예를 들면, 암 사이의 관련성을 뒷받침한다[참조: Sauna, Z. E., and C. Kimchi-Sarfaty, Nat Rev Genet 12:683-91 (2011); Supek, F., et al., Cell 156:1324-35 (2014)].

본 발명은, 상이한 리보솜 번역 속도 및 정확성, 단백질 폴딩 및 발현을 제공하는 코돈 쌍의 동의 변화를 제공한다. 한 가지 실시형태에서, 본 발명은 유전적으로 변형된 생물체에서 단백질의 발현을 조작하기 위한 15-염기쌍 서열을 제공한다. 본 발명은 또한 질환 상태와 연관된 유해한 효과를 제공하는 폴리뉴클레오티드 돌연변이를 스크리닝하는 방법을 제공한다.

한 가지 실시형태에서, 본 발명은, 목적하는 단백질을 코딩하는 이종성 폴리뉴클레오티드 서열에 부가될 때, 목적하는 폴리펩티드의 조절된 생성을 제공하는 단백질의 번역 효율을 증가 또는 감소시키는 조작된 FlgM 코딩 서열 또는 이의 10개-코돈-단편을 제공한다.

한 가지 실시형태에서, 본 발명은 추가로 세균 분비 시스템(예를 들면, 편모 유형 III 분비(T3S) 시스템(T3SS))을 사용하여 목적하는 단백질을 배양 배지 내로 분리시키고, 따라서 단백질 회수를 위해 세포 용해를 필요로 하는 방법보다 더욱 효율적인 단백질 생성 방법을 제공한다.

본 발명은 또한, 적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 하나 이상이 동의 코돈인, 재조합 핵산 분자를 제공한다. 특정 실시형태에서, 상기 재조합 핵산 분자는 돌연변이 트리아콘타뉴클레오티드 서열로 이루어진다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 MSIDRTSPLK(서열번호 1)을 코딩한다. 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 전장 FlgM 아미노산 서열: MSIDRTSPLKPVSTVQTRETSDTPVQKTRQEKTSAATSASVTLSDAQAKLMQPGVSDINMERVEALKTAIRNGELKMDTGKIADSLIREAQSYLQSK(서열번호 3)를 코딩하는 서열의 일부이다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결된다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 5'에서 3' 방향으로 작동적으로 연결된다. 특정 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 코딩하고, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 5'에서 3' 방향으로 작동적으로 연결된다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 추가로 절단 부위 뉴클레오티드 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 절단 부위는 토바코 에취 바이러스(Tobacco Etch Virus; TEV) 프로테아제 절단 부위 또는 엔테로키나제(ETK) 절단 부위를 코딩한다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 절단 부위 뉴클레오티드 서열, 및 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 5'-최다 코돈을 치환한다. 한 가지 실시형태에서, 목적하는 폴리펩티드는 돌연변이 트리아콘타뉴클레오티드 서열에 이종성이다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 리보핵산 서열이다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 데옥시리보핵산 서열이다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 합성 서열이다.

한 가지 실시형태에서, 5'에서 3' 방향에서 돌연변이 트리아콘타뉴클레오티드 서열의 제6 및 제8 코돈은 동의 코돈이다.

한 가지 실시형태에서, 벡터는 본 발명의 돌연변이 서열을 포함한다. 또 다른 실시형태에서, 상기 벡터는 발현 벡터이다.

한 가지 실시형태에서, 벡터는, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다. 또 다른 실시형태에서, 절단 부위 뉴클레오티드 서열은 돌연변이 트리아콘타뉴클레오티드 서열 및 목적하는 폴리뉴클레오티드 서열 사이에 존재한다. 또 다른 실시형태에서, 상기 벡터는 정제 태그를 코딩하는 핵산 서열을 추가로 포함하고, 여기서 상기 핵산은 돌연변이 트리아콘타뉴클레오티드 서열에 작동적으로 연결된다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열, 정제 태그를 코딩하는 핵산 서열, 및 임의로, 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다.

한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 또는 폴리뉴클레오티드 서열은 이종성 프로모터에 작동적으로 연결된다. 또 다른 실시형태에서, 상기 프로모터는 유도성 프로모터, 구성적 프로모터 또는 조직 특이적 프로모터이다. 본 발명의 유도성 프로모터는 아라비노즈 유도성 프로모터, 예를 들면, ParaBAD(ΔaraBAD) 프로모터 또는 살리실레이트 유도성 프로모터, 예를 들면, Psal 프로모터일 수 있다. 한 가지 실시형태에서, 숙주 세포는 재조합 분자를 포함한다. 또 다른 실시형태에서, 숙주 세포는 세균, 진균, 효모, 바이러스, 식물, 곤충 또는 포유류 세포이다. 또 다른 실시형태에서, 숙주 세포는 살로넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포이다. 또 다른 실시형태에서, 숙주 세포는 살모넬라 엔테리카(Salmonella enterica) 세포이다. 한 가지 실시형태에서, 절단 부위에 임의로 추가로 작동적으로 연결되는 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열은 숙주 세포 게놈 내로 작동적으로 통합된다.

한 가지 실시형태에서, 숙주 세포는 본 발명의 벡터를 포함한다.

한 가지 실시형태에서, 벡터 내의 폴리뉴클레오티드 서열은 숙주 세포 내에서의 발현을 위해 코돈 최적화되었다.

본 발명은, 10개 코돈을 갖는 핵산 서열을 포함하는 재조합 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 분자를 제공한다. 한 가지 실시형태에서, 상기 핵산 서열은 폴리뉴클레오티드 서열에 작동적으로 연결된다.

본 발명은 조절된 번역 속도를 갖고 데카코돈 서열 5'- AUGAGCAUUGACCGUACCUCACCUUUGAAA-3'(서열번호 2)을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자를 제공한다. 특정 실시형태에서, 상기 핵산 분자는 이러한 핵산 서열을 포함하고 아미노산 서열 서열번호 3을 코딩한다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG이고, 상기 재조합 분자는 데카코돈 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 5 내지 약 15배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 9 내지 약 15배 증가를 갖는다.

한 가지 실시형태에서, 제8 코돈은 동의 코돈 CCG이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 감소된 번역 속도를 갖는다. 한 가지 실시형태에서, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.01 내지 약 0.10배 감소를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.03 내지 약 0.07배 감소를 갖는다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 10 내지 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 20 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 30 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 40 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 27.5 내지 40.5배 증가를 갖는다.

한 가지 실시형태에서, 상기 데카코돈 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.

본 발명은, 숙주 세포 내의 단백질 생성을 조절하는 방법으로서, 본 발명의 숙주 세포를 단백질 발현에 충분한 조건하에 배양하는 것을 포함하고, 여기서 재조합 핵산 분자가 숙주 세포에 안정하게 도입되는, 방법을 제공한다. 한 가지 실시형태에서, 상기 재조합 핵산 분자는 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하고, 여기서 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나는 동의 코돈이다. 한 가지 실시형태에서, 상기 재조합 분자는 10개 코돈을 갖는 핵산 서열을 포함하고, 여기서 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나는 동의 코돈이다. 또 다른 실시형태에서, 동의 코돈을 포함하는 핵산 서열은 아미노산 서열 서열번호 3을 코딩한다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG이고, 여기서 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가된다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 5 내지 약 15배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 9 내지 약 15배 증가를 갖는다.

한 가지 실시형태에서, 제8 코돈은 동의 코돈 CCG이고, 여기서 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 감소된다. 한 가지 실시형태에서, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 0.01 내지 약 0.10배 감소를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 0.03 내지 약 0.07배 감소를 갖는다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가된다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 10 내지 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 20 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 30 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 40 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 27.5 내지 40.5배 증가를 갖는다.

본 발명은, 폴리뉴클레오티드 서열의 번역 속도를 증가시키는 방법으로서, 단백질을 코딩하고, 10개 코돈을 포함하고 NH₂-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드를 제공하는 단계 및 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈이도록 상기 트리아콘타뉴클레오티드 서열을 돌연변이시키는 단계를 포함하는, 방법을 제공한다. 추가의 실시형태에서, 상기 야생형 트리아콘타뉴클레오티드 서열 및 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 코딩한다.

한 가지 실시형태에서, 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가된다.

한 가지 실시형태에서, 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제8 코돈은 동의 코돈 CCG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 감소된다.

한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가된다.

본 발명은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열을 함유하는 숙주 세포를 배양하는 것을 포함하는, 목적하는 폴리펩티드를 생성하는 방법을 제공한다. 한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열은 절단 부위를 코딩하는 뉴클레오티드 서열 및/또는 정제 태그를 코딩하는 핵산 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 펩티드는 배양 배지로부터 정제된다. 한 가지 실시형태에서, 정제 태그를 사용하여 펩티드를 배양 배지로부터 정제한다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 갖는 FlgM 단백질을 코딩하고, 상기 펩티드는 FlgM 단백질로부터 단리된다. 또 다른 실시형태에서, 절단 부위를 사용하여 폴리펩티드를 FlgM 단백질로부터 단리한다.

본 발명은, 유형 III 분비 시스템을 갖고 또한 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열을 함유하는 하나 이상의 세균 세포를 배양하는 것을 포함하는 목적하는 폴리펩티를 생성하는 방법으로서, 상기 폴리펩티드가 배양 배지 내로 분비되는, 방법을 제공한다. 한 가지 실시형태에서, 세균 세포는 살모넬라(Salmonella) 또는 에스케리키아(Escherichia) 세포이다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열은 전장 FlgM 펩티드를 코딩한다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열은 정제 태그 및/또는 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 방법은 목적하는 폴리펩티드의 생성을 위해 연속 유동 제조 시스템을 사용한다. 한 가지 실시형태에서, 상기 연속 유동 제조 시스템은 인슐린, MaSp1 또는 MaSp2 단백질을 생성한다.

도 1은 어셈블리에 커플링된 살모넬라 엔테리카(Salmonella enterica) 편모 유전자 조절을 도시한다.
도 2는 지수 배양에서 FlgM 항-σ²⁸활성에 대한 flgM의 코돈 Thr6 및 Pro8의 동의 변화의 효과를 도시한다. 데이터는 FlgM 항-σ²⁸활성의 수준으로 제시되어 있다. 야생형 코돈(ACC)은 검정된 동의 Thr6 및 Pro8 코돈의 15개 조합 각각에 대해 최저 FlgM 활성/루시퍼라제 활성을 나타냈다.
도 3은 flgM의 Pro8 CCG 번역-결함 대립유전자의 억제에 대한 동의 코돈 돌연변이유발의 효과를 도시한다. 표지 배지 상에서 야생형 FlgM 활성을 나타낸 돌연변이체는 FlgM 서열 위에 제시되어 있다. 약간 증가된 FlgM 활성을 갖는 돌연변이체는 Ser2(ACG에서 AGT으로), Thre6(ACC에서 정지 코돈으로), Val12(GTT에서 GTG로 및 GTT에서 GTC으로)이다. FlgM 서열(10개 단리물) 하부에 도시된 나머지 돌연변이체는 표현형을 갖지 않는다. 괄호 안의 숫자는 반복 회수를 나타낸다.
도 4는 항-6xHis 항체를 사용한 웨스턴 블롯을 통해 조작된 살모넬라(Salmonella) 세포의 분비된 분획(상부) 및 세포 분획(하부) 내의 FlgM::6xHis::ETK::인슐린-글라르긴 키메라 단백질의 검출을 도시한다.

정의

본 발명의 이해를 용이하게 하기 위해, 다수의 용어 및 문구가 하기에 정의된다. 하기 용어 및 문구의 당해 기술분야에서 인식되는 동의어 및 대체어는, 구체적으로 기재되지 않더라도, 고려된다.

본 명세서 및 특허청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는, 문맥이 명백하게 달리 지시하지 않는 한, 복수 형태를 포함한다. 즉, "a"는, 달리 명시하지 않는 한, "하나 이상"을 의미한다.

용어 "약" 또는 "대략"은 대략적으로, 주위 또는 영역 내를 의미한다. 용어 "약" 또는 "대략"은 당해 기술분야의 숙련가에 의해 결정된 특정 값에 대한 허용가능한 상황 오차 범위 내를 추가로 의미하고, 이는 당해 값이 측정되거나 결정되는 방법, 즉 특정 목적에 요구된 측정 시스템의 제한 또는 정확도, 예를 들면, 사료 제형 내의 영양소의 양에 부분적으로 의존할 것이다. 용어 "약" 또는 "대략"이 수치 범위와 함께 사용되는 경우, 기재된 수치 값 상하의 경계를 확장함으로써 그 범위를 변경한다. 예를 들면, "약 5.5 내지 6.5g/l"는 수치 범위의 경계가 5.5 이하 및 6.5 이상으로 확장하여 해당 특정 값이 그 범위 내에서 동일한 기능적 결과를 달성하는 것을 의미한다. 예를 들면, "약" 및 "대략"은 당해 기술분야의 관행에 따라 1 또는 복수의 표준 편차 내인 것을 의미할 수 있다. 또는, "약" 및 "대략"은 소정 값의 20% 이하, 바람직하게는 10% 이하, 보다 바람직하게는 5% 이하 및 더욱 바람직하게는 1% 이하의 범위를 의미할 수 있다.

"A 및/또는 B" 등의 문구에 사용된 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" 및 "B"를 포함하는 것으로 의도된다. 마찬가지로, "A, B 및/또는 C" 등의 문구에 사용된 용어 "및/또는"은 각각의 하기 실시형태를 포괄하는 것으로 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A(단독); B(단독); 및 C(단독).

달리 명시되지 않는 한, 모든 명칭 "A%-B%", "A-B%," "A% 내지 B%," "A 내지 B%," "A%-B," "A% 내지 B"는 이들의 보통 의미와 관습적 의미를 제공한다. 일부 실시형태에서, 이들 명칭은 동의어이다.

용어 "실질적으로" 또는 "실질적"은 기재되거나 특허청구된 상태가 기재된 표준으로서 모든 중요한 측면에서 기능하는 것을 의미한다. 따라서, "실질적으로 포함하지 않는"은, 수치 값이 일부 불순물 또는 물질의 존재를 나타내는 경우에도, 자유 상태로서 모든 중요한 측면에서 기능하는 상태를 포괄하는 것을 의미한다. "실질적"은 일반적으로 90% 초과, 바람직하게는 95% 초과, 가장 바람직하게는 99% 초과의 값을 의미한다. 특정 값이 명세서 및 특허청구범위에 사용되는 경우, 달리 언급하지 않는 한, 용어 "실질적으로"는 특정 값에 대한 허용가능한 오차 범위를 의미한다.

"임의의" 또는 "임의로"는 후속적으로 기재된 사상, 상황 또는 물질이 발생하거나 발생하지 않거나 존재할 수도 있음을 의미하고, 해당 기재는 사상, 상황 또는 물질이 존재하는 경우 및 발생하지 않거나 존재하지 않는 경우을 포함한다.

용어 "형질전환" 및 "형질감염"은 수용체 세포 내로 핵산 분자(예: 발현 벡터)의 도입을 의미한다. 형질전환 또는 형질감염 기술은 당해 기술분야에 공지되어 있다. 핵산 서열(예: 발현 벡터에 의해 운반된 코딩 서열)이 상기 수용체(숙주) 세포의 게놈(염색체 DNA) 내로 도입(통합)되는 것이 특정될 수 있다.

"FlgM" 및 "flgM"은 유형 III 분비 시스템에서 플라젤린 합성을 음으로 조절하는 단백질 및 폴리뉴클레오티드 서열을 각각 지칭한다[참조: Gillen and Hughes, Molecular Characterization of flgM, a Gene Encoding a Negative Regulator of Flagellin Synthesis in Salmonella typhimurium , J. Bacteriology 173(20): 6453-6459 (1991)].

용어 "재조합" 또는 "돌연변이체"는 참조된 생성물이 이의 천연 존재 대응물에 관하여 변경된 것을 의미한다.

용어 "트리아콘타뉴클레오티드 서열"은 적어도 30개 뉴클레오티드 길이인 뉴클레오티드 서열을 의미한다. 예를 들면, 본 발명의 트리아콘타뉴클레오티드 서열은 30개 뉴클레오티드로 이루어질 수 있거나, 예를 들면, 전장 FlgM 단백질을 코딩하는 보다 큰 서열의 일부일 수 있다.

용어 "코돈"은 함께 하나의 아미노산을 코딩하는 3개 구성적 뉴클레오티드를 지칭한다.

용어 "데카코돈"은 적어도 5개 코돈(즉, 적어도 15개 뉴클레오티드)을 포함하는 뉴클레오티드 서열을 의미한다. 예를 들면, 본 발명의 데카코돈 서열은 10개 코돈으로 이루어질 수 있거나, 약 97개 코돈을 포함하고 전장 FlgM 펩티드를 코딩할 수 있다.

용어 "동의 코돈"은 야생형과 비교하여 변경되지만 야생형 코돈과 동일한 아미노산을 코딩하는 코돈을 의미한다.

용어 "핵산", "폴리뉴클레오티드" 및 "뉴클레오티드"는 본원에서 동의로 사용된다. 용어 "폴리뉴클레오티드"는, 단수 또는 복수로 사용되는 경우, 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭하고, 이는 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있다. 따라서, 예를 들면, 본원에 정의된 폴리뉴클레오티드는, 제한 없이, 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역을 포함하는 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역을 포함하는 RNA, 단일-가닥이거나 보다 통상적으로 이중-가닥일 수 있거나 단일- 및 이중-가닥 영역을 포함하는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 따라서, 안정성 또는 기타 이유로 변형된 골격을 갖는 DNA 또는 RNA는 해당 용어가 본원에서 의도되는 "폴리뉴클레오티드"이다. 더욱이, 이상 염기, 예를 들면, 이노신, 또는 변형된 염기, 예를 들면, 트리티움화 염기를 포함하는 DNA 또는 RNA는 본원에서 의도되는 용어 "폴리뉴클레오티드" 내에 포함된다. 일반적으로, 용어 "폴리뉴클레오티드"는 모든 화학적, 효소적 및/또는 대사적으로 변형된 형태의 비변형된 폴리뉴클레오티드를 포괄한다. 폴리뉴클레오티드는 시험관내 재조합 DNA-매개된 기술 및 세포을 포함하는 다양한 방법에 의해 또는 생물체에서 DNA의 발현에 의해 제조할 수 있다.

용어 "단백질", "폴리펩티드" 및 "펩티드"는 본원에서 동의어로 사용된다. 본원에 사용된 바와 같이, 용어 "폴리펩티드"는 단일 "폴리펩티드" 뿐만 아니라 복수의 "폴리펩티드"를 포괄하는 것으로 의도되고, 아미드 결합(또한 펩티드 결합으로 공지됨)에 의해 선형으로 연결된 단량체(아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩티드"는 2개 이상의 아미노산의 임의의 쇄 또는 쇄들을 지칭하고, 특정 길이의 생성물을 지칭하는 것은 아니다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질", "아미노산" 또는 2개 이상의 아미노산의 쇄 또는 쇄들을 지칭하기 위해 사용된 임의의 기타 용어는 "폴리펩티드"의 정의에 포함되고, 용어 "폴리펩티드"는 임의의 이들 용어 대신에 또는 이들 용어와 호환적으로 사용될 수 있다. 용어 "폴리펩티드"는 또한, 제한 없이, 글리코실화, 아세틸화, 포스포릴화, 아미드화, 공지된 보호/차단 그룹에 의한 유도체화, 단백질분해 절단, 또는 비-천연 존재 아미노산에 의한 변형을 포함하는, 폴리펩티드의 발현후 변형의 생성물을 지칭하는 것으로 의도된다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래할 수 있거나 재조합 기술에 의해 생성될 수 있지만, 지시된 핵산 서열로부터 반드시 번역되는 것은 아니다. 이는, 화학적 합성을 포함하는 임의의 방식으로 생성될 수 있다. 본 발명의 특정 실시형태는 적어도 FlgM 펩티드 및 폴리펩티드를 포함하는 융합 펩티드를 포함하고, 여기서 폴리펩티드 및 FlgM 펩티드는 서로 천연적으로 회합하지 않는다(즉, 폴리펩티드는 FlgM 펩티드에 대해 이종성이다). 이러한 폴리펩티드는 "이종성 폴리펩티드", "표적 폴리펩티드", "소망하는 폴리펩티드" 또는 "목적하는 폴리펩티드"로서 지칭될 수 있다.

"단리된" 생물학적 성분(예를 들면, 핵산 분자 또는 단백질)은 해당 성분이 천연에서 발생하는 생물체의 세포 내의 기타 생물학적 성분, 즉, 기타 염색체 및 염색체외 DNA 및 RNA, 단백질 및 세포소기관으로부터 실질적으로 분리되거나 정제되었다. "단리된" 핵산 및 단백질은 표준 정제 방법에 의해 정제된 핵산 및 단백질을 포함한다. 해당 용어는 또한 화학적으로 합성된 핵산 뿐만 아니라 숙주 세포에서 재조합 발현에 의해 제조된 핵산 및 단백질을 포괄한다.

용어 "이종성", "외래" 또는 "비-천연"은, 예를 들면, 서로 자연적으로 회합하지 않는 2개의 구조를 지칭한다. 예를 들면, 뉴클레오티드 서열이 이종성 프로모터에 작동적으로 연결되는 경우, 뉴클레오티드 서열은, 해당 뉴클레오티드 서열 및 프로모터 서열이 동일한 생물체로부터 유래하더라도, 프로모터와 자연적으로 회합하지 않는다.

용어 "리보핵산" 및 "RNA는 본원에서 동의적으로 사용된다.

용어 "데옥시리보핵산" 및 "DNA"는 본원에서 동의적으로 사용된다.

본원에 사용된 "벡터"는 클로닝 벡터, 발현 벡터, BAC 또는 YAC 벡터를 포함하는 플라스미드, 또는 세포 내로 폴리뉴클레오티드 서열을 수송할 수 있는 기타 핵산 분자일 수 있다. 벡터는 폴리뉴클레오티드 서열의 저장, 클로닝을 위해 설계될 수 있고/있거나 폴리뉴클레오티드 서열의 발현을 위해 설계될 수 있다. "플라스미드" 및 "벡터"는, 플라스미드가 통상 사용되는 형태의 벡터이기 때문에, 호환적으로 사용될 수 있다. 용어 "발현 벡터"는 세포에 의한 발현에 적합한 형태(예를 들면, 전사 조절 요소에 연결됨)로 유전자 작제물을 함유하는 임의의 벡터(예: 플라스미드, 코스미드 또는 파지 염색체)을 포함한다. 본원에 사용된 바와 같은 "작제물" 또는 "유전자 작제물"은 전체 염색체 및/또는 미토콘드리아 게놈을 포함하지 않는다. 특정한 숙주 세포 내에서 사용하기에 적합한 발현 벡터는 공지되어 있고, 통상의 실험 및 공지된 기술을 사용하여 용이하게 동정된다(예를 들면, 본원에서 이의 전체가 참조로서 도입되는, 미국 특허 제7,785,830호; 제8,663,980호; 제8,628,954호).

본원에 사용된 "숙주 세포"는 분자가 도입되거나 도입되어 있는 세포를 지칭한다. 일반적으로, 본원에서 숙주 세포는 외래(이종성, 비-천연) 분자가 도입되거나 도입되어 있는 세포를 지칭한다. 특정 실시형태에서, 본원의 숙주 세포는 세균 세포이다. 특정 실시형태에서, 숙주 세포는 그람-음성 세균 세포이다. 특정 실시형태에서, 숙주 세포는 유형 III 분비(T3S) 시스템(T3SS) 등의 분비 시스템을 포함하는 세균 세포이다. 특정 실시형태에서, 본원의 숙주 세포는 살모넬라(Salmonella), 시겔라(Shigella), 클라미디아(Chlamydia), 예르시니아(Yersinia), 슈도모나스(Pseudomonas) 및 에스케리키아(Escherichia) 세포로 이루어진 그룹으로부터 선택된다. 특정 실시형태에서, 본원의 숙주 세포는 살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움(Typhimurium), 시겔라 플렉스네리(Shigella flexneri), 클라미디아 트라코마티스(Chlamydia trachomatis), 예르시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis), 슈도모나스 에루기노사(Pseudomonas aeruginosa) 및 에스케리키아 콜라이(Escherichia coli) 세포로 이루어진 그룹으로부터 선택된다.

본원에 사용된 "정제 태그"는, 예를 들면, 크기 배제 크로마토그래피, 이온 교환 크로마토그래피 및/또는 친화성 크로마토그래피를 사용한 단백질 정제를 보조하는 리간드를 지칭한다. 정제 태그 및 이들의 용도는 당해 기술분야에 공지되어 있고[참조: Thermo Scientific Protein Purification Handbook 2010], 예를 들면, 폴리-히스티딘, 글루타티온 S-트랜스퍼라제(GST), Myc, Ha, FLAG, 또는 말토즈 결합 단백질(MBP)일 수 있다. 따라서, 단백질을 정제, 수집, 수득 또는 단리하는 단계는 크기 배제 크로마토그래피, 이온 교환 크로마토그래피 또는 친화성 크로마토그래피를 포함한다. 특정 실시형태에서, FlgM 펩티드, 또는 FlgM을 포함하는 융합(키메라) 단백질을 정제하는 단계는 친화성 크로마토그래피 및, 예를 들면, FlgM 또는 융합 단백질의 또 다른 구성원에 결합하는 항체를 포함하는 σ²⁸친화성 컬럼 또는 친화성 컬럼을 사용한다. 한 가지 실시형태에서, FlgM 펩티드 및 정제 태그를 적어도 포함하는 융합 단백질을 정제하는 단계는 친화성 크로마토그래피 및, 예를 들면, 정제 태그에 결합하는 친화성 컬럼을 사용한다.

본원에서 사용된 "절단 부위"는 화학적 또는 단백질(예를 들면, 제한 효소 또는 프로테아제)에 의해 인식되고/되거나 절단되는 서열을 지칭한다. 절단 부위는 당해 기술분야에 공지되어 있다(예를 들면, 본원에서 이의 전체가 참조로서 도입되는 미국 특허공개번호 제2015/0037868호). 절단 부위는 폴리뉴클레오티드 서열(예: 제한 효소 부위) 또는 아미노산 성려(예: 펩티다제 부위)일 수 있기 때문에, 당해 기술분야의 숙련가는, 인용되는 문맥에 기초하여, "절단 부위"가 폴리뉴클레오티드 서열 또는 아미노산 서열을 지칭하는지를 인식할 것이다. 예시적 절단 부위는 알라닌 카복시펩티다제, 아르밀라리아 멜레아(Armillaria mellea ) 아스타신, 세균 류실 아미노펩티다제, 암 응고촉진제, 카텝신 B, 클로스트리파인, 시토졸 알라닐 아미노펩티다제, 엘라스타제, 엔도프로테이나제 Arg-C, 엔테로키나제, 가스트릭신, 젤라티나제, Gly-X 카복시펩티다제, 글리실 엔도펩티다제, 인간 리노바이러스 3C 프로테아제, 하이포데르민 C, Iga-특이적 세린 엔도펩티다제, 류실 아미노펩티다제, 류실 엔도펩티다제, lysC, 리소좀 프로-X 카복시펩티다제, 리실 아미노펩티다제, 메티오닐 아미노펩티다제, 믹소박터, 나르딜리신, 췌장 엔도펩티다제 E, 피코르나인 2A, 피코르나인 3C, 프로엔도펩티다제, 프롤릴 아미노펩티다제, 프로단백질 전환효소 I, 프로단백질 전환효소 II, 루셀리신, 사카로펩신, 세메노젤라제, T-플라스미노겐 활성화제, 트롬빈, 조직 칼리크레인, 담배 에칭 바이러스(TEV), 토가비린, 트립토파닐 아미노펩티다제, U-플라스미노겐 활성화제, V8, 베놈빈 A, 베놈빈 AB 및 Xaa-프로 아미노펩티다제로 이루어진 그룹으로부터 선택된 프로테아제에 의해 인식되는 것들을 포함한다(참조: 본원에서 이의 전체가 참조로서 도입되는 미국 특허공개공보 제2015/0037868호). 일부 실시형태에서, 절단 부위는 프로테아제 절단 부위이다. 일부 실시형태에서, 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 또는 엔테로키나제(ETK) 절단 부위이다. 융합(키메라) 펩티드의 성분은 융합 펩티드 정제의 단계 전, 동안 또는 후에 절단 부위에서의 절단을 통해 분리(방출)할 수 있다. 예를 들면, 융합 단백질이 이종성 폴리펩티드 및 절단 부위에 융합된 FlgM 단백질을 포함하고 융합 펩티드가 배양 배지 내로 분비되는 경우, FlgM 단백질 및 폴리펩티드는 배양 배지로부터 정제 단계 전에 배양 배지에 대한 프로테아제의 적용에 의해 단리할 수 있거나, 융합 단백질은 배양 배지로부터 정제한 다음, 프로테아제를 융합 펩티드에 적용하여 폴리펩티드로부터 FlgM 단백질을 방출시킬 수 있다. 특정한 실시형태에서, 융합 단백질 분해(절단) 단계는 정제 단계와 동시에 수행된다. 예를 들면, 융합 단백질은 친화성 컬럼을 통과할 수 있고, 이종성 폴리펩티드 또는 정제 태그는 친화성 컬럼에 결합할 수 있고, 결합되는 동안, 절단제가 적용되어 절단 부위가 절단되고 융합 펩티드가 분해된다.

통상적인 바와 같이, 명칭 "NH₂" 또는 "N-"은 아미노산 서열의 N-말단을 지칭하고, 명칭 "COOH" 또는 "C-"는 아미노산 서열의 C-말단을 지칭한다.

개체에 적용되는 것으로 본원에 사용된 용어 "천연-존재", "천연" 또는 "야생형"은 개체가 자연에서 발견될 수 있다는 사실을 지칭한다. 예를 들면, 자연에서 공급원으로부터 단리될 수 있고 실험실 또는 다른 방법으로 인간에 의해 의도적으로 변형되지 않은 생물체(바이러스 포함)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 야생형이다.

본원에 사용된 바와 같은 "돌연변이"는 야생형 서열과 비교하여 뉴클레오티드 또는 아미노산의 변경을 지칭한다. 본원에서 돌연변이 또는 "변경"은 통상적으로, 교호, 그러나 동의 코돈을 제공하는 코딩 폴리뉴클레오티드 서열 내의 제조된 핵산 변화이다(즉, 코딩된 아미노산 잔기는 돌연변이의 결과로서 변화되지 않는다). 이러한 돌연변이체, 동의 코돈 최적화된 서열의 생성 및 동정은 본원에 추가로 기재된 바와 같다.

본원에 사용된 용어 "조절 서열"은, 이들이 결찰되는 코딩 서열의 발현 및 프로세싱을 수행하는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 용어 "조절 서열"은, 이의 존재가 발현 및 프로세싱에 필수적인 최소한 모든 성분을 포함하는 것으로 의도되고, 또한 이의 존재가 유리한 추가 성분, 예를 들면, 리더 서열 및 융합 파트너 서열을 포함할 수 있다. 조절 서열은 "전사 조절 요소(전사 조절 요소(TCE))"일 수 있고, 이의 성질은 숙주 생물체에 따라 상이하다. 당해 기술분야의 숙련가는 원핵생물에서 이러한 TCE가 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함하고, 진핵생물에서 일반적으로 이러한 TCE가 프로모터 및 전사 종결 서열을 포함한다는 것을 인식할 것이다. 조절 서열은 조절가능하거나(예를 들면, 유도가능한) 구성적일 수 있다.

본 발명에 따라, 임의의 프로모터가 사용될 수 있다. 프로모터는 통상적으로 코딩 서열의 상류(5') 뉴클레오티드 서열을 지칭하고, RNA 폴리머라제, 및 정확한 전사에 필요한 기타 인자의 인식을 제공함으로써 코딩 서열의 발현을 조절한다. 본 발명에 따라 사용된 프로모터는, 조절인자 요소가 발현 조절을 위해 부차되는 전사 개시 부위를 특정하는 최소 프로모터를 포함할 수 있다.

본원에 사용된 용어 "작동가능하게 연결된" 또는 "작동적으로 연결된"은, 성분이 이들의 의도된 방식으로 기능할 수 있도록 하는 관계에 있는 성분의 배치를 지칭한다. 당해 기술분야의 숙련가는 특정 상황하에 성분의 성질에 따라(예를 들면, 절단 부위 또는 정제 태그), 함께 "작동적으로 연결된" 2개 이상의 성분이 반드시 연속적으로 연결되거나 연속적으로 회합될 필요는 없다는 것을 인식할 것이다. 코딩 서열에 "작동적으로 연결된" 조절 서열은 코딩 서열의 발현이 조절 서열과 양립하는 조건하에 달성되는 방식으로 결찰된다. 2개 폴리뉴클레오티드 서열이 전사 조절 요소(TCE)(또는 하나 이상의 전사 조절 요소) 등의 조절 요소에 작동적으로 연결되는 것으로 언급되는 경우, 당해 기술분야의 숙련가는 다양한 구성이 기능적이고 포함된다는 것을 인식할 것이다. 예를 들면, 당해 기술분야의 숙련가는 적어도 모든 하기 구성이 포함된다는 것을 인식할 것이다: NH2-전사 조절 요소-제1 폴리뉴클레오티드 서열-제2 폴리뉴클레오티드 서열-COOH; NH2-전사 조절 요소-제2 폴리뉴클레오티드 서열-제1 폴리뉴클레오티드 서열-COOH; NH2-제1 전사 조절 요소-제1 폴리뉴클레오티드 서열-제2 전사 조절 요소-제2 폴리뉴클레오티드 서열-COOH; NH2-제2 전사 조절 요소-제2 폴리뉴클레오티드 서열-제1 전사 조절 요소-제1 폴리뉴클레오티드 서열-COOH; NH2-제1 전사 조절 요소-제2 폴리뉴클레오티드 서열-제2 전사 조절 요소-제1 폴리뉴클레오티드 서열-COOH; NH2-제2 전사 조절 요소-제1 폴리뉴클레오티드 서열-제1 전사 조절 요소-제2 폴리뉴클레오티드 서열- COOH; 및 이들의 조합. 추가로, 예를 들면, 돌연변이 트리아콘타뉴클레오티드 서열이 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열, 정제 태그를 코딩하는 핵산 서열 및 절단 부위에 작동적으로 연결되는 것으로 언급되는 경우, 당해 기술분야의 숙련가는 다양한 구성이 기능적이고 포함된다는 것을 인식할 것이다. 예를 들면, 당해 기술분야의 숙련가는 적어도 하기 구성이 포함된다는 것을 인식할 것이다(5'으로부터 3' 말단까지): 5'-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-3'; 5'-(정제 태그를 코딩하는 핵산 서열)-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-3'; 5'-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-(정제 태그를 코딩하는 핵산 서열)-3'; 및 이의 조합.

2개 핵산 서열 또는 2개 아미노산 서열 사이의 유사성은 "서열 동일성"으로 지칭된다. 서열 동일성은 퍼센트 동일성(또는 유사성)의 측면에서 빈번하게 측정되고; 퍼센트가 보다 높을수록 2개 서열은 더욱 유사하다. 인간 폴리펩티드의 동족체 또는 오르토로그 및 상응하는 cDNA 또는 유전자 서열(들)은, 표준 방법을 사용하여 정렬하는 경우, 비교적 고도의 서열 동일성을 보유할 것이다. 이러한 서열 동일성은, 오르토로거스 단백질 또는 유전자 또는 cDNA가, 보다 밀접하게 관련된 종(예: 인간 및 씨. 엘레간스(C. elegans) 서열)과 비교하여, 보다 밀접하게 관련되는 종(예: 인간 및 침팬지 서열)으로부터 유래하는 경우에 더욱 현저할 것이다.

비교를 위한 서열의 정렬 방법은 당해 기술분야에 공지되어 있다. 다양한 프로그램 및 정렬 알고리즘은 문헌[참조: Smith & Waterman Adv. Appl. Math. 2: 482, 1981; Needleman & Wunsch J. Mol. Biol. 48: 443, 1970; Pearson & Lipman Proc. Natl. Acad. Sci. USA 85: 2444, 1988; Higgins & Sharp Gene, 73: 237-244, 1988; Higgins & Sharp CABIOS 5: 151-153, 1989; Corpet et al. Nuc. Acids Res. 16, 10881-90, 1988; Huang et al. Computer Appls. in the Biosciences 8:155-65, 1992; and Pearson et al. Meth. Mol. Bio. 24:307-31, 1994. Altschul et al. J. Mol. Biol. 215:403-410, 1990]에 기재되어 있고, 서열 정렬 방법 및 상동성 계산에 대한 상세한 고려사항을 제시한다.

NCBI Basic Local Alignment Search Tool(BLAST)[참조: Altschul et al. J. Mol. Biol. 215:403-410, 1990]은, 서열 분석 프로그램 blastp, blastn, blastx, tblastn 및 tblastx와 관련하여 사용하기 위한, 생물정보를 위한 국립 센터(NCBI, Bethesda, Md.)를 포함하는 몇몇 공급원으로부터 및 인터넷 상에서 이용가능하다. 예를 들면, 약 30개 초과의 아미노산의 아미노산 서열 비교를 위해, Blast 2 서열 함수는 디펄트 파라미터로 설정한 디펄트 BLOSUM62 매트릭스를 사용하여 사용된다(11의 갭 존재 코스트, 및 1의 잔기 갭 비용당). 짧은 펩티드(30개 이하의 아미노산)을 정렬하는 경우, 정렬은, 디펄트 파라미터로 설정한 PAM30 매트릭스를 사용하는 Blast 2 서열 함수를 사용하여 수행한다(오픈 갭 9, 확장 갭 1 페널티).

2개의 핵산 분자가 밀접하게 관련되어 있는 또 다른 표시는 2개 분자가 엄격한 조건하에 서로 하이브리드화하는 것이다. 엄격한 조건은 서열 의존적이고, 상이한 환경적 파라미터하에 상이하다. 일반적으로, 엄격한 조건은 규정된 이온 강도 및 pH에서 특정 서열에 대해 열 융점(Tm)보다 약 5℃ 내지 20℃ 낮도록 선택된다. Tm은 50%의 표적 서열이 완전하게 매칭된 프로브 또는 상보성 가닥과 하이브리드화된 상태로 잔류하는 온도(규정된 이온 강도 및 pH하에)이다. 핵산 하이브리드화의 조건 및 엄격성의 계산은 문헌[참조:Sambrook et al. (In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989) and Tijssen (Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes Part I, Chapter 2, Elsevier, New York, 1993]에서 발견할 수 있다.

고도의 서열 동일성을 나타내지 않는 핵산 서열은, 그럼에도 불구하고, 유전자 코드의 축퇴로 인해, 유사한 아미노산 서열을 코딩한다. 핵산 서열의 변화는 모두 동일한 단백질을 실질적으로 코딩하는 복수 핵산 분자를 생성하기 위해 이러한 축퇴를 사용하여 이루어질 수 있는 것으로 이해된다.

문구 "번역에 대한 동의 코돈 및 코돈 컨텍스트 효과"는 약어 CEOT(codon effects on translation)을 사용하여 지칭할 수 있다.

본원에서 문구 "동의 코돈 돌연변이체"(SCM)은, 야생형 코딩 서열과 비교하여, 하나 이상의 동의 코돈을 포함하도록 돌연변이되어 있는 코돈 서열을 지칭한다. 문구 "SCM flgM"은, 돌연변이의 결과로서 돌연변이되고 하나 이상의 동의 코돈을 포함하는 flgM 코딩 서열을 지칭한다(즉, "SCM flgM"은 돌연변이 flgM 코딩 서열을 지칭한다). 본원에 사용된 바와 같이, "동의 코돈 돌연변이유발/변경"(SCA)는 수득되는 돌연변이/변경된 서열이 상응하는 조절 서열과 비교하여 하나 이상의 동의 코돈을 포함하도록 코딩 서열을 돌연변이(즉, 변경)시키는 단계를 지칭한다.

번역 속도를 검정하는 방법

본 발명은, 살모넬라(Salmonella)의 히스티딘 생합성(his) 오페론에서 전사 약독화로 불리우는 조절 메카니즘의 특성화 잇점을 취하는 번역 속도를 측정하는 검정법에 관한 것이다[참조: Chevance et al., PLOS Genetics 10(6):1-14 (2014)]. his 구조 유전자의 전사는 세포에서 하전된 히스티딜-tRNA의 수준에 의존적이고, mRNA 또는 리더 서열 펩티드 안정성과 독립적이다. his 오페론의 5'-영역은 7개 연속 His 코돈을 갖는 16개 아미노산 개방 판독 프레임을 갖는다. 하전된 His-tRNA 수준이 높으면, 약독화가 발생하고, RNA 폴리머라제가 his 오페론의 전사를 중단한다. 하전된 His-tRNA가 낮으면, 리보솜이 7개 His 코돈의 스트레치 내에 스톨하고, 약독화 메카니즘은 RNA 폴리머라제가 제한 His-tRNA에 반응하여 his 구조 유전자 내로 지속하도록 방해된다. 시스템은, 개개 코돈, 코돈 쌍, 삼중항 등을 통한 번역 속도를 측정하고 리보섬이 동일한 아미노산(소위 침묵 코돈 또는 동의 코돈)에 대해 상이한 코돈을 통해 얼마나 빨리 번역할 수 있는지를 측정하기 위해 개발되었다. 이러한 방식에서, 검정은 번역 속도, 및 하나 이상의 동의 코돈이 번역 속도에 어떻게 영향을 미치는지를 측정하기 위해 개발되었다.

예시적 시스템은 his 구조 유전자를, His 약독화를 위한 리포터로서 lac 오페론으로 치환함으로써 생성했다. lac 오페론 전사를 조절하는 his 약독화 시스템으로, 이러한 시스템은 색 지표 매질의 잇점을 취하여 약독화의 단순한 정량적 색-판독치를 제공할 수 있다. 콜로니-색 표현형에 기초하여, 약독화되거나 약독화되지 않은 his-lac 작제물의 수준을 측정한다. lac 오페론 리포터 시스템을 사용하여, 리더 펩티드의 His5 위치를 63개 코돈 모두로 치환하고, 리더 펩티드 영역에서 리보솜 스톨링 정도에 대한 개개 코돈의 효과를 측정했다(Id.). His5에서 코돈 변화에 기인하여 리보솜의 스톨링으로부터 발생된 탈-약독화의 수준을 측정했다. 정지 코돈(UAA, UAG 및 UGA)는 최고 수준의 탈-약독화를 나타냈고, 아르기닌 코돈 AGA 및 AGG는 높은 수준의 탈-약독화를 나타냈다(Id.). 단일 tRNA 종에 의해 판독되는 제3 위치 NNU 대 NNC를 비교하면, NNU의 번역은 NNC와 비교하여 높은 수준의 탈-약독화를 나타냈다(Id.). 이는, NNG가 단일 tRNA 종에 의해 동족 NNU보다 더욱 빠르게 번역되는 것을 나타내는 시험관내 연구와 일치한다.

번역 속도에 대한 코돈 컨텍스트의 효과를 측정하기 위해 이러한 번역 속도계 검정의 사용은 UCA 코돈으로 5' 및 3' 컨텍스트에서 각 코돈의 효과를 측정함으로써 추가로 증명되었다. UCA 코돈은, 하나의 필수 tRNA 종, SerT tRNA에 의해서만 번역되기 때문에 특히 유용하다. his 오페론 리더 펩티드 중의 His4-His5에 위치된 모든 UCA-NNN 및 NNN-UCA 코돈 쌍에 대한 Mac-Lac 지표 배지 상의 his-lac 발현을 측정했다. 64개 코돈 중의 22개는 코돈 컨텍스트 효과를 나타냈다. 달리 말하면, 번역 속도는 64개 코돈 중의 22개에 있어서 UCA-NNN 및 NNN-UCA 코돈 쌍에 대해 상이했다. 가장 현저한 컨텍스트 효과는 티로신 코돈으로 수득되었다. UCA-UAU 및 UCA-UAC 작제물은 정지 코돈에 의해 생성된 것들에 필적하는 탈-약독화 수준을 나타냈다. 그러나, 역 배향, UAU-UCA 및 UAC-UCA에서, 탈-약독화는 낮다. UCA-UAU 및 UCA-UAC 코돈 쌍은 낮은 속도로 번역되는 반면, 역 배향 UAU-UCA 및 UAC-UCA는 빠른 속도로 번역된다. CGU 코돈에 의한 코돈 컨텍스트 효과는 또한 현저하다. UCA-CGU 및 CGU-UCA 둘 다는 빠른 번역 속도를 나타내고, 여전히 His4-His-5 위치에서 CAU(His)-CGU는 매우 낮은 속도로 번역된다.

번역 속도를 조절하는 방법

세균은 상이한 구조 및 기능을 갖는 다양한 분비 시스템을 포함한다. 그람-음성 세균은, 예를 들면, 외부 및 내부 막 중의 하나 또는 둘 다에 걸쳐 있고 환경적 반응, 부착 또는 병원성 프로세스에서 중요한 역할을 담당하는 적어도 6개의 상이한 분비 시스템(유형 I-VI)를 포함한다[참조: Costa et al., Secretion systems in Gram-negative bacteria: structural and mechanistic insights, Nature Reviews, Microbiology 13:343-359 (2015)]. 편모 조립을 위해, 예를 들면, 세균은 분비 시스템(예: T3SS)을 사용할 수 있고, 편모 구조 및 조립에 요구되는 단백질은 세포질로부터 내보내고, 외부 막을 통과하고 성장 편모 구조를 통과한다.

살모넬라 엔테리카(Salmonella enterica) 편모는, 후크-기부 바디(HBB) 복합체로서 공지된 복잡한 모터 구조를 함유하고, 이는 세포 벽 및 막 내에 매립된다. HBB는, 세포 표면으로부터 약 10마이크론 연장하는 긴, 외부 필라멘트에 연결된다.최대 10,000 FliC 서브유닛을 포함하는 외부 필라멘트는 HBB로부터 연장한다. 각 필라멘트는 약 1%의 전체 세포 단백질을 나타낸다. 양성자 모티브는 모터-필라멘트의 회전에 동력을 제공하여, 액체 환경 및 표면에 걸쳐 세균을 추진시킨다. HBB는 또한, 구조의 중심 채널을 통해 기질의 분비를 지시하는 유형 III 분비 시스템을 함유한다. 서브유닛은, 이들이 자가 조립하는, 성장 세포기관의 선단으로 이동한다.

화학감작 시스템의 유전자를 포함하는 편모 레굴론에는 60개 이상의 유전자가 있다. 이들 유전자의 전사를 도 1에 제시된 바와 같이 편모 어셈블리에 결합된다. 편모 레굴론은 3개 프로모터 부류의 전사 계층으로 편성된다. 부류 1 오페론은 종종 마스터 오페론으로 불리우고, 전사 조절인자 FlhD 및 FlhC를 코딩한다. FlhD 및 FlhC 단백질은 복합체 FlhD₄C₂를 형성하고, 이는 편모 부류 2 프로모터로부터 σ⁷⁰ RNA 폴리머라제-의존성 전사를 지시한다. 부류 2 프로모터로부터 발현된 유전자는 HBB 복합체의 구조 및 조립으로부터 필요한 단백질을 코딩한다. HBB 유전자에 추가하여, 몇몇 조절 단백질은 부류 2 프로모터로부터 전사되고; 이들 중에서 현저한 것은 σ28 구조 유전자, FliA, 및 항-σ²⁸ 유전자, FlgM이다. σ²⁸및 FlgM은, 편모 부류 3 프로모터의 전사를 HBB의 완성에 결합시키는 조절 단백질이다. σ²⁸단백질은, 편모 부류 3 프로모터로부터 전사하기 위해 RNA 폴리머라제를 지시하는 편모-특이적 전사 인자이다. 부류 3 유전자는 편모 필라멘트의 구조 유전자, 및 변화하는 농도의 세포외 리간드에 따라 편모 회전의 방향을 조절하는 화학감작 신호 전달 시스템의 유전자를 포함한다.

HBB 조립 동안, 편모 유형 III 분비(T3S) 시스템은 로드-후크 분비 기질에 특이적이다. HBB 완료시, T3S 장치의 FlhB 성분은 형태 변화를 겪고, 분비 특이성은 후기 또는 필라멘트-형 분비로 전환된다. HBB 완료 전에, FlgM은 편모 부류 3 프로모터로부터 σ²⁸-의존성 전사를 억제한다. FlgM은 후기 분비 기질이고, HBB 완료 및 분비 특이성 전환시, FlgM은 세포로부터 분비되어, σ28을 방출하여 부류 3 프로모터로부터 전사한다.

FlgM 단백질은, 분비 프로세스 동안 절단되지 않은 이의 N-말단에서 분비 신호를 포함한다. T3SS를 통한 기질 분비는 종종 분비 장치로 기질의 샤프론-보조된 전달에 의해 촉진된다. 이러한 방식으로, FlgM 분비는 FlgM의 C-말단 절반에 대한 분비 샤프론 σ²⁸의 결합에 의해 크기 증강된다.

FlgM은 작은 T3S 기질이고 최종 편모 구조의 일부가 아니기 때문에, 주변세포질 또는 세포외 환경으로 외래 단백질의 분비를 지시하는 비히클로서 사용될 수 있다. 본 발명자들은 이종성 코딩 서열에 작동적으로 연결된 FlgM 폴리뉴클레오티드 서열이 다양한 생물체에서 발현될 수 있고 편모 T3S 시스템에 의해 분비될 수 있음을 밝혀냈다(참조: U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨). 구체적으로, 이종성 단백질에 융합된 FlgM 펩티드를 포함하는 키메라 단백질은 편모 T3SS 구조를 통해 배양 배지 내로 발현 및 분비된다(참조: U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨). 본 발명자들은, FlgM 융합 펩티드의 발현이 유도성 및/또는 과발현 조절 서열을 사용하여 조절될 수 있음을 추가로 밝혀냈고, 이는 배지 내의 염 농도(예: NaCl 및 KCl)에 의해 조작될 수 있으며, 융합 펩티드 또는 이의 성분은 다양한 수단을 사용하여 배지로부터 단리될 수 있다(Id.).

본원의 실시예는 배양 배지 내에서 키메라 단백질의 조절된 생성 및 분비를 위한 T3SS의 용도를 추가로 증명한다. 한 가지 실시형태에서, 폴리펩티드는 인슐린이다.

본원에 사용된 바와 같이, 용어 "인슐린"은, 동물 신체에서 탄수화물의 대사에 영향을 받고 진성 당뇨병의 치료에 유용한 췌장의 활성 원리를 의미한다. 이 용어는, 구조, 용도 및 의도된 효과에 있어서 천연 존재 인슐린과 동일하거나 유사하고 진성 당뇨병의 치료에 유용한 합성 및 생물공학 유래된 생성물을 포함한다.

용어 "인슐린" 또는 "인슐린 분자"는, 서열번호 1에 제시된 아미노산 서열을 갖는 A-쇄 펩티드 및 서열번호 2에 제시된 아미노산 서열을 갖는 B-쇄 펩티드를 포함하는 51개 아미노산 헤테로이량체를 지시하는 총칭이고, 여기서 A 쇄의 위치 6 및 11에서 시스테인 잔기는 디설파이드 결합으로 연결되고, A 쇄의 위치 7에서 및 B 쇄의 위치 7에서 시스테인 잔기는 디설파이드 결합으로 연결되고, A 쇄의 위치 20에서 및 B 쇄의 위치 19에서 시스테인 잔기는 디설파이드 결합으로 연결된다. 용어 "인슐린"은 또한 인슐린 분자의 전구체를 포함한다.

본원에 사용된 용어 "인슐린 유사체"는, 천연 A-쇄 펩티드 및/또는 B-쇄 펩티드의 하나 이상의 변형(들)을 포함하는 임의의 헤테로이량체 유사체를 포함한다. 변형은, 이로써 한정되지 않지만, A4, A5, A8, A9, A10, A12, A13, A14, A15, A16, A17, A18, A19, A21, B1, B2, B3, B4, B5, B9, B10, B13, B14, B15, B16, B17, B18, B20, B21, B22, B23, B26, B27, B28, B29 및 B30로부터 선택된 위치에서 천연 아미노산을 아미노산으로 치환시키는 것; 및/또는 위치 B1-4 및 B26-30 중의 어느 하나 또는 모두를 결실시키는 것을 포함한다. 인슐린 유사체는, A-쇄 펩티드 및/또는 B-쇄 펩티드의 N 또는 C 말단에서 1 내지 10개 아미노산을 갖는 분자를 포함한다. 인슐린 유사체는 A-쇄 펩티드 및/또는 B-쇄 펩티드의 C-말단에서 아미드화된 분자를 추가로 포함한다. 인슐린 유사체의 예는, 이로써 한정되지 않지만, 국제 출원 제WO20100080606호, 제WO2009/099763호 및 제WO2010080609호에 개시된 헤테로이량체 유사체를 포함하고, 이의 개시는 본원에서 참조로서 도입된다. 인슐린 글라르긴(Gly(A21), Arg(B31), Arg(B32)-인간 인슐린), 인슐린 리스프로(Lys(B28), Pro(B29)-인간 인슐린, 인슐린 글루실린(Lys(B3), Glu(B29)-인간 인슐린) 및 인슐린 디테미르(Lys-미리스트산(B29)-인간 인슐린)은 상업적으로 이용가능한 인슐린 유사체의 예이다.

용어 "인슐린 유사체"는, 인슐린 수용체에서 검출가능한 활성을 거의 또는 전혀 갖지 않지만, 천연 인슐린과 비교하여 인슐린 수용체에서 적어도 1%, 10%, 50%, 75% 또는 90%의 활성을 갖는 인슐린 수용체에서 활성을 갖도록 하나 이상의 아미노산 변형 또는 치환을 포함하도록 변형된 헤테로이량체 폴리펩티드 분자를 추가로 포함한다. 특정 측면에서, 인슐린 유사체는, 천연 인슐린과 동일하게 인슐린 수용체에서 2배 내지 100배 낮은 활성을 갖는 부분 효능제이다. 다른 측면에서, 인슐린 유사체는 인슐린 수용체에서 증강된 활성을 갖는다.

편모 분비 시스템 유전자 내의 동의 코돈 돌연변이를 사용하는 발현 시스템 및, 이러한 돌연변이 작동적으로 부가되는 경우, 이종성 폴리뉴클레오티드 번역을 조절하는 방법이 본원에 추가로 기재되어 있다. 본 발명의 동의 코돈 돌연변이유발은 숙주 세포(생물)의 코돈 사용(바이어스)에 의존하는 전통적 코돈 최적화와는 상이하다. 코돈 사용 바이어스는 특정 코돈이 특정 생물에 의해 사용되는 상대적 양에 의존한다. 당해 기술분야의 숙련가는 생물 사이에서, 아미노산에 대한 하나의 동의 코돈이 동일한 아미노산에 대한 다른 동의 코돈과 비교하여 더욱 보급되어 있음을 장기간 동안 인식하고 있다(즉, 생물은 특정 동의 코돈의 사용에 대해 "선호"하거나 "바이어스"를 갖는다). 다양한 생물은 상이한 동의 코돈을 선호할 수 있고, 또는 상이한 코돈 사용 바이어스를 갖는다.

에스케리키아 콜라이(Escherichia coli) 및 살모넬라 엔테리카(Salmonella enterica)에서 코돈 사용 빈도의 표는 하기에 제시되어 있다. 여기서, 보다 높은 사용 빈도 값은 동의 코돈에 대해 보다 큰 바이어스(선호)에 상응한다(WorldWideWeb.sci.sdsu.edu/~smaloy/MicrobialGenetics/topics/rev-sup/wobble.html, last visited November 15, 2015에서 이용가능함). 또한 코돈 바이어스 데이터베이스[참조: (WorldWideWeb.homepages.luc.edu/~cputonti/cbdb/genera/shigella.html) 및 Hilterbrand, et al. (CBDB: The codon bias database, BMC Bioinformatics 13(62):1-7 (2012)]를 참조한다.

이. 콜라이 및 에스. 티피무리움¹에서 코돈 선호

¹ 수는 이. 콜라이 및 에스. 티피무리움에서 약 450,000 유전자의 DNA 서열에 기초하여 1000 코돈당 코돈 사용의 평균 빈도를 나타낸다. 일부 추가 코돈 빈도는 밀러[참조: Miller(1992)]에서 발견할 수 있다.

일반적으로, 예를 들면, 숙주 세포 내의 이종성 폴리뉴클레오티드 서열의 발현을 위한 숙주 세포의 선호 동의 코돈의 존재는 번역 효율의 증가를 제공했다. 종래의 코돈 최적화 기술은, 번역 효율의 증가시키기 위해 숙주 세포의 선호 코돈이 존재하거나 번역 효율을 감소시키기 위해 부재하도록 코딩 서열을 돌연변이시킴으로써 코돈 사용 바이어스를 이용한다.

유전자 발현을 증가 또는 감소시키는, 살모넬라(Salmonella) 유형 III 분비 시스템의 fliA, fliC 및 flgM 유전자에서 동의 코돈 돌연변이가 단리되었다. fliA에 있어서, GAU로부터 GAC로의 동의 코돈 13(Asp) 변화는 생성된 σ²⁸ 단백질에서 약 2배 증가를 제공했다[참조: Barker, C. S., et al., Assembling Flagella in Salmonella Mutant Strains Producing a Type III Export Apparatus without FliO, J. Bacteriol. 196(23):4001-4011 (2014)]. 유사하게는, 살모넬라(Salmonella) T3SS의 fliC 유전자에 있어서, UUG로부터 CUG로의 동의 코돈 13(Leu) 변화는 약 1배 더 많은 FliC 단백질을 생성했고, 코돈 14(Thr)에서 ACC로부터 ACA 또는 ACG로의 동의 코돈 변화는 각각 약 2배 및 약 1.5배 더 많은 FliC 단백질을 생성했다[참조: Rosu, V., et al., Translation Inhibition of the Salmonella fliC Gene by the FliC 5' Untranslated Region, fliC Coding Sequences, and FlgM, J. Bacteriol. 188(12):4497-4507 (2006)].

예를 들면, 상기 표에 도시된 바와 같은 코돈 사용 바이어스에 기초하여, GAC(22)보다 ASP GAU 코돈(33)에 대한 살모넬라(Salmonella)의 선호는 놀랍게도 GAC 코돈을 사용한 단백질 생성에서 적어도 약 2배 증가시킨다[참조: Barker et al., supra]. 마찬가지로, ACA(6) 및 ACG(15) 코돈에 비해 Thr ACC 코돈(25)에 대한 선호는 놀랍게도 각각 ACA 및 ACG 코돈을 사용하는 단백질 생성에서 적어도 약 2배 및 1.5배 증가를 가져온다[참조: Rosu et al., supra].

실시예

세균 균주 및 배지

살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움 LT2의 통상 사용된 비-병원성 균주를 모든 실험을 위해 사용했다. LT2는, 이를 비병원성으로 되게 하는, ropS 및 mviA 유전자에서 돌연변이를 갖는다[참조: Yarus, Rates of aminoacyl-tRNA selection at 29 sense codons in vivo, J. Mol. Biol. 209: 65-77 (1989); Hughes & providing transposition functions to defective transposons, Genetics 119: 9-12 (1988); Johnston & Roth, Genetic analysis of the histidine operon control region of Salmonella typhimurium, J. Mol. Biol. 145: 713-734 (1981)]. mviA 유전자는 살모넬라(Salmonella) 병원성에 관여하는 2성분 시스템의 조절인자를 코딩한다. rpoS 유전자 생성물(정지상 시그마 전사 인자)은 복수의 병원성 인자의 발현에 요구된다. 살모넬라(Salmonella)의 병원성 경로 내의 2개 돌연변이는 병원성의 약독화를 제공한다.

세포는 루리아-베르타니(LB) 배지에서 배양하고, 필요한 경우, 암피실린(100 ㎍/밀리리터) 또는 테트라사이클린(15 ㎍/밀리리터)를 보충했다. 에스. 티피무리움 P22 HT105/1 int-201의 일반화된 형질도입 파지를 모든 형질도입 교배에 사용했다[참조: Johnston & Roth, DNA sequence changes of mutations altering attenuation control of the histidine operon of Salmonella typhimurium, J. Mol. Biol. 145: 735-756 (1981)].

균주 작제

표적화된 염색체 돌연변이유발은 문헌[참조: Datsenko and Wanner (One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products, PNAS 97: 6640- 6645 (2000)]에 기재된 바와 같이 tetRA 삽입 및 L-Red 리콤비나제 시스템으로의 치환을 통해 수행했다.

모든 프라이머는 인테그레이티드(Integrated) DNA 기술(Coralville, IA)에 의해 합성했다. 모든 PCR 반응은 프루프 판독 폴리머라제를 사용하여 수행했다[참조: Accuprime Pfx, Invitrogen or Phusion, Fermenta]. L-Red에 의해 매개된 재조합 생성물은 Taq DNA 폴리머라제를 사용하여 PCR-검사하고, 추가로 서열분석했다.

번역-최저속 코돈 쌍의 스크리닝

저속 쌍 또는 고속 쌍을 함유하는 균주는 상기 기재된 바와 같이 L-Red 재조합을 사용하여 작제했다. 전기천공 및 무수 테트라사이클린 플레이트 상에 플레이팅 후, 플레이트를 맥콘케이(MacConkey)-락토즈 및 테트라졸리움-락토즈 지시약 플레이트 상에 복제했다. 테트라졸륨 플레이트(Lac+) 상의 백색 콜로니를 단리하고 DNA 서열 분석을 위해 수송했다. T-N-N 코돈을 특이적으로 회피하여 정지 코돈의 단리를 방지했다. Tz-Lac 스크리닝을 사용하여 His 리더 시스템에서 번역-저속 및 번역-고속 코돈 쌍을 동정했다.

β-갈락토시다제 검정

30마이크로리터의 밤새 배양물을 3ml의 신선한 LB 배지에 계대배양했다. 튜브를 37℃에서 진탕하면서 내용물이 OD 0.4의 중간-대수-밀도에 도달할 때까지 배양했다. 배양물을 아이스 상에 놓고, 스펀 다운하고, 3ml의 냉-완충된 염수에 재현탁시켰다. 0.5ml의 배양 샘플(필요한 경우 희석시킴)을 0.55ml의 완전 Z-완충액(Z-완충액 + 5ml의 10% 나트륨 도데실 설페이트 및 100ml의 클로로포름)에 첨가했다[참조: Stanley R. Maloy, Experimental Techniques in Bacterial Genetics. (Jones and Bartlett Publishers, Inc. 1990)]. 검정은 상기 기재된 바와 같이 계속했다(Id.). 각 균주에 대해, 3개 독립적 생물학적 복제에 대해 검정을 실시했다.

질환 또는 상태와 연관된 코딩 서열에서 동의 코돈 쌍의 종정

질환 또는 상태와 연관된 폴리뉴클레오티드 서열(예: 코딩 서열) 내의 동의 코돈 돌연변이의 검색은, 예를 들면, 데이터베이스를 사용하여 수행한다. 동의 돌연변이는 임의의 추가 돌연변이(삽입 및 결실 포함)와 독립적이다. 동의 돌연변이는 양측에 인접하는 15개 염기 쌍 서열에 기초하여 해석된다. 폴리뉴클레오티드 서열의 발현(예를 들면, 코딩된 단백질의 발현)에 대해 동의 코돈 돌연변이가 갖는 효과는 동의 코돈 돌연변이된/변경된 (SCA) 폴리뉴클레오티드 서열을 숙주 세포 내로 도입하고 숙주 세포를 폴리뉴클레오티드 발현에 충분한 조건하에 배양함으로써 검증한다. 임의의 효과는 비교가능한 대조군 세포 내의 야생형 폴리뉴클레오티드 발현과 비교하여 결정한다. 수득된 단백질 생성은 SDS-PAGE 및 웨스턴 블롯에 의해 결정한다.

SDS-PAGE 및 웨스턴 블롯

FlgM(및 임의로 폴리-히스티딘 정제 태그)를 포함하는 발현된 키메라 단백질, 또는 동의 코돈 돌연변이된 폴리뉴클레오티드 서열로부터 발현된 폴리펩티드는 전체 세포 용해물 또는 배양 상청액으로부터 회수하고, SDS 폴리아크릴아미드 겔 전기영동에 적용한 다음, 폴리클로날 항-FlgM 항체, 모노클로날 항-6xHis(래빗) 항체, 또는 검출을 위한 항-폴리펩티드 항체를 사용한 면역블롯에 의해 분석했다. 항원-항체 복합체는 LI-COR 오디세이 또는 Bio-Rad ChemiDoc 영상화 시스템을 사용하여 화학발광 또는 적외선 검출에 의해 가시화한다. 화학발광 발색을 위해, 호세라디쉬 퍼옥시다제(HRP) 및 ECL 검출 키트(Amersham Biosciences)와 접합된 이차 염소 항-래빗 항체(Bio-Rad)가 사용된다. 적외선 검출을 위해, 이차 항-래빗 IRDye690(LI-COR)이 사용된다. 단백질 밴드의 농도 측정은 Mac OS X를 위한 ImageJ 1.45s를 사용하여 수행한다[참조: Abramoff et al., Image processing with ImageJ, Biophotonics Int. 11:36-42(2004)].

단백질 융합체의 재조합 발현 및 정제

최적화된 융합 단백질을 발현하는 세포는 신선한 단일 콜로니로부터 채취하고, 밤새 10ml LB에서 성장시켰다. 밤새 배양물을 배플 플라스크에서 1리터의 신선한 배지로 1:100 희석시키고, 6 내지 12시간 동안 200rpm으로 진탕 배양기에서 성장시킨다. 적절한 경우, 발현은 0.2% 아라비노즈 또는 Na-살리실레이트의 첨가에 의해 처음 2시간 후에 발현을 유도한다. 세포를 원심분리(7,000rpm)에 의해 펠렛화하고, 목적하는 재조합 폴리펩티드를 함유하는 상청액은 잔류 세균의 제거를 위해 0.22-㎛ 폴리에틸렌설폰 필터(Corning, NY), 저-분자-결합 막에 통과시킨다. 추가의 정제를 위해, 3g NiIDA 수지(Protino Ni-IDA; Machery-Nagel)가 충전된 중력 유동 컬럼(Bio-Rad)을 사용하고, 친화성-태그된 단백질을, 250mM 이미다졸을 함유하는 완충액으로 pH 7.5에서 음성 조건하에 용출시킨다.

분비 검정

밤새 배양물을 LB에서 1:100으로 희석시키고, 37℃에서 2시간 동안 성장시킨 다음, 0.2% L-아라비노즈를 첨가하여 각각의 FlgM 융합체의 발현을 유도한다. 세포를 추가로 4 내지 12시간 동안 37℃에서 유지하면서, 융합 단백질을 발현시킨다. 이어서, 600nm에서의 광학 밀도(OD₆₀₀)를 모든 균주에 대해 측정한다.

수득된 세포 배양물의 2-밀리리터 분액을 4℃ 및 7,000rpm에서 10분 동안 원심분리하여, 각각의 분액에 대해, 펠렛 및 상청액을 수득한다. 상청액을 0.2㎛ 기공 크기(Acrodisk 시린지 필터; Pall Life Sciences)로 저-단백질-결합 필터를 통해 여과하여 잔류하는 세포를 제거한다. 또는, 분액을 최대 속도로 2회 원심분리하여 잔류 세포를 제거한다. 여과된 또는 2회-원심분리된 상청액 중의 분비된 단백질은 TCA(10% 최종 농도)의 첨가에 의해 침전시킨다. 상청액 샘플을 2μL SDS 샘플 완충액(100mM 트리스[pH 6.8], 4% SDS, 10% 글리세롤, 2% B-머캅토에탄올, 25mM EDTA, 0.04% 브로모페놀 블루)에 재현탁시키고, 20 OD₆₀₀ 단위/μ로 조정한다. 세포 펠렛 분획을 2% SDS 샘플 완충액에 현탁시키고, 이의 용적을 조정하여 20 OD₆₀₀ 단위/μ를 수득한다.

실시예 1: 번역에 대한 동의 코돈 돌연변이체의 효과

편모 항-σ²⁸ 유전자의 아미노산 Ser7에 대해 UCA를 번역하는 것에 결함이 있는 SerT tRNA의 대립유전자, flgM를 단리했다[참조: Chevance, F. F., et al., J Bacteriol 188:297-304 (2006)]. 살모넬라(Salmonella) 편모 시스템에서 세린에 대한 UCA 코돈을 갖는 다수의 유전자가 존재함에도 불구하고, serT tRNA 대립유전자만이 flgM 번역에 영향을 미쳤다. 이론에 국한시키고자 하는 것은 아니지만, flgM의 UCA(Ser7) 코돈의 번역에 대한 serT 돌연변이 대립유전자의 효과는 코돈-컨텍스트 효과인 것으로 생각된다.

σ²⁸-의존성 프로모터로부터의 전사는 FlgM에 의해 억제된다. 리포터로서 세균 루시퍼라제 오페론(lux)를 사용하여, FlgM의 항-σ²⁸활성을 측정했다. FlgM 활성이 높은 경우, P _motA -lux의 σ²⁸-의존성 전사는 낮다. 동의 돌연변이를 위치 Ser7에 인접하게 도입하고, flgM mRNA 번역에 대한 인접 동의 돌연변이의 효과를 측정했다.

flgM의 UCA Ser7에 인접하는 Thr6 및 Pro8 코돈의 동의 변화의 모든 16개 조합을 제조했다. σ²⁸-의존성 P _motA -lux 전사의 FlgM 억제를 측정했다. 결과는 도 2에 제시되어 있다.

ACU, ACA 또는 ACG에 대한 Thr6에서의 동의 변화는 FlgM 억제 활성의 약 11 내지 13배 증가를 생성한다. CCU에서 CCG로의 동의 Pro8 코돈 변화는 FlgM 억제 활성의 약 20배 감소를 제공한다. Thr6에서 ACC에서 ACU로의 변화와 Pro8에서 CCU에서 CCG로의 변화와의 조합은 FlgM 억제 활성의 약 34배 증가를 제공한다. 이들 결과는 코돈 번역의 효율이 최대 2개의 인접한 코돈에 의해 영향을 받는 것을 입증한다(도 2 참조).

실시예 2: FlgM 의 동의 유전자돌연변이유발을 사용한 폴리뉴클레오티드의 조절

Pro8에서 CCU에서 CCG로의 변화를 포함하는 flgM 서열로 출발하여, 아미노산 2 내지 25를 코딩하는 flgM 유전자의 영역은, 평균적으로, 각각의 올리고뉴클레오티드가 아미노산 2 내지 25에 대해 동의 코돈 변화를 갖도록 설계된 도핑된 올리고뉴클레오티드 돌연변이유발을 사용하여 변형시켰다. 결과는 도 3에 제시된 바와 같다.

Pro8 이전의 2개 코돈 및 Pro9 CCG 이후의 Leu9 코돈에서 동의 변화만이 야생형 GlgM 억제 활성으로의 회복을 제공했다. 이들 결과는 특정 코돈의 번역 효율이 인접하는 2개 코돈에 의존하는 것을 입증한다.

FlgM의 아미노산 Thr6-Ser7-Pro8-Leu9를 코딩하는 동의 변화는 FlgM 단백질 수준에서 약 2배 범위를 제공한다. 그러나, FlgM은 σ²⁸-의존성 fliC 전사를 억제하는 조절 단백질이기 때문에, FlgM 단백질 수준에서 약 2배 범위는 fliC 전사 활성에서 약 1000배 이상 범위를 생성한다. 예를 들면, CCU로부터 CCG(프롤린을 코딩)로 flgM의 코돈 8에서 동의 코돈 변화는 약 2배 더 낮은 FlgM 단백질 수준을 제공했다. FlgM 단백질 수준에서 약 20배 감소는 σ28-의존성 fliC 프로모터의 전사에서 약 20배 증가를 제공했다.

실시예 3: FlgM의 동의 돌연변이유발을 사용한 이종성 폴리뉴클레오티드 번역의 조절

lacZ의 최초 10개 코돈을 flgM의 최초 10개 코돈으로 치환했고, flgM 서열은 Pro8에서 CCU에서 CCG로의 동의 코돈 변화를 포함하도록 돌연변이시켰다(5'에서 3' 방향으로, 프롤린을 코딩하는 flgM의 코돈 수 8). 상기 결과와 일치하게, 컨텍스트-코돈-최적화된 flgM 서열의 조절하에 이종성 lacZ 서열의 발현은 감소된 β-갈락토시다제 활성을 제공했다. β-갈락토시다제 활성은 약 210에서 150단위로 감소했다.

이들 결과는, 폴리펩티드(여기서는 lacz)를 코딩하는 폴리뉴클레오티드 서열이 컨텍스트-코돈-최적화된 FlgM 서열(SCM FlgM)에 작동적으로 연결되고 발현되어 세균 분비 시스템(여기서는 조작된 T3SS)를 통해 분비되는 경우, FlgM의 하나 이상의 Thr6-Ser7-Pro8-Leu9에서 동의 변화가 이종성 단백질 생성(여기서는 LacZ)을 초래한다는 것을 입증한다.

본 발명의 분비 시스템을 사용하여 재조합에 의해 생성될 수 있는 예시적 폴리펩티드는 하기 표 1에 수록되어 있다.

단백질	예시적 서열 정보
인슐린(인간)	A 쇄: GIVEQCCTSICSLYQLENYCN B 쇄: FVNQHLCGSHLVEALYLVCGERGFFYTPKT
인슐린 글라르긴(인간)	A 쇄: GIVEQCCTSICSLYQLENYCG B 쇄: FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR
인슐린 프리-프로인슐린(인간)	UniProtKB 수탁 번호 P01308 및 GenBank 수탁 번호 CAA49913 참조[Chekhranova et al., Mol. Biol. 26(3): 596-600 (1992)]: MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAED LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 예시적 mRNA 서열은 GenBank 수탁 번호 X70508 [Chekhranova et al., Mol. Biol. 26(3): 596-600 (1992)]에서 이용가능하다.
인슐린 리소프로	A 쇄: GIVEQCCTSICSLYQLENYCN B chain: FVNQHLCGSHLVEALYLVCGERGFFYTKPT
MaSp1 (주요 앰풀레이트 스피드로인 1; 거미 실크 단백질) (예를 들면, 네필라(Nephila) 거미로부터 MaSp1A 또는 MaSp1B 포함)	Gaines and Marcotte, Insect Mol. Biol. 17(5): 465-474 (2008); US 특허 제8,642,734호(이의 전체가 본원에서 참조로서 도입됨); US 특허 제7,521,228호(이의 전체가 본원에서 참조로서 도입됨); US PG PUB NO. 제2014/0093965호(이의 전체가 본원에서 참조로서 도입됨).
MaSp2 (주요 앰풀레이트 스피드로인 2; 거미 실크 단백질)	US 특허 제8,642,734호(이의 전체가 본원에서 참조로서 도입됨); US 특허 제7,521,228호(이의 전체가 본원에서 참조로서 도입됨); US PG PUB NO. 제2014/0093965호(이의 전체가 본원에서 참조로서 도입됨)..

실시예 4: α T3SS 를 사용한 이종성 단백질 생성의 조절

인간 인슐린 글라르긴 핵산 서열, 폴리-히스티딘 뉴클레오티드 서열, 엔테로키나제 절단 부위 및 ParaBAD 프로모터에 작동적으로 연결된 전장 야생형 FlgM 폴리뉴클레오티드 서열을 포함하는 핵산 분자를 살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움(Typhimurium) 세포에 도입하고 발현시켰다. 살모넬라(Salmonella) 세포를 본 발명자에 의해 이전에 기재된 몇몇 T3S 유전자 내에서 변형시키고(U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨), 구체적으로 하기를 포함했다: ParaBAD 1::flgM-His6-ETK-인슐린 글라르긴 ΔflgMN7753 ΔflgKL7770 PflhDC7793 fliA*5225 ΔfliB-T7771 fljB _enx vh2(균주 TS1으로 지칭됨). FlgM::인슐린 키메라 단백질은 세포에 의해 분비되었고, 항-6xHis 항체를 사용한 웨스턴 블롯에 의해 검출되었다. 결과는 도 4에 제시되어 있다.

실시예 5: T3SS 및 동의 돌연변이유발을 사용한 이종성 단백질 생성의 조절

조작된 살모넬라(Salmonella) T3SS로부터 인간 인슐린의 분비는, 폴리-히스티딘 정제 태그 핵산 서열, 절단 부위(예: 엔테로키나제 절단 부위), 및 인간 인슐린의 A 및 B 쇄를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되는 FlgM 뉴클레오티드 서열(야생형 또는 동의 코돈 돌연변이된 FlgM 서열)을 살모넬라(Salmonella) 세포 내에 도입하여 발현시킴으로써 추가로 최적화시킬 수 있고, 여기서 인간 인슐린 B 쇄 서열은 동의 코돈 돌연변이를 포함한다. 예를 들면, 인간 인슐린 B 쇄 내의 2개 인접한 아르기닌 잔기를 컨텍스트 코돈 최적화시켜 인슐린 발현 및 T3SS를 통한 분비를 증가시킬 수 있다. 특히, 야생형 인접한 아르기닌 코돈 CGC 및 CGG(5'에서 3' 방향으로)은 CGU 및 CGU; CGU 및 CGC; CGC 및 CGU; CGC 및 CGC; 또는 CGG 및 CGC로 돌연변이시킬 수 있다. N-말단에서 C-말단 방향으로, 폴리-히스티딘 정제 태그, 절단 부위 및 인간 인슐린을 코딩하는 핵산 서열을 포함하는 예시적 작제물은 서열번호 16에 제공되어 있다. 서열번호 16에 의해 제공된 서열은 본원의 다른 곳 및 본 발명자들에 의해 U.S. PG PUB NO. 제2015/0225466호(이의 전체가 본원에서 참조로서 도입됨)에 기재된 FlgM 서열에 부착될 수 있다. 동의 코돈 최적화된 아르기닌 코돈의 수득되는 쌍은 증가된 인간 인슐린 발현 및 분비를 유발할 것으로 예상된다. FlgM, 폴리-히스티딘 정제 태그, 절단 부위 및 인슐린을 포함하는 키메라 단백질은 상기 기재된 바와 같이 검출하고 정제할 수 있다. 인슐린 단백질은 상기 기재된 바와 같이 키메라 단백질로부터 단리할 수 있다.

서열 식별자	서열 기재	서열 (5'에서 3' 방향으로 또는 N-말단에서 C-말단 방향으로 기재됨)
1	야생형 FlgM 단백질의 최초 10개 아미노산 잔기(서열번호 3의 최초 10개 잔기에 상응).	MSIDRTSPLK
2	야생형 FlgM mRNA 서열의 최초 10개 코돈(즉, 30 뉴클레오티드)	ATGAGCATTGACCGTACCTCACCTTTGAAA
3	전장 97 잔기 야생형 FlgM 아미노산 서열[Gillen and Hughes, J. Bacteriology 173(20): 6453-6459 (1991); 예를 들면, GenBank 수탁 번호 AAA27075 및 UniProtKB 수탁 번호 P26477로 공개적으로 이용가능]. 밑줄친 최초 10개 잔기(즉, 서열번호 1).	MSIDRTSPLKPVSTVQTRETSDTPVQKTRQEKTSAATSASVTLSDAQAKLMQPGVSDINMERVEALKTAIRNGELKMDTGKIADSLIREAQSYLQSK
4	야생형 FlgM 유전자 서열[Gillen and Hughes, J. Bacteriology 173(20): 6453-6459 (1991); 예를 들면, GenBank 수탁 번호 M74222에서 공개적으로 이용가능]. 밑줄친 코딩 영역(즉, 서열번호 5). 볼드체의 이의 최초 10개 코돈(즉, 서열번호 2).	AATATTCTTATTAACCTATAATTGTGTAAAGATTTTGTCGCGGCTGCCGATGAGATATTCAACCATGATGGTAGCTGGCCGCTACAACGTAACCCTCGATGAGGATAAATAA ATGAGCATTGACCGTACCTCACCTTTGA AA CCCGTTAGCACTGTCCAGACGCGCGAAACCAGCGACACGCCGGTACAAAAAACGCGTCAGGAAAAAAC GTCCGCCGCGACGAGCGCCAGCGTAACGTTAAGCGACGCGCAAGCGAAGCTCATGCAGCCAGGCGTCAGC GACATTAATATGGAACGCGTCGAAGCATTAAAAACGGCTATCCGTAACGGTGAGTTAAAAATGGATACGG GAAAAATAGCAGACTCGCTCATTCGCGAGGCGCAGAGCTACTTACAGAGTAAATAAGCGTATGACTCGTT TGTCAGAAATACTTGACCAGATGACCACCGTCCTGAATGACCTGAAGACGGTGATGGACGCCGAGCAACA ACAGCTTTCCGTAGGCCAGATTAACGGCAGCCAGCTACAGCGTATTACAGAAGAAAAAAGCTCGTTGCTG GCGACGCTGGATTATCTGGAACAACAGCGCCGTCTGGAGCAGAATGC
5	전장 야생형 FlgM 코딩 영역 및 정지 코돈(서열번호 4의 뉴클레오티드 113 내지 406에 상응, 밑줄친 정지 코돈).	atgagcattgaccgtacctcacctttgaaacccgttagcactgtccagacgcgcgaaaccagcgacacgccggtacaaaaaacgcgtcaggaaaaaacgtccgccgcgacgagcgccagcgtaacgttaagcgacgcgcaagcgaagctcatgcagccaggcgtcagcGacattaatatggaacgcgtcgaagcattaaaaacggctatccgtaacggtgagttaaaaatggatacgggaaaaatagcagactcgctcattcgcgaggcgcagagctacttacagagtaaataa
6	전장 야생형 FlgM mRNA(볼드체의 최초 10개 코돈(즉, 서열번호 2에 상응하는 mRNA 서열), 밑줄친 정지 코돈).	AUGAGCAUUGACCGUACCUCACCUUUGAAACCCGUUAGCACUGUCCAGACGCGCGAAACCAGCGACACGCCGGUACAAAAAACGCGUCAGGAAAAAACGUCCGCCGCGACGAGCGCCAGCGUAACGUUAAGCGACGCGCAAGCGAAGCUCAUGCAGCCAGGCGUCAGCGACAUUAAUAUGGAACGCGUCGAAGCAUUAAAAACGGCUAUCCGUAACGGUGAGUUAAAAAUGGAUACGGGAAAAAUAGCAGACUCGCUCAUUCGCGAGGCGCAGAGCUACUUACAGAGUAAAUAA
7	AGCSer2AGT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGTATTGACCGTACCTCACCTTTGAAA
8	ACCThr6ACA 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACATCACCTTTGAAA
9	ACCThr6ACG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACGTCACCTTTGAAA
10	ACCThr6ACT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACTTCACCTTTGAAA
11	TCASer7TCG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACCTCGCCTTTGAAA
12	TCASer7TCC 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACCTCCCCTTTGAAA
13	TCASer7TCT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACCTCTCCTTTGAAA
14	CCTPro8CCG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACCTCACCGTTGAAA
15	TTGLeu9TTA 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이.	ATGAGCATTGACCGTACCTCACCTTTAAAA
16	폴리-히스티딘 정제 태그 서열(볼드체), 절단 부위(밑줄) 및 프리-프로 인슐린 서열(볼드체 및 밑줄의 B 쇄 및 볼드체 및 이중 밑줄의 A 쇄)를 포함하는 인간 인슐린 글라르긴 작제물.	ATG CAT CAT CAT CAT CAT CAT GGT GGC CGC TTT GTG AAC CAA CAC CTG TGC GGC TCA CAC CTG GTG GAA GCT CTC TAC CTA GTG TGC GGG GAA CGA GGC TTC TTC TAC ACA CCC AAG ACC 　CGC CGG GAG GCA GAG GAC CTG CAG GTG GGG CAG GTG GAG CTG GGC GGG GGC CCT GGT GCA　　 GGC AGC CTG CAG CCC TTG GCC CTG GAG GGG TCT CTG CAG GCG CGT GGC ATT GTG GAA CAA　　 TGC TGT ACC AGC ATC TGC TCC CTC TAC CAG CTG GAG AAC TAC TGC GGC TAG

요약 및 요약 섹션이 아닌 상세한 설명 섹션은 특허청구범위를 해석하기 위해 사용되는 것이 의도되는 것을 이해해야 한다. 요약 및 요약 섹션은 본 발명자(들)에 의해 검토되는 바와 같이, 본 발명의 하나 이상, 그너나 전부는 아닌 예시적 실시형태를 기재하고, 따라서 어떠한 방식으로도 본 발명 및 첨부된 특허청구범위를 한정하는 것은 아니다. 본원에서 인용된 모든 특허, 특허 출원 및 참조문헌은 이들의 전체가 참조로서 도입된다.

본 발명은 특정의 기능의 실시 및 이의 관계를 설명하는 기능적 구성 블록의 도움으로 상기 기재되었다. 이들 기능적 구성 블록의 경계는 설명의 편의를 위해 본원에서 임의로 정의되어 있다. 특정한 기능 및 이의 관계가 적절하게 실시되는 한, 대체 경계를 정의할 수 있다.

SEQUENCE LISTING <110> UNIVERSITY OF UTAH RESEARCH FOUNDATION <120> COMPOSITIONS FOR ADJUSTABLE RIBOSOME TRANSLATION SPEED AND METHODS OF USE <130> IPA180500-US <140> PCT/US2016/055162 <141> 2016-10-03 <150> 62/236,477 <151> 2015-10-02 <150> 62/263,404 <151> 2015-12-04 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 10 <212> PRT <213> Salmonella typhimurium <400> 1 Met Ser Ile Asp Arg Thr Ser Pro Leu Lys 1 5 10 <210> 2 <211> 30 <212> DNA <213> Salmonella typhimurium <400> 2 atgagcattg accgtacctc acctttgaaa 30 <210> 3 <211> 97 <212> PRT <213> Salmonella typhimurium <400> 3 Met Ser Ile Asp Arg Thr Ser Pro Leu Lys Pro Val Ser Thr Val Gln 1 5 10 15 Thr Arg Glu Thr Ser Asp Thr Pro Val Gln Lys Thr Arg Gln Glu Lys 20 25 30 Thr Ser Ala Ala Thr Ser Ala Ser Val Thr Leu Ser Asp Ala Gln Ala 35 40 45 Lys Leu Met Gln Pro Gly Val Ser Asp Ile Asn Met Glu Arg Val Glu 50 55 60 Ala Leu Lys Thr Ala Ile Arg Asn Gly Glu Leu Lys Met Asp Thr Gly 65 70 75 80 Lys Ile Ala Asp Ser Leu Ile Arg Glu Ala Gln Ser Tyr Leu Gln Ser 85 90 95 Lys <210> 4 <211> 607 <212> DNA <213> Salmonella typhimurium <400> 4 aatattctta ttaacctata attgtgtaaa gattttgtcg cggctgccga tgagatattc 60 aaccatgatg gtagctggcc gctacaacgt aaccctcgat gaggataaat aaatgagcat 120 tgaccgtacc tcacctttga aacccgttag cactgtccag acgcgcgaaa ccagcgacac 180 gccggtacaa aaaacgcgtc aggaaaaaac gtccgccgcg acgagcgcca gcgtaacgtt 240 aagcgacgcg caagcgaagc tcatgcagcc aggcgtcagc gacattaata tggaacgcgt 300 cgaagcatta aaaacggcta tccgtaacgg tgagttaaaa atggatacgg gaaaaatagc 360 agactcgctc attcgcgagg cgcagagcta cttacagagt aaataagcgt atgactcgtt 420 tgtcagaaat acttgaccag atgaccaccg tcctgaatga cctgaagacg gtgatggacg 480 ccgagcaaca acagctttcc gtaggccaga ttaacggcag ccagctacag cgtattacag 540 aagaaaaaag ctcgttgctg gcgacgctgg attatctgga acaacagcgc cgtctggagc 600 agaatgc 607 <210> 5 <211> 294 <212> DNA <213> Salmonella typhimurium <400> 5 atgagcattg accgtacctc acctttgaaa cccgttagca ctgtccagac gcgcgaaacc 60 agcgacacgc cggtacaaaa aacgcgtcag gaaaaaacgt ccgccgcgac gagcgccagc 120 gtaacgttaa gcgacgcgca agcgaagctc atgcagccag gcgtcagcga cattaatatg 180 gaacgcgtcg aagcattaaa aacggctatc cgtaacggtg agttaaaaat ggatacggga 240 aaaatagcag actcgctcat tcgcgaggcg cagagctact tacagagtaa ataa 294 <210> 6 <211> 294 <212> RNA <213> Salmonella typhimurium <400> 6 augagcauug accguaccuc accuuugaaa cccguuagca cuguccagac gcgcgaaacc 60 agcgacacgc cgguacaaaa aacgcgucag gaaaaaacgu ccgccgcgac gagcgccagc 120 guaacguuaa gcgacgcgca agcgaagcuc augcagccag gcgucagcga cauuaauaug 180 gaacgcgucg aagcauuaaa aacggcuauc cguaacggug aguuaaaaau ggauacggga 240 aaaauagcag acucgcucau ucgcgaggcg cagagcuacu uacagaguaa auaa 294 <210> 7 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> AGCSer2AGT synonymous codon mutant triacontanucleotide flgM sequence <400> 7 atgagtattg accgtacctc acctttgaaa 30 <210> 8 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ACCThr6ACA synonymous codon mutant triacontanucleotide flgM sequence <400> 8 atgagcattg accgtacatc acctttgaaa 30 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ACCThr6ACG synonymous codon mutant triacontanucleotide flgM sequence <400> 9 atgagcattg accgtacgtc acctttgaaa 30 <210> 10 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ACCThr6ACT synonymous codon mutant triacontanucleotide <400> 10 atgagcattg accgtacttc acctttgaaa 30 <210> 11 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> TCASer7TCG synonymous codon mutant triacontanucleotide flgM sequence <400> 11 atgagcattg accgtacctc gcctttgaaa 30 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> TCASer7TCC synonymous codon mutant triacontanucleotide flgM sequence <400> 12 atgagcattg accgtacctc ccctttgaaa 30 <210> 13 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> TCASer7TCT synonymous codon mutant triacontanucleotide flgM sequence <400> 13 atgagcattg accgtacctc tcctttgaaa 30 <210> 14 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> CCTPro8CCG synonymous codon mutant triacontanucleotide flgM sequence <400> 14 atgagcattg accgtacctc accgttgaaa 30 <210> 15 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> TTGLeu9TTA synonymous codon mutant triacontanucleotide flgM sequence <400> 15 atgagcattg accgtacctc acctttaaaa 30 <210> 16 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> Human insulin glargine construct <400> 16 atgcatcatc atcatcatca tggtggccgc tttgtgaacc aacacctgtg cggctcacac 60 ctggtggaag ctctctacct agtgtgcggg gaacgaggct tcttctacac acccaagacc 120 cgccgggagg cagaggacct gcaggtgggg caggtggagc tgggcggggg ccctggtgca 180 ggcagcctgc agcccttggc cctggagggg tctctgcagg cgcgtggcat tgtggaacaa 240 tgctgtacca gcatctgctc cctctaccag ctggagaact actgcggcta g 291 <210> 17 <211> 21 <212> PRT <213> Homo sapiens <400> 17 Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu 1 5 10 15 Glu Asn Tyr Cys Asn 20 <210> 18 <211> 30 <212> PRT <213> Homo sapiens <400> 18 Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 <210> 19 <211> 21 <212> PRT <213> Homo sapiens <400> 19 Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu 1 5 10 15 Glu Asn Tyr Cys Gly 20 <210> 20 <211> 32 <212> PRT <213> Homo sapiens <400> 20 Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg 20 25 30 <210> 21 <211> 110 <212> PRT <213> Homo sapiens <400> 21 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15 Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly 20 25 30 Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45 Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly 50 55 60 Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu 65 70 75 80 Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys 85 90 95 Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 22 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Insulin lisopro A chain <400> 22 Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu 1 5 10 15 Glu Asn Tyr Cys Asn 20 <210> 23 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Insulin lisopro B chain <400> 23 Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr 1 5 10 15 Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr 20 25 30

Claims

적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 하나 이상이 동의 코돈(synonymous codons)인, 재조합 핵산 분자.
적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열로 이루어진 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8 및 제9 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자.
제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 아미노산 서열 NH₂-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는, 재조합 분자.
제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이, 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결되는, 재조합 분자.
제4항에 있어서, 상기 목적하는 폴리펩티드가 표 1에 수록된 폴리펩티드로부터 선택되는, 재조합 분자.
제4항에 있어서, 상기 목적하는 폴리페티드가 인슐린, 거미 실크 단백질 MaSp1, 또는 거미 실크 단백질 MaSp2인, 재조합 분자.
제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 5'에서 3' 방향으로 폴리뉴클레오티드 서열에 작동적으로 연결되는, 재조합 분자.
제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 폴리뉴클레오티드 서열의 아미노-말단 최다 코돈을 치환하고, 상기 이종성 폴리뉴클레오티드 서열이 목적하는 폴리펩티드를 코딩하는, 재조합 분자.
제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 서열번호 3을 코딩하는, 재조합 분자.
제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 리보핵산 서열인, 재조합 분자.
제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 데옥시리보핵산 서열인, 재조합 분자.
제1항 또는 제4항에 있어서, 상기 폴리뉴클레오티드 서열이 리보핵산 서열인, 재조합 분자.
제1항 또는 제4항에 있어서, 상기 폴리뉴클레오티드 서열이 데옥시리보핵산 서열인, 재조합 분자.
제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 합성 서열인, 재조합 분자.
제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열 중의 하나 또는 둘 모두가 합성 서열인, 재조합 분자.
제1항에 있어서, 5'에서 3' 방향으로 제6 및 제8 코돈이 동의 코돈인, 재조합 분자.
제1항 내지 제16항 중의 어느 한 항의 재조합 분자를 포함하는 벡터.
제17항에 있어서, 상기 벡터가 발현 벡터이고, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열이 이종성 프로모터에 작동적으로 연결되는, 벡터.
제18항에 있어서, 상기 이종성 프로모터가 유도성 프로모터, 구성적 프로모터, 또는 조직 특이적 프로모터인, 벡터.
제19항에 있어서, 상기 유도성 프로모터가 ParaBAD 또는 Psal 프로모터인, 벡터.
제1항 내지 제16항 중의 어느 한 항의 재조합 분자를 포함하는 숙주 세포.
제21항에 있어서, 상기 폴리뉴클레오티드 서열이, 숙주 세포 내에서의 발현을 위해 코돈 최적화되어 있는, 숙주 세포.
제21항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
제23항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
제17항 내지 제19항 중의 어느 한 항의 벡터를 포함하는 숙주 세포.
제25항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
제26항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
서열 5'-AUGAGCAUUGACCGUACCUCACCUUUGAAA-3'(서열번호 2)를 포함하는, 조절된 번역 속도를 갖는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자.
제28항에 있어서, 상기 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는, 재조합 분자.
제28항에 있어서, 상기 제6 코돈이 동의 코돈이고, 상기 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 9 내지 15배 증가를 갖는, 재조합 분자.
제28항에 있어서, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 감소된 번역 속도를 갖는, 재조합 분자.
제28항에 있어서, 상기 제8 코돈이 동의 코돈이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.03 내지 0.07배 감소를 갖는, 재조합 분자.
제28항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는, 재조합 분자.
제28항에 있어서, 상기 제6 코돈이 동의 코돈이고, 상기 제8 코돈이 동의 코돈이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 27.5 내지 40.5배 증가를 갖는, 재조합 분자.
목적하는 폴리펩티드를 코딩하는 핵산 서열에 작동적으로 연결된 제28항 내지 제34항 중의 어느 한 항의 재조합 분자를 포함하는 단리된 폴리뉴클레오티드.
제28항 내지 제35항 중의 어느 한 항의 재조합 분자 또는 폴리뉴클레오티드를 포함하는, 벡터.
제28항 내지 제35항 중의 어느 한 항의 재조합 분자 또는 폴리뉴클레오티드를 포함하는 숙주 세포.
제37항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
제37항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
숙주 세포 내의 단백질 생성을 조절하는 방법으로서,
숙주 세포를 단백질 발현에 충분한 조건하에 배양하는 것을 포함하고, 여기서 제4항 내지 제9항, 제12항, 제13항 및 제15항 중의 어느 한 항의 재조합 분자가 상기 숙주 세포에 안정하게 도입되는, 방법.
제40항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 방법.
제40항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica ) 세포인, 방법.
제40항에 있어서, 상기 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가되는, 방법.
제40항에 있어서, 상기 제6 코돈이 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 9 내지 15배 증가를 제공하는, 방법.
제40항에 있어서, 상기 제8 코돈이 동의 코돈 CCG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 감소되는, 방법.
제40항에 있어서, 상기 제8 코돈이 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 0.03 내지 0.07배 감소를 제공하는, 방법.
제40항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가되는, 방법.
제40항에 있어서, 상기 제6 코돈이 상기 동의 코돈이고, 상기 제8 코돈이 상기 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 27.5 내지 40.5배 증가를 제공하는, 방법.
폴리뉴클레오티드 서열의 번역 속도를 증가시키는 방법으로서,
단백질을 코딩하고, 10개 코돈을 포함하고 NH₂-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드 서열을 제공하는 단계 및
상기 트리아콘타뉴클레오티드 서열을 돌연변이시켜, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈으로 되도록 하는 단계를 포함하는, 방법.
숙주 세포에서 목적하는 폴리펩티드의 특이적 세포 생성능을 증가시키는 방법으로서,
(a) 상기 목적하는 폴리펩티드를 코딩하고, 10개 코돈을 포함하고 NH₂-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드 서열을 제공하는 단계,
(b) 상기 트리아콘타뉴클레오티드 서열을 돌연변이시켜, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈으로 되도록 하는 단계,
(c) 상기 폴리뉴클레오티드 서열을 상기 숙주 세포에 도입시키는 단계,
(d) 상기 세포를 상기 도입된 폴리폴리뉴클레오티드가 발현되는 조건하에 배양하는 단계 및
(e) 상기 목적하는 폴리펩티드를 단리하는 단계를 포함하는, 방법.
제49항 또는 제50항에 있어서, 상기 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도가 상기 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가되는, 방법.
제51항에 있어서, 상기 방법이 번역 속도의 약 9 내지 15배 증가를 생성하는, 방법.
제49항 또는 제50항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 폴리뉴클레오티드 서열의 번역 속도가 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가되는, 방법.
제53항에 있어서, 상기 방법이 번역 속도의 약 27.5 내지 40.5배 증가를 생성하는, 방법.
제40항 내지 제54항 중의 어느 한 항에 있어서, 상기 단백질 또는 폴리펩티드가, 인슐린, 인슐린 분자 또는 인슐린 유사체를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결되는, 방법.