KR20170070238A

KR20170070238A - 단백질 내로의 비-천연 아미노산의 혼입

Info

Publication number: KR20170070238A
Application number: KR1020177014048A
Authority: KR
Inventors: 제이슨 더블류. 친; 울프강 에이치. 슈미드; 시몬 제이. 엘사서; 유진 와이. 킴
Original assignee: 메디칼 리서취 카운실
Priority date: 2014-10-27
Filing date: 2015-10-21
Publication date: 2017-06-21
Also published as: GB201419109D0; JP2017532043A; CN107002088A; EP3212799B1; JP2021035374A; CA2965085A1; US20170356023A1; JP6843044B2; BR112017008108A2; EP3212799A1; WO2016066995A1; KR102516695B1; US10738339B2; CN107002088B

Abstract

본 발명은 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법에 관한 것이다: i) 직교 tRNA 신테타제 - tRNA 쌍, 상기 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계; ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및 iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계. 또한 본 발명은 용도, 숙주 세포, 조합물 및 키트에 관한 것이다.
[대표도]
도 1a, 1b, 1c

Description

단백질 내로의 비-천연 아미노산의 혼입{INCORPORATION OF UNNATURAL AMINO ACIDS INTO PROTEINS}

본 발명은 일반적으로 단백질 발현, 특히 관심 단백질 내로의 비-천연 아미노산(들)의 혼입 분야에 속한다.

유전자 코드 확장은 100개를 초과하는 비-천연 아미노산의 단백질 내로의 부위-특이적 혼입을 허용하였다. 그러나, 비-천연 아미노산이 단백질 내로 혼입되는 효율에 의해 이러한 접근법의 유용성이 제한될 수 있다. 단백질 내로의 비-천연 아미노산의 효율적이고, 번역과 동시적이며, 부위-특이적인 혼입은 부위-특이적으로 변형된 재조합 단백질을 생성하기 위한 신흥 접근법 (1, 2), 뿐만 아니라 생체 내에서의 단백질 기능을 정확하게 제어 및 영상화하는 전략 (3, 4), 및 디자이너 비-천연 아미노산이 단백질 기능을 제어하거나 보고하는데 사용되는 다수의 기타 접근법을 가능하게 할 것이다.

직교 tRNA 신테타제/tRNA 쌍은, 가장 통상적으로는 앰버(amber) 정지 코돈 (UAG)에 반응하여, 비-천연 아미노산의 혼입을 지시한다. 비-천연 아미노산이 혼입되는 효율은 i) 직교 신테타제/tRNA 쌍이 리보솜의 A 부위 내의 UAG 코돈에 반응하여 번역 연장을 가능하게 하는 본질적인 효율, 및 ii) 방출 인자가 아미노아실화된 직교 tRNA_CUA와 경쟁하여 단백질 합성을 종결시키는 효율 둘 모두에 의해 정의된다. 피롤리실-tRNA 신테타제 (PylRS)/tRNA_CUA 쌍은 단언컨대 유전자 코드 확장용으로 개발된 가장 유용한 쌍인데, 이는 i) 이러한 쌍이 이. 콜라이(E. coli), 효모, 포유동물 세포, 씨. 엘레강스(C. elegans) 및 디. 멜라노가스터(D. melanogaster)를 포함하는 광범위한 숙주에서 직교이고, ii) PylRS가 통상적인 20개의 아미노산을 인식하지 않으며, iii) PylRS가 이의 동족 tRNA_CUA의 안티코돈을 인식하지 않고, iv) PylRS의 활성 부위가 지향성 진화를 필요로 하지 않으면서 유용한 관능기를 보유하는 광범위한 비-천연 아미노산을 수용하고, v) PylRS의 활성 부위가 이. 콜라이에서 광범위한 유용한 관능기를 보유하는 구조적으로 다양한 비-천연 아미노산을 인식하도록 진화될 수 있으며, vi) 이. 콜라이에서 발견된 신테타제 변이체가 신테타제의 지향성 진화를 실행하기 어려운 다양한 진핵생물 숙주에서 사용될 수 있기 때문이다 (5).

비-천연 아미노산 혼입은 현재 진핵생물 세포에서 이. 콜라이에서보다 덜 효율적이다. 진핵생물 세포에서의 단백질 내로의 비-천연 아미노산의 효율적이고 부위-특이적인 혼입은 유전자 코드 확장 접근법의 가능성을 실현하는 것에서의 해결되지 않은 난제이다. 이러한 난제를 다루는 것은 진핵생물 세포에서의 변형된 재조합 단백질의 합성을 허용할 것이고, 새로운 화학 관능기를 단백질 내로 도입하여 이의 기능을 진핵생물 세포에서 높은 공간적 및 시간적 정확도로 제어 및 영상화하는 신흥 전략을 증대시킬 것이다.

본 발명은 이러한 요구를 다루려 한다.

본 발명가들은 하나 이상의 비-천연 아미노산을 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 발현되는 관심 단백질 내로 효율적으로 혼입시키기 위한 직교 신테타제/tRNA 쌍을 기초로 하는 발현 시스템을 개발하였다. 유리하게는, 본원에 기술된 발현 시스템은 이같은 세포에서의 비-천연 아미노산 혼입 효율을 증가시킨다.

또한, 본 발명가들은 정상적으로는 포유동물 세포에서 3개 모두의 정지 코돈에서 번역을 종결시키는 eRF1을 다른 정지 코돈의 번역초과(read-through)를 증가시키지 않으면서 TAG 코돈에 반응하여 비-천연 아미노산 혼입의 실질적인 증가를 제공하도록 조작하였다. 본원에서 제시된 데이터는 천연 eRF1이 3개 모두의 정지 코돈을 인식함에도 불구하고, 오팔(opal) 또는 오커(ochre) 정지 코돈의 번역초과를 증가시키지 않으면서 앰버 정지 코돈에 반응하여 진핵생물 세포에서 비-천연 아미노산 혼입의 효율을 선택적으로 강화하도록 eRF1을 조작하는 것이 가능하다는 것의 최초의 실연을 제공한다.

원핵생물 시스템, 예컨대 이. 콜라이 발현 시스템에 방출 인자가 존재한다. 온도 민감성 방출 인자, 예컨대 tsRF1이 원핵생물 발현 시스템에서의 앰버 억제의 일시적인 증가에 대해 연구되었다. 박테리아 RF1과 rRNA의 상호작용이 원핵생물 시스템에서 rRNA의 530 루프로 정확하게 지적되었다. 예를 들어, WO 2008/065398의 4면 31-35행에 이러한 상호작용이 언급되어 있다. 그러나, 이. 콜라이 시스템으로부터 본 발명의 주제인 진핵생물 시스템으로의 교차는 없다. 원핵생물 단백질과 진핵생물 단백질 사이에는 이들의 명칭 이외에는 직접적인 유사성이 없다.

매우 상이한 박테리아 단백질로부터 본 발명의 주제인 진핵생물 단백질로 돌연변이체를 운반하는 것이 가능하지 않다. 원핵생물 시스템에서는, 상이한 RF 단백질들이 상이한 생물학적 기능을 수행한다 - 진핵생물 시스템과 비교하여, 생물학이 매우 상이한 "분할 기능" 배열이 있다. 대조적으로, 진핵생물 시스템에서는, 단일한 eRF1 단백질이 다중 종결 기능을 제공한다. 따라서, 포유동물 eRF1 단백질은 원핵생물 시스템에서의 방출 인자 단백질과 기술적으로 매우 상이한 것으로 고려될 수 있다. 그러므로, RF1 기능의 선택적 파괴를 통해 앰버 코돈에 반응하여 비-천연 아미노산 혼입을 강화하도록 이. 콜라이에서 개발된 전략 (12-16)이 진핵생물 시스템으로 확장될 수 없다. 특정 eRF1 돌연변이체가 관련 기술 분야에 공지되어 있다. 이러한 돌연변이체들은 순전히 eRF1 기능을 연구하려고 시도하는 과정에서 기술되었다. 이러한 개시내용들은 eRF1 생물학의 학문적 연구에 초점을 두었다. 대조적으로, 본 발명가들은 단백질 내로의 비-천연 아미노산의 혼입에서의 특정 eRF1 돌연변이체의 용도를 최초로 교시한다. 실제로, 직교 tRNA 신테타제/tRNA 쌍을 사용하여 진핵생물 세포에서 비-천연 아미노산이 단백질 내로 부위-특이적으로 혼입되는 효율을 강화하도록 진핵생물 번역 기구를 조작하는 것에 대한 보고가 공지되어 있지 않다. 본 발명가들은 앰버 코돈 발현 시스템의 맥락에서의 eRF1 돌연변이체의 유용성을 최초로 실현한다.

따라서, 본 발명의 장점은 본 발명가들이 eRF1 돌연변이체의 사용에 의한 앰버 코돈의 강화된 억제를 최초로 교시한다는 것이다. 따라서, 본 발명의 장점은 본 발명가들이 앰버 코돈의 강화된 억제에서의 eRF1 돌연변이체의 용도를 최초로 교시한다는 것이다.

유리하게는, 개선된 발현 시스템을 조작된 eRF1과 조합함으로써, 단일 비-천연 아미노산을 보유하는 단백질의 수율이 17- 내지 20-배 증가된다. 비-천연 아미노산을 함유하는 단백질이 정지 코돈을 함유하지 않는 유전자로부터 생산된 단백질에 필적하는 수율로 생산될 수 있다. 또한, 개선된 시스템은 다중 부위 (예를 들어, 3개 이상의 부위)에서 비-천연 아미노산이 혼입된 단백질의 수율을 측정이 불가능하게 낮은 수준에서 앰버 정지가 없는 대조군의 43％로 증가시킨다. 이러한 접근법은 부위-특이적으로 변형된 치료 단백질을 효율적으로 생산하는 것, 및 표적화된 세포 단백질을 단백질 기능의 영상화 또는 합성 조절을 허용하는 비-천연 아미노산을 보유하는 버전으로 정량적으로 교체하는 것을 가능하게 할 수 있다.

유리하게는, 본 개시내용은 진핵생물 세포에서 부위-특이적으로 변형된 치료 단백질을 효율적으로 생산하는 것, 뿐만 아니라 표적화된 세포 단백질을 단백질 기능의 영상화 또는 합성 조절을 허용하는 비-천연 아미노산을 보유하는 버전으로 정량적으로 교체하는 것을 가능하게 할 수 있다.

따라서, 한 측면에서, 본 발명은 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법을 제공한다:

i) 직교 tRNA 신테타제 - tRNA 쌍, 상기 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 67％인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;

ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및

iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

한 측면에서, 본 발명은 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％, 더욱 적절하게는 67％인 아미노산 서열을 갖는 것인 용도에 관한 것이다.

한 측면에서, 본 발명은 비-천연 아미노산의 관심 폴리펩티드 내로의 혼입을 지시하는 직교 코돈을 포함하는, 관심 폴리펩티드를 코딩하는 핵산의 번역에 의해 비-천연 아미노산을 관심 폴리펩티드 내로 혼입시키는 것을 돕는데 사용하기 위한 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％, 더욱 적절하게는 67％인 아미노산 서열을 갖는 것인 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산에 관한 것이다.

한 측면에서, 본 발명은 상기 기술된 바와 같은 돌연변이체 eRF1 폴리펩티드 또는 핵산을 포함하는 진핵생물 숙주 세포에 관한 것이다.

한 측면에서, 본 발명은

(i) 직교 tRNA 신테타제 - tRNA 쌍, 및

(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％, 더욱 적절하게는 67％인 아미노산 서열을 갖는 돌연변이체 eRF1, 및

임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열

을 포함하는 진핵생물 숙주 세포에 관한 것이다.

한 측면에서, 본 발명은

(i) 직교 tRNA 신테타제 - tRNA 쌍, 및

(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％, 더욱 적절하게는 67％인 아미노산 서열을 갖는 돌연변이체 eRF1

을 코딩하는 핵산(들), 및

을 포함하는 조합물 또는 키트에 관한 것이다.

한 측면에서, 본 발명은 비-천연 아미노산, 예컨대 BocK 또는 CypK 또는 BCNK; 더욱 적절하게는 BocK 또는 CypK를 추가로 포함하는, 상기 기술된 바와 같은 진핵생물 숙주 세포 또는 상기 기술된 바와 같은 조합물 또는 키트에 관한 것이다.

적절하게는, 상기 돌연변이체 eRF1은 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공한다.

적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해

(i) E55

(ii) N129, K130

(iii) T122, S123

(iv) Y125

(v) T58, S60, S64, L125, N129

(vi) S123, L124, Y125

(vii) S123, L124, Y125

(viii) S123, L124, Y125

(ix) M51, K130

(x) S123, L124, Y125

(xi) S123, L124, Y125

(xii) S123, L124, Y125

(xiii) S123, L124, Y125

로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함한다.

적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해

(i) E55D

(ii) N129P, K130Q

(iii) T122Q, S123F

(iv) E55A

(v) Y125F

(vi) T58K, S60T, S64D, L125F, N129S

(vii) S123A, L124I, Y125L

(viii) S123R, L124W, Y125R

(ix) S123H, L124A, Y125G

(x) M51A, K130M

(xi) S123A, L124L, Y125V

(xii) S123L, L124C, Y125S

(xiii) S123L, L124S, Y125S

(xiv) S123V, L124T, Y125P

적절하게는, 상기 진핵생물 세포는 포유동물 또는 곤충 세포이다.

적절하게는, 상기 코돈은 정지 코돈이다. 더욱 적절하게는, 상기 정지 코돈은 UAG이다.

적절하게는, 직교 tRNA 신테타제 - tRNA 쌍은 피롤리실-tRNA 신테타제 (PylRS)/PylT tRNA_CUA 쌍을 포함한다.

적절하게는, tRNA는

(i) PylT의 U25C 변이체, 또는

(ii) PylT의 Opt 변이체, 또는

(iii) PylT의 U25C - Opt 변이체이다.

본 발명의 추가 측면 및 실시양태

제1 측면에서, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물이 제공된다. 이러한 구축물을 코딩하는 예시적인 뉴클레오티드 서열이 서열식별번호: 1에 기재된다.

적절하게는, 핵산 구축물은 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함할 수 있다.

적절하게는, 관심 핵산 서열을 발현시킬 수 있는 프로모터는 상기 언급된 제1 측면에 따른 제1 프로모터와 동일한 방향으로 배향된다.

적절하게는, 관심 핵산 서열을 발현시킬 수 있는 프로모터는 제1 프로모터와 동일하거나 또는 제1 프로모터와 상이하다. 한 실시양태에서, 이러한 프로모터는 본원에 기술된 바와 같은 EF-1 프로모터이거나 또는 이로부터 유래되거나, 또는 CMV 프로모터이거나 또는 이로부터 유래된다.

적절하게는, 핵산 구축물은 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 핵산 서열을 추가로 포함한다. 한 실시양태에서, eRF1 돌연변이체는 tRNA 신테타제를 발현하는 제1 Pol II 오픈 리딩 프레임의 하류 (3')의 CMV 프로모터로부터 발현된다.

적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열 및 tRNA 신테타제를 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 적절하게는, tRNA 신테타제를 코딩하는 핵산 서열 및 돌연변이체 eRF1을 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 예시적인 T2A 자가-절단 펩티드가 문헌 [PLoS ONE 6(4) (2011)]에 기술되어 있다.

제2 측면에서, (i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물이 제공된다. 이러한 구축물을 코딩하는 예시적인 뉴클레오티드 서열이 서열식별번호: 2에 기재된다.

적절하게는, 구축물은 돌연변이체 eRF1, 적절하게는 돌연변이체 포유동물 eRF1, 적절하게는 돌연변이체 호모 사피엔스(homo sapiens) eRF1을 코딩하는 핵산 서열을 포함하고, 적절하게는 여기서 돌연변이체 eRF1은 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택된다.

적절하게는, 제1 및 제2 프로모터가 서로 반대 방향으로 있고, tRNA가 핵산 구축물 내에 다중 카피로 존재한다.

적절하게는, 핵산 구축물은 프로모터에 직접적으로 연결된 tRNA를 포함한다. 이러한 실시양태에 따르면, 어떠한 중간체 서열도 tRNA와 프로모터 사이에 위치하지 않으면서 tRNA가 프로모터에 직접적으로 연결된다.

적절하게는, 핵산 구축물은 프로모터에 직접적으로 연결된 tRNA를 포함한다. 이러한 실시양태에 따르면, 중간체 서열(들)이 tRNA와 프로모터 사이에 위치하지 않으면서 tRNA가 프로모터에 직접적으로 연결된다. tRNA의 3' 끝부분이 종결인자 서열에 간접적으로 연결될 수 있다. 예를 들어, 종결인자 서열 (예를 들어, TTTTT)이 링커를 통해 tRNA에 연결될 수 있고, 상기 링커는 임의적으로 서열 GACAAGTGCGG를 포함한다.

적절하게는, tRNA를 코딩하는 핵산 서열의 각각의 카피가 별개의 (자신의 독자적인) 프로모터의 제어 하에 놓인다.

적절하게는, 프로모터 배열은 제1 방향으로 배향된 신장 인자 프로모터 및 제2 방향으로 배향된 Pol III 프로모터를 포함한다.

적절하게는, 제1 프로모터는 EF-1 프로모터이거나 또는 이로부터 유래된다.

적절하게는, 제2 프로모터는 U6 프로모터이거나 또는 이로부터 유래된다.

적절하게는, tRNA는 핵산 구축물(들) 상에 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 카피로 존재한다.

적절하게는, tRNA는 야생형 또는 변이체 tRNA이고, 적절하게는 PylT의 U25C 변이체이다.

적절하게는, 관심 핵산 서열은 적어도 1, 2, 3 또는 4개 또는 이를 초과하는 개수의 정지 코돈을 포함하고, 적절하게는 적어도 1, 2 또는 3개의 코돈을 포함한다.

적절하게는, 관심 핵산 서열은 항체 또는 항체 단편을 코딩한다.

적절하게는, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고/이거나, 상기 tRNA가 진핵생물 세포 내의 내인성 tRNA 신테타제에 대해 직교이고/이거나, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고 상기 tRNA가 내인성 tRNA 신테타제에 대해 직교이다.

추가 측면에서, 제1 측면에 따른 핵산 구축물 및 제2 측면에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물이 제공된다.

추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 및 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물이 제공된다.

적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 추가의 별개의 구축물 상에 있다.

추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 또는 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 벡터가 제공된다.

추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 및 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 벡터를 포함하는 벡터 조합물이 제공된다.

적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 추가의 별개의 벡터 상에 있다.

추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 또는 본 발명의 제2 측면에 따른 핵산 구축물, 핵산 구축물 조합물, 벡터, 또는 벡터 조합물을 포함하는 세포가 제공된다.

적절하게는, 세포는 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 구축물을 추가로 포함한다. 적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열은 별개의 구축물 또는 벡터 상에 있다.

적절하게는, 돌연변이체 eRF1은 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되고, 적절하게는 여기서 돌연변이는 진뱅크 등록 번호(GenBank Accession Number) AF095901.1에 기술된 바와 같은 호모 사피엔스 eRF1 유전자 서열에서 이루어진다. 한 실시양태에서, 돌연변이는 코돈-최적화 호모 사피엔스 eRF1 유전자 서열에서 이루어진다. 코돈-최적화 호모 사피엔스 eRF1 유전자 서열의 예가 서열식별번호: 3에 기재된다.

적절하게는, 세포는 포유동물 세포 또는 곤충 세포이다.

적절하게는, 세포는 일시적으로 또는 안정적으로 핵산으로 형질감염된다.

추가 측면에서, (i) 본 발명의 제1 또는 제2 측면에 따른 핵산 구축물; 또는 (ii) 핵산 구축물 조합물; 또는 (iii) 벡터; 또는 (iv) 벡터 조합물; 또는 (v) 진핵생물 세포를 포함하고; (vi) 임의적으로 비-천연 아미노산을 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트가 제공된다.

적절하게는, 키트는 돌연변이체 eRF1을 코딩하는 핵산 구축물 또는 벡터, 또는 이를 포함하는 세포를 추가로 포함한다.

추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) 세포를 제공하는 단계이며, 여기서 상기 세포가 본원에 기술된 바와 같은 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

적절하게는, 적어도 1, 2, 3, 4, 또는 5개의 비-천연 아미노산이 관심 단백질 내로 혼입된다.

추가 측면에서, 하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법이 제공된다: i) 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포를 제공하는 단계이며, 여기서 관심 핵산 서열이 항체 또는 항체 단편을 코딩하고, 상기 세포가 본원에 기술된 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및 vi) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계.

추가 측면에서, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한, (i) 본 발명의 제1 또는 제2 측면에 따른 핵산 구축물; 및/또는 (ii) 핵산 구축물 조합물; 및/또는 (iii) 벡터; 및/또는 (iv) 벡터 조합물; 및/또는 (v) 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포의 용도가 제공된다.

추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) tRNA 신테타제 및 tRNA 쌍, 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계; ii) 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

추가 측면에서, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도가 제공된다.

추가 측면에서, 하기 단계를 포함하는, 관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법이 제공된다: (i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 본원에 기술된 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; (ii) 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에, 그리고 eRF1의 돌연변이체의 존재 및 부재 하에 세포를 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 (iii) eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계.

추가 측면에서, 실질적으로 첨부된 설명 및 도면을 참조로 본원에 기술된 바와 같은 구축물, 벡터, 세포, 키트, 방법 또는 용도가 제공된다.

이제 본 발명의 실시양태가 하기와 같은 첨부된 도면을 참조로 추가로 기술될 것이다:
차트 1은 사용된 플라스미드 구축물 및 비-천연 아미노산을 나타낸다. (a) 사용된 벡터의 개략도. PylT는 Pyl tRNA_CUA를 코딩하는 유전자이고, PylT^*는 U25C 변이체를 코딩한다. U6은 U6 프로모터를 가리키고, CMV는 CMV 프로모터이며, CMV enh는 CMV 프로모터의 5' 인핸서 단편이고, EF1 prom은 EF-1α 프로모터이다. 적색 막대는 앰버 정지 코돈의 위치를 가리킨다. (b) 1 (N ^ε-[(tert-부톡시)카르보닐]-l-리신) 및 2 (N ^ε-[((2-메틸시클로프로프-2-엔-1 일)메톡시)카르보닐]-l-리신)의 화학 구조.
도 1은 포유동물 세포에서 TAG 코돈에 반응하여 비-천연 아미노산을 혼입시키기 위한 PylRS/tRNA_CUA 발현 벡터의 최적화를 도시한다. (a) 형광 검정법에서 측정된 sfGFP 내로의 1 (2 mM) 및 2 (0.5 mM)의 혼입의 정량. 지시된 구축물을 HEK293T 세포에서 일시적으로 발현시키고, 485 nm에서의 여기 후 520 nm에서의 형광에 의해 용해물에서 sfGFP를 정량하였다. 아미노산이 없는 대조군이 각각의 벡터 조합에 대해 포함된다. 정지 코돈 대신 류신 코돈이 있는 등가의 sfGFP 대조군 플라스미드 (차트 1a의 구축물 a)가 나타내는 형광의 백분율로서 데이터가 플롯팅된다. 데이터는 3중물의 평균 ± SE를 나타낸다. (b) 웨스턴 블롯으로 가시화된 용해물 내의 sfGFP 수율. 지시된 벡터로 형질감염되고 지시된 아미노산의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-액틴 및 α-FLAG 항체로 이뮤노블롯팅하였다. (c) 아미노산 부재 하의 구축물 b+c, b+d, b+e, g+h로부터의 상대적인 PylT/PylT^* 발현의 노던 블롯 분석. 로딩 대조군에 대해서 보충 도면 1을 참조한다.
도 2는 정지 코돈 번역초과, 및 PylRS/tRNA_CUA 쌍을 이용한 1 (2 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. (a) 이러한 연구에서 돌연변이된 eRF1 위치. eRF1 (PDB ID:3E1Y)²⁹로부터의 N-말단 도메인의 구조이고, 이러한 연구에서 돌연변이된 잔기는 적색이다. (b) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 인간 eRF1 변이체가 발현된다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운(knockdown)이다. (c) 억제인자 tRNA의 부재 하에서의 HEK293T 세포에서의 레닐라(Renilla)-TAG-반딧불이 루시페라제 리포터 및 eRF1 변이체의 발현에 의해 3개 모두의 정지 코돈의 번역초과가 결정된다. CMV-PylRS/CMV-DLR(TAG) (또는 상응하는 TAA, TGA 또는 세린 코돈 변이체)를 세포 내로 일시적으로 형질감염시키고, 20시간 후에 발현 수준을 결정하였다. TAG, TAA, 또는 TGA 번역초과를 세린 코돈 (TCC)을 함유하는 구축물로부터의 데이터에 대해 표준화하였다. 데이터는 4중 측정의 평균 ± SE를 나타낸다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. Wt는 디. 멜라노가스터 코돈 용법으로 리코딩(recoding)된 인간 eRF1이다. Δ100 돌연변이체에 대한 데이터는 척도를 벗어나고, 하기의 값이다: 1.6％ (TAA), 2％ (TAG) 및 15％ (TGA). (d) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], U6 프로모터로부터 PylT를 발현하는 플라스미드 c (차트 1a), 및 플라스미드 a (차트 1a)에서 sfGFP가 레닐라-TAG-반딧불이로 교체된 버전인 CMV-PylRS/CMV-레닐라-TAG-반딧불이로의 HEK 293T 세포의 일시적인 형질감염. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. 등량의 세포 용해물을 α-eRF1 및 α-액틴 항체로 이뮤노블롯팅하였다. (e) eRF1 (X) 변이체가 피롤리실 tRNA/신테타제 쌍을 사용하여 앰버 정지 코돈에 반응하여 비-천연 아미노산 혼입을 증가시킨다. HEK293T 세포를 패널 d에 기술된 바와 같이 형질감염시키고, 1 mM 아미노산 1의 존재 하에 성장시키고, 20 h 후에 측정하였다. ％ 번역초과를 앰버 정지 코돈 대신 세린 코돈을 보유하는 레닐라-TCC-반딧불이 리포터에 대해 상대적으로 측정하였다.
도 3은 eRF1 E55D를 최적화된 PylRS/tRNACUA 쌍 발현 시스템과 조합하는 것이 포유동물 세포에서 다중 비-천연 아미노산의 재조합 단백질 내로의 효율적인 혼입을 가능하게 한다는 것을 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1의 존재 또는 부재 하에 성장시켰다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다. (b) 용해물로부터의 웨스턴 블롯. (c) 패널 a에서와 같지만, 0.5 mM 아미노산 2를 사용함. (d) 용해물로부터의 웨스턴 블롯.
도 4는 1개 또는 3개의 비-천연 아미노산이 혼입된 재조합 sfGFP의 발현, 정제 및 특성화를 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1 또는 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 전장 sfGFP를 Ni-NTA 크로마토그래피로 정제하였다. (b) sfGFP 내의 1개 또는 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입이 전기분무 이온화 질량 분광법에서 확인된다 (보충 도면 4를 또한 참조한다).
도 5는 게놈 통합으로부터의 eRF1 E55D의 안정적인 발현이 T-Rex 293 Flp-In 세포에서 앰버 억제를 강화한다는 것을 도시한다. T-Rex 293 Flp-In 시스템 (라이프 테크놀러지즈(Life Technologies))를 사용하는 것에 의해 안정적인 eRF1 세포주가 생성되어, 규정된 표적 유전자좌에서의 삽입으로 인해 삽입된 트랜스진(transgene)의 균일한 발현을 제공하였다.
a 플라스미드 g 및 h 또는 i (도 1, a)를 게놈에 통합된 디. 멜라노가스터 코돈 용법의 eRF1 E55D를 함유하는 T-Rex293 세포 내로 일시적으로 형질감염시켰다. 세포를 48시간 시간 동안 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 형질감염 16시간 전에 1 ㎍/ml 테트라시클린 첨가로 eRF1 E55D의 발현을 유도하였다. 모든 실험에서 공인된 테트라시클린이 없는 성장 배지를 사용하였다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
b 패널 a에서 제시된 바와 같은 용해물로부터의 웨스턴 블롯. 등량의 세포 용해물이 로딩되었다. eRF1 wt 또는 E55D가 삽입된 T-Rex293 Flp-in 세포주를 렌티바이러스 shRNA(eRF1) 구축물 (산타 크루즈(Santa Cruz), 도 3에서와 같음)로 형질전환시키고, 나이브 세포에 대해 퓨로마이신으로 선별함으로써, 내인성 eRF1에 대한 shRNA를 구성적으로 발현하는 안정적인 세포주가 생성되었다. 디. 멜라노가스터 코돈-최적화 후 shRNA에 상보적인 서열이 결여되기 때문에 eRF1 wt 및 E55D는 shRNA(eRF1)에 대해 불응성이었다.
c 2의 존재 또는 부재 하에, 그리고 방출 인자 변이체의 발현을 유도하기 위해 성장 배지에 1 ㎍/ml 테트라시클린을 첨가하여, 48시간 동안 구축물 g 및 h (도 1)로 일시적으로 형질감염시킨 후에 sfGFP(TAG)가 발현되었다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
d. 패널 c에서와 같지만, sfGFP(TAG)₃을 발현함.
도 6은 Dmel 세포에서의 정지 코돈 번역초과, 및 PylRS/tRNA_CUA 쌍을 이용한 1 (1 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. a. peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 UAS-PylRS/UAS-GFP-(TAG)-mCherry/(U6-PylT)₄로의 Dmel 세포의 일시적인 형질감염 후에 인간 eRF1 변이체 (디. 멜라노가스터 코돈 용법으로 리코딩됨)가 발현된다. 정지가 없는 대조군이 전장 단백질에 대한 크기 마커로서의 역할을 하고, 음성 대조군 (-)은 내인성 eRF1의 존재 하의 기준선 억제 효율을 규명하고, 2가 없는 음성 대조군은 1의 부재 하의 번역초과 수준을 가리킨다. 세포를 형질감염시키고, 48시간 동안 성장시켰다. 전장 생성물을 나타내는 밴드 강도의 말단절단 생성물에 대한 비를 계산함으로써, 비-포화 노출 조건 하에 GFP에 대해 면역염색된 블롯으로부터 번역초과를 정량한다. 각각의 막대는 3회의 독립적인 형질감염 및 정량 실험의 평균 ± SE를 나타낸다.
b. 웨스턴 블롯으로 가시화된 용해물 내의 단백질의 발현 수준. 패널 a에 대해 기술된 바와 같이, 지시된 벡터로 형질감염되고 1 mM 아미노산 1의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-eRF1 및 α-HA 항체로 이뮤노블롯팅하였다. 제시된 α-GFP 블롯은 전장 생성물에 대한 명료한 밴드를 프린트로 나타내도록 30초 동안 노출되었다. 정량에 사용된 블롯의 상응하는 노출은 5초 동안 노출되었고, 포화를 나타내지 않으며, 추가적인 반복실험도 마찬가지이다.
c. 일시적인 형질감염에 사용된 구축물.
도 7은 eRF1 E55D 돌연변이체의 존재 하에서의 sfGFP(TAG) 내로의 4개의 별개의 비-천연 아미노산의 혼입을 도시한다.
도 8 (보충 도면 1)은 유니버설(universal) PylT/PylTU25C 프로브를 이용한 노던 블롯을 도시한다. 도 1a,b와 유사한 플라스미드 b+c, b+d, b+e, g+h (차트 1)로의 일시적인 형질감염 24시간 후에 총 RNA를 추출하였다.
도 9 (보충 도면 2)는 peRF1(X) 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 발현된 인간 eRF1 변이체를 도시한다. 음성 대조군 (-)은 내인성 eRF1을 검출한다. 이중 루시페라제 검정법에서의 생산된 단백질의 절대적 발현 수준이 α-레닐라 웨스턴 블롯에 의해 제시된다. 형질감염 없음은 형질감염되지 않은 세포이다.
도 10 (보충 도면 3)은 용해 완충제 내의 sfGFP의 형광측정 정량을 위한 검정 곡선을 도시한다. 정제 및 단계 희석된 sfGFP의 형광 강도가 샘플 내의 sfGFP의 농도에 대해 플롯팅된다. 박테리아 발현 후 단백질을 정제하고, 280 nm에서의 흡광도 측정으로 정량하고, 프로테아제 억제제가 첨가된 RIPA-완충제에서 희석하였다.
도 11 (보충 도면 4)은 sfGFP 내의 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입을 입증하는 전기분무 이온화 질량 분광법을 도시한다. 미량 성분은 검출 동안 하나의 1 또는 2의 카르바메이트 기에서의 자발적인 절단으로 천연 리신이 생산되는 것을 나타낸다. 상응하는 질량 손실이 각각 100 또는 110 Da으로 계산된다. 이전에 본 발명가들은 전자 분무 이온화 공정에서 1의 카르바메이트 절단이 발생한다는 것을 관찰하였다⁷.
도 12 이중-루시페라제 리포터 검정법에서의 난소에서의 eRF1 E55D 또는 Δ100 발현이 정지 코돈 번역초과에 미치는 효과에 대한 트랜스제닉 디. 멜라노가스터 파리 계통의 스크리닝.
도 13은 FACs 플롯을 나타낸다.
도 14는 사진을 나타낸다.
도 15는 막대 차트를 나타낸다.
도 16은 PylT U25C 및 PylT U25C Opt 변이체를 나타낸다.
도 17은 PylT U25C 및 PylT U25C Opt 변이체의 서열을 나타낸다.
도 18은 사진 및 막대 차트를 나타낸다.
도 19는 다이어그램을 나타낸다.
도 20은 다이어그램을 나타낸다.
도 21은 (a) 다이어그램, (b) 화학 구조, 및 (c) 2개의 그래프를 나타낸다.

구축물 및 벡터

본원에서 사용된 바와 같이, 일반적으로 용어 "구축물" 또는 "벡터"는 자신이 연결된 관심 핵산 서열을 전달할 수 있는 핵산을 지칭한다.

한 벡터 유형은 추가적인 DNA 분절이 내부로 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 또 다른 벡터 유형은 추가적인 DNA 분절이 바이러스 게놈 내로 라이게이션될 수 있는 바이러스 벡터이다. 특정 벡터는 자신이 도입된 숙주 세포 내에서 자가 복제가 가능하다 (예를 들어, 박테리아 복제 기원이 있는 박테리아 벡터, 및 에피솜형 포유동물 벡터). 다른 벡터 (예를 들어, 비-에피솜형 포유동물 벡터)는 숙주 세포 내로의 도입 시 숙주 세포의 게놈 내로 통합되고, 이에 의해 숙주 게놈과 함께 복제된다.

관심 핵산 서열이 구축물 또는 벡터, 예컨대 발현 벡터 내로 혼입될 수 있다. 이러한 벡터를 상용성 숙주 세포 내에서 핵산을 복제시키는데 사용할 수 있다. 이러한 벡터를 숙주 세포로부터 회수할 수 있다.

벡터는 상용성 숙주 세포, 예컨대 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 관심 핵산 서열을 발현시키는데 사용되는 발현 벡터일 수 있다. 적절하게는, 관심 핵산 서열이 숙주 세포에서의 관심 핵산 서열의 발현을 제공할 수 있는 제어 서열, 예컨대 프로모터 또는 인핸서에 작동가능하게 연결된다. 용어 "작동가능하게 연결된"은 기술된 성분들이 이들이 이들의 의도되는 방식으로 기능하게 허용하는 관계에 있다는 것을 의미한다. 관심 핵산 서열에 "작동가능하게 연결된" 조절 서열은 제어 서열과 상용성인 조건 하에 관심 핵산 서열의 발현이 달성되는 방식으로 라이게이션된다.

벡터는 단백질 발현을 제공하도록 적절한 숙주 세포 내로 형질전환 또는 형질감염될 수 있다. 이러한 프로세스는 발현 벡터로 형질전환된 숙주 세포를 단백질을 코딩하는 관심 핵산 서열의 벡터에 의한 발현을 제공하는 조건 하에 배양하고, 임의적으로, 발현된 단백질을 회수하는 것을 포함할 수 있다.

벡터는, 예를 들어, 복제 기원, 임의적으로, 관심 핵산 서열의 발현을 위한 프로모터, 및 임의적으로, 프로모터의 조절인자가 제공된 플라스미드 또는 바이러스 벡터일 수 있다. 벡터는 하나 이상의 선별성 마커 유전자를 함유할 수 있고, 예를 들어 박테리아 플라스미드의 경우 암피실린 내성 유전자를 함유할 수 있다.

한 측면에서, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물이 제공된다.

또 다른 측면에서, (i) 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물이 제공된다.

또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 포함하는 핵산 구축물 조합물이 또한 제공된다.

또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 포함하거나 또는 별개로 포함하는 벡터가 또한 제공된다.

또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 별개로 포함하는 벡터들을 포함하는 벡터 조합물이 또한 제공된다.

특정 실시양태에서, 핵산 구축물 내의 제1 및 제2 프로모터는 반대 방향으로 놓인 별개의 프로모터이다. 이러한 실시양태에 따르면, 제1 및 제2 프로모터를 각각의 프로모터가 이들의 5' 끝부분이 서로를 향해 배향되면서 반대 가닥 상에서 코딩되는 양방향성 프로모터라고 할 수 있다. 프로모터에 작동가능하게 연결된 각각의 핵산이 상응하여 배향될 것이다. 따라서, 예를 들어, 프로모터 및 발현될 tRNA 서열이 역방향 가닥 상에서 코딩될 수 있다. 프로모터 및 발현될 tRNA 신테타제 유전자는 전방향 가닥 상에서 코딩될 수 있다. 추가적인 예로서, U6 프로모터 및 발현될 tRNA 서열이 역방향 가닥 상에서 코딩될 수 있다. 추가적인 예로서, EF-1a 프로모터 및 발현될 tRNA 신테타제 유전자가 전방향 가닥 상에서 코딩될 수 있다.

제1 및 제2 프로모터에 더하여, 하나 이상의 추가 프로모터가 또한 포함될 수 있고, 이는 제1 및/또는 제2 프로모터와 동일한 프로모터일 수 있거나 또는 제1 및/또는 제2 프로모터와 상이할 수 있다. 추가 프로모터(들)는 제1 또는 제2 프로모터와 동일한 방향으로 배향될 수 있다. 적절하게는, 추가 프로모터(들)는 제1 프로모터와 동일한 방향으로 배향된다.

적절하게는, 본원에 기술된 구축물은 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 핵산 서열을 추가로 포함한다. 돌연변이체 eRF1을 발현시키는 프로모터는 제1 또는 제2 프로모터와 동일한 방향으로 배향될 수 있다. 적절하게는, 이러한 프로모터는 제1 프로모터와 동일한 방향으로 배향된다.

적절하게는, 구축물은 다중-카피 tRNA 배열을 제공한다. 적절하게는, tRNA 유전자의 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 카피가 본원에 기술된 구축물 내에 제공된다. 적절하게는, tRNA 유전자의 적어도 4개의 카피가 구축물 내에 제공된다. 적절하게는, tRNA 유전자의 적어도 8개의 카피가 구축물 내에 제공된다. tRNA 유전자의 다중 카피는 동일한 구축물 상에서 또는 상이한 구축물 상에서 제공될 수 있다. 한 실시양태에서, tRNA 유전자의 적어도 4개의 카피가 제1 구축물 상에서 제공되고, tRNA 유전자의 적어도 4개의 카피가 제2 구축물 상에서 제공된다.

한 실시양태에서, tRNA 유전자의 다중 카피는 단일 프로모터의 제어 하에 놓인다. 또 다른 실시양태에서, tRNA 유전자의 다중 카피는 상이한 다중 프로모터의 제어 하에 놓인다. 또 다른 실시양태에서, tRNA 유전자의 각각의 카피는 별개의 프로모터의 제어 하에 놓이고, 이는 동일한 프로모터 또는 2개 이상의 상이한 프로모터일 수 있다. 또 다른 실시양태에서, tRNA 유전자의 각각의 카피는 다중 프로모터의 제어 하에 놓이고, 이는 동일한 프로모터 또는 2개 이상의 상이한 프로모터일 수 있다. 적절하게는, 각각의 tRNA 유전자는 별개의 프로모터의 제어 하에 놓이고, 이는 각각의 tRNA 유전자에 대해 동일한 프로모터이다. 적절하게는, 제공된 tRNA 유전자(들) 각각을 제어하는 프로모터 또는 프로모터들은 동일하다. 이러한 맥락에서, "동일한"은 다중 tRNA 서열을 제어하는 단일한 프로모터 서열을 뜻하기보다는 이의 서열 면에서의 동일성을 의미한다. 명확하게, 본원에 기술된 바와 같이 동일한 프로모터의 다중 카피가 있을 수 있다.

한 실시양태에서, tRNA의 적어도 4개의 카피가 제공되고, 여기서 각각의 카피가 프로모터에 작동가능하게 연결된 다중-카피 tRNA 배열이 제공된다.

또 다른 실시양태에서, tRNA의 적어도 4개의 카피가 제공되고, 여기서 각각의 카피가 프로모터에 작동가능하게 연결되며, 각각의 프로모터가 동일한 프로모터, 예컨대 RNA pol III 프로모터, 예를 들어 U6 프로모터인 다중-카피 tRNA 배열이 제공된다.

한 실시양태에서, tRNA의 5' 끝부분이 tRNA를 발현시키는데 사용되는 프로모터의 전사 개시 부위에 의해 직접적으로 규정된다.

본원에서 제공되는 뉴클레오티드 구축물은 용도가 광범위하고, 앰버 억제뿐만 아니라 오팔 및/또는 오커 억제에서 사용될 수 있다는 것을 주지하여야 한다. 본 발명의 핵산 구축물을 앰버/오팔/오커 억제에 적용할 때, 통상의 기술자는 적합한 앰버/오팔/오커 코돈과 함께 이에 따라 적합한 tRNA 및/또는 tRNA 신테타제를 선택할 것이다.

구축물 및 벡터의 조합물

본원에 기술된 구축물 및 벡터의 조합물이 하나 이상의 비-천연 아미노산을 세포 내로 혼입시키는데 사용하기 위해 구상된다.

예를 들어, (1) (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물; 및 (2) (i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물을 포함하는 구축물 조합물.

한 실시양태에서, 상기 언급된 구축물 (1)로부터의 관심 핵산 서열은 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함한다. 이러한 실시양태에 따르면, 구축물 (2)로부터의 관심 핵산 서열 및 tRNA가 구축물 (1) 내로 혼입되기 때문에 구축물 (1)이 반드시 구축물 (2)와 함께 사용될 필요는 없다. 이러한 실시양태에 따르면, 또 다른 벡터 상의 tRNA의 하나 이상의 추가 카피를 포함하는 것이 바람직할 수 있다. 이러한 다른 벡터는 하나 이상의 프로모터의 제어 하에 tRNA(들)를 배타적으로 포함할 수 있다. 임의적으로, 원한다면 다른 요소들이 이러한 다른 벡터 내로 혼입될 수 있다.

상기 언급된 바와 같은 (1) 및 (2)를 포함하는 구축물 조합물이 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 추가 구축물과 함께 사용될 수 있다.

대안적으로, 돌연변이체 eRF1을 코딩하는 핵산 서열이 구축물 (1) 및/또는 (2) 내로 혼입될 수 있다. 적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 구축물 (1) 내로 혼입된다. 이러한 실시양태에 따르면, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하며; 임의적으로 (iii) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 포함하고; 임의적으로 (iv) 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 관심 핵산 서열을 포함하는 핵산 구축물이 개시된다.

이러한 다양한 구축물 조합물을 포함하는 벡터 및 세포가 또한 개시된다.

tRNA 신테타제

본원에서 사용되는 tRNA 신테타제 (적절하게는, 아미노아실-tRNA 신테타제)는 다양할 수 있다. 구체적인 tRNA 신테타제 서열이 실시예에서 사용되었을 수 있지만, 본 발명은 이러한 실시예에만 국한되도록 의도되지 않는다. 원칙적으로, tRNA 장전(charging) (아미노아실화) 기능을 제공하는 임의의 tRNA 신테타제를 사용할 수 있다. 예를 들어, tRNA 신테타제는 임의의 적절한 종 예컨대 고세균, 예를 들어, 메타노사르시나(Methanosarcina), 예컨대 메타노사르시나 바르케리(Methanosarcina barkeri) MS; 메타노사르시나 바르케리 변종 푸사로(Fusaro); 메타노사르시나 마제이(Methanosarcina mazei) Go1; 메타노사르시나 아세티보란스(Methanosarcina acetivorans ) C2A; 메타노사르시나 써모필라(Methanosarcina thermophila); 또는 메타노코코이데스(Methanococcoides), 예컨대 메타노코코이데스 부르토니이(Methanococcoides burtonii)로부터의 것일 수 있다. 대안적으로, tRNA 신테타제는 박테리아, 예를 들어 데술피토박테리움(Desulfitobacterium), 예컨대 데술피토박테리움 하프니엔세(Desulfitobacterium hafniense) DCB-2; 데술피토박테리움 하프니엔세 Y51; 데술피토박테리움 하프니엔세 PCP1; 또는 데술포토마쿨룸 아세톡시단스(Desulfotomaculum acetoxidans) DSM 771로부터의 것일 수 있다.

한 실시양태에서, tRNA 신테타제는 피롤리실 tRNA 신테타제 생물학적 활성이 있는 단백질인 피롤리실 tRNA 신테타제 (PylRS)이다. PylRS는 tRNA를 비-천연 아미노산으로 아실화시킬 수 있다.

PylRS는 야생형 또는 유전자 조작 PylRS일 수 있다. 예를 들어, 문헌 [Neumann et al., Nat Chem Biol 4:232, 2008] 및 [Yanagisawa et al., Chem Biol 2008, 15:1187], 및 EP2192185A1에 유전자 조작 PylRS가 기술되어 있다. 적절하게는, 비-천연 아미노산(들)의 혼입 효율을 증가시키는 유전자 조작 tRNA 신테타제 유전자가 선택된다.

한 실시양태에 따르면, PylRS는 임의적으로 하기 기재된 코돈-최적화 서열을 포함하거나 이로 이루어진, 메타노사르시나 바르케리로부터의 것 (MbPylRS)이다:

특정 실시양태에 따르면, PylRS는 임의적으로 하기 기재된 코돈-최적화 서열을 포함하거나 이로 이루어진, 메타노사르시나 마제이로부터의 것 (MmPylRS)이다:

적절하게는, tRNA 신테타제를 코딩하는 뉴클레오티드 서열은 코돈-최적화된다.

tRNA

본원에서 사용되는 tRNA는 다양할 수 있다. 구체적인 tRNA가 실시예에서 사용되었을 수 있지만, 본 발명은 이러한 실시예에만 국한되도록 의도되지 않는다. 원칙적으로, 임의의 tRNA를 사용할 수 있고, 단 이는 선택된 tRNA 신테타제와 상용성이다.

tRNA는 임의의 적절한 종 예컨대 고세균, 예를 들어, 메타노사르시나, 예컨대 메타노사르시나 바르케리 MS; 메타노사르시나 바르케리 변종 푸사로; 메타노사르시나 마제이 Go1; 메타노사르시나 아세티보란스 C2A; 메타노사르시나 써모필라; 또는 메타노코코이데스, 예컨대 메타노코코이데스 부르토니이로부터의 것일 수 있다. 대안적으로, tRNA는 박테리아, 예를 들어 데술피토박테리움, 예컨대 데술피토박테리움 하프니엔세 DCB-2; 데술피토박테리움 하프니엔세 Y51; 데술피토박테리움 하프니엔세 PCP1; 또는 데술포토마쿨룸 아세톡시단스 DSM 771로부터의 것일 수 있다.

tRNA 유전자는 야생형 tRNA 유전자일 수 있거나, 또는 돌연변이된 tRNA 유전자일 수 있다. 적절하게는, 비-천연 아미노산(들)의 혼입 효율을 증가시키는 돌연변이된 tRNA 유전자가 선택된다. 한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNA_CUA 유전자는 문헌 [Biochemistry (2013) 52, 10]에 기술된 바와 같은 PylT의 U25C 변이체이다.

한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNA_CUA 유전자는 문헌 [Fan et al. 2015, Nucleic Acids Research doi:10.1093/nar/gkv800]에 기술된 바와 같은 PylT의 Opt 변이체이다.

한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNA_CUA 유전자는 PylT의 U25C 및 Opt 변이체 양쪽 모두를 갖고, 즉, 이러한 실시양태에서, tRNA, 예컨대 PylT tRNA_CUA 유전자는 U25C 및 Opt 돌연변이 양쪽 모두를 포함한다.

한 실시양태에서, tRNA를 코딩하는 서열은 tRNA^Pyl, 더욱 적절하게는 tRNA^Pyl _CUA를 코딩하는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT) 유전자이다. 이는 앰버 억제에 의해, 즉 앰버 코돈의 인식에 의해 비-천연 아미노산을 혼입시킨다.

메타노사르시나 마제이로부터의 PylT를 코딩하는 핵산 서열의 예는 하기의 것이다:

또 다른 실시양태에서, 메타노사르시나 마제이로부터의 PylT는 U6 프로모터로부터 발현되고, PylT의 3' 끝부분에 링커에 이어지는 종결인자가 있다. 예시적인 서열은 하기의 것이다 (U6 프로모터는 볼드체 소문자이고; PlyT는 밑줄이 그어지며; 링커는 볼드체 대문자이고; 종결인자는 밑줄이 그어진 대문자이다):

tRNA 신테타제/tRNA 쌍

적절하게는, tRNA-tRNA 신테타제 쌍은 20개의 천연 발생 아미노산 중 어떤 것도 인식하지 않는 것이다.

상응하거나 동족인 tRNA 또는 tRNA 신테타제가 상이한 종들, 예컨대 메타노코쿠스 박테리아의 상이한 종들로부터 조합될 수 있다는 것이 이해될 것이다. 예를 들어, 메타노사르시나 마제이로부터의 피롤리신 tRNA를 메타노사르시나 바르케리로부터의 피롤리실 tRNA 신테타제와 함께 사용하는 것이 가능할 수 있다. 관련 기술 분야에 공지된 방법을 사용하여, 예를 들어, 숙주 세포에서 상이한 성분들을 함께 조합하고, 생산되는 무손상 관심 단백질에 대해 분석함으로써, 이같이 쌍을 이루어 것의 기능성을 쉽게 테스트할 수 있다.

한 실시양태에서, tRNA-tRNA 신테타제 쌍은 피롤리실-tRNA 신테타제 (PylRS)/tRNA_CUA 쌍이고, 적절하게는 메타노코쿠스로부터의 것이다.

한 실시양태에서, tRNA 신테타제는 메타노사르시나 바르케리로부터의 PylRS (MbPylRS)이거나 또는 이로부터 유래되고, tRNA는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT)이거나 또는 이로부터 유래된다.

한 실시양태에서, tRNA 신테타제는 메타노사르시나 마제이로부터의 PylRS (MmPylRS)이거나 또는 이로부터 유래되고, tRNA는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT)이거나 또는 이로부터 유래된다.

제어 서열

핵산 서열에 작동가능하게 연결된 제어 서열은 프로모터, 인핸서 및 기타 발현 조절 신호를 포함한다. 이러한 제어 서열은 구축물 또는 벡터가 디자인되어 사용되는 숙주 세포와 상용성이도록 선택될 수 있다. 용어 프로모터는 관련 기술 분야에 널리 공지되어 있고, 크기 및 복잡성 면에서 최소 프로모터에서 상류 요소 및 인핸서를 포함하는 프로모터까지의 범위에 이르는 핵산 영역을 포함한다.

적절하게는, 프로모터 서열 중 하나는 RNA Pol III 프로모터, 예컨대 U6 프로모터이다. 적절하게는, RNA Pol III 프로모터가 tRNA 유전자에 작동가능하게 연결된다. 적절하게는, 이러한 배열이 본 개시내용의 구축물에서 적어도 4, 5, 6, 7 또는 8회 또는 이를 초과하는 횟수로 반복된다.

적절하게는, 프로모터 서열 중 하나는 진핵생물 신장 인자 프로모터, 예컨대 EF-1 프로모터 (예를 들어, EF-1α)이다. 적절하게는, 이러한 프로모터가 tRNA 신테타제 유전자 및/또는 관심 핵산 서열에 작동가능하게 연결된다. 적절하게는, 이러한 배열이 본 개시내용의 구축물에서 적어도 1회 반복된다.

RNA Pol III 프로모터

적절하게는, 진핵생물 세포, 예컨대 포유동물 또는 곤충 세포에서 RNA Pol III 전사를 지시할 수 있는 임의의 프로모터가 본원에 기술된 구축물에서 사용될 수 있다. RNA Pol III 프로모터는 유전자내 및 유전자외 (내부 및 외부) 프로모터를 포함한다.

적절하게는, 상기 프로모터는 진핵생물 U6 프로모터, 적절하게는 호모 사피엔스 U6 프로모터이거나 또는 이로부터 유래된다.

예시적인 U6 프로모터가 문헌 [The Journal of Biological Chemistry (1987) 262(3), 1187-1193]에 기술되어 있다.

인간 및/또는 마우스 시스템에서 사용하기 위한 예시적인 U6 프로모터가 문헌 [Journal of the American Chemical Society (2010) 132(12), 4086-4088]에 기술되어 있다.

또 다른 예시적인 U6 프로모터는 하기에 기재된 서열을 포함하거나 또는 이로 이루어진다:

적절하게는, 프로모터는 본원에 기술된 바와 같은 하나 이상의 tRNA 유전자에 작동가능하게 연결된, 포유동물 세포, 예컨대 마우스 또는 인간 세포에서 RNA Pol III 전사를 지시할 수 있는 U6 프로모터이거나 또는 이로부터 유래된다.

신장 인자 프로모터

적절하게는, 진핵생물 세포, 예컨대 포유동물 또는 곤충 세포에서 발현을 지시할 수 있는 임의의 진핵생물 신장 인자 프로모터가 본원에 기술된 구축물에서 사용될 수 있다.

적절하게는 상기 프로모터는 진핵생물 신장 인자 1 (EF-1) 프로모터이거나 또는 이로부터 유래된다.

적절하게는, 상기 프로모터는 EF-1α 프로모터이거나 또는 이로부터 유래된다.

예시적인 EF-1α 프로모터가 문헌 [Anticancer Res. (2002), 22(6A), 3325-30]에 기술되어 있다.

또 다른 예시적인 EF-1α 프로모터는 하기에 기재된 서열을 포함하거나 또는 이로 이루어진다:

적절하게는, 프로모터는 본원에 기술된 바와 같은 tRNA 신테타제 및/또는 관심 핵산 서열에 작동가능하게 연결된, 포유동물 세포, 예컨대 마우스 또는 인간 세포에서 전사를 지시할 수 있는 EF-1α 프로모터이거나 또는 이로부터 유래된다.

숙주 세포

적절한 숙주 세포는 박테리아 세포 (예를 들어, 이. 콜라이)를 포함할 수 있지만, 가장 적절하게는, 숙주 세포는 진핵생물 세포, 예를 들어 곤충 세포 (예를 들어 드로소필라(Drosophila) 예컨대 드로소필라 멜라노가스터(Drosophila melanogaster)), 효모 세포, 선충 (예를 들어 씨. 엘레강스), 마우스 (예를 들어 무스 무스쿨루스(Mus musculus)), 또는 포유동물 세포 (예컨대 차이니즈 햄스터 난소 세포 (CHO) 또는 COS 세포, 인간 293T 세포, HeLa 세포, NIH 3T3 세포, 및 마우스 적백혈병 (MEL) 세포) 또는 인간 세포 또는 기타 진핵생물 세포이다. 기타 적절한 숙주 세포가 관련 기술 분야의 통상의 기술자에게 공지되어 있다. 적절하게는, 숙주 세포는 포유동물 세포, 예컨대 인간 세포 또는 곤충 세포이다.

본 발명의 실시양태에서 일반적으로 사용될 수 있는 기타 적절한 숙주 세포는 실시예 섹션에서 언급된 것들이다.

통상적인 형질전환 또는 형질감염 기술을 통해 벡터 DNA를 숙주 세포 내로 도입할 수 있다. 본원에서 사용된 바와 같이, 용어 "형질전환" 및 "형질감염"은 인산칼슘 또는 염화칼슘 공침전, DEAE-덱스트란-매개 형질감염, 리포펙션(lipofection), 또는 전기천공을 포함하여, 외래 핵산 분자 (예를 들어, DNA)를 숙주 세포 내로 도입하기 위한 다양한 잘 알려진 기술을 지칭하도록 의도된다. 숙주 세포를 형질전환 또는 형질감염시키는 적절한 방법이 관련 기술 분야에 널리 공지되어 있다.

세포주를 생성시킬 때, 안정적인 세포주가 제조되는 것이 일반적으로 바람직하다. 예를 들어 포유동물 세포의 안정적인 형질감염의 경우, 사용되는 발현 벡터 및 형질감염 기술에 따라, 소량의 세포만 외래 DNA를 이의 게놈 내로 통합시킬 수 있는 것으로 알려져 있다. 이러한 통합체를 확인 및 선별하기 위해, 선별성 마커 (예를 들어, 항생제에 대한 저항성)을 코딩하는 유전자가 일반적으로 관심 유전자와 함께 숙주 세포 내로 도입된다. 바람직한 선별성 마커는 약물, 예컨대 G418, 히그로마이신 또는 메토트렉세이트에 대한 저항성을 부여하는 것을 포함한다. 선별성 마커를 코딩하는 핵산 분자는 동일한 벡터 상에서 숙주 세포 내로 도입될 수 있거나 또는 별개의 벡터 상에서 도입될 수 있다. 도입된 핵산 분자로 안정적으로 형질감염된 세포를 약물 선별로 확인할 수 있다 (예를 들어, 선별성 마커 유전자가 혼입된 세포는 생존하는 한편, 다른 세포는 사망할 것이다).

한 실시양태에서, 본원에 기술된 구축물은 숙주 세포의 게놈 내로 통합된다. 안정적인 통합의 장점은 개별적인 세포 또는 클론들 사이의 균일성이 달성된다는 것이다. 또 다른 장점은 최상의 생산자의 선별이 수행될 수 있다는 것이다. 따라서, 안정적인 세포주를 생성시키는 것이 바람직하다.

또 다른 실시양태에서, 본원에 기술된 구축물은 숙주 세포 내로 형질감염된다. 구축물을 숙주 세포 내로 형질감염시키는 것의 장점은 단백질 수율이 최대화될 수 있다는 것이다.

한 측면에서, 본원에 기술된 핵산 구축물 또는 벡터를 포함하는 세포가 기술된다.

eRF1

맥락으로부터 달리 명백하지 않는 한, 본원에서 'eRF1'에 대한 언급은 진핵생물 eRF1을 지칭한다.

본원에서, 특히 eRF1의 논의에서 사용될 때, '돌연변이체'는 '야생형 이외의 것'이라는 이의 본래의 의미를 갖는다. 명확하게, 야생형 잔기는 사용되는 eRF1의 특정 종에 따라 다를 수 있다. 특정 잔기에 대한 언급은 진뱅크 등록 번호 AF095901.1의 eRF1에 대한 에이치. 사피엔스(H. sapiens) 야생형 기준 서열을 참조로 해석되어야 한다. 출원일의 데이터베이스 공개물에 의존한다. 의혹의 여지가 있는 경우, 이는 2015년 8월 15일자의 <Genetic Sequence Data Bank NCBI-GenBank Flat File Release 209.0>를 의미한다.

의혹을 피하기 위해, 야생형 인간 eRF1 폴리펩티드 서열은 하기의 것으로 간주된다:

특히, 본 출원에서 제공되는 아미노산 주소는 상기 eRF1 기준 서열의 번호매김에 상응한다. 말단절단 또는 확장 형태의 eRF1이 사용되는 경우 (예를 들어, 6his 태그가 부가되거나 또는 폴리펩티드의 일부 구획이 결실되는 경우), 아미노산 번호매김은 '절대적'이거나 엄격하게 융통성이 없는 숫자 주소로서가 아니라 전장 기준 서열의 등가의 구획에 상응하는 것으로 처리되어야 한다. 설명으로서, E55의 치환이 명세서에 언급되면, 이는 상기 eRF1 기준 서열의 아미노산 55를 의미한다. 또 다른 종의 위치 55이 야생형에서 E가 아니면, 예를 들어, 관련 기술 분야에 널리 공지된 바와 같이, 상기 다른 종의 eRF1의 서열을 상기 기준 서열과 정렬하고 상응하는 아미노산을 선택함으로써, 인간 야생형 서열의 E55에 상응하는 아미노산이 확인된다. 유사하게, 사용되는 폴리펩티드가 처음 10개의 아미노산의 결실에 의해 말단절단되는 경우, 제공되는 주소는 여전히 (예를 들어 E45가 아니라) E55일 것이다 - 관련 기술 분야에서 통상적인 바와 같이, 숙련된 독자는 이를 쉽게 이해하여, 상기 전장 eRF1 서열을 참조로 상응하는 맥락의 아미노산을 지칭할 것이다.

본 발명가들은 eRF1의 N-말단 도메인을 제거하는 다른 말단절단이 유사한 효과를 가질 것임을 교시한다. eRF1의 N-말단 도메인 (대략적으로 아미노산 1-130)은 메신저 RNA 및 정지 코돈과 상호작용한다. 이러한 도메인의 전체 또는 일부가 결실되면, 사용 시 이는 비활성 eRF1-eRF3 복합체 (델타 100 변이체로 예시됨)를 형성하고, 정지 코돈 번역초과 (및 독성)를 증가시킬 것이다. 적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 131부터 그 이후에 상응하는 아미노산 서열을 포함하고, 적절하게는 적어도 서열식별번호: 4의 아미노산 101부터 그 이후에 상응하는 아미노산 서열을 포함한다.

적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 101부터 끝부분까지에 상응하는 아미노산 서열을 포함한다.

적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 131부터 끝부분까지에 상응하는 아미노산 서열을 포함한다.

적절하게는 eRF1의 C-말단 끝부분은 서열식별번호: 4에 비해 말단절단되지 않거나 또는 최소한으로만 말단절단된다. 가장 적절하게는, eRF1의 C-말단 끝부분은 서열식별번호: 4에 비해 말단절단되지 않는다.

요구되는 임의의 정렬은 육안으로, 또는 관련 기술 분야에 공지된 광범위하게 입수가능한 서열 정렬 프로그램 중 임의의 것, 예컨대 GCG 스위트 프로그램 (GCG 제네틱스 컴퓨터 그룹(Genetics Computer Group) (위스컨신주 53711 매디슨 사이언스 드라이브 575 유니버시티 리서치 파크))을 사용하여 수행되어야 한다. 가장 적절하게는, 정렬은 ClustalW를 디폴트 설정으로 사용한다.

유리하게는, 다른 정지 코돈의 번역초과를 실질적으로 증가시키지 않으면서 하나 이상의 정지 코돈에 반응하여 비-천연 아미노산 혼입의 실질적인 증가를 제공하도록 본 개시내용에 따라 eRF1의 특정 돌연변이체가 사용될 수 있다. 따라서, 본원에 기술된 바와 같은 핵산 구축물을 세포에서 특정 eRF1 돌연변이체와 함께 발현시키는 것이 유리할 수 있다. 다양한 프로모터, 예컨대 EF1 프로모터 또는 CMV 프로모터를 사용하여 eRF1을 발현시킬 수 있다.

가장 적절하게는, 본 발명의 eRF1 돌연변이체는 증가된 효율의 비-천연 아미노산 혼입을 제공한다.

적절하게는, 본 발명의 eRF1 돌연변이체는 천연 번역 제어에 비해 비-천연 아미노산 혼입 효율을 증가시킨다.

적절하게는, 본 발명의 eRF1 돌연변이체는 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공한다.

이는 본원에 교시된 바와 같이, 예를 들어, 실시예 섹션을 참조로 쉽게 결정될 수 있다.

특정 실시양태에서, 돌연변이체 eRF1은 숙주 세포 내로 통합되고, 적절하게는 숙주 세포 내로 안정적으로 통합된다.

특정 실시양태에서, 돌연변이체 eRF1은 본원에 기술된 핵산 구축물 중 하나 이상으로부터 숙주 세포에서 발현된다.

특정 실시양태에서, 돌연변이체 eRF1을 코딩하는 핵산 서열은 별개의 구축물 또는 별개의 벡터 상에 있다.

TB3-1로 또한 알려진 진핵생물 번역 종결 인자 1 (eRF1)은 인간에서 ETF1 유전자에 의해 코딩되는 단백질이다. 진핵생물에서, 이는 3개 모두의 정지 코돈을 인식하는 유일한 방출 인자이다. 리보솜의 아미노아실 부위에 인-프레임(in-frame) 정지 코돈이 존재하는 것에 의해 단백질 생합성의 종결 및 신생 폴리펩티드 쇄의 방출이 신호된다. 번역 종결 프로세스는 보편적이고, 단백질 방출 인자 (RF) 및 GTP에 의해 매개된다.

예시적인 eRF1 유전자 서열은 진뱅크 등록 번호 AF095901.1에 기술된 바와 같은 야생형 호모 사피엔스 eRF1 유전자 서열이다. 적절하게는, eRF1 유전자는, 예를 들어, 드로소필라 멜라노가스터에 대해, 코돈-최적화될 수 있다.

또한 포유동물 세포에서 shRNA를 사용하여 eRF1 발현을 녹다운시키는 것이 억제의 일시적인 증가를 제공한 후에 해로울 수 있다. 높은 수준의 정지 코돈 번역초과가 또한 발생할 수 있다. 명확하게, 이러한 해로운 효과들을 피해야 하고, 적절하게는 본 개시내용에서 shRNA가 사용되지 않아야 한다.

본 발명에서 유용한 eRF1 돌연변이체가 하기 표에서 개시된다:

* 어떤 eRF1 돌연변이체를 사용할지 선택할 때, 통상의 기술자는 세포 생육성과 증가된 억제 사이의 상호관계를 고려할 것이다. 예를 들어, Δ100 eRF1 돌연변이체는 높은 수준의 정지 코돈 번역초과 및 병든 세포를 초래할 수 있다. 따라서, 적절하게는 본 개시내용에서 Δ100 eRF1 돌연변이체가 사용되지 않는다.

** 혼입 신호로서의 UAG용으로 유용하지 않지만, UGA용 용도가 있을 수 있다.

때때로, 돌연변이되지 않은 부위(들), 예컨대 "L124L"이 언급된다. 명확하게, 이는 야생형 'L'이 바뀌지 않기 때문에 돌연변이가 아니다. 이는 L124가 이러한 특정 eFR1에서 돌연변이되지 않는다, 즉, 위치 L124가 이러한 특정한 돌연변이 조합/이러한 특정한 예시적인 eRF1에서 야생형으로 (L로) 남는다는 것을 나타내는 것으로 이해되어야 한다.

소정의 위치에서의 각각의 돌연변이에 대해, 유사한 효과를 제공할 다수의 밀접하게 관련된 아미노산들이 있는 것으로 여겨진다. '예시적인 돌연변이체'는 철저한 것으로 의도되지 않는다. 상기 칼럼 I에서 확인되는 잔기에 대한 '야생형이외의 것'에 대한 돌연변이가 또한 구상된다. 더욱 적절하게는, 예를 들어 하기 표에 따라, 칼럼 II에서 언급된 잔기에 보존적 치환이 이루어질 수 있다. 하기 표의 두번째 칼럼 내의 동일한 블럭, 바람직하게는 세번째 칼럼의 동일한 줄 내의 아미노산이 서로 치환될 수 있다:

예를 들어, 칼럼 I의 E55가 'E 이외의 것'으로 돌연변이될 수 있다. 더욱 적절하게는, E55가 칼럼 II 내의 특정 돌연변이에 대해 보존적인 아미노산, 예컨대 E55D 또는 E55A 또는 E55G 또는 E55P로 돌연변이될 수 있다. 가장 적절하게는, E55가 칼럼 II에서 구체적으로 언급된 아미노산, 예컨대 E55A 또는 E55D, 가장 적절하게는 E55D로 돌연변이될 수 있다. 이는 칼럼 I에 열거된 다른 잔기들에 동일하게 적용된다.

모든 S123, L124, Y125 돌연변이체가 DLR 검정법에서 E55D에 비교하여 잘 작동하지만 (E55D보다 1-2×더 양호함), 단백질 발현 테스트에서는 E55D보다 덜 작동한다. 본 발명에서 이들이 여전히 유용하지만, 가장 바람직한 돌연변이체는 E55D이다. (sfGFP(3TAG).

일부 돌연변이가 조합되어 존재하지만, 이러한 조합은 본 발명의 특히 바람직한 예이다. 개별적인 eRF1 돌연변이체들의 사용이 개시된다; 적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해 E55, N129, K130, T122, S123, Y125, T58, S60, S64, L125, S123, L124, M51, 및 K130으로 이루어진 군으로부터 선택된 돌연변이를 포함한다. 적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해 E55D, N129P, K130Q, T122Q, S123F, E55A, Y125F, T58K, S60T, S64D, L125F, N129S, S123A, L124I, Y125L, S123R, L124W, Y125R, S123H, L124A, Y125G, M51A, K130M, Y125V, S123L, L124C, Y125S, S123L, L124S, Y125S, S123V, L124T, 및 Y125P로 이루어진 군으로부터 선택된 돌연변이를 포함한다.

eRF1은 일시적인 발현에 의해 또는 게놈 통합에 의해 숙주 세포 내에 제공될 수 있다. 예를 들어, TRex Flip-In 시스템 (인간 HEK293-유래)을 사용하여 안정적인 유전적 배경에서 eRF1 돌연변이체가 유도적으로 발현되게 한다. 한 실시양태에서, 관련 핵산은 일시적인 형질감염에 의해 도입된다. 한 실시양태에서, 관련 핵산은 안정적인 세포주 생성에 의해 도입된다.

M51A/K130M, T122Q/S123F, S70A/G73S, E55D, E55A, N129P/K130Q 및 Y125F를 포함하여 다양한 특히 적절한 돌연변이체 및 조합이 본원에서 기술된다. 적절하게는, 본 개시내용에서 사용되는 eRF1 돌연변이체는 E55에 돌연변이를 포함한다. 적절하게는, 본 개시내용에서 사용되는 eRF1 돌연변이체는 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택된다. 이러한 돌연변이들은 진뱅크 등록 번호 AF095901.1로부터 유래되는 야생형 호모 사피엔스 eRF1 아미노산 서열 또는 이의 코돈-최적화 변이체에 관하여 이루어진다.

eRF1 단백질은 대부분의 진핵생물에 걸쳐 매우 강한 상동성을 나타낸다. 본 발명가들의 돌연변이를 도입하기 위한 예로서 본 발명가들은 인간 eRF1을 사용하였지만, 다른 종으로부터의 eRF1 또한 동일한 돌연변이 (예를 들어 인간 또는 곤충 eRF1 단백질 내의 E55D)를 보유할 수 있다. 본 발명가들은 이러한 대안적인 종 돌연변이체 eRF1 단백질이 본원에서의 예시적인 eRF에 대해 제시된 바와 유사한 기술적 효과를 지닐 것임을 교시한다.

본 발명가들은 바람직한 eRF1 돌연변이체 (조작된 인간 (에이치. 사피엔스) eRF1 변이체)를 사용하여, CHO 세포 (씨. 그리세우스(C. griseus)), HEK 세포 (에이치. 사피엔스) 및 Dmel 세포 (디. 멜라노가스터)를 포함하는 다양한 진핵생물 숙주 세포에서 성공적으로 비-천연 아미노산 혼입을 강화하였다. 이러한 생물들 내의 eRF1 단백질은 고도로 보존된다 (표 1).

표 1: 다양한 종에서의 eRF1의 쌍-방식 유사성. 제공된 백분율은 ClustalW 정렬에 의해 결정된 바와 같은, 단백질에 걸쳐 보존된 아미노산 동일성을 가리킨다.

다양한 단세포 (효모) 및 다세포 (포유동물, 곤충) 진핵생물 사이의 보존 수준을 고려하여, 다양한 진핵생물 종으로부터의 eRF1 변이체가 여러 다른 진핵생물 종 숙주 세포에서 기능성일 것이라는 것이 지지된다. 예를 들어, 숙주 세포는 인간, 마우스, 씨. 엘레강스, 당나귀, 효모 또는 기타 진핵생물 숙주 세포일 수 있다.

적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 67％인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 84％인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 92％인 아미노산 서열을 갖거나, 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 95％인 아미노산 서열을 갖거나, 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 98％인 아미노산 서열을 갖거나, 또는 이를 초과한다.

한 실시양태에서, 적절하게는, 돌연변이체 eFR1에 대해 언급된 구체적인 돌연변이가 도입되기 전에 백분율 동일성 수준이 계산된다. 바람직하게는, 돌연변이체 eFR1에 대해 언급된 구체적인 돌연변이를 포함하여 백분율 동일성 수준이 계산된다.

적절하게는, 숙주 세포는 시험관 내의 것이다. 숙주 세포가 생물 내에 있는 경우, 적절하게는 숙주는 비-인간이다.

본 발명가들은 예시적인 인간 eRF1을 3가지 진핵생물 종 (인간, 햄스터, 파리)로부터의 세포주, 뿐만 아니라 살아 있는 진핵생물 동물 (파리) 내로 도입하였다.

조작된 인간 eRF1은 천연 eRF1이 84％만 보존되는 종 (Dmel 곤충 세포)에서 비-천연 아미노산 혼입을 강화한다.

본 발명가들은 구축물을 사용하여 천연 효모 eRF1을 본 발명가들의 예시적인 인간 eRF1 변이체 (문헌 [Nucleic Acids Res. 2010 Sep;38(16):5479-92]로부터 유래된 플라스미드)로 교체하였다. 이는 다양한 eRF1 단백질이 67％만의 보존 (서열 동일성)으로 사용될 수 있고 광범위한 진핵생물을 포괄한다는 것을 나타낸다.

당연히, eRF1 (또는 변이체)에 대한 핵산 서열은 중요하지 않다 - 한 예시적인 인간 eRF1 변이체가 곤충 세포에서 잘 발현되도록 코돈-최적화되었지만, 인간 세포주에서 또한 작동한다. 따라서, 핵산의 코돈 최적화 (원하는 경우)는 통상의 기술자의 일이다.

앰버 억제가 증가된다는 것이 본 발명의 장점이다. 적절하게는, 본원에 기술된 eRF1 돌연변이체가 앰버 억제에서 사용된다.

진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도가 또한 개시된다.

관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법이 또한 개시된다. 이러한 방법은 (i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 본원에 기술된 바와 같은 진핵생물 세포인 단계; (ii) 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 세포를 eRF1의 돌연변이체의 존재 및 부재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 (iii) eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계를 포함한다.

하나 이상의 돌연변이를 eRF1 내로 혼입시키는 방법은 관련 기술 분야에 널리 공지된 부위-지정 돌연변이유발 등을 포함한다. 적절하게는, 선택되는 돌연변이는 참고문헌 25-30에 기술된 바와 같이 앰버 코돈에서의 종결에 대한 효과가 있는 eRF1 내의 아미노산에서의 돌연변이를 기초로 할 수 있다. 적절하게는, 선택되는 돌연변이는 리보솜 내에서 mRNA 상의 정지 코돈과 상호작용하는 eRF1의 N-말단 도메인에 위치할 수 있다 (도 2a 참조). 바람직하게는, eRF1 돌연변이체는 다른 정지 코돈의 번역초과를 증가시키지 않으면서 선택된 코돈, 예컨대 TAG에 반응하여 효율적인 비-천연 아미노산 혼입을 초래한다.

한 실시양태에서, 본 개시내용에서 방출 인자 돌연변이체, 예컨대 eRF1가 사용되지 않는다.

한 실시양태에서, 숙주 세포로부터 내인성 방출 인자, 예컨대 eRF1의 발현이 감소되거나 결실된다. 이는, 예를 들어, eRF1을 코딩하는 게놈 유전자좌 중 하나 이상의 파괴에 의해, 또는 eRF1의 RNA-매개 유전자 침묵화를 통해 달성될 수 있다.

비-천연 아미노산(들)을 포함하는 단백질의 제조

관심 핵산 서열 내에 존재하는 하나 이상의 특정한 코돈이 비-천연 아미노산을 코딩하도록 할당되어 비-천연 아미노산이 직교 tRNA 신테타제/tRNA 쌍을 사용하여 관심 단백질 내로 유전적으로 혼입될 수 있는, 직교이거나 확장된 유전자 코드가 본 개시내용에서 사용될 수 있다. 직교 tRNA 신테타제/tRNA 쌍은 tRNA에 비-천연 아미노산을 장전시킬 수 있고, 코돈에 반응하여 이러한 비-천연 아미노산을 폴리펩티드 쇄 내로 혼입시킬 수 있다.

코돈은 앰버, 오커, 오팔 코돈, 또는 4중 코돈일 수 있다. 간단하게 코돈은 비-천연 아미노산을 운반하도록 사용될 직교 tRNA에 상응하여야 한다. 적절하게는, 코돈은 앰버이다. 적절하게는, 코돈은 직교 코돈이다.

비-천연 아미노산 혼입은 대체로 앰버 UAG 코돈 상에서 수행된다. 적절하게는, 코돈은 UAG 또는 UGA이고, 가장 적절하게는 UAG (앰버)이다. 예시적인 돌연변이는 앰버 (UAG) 정지 코돈 상에서의 방출 인자의 활성을 최소화한다 (예를 들어 E55D). 기술된 다른 돌연변이들은 앰버 정지 코돈의 인식에 영향을 미치지 않을 수 있지만, UGA 또는 UAA 정지 코돈 (오팔/오커) 상에서의 종결 활성을 감소시킬 수 있다. 이는 S70A, G73S에 의해 예시된다. UAG (앰버) 이외의 코돈을 사용할 때 통상의 기술자는 이들의 요구에 맞도록 eRF1 돌연변이체를 선택할 것이다.

본원에 제시된 구체적인 예가 앰버 코돈 및 상응하는 tRNA/tRNA 신테타제를 사용하였음을 주지하여야 한다. 상기 언급된 바와 같이, 이들은 다양할 수 있다. 대안적으로, 비-천연 아미노산과 함께 작동할 수 있는 대안적인 tRNA/tRNA 신테타제 쌍을 사용하거나 선택하는 수고 없이 다른 코돈을 사용하기 위해, 간단하게 tRNA의 안티코돈 영역을 선택된 코돈에 대한 원하는 안티코돈 영역으로 교환할 수 있다. 안티코돈 영역은 tRNA의 장전 또는 혼입 기능 또는 tRNA 신테타제에 의한 인식에 수반되지 않아서, 이같은 교환은 전적으로 통상의 기술자의 영역에 속한다.

따라서, 원한다면 대안적인 직교 tRNA 신테타제/tRNA 쌍을 사용할 수 있다.

숙주 세포를 사용하여, 하나 이상의 비-천연 아미노산을 포함하는 단백질을 생산할 수 있다 (예를 들어, 발현시킬 수 있다).

본원에 개시된 구축물 또는 벡터가 도입되는 숙주 세포를 tRNA, tRNA 신테타제 및 관심 단백질이 생산되도록 적절한 배지에서 배양하거나 유지시킨다. 배지는 관심 단백질에 비-천연 아미노산(들)이 혼입되도록 비-천연 아미노산(들)을 또한 포함한다. 이같은 단백질은 코딩 서열 내에 본원에 기술된 바와 같은 코돈을 하나 이상 포함하는 핵산에 의해 코딩된다. 이러한 코돈에 반응하여, 직교 tRNA 신테타제/tRNA 쌍이 tRNA에 비-천연 아미노산을 장전시키고, 비-천연 아미노산을 폴리펩티드 쇄 내로 혼입시킨다.

추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) 본원에 기술된 구축물(들) 또는 벡터(들)를 포함하는 진핵생물 세포를 제공하는 단계; ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 하나 이상의 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

tRNA 및 tRNA 신테타제를 포함하고, 하나 이상의 인-프레임 직교 (정지) 코돈이 있는 관심 핵산 서열을 포함하는 본원에 기술된 핵산 구축물들을 숙주 세포 내로 도입함으로써, 비-천연 아미노산(들)을 포함하는 단백질이 제조된다. 숙주 세포를 비-천연 아미노산(들)을 포함하는 생리 용액에 노출시킨 후, 숙주 세포를 관심 단백질의 코딩 서열의 발현을 허용하는 조건 하에 유지시킨다. 이러한 코돈에 반응하여 비-천연 아미노산(들)이 폴리펩티드 쇄 내로 혼입된다.

유리하게는, 1개를 초과하는 비-천연 아미노산이 관심 단백질 내로 혼입된다. 대안적으로, 2개 이상의 비-천연 아미노산이 단백질 내의 2개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 3개의 비-천연 아미노산이 단백질 내의 3개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 4개의 비-천연 아미노산이 단백질 내의 4개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 5개의 비-천연 아미노산이 단백질 내의 5개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 6개의 비-천연 아미노산이 단백질 내의 6개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 7개의 비-천연 아미노산이 단백질 내의 7개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 8개의 비-천연 아미노산이 단백질 내의 8개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다.

다중 비-천연 아미노산이 관심 단백질 내로 혼입될 경우, tRNA 신테타제/tRNA 쌍이 코돈(들)에 반응하여 비-천연 아미노산의 혼입을 지시할 수 있도록 다중 코돈이 원하는 위치에서 코딩 핵산 서열 내로 혼입될 필요가 있을 것임이 이해될 것이다. 적어도 1, 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 코돈 코딩 핵산이 관심 핵산 서열 내로 혼입될 수 있다.

1가지를 초과하는 유형의 비-천연 아미노산을 관심 단백질 내로 단일 단백질 내로 혼입시키는 것을 원하는 경우, 제2 또는 추가 직교 tRNA-tRNA 신테타제 쌍이 제2 또는 추가 비-천연 아미노산을 혼입시키는데 사용될 수 있다; 적절하게는, 단일 제작 단계에서 2가지 이상의 비-천연 아미노산이 단백질 내의 상이한 규정된 부위 내로 특이적으로 혼입될 수 있도록 상기 제2 또는 추가 직교 tRNA-tRNA 신테타제 쌍은 관심 단백질을 코딩하는 핵산 내의 상이한 코돈을 인식한다. 따라서, 특정 실시양태에서, 2가지 이상의 직교 tRNA-tRNA 신테타제 쌍이 사용될 수 있다.

비-천연 아미노산(들)이 혼입된 관심 단백질이 숙주 세포에서 생산되었으면, 효소, 화학적 및/또는 삼투압 용해 및 물리적 파괴를 포함하는 관련 기술 분야에 공지된 다양한 기술에 의해 이를 세포로부터 추출할 수 있다. 관련 기술 분야의 표준 기술 예컨대 분취용 크로마토그래피, 친화력 정제 또는 임의의 기타 적절한 기술에 의해 관심 단백질을 정제할 수 있다.

비-천연 아미노산

본원에서 사용된 바와 같이, 용어 "비-천연 아미노산"은 단백질에서 천연적으로 발생하는 20개의 아미노산 이외의 아미노산을 지칭한다.

비-천연 아미노산의 비제한적인 예는 하기를 포함한다: p-아세틸-L-페닐알라닌, p-아이오도-L-페닐알라닌, O-메틸-L-티로신, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-Dopa, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비-천연 유사체; 글루타민 아미노산의 비-천연 유사체; 페닐알라닌 아미노산의 비-천연 유사체; 세린 아미노산의 비-천연 유사체; 트레오닌 아미노산의 비-천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로고리형, 에논, 이민, 알데히드, 히드록실아민, 케토, 또는 아미노로 치환된 아미노산, 또는 이들의 조합물; 광-활성화성 가교제가 있는 아미노산; 스핀-표지 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 광-케이징(photocaged) 및/또는 광-이성질화성 아미노산; 비오틴 또는 비오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중원자로 치환된 아미노산; 화학적으로 절단성이거나 광-절단성인 아미노산; 측쇄가 신장된 아미노산; 독성 기를 함유하는 아미노산; 당으로 치환된 아미노산; 탄소-연결 당을 함유하는 아미노산; 산화환원-활성 아미노산; α-히드록시를 함유하는 산; 아미노 티오 산; α, α 2치환 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 고리형 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산.

본원에 기술된 바와 같이 단백질 내로 선택된 하나 이상의 비-천연 아미노산(들)을 혼입시키기 위해, 통상의 기술자는 코돈을 인식하는 직교 tRNA를 장전시킬 수 있는 올바른 신테타제를 간단하게 선택할 수 있다.

상이한 비-천연 아미노산들의 혼입의 구체적인 예가 본원에서 제공된다.

실시예 2에서, (N ^ε-[(tert-부톡시)카르보닐]-l-리신) 및 (N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신의 혼입이 실연된다. 이러한 화합물들의 구조가 차트 1b에서 제시된다. 이러한 기질 양쪽 모두 PylRS/tRNA_CUA 쌍에 대한 공지된 효율적인 기질이다 (문헌 [Nat Biotechnol 2014, 32, 465] 및 [J Am Chem Soc 2009, 131, 8720]).

실시예 9에서, Boc-K (N ^ε-[(tert-부톡시)카르보닐]-l-리신), 노르보넨-K (N ^ε-노르보르넨-2-일옥시카르보닐-L-리신), 시클로프로펜-K (N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) 및 비시클로닌-K (N ^ε-([(1R,8S)-비시클로[6.1.0]논-4-인-9-일메톡시]카르보닐)-리신)의 혼입이 제시된다.

WO2010/139948은 직교 tRNA-tRNA 신테타제 쌍을 사용하여 관심 단백질 내로 알킨-아지드 결합을 지지할 수 있는 지방족 또는 직쇄 탄소 백본 아미노산을 혼입시키는 것을 기술한다.

WO2013/10844는 직교 tRNA-tRNA 신테타제 쌍을 사용하여 노르보르넨 아미노산을 관심 단백질 내로 혼입시키는 것을 기술한다.

항체

적절하게는, 관심 핵산 서열은 항체 또는 항체 단편을 코딩한다. 하나 이상의 비-천연 아미노산, 적절하게는 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 비-천연 아미노산이 항체 또는 항체 단편 내로 혼입될 수 있다.

본원에서 사용된 바와 같이, 용어 "항체"는 상응하는 항원에 비-공유결합으로, 가역적으로, 그리고 특이적 방식으로 결합할 수 있는 면역글로불린 패밀리의 단백질을 지칭한다. 이러한 용어는 모노클로날 항체, 인간 항체, 인간화 항체, 낙타류 항체, 키메라 항체, 및 항-이디오타입 (항-Id) 항체를 포함하지만, 이에 제한되지 않는다. 항체는 임의의 아이소타입/클래스일 수 있고, 따라서 IgG, IgE, IgM, IgD, IgA 및 IgY, 또는 항체의 서브클래스, 예컨대 IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2를 포함할 수 있다.

본원에서 사용된 바와 같이, 용어 "항체 단편"은 항원의 에피토프와 (예를 들어, 결합, 입체 장애, 안정화/탈안정화, 공간 분포에 의해) 특이적으로 상호작용하는 능력을 유지하는 항체의 하나 이상의 부분을 지칭한다. 결합 단편의 예는 단일쇄 Fv (scFv), 디술피드로 연결된 Fv (sdFv), Fab 단편, F(ab') 단편 (VL, VH, CL 및 CH1 도메인으로 이루어진 1가 단편), F(ab)₂ 단편 (힌지 영역에서 디술피드 다리로 연결된 2개의 Fab 단편을 포함하는 2가 단편), VH 및 CH1 도메인으로 이루어진 Fd 단편, 항체의 한쪽 팔의 VL 및 VH 도메인으로 이루어진 Fv 단편, VH 도메인으로 이루어진 dAb 단편, 및 단리된 상보성 결정 영역 (CDR), 또는 항체의 기타 에피토프-결합 단편을 포함하지만, 이에 제한되지 않는다. 추가로, Fv 단편의 2개의 도메인인 VL 및 VH가 별개의 유전자에 의해 코딩되지만, 재조합 방법을 사용하여, 이들이 단일 단백질 쇄로서 만들어지게 할 수 있는 합성 링커에 의해 이들이 연결될 수 있고, 이러한 단일 단백질 쇄에서 VL 및 VH 영역은 쌍을 이루어 1가 분자 (단일쇄 Fv ("scFv")로 알려짐)를 형성한다. 이같은 단일쇄 항체가 용어 "항원 결합 단편" 내에 포함된다. 관련 기술 분야의 통상의 기술자에게 공지된 통상적인 기술을 사용하여 이러한 항원 결합 단편들이 수득되고, 단편들을 무손상 항체와 동일한 방식으로 활성에 대해 스크리닝할 수 있다.

항체는 단일특이적, 이중특이적, 또는 다중특이적일 수 있다. 다중특이적 항체는 1개의 표적 단백질의 상이한 에피토프들에 대해 특이적일 수 있거나, 또는 1개를 초과하는 표적 단백질에 대해 특이적인 항원-결합 도메인들을 함유할 수 있다. 항체는 또 다른 기능성 분자, 예컨대 또 다른 펩티드 또는 단백질에 연결될 수 있거나 또는 이와 공동-발현될 수 있다. 예를 들어, 항체 또는 이의 단편이 하나 이상의 다른 분자 물질, 예컨대 또 다른 항체 또는 항체 단편에 기능적으로 연결되어, 제2의 결합 특이성이 있는 이중특이적 또는 다중특이적 항체가 생산될 수 있다. 예를 들어, 화학적 커플링, 유전자 융합, 또는 비-공유결합 회합을 사용하여 기능적 연결이 달성될 수 있다.

다른 예시적인 이중특이적 형식은 scFv-기반 또는 디아바디(diabody) 이중특이적 형식, IgG-scFv 융합물, 이중 가변 도메인 (DVD)-Ig, 쿼드로마(Quadroma), 놉-홀(knobs-into-holes), 통상적인 경쇄 (예를 들어, 통상적인 경쇄 + 놉-홉 등), 크로스맙(CrossMab), 크로스팝(CrossFab), (시드)바디((SEED)body), 류신 지퍼, 듀오바디(Duobody), IgG1/IgG2 및 이중 작용 Fab (DAF)-IgG 이중특이적 형식 (예를 들어, 문헌 [mAbs (2012) 4:6, 1-11] 참조)를 포함한다.

적절하게는, 사용되는 항체는 인간 항체이다. 용어 "인간 항체"는 프레임워크 및 CDR 영역 양쪽 모두가 인간 기원의 서열로부터 유래되는 가변 영역을 갖는 항체를 포함한다. 추가로, 항체가 불변 영역을 함유하면, 불변 영역 또한 이같은 인간 서열, 예를 들어, 인간 생식계열 서열, 또는 돌연변이된 버전의 인간 생식계열 서열, 또는 인간 프레임워크 서열 분석으로부터 유래된 컨센서스 프레임워크 서열을 함유하는 항체로부터 유래된다. 인간 항체는 인간 서열이 코딩하지 않는 아미노산 잔기 (예를 들어, 시험관 내에서의 무작위 또는 부위-특이적 돌연변이유발에 의해 또는 생체 내에서의 체세포 돌연변이에 의해 도입된 돌연변이, 또는 안정성 또는 제작을 촉진하기 위한 보존적 치환)을 포함할 수 있다.

항체 약물 접합체

하나 이상의 비-천연 아미노산이 혼입되어 있는 항체 또는 항체 단편이 항체 약물 접합체 (ADC)를 제조하는데 사용될 수 있다.

ADC는 약물 모이어티에 접합된 항체(들) 또는 항체 단편(들)을 포함한다. 약물 모이어티는 ADC가 존재하는 세포에 원하는 영향을 미치는 임의의 약물 모이어티일 수 있다. 예를 들어, 이는 항암제, 항-혈액 장애 작용제, 항-자가면역 치료제, 항염증제, 항진균제, 항균제, 항기생충제, 항바이러스제, 또는 마취제, 또는 방사성 동위원소 등일 수 있다.

필요하다면 하나 이상의 동일하거나 상이한 약물 모이어티에 항체 또는 항체 단편이 접합될 수 있다. 소정의 생물학적 반응을 변형시키는 약물 모이어티에 항체 또는 항체 단편이 접합될 수 있다. 따라서, 예를 들어, 약물 모이어티는 원하는 생물학적 활성을 지니는 단백질, 펩티드, 또는 폴리펩티드일 수 있다. 이같은 단백질은, 예를 들어, 독소, 세포독소, 단백질, 예컨대 종양 괴사 인자, 시토카인, 아포프토시스 작용제, 항-혈관형성제, 또는 생물학적 반응 변형제, 예컨대 림포카인을 포함할 수 있다.

약물 모이어티를 항체 또는 항체 단편에 접합시키는 다양한 방법이 관련 기술 분야에 널리 공지되어 있다. 예를 들어, 항체에 대한 부위-특이적 약물 접합을 위한 현행 방법이 검토되어 있는 문헌 [MAbs (2014) 6(1): 46-53]을 참조할 수 있다. 단백질의 화학적 변형을 위한 다양한 기술이 또한 관련 기술 분야에 공지되어 있다 (예를 들어, 문헌 [Nat Chem Biol. (2011) 7, 876-84]; [Bioconjugate Techniques, Elsevier (2008)] 및 [Chem Biol. (2010) 17, 213-27]을 참조한다).

링커를 통해 약물 모이어티가 항체 또는 항체 단편에 연결될 수 있다. 본원에서 사용된 바와 같이, "링커"는 항체 또는 항체 단편을 약물 모이어티에 연결할 수 있는 임의의 화학적 모이어티를 지칭한다. 링커는 절단, 예컨대 산-유도 절단, 광-유도 절단, 펩티다제-유도 절단, 에스테라제-유도 절단, 및 디술피드 결합 절단에 감수성일 수 있다 (절단성 링커). 대안적으로, 링커는 절단에 대해 실질적으로 저항성일 수 있다 (예를 들어, 안정적 링커 또는 비-절단성 링커).

관련 기술분야에 공지된 다양한 검정법으로 ADC를 이의 물리적/화학적 성질 및/또는 생물학적 활성에 대해 특성화하고 선택할 수 있다. 예를 들어, 공지된 방법, 예컨대 ELISA, FACS, 비아코어(Biacore) 또는 웨스턴 블롯에 의해 항체를 이의 항원 결합 활성에 대해 테스트할 수 있다. 트랜스제닉 동물 및 세포주가 예방적 또는 치료적 처치로서의 잠재력이 있는 ADC를 스크리닝하는데 특히 유용하다. 유용한 ADC를 스크리닝하는 것은 후보 ADC를 다양한 용량에 걸쳐 트랜스제닉 동물에게 투여하고, 평가되는 질환 또는 장애에 대한 ADC의 효과(들)에 대해 다양한 시점에 검정하는 것을 수반할 수 있다. 대안적으로, 또는 추가적으로, 적용가능한 경우, 질환 유도체에 대한 노출 이전에 또는 이와 동시에 약물을 투여할 수 있다. 후보 ADC를 연속적으로 및 개별적으로, 또는 병행적으로 중등도 또는 고도-처리량(throughput) 스크리닝 형식 하에 스크리닝할 수 있다.

따라서, 추가 측면에서, 하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법이 제공된다: i) 본원에 기술된 진핵생물 세포를 제공하는 단계이며, 여기서 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 것인 단계; ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및 vi) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계. 비-천연 아미노산과 약물 모이어티 사이의 링커가 사용될 수 있다.

한 실시양태에서, 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수)의 비-천연 아미노산을 포함하는 항체 또는 항체 단편이 비-천연 아미노산과 약물 모이어티 사이의 연결을 통해 약물 모이어티에 접합된다. 전통적으로, 약물 모이어티는 항체 또는 항체 단편 내의 시스테인 또는 리신 잔기에 비-선택적으로 접합된다. 그러나, 이러한 전략은 종종 비균질한 생성물에 이르고, 이는 ADC의 생물학적, 물리적 및 약리학적 성질의 최적화를 힘들게 한다. 접합 부위 및 화학양론을 정확하게 제어하면서 균질한 ADC를 합성하도록 비-천연 아미노산을 접합점으로 사용하는 것은 개선된 약동학 및 개선된 효능을 포함할 수 있는 다수의 장점을 제공한다. 따라서 부위-특이적 접합 방법이 고도로 바람직하다.

지금까지, 많은 ADC가 항체 당 평균 4개의 약물을 표적화하였다. 이러한 비가 세포독성 및 약동학적 안정성의 최적의 조합으로서 선택되었다 (문헌 [Acc. Chem. Res (2008) 41(1) 98-107] 및 [Clin. Cancer. Res (2004) 10(20):7063-7070] 참조). 따라서, 특정 실시양태는 비-천연 아미노산과 약물 모이어티 사이의 연결을 통해 약물 모이어티에 접합될 수 있거나 또는 접합되는 약 4개의 비-천연 아미노산을 포함하는 항체 또는 항체 단편에 관한 것이다.

한 예시적인 실시양태에서, 항체는 항-HER2/neu IgG1 인간화 항체 또는 이의 변이체 또는 유도체, 예컨대 트라스투주맙(Trastuzumab)이다.

하나 이상의 소형 분자의 접합을 위한 상이한 비-천연 발생 아미노산들 (예를 들어, N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신)이 혼입될 것이다. 이러한 분자는 테트라진 화학을 사용하여 비-천연 아미노산(들)을 함유하는 mAb와 접합될 수 있다. 이러한 분자는 면역 반응을 유도하는 화학적 모이어티 또는 세포독성 분자를 포함할 수 있다.

유리하게는, N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신)이 앰버 코돈에서 매우 높은 혼입율 (그리고, 이에 따라 더 높은 단백질 발현)을 나타낼 것이다. 공공 도메인에서 단백질 접합에 사용되는 다수의 UAA와 비교하여, 시클로프로펜은 더 긴 측쇄 및 용매에 더 많이 노출되는 접합 핸들을 갖는다. 이러한 긴 측쇄는, 앰버-코돈의 높은 혼입율과 조합되어, mAb 스캐폴드 내의 더 많은 부위에서의 UAA의 혼입을 허용할 것이다. 이러한 유연성은 상이한 항체-약물 접합체들에 대해 맞춤제작하는데 중요할 수 있다.

키트

하나 이상의 비-천연 아미노산을 포함하는 관심 단백질을 생산하기 위한 키트가 또한 제공된다.

한 측면에서, (i) 본원에 기술된 핵산 구축물; 또는 (ii) 본원에 기술된 핵산 구축물 조합물; 또는 (iii) 본원에 기술된 벡터; 또는 (iv) 본원에 기술된 벡터 조합물; 또는 (v) 본원에 기술된 세포를 포함하고; (vi) 임의적으로 비-천연 아미노산을 포함하는, 진핵생물 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트가 제공된다.

키트는 시약들을 사용하여 이같은 단백질을 생산하는 방법을 기술하는 인쇄된 설명서 물질을 또한 포함할 수 있다.

일반적인 재조합 DNA 기술

본 발명은, 달리 지시되지 않는 한, 화학, 분자생물학, 미생물학 및 재조합 DNA 기술의 통상적인 기술을 사용하고, 이는 관련 기술 분야의 통상의 기술자의 능력 내에 속한다. 이같은 기술이 문헌에 설명되어 있다. 예를 들어, 문헌 [M. Green & J. Sambrook, 2012, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press]을 참조한다. 이러한 교재는 본원에 참조로 포함된다.

이제 본 발명이 번호가 매겨진 항에 의해 기술된다:

제1항

(i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및

(ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고,

제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는

tRNA가 핵산 구축물 내에 다중 카피로 존재하는,

진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물.

제2항

제1항에 있어서, 핵산 구축물이 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함하는 핵산 구축물.

제3항

제2항에 있어서, 프로모터가 제1 프로모터와 동일한 방향으로 배향되고, 임의적으로는 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 프로모터가 제1 프로모터와 동일하거나 또는 제1 프로모터와 상이한 핵산 구축물.

제4항

제1항 내지 제3항 중 어느 한 항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 서열을 추가로 포함하고, 적절하게는 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되는 핵산 구축물.

제5항

제4항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열 및 tRNA 신테타제를 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된 핵산 구축물.

제6항

(i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및

제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는

tRNA가 핵산 구축물 내에 다중 카피로 존재하는,

진핵생물 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물.

제7항

제6항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 서열을 추가로 포함하고, 적절하게는 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되는 핵산 구축물.

제8항

제1항 내지 제7항 중 어느 한 항에 있어서, 제1 및 제2 프로모터가 서로 반대 방향으로 있고, tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물.

제9항

제1항 내지 제8항 중 어느 한 항에 있어서, tRNA가 직접적으로 프로모터에 또는 간접적으로 프로모터에 연결되고, 적절하게는 핵산 구축물이 링커로 tRNA에 연결된 종결인자 서열을 포함하는 핵산 구축물.

제10항

제1항 내지 제9항 중 어느 한 항에 있어서, tRNA를 코딩하는 핵산 서열의 각각의 카피가 별개의 프로모터의 제어 하에 놓인 핵산 구축물.

제11항

제1항 내지 제10항 중 어느 한 항에 있어서, 프로모터 배열이 제1 방향으로 배열된 신장 인자 프로모터 및 제2 방향으로 배열된 Pol III 프로모터를 포함하는 핵산 구축물.

제12항

제1항 내지 제11항 중 어느 한 항에 있어서, 제1 프로모터가 EF-1 프로모터이거나 또는 이로부터 유래되는 핵산 구축물.

제13항

제1항 내지 제12항 중 어느 한 항에 있어서, 제2 프로모터가 U6 프로모터이거나 또는 이로부터 유래되는 핵산 구축물.

제14항

제1항 내지 제13항 중 어느 한 항에 있어서, tRNA가 핵산 구축물(들) 상에 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 카피로 존재하는 핵산 구축물.

제15항

제1항 내지 제14항 중 어느 한 항에 있어서, tRNA가 야생형 또는 변이체 tRNA이고, 적절하게는 PylT의 U25C 변이체인 핵산 구축물.

제16항

제1항 내지 제15항 중 어느 한 항에 있어서, 관심 핵산 서열이 적어도 1, 2, 3 또는 4개의 정지 코돈을 포함하는 핵산 구축물.

제17항

제2항 내지 제16항 중 어느 한 항에 있어서, 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 핵산 구축물.

제18항

제1항 내지 제17항 중 어느 한 항에 있어서, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고/이거나, 상기 tRNA가 진핵생물 세포 내의 내인성 tRNA 신테타제에 대해 직교이고/이거나, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고 상기 tRNA가 내인성 tRNA 신테타제에 대해 직교인 핵산 구축물.

제19항

제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물.

제20항

제19항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열이 별개의 구축물 상에 있는 핵산 구축물 조합물.

제21항

제1항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터.

제22항

제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터를 포함하는 벡터 조합물.

제23항

제22항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열이 별개의 벡터 상에 있는 벡터 조합물.

제24항

제1항 내지 제18항 중 어느 한 항에 따른 핵산 구축물, 제19항 또는 제20항에 따른 핵산 구축물 조합물, 제21항에 따른 벡터, 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하는 세포.

제25항

제24항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 구축물을 추가로 포함하는 세포.

제26항

제25항에 있어서, 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되고, 적절하게는 돌연변이가 진뱅크 등록 번호 AF095901.1에 기술된 바와 같은 호모 사피엔스 eRF1 유전자 서열에서 이루어진 세포.

제27항

제24항 내지 제26항 중 어느 한 항에 있어서, 세포가 곤충 세포 또는 포유동물 세포인 세포.

제28항

제24항 내지 제27항 중 어느 한 항에 있어서, 세포가 일시적으로 또는 안정적으로 핵산으로 형질감염된 세포.

제29항

(i) 제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물; 또는

(ii) 제19항 또는 제20항에 따른 핵산 구축물 조합물; 또는

(iii) 제21항에 따른 벡터; 또는

(iv) 제22항 또는 제23항에 따른 벡터 조합물; 또는

(v) 제27항 또는 제28항에 따른 곤충 또는 포유동물 세포를 포함하고;

(vi) 임의적으로 비-천연 아미노산을 포함하는,

진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트.

제30항

제29항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 구축물 또는 벡터, 또는 이를 포함하는 세포를 추가로 포함하는 키트.

제31항

하기 단계를 포함하는, 진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법:

i) 제27항 또는 제28항에 따른 세포를 제공하는 단계이며, 여기서 상기 세포가 제19항 또는 제20항에 따른 핵산 구축물 조합물 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하는 것인 단계;

ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및

iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

제32항

제31항에 있어서, 적어도 3, 4, 또는 5개의 비-천연 아미노산이 관심 단백질 내로 혼입되는 방법.

제33항

하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법:

i) 제27항 또는 제28항에 따른 세포를 제공하는 단계이며, 여기서 상기 세포가 제19항 또는 제20항에 따른 핵산 구축물 조합물 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하고, 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 것인 단계;

ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계;

iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및

iv) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계.

제34항

진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한, (i) 제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물; 또는 (ii) 제19항 또는 제20항에 따른 핵산 구축물 조합물; 또는 (iii) 제21항에 따른 벡터; 또는 (iv) 제22항 또는 제23항에 따른 벡터 조합물; 또는 (v) 제27항 또는 제28항에 따른 곤충 또는 포유동물 세포의 용도.

제35항

i) 직교 tRNA 신테타제 및 tRNA 쌍, 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;

iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.

제36항

진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도.

제37항

하기 단계를 포함하는, 관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법:

(i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 직교 tRNA 신테타제 및 tRNA 쌍, 및 관심 핵산 서열을 발현하고, 임의적으로 돌연변이체 eRF1을 발현하며, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;

관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에, 그리고 eRF1의 돌연변이체의 존재 및 부재 하에 세포를 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및

eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계.

제38항

실질적으로 첨부된 설명 및 도면을 참조로 본원에 기술된 바와 같은 구축물, 벡터, 세포, 키트, 방법 또는 용도.

실시양태의 설명

본 발명의 설명적인 실시양태들이 첨부된 도면을 참조로 본원에서 상세하게 개시되었지만, 본 발명이 명확한 실시양태에 제한되지 않고, 첨부된 청구범위 및 이의 등가물에 의해 규정되는 바와 같은 발명의 범주를 벗어나지 않으면서 통상의 기술자에 의해 그 안에서 다양한 변화 및 변형이 이루어질 수 있는 것으로 이해된다.

추가의 특정한 바람직한 측면이 첨부된 독립항 및 종속항에 기재된다. 종속항의 특색은 적합하게, 그리고 청구범위에 명시적으로 기재된 것들 이외의 조합으로 독립항의 특색들과 조합될 수 있다.

장치 특색이 기능을 제공하도록 작동가능한 것으로 기술된 경우에, 이는 이러한 기능을 제공하거나 또는 이러한 기능을 제공하도록 개조 또는 구성된 장치 특색을 포함하는 것으로 이해될 것이다.

실시예

실시예 1 - 물질 및 방법

DNA 구축물

기존에 기술된 플라스미드 pMbPylRS-mCherry-TAG-EGFP-HA¹로부터 리포터 구축물이 유래되었다. 제한 부위를 인간 세포주에서의 발현에 대해 코돈-최적화 (보충 정보 표 S1)된 sfGFP 150TAG (라이프 테크놀러지즈)로 교체하여 플라스미드 CMV-PylRS/CMV-sfGFP(TAG)가 생성되었다. 동일한 영역을 레닐라-TAG-반딧불이 루시페라제 카세트로 교체하여, 플라스미드 CMV-PylRS/CMV-DLR(TAG)이 생성되었다. KOD 핫 스타트(KOD Hot Start) 폴리머라제 (노바젠(Novagen))를 사용하여, 정지 또는 센스 코돈을 pJet1.2 (써모 사이언티픽(Thermo scientific)) 내의 sfGFP 150TAG 또는 레닐라-TAG-반딧불이 루시페라제 카세트 내로 부위-지정 돌연변이유발에 의해 도입하였다. 생성된 돌연변이체들을 pMbPylRS-mCherry-TAG-EGFP-HA 내로 서브클로닝하여, sfGFP 150Leu (CMV-PylRS/CMV-sfGFP), 및 sfGFP 101, 133, 150TAG (CMV-PylRS/CMV-sfGFP(TAG)₃), 및 TAA (CMV-PylRS/CMV-DLR(TAA)), TGA (CMV-PylRS/CMV-DLR(TGA)) 및 SER (CMV-PylRS/CMV-DLR)를 함유하는 이중 루시페라제 리포터 플라스미드를 제공하였다.

4×U6 PylT 플라스미드 시리즈의 경우, PB220PA-1 백본 (시스템 바이오사이언시즈(System Biosciences))을 사용하였다. CMV 카세트를 CD532A-2 (시스템 바이오사이언시즈)로부터의 EF-1α 카세트로 교체하고, SpeI/SalI 단편을 PB220PA-1의 SpeI/SalI 내로 서브클로닝하였다. SpeI/AvrII 플랭킹(flanking) 부위가 있는 최적화된 U6 프로모터 / 메타노사르시나 마제이 피롤리신 tRNA 삽입물 (보충 정보 표 S1)을 합성하였다 (라이프 테크놀러지즈). EF1 프로모터의 5'의 독특한 SpeI 부위 내로의 SpeI/AvrII 단편의 반복 삽입에 의해 4×U6 PylT 탠덤(tandem) 카세트를 구축하였다. AG28, CMV-PylRS/CMV-sfGFP 및 CMV-PylRS/CMV-S2로부터의 관련 유전자의 서브클로닝에 의해 (U6-PylT^*)₄/EF-1α-PylRS, (U6-PylT^*)₄/EF-1α-sfGFP(TAG) 및 (U6-PylT^*)₄/EF-1α-sfGFP(TAG)₃ 플라스미드를 구축하였다. MfeI와 NheI 사이의 mCherry-TAG-EGFP 카세트 sfGFP(TAG)₃.

호모 사피엔스 eRF1 유전자 (진뱅크: AF095901.1)를 드로소필라 멜라노가스터에 대해 코돈-최적화하였고 (보충 정보 표 S1), N-말단 His6 태그, C-말단 삼중 정지 (UAAUGAUAG)에 의해 확장시켰다. 헬릭스웹 툴키트(Helixweb toolkit)²를 사용하여 코돈 최적화를 수행하였다. 부위-지정 돌연변이유발 (보충 정보 표 2)에 의해 추가적인 돌연변이를 도입하고, 생성된 구축물을 제한 부위 HindIII/NotI을 사용하여 포유동물 발현 벡터 pcDNATM5/FRT/TO 내로 클로닝하여, peRF1(X) 벡터 (여기서 X는 돌연변이를 나타낸다)를 생성시켰으며, eRF1이 CMV 프로모터로부터 발현된다.

세포 배양, 항체 및 검정법

부착성 HEK293T 세포를 37℃, 5％ CO₂ 대기에서 10％ FBS가 보충된 둘베코 변형 이글 배지 (DMEM)-글루타맥스(Glutamax) (깁코(Gibco) 상에서 유지시켰다. 트랜스잇(TransIT)®-293 (마이러스(Mirus)) 형질감염 시약 또는 3:1 PEI:DNA 비의 폴리에틸렌이민 (맥스 PEI(Max PEI), 폴리사이언시즈(Polysciences))을 제조사의 프로토콜에 따라 사용하여 일시적인 형질감염을 수행하였다.

eRF1 (ab30928, 앱캠(Abcam)), 액틴 (#4967, 셀 시그널링 테크놀러지(Cell Signaling Technology)), FLAG (A8592, 시그마-알드리치(Sigma-Aldrich), HIS (27E8, 셀 시그널링 테크놀러지), HA (C29F4, 셀 시그널링 테크놀러지)에 대한 항체 및 상응하는 2차 HRP-연결 항체 (#7074, #7076, #7077, 셀 시그널링 테크놀러지)로의 이뮤노블롯팅에 의해 단백질 발현 및 eRF1 고갈을 확인하였다. eRF1 고갈은 다른 형질감염된 플라스미드와 등량의 시판되는 eRF1 shRNA (sc-37871-SH, 산타 크루즈 바이오테크놀러지(Santa Cruz Biotechnology))로의 형질감염에 의해 달성되었다.

아미노산 1은 시판되었고 (E1610.0025, 바켐(Bachem)), 아미노산 2는 기존에 기술된 바와 같이 합성되었다. 단백질 발현을 위해, 아미노산 용액을 배양 배지 내의 중화된 원액 용액으로서 제조하고, 예비 인큐베이션된 형질감염 혼합물과 함께 (트랜스잇-293, 96웰 플레이트), 또는 형질감염 4시간 후에 배양 배지를 교체하면서 (PEI, 24웰 플레이트, 10 cm 배양 접시, T75 플라스크), 배양 세포에 첨가하였다.

노던 블롯팅

총 RNA를 퀴아졸(Qiazol) 용해 시약 (퀴아젠(Qiagen))을 사용하여 HEK293T 세포로부터 단리하고, 이소프로판올로 침전시켰다. 노던맥스-Gly(NorthernMax-Gly) 키트 (앰비온Ambion))로 노던 블롯팅을 수행하였다; RNA를 글리옥살 로드 염료에서 변성시키고, 2％ 아가로스 겔 상에서 분리하고, 양으로 하전된 브라이트스타-플러스(BrightStar-Plus) 나일론 막 (앰비온) 상으로 옮기고, 스트라타링커(Stratalinker) 2400 UV 가교제 (스트라타진(Stratagene))를 통해 UV로 가교시켰다. 막을 하룻밤 동안 37℃에서 5'-비오틴화 DNA 프로브 (5'-GGAAACCCCGGGAATCTAACCCGGCTGAACGGATTTAGAG-3')와 혼성화시켰다. 혼성화된 프로브를 화학발광 핵산 검출 모듈 (써모 사이언티픽)을 사용하여 검출하였다.

이중 루시페라제 검정법

HEK293T 세포를 96웰 플레이트 (코스타(Costar) #3595, 코닝(Corning))에서 웰 당 제안된 양의 2배의 DNA (총 0.2 ㎍) 및 트랜스잇®-293 시약 (0.6 ㎕)을 사용하여 형질감염시켰다. 간략화된 제조사의 프로토콜 (프로메가(Promega))에 따라 이중 루시페라제 검정법을 수행하였다. 16시간의 성장 후, 배양 배지를 제거하고, 세포를 15분 동안 실온에서 20 ㎕의 패시브(passive) 용해 완충제에서 용해시켰다. 그 후, 10 ㎕의 용해물을 백색 96웰 플레이트 (눈크(Nunc) 236105, 써모 사이언티픽) 내의 50 ㎕의 루시페라제 검정법 완충제 II에 첨가하였다. 이어서, 반딧불이 루시페라제 발광을 측정하고 (페라스타 FS(Pherastar FS), BMG 랩테크(BMG Labtech)), 반응을 켄칭시키고, 50 ㎕ 스톱 & 글로(Stop & Glo) 완충제를 첨가한 후 레닐라 발광을 측정하였다. 실험을 4중으로 수행하여, 3회의 반복 실험은 이중 루시페라제 측정에 사용하고, 나머지 반복 실험은 50 ㎕의 RIPA 완충제 (시그마(Sigma)) + 컴플리트(Complete) 프로테아제 억제제 (로슈(Roche))에서의 용해 후에 이뮤노블롯팅에 사용하였다.

sfGFP 변이체의 일시적인 발현

형광 검정법을 위한 sfGFP(TAG) 및 sfGFP(TAG)₃의 발현을 24웰 플레이트에서 수행하였다. 관례적으로, 웰 당 100000개의 세포를 시딩하고, 하룻밤 동안 성장시키고, 플라스미드 당 160 ng DNA, 1.5 ㎕의 PEI (1 mg/ml) 및 50 ㎕의 혈청 감소 배지 (옵티-MEM(Opti-MEM), 깁코)를 사용하여 일시적으로 형질감염시켰다. 형질감염 4시간 후, 배지를 교환하고, 아미노산 1 또는 2를 신선한 성장 배지에 첨가하였다. 48시간의 성장 후, 상청액을 조심스럽게 제거하고, 진탕시키면서 세포를 컴플리트 프로테아제 억제제 (로슈)가 첨가된 100 ㎕ RIPA 완충제 (시그마)에서 용해시켰다. 50 ㎕의 용해물을 96웰 플레이트 (코스타 #3595, 코닝) 내로 옮기고, 형광 강도를 485/520 nm에서 결정하였다 (페라스타 FS, BMG 랩테크). 검정 곡선 (보충 도면 S1)을 사용하여 용해물에서 sfGFP를 정량하였다.

검정 목적을 위해, sfGFP를 이. 콜라이 DH10b 세포에서 pBAD 프로모터 제어 하에 p15A-기반 플라스미드로부터 발현시키고, 앞서 기술된 바와 같이 Ni-친화력 크로마토그래피로 정제하였다⁴. SDS-PAGE 후에 쿠마시 염색으로 단백질 순도를 확인하였다.

컴플리트 프로테아제 억제제 (로슈)가 보충된 RIPA 완충제 (시그마)에서 단계 희석 (단계 당 1:10)하여 280 nm에서의 흡광도 (흡광 계수 0.6845)를 측정함으로써 기준 샘플 내의 절대 단백질 농도를 결정하였다. 소정의 농도의 sfGFP에 대한 형광 강도 (여기 485 nm, 방출 520 nm)를 96웰 플레이트 (코스타, 코닝)에서 50 ㎕의 부피로 3중으로 측정하였다. 소정의 게인 세팅(gain setting) (페라스타 FS, BMG 랩테크)에 대한 마이크로플레이트 판독기의 선형 범위 밖의 측정치를 폐기하고, 나머지 데이터 포인트를 선형 곡선에 핏팅하였다. 세포 용해물 내의 sfGFP 형광의 후속 측정을 동일한 조건 하에 수행하고, 표준 곡선 (프리즘6(Prism6), 그래프패드(Graphpad))를 참조로 sfGFP 농도를 결정하였다.

질량 분광법을 위한 단백질 발현을 10 cm 배양 접시에서 수행하였다. HEK293T를 10 cm 조직 배양 접시에서 15 ㎍ DNA + PEI로 형질감염시켰다. 형질감염 4시간 후 세포 배양 배지를 교환하고, 72시간 동안 아미노산과 함께 인큐베이션하였다. 세포를 PBS로 2회 세정하고, 1 mL RIPA 완충제에서 용해시켰다. 정화된 용해물을 50 ㎕ GFP-트랩(GFP-Trap)® M (크로모테크(ChromoTek))에 첨가하고, 4시간 동안 4℃에서 인큐베이션하였다. 자석으로 비드를 분리하고, 1 mL RIPA, 1 mL PBS, 1 mL PBS+500 mM NaCl, 1 mL ddH₂O로 세정하고, 1％ 아세트산/ddH₂O에서 용출시켰다.

질량 분광법

6130 쿼드로폴(Quadrupole) 분광계가 장착된 애질런트(Agilent) 1200 LC-MS 시스템을 사용하여 전기분무 질량 분광법을 수행하였다. 용매 시스템은 완충제 A로서의 H₂O 내의 0.1％ 포름산, 및 완충제 B로서의 아세토니트릴 (MeCN) 내의 0.1％ 포름산으로 이루어졌다. 214 및 280 nm에서 단백질 UV 흡광도를 모니터링하였다. 양이온 모드에서 단백질 MS를 획득하고, 총 단백질 질량을 MS 켐스테이션(Chemstation) 소프트웨어 (애질런트 테크놀러지즈(Agilent Technologies))에서의 디컨볼루션(deconvolution)으로 계산하였다⁶.

실시예 2 - tRNA 수준을 증가시키는 것이 비-천연 아미노산 혼입 효율을 증가시킨다

본 발명가들은 포유동물 세포에서의 비-천연 아미노산 혼입의 효율을 증가시키도록 tRNA_CUA의 발현 수준을 최적화하였다. PylRS, tRNA_CUA 및 선택된 프로모터의 카피수가 다른 상이한 PylRS 및 tRNA 플라스미드들을 연구원들이 사용하였다¹⁷ ^-20. 그러나, 포유동물 세포에서 이러한 PylRS/tRNA_CUA 쌍으로 혼입된 비-천연 아미노산을 보유하는 단백질의 수율을 정량하는 보고 또는 앰버 정지 코돈을 함유하지 않는 유전자로부터 발현된 대조군 단백질의 발현에 비교하여 비-천연 아미노산 혼입의 효율을 정량하는 보고가 없다. 이러한 실험들은 포유동물 세포에서의 비-천연 아미노산 혼입이 천연 단백질 합성에 얼마나 잘 필적하는지를 이해하는데 결정적이다.

본 발명가들은 CMV 프로모터 상의 PylRS의 단일 카피 및 U6 프로모터 + CMV 인핸서에 의해 각각 구동되는 tRNA_CUA의 4개의 카피를 보유하는 플라스미드 b 및 c를 사용하여 비-천연 아미노산 혼입의 효율을 최초로 테스트하였다¹⁷ ^,19 (구축물 개략도가 차트 1a에서 제시된다). 이러한 시스템은 sfGFP (CMV-sfGFP(TAG))의 위치 150의 앰버 코돈에 반응하여²³ 1 (N ^ε-[(tert-부톡시)카르보닐]-l-리신), 또는 2 (N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) (차트 1b) (양쪽 모두 PylRS/tRNA_CUA 쌍에 대한 공지된 효율적인 기질임²¹ ^, ²²)의 혼입을 5％ 및 7％의 효율로 지시하였다 (도 1a, b); 모든 혼입 효율은 위치 150에 앰버 코돈 대신 류신 코돈을 보유하는 다른 면에서는 동일한 대조군 구축물 (플라스미드 a, 차트 1)로부터 생산된 sfGFP 수준의 백분율로서 보고된다. 다음으로, 본 발명가들은 tRNA_CUA의 4개의 카피를 최적화된 U6 프로모터 상의 tRNA_CUA의 단일 카피로 교체하였고, 이는 비-천연 아미노산 혼입 효율을 소량 감소시켰다 (플라스미드 b 및 d).

원래의 4-카피 카세트 (c)와 달리, 새로운 U6 tRNA_CUA 카세트 (d)는 CMV 인핸서를 함유하지 않고, tRNA에 대한 정확한 5' 끝부분을 생산하며, 이는 뉴클레아제 프로세싱을 필요로 하지 않는다. 노던 블롯 (도 1c)은 d로부터 생산된 Pyl tRNA_CUA의 수준이 c로부터 생산된 수준에 필적한다는 것을 실연한다. 이는 변경된 tRNA 발현 구축물이 tRNA 유전자의 카피 당 더 많은 카피의 tRNA를 제공한다는 것을 가리킨다. tRNA_CUA를 U25C 변이체²⁴로 교체하는 것은 혼입 효율을 2.7％-3.5％에서 4.7-5.1％로 약간 증가시켰고 (플라스미드 b 및 e, 차트 1), tRNA_CUA 수준에 대한 작은 효과가 있었다.

U6 Pyl tRNA_CUA (U25C를 보유함)의 4개의 카피를 각각 함유하는 탠덤 어레이를 생성시키고, 단백질 코딩 유전자에 대한 프로모터를 CMV에서 EF-1α로 전환하면 (플라스미드 g 및 h, 차트 1), 1 또는 2를 보유하는 sfGFP가 실질적으로 증가되었다. 이러한 시스템에서, 아미노산 1은 앰버 코돈에 반응하여 sfGFP 내에 62％의 효율로 혼입된 한편, 2는 약 129％의 효율로 혼입되었다. 웨스턴 블롯은 단백질 코딩 유전자의 프로모터를 EF-1α로 변화시키는 것이 PylRS (항-FLAG b+e 대 g+h, 도 1b) 또는 wt sfGFP (a 대 f 도 1b)의 수준을 변화시키지 않는다는 것을 실연하여, EF1 α 프로모터로 변화시키는 것에 의해 PylRS 수준 또는 sfGFP 발현의 최대 수준이 변경되지 않는다는 것을 실연한다. 그러나, 노던 블롯은 테스트된 다른 모든 시스템에서보다 이러한 시스템에서 tRNA 수준이 훨씬 더 높다는 것을 실연하여, 본 발명가들이 관찰한 비-천연 아미노산 혼입 효율의 큰 증가가 tRNA 수준의 증가에 의해 야기된다는 것을 강하게 시사한다.

실시예 3 - 선택된 eRF1 변이체의 이소성 발현이 정지 코돈의 번역초과를 증가시키지 않는다.

다음으로, 본 발명가들은 eRF1을 조작하는 것에 의해 다른 정지 코돈의 번역초과를 증가시키지 않으면서 비-천연 아미노산 혼입 효율을 추가로 강화할 수 있는지를 질문하였다. 최적화된 신테타제 및 tRNA 시스템으로 비-천연 아미노산 혼입의 효율이 이미 양호하였지만, 본 발명가들은 eRF1 조작이 이러한 효율을 추가로 개선할 수 있고, 단백질 내의 다중 부위에서 비-천연 아미노산을 효율적으로 혼입시키게 할 수 있다고 구상하였다.

본 발명가들은 유전학 또는 생화학 연구로부터 앰버 코돈에서의 종결에 대한 효과가 있는 것으로 보고되는 eRF1 내의 아미노산 위치를 최초로 확인하였다²⁵ ^- ³⁰. 이러한 돌연변이들은 리보솜 내에서 mRNA 상의 정지 코돈과 상호작용하는 eRF1의 N-말단 도메인 (도 2a) 내에 있다. 포유동물 세포 내에서의 번역 종결에 대한 eRF1 돌연변이체의 효과를 평가하기 위해, 본 발명가들은 HEK 293T 세포, 및 부가되고 과발현된 인간 eRF1 및 eRF1 돌연변이체를 보유하는 HEK 293T 세포에서 앰버, 오팔 및 오커 정지 코돈에서의 억제인자 tRNA 비의존적 번역초과를 정량하였다 (도 2b). eRF1은 eRF3과 복합체를 형성하고 (eRF1 상의 C-말단 도메인을 통해 주로 매개됨³⁷), 이는 번역 종결을 매개한다. eRF3은 세포 내에 내인성 eRF1에 필적하는 수준으로 존재하고, 따라서 eRF3이 형성될 수 있는 종결 복합체의 개수를 제한한다³⁵. eRF1 N-말단 도메인 돌연변이체의 과발현은 (질량 작용에 의해) 이러한 복합체를 eRF1 돌연변이체를 함유하는 것을 향해 편향시킴으써 eRF1 돌연변이의 표현형을 나타낼 수 있다.

본 발명가들은 각각의 eRF1 변이체를 세포 내로 도입하고 (도 2b), 3가지 이중 루시페라제 리포터를 사용하여 정지 코돈의 기저 번역초과를 측정하였다 (도 2c). 각각의 리포터는 N-말단 레닐라 루시페라제에 이어지는 정지 코돈 (앰버, 오팔 또는 오커) 및 C-말단 반딧불이 루시페라제를 함유하였다³¹ ^- ³⁴. 정지 코돈의 번역초과는 0.08 내지 0.12％ (TAG 0.09％, TGA 0.12％, TAA 0.08％)였고, 이는 추가 실험에 대한 기준점을 제공한다. eRF1의 이소성 과발현으로 3개 모두의 정지 코돈의 번역초과가 감소하였고 (TAG 0.03％, TGA 0.07％, TAA 0.04％), 이는 세포 내의 eRF1의 수준 증가와 일관된다³⁵. 번역초과의 이러한 감소는 소량이고, 이는 eRF3의 수준이 내인성 eRF1의 수준에 필적하고, eRF3 수준이 형성될 수 있는 기능성 종결 복합체의 개수를 제한한다는 것과 일관된다³⁵.

eRF1 변이체의 도입은 야생형 eRF1의 도입과 관련하여 정지 코돈 번역초과를 증가시켰다. 그러나, 2개를 제외한 테스트된 모든 eRF1 돌연변이체에 대해, 3개 모두의 정지 코돈의 번역초과가 이소성으로 발현된 eRF1의 부재 하에 발견된 수준을 초과하여 증가되지 않았다. 본 발명가들은 대부분의 테스트된 eRF1 변이체의 이소성 발현이 정지 코돈의 번역초과를 기저 수준을 초과하여 증가시키지 않는다는 결론을 내렸다.

정지 코돈의 번역초과를 정상적으로 세포에서 발견되는 수준을 초과하여 증가시키는 2개의 eRF1 돌연변이체는 번역초과를 1.6％ (TAA), 2％ (TAG) 및 15％ (TGA)로 증가시키는 돌연변이체인 eRF1 Δ100, 및 선택적으로 TGA 코돈에서 번역초과를 2배 증가시키는 T122Q, S123F 돌연변이체²⁹이다. shRNA에 의한 내인성 eRF1 수준의 감소는 3개 모두의 정지 코돈에 대해 기저 번역초과를 2 내지 3배 증가시켰다.

모든 정지 코돈의 번역초과에 대한 eRF1 Δ100 돌연변이체의 효과는 예상된 것인데, 이는 잔기가 결실되는 N-말단 도메인이 mRNA 내의 3개 모두의 정지 코돈의 인식을 매개하지만 eRF3과의 상호작용은 매개하지 않기 때문이다³⁶ ^- ³⁹. 따라서 이러한 돌연변이체는 eRF3과 비활성 복합체를 형성하여, 종결을 매개할 수 있는 기능성 eRF1/eRF3 복합체의 개수를 감소시킬 것으로 예견된다. 유사하게, eRF1에 대한 shRNA가 모든 정지 코돈에 미치는 효과는 예상된 것인데⁴⁰, eRF1의 감소는 모든 정지 코돈 상에서의 종결의 감소에 이르기 때문이다.

실시예 4 - eRF1 돌연변이체가 비-천연 아미노산 혼입 효율을 증가시킨다.

비-천연 아미노산 혼입에 대한 eRF1, eRF1 돌연변이체 및 shRNA의 효과를 연구하기 위해, 본 발명가들은 세포를 관련된 eRF1 돌연변이체로 형질감염시켰다 (도 2d). 각각의 샘플에 앰버 억제의 이중 루시페라제 리포터인 직교 피롤리실 tRNA - 신테타제 (PylRS)/tRNACUA 쌍의 단일 카피 (차트 1의 b + d로 제시된 배열이지만, sfGFP가 이중 루시페라제 리포터로 교체됨)가 또한 제공되었다. 본 발명가들은 이러한 시스템을 사용하여, eRF1 변이체가 제공하는 강화를 측정할 수 있는 동적 범위를 최대화하게 하였다. 아미노산 1을 모든 세포에 첨가하였다. 한 경우에, 내인성 eRF1에 대한 shRNA 구축물⁴⁰을 첨가하여, 이소성으로 발현된 eRF1 돌연변이체의 효과를 내인성 eRF1을 녹아웃시키는 것에 비교하였다.

이중 루시페라제 검정법을 사용하여 비-천연 아미노산 혼입 효율에 대한 eRF1의 효과를 결정하였다 (도 2e). 이소형으로 발현된 방출 인자의 부재 하에, 이러한 검정법에서 비-천연 아미노산 혼입의 효율은 약 5.3％였다. 혼입 효율은 야생형 방출 인자의 이소성 발현 시 약간 감소하였고, 내인성 eRF1의 shRNA 녹다운 시 13％로 증가하였다. S70A, G73S 돌연변이체를 제외하고는 1에 대한 혼입 효율이 모든 돌연변이체 방출 인자의 존재 하에 증가하였다. 이러한 돌연변이체는 기존에 이능성(bipotent) UAR 특이적 eRF1로서 기술되었다.^28,41

2개의 eRF1 돌연변이체가 가장 효율적인 비-천연 아미노산 혼입을 일으켰다: eRF1 (E55D), 27％; 및 eRF1 (Δ100), 36％. Δ100 돌연변이체 및 E55D 돌연변이체로의 혼입 효율은 이소성으로 발현된 방출 인자를 함유하지 않는 세포에서의 혼입 효율보다 5 내지 7배 더 크다. 흥미롭게, PylRS/tRNA_CUA 쌍의 존재 및 부재 하에 앰버 번역초과를 강하게 강화하는 한편, eRF1Δ100 돌연변이체는 양쪽 모두의 상황에서 생산된 루시페라제의 총량을 유의하게 감소시켰고, 이는 번역 효율에 대한 전반적인 효과가 있는 3개 모두의 정지 코돈에서의 종결의 극단적인 파괴와 일관된다 (보조 정보 도면 2). 또한, Δ100 돌연변이체는 억제인자 tRNA의 부재 하에 3개 모두의 정지 코돈의 번역초과를 일으킨다; 따라서, 본 발명가들은 이러한 방출 인자 돌연변이체를 더 연구하지 않았다. 본 발명가들은 eRF1 (E55D)에 대한 추가 연구에 집중하였다. 이러한 방출 인자 돌연변이체는 토끼 망상적혈구 리보솜을 사용한 시험관 내 검정법에서 앰버 코돈에 반응하는 것보다 더욱 효율적으로 오커 및 오팔 코돈에 반응하여 개시인자 tRNA로부터 포르밀-메티오닌을 제거하는 것으로 확인되었다.²⁵

실시예 5 - 다중 비-천연 아미노산을 혼입시키기 위한 최적화된 시스템

다음으로, 본 발명가들은 최적화된 신테타제 및 tRNA 시스템과 eRF1의 E55D 돌연변이체를 조합하였다 (도 3). 본 발명가들은 1의 존재 하에 성장된, PylRS/tRNA_CUA 쌍을 함유하는 세포에 eRF1 (E55D)을 첨가하는 것이 sfGFP(TAG) 내로의 1의 혼입을 62％에서 85％로 증가시킨다는 것을 발견하였다 (도 3a). 유사하게, eRF1 (E55D) 첨가가 GFP의 위치 K101, D133 및 V15014에 앰버 정지 코돈을 함유하는 sfGFP(TAG)₃ 내로 1이 혼입되는 효율을 5％에서 12％로 증가시켰다 (도 3a, b). sfGFP(TAG)로부터의 sfGFP-1의 수율은 10⁵개의 세포로부터 0.65 ㎍인 한편, sfGFP-(TAG)₃으로부터의 sfGFP-(1)₃의 수율은 10⁵개의 세포 당 0.1 ㎍이었다 (보조 정보 도면 3; 모든 수율은 시딩된 세포의 개수 당으로 매겨지고, 형질감염 48 h 후에 측정되었다).

본 발명가들은 2의 존재 하에 성장된, PylRS/tRNA_CUA 쌍을 함유하는 세포에 eRF1 (E55D)을 첨가하는 것이 sfGFP(TAG) 내로의 2의 혼입을 129％ 에서 157％로 증가시킨다는 것과 eRF1 (E55D) 첨가가 sfGFP(TAG)₃으로부터 sfGFP-(2)₃을 생산하는 효율을 11％에서 43％로 4배가 되게 한다는 것을 발견하였다 (도 3c,d). sfGFP(TAG)로부터의 sfGFP-2의 수율은 10⁵개의 세포 당 1.76 ㎍인 한편, sfGFP-(TAG)₃으로부터의 sfGFP-(2)₃의 수율은 10⁵개의 세포 당 0.49 ㎍이었다 (보조 정보 도면 3). 최적화된 시스템을 함유하는 세포 용해물로부터 전장 sfGFP를 정제하였다 (도 4a). 전기분무 이온화 질량 분광법에서, 각각 sfGFP(TAG) 및 sfGFP(TAG)₃으로부터의 sfGFP 내로의 1 및 2의 1개 및 3개의 분자의 부위-특이적 혼입이 실연되었다 (도 4b, 보조 정보 도면 4). 이러한 데이터는, 도 4a에서의 아미노산이 없는 대조군과 함께, eRF1 (E55D)의 존재 하에 비-천연 아미노산이 높은 정확도로 혼입되는 것을 실연한다.

실시예 6 - 유도성 eRF1 돌연변이체의 게놈 통합이 앰버 억제를 강화한다

지금까지 기술된 eRF1-강화 발현 시스템은 세포 내로의 비-천연 아미노산 혼입을 위한 모든 필요한 성분을 도입하기 위해 3개의 플라스미드의 병행 형질감염에 의존한다. eRF1 E55D 돌연변이체의 게놈 통합에 의해, 2개의 플라스미드 (도 1, 구축물 g가 h 또는 i와 조합됨)만 형질감염되어야 해서, 세포 내로 전달되는 이러한 플라스미드의 양을 증가시킨다.

eRF1용으로 테트라시클린 유도성 프로모터를 사용함으로써, 성장 배지에 테트라시클린을 첨가하는 것에 의해 필요할 때 표준 세포 배양 유지 모드에서 고효율 앰버 억제 모드로 전환될 수 있는 세포주를 생성시켰다.

eRF1 변이체를 Flp-In™ T-REx™ 293 세포주 (라이프 테크놀러지즈) 내로 도입하였다. 이러한 세포주는 단일한 전사적으로 활성인 게놈 FRT 표적 부위를 함유하고, 이에 의해 게놈 삽입 부위로 인한 발현 수준 변동이 없게 한다. 따라서 이는 별개의 안정적인 세포주들에서 다중 유전자 구축물의 효과를 비교하기 위한 이상적인 도구이다. 본 발명가들은 pcDNA™5/FRT/TO (라이프 테크놀러지즈)를 기초로 필요한 FRT 공여자 플라스미드를 생성시켰다.

디. 멜라노가스터에 대해 리코딩된 인간 eRF1 wt 및 eRF1 E55D 변이체 양쪽 모두가 게놈 내로 성공적으로 통합되었다. 생성된 Trex 293 wt 및 E55D 세포주가 유도 조건 및 비-유도 조건 양쪽 모두 하에서 수개월 동안 유지될 수 있었고, 이는 무시할 수 있는 독성 효과를 시사한다.

1:1 비의 PylRS/tRNA_CUA 및 sfGFP 리포터를 함유하는 구축물들 (구축물 g + h/i, 도 1)의 일시적인 형질감염에 의해 앰버 억제 효율을 결정하였다. 0.5 mM 아미노산 2의 존재 하에, 1 ㎍/mL 테트라시클린 첨가로 eRF1 발현을 유도했을 때 sfGFP(wt)와 비교하여 sfGFP(TAG)에서는 75％에서 99％로, sfGFP(TAG)₃에서는 8％에서 20％로 앰버 억제가 증가하였다 (도 5a).

관찰된 효과는 eRF1을 일시적인 형질감염에 의해 도입하는 것 (도 4)에 비교하여 덜 뚜렷하다. eRF1에 대한 세포 용해물의 면역염색은 유도 시 eRF1 수준이 성공적으로 상승된다는 것을 나타내지만 (도 5d), 일시적인 형질감염 후의 eRF1 발현 (도 4, b/d)과 비교하여 덜 뚜렷하다. 이는 일시적인 형질감염에 의해 세포 당 다중 카피의 플라스미드가 운반되는 것에 비교하여, 단일한 게놈 통합 부위가 존재하는 것과 일관된다. 내인성인 야생형 eRF1의 존재 하에서는, UAG 코돈에서 종결하는 능력이 있는 야생형 eRF1/eRF3 복합체의 형성을 방지하도록 충분한 eRF1 E55D가 존재하는 경우에만 앰버 억제가 강화될 수 있다.

실시예 7 - shRNA(eRF1)의 구성적 발현이 eRF1 E55D가 안정적으로 통합된 세포주에서 앰버 번역초과를 증가시킨다

eRF1 변이체의 강한 발현이 강화된 앰버 억제를 가능하게 하는 바와 같이 (도 3), 트랜스제닉 eRF1의 존재 하에서의 내인성 eRF1의 감소도 그러할 것이다 (Carnes et al. 2003; Ilegems et al. 2004). shRNA에 의한 내인성 eRF1 수준의 감소는 기저 정지 코돈 번역초과의 비특이적인 증가에 연결된다 (도 3 b, c). 앰버 억제 잠재력이 강화된 안정적인 세포주의 개념에 따라, 이전에 사용된 eRF1 특이적 shRNA 세트를 게놈 내로의 무작위 렌티바이러스 통합에 의해 세포주 내로 도입하였다 (산타 크루즈 바이오테크놀러지). 통합 이벤트가 성공적인 세포를 퓨로마이신에 대한 저항성 획득을 기초로 선별하였다. eRF1 E55D를 함유하는 세포주 및 eRF1 야생형을 함유하는 세포주 양쪽 모두가 생성되었고, 수주 동안 테트라시클린의 존재 및 부재 하에 유지될 수 있었다.

PylRS/tRNA_CUA 쌍 및 sfGFP(TAG) 또는 sfGFP(TAG)₃ 리포터 구축물 (플라스미드 g + h/I, 도 1)의 일시적인 형질감염 후에 앰버 억제 효율을 결정하였다. 앰버 억제 효율은 배경값을 초과하는 총 sfGFP 형광으로 제시되고, 동일한 세포주에서의 sfGFP(wt)에 대해 표준화된다.

eRF1 E55D의 통합 및 유도가 0.5 mM 2의 존재 하에 "블랭크(blank)" 부모 세포주인 TRex 293 Flp-In에 비교하여 87％에서 99％로 앰버 억제의 증가를 야기하였다. 대조적으로, eRF1 wt의 유도는 앰버 억제를 평균적으로 81％로 감소시켰다.

eRF1-특이적 shRNA가 구성적으로 발현되는 세포주는 eRF1 E55D 배경에서는 상대적 형광을 114％로 증가시켰지만, eRF1 wt 배경에서는 억제를 79％에서 유지시켰다 (도 5c). Trex 293 Flp-In 부모 세포주에서 sfGFP(TAG)₃ 리포터로의 앰버 억제 효율은 7.6％였다. eRF1 E55D를 발현하는 안정적인 세포주는 19％로의 앰버 억제 증가를 나타내고, eRF1 E55D 및 shRNA(eRF1) 양쪽 모두를 발현하는 세포주에서 31％로 추가로 증가된다. 대조적으로, eRF1 wt를 발현하는 세포주는 7.6％의 부모 세포주에 비교하여 앰버 억제의 변화를 나타내지 않는다. eRF1 wt 및 shRNA(eRF1) 양쪽 모두를 발현하는 유래된 세포주는 5％로의 억제 효율의 미미한 감소를 나타낸다 (도 5d).

종합적으로, 상대적인 앰버 억제 효율이 eRF1 E55D의 단일 카피의 안정적인 통합에 의해 강화될 수 있고, 내인성 eRF1수준의 감소 또는 eRF1 E55D의 증가된 발현이 추가 강화에 요구된다. 어느 경우든, sfGFP-2의 정량적 발현이 달성될 수 있고, sfGFP-2₃이 sfGFP의 30-40％의 효율로 생산될 수 있다.

실시예 8 - eRF1 돌연변이체가 Dmel 세포에서 비-천연 아미노산 혼입 효율을 증가시킨다

본 발명가들은 곤충 세포를 기초로 하는 발현 시스템에서의 선택된 eRF1 돌연변이체의 효과를 또한 평가하였다. 드로소필라로부터 유래된 세포주, 예컨대 슈나이더(Schneider) 2 세포가 단백질의 대규모 발현에 일상적으로 사용된다. 이러한 시스템에서의 단백질 내의 비-천연 아미노산 혼입을 엠. 마제이(M. mazei) PylRS/ tRNA_CUA 쌍 및 적절한 발현 시스템을 사용하여 실연하였다 (Bianco et al. 2012; Elliott et al. 2014).

4개의 구축물을 사용하여 비-천연 아미노산 혼입을 구동시켰다: PylRS/tRNA_CUA 발현 구축물, GFP-mCherry 또는 GFP-TAG-mCherry를 함유하는 리포터 구축물, UAS 구동제, 및 각각의 eRF1 변이체에 대한 발현 구축물.

종합적으로, Dmel 세포에서의 형질감염 효율이 포유동물 시스템에서보다 더 낮고, 생성된 세포 용해물 및 블롯이 형질감염된 세포 및 형질감염되지 않은 세포의 혼합물을 나타내어, 명확한 효과를 감소시킨다 (도 6a). 시각 지표는 내인성 eRF1 밴드 아래의 이소성 말단절단 eRF1에 상응하는 약한 밴드를 나타내는 Δ100 돌연변이체이다 (도 6b). 도 6a에 제시된 앰버 억제의 정량은 3회의 독립적인 형질감염 실험을 기초로 하고, 상응하는 블롯이 개별적으로 정량된다.

야생형 방출 인자의 발현은 번역초과의 매우 미미한 감소를 야기하는 반면, eRF1 Δ100 돌연변이체의 발현은 번역초과 수준을 4.8％에서 23％로 5배 증가시킨다. 이러한 효과에 말단절단된 GFP의 총량의 강한 감소가 동반되고, 이는 전반적인 번역 프로세스의 현저한 파괴를 시사한다 (도 6b).

E55D 돌연변이체는 15％로 4배 증가되어, 테스트된 변이체들 중 번역초과 수준의 두 번째로 큰 증가를 나타낸다. 유사하게, 돌연변이 E55A 및 NK129PQ가 번역초과를 12％로 약 3배 증가시킨다. UGA 번역초과를 강화하는 것으로 보고된 돌연변이체 S70A G73S은 앰버 억제에 대한 효과를 나타내지 않는다. 세포 환경 및 사용된 리포터 시스템 양쪽 모두에서의 차이에도 불구하고, 이러한 결과들은 이전에 포유동물 세포에서 관찰된 상대적인 효과 크기를 밀접하게 반영한다. 유일한 예외는 돌연변이 Y125F이고, 이는 Dmel 세포에서는 무시할 수 있는 효과를 갖는 것으로 나타나지만, 포유동물 시스템에서는 UAG 번역초과를 개선하였다.

실시예 9 - eRF1 E55D 돌연변이체가 광범위한 비-천연 아미노산 및 tRNA 신테타제 변이체의 혼입 효율을 증가시킨다.

도 7에 나타난 바와 같이, 4개의 별개의 비-천연 아미노산인 Boc-K (N ^ε-[(tert-부톡시)카르보닐]-l-리신), 노르보넨-K (N ^ε-노르보르넨-2-일옥시카르보닐-L-리신), 시클로프로펜-K (N ^ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) 및 비시클로닌-K (N ^ε-([(1R,8S)-비시클로[6.1.0]논-4-인-9-일메톡시]카르보닐)-리신)의 sfGFP(TAG) 내로의 혼입이 eRF1 E55D 돌연변이체의 존재 하에 개선되었다. 실시예 6에서 생성된 T-REx 293 eRF1 E55D를 eRF1 E55D를 유도적으로 발현시키는데 사용하였다.

1:1 비의 PylRS/tRNA_CUA 및 sfGFP_150TAG 리포터를 함유하는 구축물들 (구축물 g + h/i, 도 1)의 일시적인 형질감염에 의해 앰버 억제 효율을 결정하였다. 웨스턴 블롯팅에 의해 sfGFP 발현을 기초로 앰버 억제 효율을 결정하였다. 모든 경우에, eRF1 E55D 돌연변이체의 존재가 sfGFP 발현을 증가시켰다.

실시예 10 - 논의

본 발명가들은 천연의 번역 대조군에 비교하여 비-천연 아미노산 혼입 효율을 규정하여, 비-천연 아미노산 혼입 효율에서의 개선을 정량적으로 기준화하게 하였다. 본 발명가들에 의해 생성된 최적화된 시스템은 아미노산 1 및 2로 비-천연 아미노산 혼입 효율에서의 17 내지 20배 개선을 제공한다. 아미노산 1의 경우는 혼입 효율이 정지 코돈이 없는 대조군의 5％에서 85％로 증가되는 한편, 아미노산 2의 경우는 혼입 효율이 7％에서 157％로 증가된다. 또한, 최적화된 시스템은 3개의 위치에서 1 및 2가 혼입된 단백질의 수율을 측정불가능하게 낮은 수준에서 정지가 없는 대조군의 12％ 및 43％로 각각 증가시킨다.

PylRS/tRNA_CUA 발현을 최적화하는 tRNA_CUA 수준의 최적화; 및 조작된 eRF1 변이체의 개발 및 사용을 포함하는 다양한 요인이 비-천연 아미노산 혼입에서의 극적인 개선에 기여한다. 최적화된 PylRS/tRNA_CUA 시스템을 단독으로 사용할 때 단일 앰버 코돈에 반응하여 비-천연 아미노산의 혼입이 꽤 효율적이지만, eRF1 (예를 들어, E55D)의 첨가에 의해 효율이 추가로 개선된다. 비-천연 아미노산 혼입에 대한 eRF1 돌연변이체의 효과는 비-천연 아미노산을 다중 부위에 혼입하는 경우에 더욱 극적이어서, 3개의 부위에 아미노산 1을 함유하는 단백질의 수율을 2 내지 3배 증가시키고, 3개의 부위에 2를 함유하는 단백질의 수율을 4배 증가시킨다.

실시예 11: 대안적인 eRF1 돌연변이체의 실연

본 발명가들은 HEK 293T 세포주에서의 일시적인 형질감염에 의해 eRF1 변이체를 처음으로 스크리닝하였다. 하기의 표는 스크리닝된 돌연변이를 비-천연 아미노산 혼입 (BocK)에 대한 이의 효과 순으로 정렬하여 열거한다. 관련 프로토콜 및 지원 자료는 상기 실시예에서와 같다.

실시예 12: 다양한 진핵생물 종에서의 eRF1 돌연변이체 기능성

본 발명은 다양한 진핵생물 종에서의 용도가 있다. 본 발명은 곤충 세포 예컨대 파리 세포 (예를 들어 드로소필라), 진균 세포 예컨대 효모 세포 및 기타 진핵생물에서 적용될 수 있다.

본 발명가들은 일시적인 형질감염을 사용하여 돌연변이체 eRF1을 곤충 (Dmel) 세포주 내로 도입하였다.

방법:

D.mel-2 세포 (S2)의 일시적인 형질감염

드로소필라 S2 세포 (D.Mel; 인비트로젠(Invitrogen))를 표준 세포 배양 관례에 따라 T75 플라스크에서 2 mM L-글루타민 및 pen/strep (50 I.U./mL 페니실린, 50 ㎍/mL 스트렙토마이신)이 보강된 완전한 익스프레스(Express) 5 SFM 배지 (라이프 테크놀러지즈 리미티드(Life technologies Ltd.)) 상에서 유지시켰다. 형질감염 24시간 전에, 긁어내거나 진탕시켜서 세포를 탈착시키고, 5 ml의 현탁된 세포를 8 ml의 미리 가온된 배지로 희석하였다. 24웰 플레이트에, 웰 당 0.5 ml의 현탁된 세포를 시딩하고, 하룻밤 동안 성장시켰다. 퓨진 HD(Fugene HD) (프로메가)를 사용하여 세포를 일시적으로 형질감염시켰다. 각각의 웰에 대해, 1.75 ㎕의 퓨진 HD를 15 ㎕의 멸균수와 혼합하고, 실온에서 5분 동안 인큐베이션하였다. 유사하게, 0.75 ㎍의 DNA (각각 0.3 ㎍의 리포터, PylRS/PylT 및 eRF1 구축물, 0.15 ㎍의 GAL4)를 15 ㎕의 멸균수에 희석하고, 희석된 퓨진 HD 시약에 첨가한 후, 실온에서 15분 동안 인큐베이션하였다. 표적 세포를 함유하는 각각의 웰에서, 소비된 성장 배지를 제거하고, 세포를 조심스럽게 500 ㎕ 멸균 PBS로 세정하였다. 그 후, 각각의 웰에 500 ㎕의 익스프레스 5 배지, 0.2 mM CuSO₄ (시그마), 2 mM/ml 글루타민 및 비-천연 아미노산 (필요한 경우)을 채웠다. 1을 멸균수/NaOH에 용해시키고 (20 mM 1), 성장 배지에 첨가하였다. 이어서 4 M HCl을 사용하여 pH를 6.5로 조정하였다. 달리 언급되지 않는 한, 성장 배지 내의 2의 최종 농도는 2 mM이었다. 30 ㎕ 형질감염 믹스 중 25 ㎕를 각각의 웰에 점적식으로 첨가하였다. 플레이트를 조심스럽게 진탕시키고, 25℃에서 하룻밤 동안 인큐베이션하였다. 형질감염 16시간 후, 각각의 웰을 PBS로 세정하고, 실온에서 15분 동안 진탕시키면서 세포를 컴플리트 프로테아제 억제제 (로슈)가 첨가된 100 ㎕ RIPA 완충제 (시그마)에서 용해시켰다.

GFP-TAG-mCherry 구축물의 발현에 의해 비-천연 아미노산 혼입을 결정하였다. HEK293T 세포에 대해 기술된 바와 같이, GFP에 대해 면역염색된 블롯 상에서의 정량에 의해 전장 단백질 대 말단절단된 단백질의 비를 결정하였다.

드로소필라 멜라노가스터 유전자 구축물

His₆ 태그 및 삼중-정지 종결 신호를 함유하는 디. 멜라노가스터 코돈 용법에 대해 최적화된 인간 eRF1 유전자를 BamHI/NotI 제한 부위 (프라이머 eRF1_SG105)를 사용하여 플라스미드 SG105 (Bianco et al., 2012) 내로 클로닝하였다. SG105는 UASp로부터 유래되고, 흰눈 유전자좌의 하류에 제2의 다중 클로닝 부위를 함유한다 (Rørth, 1998). AB51은 U6-PylT 카세트의 6개의 카피 및 UAS-PylRS를 함유한다 (암브라 비안코(Ambra Bianco), 미공개 데이터).

디. 멜라노가스터에서의 비-천연 아미노산 혼입 효율의 결정

드로소필라 배아 주입 서비스 (베스트진 인크(Bestgene Inc.))를 사용하여 P 요소 주입에 의해 eRF1 변이체를 함유하는 트렌스제닉 파리 계통을 생성시켰다. 플라스미드 SG105 내로 클로닝된 eRF1 Δ100 및 E55D 구축물이 성공적으로 미세주입되었고, 각각 9개 및 7개의 독특한 계통으로 반송되었다.

파리 계통 스톡을 16℃에서 사과 플레이트 상에서 유지시켰다. 유전적 교배 및 비-천연 아미노산 혼입 실험을 위해, 파리를 25℃에서 유지시켰다. eRF1 Δ100 또는 E55D 변이체를 함유하는 파리 계통을 FT74-S2-nos 파리 계통으로부터의 처녀 암컷과 교배시켰다. 생성된 후손을 각각의 eRF1 계통에 좌우되는 유전자 마커의 올바른 조합에 대해 스크리닝하고, 추가 실험을 위해 유지시켰다.

FT74-S2-nos 계통은 PylRS/PylT_CUA 쌍을 이용한 비-천연 아미노산 혼입을 지지하고, 이중 루시페라제 리포터를 발현한다. 게놈 상의 구축물 통합물은 UAS-이중-루시페라제(TAG) 리포터, UAS-PylRS, U6-PylT 카세트 (삼중-Rep-L)의 4개의 카피, 및 nos-Gal4-VP16 카세트 (블루밍톤(Bloomington) 4937)이다. 이러한 구축물 및 계통의 생성이 문헌 [Bianco et al., 2012]에 논의되어 있다.

화합물 2를 효모 페이스트 내로 혼합하여 파리에 급식하였다. 2를 물/NaOH에 10 mM의 최종 농도로 용해시키고, 페이스트성 경도가 달성될 때까지 건조 효모를 첨가하였다. 1M HCl을 첨가하여 페이스트를 중화시켰다. 파리 계통에서의 비-천연 아미노산 혼입을 측정하기 위해, 비-천연 아미노산 혼입을 위한 필요한 성분들, 뿐만 아니라 eRF1 변이체를 발현하는 각각의 계통의 암컷 파리 15마리를 튜브에서 5마리의 수컷과 짝지우고, 소량의 10 mM 2-효모 페이스트를 공급하였다. 24 및 48시간 후 파리를 신선한 2-효모 페이스트가 있는 새로운 튜브로 옮겼다. 제3일에, 오전에 2-효모 페이스트가 있는 새로운 튜브로 옮기고, 오후에 암컷 파리를 해부하였다.

해부를 위해, 파리를 CO₂ 패드 상에서 수집하였다. 암컷 파리를 현미경 하의 해부 유리로 옮기고, 후방 끝부분을 조심스럽게 제거하여 흉부로부터 난소를 단리하였다. 10-12마리의 파리로부터의 난소를 PBS 완충제 내에 수집하고, 1.5 ml 미세원심분리 튜브 내로 옮겼다. 튜브를 탁상용 원심분리기에서 최저 설정으로 30초 동안 원심분리하고, 상청액을 제거하였다. 100 ㎕의 1× 패시브 용해 완충제 (프로메가)를 첨가한 후, 용액이 우유와 같은 외관에 도달할 때까지 플라스틱 막자를 사용하여 난소를 갈아서 분쇄하였다. 전속력으로 3분 동안 원심분리하여 잔해물을 제거하였다. 상청액을 조심스럽게 제거하고, 다시 전속력으로 1분 동안 펠릿화하였다. 96웰 형식의 이중 루시페라제 검정법 당 10 ㎕의 이러한 용해물을 샘플 당 3중으로 사용하였다. 포유동물 세포 용해물에 대해 기술된 바와 같이 검정법 (프로메가)을 수행하였다.

도 12를 참조한다.

a. 유전적 배경의 도해. 피롤리실 aaRS/tRNA_CUA 쌍, 이중-루시페라제 리포터 및 난소-특이적 프로모터를 발현하는 파리 계통 FT74-S2-Nos/TM6으로부터의 처녀 암컷을 미세주입 (베스트진) 후에 eRF1 E55D 또는 Δ100의 무작위 게놈 삽입에 의해 생성된 밸런스(balanced) 파리 계통으로부터의 수컷과 교배시켰다. b, c. 이중 루시페라제 검정법에서의 정지 코돈 번역초과의 측정. 각각의 유전적 교배로부터의 올바른 유전자 마커가 있는 암컷 파리 12마리를 수집하고, 72시간 동안 10 mM CyP-효모 페이스트를 먹였다. 해부에 의해 난소를 수집하고, 풀링하고, UAG 번역초과에 대해 테스트하였다. 패널 b는 eRF1 E55D 통합 이벤트로부터 생성된 모든 파리 계통에 대한 결과를 열거하고, 패널 c는 eRF1 Δ100에 대한 결과를 열거한다.

실시예 13: PylT U25C 및 PylT U25C Opt 변이체 양쪽 모두가 HEK 세포에서 앰버를 효율적으로 억제한다

HEK 세포가 GFP150UAG 및 4× PylT U25C 또는 4× PylT U25C Opt로 형질감염되고, FACS를 통해 GFP 형광에 대해 분석되었으며, GFP-양성 집단이 백분율이 표시되면서 분홍색으로 원을 그리고, 그래프는 반복실험의 MFI이다. 표준 형질감염 및 유동 세포측정법 프로토콜이고, 2 mM BocK에서 발현된다. 도 13을 참조한다.

각각 4× PylT U25C 또는 4× PylT U25C Opt를 이용한 트라스투주맙 중쇄 (위치 A114에 UAG가 있고, LC 및 HC가 별개의 플라스미드 상에 있음)의 웨스턴 블롯. 반복 실험의 블롯 강도가 그래프용으로 측정된다. 표준 형질감염 및 웨스턴 블롯 프로토콜이고, 2 mM BocK에서 발현된다. 도 14 및 도 15를 참조한다.

비교를 위한 모체 엠. 마제이 Pyl tRNA(cua 안티코돈), U25C 유도체, U25C 및 Opt 유도체에 대한 tRNA 클로버잎형 다이어그램. U25C 돌연변이는 녹색으로, 뉴클레오티드 6개의 Opt 돌연변이는 분홍색으로 기재된다. 도 16을 참조한다.

tRNA 변이체들에 대한 DNA 서열의 서열 정렬 (차이는 흑색이다) - CCA 테일이 포유동물 플라스미드에서 명시적으로 코딩되지 않지만, 세포에 의해 전사 후에 부가된다는 것을 주지한다. 도 17을 참조한다.

엠. 마제이 PylT U25C Opt

(1×) 인간 U6 프로모터 :: 엠. 마제이 PylT U25C Opt :: 3' UTR 및 종결인자

클로닝된 바와 같은 (4×) 인간 U6 프로모터 :: 엠. 마제이 PylT U25C Opt :: 3' UTR 및 종결인자

이러한 4× 카세트가 상기 기술된 다양한 벡터, 예컨대 GFP(150 uag), 트라스투주맙 LC 및 HC (114 uag)가 있는 pKYM1 내의 4× PylT U25C 카세트를 교체할 수 있다.

실시예 14: eRF1 E55D가 항체 발현을 증가시킨다.

달리 언급되지 않는 한 모든 실험을 2 mM bocK로 행하였다. "CypK"로 열거된 것은 0.5 mM 시클로프로펜으로 행하였다. 양쪽 모두 피롤리신 모방체이다. HC 및 LC는 별개의 플라스미드 상에 있었고, 표준 PEI 프로토콜을 사용하여 1:1 비로 공동-형질감염시켰다. GFP 연구를 위해, 단일 플라스미드만 형질감염시켰다. 비-천연의 tRNA/신테타제 기구가 GFP/mAb 유전자와 동일한 플라스미드 상에 있기 때문에, 이러한 연구를 위해 추가의 플라스미드가 필요하지 않았다.

양쪽 모두의 항체 유전자, 뿐만 아니라 피롤리신 비-천연 아미노산 tRNA 및 신테타제를 함유하는 단일 벡터로부터 LC-ires-HC 형식으로 항체 발현을 행하였다. 이러한 4×PylT(u25c)/PylS 구축물은 상기 기술된 바와 같다.

eRF1은 표준 발현 벡터인 pcDNA5로부터 발현되었다. eRF1을 항체 플라스미드에 대해 1:5 비로 형질감염시켰다. 현탁 HEK 시스템인 Expi293 세포에서 실험을 행하였고, 이를 표준 프로토콜을 사용하여 PEI로 형질감염시켰다. 배양물은 각각 30 mL였고, 60 ug의 DNA + 180 ug의 PEI를 사용하였으며, 7일 동안 발현시켰다.

HRP에 접합된 항-HC 및 항-LC 항체를 사용하여, 배양물의 상청액으로부터 직접적으로 웨스턴 블롯팅하였다. 중쇄의 위치 Ala114에 UAG 앰버 코돈이 있는 트라스투주맙이 HEK 세포에서 eRF1 E55D와 본 발명가들의 발현 시스템으로 발현 증가를 나타낸다. 도 18을 참조한다.

구축물이 도 19에 있다. 플라스미드 다이어그램이 도 20에 있다. 서열은 하기와 같다.

pKYM1 LC-ires-HC 서열

HC A114X DNA 서열 + 리더 펩티드

LC DNA 서열 + 리더 펩티드

HC + A114X 돌연변이 단백질 서열 - *는 UAG 비-천연 부위를 나타낸다

LC 단백질 서열

실시예 15: eRF1 E55D가 HEK 세포에서 BCN 혼입을 강화한다

HEK293 3일 발현, 1 mM BCN (N엡실론-(비시클로[6.1.0]논-4-인-9-일메톡시)카르보닐-L-리신)), 1:1:1 비의 플라스미드, 상기 기술된 바와 같은 표준 프로토콜. 도 21을 참조한다.

약어

PylRS, 피롤리실-tRNA 신테타제; PylT, 피롤리실-tRNA 신테타제; eRF1, 진핵생물 방출 인자 1; eRF3, 진핵생물 방출 인자 3; sfGFP, 수퍼-폴더(super-folder) 녹색 형광 단백질.

참고문헌

보충 참고문헌

본원에서 인용되거나 기술된 임의의 간행물은 본 출원의 출원일 이전에 개시된 관련 정보를 제공한다. 본원에서의 서술은 본 발명가들이 이같은 개시내용을 선행할 자격이 없다는 것을 인정하는 것으로 해석되지 않아야 한다. 상기 명세서에서 언급된 모든 간행물은 본원에 참조로 포함된다. 본 발명의 다양한 변형 및 변경이 본 발명의 범주 및 취지를 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명이 구체적인 바람직한 실시양태와 관련되어 기술되었지만, 청구된 바와 같은 본 발명이 이같은 구체적인 실시양태에 과도하게 제한되지 않아야 한다는 것을 이해하여야 한다. 실제로, 분자생물학 및 화학 또는 관련 분야의 통상의 기술자에게 자명한, 본 발명을 수행하기 위한 기술된 양식의 다양한 변형이 하기 청구범위의 범주 내인 것으로 의도된다.

보충 표 S1

이러한 연구에서 사용된 합성 유전자의 뉴클레오티드 서열. A. 변형된 U6-PylT^* 발현 카세트의 서열. PylT에 밑줄이 그어지고, 안티코돈이 적색으로 표시된다. B. 에이치. 사피엔스 코돈-최적화되고, C-말단 폴리히스티딘 태그가 있는 sfGFP(TAG)의 서열. 위치 150의 앰버 코돈이 적색으로 표시된다. C는 N-말단 폴리히스티딘 태그가 있는, 디. 멜라노가스터에 대한 코돈 최적화 후의 인간 eRF1 서열을 나타낸다.

보충 표 S2

부위-지정 돌연변이 유발에 사용된 올리고뉴클레오티드

서열

차트 1

SEQUENCE LISTING <110> Medical Research Council <120> Incorporation of Unnatural Amino Acids into Proteins <130> |P10195WO| <140> PCT/GB2015/053141 <141> 2015-10-21 <160> 67 <170> PatentIn version 3.5 <210> 1 <211> 9683 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid expression construct <400> 1 actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 60 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 120 agtgccacct aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 180 atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 240 tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac 300 gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa 360 ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct 420 aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa 480 gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc 540 gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtccca ttcgccattc 600 aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 660 gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 720 cgacgttgta aaacgacggc cagtgagcgc gcctcgttca ttcacgtttt tgaacccgtg 780 gaggacgggc agactcgcgg tgcaaatgtg ttttacagcg tgatggagca gatgaagatg 840 ctcgacacgc tgcagaacac gcagctagat taaccctaga aagataatca tattgtgacg 900 tacgttaaag ataatcatgc gtaaaattga cgcatgtgtt ttatcggtct gtatatcgag 960 gtttatttat taatttgaat agatattaag ttttattata tttacactta catactaata 1020 ataaattcaa caaacaattt atttatgttt atttatttat taaaaaaaaa caaaaactca 1080 aaatttcttc tataaagtaa caaaactttt atgagggaca gccccccccc aaagccccca 1140 gggatgtaat tacgtccctc ccccgctagg gggcagcagc gagccgcccg gggctccgct 1200 ccggtccggc gctccccccg catccccgag ccggcagcgt gcggggacag cccgggcacg 1260 gggaaggtgg cacgggatcg ctttcctctg aacgcttctc gctgctcttt gagcctgcag 1320 acacctgggg ggatacgggg aaaaggcctc caaggccact aggaaaaacc gcacttgtcc 1380 ggaaaccccg ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc 1440 aggtttccgg tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt 1500 caagttacgg taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac 1560 ccaagaaatt attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc 1620 aaattaattc taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc 1680 atgggaaata ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg 1740 ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg 1800 tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg 1860 taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt 1920 attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc 1980 taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata 2040 ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac 2100 ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc 2160 tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg 2220 atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct 2280 acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc 2340 tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc 2400 ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac 2460 ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag 2520 atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt 2580 ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta 2640 ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc 2700 ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact 2760 agtaaggatc tgcgatcgct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt 2820 ccccgagaag ttggggggag gggtcggcaa ttgaacgggt gcctagagaa ggtggcgcgg 2880 ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga 2940 accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag 3000 aacacagctg aagcttcgag gggctcgcat ctctccttca cgcgcccgcc gccctacctg 3060 aggccgccat ccacgccggt tgagtcgcgt tctgccgcct cccgcctgtg gtgcctcctg 3120 aactgcgtcc gccgtctagg taagtttaaa gctcaggtcg agaccgggcc tttgtccggc 3180 gctcccttgg agcctaccta gactcagccg gctctccacg ctttgcctga ccctgcttgc 3240 tcaactctac gtctttgttt cgttttctgt tctgcgccgt tacagatcca agctgtgacc 3300 ggcgcctact ctagagctag cgtttaaact taagcttgcc accatggact acaaggacga 3360 cgacgacaag gacaagaagc ccctgaacac cctgatcagc gccacaggac tgtggatgtc 3420 cagaaccggc accatccaca agatcaagca ccacgaggtg tcccggtcca aaatctacat 3480 cgagatggcc tgcggcgatc acctggtcgt caacaacagc agaagcagcc ggacagccag 3540 agccctgcgg caccacaagt acagaaagac ctgcaagcgg tgcagagtgt ccgacgagga 3600 cctgaacaag ttcctgacca aggccaacga ggaccagacc agcgtgaaag tgaaggtggt 3660 gtccgccccc acccggacca agaaagccat gcccaagagc gtggccagag cccccaagcc 3720 cctggaaaac accgaagccg ctcaggccca gcccagcggc agcaagttca gccccgccat 3780 ccccgtgtct acccaggaaa gcgtcagcgt ccccgccagc gtgtccacca gcatctctag 3840 catctcaacc ggcgccacag cttctgccct ggtcaagggc aacaccaacc ccatcaccag 3900 catgtctgcc cctgtgcagg cctctgcccc agccctgacc aagtcccaga ccgaccggct 3960 ggaagtgctc ctgaacccca aggacgagat cagcctgaac agcggcaagc ccttccggga 4020 gctggaaagc gagctgctga gccggcggaa gaaggacctc cagcaaatct acgccgagga 4080 acgggagaac tacctgggca agctggaaag agagatcacc cggttcttcg tggaccgggg 4140 cttcctggaa atcaagagcc ccatcctgat ccccctggag tacatcgagc ggatgggcat 4200 cgacaacgac accgagctga gcaagcagat tttccgggtg gacaagaact tctgcctgcg 4260 gcccatgctg gcccccaacc tgtacaacta cctgcggaaa ctggatcgcg ctctgcccga 4320 ccccatcaag attttcgaga tcggcccctg ctaccggaaa gagagcgacg gcaaagagca 4380 cctggaagag tttacaatgc tgaacttttg ccagatgggc agcggctgca ccagagagaa 4440 cctggaatcc atcatcaccg actttctgaa ccacctgggg atcgacttca agatcgtggg 4500 cgacagctgc atggtgtacg gcgacaccct ggacgtgatg cacggcgacc tggaactgtc 4560 tagcgccgtc gtgggaccca tccctctgga ccgggagtgg ggcatcgata agccctggat 4620 cggagccggc ttcggcctgg aacggctgct gaaagtcaag cacgacttta agaacatcaa 4680 gcgggctgcc agaagcgaga gctactacaa cggcatcagc accaacctgt gatgataagg 4740 atccaaaatg tacagcggcc gcgcccctct ccctcccccc cccctaacgt tactggccga 4800 agccgcttgg aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg 4860 tcttttggca atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg 4920 ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt 4980 cctctggaag cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac 5040 cccccacctg gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca 5100 aaggcggcac aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg 5160 ctctcctcaa gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg 5220 ggatctgatc tggggcctcg gtgcacatgc tttacatgtg tttagtcgag gttaaaaaaa 5280 cgtctaggcc ccccgaacca cggggacgtg gttttccttt gaaaaacacg ataatacctc 5340 cggaatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 5400 attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 5460 gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 5520 actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 5580 tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 5640 gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 5700 aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 5760 tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 5820 cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 5880 cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 5940 aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 6000 ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 6060 cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 6120 tcttgacgag ttcttctgag tcgacaatca acctctggat tacaaaattt gtgaaagatt 6180 gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc 6240 tttgtatcat gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 6300 cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 6360 catcaatgta tcttatcatg tctggaattg actcaaatga tgtcaattag tctatcagaa 6420 gctatctggt ctcccttccg ggggacaaga catccctgtt taatatttaa acagcagtgt 6480 tcccaaactg ggttcttata tcccttgctc tggtcaacca ggttgcaggg tttcctgtcc 6540 tcacaggaac gaagtcccta aagaaacagt ggcagccagg tttagccccg gaattgactg 6600 gattcctttt ttagggccca ttggtatggc tttttccccg tatcccccca ggtgtctgca 6660 ggctcaaaga gcagcgagaa gcgttcagag gaaagcgatc ccgtgccacc ttccccgtgc 6720 ccgggctgtc cccgcacgct gccggctcgg ggatgcgggg ggagcgccgg accggagcgg 6780 agccccgggc ggctcgctgc tgccccctag cgggggaggg acgtaattac atccctgggg 6840 gctttggggg ggggctgtcc ctgatatcta taacaagaaa atatatatat aataagttat 6900 cacgtaagta gaacatgaaa taacaatata attatcgtat gagttaaatc ttaaaagtca 6960 cgtaaaagat aatcatgcgt cattttgact cacgcggtcg ttatagttca aaatcagtga 7020 cacttaccgc attgacaagc acgcctcacg ggagctccaa gcggcgactg agatgtccta 7080 aatgcacagc gacggattcg cgctatttag aaagagagag caatatttca agaatgcatg 7140 cgtcaatttt acgcagacta tctttctagg gttaatctag ctgcatcagg atcatatcgt 7200 cgggtctttt ttccggctca gtcatcgccc aagctggcgc tatctgggca tcggggagga 7260 agaagcccgt gccttttccc gcgaggttga agcggcatgg aaagagtttg ccgaggatga 7320 ctgctgctgc attgacgttg agcgaaaacg cacgtttacc atgatgattc gggaaggtgt 7380 ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc acctgggata ccagttcgtc 7440 gcggcttttc cggacacagt tccggatggt cagcccgaag cgcatcagca acccgaacaa 7500 taccggcgac agccggaact gccgtgccgg tgtgcagatt aatgacagcg gtgcggcgct 7560 gggatattac gtcagcgagg acgggtatcc tggctggatg ccgcagaaat ggacatggat 7620 accccgtgag ttacccggcg ggcgcgcttg gcgtaatcat ggtcatagct gtttcctgtg 7680 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 7740 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 7800 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 7860 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 7920 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 7980 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 8040 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 8100 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 8160 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 8220 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 8280 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 8340 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 8400 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 8460 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 8520 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 8580 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 8640 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 8700 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 8760 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 8820 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 8880 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 8940 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 9000 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 9060 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 9120 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 9180 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 9240 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 9300 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 9360 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 9420 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 9480 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 9540 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 9600 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 9660 acacggaaat gttgaatact cat 9683 <210> 2 <211> 9400 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid expression construct <400> 2 actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 60 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 120 agtgccacct aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 180 atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 240 tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac 300 gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa 360 ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct 420 aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa 480 gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc 540 gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtccca ttcgccattc 600 aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 660 gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 720 cgacgttgta aaacgacggc cagtgagcgc gcctcgttca ttcacgtttt tgaacccgtg 780 gaggacgggc agactcgcgg tgcaaatgtg ttttacagcg tgatggagca gatgaagatg 840 ctcgacacgc tgcagaacac gcagctagat taaccctaga aagataatca tattgtgacg 900 tacgttaaag ataatcatgc gtaaaattga cgcatgtgtt ttatcggtct gtatatcgag 960 gtttatttat taatttgaat agatattaag ttttattata tttacactta catactaata 1020 ataaattcaa caaacaattt atttatgttt atttatttat taaaaaaaaa caaaaactca 1080 aaatttcttc tataaagtaa caaaactttt atgagggaca gccccccccc aaagccccca 1140 gggatgtaat tacgtccctc ccccgctagg gggcagcagc gagccgcccg gggctccgct 1200 ccggtccggc gctccccccg catccccgag ccggcagcgt gcggggacag cccgggcacg 1260 gggaaggtgg cacgggatcg ctttcctctg aacgcttctc gctgctcttt gagcctgcag 1320 acacctgggg ggatacgggg aaaaggcctc caaggccact aggaaaaacc gcacttgtcc 1380 ggaaaccccg ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc 1440 aggtttccgg tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt 1500 caagttacgg taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac 1560 ccaagaaatt attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc 1620 aaattaattc taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc 1680 atgggaaata ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg 1740 ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg 1800 tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg 1860 taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt 1920 attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc 1980 taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata 2040 ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac 2100 ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc 2160 tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg 2220 atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct 2280 acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc 2340 tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc 2400 ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac 2460 ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag 2520 atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt 2580 ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta 2640 ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc 2700 ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact 2760 aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac ggatttagag 2820 tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag atatataaag 2880 ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt ttaaaacata 2940 attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta ttttgtacta 3000 atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc ttgtatcgta 3060 tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact agtaaggatc 3120 tgcgatcgct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag 3180 ttggggggag gggtcggcaa ttgaacgggt gcctagagaa ggtggcgcgg ggtaaactgg 3240 gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata 3300 agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacacagctg 3360 aagcttcgag gggctcgcat ctctccttca cgcgcccgcc gccctacctg aggccgccat 3420 ccacgccggt tgagtcgcgt tctgccgcct cccgcctgtg gtgcctcctg aactgcgtcc 3480 gccgtctagg taagtttaaa gctcaggtcg agaccgggcc tttgtccggc gctcccttgg 3540 agcctaccta gactcagccg gctctccacg ctttgcctga ccctgcttgc tcaactctac 3600 gtctttgttt cgttttctgt tctgcgccgt tacagatcca agctgtgacc ggcgcctact 3660 ctagagctag cgaattcgaa tttaaatcgg atcaccacca tggtgtccaa gggcgaggaa 3720 ctgttcaccg gcgtggtgcc catcctggtg gaactggatg gcgacgtgaa cggccacaag 3780 ttctctgtgc ggggagaggg cgaaggcgac gccacaaatg gcaagctgac cctgaagttc 3840 atctgcacca ccggcaagct gcccgtgcct tggcctaccc tcgtgaccac actgacctac 3900 ggcgtgcagt gcttcagcag ataccccgac catatgaagc ggcacgactt cttcaagagc 3960 gccatgcccg agggctacgt gcaggaacgg accatcagct tcaaggacga cggcacctac 4020 aagaccagag ccgaagtgaa gttcgagggc gacaccctcg tgaaccggat cgagctgaag 4080 ggcattgatt tcaaagagga cggcaacatc ctgggccaca agctggagta caacttcaac 4140 agccactagg tgtacatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 4200 atccggcaca acgtggaaga tggcagcgtg cagctggccg accactacca gcagaacacc 4260 cccatcggag atggccccgt gctgctgccc gacaaccact acctgagcac ccagagcgtg 4320 ctgagcaagg accccaacga gaagcgggac cacatggtgc tgctggaatt cgtgaccgcc 4380 gctggcatca cccacggcat ggacgagctg tacaagggca gccaccatca ccatcaccat 4440 tgataaggat cccagttacc atcgatgatc cgcggccgcg cccctctccc tccccccccc 4500 ctaacgttac tggccgaagc cgcttggaat aaggccggtg tgcgtttgtc tatatgttat 4560 tttccaccat attgccgtct tttggcaatg tgagggcccg gaaacctggc cctgtcttct 4620 tgacgagcat tcctaggggt ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg 4680 tcgtgaagga agcagttcct ctggaagctt cttgaagaca aacaacgtct gtagcgaccc 4740 tttgcaggca gcggaacccc ccacctggcg acaggtgcct ctgcggccaa aagccacgtg 4800 tataagatac acctgcaaag gcggcacaac cccagtgcca cgttgtgagt tggatagttg 4860 tggaaagagt caaatggctc tcctcaagcg tattcaacaa ggggctgaag gatgcccaga 4920 aggtacccca ttgtatggga tctgatctgg ggcctcggtg cacatgcttt acatgtgttt 4980 agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg ggacgtggtt ttcctttgaa 5040 aaacacgata atacctccgg aatgattgaa caagatggat tgcacgcagg ttctccggcc 5100 gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 5160 gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 5220 tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 5280 ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 5340 ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 5400 tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 5460 gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 5520 gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 5580 ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 5640 ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 5700 gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 5760 ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 5820 atcgccttct atcgccttct tgacgagttc ttctgagtcg acaatcaacc tctggattac 5880 aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 5940 tacgctgctt taatgccttt gtatcatgtt aacttgttta ttgcagctta taatggttac 6000 aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 6060 tgtggtttgt ccaaactcat caatgtatct tatcatgtct ggaattgact caaatgatgt 6120 caattagtct atcagaagct atctggtctc ccttccgggg gacaagacat ccctgtttaa 6180 tatttaaaca gcagtgttcc caaactgggt tcttatatcc cttgctctgg tcaaccaggt 6240 tgcagggttt cctgtcctca caggaacgaa gtccctaaag aaacagtggc agccaggttt 6300 agccccggaa ttgactggat tcctttttta gggcccattg gtatggcttt ttccccgtat 6360 ccccccaggt gtctgcaggc tcaaagagca gcgagaagcg ttcagaggaa agcgatcccg 6420 tgccaccttc cccgtgcccg ggctgtcccc gcacgctgcc ggctcgggga tgcgggggga 6480 gcgccggacc ggagcggagc cccgggcggc tcgctgctgc cccctagcgg gggagggacg 6540 taattacatc cctgggggct ttgggggggg gctgtccctg atatctataa caagaaaata 6600 tatatataat aagttatcac gtaagtagaa catgaaataa caatataatt atcgtatgag 6660 ttaaatctta aaagtcacgt aaaagataat catgcgtcat tttgactcac gcggtcgtta 6720 tagttcaaaa tcagtgacac ttaccgcatt gacaagcacg cctcacggga gctccaagcg 6780 gcgactgaga tgtcctaaat gcacagcgac ggattcgcgc tatttagaaa gagagagcaa 6840 tatttcaaga atgcatgcgt caattttacg cagactatct ttctagggtt aatctagctg 6900 catcaggatc atatcgtcgg gtcttttttc cggctcagtc atcgcccaag ctggcgctat 6960 ctgggcatcg gggaggaaga agcccgtgcc ttttcccgcg aggttgaagc ggcatggaaa 7020 gagtttgccg aggatgactg ctgctgcatt gacgttgagc gaaaacgcac gtttaccatg 7080 atgattcggg aaggtgtggc catgcacgcc tttaacggtg aactgttcgt tcaggccacc 7140 tgggatacca gttcgtcgcg gcttttccgg acacagttcc ggatggtcag cccgaagcgc 7200 atcagcaacc cgaacaatac cggcgacagc cggaactgcc gtgccggtgt gcagattaat 7260 gacagcggtg cggcgctggg atattacgtc agcgaggacg ggtatcctgg ctggatgccg 7320 cagaaatgga catggatacc ccgtgagtta cccggcgggc gcgcttggcg taatcatggt 7380 catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 7440 gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 7500 tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 7560 gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 7620 actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 7680 tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 7740 aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 7800 ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 7860 aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 7920 cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 7980 cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 8040 aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 8100 cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 8160 ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 8220 ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 8280 gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 8340 agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 8400 acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 8460 tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 8520 agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 8580 gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 8640 agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 8700 cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 8760 ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 8820 cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 8880 cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 8940 ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 9000 tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 9060 catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 9120 gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 9180 gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 9240 tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 9300 catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 9360 aaaagggaat aagggcgaca cggaaatgtt gaatactcat 9400 <210> 3 <211> 1320 <212> DNA <213> Artificial Sequence <220> <223> codon optimised human eRF1 <400> 3 atggccgatg atccaagcgc cgcagaccgc aatgttgaga tctggaagat aaaaaagctg 60 ataaagagct tggaggccgc acggggcaac ggcacgtcca tgatatccct cattatccca 120 ccaaaggatc agatcagccg tgtggcgaag atgttggcgg atgagttcgg aacggccagt 180 aacattaaaa gtcgcgtgaa ccggctgtcg gtcttgggcg ccatcacttc cgtgcagcaa 240 cgtctgaaac tgtacaacaa agtcccaccc aacggtttgg tcgtctactg cggtacgata 300 gttaccgagg aaggaaagga gaagaaagtg aatattgatt tcgaaccatt taaaccgata 360 aacactagct tgtacttgtg cgacaataag tttcatacag aggcactcac ggccctgctg 420 agcgacgact cgaaattcgg attcattgtc attgatggaa gtggagcgct gttcggcacg 480 ctgcagggta acacgcgcga ggtcttgcac aaattcaccg tggacttgcc caaaaagcat 540 ggccgtggtg gccagagcgc cctcaggttt gcgcggctgc gcatggagaa gcgccataac 600 tacgtgcgca aggtcgcaga gacggctgtg cagctgttca tctcgggtga taaggtaaat 660 gtcgcgggac tggtgctcgc cggcagcgcg gacttcaaaa ccgagctgag tcagtccgac 720 atgttcgatc agcgtctgca gtcgaaggta ctgaagctcg tcgacattag ctacggcggc 780 gagaacggct tcaatcaggc catcgaactg agtaccgaag tcctcagtaa cgtaaagttt 840 attcaggaaa aaaagttgat tggacgctac tttgatgaaa taagccaaga tacgggcaaa 900 tactgttttg gcgtcgagga tactctgaaa gcgctcgaga tgggagcagt ggaaatactc 960 atcgtatatg aaaatctcga tataatgcgc tatgtactgc attgccaagg aacagaagag 1020 gagaaaattc tctacctcac cccggagcaa gagaaggaca agagccattt tacagacaag 1080 gagacgggcc aagagcacga gctcattgag tcgatgccct tgctcgaatg gtttgccaac 1140 aactacaaga agttcggcgc gaccctggaa attgtcacgg ataaatcgca ggagggcagc 1200 cagtttgtga agggcttcgg tggcatcggc ggcatcctcc gctaccgggt ggatttccaa 1260 ggcatggaat atcaaggtgg agatgatgaa ttcttcgatt tggatgatta ctaatgatag 1320 <210> 4 <211> 437 <212> PRT <213> Homo sapiens <400> 4 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 5 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 E55D <400> 5 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Asp Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 6 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 N129P K130Q <400> 6 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp 115 120 125 Pro Gln Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 7 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eFR1 T122Q S123F <400> 7 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Gln Phe Leu Tyr Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 8 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 E55A <400> 8 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Ala Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 9 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 Y125F <400> 9 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Phe Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 10 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 T58K S60T S64D Y125F N129S <400> 10 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Lys Ala Thr Asn Ile Lys Asp 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Phe Leu Cys Asp 115 120 125 Ser Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 11 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123A L124I Y125L <400> 11 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ala Ile Leu Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 12 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123R L124W Y125R <400> 12 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Arg Trp Arg Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 13 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123H, L124A, Y125G <400> 13 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr His Ala Gly Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 14 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 M51A K130M <400> 14 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Ala Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp 115 120 125 Asn Met Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 15 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123A Y125V <400> 15 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ala Ala Leu Val Leu Cys 115 120 125 Asp Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp 130 135 140 Ser Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly 145 150 155 160 Thr Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp 165 170 175 Leu Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala 180 185 190 Arg Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu 195 200 205 Thr Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly 210 215 220 Leu Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser 225 230 235 240 Asp Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp 245 250 255 Ile Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser 260 265 270 Thr Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile 275 280 285 Gly Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe 290 295 300 Gly Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile 305 310 315 320 Leu Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys 325 330 335 Gln Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu 340 345 350 Lys Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu 355 360 365 Leu Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys 370 375 380 Lys Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly 385 390 395 400 Ser Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr 405 410 415 Arg Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe 420 425 430 Phe Asp Leu Asp Asp Tyr 435 <210> 16 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123L L124C Y125S <400> 16 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Leu Cys Ser Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 17 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123L L124S Y125S <400> 17 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Leu Ser Ser Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 18 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> mutant eRF1 S123V L124T Y125P <400> 18 Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys 1 5 10 15 Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr 20 25 30 Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val 35 40 45 Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser 50 55 60 Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln 65 70 75 80 Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr 85 90 95 Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile 100 105 110 Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Val Thr Pro Leu Cys Asp 115 120 125 Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser 130 135 140 Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr 145 150 155 160 Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu 165 170 175 Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg 180 185 190 Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr 195 200 205 Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu 210 215 220 Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp 225 230 235 240 Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile 245 250 255 Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr 260 265 270 Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly 275 280 285 Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly 290 295 300 Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu 305 310 315 320 Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln 325 330 335 Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys 340 345 350 Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu 355 360 365 Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys 370 375 380 Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser 385 390 395 400 Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg 405 410 415 Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe 420 425 430 Asp Leu Asp Asp Tyr 435 <210> 19 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> linker <400> 19 gacaagtgcg g 11 <210> 20 <211> 1290 <212> DNA <213> Artificial Sequence <220> <223> codon optimised MbPylRS <400> 20 atggactaca aggacgacga cgacaaggac aagaaacccc tggacgtgct gatcagcgcc 60 accggcctgt ggatgagccg gaccggcacc ctgcacaaga tcaagcacca cgaggtgtca 120 agaagcaaaa tctacatcga gatggcctgc ggcgaccacc tggtggtgaa caacagcaga 180 agctgccgga ccgccagagc cttccggcac cacaagtaca gaaagacctg caagcggtgc 240 cgggtgtccg acgaggacat caacaacttt ctgaccagaa gcaccgagag caagaacagc 300 gtgaaagtgc gggtggtgtc cgcccccaaa gtgaagaaag ccatgcccaa gagcgtgtcc 360 agagccccca agcccctgga aaacagcgtg tccgccaagg ccagcaccaa caccagccgc 420 agcgtgccca gccccgccaa gagcaccccc aacagctccg tgcccgcctc tgctcctgct 480 cccagcctga cacggtccca gctggacaga gtggaggccc tgctgtcccc cgaggacaag 540 atcagcctga acatggccaa gcccttccgg gagctggaac ccgagctggt gacccggcgg 600 aagaacgact tccagcggct gtacaccaac gaccgggagg actacctggg caagctggaa 660 cgggacatca ccaagttctt cgtggaccgg ggcttcctgg aaatcaagag ccccatcctg 720 atccccgccg agtacgtgga gcggatgggc atcaacaacg acaccgagct gtccaagcag 780 attttccggg tggacaagaa cctgtgcctg cggcctatgc tggcccccac cctgtacaac 840 tacctgcgga aactggacag aatcctgcct ggccccatca agattttcga agtgggaccc 900 tgctaccgga aagagagcga cggcaaagag cacctggaag agtttacaat ggtgaatttt 960 tgccagatgg gcagcggctg cacccgggag aacctggaag ccctgatcaa agagttcctg 1020 gattacctgg aaatcgactt cgagatcgtg ggcgacagct gcatggtgta cggcgacacc 1080 ctggacatca tgcacggcga cctggaactg agcagcgccg tggtgggacc cgtgtccctg 1140 gaccgggagt ggggcatcga caagccctgg atcggagccg gcttcggcct ggaacggctg 1200 ctgaaagtga tgcacggctt caagaacatc aagcgggcca gcagaagcga gagctactac 1260 aacggcatca gcaccaacct gtgatgataa 1290 <210> 21 <211> 1396 <212> DNA <213> Artificial Sequence <220> <223> codon optimised MmPylRS <400> 21 atggactaca aggacgacga cgacaaggga caagaagccc ctgaacaccc tgatcagcgc 60 cacaggactg tggatgtcca gaaccggcac catccacaag atcaagcacc acgaggtgtc 120 ccggtccaaa atctacatcg agatggcctg cggcgatcac ctggtcgtca acaacagcag 180 aagcagccgg acagccagag ccctgcggca ccacaagtac agaaagacct gcaagcggtg 240 cagagtgtcc gacgaggacc tgaacaagtt cctgaccaag gccaacgagg accagaccag 300 cgtgaaagtg aaggtggtgt ccgcccccac ccggaccaag aaagccatgc ccaagagcgt 360 ggccagagcc cccaagcccc tggaaaacac cgaagccgct caggcccagc ccagcggcag 420 caagttcagc cccgccatcc ccgtgtctac ccaggaaagc gtcagcgtcc ccgccagcgt 480 gtccaccagc atctctagca tctcaaccgg cgccacagct tctgccctgg tcaagggcaa 540 caccaacccc atcaccagca tgtctgcccc tgtgcaggcc tctgccccag ccctgaccaa 600 gtcccagacc gaccggctgg aagtgctcct gaaccccaag gacgagatca gcctgaacag 660 cggcaagccc ttccgggagc tggaaagcga gctgctgagc cggcggaaga aggacctcca 720 gcaaatctac gccgaggaac gggagaacta cctgggcaag ctggaaagag agatcacccg 780 gttcttcgtg gaccggggct tcctggaaat caagagcccc atcctgatcc ccctggagta 840 catcgagcgg atgggcatcg acaacgacac cgagctgagc aagcagattt tccgggtgga 900 caagaacttc tgcctgcggc ccatgctggc ccccaacctg tacaactacc tgcggaaact 960 ggatcgcgct ctgcccgacc ccatcaagat tttcgagatc ggcccctgct accggaaaga 1020 gagcgacggc aaagagcacc tggaagagtt tacaatgctg aacttttgcc agatgggcag 1080 cggctgcacc agagagaacc tggaatccat catcaccgac tttctgaacc acctggggat 1140 cgacttcaag atcgtgggcg acagctgcat ggtgtacggc gacaccctgg acgtgatgca 1200 cggcgacctg gaactgtcta gcgccgtcgt gggacccatc cctctggacc gggagtgggg 1260 catcgataag ccctggatcg gagccggctt cggcctggaa cggctgctga aagtcaagca 1320 cgactttaag aacatcaagc gggctgccag aagcgagagc tactacaacg gcatcagcac 1380 caacctgtga tgataa 1396 <210> 22 <211> 61 <212> DNA <213> Methanosarcina mazeii <400> 22 ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 60 g 61 <210> 23 <211> 344 <212> DNA <213> Artificial Sequence <220> <223> U6 promoter - linker - terminator <400> 23 tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 60 tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 120 gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 180 ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 240 gtggaaagga cgaaacaccg gaaacctgat catgtagatc gaatggactc taaatccgtt 300 cagccgggtt agattcccgg ggtttccgga caagtgcggt tttt 344 <210> 24 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> exemplary U6 promoter <400> 24 tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 60 tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 120 gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 180 ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 240 gtggaaagga cgaaacaccg 260 <210> 25 <211> 556 <212> DNA <213> Artificial Sequence <220> <223> exemplary EF-1 alpha promoter <400> 25 ctagtaagga tctgcgatcg ctccggtgcc cgtcagtggg cagagcgcac atcgcccaca 60 gtccccgaga agttgggggg aggggtcggc aattgaacgg gtgcctagag aaggtggcgc 120 ggggtaaact gggaaagtga tgtcgtgtac tggctccgcc tttttcccga gggtggggga 180 gaaccgtata taagtgcagt agtcgccgtg aacgttcttt ttcgcaacgg gtttgccgcc 240 agaacacagc tgaagcttcg aggggctcgc atctctcctt cacgcgcccg ccgccctacc 300 tgaggccgcc atccacgccg gttgagtcgc gttctgccgc ctcccgcctg tggtgcctcc 360 tgaactgcgt ccgccgtcta ggtaagttta aagctcaggt cgagaccggg cctttgtccg 420 gcgctccctt ggagcctacc tagactcagc cggctctcca cgctttgcct gaccctgctt 480 gctcaactct acgtctttgt ttcgttttct gttctgcgcc gttacagatc caagctgtga 540 ccggcgccta ctctag 556 <210> 26 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> DNA probe <400> 26 ggaaaccccg ggaatctaac ccggctgaac ggatttagag 40 <210> 27 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> M. Mazei PylT U25C Opt <400> 27 ggaaacgtga tcatgtagat cgaacggact ctaaatccgt tcagtggggt tagattcccc 60 acgtttccg 69 <210> 28 <211> 350 <212> DNA <213> Artificial Sequence <220> <223> (1x) Human U6 promoter :: M. Mazei PylT U25C Opt :: 3' UTR and terminator <400> 28 cctagttggg caggaagagg gcctatttcc catgattcct tcatatttgc atatacgata 60 caaggctgtt agagagataa ttagaattaa tttgactgta aacacaaaga tattagtaca 120 aaatacgtga cgtagaaagt aataatttct tgggtagttt gcagttttaa aattatgttt 180 taaaatggac tatcatatgc ttaccgtaac ttgaaagtat ttcgatttct tggctttata 240 tatcttgtgg aaaggacgaa acaccggaaa cgtgatcatg tagatcgaac ggactctaaa 300 tccgttcagt ggggttagat tccccacgtt tccggacaag tgcggttttt 350 <210> 29 <211> 1642 <212> DNA <213> Artificial Sequence <220> <223> (4x) Human U6 promoter :: M. Mazei PylT U25C Opt :: 3' UTR and terminator as cloned <400> 29 tgggcgatgt gcgctctgcc cactgacggg caccggagcg atcgcagatc ccctagttgg 60 gcaggaagag ggcctatttc ccatgattcc ttcatatttg catatacgat acaaggctgt 120 tagagagata attagaatta atttgactgt aaacacaaag atattagtac aaaatacgtg 180 acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga 240 ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat atatcttgtg 300 gaaaggacga aacaccggaa acgtgatcat gtagatcgaa cggactctaa atccgttcag 360 tggggttaga ttccccacgt ttccggacaa gtgcggtttt tagaattaca acttatatcg 420 tatgggctag actcgagcct agttgggcag gaagagggcc tatttcccat gattccttca 480 tatttgcata tacgatacaa ggctgttaga gagataatta gaattaattt gactgtaaac 540 acaaagatat tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca 600 gttttaaaat tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc 660 gatttcttgg ctttatatat cttgtggaaa ggacgaaaca ccggaaacgt gatcatgtag 720 atcgaacgga ctctaaatcc gttcagtggg gttagattcc ccacgtttcc ggacaagtgc 780 ggtttttgcg gccgcgatat ctgcagaatt cacactggac taggatccga gctccctagt 840 tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 900 tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 960 gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 1020 ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 1080 gtggaaagga cgaaacaccg gaaacgtgat catgtagatc gaacggactc taaatccgtt 1140 cagtggggtt agattcccca cgtttccgga caagtgcggt ttttggtacc aagcttaagc 1200 agactcgtcg tgactacatt agcctagttg ggcaggaaga gggcctattt cccatgattc 1260 cttcatattt gcatatacga tacaaggctg ttagagagat aattagaatt aatttgactg 1320 taaacacaaa gatattagta caaaatacgt gacgtagaaa gtaataattt cttgggtagt 1380 ttgcagtttt aaaattatgt tttaaaatgg actatcatat gcttaccgta acttgaaagt 1440 atttcgattt cttggcttta tatatcttgt ggaaaggacg aaacaccgga aacgtgatca 1500 tgtagatcga acggactcta aatccgttca gtggggttag attccccacg tttccggaca 1560 agtgcggttt ttcctagtgg ccttggaggc cttttccccg tatcccccca ggtgtctgca 1620 ggctcaaaga gcagcgagaa gc 1642 <210> 30 <211> 10627 <212> DNA <213> Artificial Sequence <220> <223> pKYM1 LC-ires-HC sequence <400> 30 gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat atacgcgttg acattgatta 60 ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc atatatggag 120 ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc 180 ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac tttccattga 240 cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat 300 atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc 360 cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct 420 attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca 480 cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat 540 caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg 600 cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg 660 agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgg 720 actctagagg atcgaattaa gcttggtacc gccgccacca tgggatggtc atgtatcatc 780 ctttttctag tagcaactgc aaccggtgta cattctgaca tccagatgac ccagtccccg 840 agctctctgt ctgcgtctgt tggtgaccgc gttaccatca cctgccgtgc gtcccaggac 900 gttaacaccg ccgtggcgtg gtatcaacag aaaccgggta aagcgccaaa actgctgatc 960 tactccgcgt ctttcctgta ctctggtgtt ccgtctcgtt tcagcggttc tcgttctggt 1020 actgacttca ccctcaccat ctcttctctg cagccggaag acttcgcgac ctactactgc 1080 cagcagcact acaccacccc accgaccttc ggtcagggca ccaaagttga aatcaaacgt 1140 acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga 1200 actgcctctg ttgtgtgcct gctgaataac ttctacccca gagaagccaa agtgcagtgg 1260 aaggtggaca acgccctgca gagcggaaac agccaggaaa gcgtgacaga gcaggattcc 1320 aaggattcca catacagcct gagcagcaca ctgacactgt ccaaggccga ctacgagaag 1380 cacaaggtgt acgcctgcga agtgacacac cagggactgt cctcccctgt gacaaagagc 1440 ttcaacagag gagaatgctg aggccgcgcc cctctccctc ccccccccct aacgttactg 1500 gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 1560 tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 1620 ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 1680 cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 1740 ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 1800 ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 1860 aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 1920 gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 1980 aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa acacgataat 2040 acctccggaa tgggatggtc atgtatcatc ctttttctag tagcaactgc aaccggtgta 2100 cattctgaag ttcagctggt tgaatctggt ggtggtctgg ttcaaccggg tggctccctg 2160 cgtctgtctt gtgcggcctc tggttttaac atcaaagata cctatatcca ctgggttcgt 2220 caggcgccag gcaaaggtct ggaatgggtt gcgcgtatct acccgaccaa cggttacacc 2280 cgctacgcgg actctgttaa aggtcgtttc accatctctg cggacacctc taaaaacacc 2340 gcgtacctgc agatgaactc tctgcgtgcg gaagacaccg ccgtttacta ctgctctcgt 2400 tggggtggtg acggtttcta cgcgatggac tactggggtc agggtacgct ggttaccgtt 2460 tcttcttagt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc 2520 tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga acctgtgacg 2580 gtctcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag 2640 tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc 2700 cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt 2760 gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 2820 gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 2880 acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 2940 aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 3000 tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 3060 ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 3120 atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 3180 gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 3240 gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 3300 cccgtgctgg actccgacgg ctccttcttc ctctatagca agctcaccgt ggacaagagc 3360 aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 3420 tacacgcaga agagcctctc cctgtccccg ggttgagctc gagtctagag ggttcgatcc 3480 ctaccggtta gtaatgagtt taaactcgac aatcaacctc tggattacaa aatttgtgaa 3540 agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 3600 atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 3660 tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 3720 tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 3780 ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 3840 cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 3900 gggaagctga cgtcctttcc atggctgctc gcctgtgttg ccacctggat tctgcgcggg 3960 acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 4020 ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 4080 ctttgggccg cctccccgcc tggaaacggg ggaggctaac tgaaacacgg aaggagacaa 4140 taccggaagg aacccgcgct atgacggcaa taaaaagaca gaataaaacg cacgggtgtt 4200 gggtcgtttg ttcataaacg cggggttcgg tcccagggct ggcactctgt cgatacccca 4260 ccgagacccc attggggcca atacgcccgc gtttcttcct tttccccacc ccacccccca 4320 agttcgggtg aaggcccagg gctcgcagcc aacgtcgggg cggcaggccc tgccatagca 4380 gatctgcgca gctctataaa gtaacaaaac ttttatgagg gacagccccc ccccaaagcc 4440 cccagggatg taattacgtc cctcccccgc tagggggcag cagcgagccg cccggggctc 4500 cgctccggtc cggcgctccc cccgcatccc cgagccggca gcgtgcgggg acagcccggg 4560 cacggggaag gtggcacggg atcgctttcc tctgaacgct tctcgctgct ctttgagcct 4620 gcagacacct ggggggatac ggggaaaagg cctccaaggc cactaggaaa aaccgcactt 4680 gtccggaaac cccgggaatc taacccggct gaacggattt agagtccatt cgatctacat 4740 gatcaggttt ccggtgtttc gtcctttcca caagatatat aaagccaaga aatcgaaata 4800 ctttcaagtt acggtaagca tatgatagtc cattttaaaa cataatttta aaactgcaaa 4860 ctacccaaga aattattact ttctacgtca cgtattttgt actaatatct ttgtgtttac 4920 agtcaaatta attctaatta tctctctaac agccttgtat cgtatatgca aatatgaagg 4980 aatcatggga aataggccct cttcctgccc aactaggaaa aaccgcactt gtccggaaac 5040 cccgggaatc taacccggct gaacggattt agagtccatt cgatctacat gatcaggttt 5100 ccggtgtttc gtcctttcca caagatatat aaagccaaga aatcgaaata ctttcaagtt 5160 acggtaagca tatgatagtc cattttaaaa cataatttta aaactgcaaa ctacccaaga 5220 aattattact ttctacgtca cgtattttgt actaatatct ttgtgtttac agtcaaatta 5280 attctaatta tctctctaac agccttgtat cgtatatgca aatatgaagg aatcatggga 5340 aataggccct cttcctgccc aactaggaaa aaccgcactt gtccggaaac cccgggaatc 5400 taacccggct gaacggattt agagtccatt cgatctacat gatcaggttt ccggtgtttc 5460 gtcctttcca caagatatat aaagccaaga aatcgaaata ctttcaagtt acggtaagca 5520 tatgatagtc cattttaaaa cataatttta aaactgcaaa ctacccaaga aattattact 5580 ttctacgtca cgtattttgt actaatatct ttgtgtttac agtcaaatta attctaatta 5640 tctctctaac agccttgtat cgtatatgca aatatgaagg aatcatggga aataggccct 5700 cttcctgccc aactaggaaa aaccgcactt gtccggaaac cccgggaatc taacccggct 5760 gaacggattt agagtccatt cgatctacat gatcaggttt ccggtgtttc gtcctttcca 5820 caagatatat aaagccaaga aatcgaaata ctttcaagtt acggtaagca tatgatagtc 5880 cattttaaaa cataatttta aaactgcaaa ctacccaaga aattattact ttctacgtca 5940 cgtattttgt actaatatct ttgtgtttac agtcaaatta attctaatta tctctctaac 6000 agccttgtat cgtatatgca aatatgaagg aatcatggga aataggccct cttcctgccc 6060 aactagtaag gatctgcgat cgctccggtg cccgtcagtg ggcagagcgc acatcgccca 6120 cagtccccga gaagttgggg ggaggggtcg gcaattgaac gggtgcctag agaaggtggc 6180 gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg cctttttccc gagggtgggg 6240 gagaaccgta tataagtgca gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg 6300 ccagaacaca gctgaagctt cgaggggctc gcatctctcc ttcacgcgcc cgccgcccta 6360 cctgaggccg ccatccacgc cggttgagtc gcgttctgcc gcctcccgcc tgtggtgcct 6420 cctgaactgc gtccgccgtc taggtaagtt taaagctcag gtcgagaccg ggcctttgtc 6480 cggcgctccc ttggagccta cctagactca gccggctctc cacgctttgc ctgaccctgc 6540 ttgctcaact ctacgtcttt gtttcgtttt ctgttctgcg ccgttacaga tccaagctgt 6600 gaccggcgcc tactctagag ctagcgttta aacttaagct tgccaccatg gactacaagg 6660 acgacgacga caaggacaag aagcccctga acaccctgat cagcgccaca ggactgtgga 6720 tgtccagaac cggcaccatc cacaagatca agcaccacga ggtgtcccgg tccaaaatct 6780 acatcgagat ggcctgcggc gatcacctgg tcgtcaacaa cagcagaagc agccggacag 6840 ccagagccct gcggcaccac aagtacagaa agacctgcaa gcggtgcaga gtgtccgacg 6900 aggacctgaa caagttcctg accaaggcca acgaggacca gaccagcgtg aaagtgaagg 6960 tggtgtccgc ccccacccgg accaagaaag ccatgcccaa gagcgtggcc agagccccca 7020 agcccctgga aaacaccgaa gccgctcagg cccagcccag cggcagcaag ttcagccccg 7080 ccatccccgt gtctacccag gaaagcgtca gcgtccccgc cagcgtgtcc accagcatct 7140 ctagcatctc aaccggcgcc acagcttctg ccctggtcaa gggcaacacc aaccccatca 7200 ccagcatgtc tgcccctgtg caggcctctg ccccagccct gaccaagtcc cagaccgacc 7260 ggctggaagt gctcctgaac cccaaggacg agatcagcct gaacagcggc aagcccttcc 7320 gggagctgga aagcgagctg ctgagccggc ggaagaagga cctccagcaa atctacgccg 7380 aggaacggga gaactacctg ggcaagctgg aaagagagat cacccggttc ttcgtggacc 7440 ggggcttcct ggaaatcaag agccccatcc tgatccccct ggagtacatc gagcggatgg 7500 gcatcgacaa cgacaccgag ctgagcaagc agattttccg ggtggacaag aacttctgcc 7560 tgcggcccat gctggccccc aacctgtaca actacctgcg gaaactggat cgcgctctgc 7620 ccgaccccat caagattttc gagatcggcc cctgctaccg gaaagagagc gacggcaaag 7680 agcacctgga agagtttaca atgctgaact tttgccagat gggcagcggc tgcaccagag 7740 agaacctgga atccatcatc accgactttc tgaaccacct ggggatcgac ttcaagatcg 7800 tgggcgacag ctgcatggtg tacggcgaca ccctggacgt gatgcacggc gacctggaac 7860 tgtctagcgc cgtcgtggga cccatccctc tggaccggga gtggggcatc gataagccct 7920 ggatcggagc cggcttcggc ctggaacggc tgctgaaagt caagcacgac tttaagaaca 7980 tcaagcgggc tgccagaagc gagagctact acaacggcat cagcaccaac ctgtgatgag 8040 gatccgcggc cgcgcccctc tccctccccc ccccctaacg ttactggccg aagccggagt 8100 tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 8160 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 8220 tcatcaatgt atcttatcat gtctgtatac cgtcgacctc tagctagagc ttggcgtaat 8280 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 8340 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 8400 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 8460 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8520 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8580 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 8640 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8700 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8760 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8820 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 8880 aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 8940 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9000 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 9060 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9120 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9180 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9240 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9300 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 9360 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 9420 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 9480 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 9540 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 9600 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 9660 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 9720 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 9780 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 9840 gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 9900 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9960 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 10020 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 10080 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 10140 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 10200 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 10260 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 10320 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 10380 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 10440 tcgacggatc gggagatctc ccgatcccct atggtcgact ctcagtacaa tctgctctga 10500 tgccgcatag ttaagccagt atctgctccc tgcttgtgtg ttggaggtcg ctgagtagtg 10560 cgcgagcaaa atttaagcta caacaaggca aggcttgacc gacaattgca tgaagaatct 10620 gcttagg 10627 <210> 31 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> HC A114X DNA sequence with leader peptide <400> 31 atgggatggt catgtatcat cctttttcta gtagcaactg caaccggtgt acattctgaa 60 gttcagctgg ttgaatctgg tggtggtctg gttcaaccgg gtggctccct gcgtctgtct 120 tgtgcggcct ctggttttaa catcaaagat acctatatcc actgggttcg tcaggcgcca 180 ggcaaaggtc tggaatgggt tgcgcgtatc tacccgacca acggttacac ccgctacgcg 240 gactctgtta aaggtcgttt caccatctct gcggacacct ctaaaaacac cgcgtacctg 300 cagatgaact ctctgcgtgc ggaagacacc gccgtttact actgctctcg ttggggtggt 360 gacggtttct acgcgatgga ctactggggt cagggtacgc tggttaccgt ttcttcttag 420 tcgaccaagg gcccatcggt cttccccctg gcaccctcct ccaagagcac ctctgggggc 480 acagcggccc tgggctgcct ggtcaaggac tacttccccg aacctgtgac ggtctcgtgg 540 aactcaggcg ccctgaccag cggcgtgcac accttcccgg ctgtcctaca gtcctcagga 600 ctctactccc tcagcagcgt ggtgaccgtg ccctccagca gcttgggcac ccagacctac 660 atctgcaacg tgaatcacaa gcccagcaac accaaggtgg acaagaaagt tgagcccaaa 720 tcttgtgaca aaactcacac atgcccaccg tgcccagcac ctgaactcct ggggggaccg 780 tcagtcttcc tcttcccccc aaaacccaag gacaccctca tgatctcccg gacccctgag 840 gtcacatgcg tggtggtgga cgtgagccac gaagaccctg aggtcaagtt caactggtac 900 gtggacggcg tggaggtgca taatgccaag acaaagccgc gggaggagca gtacaacagc 960 acgtaccgtg tggtcagcgt cctcaccgtc ctgcaccagg actggctgaa tggcaaggag 1020 tacaagtgca aggtctccaa caaagccctc ccagccccca tcgagaaaac catctccaaa 1080 gccaaagggc agccccgaga accacaggtg tacaccctgc ccccatcccg ggaggagatg 1140 accaagaacc aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc 1200 gtggagtggg agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg 1260 gactccgacg gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag 1320 caggggaacg tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag 1380 aagagcctct ccctgtcccc gggt 1404 <210> 32 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> LC DNA sequence with leader peptide <400> 32 atgggatggt catgtatcat cctttttcta gtagcaactg caaccggtgt acattctgac 60 atccagatga cccagtcccc gagctctctg tctgcgtctg ttggtgaccg cgttaccatc 120 acctgccgtg cgtcccagga cgttaacacc gccgtggcgt ggtatcaaca gaaaccgggt 180 aaagcgccaa aactgctgat ctactccgcg tctttcctgt actctggtgt tccgtctcgt 240 ttcagcggtt ctcgttctgg tactgacttc accctcacca tctcttctct gcagccggaa 300 gacttcgcga cctactactg ccagcagcac tacaccaccc caccgacctt cggtcagggc 360 accaaagttg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct 420 gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgctgaataa cttctacccc 480 agagaagcca aagtgcagtg gaaggtggac aacgccctgc agagcggaaa cagccaggaa 540 agcgtgacag agcaggattc caaggattcc acatacagcc tgagcagcac actgacactg 600 tccaaggccg actacgagaa gcacaaggtg tacgcctgcg aagtgacaca ccagggactg 660 tcctcccctg tgacaaagag cttcaacaga ggagaatgct ga 702 <210> 33 <211> 449 <212> PRT <213> Artificial Sequence <220> <223> HC with A114X mutation protein sequence, X121 represents the UAG unnatural site <220> <221> misc_feature <222> (121)..(121) <223> Xaa can be any naturally occurring amino acid <400> 33 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr 20 25 30 Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser Xaa Ser Thr Lys Gly Pro Ser Val 115 120 125 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 130 135 140 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 145 150 155 160 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 165 170 175 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 180 185 190 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 195 200 205 Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp 210 215 220 Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly 225 230 235 240 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 245 250 255 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu 260 265 270 Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 275 280 285 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 290 295 300 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 305 310 315 320 Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu 325 330 335 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 340 345 350 Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu 355 360 365 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 370 375 380 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 385 390 395 400 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp 405 410 415 Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His 420 425 430 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro 435 440 445 Gly <210> 34 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> LC protein sequence <400> 34 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210 <210> 35 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> U6-PylT U25C supp table S1 <400> 35 agtcagtcac tagttgggca ggaagagggc ctatttccca tgattccttc atatttgcat 60 atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata 120 ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa 180 ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg 240 gctttatata tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg 300 actctaaatc cgttcagccg ggttagattc ccggggtttc cggacaagtg cggtttttcc 360 taggagtcag tc 372 <210> 36 <211> 750 <212> DNA <213> Artificial Sequence <220> <223> sfGFP(TAG) H. sapiens optimized, C-terminal HisTag Supp Table S1 <400> 36 atggtgtcca agggcgagga actgttcacc ggcgtggtgc ccatcctggt ggaactggat 60 ggcgacgtga acggccacaa gttctctgtg cggggagagg gcgaaggcga cgccacaaat 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ttggcctacc 180 ctcgtgacca cactgaccta cggcgtgcag tgcttcagca gataccccga ccatatgaag 240 cggcacgact tcttcaagag cgccatgccc gagggctacg tgcaggaacg gaccatcagc 300 ttcaaggacg acggcaccta caagaccaga gccgaagtga agttcgaggg cgacaccctc 360 gtgaaccgga tcgagctgaa gggcatcgat ttcaaagagg acggcaacat cctgggccac 420 aagctggagt acaacttcaa cagccactag gtgtacatca ccgccgacaa gcagaagaac 480 ggcatcaagg ccaacttcaa gatccggcac aacgtggaag atggcagcgt gcagctggcc 540 gaccactacc agcagaacac ccccatcgga gatggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagagcgt gctgagcaag gaccccaacg agaagcggga ccacatggtg 660 ctgctggaat tcgtgaccgc cgctggcatc acccacggca tggacgagct gtacaagggc 720 agccaccatc accatcacca ttaataataa 750 <210> 37 <211> 1338 <212> DNA <213> Artificial Sequence <220> <223> H. sapiens eRF1 D. melanogaster optimized, N-terminal HisTag Supp Table S1 <400> 37 atgcatcatc accatcacca cgccgatgat ccaagcgccg cagaccgcaa tgttgagatc 60 tggaagataa aaaagctgat aaagagcttg gaggccgcac ggggcaacgg cacgtccatg 120 atatccctca ttatcccacc aaaggatcag atcagccgtg tggcgaagat gttggcggat 180 gagttcggaa cggccagtaa cattaaaagt cgcgtgaacc ggctgtcggt cttgggcgcc 240 atcacttccg tgcagcaacg tctgaaactg tacaacaaag tcccacccaa cggtttggtc 300 gtctactgcg gtacgatagt taccgaggaa ggaaaggaga agaaagtgaa tattgatttc 360 gaaccattta aaccgataaa cactagcttg tacttgtgcg acaataagtt tcatacagag 420 gcactcacgg ccctgctgag cgacgactcg aaattcggat tcattgtcat tgatggaagt 480 ggagcgctgt tcggcacgct gcagggtaac acgcgcgagg tcttgcacaa attcaccgtg 540 gacttgccca aaaagcatgg ccgtggtggc cagagcgccc tcaggtttgc gcggctgcgc 600 atggagaagc gccataacta cgtgcgcaag gtcgcagaga cggctgtgca gctgttcatc 660 tcgggtgata aggtaaatgt cgcgggactg gtgctcgccg gcagcgcgga cttcaaaacc 720 gagctgagtc agtccgacat gttcgatcag cgtctgcagt cgaaggtact gaagctcgtc 780 gacattagct acggcggcga gaacggcttc aatcaggcca tcgaactgag taccgaagtc 840 ctcagtaacg taaagtttat tcaggaaaaa aagttgattg gacgctactt tgatgaaata 900 agccaagata cgggcaaata ctgttttggc gtcgaggata ctctgaaagc gctcgagatg 960 ggagcagtgg aaatactcat cgtatatgaa aatctcgata taatgcgcta tgtactgcat 1020 tgccaaggaa cagaagagga gaaaattctc tacctcaccc cggagcaaga gaaggacaag 1080 agccatttta cagacaagga gacgggccaa gagcacgagc tcattgagtc gatgcccttg 1140 ctcgaatggt ttgccaacaa ctacaagaag ttcggcgcga ccctggaaat tgtcacggat 1200 aaatcgcagg agggcagcca gtttgtgaag ggcttcggtg gcatcggcgg catcctccgc 1260 taccgggtgg atttccaagg catggaatat caaggtggag atgatgaatt cttcgatttg 1320 gatgattact aatgatag 1338 <210> 38 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> eRF1_E55Af <400> 38 gaagatgttg gcggatgcct tcggaacggc cagtaac 37 <210> 39 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> eRF1_E55Ar <400> 39 gttactggcc gttccgaagg catccgccaa catcttc 37 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> eRF1_E55Df <400> 40 gatgttggcg gatgatttcg gaacggccag 30 <210> 41 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> eRF1_E55Dr <400> 41 ctggccgttc cgaaatcatc cgccaacatc 30 <210> 42 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> eRF1_Y125Ff <400> 42 ccgataaaca ctagcttgtt cttgtgcgac aataagtttc 40 <210> 43 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> eRF1_Y125Fr <400> 43 gaaacttatt gtcgcacaag aacaagctag tgtttatcgg 40 <210> 44 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> eRF1_TS122QFf <400> 44 catttaaacc gataaaccaa ttcttgtact tgtgcgac 38 <210> 45 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> eRF1_TS122QFr <400> 45 gtcgcacaag tacaagaatt ggtttatcgg tttaaatg 38 <210> 46 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> eRF1_NK129PQf <400> 46 gcttgtactt gtgcgaccca cagtttcata cagaggcac 39 <210> 47 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> eRF1_NK129PQr <400> 47 gtgcctctgt atgaaactgt gggtcgcaca agtacaagc 39 <210> 48 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> eRF1_SVLG70AVLSf <400> 48 gcgtgaaccg gctggccgtg ctgagcgcca tcacttcc 38 <210> 49 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> eRF1_SVLG70AVLSr <400> 49 ggaagtgatg gcgctcagca cggccagccg gttcacgc 38 <210> 50 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> eRF1_K130Mf <400> 50 gtacttgtgc gacaatatgt ttcatacaga ggcac 35 <210> 51 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> eRF1_K130Mr <400> 51 gtgcctctgt atgaaacata ttgtcgcaca agtac 35 <210> 52 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> eRF1_M51Af <400> 52 gtgtggcgaa ggccttggcg gatgag 26 <210> 53 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> eRF1_M51Ar <400> 53 ctcatccgcc aaggccttcg ccacac 26 <210> 54 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> DLR_Ser_f <400> 54 ctgaagaacg agcaaatctc cacgggggcc cctaggagat c 41 <210> 55 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> DLR_Ser_r <400> 55 gatctcctag gggcccccgt ggagatttgc tcgttcttca g 41 <210> 56 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> DLR_TAA_f <400> 56 gaagaacgag caaatctaaa cgggggcccc taggag 36 <210> 57 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> DLR_TAA_r <400> 57 ctcctagggg cccccgttta gatttgctcg ttcttc 36 <210> 58 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> DLR_TAG_f <400> 58 gaagaacgag caaatctaga cgggggcccc tagg 34 <210> 59 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> DLR_TAG_r <400> 59 cctaggggcc cccgtctaga tttgctcgtt cttc 34 <210> 60 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> DLR_TGA_f <400> 60 ctgaagaacg agcaaatctg aacgggggcc cctaggagat c 41 <210> 61 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> DLR_TGA_r <400> 61 gatctcctag gggcccccgt tcagatttgc tcgttcttca g 41 <210> 62 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_TAG150Lf <400> 62 cttcaacagc cacctggtgt acatcacc 28 <210> 63 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_TAG150Lr <400> 63 ggtgatgtac accaggtggc tgttgaag 28 <210> 64 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_D133TAGf <400> 64 ggcatcgatt tcaaagagta gggcaacatc ctggg 35 <210> 65 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_D133TAGr <400> 65 cccaggatgt tgccctactc tttgaaatcg atgcc 35 <210> 66 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_K101TAGf <400> 66 ggaccatcag cttctaggac gacggcacct acaagacc 38 <210> 67 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> sfGFP_K101TAGr <400> 67 ggtcttgtag gtgccgtcgt cctagaagct gatggtcc 38

Claims

i) 직교 tRNA 신테타제 - tRNA 쌍, 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;
ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및
iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계
를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법.
진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖는 것인 용도.
비-천연 아미노산의 관심 폴리펩티드 내로의 혼입을 지시하는 직교 코돈을 포함하는, 관심 폴리펩티드를 코딩하는 핵산의 번역에 의해 비-천연 아미노산을 관심 폴리펩티드 내로 혼입시키는 것을 돕는데 사용하기 위한 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖는 것인 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산.
제3항의 돌연변이체 eRF1 폴리펩티드 또는 핵산을 포함하는 진핵생물 숙주 세포.
(i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖는 돌연변이체 eRF1, 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 진핵생물 숙주 세포.
(i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60％인 아미노산 서열을 갖는 돌연변이체 eRF1
을 코딩하는 핵산(들), 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 조합물 또는 키트.
제5항 또는 제6항에 있어서, 비-천연 아미노산, 예컨대 BocK 또는 CypK 또는 BCNK를 추가로 포함하는 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 서열식별번호: 4에 비해
(i) E55
(ii) N129, K130
(iii) T122, S123
(iv) Y125
(v) T58, S60, S64, L125, N129
(vi) S123, L124, Y125
(vii) S123, L124, Y125
(viii) S123, L124, Y125
(ix) M51, K130
(x) S123, L124, Y125
(xi) S123, L124, Y125
(xii) S123, L124, Y125
(xiii) S123, L124, Y125
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 서열식별번호: 4에 비해
(i) E55D
(ii) N129P, K130Q
(iii) T122Q, S123F
(iv) E55A
(v) Y125F
(vi) T58K, S60T, S64D, L125F, N129S
(vii) S123A, L124I, Y125L
(viii) S123R, L124W, Y125R
(ix) S123H, L124A, Y125G
(x) M51A, K130M
(xi) S123A, L124L, Y125V
(xii) S123L, L124C, Y125S
(xiii) S123L, L124S, Y125S
(xiv) S123V, L124T, Y125P
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 진핵생물 세포가 포유동물 또는 곤충 세포인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 코돈이 정지 코돈이고, 임의적으로는 상기 정지 코돈이 UAG인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제10항 중 어느 한 항에 있어서, 직교 tRNA 신테타제 - tRNA 쌍이 피롤리실-tRNA 신테타제 (PylRS)/PylT tRNA_CUA 쌍을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
제1항 내지 제10항 중 어느 한 항에 있어서, tRNA가
(i) PylT의 U25C 변이체, 또는
(ii) PylT의 Opt 변이체, 또는
(iii) PylT의 U25C - Opt 변이체인
방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.