KR20170070238A - 단백질 내로의 비-천연 아미노산의 혼입 - Google Patents
단백질 내로의 비-천연 아미노산의 혼입 Download PDFInfo
- Publication number
- KR20170070238A KR20170070238A KR1020177014048A KR20177014048A KR20170070238A KR 20170070238 A KR20170070238 A KR 20170070238A KR 1020177014048 A KR1020177014048 A KR 1020177014048A KR 20177014048 A KR20177014048 A KR 20177014048A KR 20170070238 A KR20170070238 A KR 20170070238A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- lys
- erf1
- gly
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y601/00—Ligases forming carbon-oxygen bonds (6.1)
- C12Y601/01—Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
- C12Y601/01026—Pyrrolysine-tRNAPyl ligase (6.1.1.26)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법에 관한 것이다: i) 직교 tRNA 신테타제 - tRNA 쌍, 상기 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계; ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및 iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계. 또한 본 발명은 용도, 숙주 세포, 조합물 및 키트에 관한 것이다.
[대표도]
도 1a, 1b, 1c
[대표도]
도 1a, 1b, 1c
Description
본 발명은 일반적으로 단백질 발현, 특히 관심 단백질 내로의 비-천연 아미노산(들)의 혼입 분야에 속한다.
유전자 코드 확장은 100개를 초과하는 비-천연 아미노산의 단백질 내로의 부위-특이적 혼입을 허용하였다. 그러나, 비-천연 아미노산이 단백질 내로 혼입되는 효율에 의해 이러한 접근법의 유용성이 제한될 수 있다. 단백질 내로의 비-천연 아미노산의 효율적이고, 번역과 동시적이며, 부위-특이적인 혼입은 부위-특이적으로 변형된 재조합 단백질을 생성하기 위한 신흥 접근법 (1, 2), 뿐만 아니라 생체 내에서의 단백질 기능을 정확하게 제어 및 영상화하는 전략 (3, 4), 및 디자이너 비-천연 아미노산이 단백질 기능을 제어하거나 보고하는데 사용되는 다수의 기타 접근법을 가능하게 할 것이다.
직교 tRNA 신테타제/tRNA 쌍은, 가장 통상적으로는 앰버(amber) 정지 코돈 (UAG)에 반응하여, 비-천연 아미노산의 혼입을 지시한다. 비-천연 아미노산이 혼입되는 효율은 i) 직교 신테타제/tRNA 쌍이 리보솜의 A 부위 내의 UAG 코돈에 반응하여 번역 연장을 가능하게 하는 본질적인 효율, 및 ii) 방출 인자가 아미노아실화된 직교 tRNACUA와 경쟁하여 단백질 합성을 종결시키는 효율 둘 모두에 의해 정의된다. 피롤리실-tRNA 신테타제 (PylRS)/tRNACUA 쌍은 단언컨대 유전자 코드 확장용으로 개발된 가장 유용한 쌍인데, 이는 i) 이러한 쌍이 이. 콜라이(E. coli), 효모, 포유동물 세포, 씨. 엘레강스(C. elegans) 및 디. 멜라노가스터(D. melanogaster)를 포함하는 광범위한 숙주에서 직교이고, ii) PylRS가 통상적인 20개의 아미노산을 인식하지 않으며, iii) PylRS가 이의 동족 tRNACUA의 안티코돈을 인식하지 않고, iv) PylRS의 활성 부위가 지향성 진화를 필요로 하지 않으면서 유용한 관능기를 보유하는 광범위한 비-천연 아미노산을 수용하고, v) PylRS의 활성 부위가 이. 콜라이에서 광범위한 유용한 관능기를 보유하는 구조적으로 다양한 비-천연 아미노산을 인식하도록 진화될 수 있으며, vi) 이. 콜라이에서 발견된 신테타제 변이체가 신테타제의 지향성 진화를 실행하기 어려운 다양한 진핵생물 숙주에서 사용될 수 있기 때문이다 (5).
비-천연 아미노산 혼입은 현재 진핵생물 세포에서 이. 콜라이에서보다 덜 효율적이다. 진핵생물 세포에서의 단백질 내로의 비-천연 아미노산의 효율적이고 부위-특이적인 혼입은 유전자 코드 확장 접근법의 가능성을 실현하는 것에서의 해결되지 않은 난제이다. 이러한 난제를 다루는 것은 진핵생물 세포에서의 변형된 재조합 단백질의 합성을 허용할 것이고, 새로운 화학 관능기를 단백질 내로 도입하여 이의 기능을 진핵생물 세포에서 높은 공간적 및 시간적 정확도로 제어 및 영상화하는 신흥 전략을 증대시킬 것이다.
본 발명은 이러한 요구를 다루려 한다.
본 발명가들은 하나 이상의 비-천연 아미노산을 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 발현되는 관심 단백질 내로 효율적으로 혼입시키기 위한 직교 신테타제/tRNA 쌍을 기초로 하는 발현 시스템을 개발하였다. 유리하게는, 본원에 기술된 발현 시스템은 이같은 세포에서의 비-천연 아미노산 혼입 효율을 증가시킨다.
또한, 본 발명가들은 정상적으로는 포유동물 세포에서 3개 모두의 정지 코돈에서 번역을 종결시키는 eRF1을 다른 정지 코돈의 번역초과(read-through)를 증가시키지 않으면서 TAG 코돈에 반응하여 비-천연 아미노산 혼입의 실질적인 증가를 제공하도록 조작하였다. 본원에서 제시된 데이터는 천연 eRF1이 3개 모두의 정지 코돈을 인식함에도 불구하고, 오팔(opal) 또는 오커(ochre) 정지 코돈의 번역초과를 증가시키지 않으면서 앰버 정지 코돈에 반응하여 진핵생물 세포에서 비-천연 아미노산 혼입의 효율을 선택적으로 강화하도록 eRF1을 조작하는 것이 가능하다는 것의 최초의 실연을 제공한다.
원핵생물 시스템, 예컨대 이. 콜라이 발현 시스템에 방출 인자가 존재한다. 온도 민감성 방출 인자, 예컨대 tsRF1이 원핵생물 발현 시스템에서의 앰버 억제의 일시적인 증가에 대해 연구되었다. 박테리아 RF1과 rRNA의 상호작용이 원핵생물 시스템에서 rRNA의 530 루프로 정확하게 지적되었다. 예를 들어, WO 2008/065398의 4면 31-35행에 이러한 상호작용이 언급되어 있다. 그러나, 이. 콜라이 시스템으로부터 본 발명의 주제인 진핵생물 시스템으로의 교차는 없다. 원핵생물 단백질과 진핵생물 단백질 사이에는 이들의 명칭 이외에는 직접적인 유사성이 없다.
매우 상이한 박테리아 단백질로부터 본 발명의 주제인 진핵생물 단백질로 돌연변이체를 운반하는 것이 가능하지 않다. 원핵생물 시스템에서는, 상이한 RF 단백질들이 상이한 생물학적 기능을 수행한다 - 진핵생물 시스템과 비교하여, 생물학이 매우 상이한 "분할 기능" 배열이 있다. 대조적으로, 진핵생물 시스템에서는, 단일한 eRF1 단백질이 다중 종결 기능을 제공한다. 따라서, 포유동물 eRF1 단백질은 원핵생물 시스템에서의 방출 인자 단백질과 기술적으로 매우 상이한 것으로 고려될 수 있다. 그러므로, RF1 기능의 선택적 파괴를 통해 앰버 코돈에 반응하여 비-천연 아미노산 혼입을 강화하도록 이. 콜라이에서 개발된 전략 (12-16)이 진핵생물 시스템으로 확장될 수 없다. 특정 eRF1 돌연변이체가 관련 기술 분야에 공지되어 있다. 이러한 돌연변이체들은 순전히 eRF1 기능을 연구하려고 시도하는 과정에서 기술되었다. 이러한 개시내용들은 eRF1 생물학의 학문적 연구에 초점을 두었다. 대조적으로, 본 발명가들은 단백질 내로의 비-천연 아미노산의 혼입에서의 특정 eRF1 돌연변이체의 용도를 최초로 교시한다. 실제로, 직교 tRNA 신테타제/tRNA 쌍을 사용하여 진핵생물 세포에서 비-천연 아미노산이 단백질 내로 부위-특이적으로 혼입되는 효율을 강화하도록 진핵생물 번역 기구를 조작하는 것에 대한 보고가 공지되어 있지 않다. 본 발명가들은 앰버 코돈 발현 시스템의 맥락에서의 eRF1 돌연변이체의 유용성을 최초로 실현한다.
따라서, 본 발명의 장점은 본 발명가들이 eRF1 돌연변이체의 사용에 의한 앰버 코돈의 강화된 억제를 최초로 교시한다는 것이다. 따라서, 본 발명의 장점은 본 발명가들이 앰버 코돈의 강화된 억제에서의 eRF1 돌연변이체의 용도를 최초로 교시한다는 것이다.
유리하게는, 개선된 발현 시스템을 조작된 eRF1과 조합함으로써, 단일 비-천연 아미노산을 보유하는 단백질의 수율이 17- 내지 20-배 증가된다. 비-천연 아미노산을 함유하는 단백질이 정지 코돈을 함유하지 않는 유전자로부터 생산된 단백질에 필적하는 수율로 생산될 수 있다. 또한, 개선된 시스템은 다중 부위 (예를 들어, 3개 이상의 부위)에서 비-천연 아미노산이 혼입된 단백질의 수율을 측정이 불가능하게 낮은 수준에서 앰버 정지가 없는 대조군의 43%로 증가시킨다. 이러한 접근법은 부위-특이적으로 변형된 치료 단백질을 효율적으로 생산하는 것, 및 표적화된 세포 단백질을 단백질 기능의 영상화 또는 합성 조절을 허용하는 비-천연 아미노산을 보유하는 버전으로 정량적으로 교체하는 것을 가능하게 할 수 있다.
유리하게는, 본 개시내용은 진핵생물 세포에서 부위-특이적으로 변형된 치료 단백질을 효율적으로 생산하는 것, 뿐만 아니라 표적화된 세포 단백질을 단백질 기능의 영상화 또는 합성 조절을 허용하는 비-천연 아미노산을 보유하는 버전으로 정량적으로 교체하는 것을 가능하게 할 수 있다.
따라서, 한 측면에서, 본 발명은 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법을 제공한다:
i) 직교 tRNA 신테타제 - tRNA 쌍, 상기 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 67%인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;
ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및
iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
한 측면에서, 본 발명은 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%, 더욱 적절하게는 67%인 아미노산 서열을 갖는 것인 용도에 관한 것이다.
한 측면에서, 본 발명은 비-천연 아미노산의 관심 폴리펩티드 내로의 혼입을 지시하는 직교 코돈을 포함하는, 관심 폴리펩티드를 코딩하는 핵산의 번역에 의해 비-천연 아미노산을 관심 폴리펩티드 내로 혼입시키는 것을 돕는데 사용하기 위한 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%, 더욱 적절하게는 67%인 아미노산 서열을 갖는 것인 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산에 관한 것이다.
한 측면에서, 본 발명은 상기 기술된 바와 같은 돌연변이체 eRF1 폴리펩티드 또는 핵산을 포함하는 진핵생물 숙주 세포에 관한 것이다.
한 측면에서, 본 발명은
(i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%, 더욱 적절하게는 67%인 아미노산 서열을 갖는 돌연변이체 eRF1, 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 진핵생물 숙주 세포에 관한 것이다.
한 측면에서, 본 발명은
(i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%, 더욱 적절하게는 67%인 아미노산 서열을 갖는 돌연변이체 eRF1
을 코딩하는 핵산(들), 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 조합물 또는 키트에 관한 것이다.
한 측면에서, 본 발명은 비-천연 아미노산, 예컨대 BocK 또는 CypK 또는 BCNK; 더욱 적절하게는 BocK 또는 CypK를 추가로 포함하는, 상기 기술된 바와 같은 진핵생물 숙주 세포 또는 상기 기술된 바와 같은 조합물 또는 키트에 관한 것이다.
적절하게는, 상기 돌연변이체 eRF1은 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공한다.
적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해
(i) E55
(ii) N129, K130
(iii) T122, S123
(iv) Y125
(v) T58, S60, S64, L125, N129
(vi) S123, L124, Y125
(vii) S123, L124, Y125
(viii) S123, L124, Y125
(ix) M51, K130
(x) S123, L124, Y125
(xi) S123, L124, Y125
(xii) S123, L124, Y125
(xiii) S123, L124, Y125
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함한다.
적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해
(i) E55D
(ii) N129P, K130Q
(iii) T122Q, S123F
(iv) E55A
(v) Y125F
(vi) T58K, S60T, S64D, L125F, N129S
(vii) S123A, L124I, Y125L
(viii) S123R, L124W, Y125R
(ix) S123H, L124A, Y125G
(x) M51A, K130M
(xi) S123A, L124L, Y125V
(xii) S123L, L124C, Y125S
(xiii) S123L, L124S, Y125S
(xiv) S123V, L124T, Y125P
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함한다.
적절하게는, 상기 진핵생물 세포는 포유동물 또는 곤충 세포이다.
적절하게는, 상기 코돈은 정지 코돈이다. 더욱 적절하게는, 상기 정지 코돈은 UAG이다.
적절하게는, 직교 tRNA 신테타제 - tRNA 쌍은 피롤리실-tRNA 신테타제 (PylRS)/PylT tRNACUA 쌍을 포함한다.
적절하게는, tRNA는
(i) PylT의 U25C 변이체, 또는
(ii) PylT의 Opt 변이체, 또는
(iii) PylT의 U25C - Opt 변이체이다.
본 발명의 추가 측면 및 실시양태
제1 측면에서, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물이 제공된다. 이러한 구축물을 코딩하는 예시적인 뉴클레오티드 서열이 서열식별번호: 1에 기재된다.
적절하게는, 핵산 구축물은 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함할 수 있다.
적절하게는, 관심 핵산 서열을 발현시킬 수 있는 프로모터는 상기 언급된 제1 측면에 따른 제1 프로모터와 동일한 방향으로 배향된다.
적절하게는, 관심 핵산 서열을 발현시킬 수 있는 프로모터는 제1 프로모터와 동일하거나 또는 제1 프로모터와 상이하다. 한 실시양태에서, 이러한 프로모터는 본원에 기술된 바와 같은 EF-1 프로모터이거나 또는 이로부터 유래되거나, 또는 CMV 프로모터이거나 또는 이로부터 유래된다.
적절하게는, 핵산 구축물은 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 핵산 서열을 추가로 포함한다. 한 실시양태에서, eRF1 돌연변이체는 tRNA 신테타제를 발현하는 제1 Pol II 오픈 리딩 프레임의 하류 (3')의 CMV 프로모터로부터 발현된다.
적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열 및 tRNA 신테타제를 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 적절하게는, tRNA 신테타제를 코딩하는 핵산 서열 및 돌연변이체 eRF1을 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 예시적인 T2A 자가-절단 펩티드가 문헌 [PLoS ONE 6(4) (2011)]에 기술되어 있다.
제2 측면에서, (i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물이 제공된다. 이러한 구축물을 코딩하는 예시적인 뉴클레오티드 서열이 서열식별번호: 2에 기재된다.
적절하게는, 구축물은 돌연변이체 eRF1, 적절하게는 돌연변이체 포유동물 eRF1, 적절하게는 돌연변이체 호모 사피엔스(homo sapiens) eRF1을 코딩하는 핵산 서열을 포함하고, 적절하게는 여기서 돌연변이체 eRF1은 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택된다.
적절하게는, 제1 및 제2 프로모터가 서로 반대 방향으로 있고, tRNA가 핵산 구축물 내에 다중 카피로 존재한다.
적절하게는, 핵산 구축물은 프로모터에 직접적으로 연결된 tRNA를 포함한다. 이러한 실시양태에 따르면, 어떠한 중간체 서열도 tRNA와 프로모터 사이에 위치하지 않으면서 tRNA가 프로모터에 직접적으로 연결된다.
적절하게는, 핵산 구축물은 프로모터에 직접적으로 연결된 tRNA를 포함한다. 이러한 실시양태에 따르면, 중간체 서열(들)이 tRNA와 프로모터 사이에 위치하지 않으면서 tRNA가 프로모터에 직접적으로 연결된다. tRNA의 3' 끝부분이 종결인자 서열에 간접적으로 연결될 수 있다. 예를 들어, 종결인자 서열 (예를 들어, TTTTT)이 링커를 통해 tRNA에 연결될 수 있고, 상기 링커는 임의적으로 서열 GACAAGTGCGG를 포함한다.
적절하게는, tRNA를 코딩하는 핵산 서열의 각각의 카피가 별개의 (자신의 독자적인) 프로모터의 제어 하에 놓인다.
적절하게는, 프로모터 배열은 제1 방향으로 배향된 신장 인자 프로모터 및 제2 방향으로 배향된 Pol III 프로모터를 포함한다.
적절하게는, 제1 프로모터는 EF-1 프로모터이거나 또는 이로부터 유래된다.
적절하게는, 제2 프로모터는 U6 프로모터이거나 또는 이로부터 유래된다.
적절하게는, tRNA는 핵산 구축물(들) 상에 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 카피로 존재한다.
적절하게는, tRNA는 야생형 또는 변이체 tRNA이고, 적절하게는 PylT의 U25C 변이체이다.
적절하게는, 관심 핵산 서열은 적어도 1, 2, 3 또는 4개 또는 이를 초과하는 개수의 정지 코돈을 포함하고, 적절하게는 적어도 1, 2 또는 3개의 코돈을 포함한다.
적절하게는, 관심 핵산 서열은 항체 또는 항체 단편을 코딩한다.
적절하게는, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고/이거나, 상기 tRNA가 진핵생물 세포 내의 내인성 tRNA 신테타제에 대해 직교이고/이거나, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고 상기 tRNA가 내인성 tRNA 신테타제에 대해 직교이다.
추가 측면에서, 제1 측면에 따른 핵산 구축물 및 제2 측면에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물이 제공된다.
추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 및 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물이 제공된다.
적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 추가의 별개의 구축물 상에 있다.
추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 또는 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 벡터가 제공된다.
추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 및 본 발명의 제2 측면에 따른 핵산 구축물을 포함하는 벡터를 포함하는 벡터 조합물이 제공된다.
적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 추가의 별개의 벡터 상에 있다.
추가 측면에서, 본 발명의 제1 측면에 따른 핵산 구축물 또는 본 발명의 제2 측면에 따른 핵산 구축물, 핵산 구축물 조합물, 벡터, 또는 벡터 조합물을 포함하는 세포가 제공된다.
적절하게는, 세포는 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 구축물을 추가로 포함한다. 적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열은 별개의 구축물 또는 벡터 상에 있다.
적절하게는, 돌연변이체 eRF1은 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되고, 적절하게는 여기서 돌연변이는 진뱅크 등록 번호(GenBank Accession Number) AF095901.1에 기술된 바와 같은 호모 사피엔스 eRF1 유전자 서열에서 이루어진다. 한 실시양태에서, 돌연변이는 코돈-최적화 호모 사피엔스 eRF1 유전자 서열에서 이루어진다. 코돈-최적화 호모 사피엔스 eRF1 유전자 서열의 예가 서열식별번호: 3에 기재된다.
적절하게는, 세포는 포유동물 세포 또는 곤충 세포이다.
적절하게는, 세포는 일시적으로 또는 안정적으로 핵산으로 형질감염된다.
추가 측면에서, (i) 본 발명의 제1 또는 제2 측면에 따른 핵산 구축물; 또는 (ii) 핵산 구축물 조합물; 또는 (iii) 벡터; 또는 (iv) 벡터 조합물; 또는 (v) 진핵생물 세포를 포함하고; (vi) 임의적으로 비-천연 아미노산을 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트가 제공된다.
적절하게는, 키트는 돌연변이체 eRF1을 코딩하는 핵산 구축물 또는 벡터, 또는 이를 포함하는 세포를 추가로 포함한다.
추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) 세포를 제공하는 단계이며, 여기서 상기 세포가 본원에 기술된 바와 같은 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
적절하게는, 적어도 1, 2, 3, 4, 또는 5개의 비-천연 아미노산이 관심 단백질 내로 혼입된다.
추가 측면에서, 하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법이 제공된다: i) 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포를 제공하는 단계이며, 여기서 관심 핵산 서열이 항체 또는 항체 단편을 코딩하고, 상기 세포가 본원에 기술된 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및 vi) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계.
추가 측면에서, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한, (i) 본 발명의 제1 또는 제2 측면에 따른 핵산 구축물; 및/또는 (ii) 핵산 구축물 조합물; 및/또는 (iii) 벡터; 및/또는 (iv) 벡터 조합물; 및/또는 (v) 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포의 용도가 제공된다.
추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) tRNA 신테타제 및 tRNA 쌍, 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계; ii) 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
추가 측면에서, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도가 제공된다.
추가 측면에서, 하기 단계를 포함하는, 관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법이 제공된다: (i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 본원에 기술된 핵산 구축물 조합물 또는 벡터 조합물을 포함하는 것인 단계; (ii) 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에, 그리고 eRF1의 돌연변이체의 존재 및 부재 하에 세포를 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 (iii) eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계.
추가 측면에서, 실질적으로 첨부된 설명 및 도면을 참조로 본원에 기술된 바와 같은 구축물, 벡터, 세포, 키트, 방법 또는 용도가 제공된다.
이제 본 발명의 실시양태가 하기와 같은 첨부된 도면을 참조로 추가로 기술될 것이다:
차트 1은 사용된 플라스미드 구축물 및 비-천연 아미노산을 나타낸다. (a) 사용된 벡터의 개략도. PylT는 Pyl tRNACUA를 코딩하는 유전자이고, PylT*는 U25C 변이체를 코딩한다. U6은 U6 프로모터를 가리키고, CMV는 CMV 프로모터이며, CMV enh는 CMV 프로모터의 5' 인핸서 단편이고, EF1 prom은 EF-1α 프로모터이다. 적색 막대는 앰버 정지 코돈의 위치를 가리킨다. (b) 1 (N ε-[(tert-부톡시)카르보닐]-l-리신) 및 2 (N ε-[((2-메틸시클로프로프-2-엔-1 일)메톡시)카르보닐]-l-리신)의 화학 구조.
도 1은 포유동물 세포에서 TAG 코돈에 반응하여 비-천연 아미노산을 혼입시키기 위한 PylRS/tRNACUA 발현 벡터의 최적화를 도시한다. (a) 형광 검정법에서 측정된 sfGFP 내로의 1 (2 mM) 및 2 (0.5 mM)의 혼입의 정량. 지시된 구축물을 HEK293T 세포에서 일시적으로 발현시키고, 485 nm에서의 여기 후 520 nm에서의 형광에 의해 용해물에서 sfGFP를 정량하였다. 아미노산이 없는 대조군이 각각의 벡터 조합에 대해 포함된다. 정지 코돈 대신 류신 코돈이 있는 등가의 sfGFP 대조군 플라스미드 (차트 1a의 구축물 a)가 나타내는 형광의 백분율로서 데이터가 플롯팅된다. 데이터는 3중물의 평균 ± SE를 나타낸다. (b) 웨스턴 블롯으로 가시화된 용해물 내의 sfGFP 수율. 지시된 벡터로 형질감염되고 지시된 아미노산의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-액틴 및 α-FLAG 항체로 이뮤노블롯팅하였다. (c) 아미노산 부재 하의 구축물 b+c, b+d, b+e, g+h로부터의 상대적인 PylT/PylT* 발현의 노던 블롯 분석. 로딩 대조군에 대해서 보충 도면 1을 참조한다.
도 2는 정지 코돈 번역초과, 및 PylRS/tRNACUA 쌍을 이용한 1 (2 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. (a) 이러한 연구에서 돌연변이된 eRF1 위치. eRF1 (PDB ID:3E1Y)29로부터의 N-말단 도메인의 구조이고, 이러한 연구에서 돌연변이된 잔기는 적색이다. (b) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 인간 eRF1 변이체가 발현된다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운(knockdown)이다. (c) 억제인자 tRNA의 부재 하에서의 HEK293T 세포에서의 레닐라(Renilla)-TAG-반딧불이 루시페라제 리포터 및 eRF1 변이체의 발현에 의해 3개 모두의 정지 코돈의 번역초과가 결정된다. CMV-PylRS/CMV-DLR(TAG) (또는 상응하는 TAA, TGA 또는 세린 코돈 변이체)를 세포 내로 일시적으로 형질감염시키고, 20시간 후에 발현 수준을 결정하였다. TAG, TAA, 또는 TGA 번역초과를 세린 코돈 (TCC)을 함유하는 구축물로부터의 데이터에 대해 표준화하였다. 데이터는 4중 측정의 평균 ± SE를 나타낸다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. Wt는 디. 멜라노가스터 코돈 용법으로 리코딩(recoding)된 인간 eRF1이다. Δ100 돌연변이체에 대한 데이터는 척도를 벗어나고, 하기의 값이다: 1.6% (TAA), 2% (TAG) 및 15% (TGA). (d) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], U6 프로모터로부터 PylT를 발현하는 플라스미드 c (차트 1a), 및 플라스미드 a (차트 1a)에서 sfGFP가 레닐라-TAG-반딧불이로 교체된 버전인 CMV-PylRS/CMV-레닐라-TAG-반딧불이로의 HEK 293T 세포의 일시적인 형질감염. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. 등량의 세포 용해물을 α-eRF1 및 α-액틴 항체로 이뮤노블롯팅하였다. (e) eRF1 (X) 변이체가 피롤리실 tRNA/신테타제 쌍을 사용하여 앰버 정지 코돈에 반응하여 비-천연 아미노산 혼입을 증가시킨다. HEK293T 세포를 패널 d에 기술된 바와 같이 형질감염시키고, 1 mM 아미노산 1의 존재 하에 성장시키고, 20 h 후에 측정하였다. % 번역초과를 앰버 정지 코돈 대신 세린 코돈을 보유하는 레닐라-TCC-반딧불이 리포터에 대해 상대적으로 측정하였다.
도 3은 eRF1 E55D를 최적화된 PylRS/tRNACUA 쌍 발현 시스템과 조합하는 것이 포유동물 세포에서 다중 비-천연 아미노산의 재조합 단백질 내로의 효율적인 혼입을 가능하게 한다는 것을 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1의 존재 또는 부재 하에 성장시켰다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다. (b) 용해물로부터의 웨스턴 블롯. (c) 패널 a에서와 같지만, 0.5 mM 아미노산 2를 사용함. (d) 용해물로부터의 웨스턴 블롯.
도 4는 1개 또는 3개의 비-천연 아미노산이 혼입된 재조합 sfGFP의 발현, 정제 및 특성화를 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1 또는 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 전장 sfGFP를 Ni-NTA 크로마토그래피로 정제하였다. (b) sfGFP 내의 1개 또는 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입이 전기분무 이온화 질량 분광법에서 확인된다 (보충 도면 4를 또한 참조한다).
도 5는 게놈 통합으로부터의 eRF1 E55D의 안정적인 발현이 T-Rex 293 Flp-In 세포에서 앰버 억제를 강화한다는 것을 도시한다. T-Rex 293 Flp-In 시스템 (라이프 테크놀러지즈(Life Technologies))를 사용하는 것에 의해 안정적인 eRF1 세포주가 생성되어, 규정된 표적 유전자좌에서의 삽입으로 인해 삽입된 트랜스진(transgene)의 균일한 발현을 제공하였다.
a 플라스미드 g 및 h 또는 i (도 1, a)를 게놈에 통합된 디. 멜라노가스터 코돈 용법의 eRF1 E55D를 함유하는 T-Rex293 세포 내로 일시적으로 형질감염시켰다. 세포를 48시간 시간 동안 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 형질감염 16시간 전에 1 ㎍/ml 테트라시클린 첨가로 eRF1 E55D의 발현을 유도하였다. 모든 실험에서 공인된 테트라시클린이 없는 성장 배지를 사용하였다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
b 패널 a에서 제시된 바와 같은 용해물로부터의 웨스턴 블롯. 등량의 세포 용해물이 로딩되었다. eRF1 wt 또는 E55D가 삽입된 T-Rex293 Flp-in 세포주를 렌티바이러스 shRNA(eRF1) 구축물 (산타 크루즈(Santa Cruz), 도 3에서와 같음)로 형질전환시키고, 나이브 세포에 대해 퓨로마이신으로 선별함으로써, 내인성 eRF1에 대한 shRNA를 구성적으로 발현하는 안정적인 세포주가 생성되었다. 디. 멜라노가스터 코돈-최적화 후 shRNA에 상보적인 서열이 결여되기 때문에 eRF1 wt 및 E55D는 shRNA(eRF1)에 대해 불응성이었다.
c 2의 존재 또는 부재 하에, 그리고 방출 인자 변이체의 발현을 유도하기 위해 성장 배지에 1 ㎍/ml 테트라시클린을 첨가하여, 48시간 동안 구축물 g 및 h (도 1)로 일시적으로 형질감염시킨 후에 sfGFP(TAG)가 발현되었다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
d. 패널 c에서와 같지만, sfGFP(TAG)3을 발현함.
도 6은 Dmel 세포에서의 정지 코돈 번역초과, 및 PylRS/tRNACUA 쌍을 이용한 1 (1 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. a. peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 UAS-PylRS/UAS-GFP-(TAG)-mCherry/(U6-PylT)4로의 Dmel 세포의 일시적인 형질감염 후에 인간 eRF1 변이체 (디. 멜라노가스터 코돈 용법으로 리코딩됨)가 발현된다. 정지가 없는 대조군이 전장 단백질에 대한 크기 마커로서의 역할을 하고, 음성 대조군 (-)은 내인성 eRF1의 존재 하의 기준선 억제 효율을 규명하고, 2가 없는 음성 대조군은 1의 부재 하의 번역초과 수준을 가리킨다. 세포를 형질감염시키고, 48시간 동안 성장시켰다. 전장 생성물을 나타내는 밴드 강도의 말단절단 생성물에 대한 비를 계산함으로써, 비-포화 노출 조건 하에 GFP에 대해 면역염색된 블롯으로부터 번역초과를 정량한다. 각각의 막대는 3회의 독립적인 형질감염 및 정량 실험의 평균 ± SE를 나타낸다.
b. 웨스턴 블롯으로 가시화된 용해물 내의 단백질의 발현 수준. 패널 a에 대해 기술된 바와 같이, 지시된 벡터로 형질감염되고 1 mM 아미노산 1의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-eRF1 및 α-HA 항체로 이뮤노블롯팅하였다. 제시된 α-GFP 블롯은 전장 생성물에 대한 명료한 밴드를 프린트로 나타내도록 30초 동안 노출되었다. 정량에 사용된 블롯의 상응하는 노출은 5초 동안 노출되었고, 포화를 나타내지 않으며, 추가적인 반복실험도 마찬가지이다.
c. 일시적인 형질감염에 사용된 구축물.
도 7은 eRF1 E55D 돌연변이체의 존재 하에서의 sfGFP(TAG) 내로의 4개의 별개의 비-천연 아미노산의 혼입을 도시한다.
도 8 (보충 도면 1)은 유니버설(universal) PylT/PylTU25C 프로브를 이용한 노던 블롯을 도시한다. 도 1a,b와 유사한 플라스미드 b+c, b+d, b+e, g+h (차트 1)로의 일시적인 형질감염 24시간 후에 총 RNA를 추출하였다.
도 9 (보충 도면 2)는 peRF1(X) 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 발현된 인간 eRF1 변이체를 도시한다. 음성 대조군 (-)은 내인성 eRF1을 검출한다. 이중 루시페라제 검정법에서의 생산된 단백질의 절대적 발현 수준이 α-레닐라 웨스턴 블롯에 의해 제시된다. 형질감염 없음은 형질감염되지 않은 세포이다.
도 10 (보충 도면 3)은 용해 완충제 내의 sfGFP의 형광측정 정량을 위한 검정 곡선을 도시한다. 정제 및 단계 희석된 sfGFP의 형광 강도가 샘플 내의 sfGFP의 농도에 대해 플롯팅된다. 박테리아 발현 후 단백질을 정제하고, 280 nm에서의 흡광도 측정으로 정량하고, 프로테아제 억제제가 첨가된 RIPA-완충제에서 희석하였다.
도 11 (보충 도면 4)은 sfGFP 내의 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입을 입증하는 전기분무 이온화 질량 분광법을 도시한다. 미량 성분은 검출 동안 하나의 1 또는 2의 카르바메이트 기에서의 자발적인 절단으로 천연 리신이 생산되는 것을 나타낸다. 상응하는 질량 손실이 각각 100 또는 110 Da으로 계산된다. 이전에 본 발명가들은 전자 분무 이온화 공정에서 1의 카르바메이트 절단이 발생한다는 것을 관찰하였다7.
도 12 이중-루시페라제 리포터 검정법에서의 난소에서의 eRF1 E55D 또는 Δ100 발현이 정지 코돈 번역초과에 미치는 효과에 대한 트랜스제닉 디. 멜라노가스터 파리 계통의 스크리닝.
도 13은 FACs 플롯을 나타낸다.
도 14는 사진을 나타낸다.
도 15는 막대 차트를 나타낸다.
도 16은 PylT U25C 및 PylT U25C Opt 변이체를 나타낸다.
도 17은 PylT U25C 및 PylT U25C Opt 변이체의 서열을 나타낸다.
도 18은 사진 및 막대 차트를 나타낸다.
도 19는 다이어그램을 나타낸다.
도 20은 다이어그램을 나타낸다.
도 21은 (a) 다이어그램, (b) 화학 구조, 및 (c) 2개의 그래프를 나타낸다.
차트 1은 사용된 플라스미드 구축물 및 비-천연 아미노산을 나타낸다. (a) 사용된 벡터의 개략도. PylT는 Pyl tRNACUA를 코딩하는 유전자이고, PylT*는 U25C 변이체를 코딩한다. U6은 U6 프로모터를 가리키고, CMV는 CMV 프로모터이며, CMV enh는 CMV 프로모터의 5' 인핸서 단편이고, EF1 prom은 EF-1α 프로모터이다. 적색 막대는 앰버 정지 코돈의 위치를 가리킨다. (b) 1 (N ε-[(tert-부톡시)카르보닐]-l-리신) 및 2 (N ε-[((2-메틸시클로프로프-2-엔-1 일)메톡시)카르보닐]-l-리신)의 화학 구조.
도 1은 포유동물 세포에서 TAG 코돈에 반응하여 비-천연 아미노산을 혼입시키기 위한 PylRS/tRNACUA 발현 벡터의 최적화를 도시한다. (a) 형광 검정법에서 측정된 sfGFP 내로의 1 (2 mM) 및 2 (0.5 mM)의 혼입의 정량. 지시된 구축물을 HEK293T 세포에서 일시적으로 발현시키고, 485 nm에서의 여기 후 520 nm에서의 형광에 의해 용해물에서 sfGFP를 정량하였다. 아미노산이 없는 대조군이 각각의 벡터 조합에 대해 포함된다. 정지 코돈 대신 류신 코돈이 있는 등가의 sfGFP 대조군 플라스미드 (차트 1a의 구축물 a)가 나타내는 형광의 백분율로서 데이터가 플롯팅된다. 데이터는 3중물의 평균 ± SE를 나타낸다. (b) 웨스턴 블롯으로 가시화된 용해물 내의 sfGFP 수율. 지시된 벡터로 형질감염되고 지시된 아미노산의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-액틴 및 α-FLAG 항체로 이뮤노블롯팅하였다. (c) 아미노산 부재 하의 구축물 b+c, b+d, b+e, g+h로부터의 상대적인 PylT/PylT* 발현의 노던 블롯 분석. 로딩 대조군에 대해서 보충 도면 1을 참조한다.
도 2는 정지 코돈 번역초과, 및 PylRS/tRNACUA 쌍을 이용한 1 (2 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. (a) 이러한 연구에서 돌연변이된 eRF1 위치. eRF1 (PDB ID:3E1Y)29로부터의 N-말단 도메인의 구조이고, 이러한 연구에서 돌연변이된 잔기는 적색이다. (b) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 인간 eRF1 변이체가 발현된다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운(knockdown)이다. (c) 억제인자 tRNA의 부재 하에서의 HEK293T 세포에서의 레닐라(Renilla)-TAG-반딧불이 루시페라제 리포터 및 eRF1 변이체의 발현에 의해 3개 모두의 정지 코돈의 번역초과가 결정된다. CMV-PylRS/CMV-DLR(TAG) (또는 상응하는 TAA, TGA 또는 세린 코돈 변이체)를 세포 내로 일시적으로 형질감염시키고, 20시간 후에 발현 수준을 결정하였다. TAG, TAA, 또는 TGA 번역초과를 세린 코돈 (TCC)을 함유하는 구축물로부터의 데이터에 대해 표준화하였다. 데이터는 4중 측정의 평균 ± SE를 나타낸다. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. Wt는 디. 멜라노가스터 코돈 용법으로 리코딩(recoding)된 인간 eRF1이다. Δ100 돌연변이체에 대한 데이터는 척도를 벗어나고, 하기의 값이다: 1.6% (TAA), 2% (TAG) 및 15% (TGA). (d) peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], U6 프로모터로부터 PylT를 발현하는 플라스미드 c (차트 1a), 및 플라스미드 a (차트 1a)에서 sfGFP가 레닐라-TAG-반딧불이로 교체된 버전인 CMV-PylRS/CMV-레닐라-TAG-반딧불이로의 HEK 293T 세포의 일시적인 형질감염. 음성 대조군 (-)은 내인성 eRF1을 검출하고, shRNA는 내인성 eRF1의 녹다운이다. 등량의 세포 용해물을 α-eRF1 및 α-액틴 항체로 이뮤노블롯팅하였다. (e) eRF1 (X) 변이체가 피롤리실 tRNA/신테타제 쌍을 사용하여 앰버 정지 코돈에 반응하여 비-천연 아미노산 혼입을 증가시킨다. HEK293T 세포를 패널 d에 기술된 바와 같이 형질감염시키고, 1 mM 아미노산 1의 존재 하에 성장시키고, 20 h 후에 측정하였다. % 번역초과를 앰버 정지 코돈 대신 세린 코돈을 보유하는 레닐라-TCC-반딧불이 리포터에 대해 상대적으로 측정하였다.
도 3은 eRF1 E55D를 최적화된 PylRS/tRNACUA 쌍 발현 시스템과 조합하는 것이 포유동물 세포에서 다중 비-천연 아미노산의 재조합 단백질 내로의 효율적인 혼입을 가능하게 한다는 것을 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1의 존재 또는 부재 하에 성장시켰다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다. (b) 용해물로부터의 웨스턴 블롯. (c) 패널 a에서와 같지만, 0.5 mM 아미노산 2를 사용함. (d) 용해물로부터의 웨스턴 블롯.
도 4는 1개 또는 3개의 비-천연 아미노산이 혼입된 재조합 sfGFP의 발현, 정제 및 특성화를 도시한다. (a) 플라스미드 g, h (또는 i, 차트 1a) 및 eRF1 E55D를 HEK293T 세포 내로 일시적으로 형질감염시키고, 48시간 동안 2 mM 아미노산 1 또는 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 전장 sfGFP를 Ni-NTA 크로마토그래피로 정제하였다. (b) sfGFP 내의 1개 또는 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입이 전기분무 이온화 질량 분광법에서 확인된다 (보충 도면 4를 또한 참조한다).
도 5는 게놈 통합으로부터의 eRF1 E55D의 안정적인 발현이 T-Rex 293 Flp-In 세포에서 앰버 억제를 강화한다는 것을 도시한다. T-Rex 293 Flp-In 시스템 (라이프 테크놀러지즈(Life Technologies))를 사용하는 것에 의해 안정적인 eRF1 세포주가 생성되어, 규정된 표적 유전자좌에서의 삽입으로 인해 삽입된 트랜스진(transgene)의 균일한 발현을 제공하였다.
a 플라스미드 g 및 h 또는 i (도 1, a)를 게놈에 통합된 디. 멜라노가스터 코돈 용법의 eRF1 E55D를 함유하는 T-Rex293 세포 내로 일시적으로 형질감염시켰다. 세포를 48시간 시간 동안 0.5 mM 아미노산 2의 존재 또는 부재 하에 성장시켰다. 형질감염 16시간 전에 1 ㎍/ml 테트라시클린 첨가로 eRF1 E55D의 발현을 유도하였다. 모든 실험에서 공인된 테트라시클린이 없는 성장 배지를 사용하였다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
b 패널 a에서 제시된 바와 같은 용해물로부터의 웨스턴 블롯. 등량의 세포 용해물이 로딩되었다. eRF1 wt 또는 E55D가 삽입된 T-Rex293 Flp-in 세포주를 렌티바이러스 shRNA(eRF1) 구축물 (산타 크루즈(Santa Cruz), 도 3에서와 같음)로 형질전환시키고, 나이브 세포에 대해 퓨로마이신으로 선별함으로써, 내인성 eRF1에 대한 shRNA를 구성적으로 발현하는 안정적인 세포주가 생성되었다. 디. 멜라노가스터 코돈-최적화 후 shRNA에 상보적인 서열이 결여되기 때문에 eRF1 wt 및 E55D는 shRNA(eRF1)에 대해 불응성이었다.
c 2의 존재 또는 부재 하에, 그리고 방출 인자 변이체의 발현을 유도하기 위해 성장 배지에 1 ㎍/ml 테트라시클린을 첨가하여, 48시간 동안 구축물 g 및 h (도 1)로 일시적으로 형질감염시킨 후에 sfGFP(TAG)가 발현되었다. 485 nm에서의 여기 후, 520 nm에서 세포 용해물에서 전장 sfGFP를 정량하였다. 데이터는 4회의 독립적인 측정의 평균 ± SE를 나타낸다.
d. 패널 c에서와 같지만, sfGFP(TAG)3을 발현함.
도 6은 Dmel 세포에서의 정지 코돈 번역초과, 및 PylRS/tRNACUA 쌍을 이용한 1 (1 mM)의 혼입에 대한 eRF1 내의 돌연변이의 효과를 도시한다. a. peRF1 (X) [여기서 X는 도입된 돌연변이를 지시한다], 및 UAS-PylRS/UAS-GFP-(TAG)-mCherry/(U6-PylT)4로의 Dmel 세포의 일시적인 형질감염 후에 인간 eRF1 변이체 (디. 멜라노가스터 코돈 용법으로 리코딩됨)가 발현된다. 정지가 없는 대조군이 전장 단백질에 대한 크기 마커로서의 역할을 하고, 음성 대조군 (-)은 내인성 eRF1의 존재 하의 기준선 억제 효율을 규명하고, 2가 없는 음성 대조군은 1의 부재 하의 번역초과 수준을 가리킨다. 세포를 형질감염시키고, 48시간 동안 성장시켰다. 전장 생성물을 나타내는 밴드 강도의 말단절단 생성물에 대한 비를 계산함으로써, 비-포화 노출 조건 하에 GFP에 대해 면역염색된 블롯으로부터 번역초과를 정량한다. 각각의 막대는 3회의 독립적인 형질감염 및 정량 실험의 평균 ± SE를 나타낸다.
b. 웨스턴 블롯으로 가시화된 용해물 내의 단백질의 발현 수준. 패널 a에 대해 기술된 바와 같이, 지시된 벡터로 형질감염되고 1 mM 아미노산 1의 존재 하에 또는 아미노산 없이 성장된 세포로부터의 등량의 세포 용해물을 α-GFP, α-eRF1 및 α-HA 항체로 이뮤노블롯팅하였다. 제시된 α-GFP 블롯은 전장 생성물에 대한 명료한 밴드를 프린트로 나타내도록 30초 동안 노출되었다. 정량에 사용된 블롯의 상응하는 노출은 5초 동안 노출되었고, 포화를 나타내지 않으며, 추가적인 반복실험도 마찬가지이다.
c. 일시적인 형질감염에 사용된 구축물.
도 7은 eRF1 E55D 돌연변이체의 존재 하에서의 sfGFP(TAG) 내로의 4개의 별개의 비-천연 아미노산의 혼입을 도시한다.
도 8 (보충 도면 1)은 유니버설(universal) PylT/PylTU25C 프로브를 이용한 노던 블롯을 도시한다. 도 1a,b와 유사한 플라스미드 b+c, b+d, b+e, g+h (차트 1)로의 일시적인 형질감염 24시간 후에 총 RNA를 추출하였다.
도 9 (보충 도면 2)는 peRF1(X) 및 CMV-PylRS/CMV-DLR(TAG)로의 HEK 293T 세포의 일시적인 형질감염 후에 발현된 인간 eRF1 변이체를 도시한다. 음성 대조군 (-)은 내인성 eRF1을 검출한다. 이중 루시페라제 검정법에서의 생산된 단백질의 절대적 발현 수준이 α-레닐라 웨스턴 블롯에 의해 제시된다. 형질감염 없음은 형질감염되지 않은 세포이다.
도 10 (보충 도면 3)은 용해 완충제 내의 sfGFP의 형광측정 정량을 위한 검정 곡선을 도시한다. 정제 및 단계 희석된 sfGFP의 형광 강도가 샘플 내의 sfGFP의 농도에 대해 플롯팅된다. 박테리아 발현 후 단백질을 정제하고, 280 nm에서의 흡광도 측정으로 정량하고, 프로테아제 억제제가 첨가된 RIPA-완충제에서 희석하였다.
도 11 (보충 도면 4)은 sfGFP 내의 3개의 부위에서의 비-천연 아미노산 1 및 2의 정량적 혼입을 입증하는 전기분무 이온화 질량 분광법을 도시한다. 미량 성분은 검출 동안 하나의 1 또는 2의 카르바메이트 기에서의 자발적인 절단으로 천연 리신이 생산되는 것을 나타낸다. 상응하는 질량 손실이 각각 100 또는 110 Da으로 계산된다. 이전에 본 발명가들은 전자 분무 이온화 공정에서 1의 카르바메이트 절단이 발생한다는 것을 관찰하였다7.
도 12 이중-루시페라제 리포터 검정법에서의 난소에서의 eRF1 E55D 또는 Δ100 발현이 정지 코돈 번역초과에 미치는 효과에 대한 트랜스제닉 디. 멜라노가스터 파리 계통의 스크리닝.
도 13은 FACs 플롯을 나타낸다.
도 14는 사진을 나타낸다.
도 15는 막대 차트를 나타낸다.
도 16은 PylT U25C 및 PylT U25C Opt 변이체를 나타낸다.
도 17은 PylT U25C 및 PylT U25C Opt 변이체의 서열을 나타낸다.
도 18은 사진 및 막대 차트를 나타낸다.
도 19는 다이어그램을 나타낸다.
도 20은 다이어그램을 나타낸다.
도 21은 (a) 다이어그램, (b) 화학 구조, 및 (c) 2개의 그래프를 나타낸다.
구축물 및 벡터
본원에서 사용된 바와 같이, 일반적으로 용어 "구축물" 또는 "벡터"는 자신이 연결된 관심 핵산 서열을 전달할 수 있는 핵산을 지칭한다.
한 벡터 유형은 추가적인 DNA 분절이 내부로 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 또 다른 벡터 유형은 추가적인 DNA 분절이 바이러스 게놈 내로 라이게이션될 수 있는 바이러스 벡터이다. 특정 벡터는 자신이 도입된 숙주 세포 내에서 자가 복제가 가능하다 (예를 들어, 박테리아 복제 기원이 있는 박테리아 벡터, 및 에피솜형 포유동물 벡터). 다른 벡터 (예를 들어, 비-에피솜형 포유동물 벡터)는 숙주 세포 내로의 도입 시 숙주 세포의 게놈 내로 통합되고, 이에 의해 숙주 게놈과 함께 복제된다.
관심 핵산 서열이 구축물 또는 벡터, 예컨대 발현 벡터 내로 혼입될 수 있다. 이러한 벡터를 상용성 숙주 세포 내에서 핵산을 복제시키는데 사용할 수 있다. 이러한 벡터를 숙주 세포로부터 회수할 수 있다.
벡터는 상용성 숙주 세포, 예컨대 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 관심 핵산 서열을 발현시키는데 사용되는 발현 벡터일 수 있다. 적절하게는, 관심 핵산 서열이 숙주 세포에서의 관심 핵산 서열의 발현을 제공할 수 있는 제어 서열, 예컨대 프로모터 또는 인핸서에 작동가능하게 연결된다. 용어 "작동가능하게 연결된"은 기술된 성분들이 이들이 이들의 의도되는 방식으로 기능하게 허용하는 관계에 있다는 것을 의미한다. 관심 핵산 서열에 "작동가능하게 연결된" 조절 서열은 제어 서열과 상용성인 조건 하에 관심 핵산 서열의 발현이 달성되는 방식으로 라이게이션된다.
벡터는 단백질 발현을 제공하도록 적절한 숙주 세포 내로 형질전환 또는 형질감염될 수 있다. 이러한 프로세스는 발현 벡터로 형질전환된 숙주 세포를 단백질을 코딩하는 관심 핵산 서열의 벡터에 의한 발현을 제공하는 조건 하에 배양하고, 임의적으로, 발현된 단백질을 회수하는 것을 포함할 수 있다.
벡터는, 예를 들어, 복제 기원, 임의적으로, 관심 핵산 서열의 발현을 위한 프로모터, 및 임의적으로, 프로모터의 조절인자가 제공된 플라스미드 또는 바이러스 벡터일 수 있다. 벡터는 하나 이상의 선별성 마커 유전자를 함유할 수 있고, 예를 들어 박테리아 플라스미드의 경우 암피실린 내성 유전자를 함유할 수 있다.
한 측면에서, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물이 제공된다.
또 다른 측면에서, (i) 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는, 진핵생물 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물이 제공된다.
또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 포함하는 핵산 구축물 조합물이 또한 제공된다.
또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 포함하거나 또는 별개로 포함하는 벡터가 또한 제공된다.
또 다른 측면에서, 상기 기술된 핵산 구축물 각각을 별개로 포함하는 벡터들을 포함하는 벡터 조합물이 또한 제공된다.
특정 실시양태에서, 핵산 구축물 내의 제1 및 제2 프로모터는 반대 방향으로 놓인 별개의 프로모터이다. 이러한 실시양태에 따르면, 제1 및 제2 프로모터를 각각의 프로모터가 이들의 5' 끝부분이 서로를 향해 배향되면서 반대 가닥 상에서 코딩되는 양방향성 프로모터라고 할 수 있다. 프로모터에 작동가능하게 연결된 각각의 핵산이 상응하여 배향될 것이다. 따라서, 예를 들어, 프로모터 및 발현될 tRNA 서열이 역방향 가닥 상에서 코딩될 수 있다. 프로모터 및 발현될 tRNA 신테타제 유전자는 전방향 가닥 상에서 코딩될 수 있다. 추가적인 예로서, U6 프로모터 및 발현될 tRNA 서열이 역방향 가닥 상에서 코딩될 수 있다. 추가적인 예로서, EF-1a 프로모터 및 발현될 tRNA 신테타제 유전자가 전방향 가닥 상에서 코딩될 수 있다.
제1 및 제2 프로모터에 더하여, 하나 이상의 추가 프로모터가 또한 포함될 수 있고, 이는 제1 및/또는 제2 프로모터와 동일한 프로모터일 수 있거나 또는 제1 및/또는 제2 프로모터와 상이할 수 있다. 추가 프로모터(들)는 제1 또는 제2 프로모터와 동일한 방향으로 배향될 수 있다. 적절하게는, 추가 프로모터(들)는 제1 프로모터와 동일한 방향으로 배향된다.
적절하게는, 본원에 기술된 구축물은 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 핵산 서열을 추가로 포함한다. 돌연변이체 eRF1을 발현시키는 프로모터는 제1 또는 제2 프로모터와 동일한 방향으로 배향될 수 있다. 적절하게는, 이러한 프로모터는 제1 프로모터와 동일한 방향으로 배향된다.
적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열 및 tRNA 신테타제를 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 적절하게는, tRNA 신테타제를 코딩하는 핵산 서열 및 돌연변이체 eRF1을 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된다. 예시적인 T2A 자가-절단 펩티드가 문헌 [PLoS ONE 6(4) (2011)]에 기술되어 있다.
적절하게는, 구축물은 다중-카피 tRNA 배열을 제공한다. 적절하게는, tRNA 유전자의 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 카피가 본원에 기술된 구축물 내에 제공된다. 적절하게는, tRNA 유전자의 적어도 4개의 카피가 구축물 내에 제공된다. 적절하게는, tRNA 유전자의 적어도 8개의 카피가 구축물 내에 제공된다. tRNA 유전자의 다중 카피는 동일한 구축물 상에서 또는 상이한 구축물 상에서 제공될 수 있다. 한 실시양태에서, tRNA 유전자의 적어도 4개의 카피가 제1 구축물 상에서 제공되고, tRNA 유전자의 적어도 4개의 카피가 제2 구축물 상에서 제공된다.
한 실시양태에서, tRNA 유전자의 다중 카피는 단일 프로모터의 제어 하에 놓인다. 또 다른 실시양태에서, tRNA 유전자의 다중 카피는 상이한 다중 프로모터의 제어 하에 놓인다. 또 다른 실시양태에서, tRNA 유전자의 각각의 카피는 별개의 프로모터의 제어 하에 놓이고, 이는 동일한 프로모터 또는 2개 이상의 상이한 프로모터일 수 있다. 또 다른 실시양태에서, tRNA 유전자의 각각의 카피는 다중 프로모터의 제어 하에 놓이고, 이는 동일한 프로모터 또는 2개 이상의 상이한 프로모터일 수 있다. 적절하게는, 각각의 tRNA 유전자는 별개의 프로모터의 제어 하에 놓이고, 이는 각각의 tRNA 유전자에 대해 동일한 프로모터이다. 적절하게는, 제공된 tRNA 유전자(들) 각각을 제어하는 프로모터 또는 프로모터들은 동일하다. 이러한 맥락에서, "동일한"은 다중 tRNA 서열을 제어하는 단일한 프로모터 서열을 뜻하기보다는 이의 서열 면에서의 동일성을 의미한다. 명확하게, 본원에 기술된 바와 같이 동일한 프로모터의 다중 카피가 있을 수 있다.
한 실시양태에서, tRNA의 적어도 4개의 카피가 제공되고, 여기서 각각의 카피가 프로모터에 작동가능하게 연결된 다중-카피 tRNA 배열이 제공된다.
또 다른 실시양태에서, tRNA의 적어도 4개의 카피가 제공되고, 여기서 각각의 카피가 프로모터에 작동가능하게 연결되며, 각각의 프로모터가 동일한 프로모터, 예컨대 RNA pol III 프로모터, 예를 들어 U6 프로모터인 다중-카피 tRNA 배열이 제공된다.
한 실시양태에서, tRNA의 5' 끝부분이 tRNA를 발현시키는데 사용되는 프로모터의 전사 개시 부위에 의해 직접적으로 규정된다.
본원에서 제공되는 뉴클레오티드 구축물은 용도가 광범위하고, 앰버 억제뿐만 아니라 오팔 및/또는 오커 억제에서 사용될 수 있다는 것을 주지하여야 한다. 본 발명의 핵산 구축물을 앰버/오팔/오커 억제에 적용할 때, 통상의 기술자는 적합한 앰버/오팔/오커 코돈과 함께 이에 따라 적합한 tRNA 및/또는 tRNA 신테타제를 선택할 것이다.
구축물 및 벡터의 조합물
본원에 기술된 구축물 및 벡터의 조합물이 하나 이상의 비-천연 아미노산을 세포 내로 혼입시키는데 사용하기 위해 구상된다.
예를 들어, (1) (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물; 및 (2) (i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물을 포함하는 구축물 조합물.
한 실시양태에서, 상기 언급된 구축물 (1)로부터의 관심 핵산 서열은 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함한다. 이러한 실시양태에 따르면, 구축물 (2)로부터의 관심 핵산 서열 및 tRNA가 구축물 (1) 내로 혼입되기 때문에 구축물 (1)이 반드시 구축물 (2)와 함께 사용될 필요는 없다. 이러한 실시양태에 따르면, 또 다른 벡터 상의 tRNA의 하나 이상의 추가 카피를 포함하는 것이 바람직할 수 있다. 이러한 다른 벡터는 하나 이상의 프로모터의 제어 하에 tRNA(들)를 배타적으로 포함할 수 있다. 임의적으로, 원한다면 다른 요소들이 이러한 다른 벡터 내로 혼입될 수 있다.
상기 언급된 바와 같은 (1) 및 (2)를 포함하는 구축물 조합물이 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 추가 구축물과 함께 사용될 수 있다.
대안적으로, 돌연변이체 eRF1을 코딩하는 핵산 서열이 구축물 (1) 및/또는 (2) 내로 혼입될 수 있다. 적절하게는, 돌연변이체 eRF1을 코딩하는 핵산 서열이 구축물 (1) 내로 혼입된다. 이러한 실시양태에 따르면, (i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및 (ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고, 제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는 tRNA가 핵산 구축물 내에 다중 카피로 존재하며; 임의적으로 (iii) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 포함하고; 임의적으로 (iv) 본원에 기술된 바와 같은 돌연변이체 eRF1을 코딩하는 관심 핵산 서열을 포함하는 핵산 구축물이 개시된다.
이러한 다양한 구축물 조합물을 포함하는 벡터 및 세포가 또한 개시된다.
tRNA 신테타제
본원에서 사용되는 tRNA 신테타제 (적절하게는, 아미노아실-tRNA 신테타제)는 다양할 수 있다. 구체적인 tRNA 신테타제 서열이 실시예에서 사용되었을 수 있지만, 본 발명은 이러한 실시예에만 국한되도록 의도되지 않는다. 원칙적으로, tRNA 장전(charging) (아미노아실화) 기능을 제공하는 임의의 tRNA 신테타제를 사용할 수 있다. 예를 들어, tRNA 신테타제는 임의의 적절한 종 예컨대 고세균, 예를 들어, 메타노사르시나(Methanosarcina), 예컨대 메타노사르시나 바르케리(Methanosarcina barkeri) MS; 메타노사르시나 바르케리 변종 푸사로(Fusaro); 메타노사르시나 마제이(Methanosarcina mazei) Go1; 메타노사르시나 아세티보란스(Methanosarcina acetivorans ) C2A; 메타노사르시나 써모필라(Methanosarcina thermophila); 또는 메타노코코이데스(Methanococcoides), 예컨대 메타노코코이데스 부르토니이(Methanococcoides burtonii)로부터의 것일 수 있다. 대안적으로, tRNA 신테타제는 박테리아, 예를 들어 데술피토박테리움(Desulfitobacterium), 예컨대 데술피토박테리움 하프니엔세(Desulfitobacterium hafniense) DCB-2; 데술피토박테리움 하프니엔세 Y51; 데술피토박테리움 하프니엔세 PCP1; 또는 데술포토마쿨룸 아세톡시단스(Desulfotomaculum acetoxidans) DSM 771로부터의 것일 수 있다.
한 실시양태에서, tRNA 신테타제는 피롤리실 tRNA 신테타제 생물학적 활성이 있는 단백질인 피롤리실 tRNA 신테타제 (PylRS)이다. PylRS는 tRNA를 비-천연 아미노산으로 아실화시킬 수 있다.
PylRS는 야생형 또는 유전자 조작 PylRS일 수 있다. 예를 들어, 문헌 [Neumann et al., Nat Chem Biol 4:232, 2008] 및 [Yanagisawa et al., Chem Biol 2008, 15:1187], 및 EP2192185A1에 유전자 조작 PylRS가 기술되어 있다. 적절하게는, 비-천연 아미노산(들)의 혼입 효율을 증가시키는 유전자 조작 tRNA 신테타제 유전자가 선택된다.
한 실시양태에 따르면, PylRS는 임의적으로 하기 기재된 코돈-최적화 서열을 포함하거나 이로 이루어진, 메타노사르시나 바르케리로부터의 것 (MbPylRS)이다:
특정 실시양태에 따르면, PylRS는 임의적으로 하기 기재된 코돈-최적화 서열을 포함하거나 이로 이루어진, 메타노사르시나 마제이로부터의 것 (MmPylRS)이다:
적절하게는, tRNA 신테타제를 코딩하는 뉴클레오티드 서열은 코돈-최적화된다.
tRNA
본원에서 사용되는 tRNA는 다양할 수 있다. 구체적인 tRNA가 실시예에서 사용되었을 수 있지만, 본 발명은 이러한 실시예에만 국한되도록 의도되지 않는다. 원칙적으로, 임의의 tRNA를 사용할 수 있고, 단 이는 선택된 tRNA 신테타제와 상용성이다.
tRNA는 임의의 적절한 종 예컨대 고세균, 예를 들어, 메타노사르시나, 예컨대 메타노사르시나 바르케리 MS; 메타노사르시나 바르케리 변종 푸사로; 메타노사르시나 마제이 Go1; 메타노사르시나 아세티보란스 C2A; 메타노사르시나 써모필라; 또는 메타노코코이데스, 예컨대 메타노코코이데스 부르토니이로부터의 것일 수 있다. 대안적으로, tRNA는 박테리아, 예를 들어 데술피토박테리움, 예컨대 데술피토박테리움 하프니엔세 DCB-2; 데술피토박테리움 하프니엔세 Y51; 데술피토박테리움 하프니엔세 PCP1; 또는 데술포토마쿨룸 아세톡시단스 DSM 771로부터의 것일 수 있다.
tRNA 유전자는 야생형 tRNA 유전자일 수 있거나, 또는 돌연변이된 tRNA 유전자일 수 있다. 적절하게는, 비-천연 아미노산(들)의 혼입 효율을 증가시키는 돌연변이된 tRNA 유전자가 선택된다. 한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNACUA 유전자는 문헌 [Biochemistry (2013) 52, 10]에 기술된 바와 같은 PylT의 U25C 변이체이다.
한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNACUA 유전자는 문헌 [Fan et al. 2015, Nucleic Acids Research doi:10.1093/nar/gkv800]에 기술된 바와 같은 PylT의 Opt 변이체이다.
한 실시양태에서, 돌연변이된 tRNA 유전자, 예를 들어, 돌연변이된 tRNACUA 유전자는 PylT의 U25C 및 Opt 변이체 양쪽 모두를 갖고, 즉, 이러한 실시양태에서, tRNA, 예컨대 PylT tRNACUA 유전자는 U25C 및 Opt 돌연변이 양쪽 모두를 포함한다.
한 실시양태에서, tRNA를 코딩하는 서열은 tRNAPyl, 더욱 적절하게는 tRNAPyl CUA를 코딩하는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT) 유전자이다. 이는 앰버 억제에 의해, 즉 앰버 코돈의 인식에 의해 비-천연 아미노산을 혼입시킨다.
메타노사르시나 마제이로부터의 PylT를 코딩하는 핵산 서열의 예는 하기의 것이다:
또 다른 실시양태에서, 메타노사르시나 마제이로부터의 PylT는 U6 프로모터로부터 발현되고, PylT의 3' 끝부분에 링커에 이어지는 종결인자가 있다. 예시적인 서열은 하기의 것이다 (U6 프로모터는 볼드체 소문자이고; PlyT는 밑줄이 그어지며; 링커는 볼드체 대문자이고; 종결인자는 밑줄이 그어진 대문자이다):
tRNA 신테타제/tRNA 쌍
적절하게는, tRNA-tRNA 신테타제 쌍은 20개의 천연 발생 아미노산 중 어떤 것도 인식하지 않는 것이다.
상응하거나 동족인 tRNA 또는 tRNA 신테타제가 상이한 종들, 예컨대 메타노코쿠스 박테리아의 상이한 종들로부터 조합될 수 있다는 것이 이해될 것이다. 예를 들어, 메타노사르시나 마제이로부터의 피롤리신 tRNA를 메타노사르시나 바르케리로부터의 피롤리실 tRNA 신테타제와 함께 사용하는 것이 가능할 수 있다. 관련 기술 분야에 공지된 방법을 사용하여, 예를 들어, 숙주 세포에서 상이한 성분들을 함께 조합하고, 생산되는 무손상 관심 단백질에 대해 분석함으로써, 이같이 쌍을 이루어 것의 기능성을 쉽게 테스트할 수 있다.
한 실시양태에서, tRNA-tRNA 신테타제 쌍은 피롤리실-tRNA 신테타제 (PylRS)/tRNACUA 쌍이고, 적절하게는 메타노코쿠스로부터의 것이다.
한 실시양태에서, tRNA 신테타제는 메타노사르시나 바르케리로부터의 PylRS (MbPylRS)이거나 또는 이로부터 유래되고, tRNA는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT)이거나 또는 이로부터 유래된다.
한 실시양태에서, tRNA 신테타제는 메타노사르시나 마제이로부터의 PylRS (MmPylRS)이거나 또는 이로부터 유래되고, tRNA는 메타노사르시나 마제이 피롤리신으로부터의 피롤리신 tRNA (PylT)이거나 또는 이로부터 유래된다.
적절하게는, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고/이거나, 상기 tRNA가 진핵생물 세포 내의 내인성 tRNA 신테타제에 대해 직교이고/이거나, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고 상기 tRNA가 내인성 tRNA 신테타제에 대해 직교이다.
제어 서열
핵산 서열에 작동가능하게 연결된 제어 서열은 프로모터, 인핸서 및 기타 발현 조절 신호를 포함한다. 이러한 제어 서열은 구축물 또는 벡터가 디자인되어 사용되는 숙주 세포와 상용성이도록 선택될 수 있다. 용어 프로모터는 관련 기술 분야에 널리 공지되어 있고, 크기 및 복잡성 면에서 최소 프로모터에서 상류 요소 및 인핸서를 포함하는 프로모터까지의 범위에 이르는 핵산 영역을 포함한다.
적절하게는, 프로모터 서열 중 하나는 RNA Pol III 프로모터, 예컨대 U6 프로모터이다. 적절하게는, RNA Pol III 프로모터가 tRNA 유전자에 작동가능하게 연결된다. 적절하게는, 이러한 배열이 본 개시내용의 구축물에서 적어도 4, 5, 6, 7 또는 8회 또는 이를 초과하는 횟수로 반복된다.
적절하게는, 프로모터 서열 중 하나는 진핵생물 신장 인자 프로모터, 예컨대 EF-1 프로모터 (예를 들어, EF-1α)이다. 적절하게는, 이러한 프로모터가 tRNA 신테타제 유전자 및/또는 관심 핵산 서열에 작동가능하게 연결된다. 적절하게는, 이러한 배열이 본 개시내용의 구축물에서 적어도 1회 반복된다.
RNA Pol III 프로모터
적절하게는, 진핵생물 세포, 예컨대 포유동물 또는 곤충 세포에서 RNA Pol III 전사를 지시할 수 있는 임의의 프로모터가 본원에 기술된 구축물에서 사용될 수 있다. RNA Pol III 프로모터는 유전자내 및 유전자외 (내부 및 외부) 프로모터를 포함한다.
적절하게는, 상기 프로모터는 진핵생물 U6 프로모터, 적절하게는 호모 사피엔스 U6 프로모터이거나 또는 이로부터 유래된다.
예시적인 U6 프로모터가 문헌 [The Journal of Biological Chemistry (1987) 262(3), 1187-1193]에 기술되어 있다.
인간 및/또는 마우스 시스템에서 사용하기 위한 예시적인 U6 프로모터가 문헌 [Journal of the American Chemical Society (2010) 132(12), 4086-4088]에 기술되어 있다.
또 다른 예시적인 U6 프로모터는 하기에 기재된 서열을 포함하거나 또는 이로 이루어진다:
적절하게는, 프로모터는 본원에 기술된 바와 같은 하나 이상의 tRNA 유전자에 작동가능하게 연결된, 포유동물 세포, 예컨대 마우스 또는 인간 세포에서 RNA Pol III 전사를 지시할 수 있는 U6 프로모터이거나 또는 이로부터 유래된다.
신장 인자 프로모터
적절하게는, 진핵생물 세포, 예컨대 포유동물 또는 곤충 세포에서 발현을 지시할 수 있는 임의의 진핵생물 신장 인자 프로모터가 본원에 기술된 구축물에서 사용될 수 있다.
적절하게는 상기 프로모터는 진핵생물 신장 인자 1 (EF-1) 프로모터이거나 또는 이로부터 유래된다.
적절하게는, 상기 프로모터는 EF-1α 프로모터이거나 또는 이로부터 유래된다.
예시적인 EF-1α 프로모터가 문헌 [Anticancer Res. (2002), 22(6A), 3325-30]에 기술되어 있다.
또 다른 예시적인 EF-1α 프로모터는 하기에 기재된 서열을 포함하거나 또는 이로 이루어진다:
적절하게는, 프로모터는 본원에 기술된 바와 같은 tRNA 신테타제 및/또는 관심 핵산 서열에 작동가능하게 연결된, 포유동물 세포, 예컨대 마우스 또는 인간 세포에서 전사를 지시할 수 있는 EF-1α 프로모터이거나 또는 이로부터 유래된다.
숙주 세포
적절한 숙주 세포는 박테리아 세포 (예를 들어, 이. 콜라이)를 포함할 수 있지만, 가장 적절하게는, 숙주 세포는 진핵생물 세포, 예를 들어 곤충 세포 (예를 들어 드로소필라(Drosophila) 예컨대 드로소필라 멜라노가스터(Drosophila melanogaster)), 효모 세포, 선충 (예를 들어 씨. 엘레강스), 마우스 (예를 들어 무스 무스쿨루스(Mus musculus)), 또는 포유동물 세포 (예컨대 차이니즈 햄스터 난소 세포 (CHO) 또는 COS 세포, 인간 293T 세포, HeLa 세포, NIH 3T3 세포, 및 마우스 적백혈병 (MEL) 세포) 또는 인간 세포 또는 기타 진핵생물 세포이다. 기타 적절한 숙주 세포가 관련 기술 분야의 통상의 기술자에게 공지되어 있다. 적절하게는, 숙주 세포는 포유동물 세포, 예컨대 인간 세포 또는 곤충 세포이다.
본 발명의 실시양태에서 일반적으로 사용될 수 있는 기타 적절한 숙주 세포는 실시예 섹션에서 언급된 것들이다.
통상적인 형질전환 또는 형질감염 기술을 통해 벡터 DNA를 숙주 세포 내로 도입할 수 있다. 본원에서 사용된 바와 같이, 용어 "형질전환" 및 "형질감염"은 인산칼슘 또는 염화칼슘 공침전, DEAE-덱스트란-매개 형질감염, 리포펙션(lipofection), 또는 전기천공을 포함하여, 외래 핵산 분자 (예를 들어, DNA)를 숙주 세포 내로 도입하기 위한 다양한 잘 알려진 기술을 지칭하도록 의도된다. 숙주 세포를 형질전환 또는 형질감염시키는 적절한 방법이 관련 기술 분야에 널리 공지되어 있다.
세포주를 생성시킬 때, 안정적인 세포주가 제조되는 것이 일반적으로 바람직하다. 예를 들어 포유동물 세포의 안정적인 형질감염의 경우, 사용되는 발현 벡터 및 형질감염 기술에 따라, 소량의 세포만 외래 DNA를 이의 게놈 내로 통합시킬 수 있는 것으로 알려져 있다. 이러한 통합체를 확인 및 선별하기 위해, 선별성 마커 (예를 들어, 항생제에 대한 저항성)을 코딩하는 유전자가 일반적으로 관심 유전자와 함께 숙주 세포 내로 도입된다. 바람직한 선별성 마커는 약물, 예컨대 G418, 히그로마이신 또는 메토트렉세이트에 대한 저항성을 부여하는 것을 포함한다. 선별성 마커를 코딩하는 핵산 분자는 동일한 벡터 상에서 숙주 세포 내로 도입될 수 있거나 또는 별개의 벡터 상에서 도입될 수 있다. 도입된 핵산 분자로 안정적으로 형질감염된 세포를 약물 선별로 확인할 수 있다 (예를 들어, 선별성 마커 유전자가 혼입된 세포는 생존하는 한편, 다른 세포는 사망할 것이다).
한 실시양태에서, 본원에 기술된 구축물은 숙주 세포의 게놈 내로 통합된다. 안정적인 통합의 장점은 개별적인 세포 또는 클론들 사이의 균일성이 달성된다는 것이다. 또 다른 장점은 최상의 생산자의 선별이 수행될 수 있다는 것이다. 따라서, 안정적인 세포주를 생성시키는 것이 바람직하다.
또 다른 실시양태에서, 본원에 기술된 구축물은 숙주 세포 내로 형질감염된다. 구축물을 숙주 세포 내로 형질감염시키는 것의 장점은 단백질 수율이 최대화될 수 있다는 것이다.
한 측면에서, 본원에 기술된 핵산 구축물 또는 벡터를 포함하는 세포가 기술된다.
eRF1
맥락으로부터 달리 명백하지 않는 한, 본원에서 'eRF1'에 대한 언급은 진핵생물 eRF1을 지칭한다.
본원에서, 특히 eRF1의 논의에서 사용될 때, '돌연변이체'는 '야생형 이외의 것'이라는 이의 본래의 의미를 갖는다. 명확하게, 야생형 잔기는 사용되는 eRF1의 특정 종에 따라 다를 수 있다. 특정 잔기에 대한 언급은 진뱅크 등록 번호 AF095901.1의 eRF1에 대한 에이치. 사피엔스(H. sapiens) 야생형 기준 서열을 참조로 해석되어야 한다. 출원일의 데이터베이스 공개물에 의존한다. 의혹의 여지가 있는 경우, 이는 2015년 8월 15일자의 <Genetic Sequence Data Bank NCBI-GenBank Flat File Release 209.0>를 의미한다.
의혹을 피하기 위해, 야생형 인간 eRF1 폴리펩티드 서열은 하기의 것으로 간주된다:
특히, 본 출원에서 제공되는 아미노산 주소는 상기 eRF1 기준 서열의 번호매김에 상응한다. 말단절단 또는 확장 형태의 eRF1이 사용되는 경우 (예를 들어, 6his 태그가 부가되거나 또는 폴리펩티드의 일부 구획이 결실되는 경우), 아미노산 번호매김은 '절대적'이거나 엄격하게 융통성이 없는 숫자 주소로서가 아니라 전장 기준 서열의 등가의 구획에 상응하는 것으로 처리되어야 한다. 설명으로서, E55의 치환이 명세서에 언급되면, 이는 상기 eRF1 기준 서열의 아미노산 55를 의미한다. 또 다른 종의 위치 55이 야생형에서 E가 아니면, 예를 들어, 관련 기술 분야에 널리 공지된 바와 같이, 상기 다른 종의 eRF1의 서열을 상기 기준 서열과 정렬하고 상응하는 아미노산을 선택함으로써, 인간 야생형 서열의 E55에 상응하는 아미노산이 확인된다. 유사하게, 사용되는 폴리펩티드가 처음 10개의 아미노산의 결실에 의해 말단절단되는 경우, 제공되는 주소는 여전히 (예를 들어 E45가 아니라) E55일 것이다 - 관련 기술 분야에서 통상적인 바와 같이, 숙련된 독자는 이를 쉽게 이해하여, 상기 전장 eRF1 서열을 참조로 상응하는 맥락의 아미노산을 지칭할 것이다.
본 발명가들은 eRF1의 N-말단 도메인을 제거하는 다른 말단절단이 유사한 효과를 가질 것임을 교시한다. eRF1의 N-말단 도메인 (대략적으로 아미노산 1-130)은 메신저 RNA 및 정지 코돈과 상호작용한다. 이러한 도메인의 전체 또는 일부가 결실되면, 사용 시 이는 비활성 eRF1-eRF3 복합체 (델타 100 변이체로 예시됨)를 형성하고, 정지 코돈 번역초과 (및 독성)를 증가시킬 것이다. 적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 131부터 그 이후에 상응하는 아미노산 서열을 포함하고, 적절하게는 적어도 서열식별번호: 4의 아미노산 101부터 그 이후에 상응하는 아미노산 서열을 포함한다.
적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 101부터 끝부분까지에 상응하는 아미노산 서열을 포함한다.
적절하게는, 본 발명에서 사용되는 eRF1은 적어도 서열식별번호: 4의 아미노산 131부터 끝부분까지에 상응하는 아미노산 서열을 포함한다.
적절하게는 eRF1의 C-말단 끝부분은 서열식별번호: 4에 비해 말단절단되지 않거나 또는 최소한으로만 말단절단된다. 가장 적절하게는, eRF1의 C-말단 끝부분은 서열식별번호: 4에 비해 말단절단되지 않는다.
요구되는 임의의 정렬은 육안으로, 또는 관련 기술 분야에 공지된 광범위하게 입수가능한 서열 정렬 프로그램 중 임의의 것, 예컨대 GCG 스위트 프로그램 (GCG 제네틱스 컴퓨터 그룹(Genetics Computer Group) (위스컨신주 53711 매디슨 사이언스 드라이브 575 유니버시티 리서치 파크))을 사용하여 수행되어야 한다. 가장 적절하게는, 정렬은 ClustalW를 디폴트 설정으로 사용한다.
유리하게는, 다른 정지 코돈의 번역초과를 실질적으로 증가시키지 않으면서 하나 이상의 정지 코돈에 반응하여 비-천연 아미노산 혼입의 실질적인 증가를 제공하도록 본 개시내용에 따라 eRF1의 특정 돌연변이체가 사용될 수 있다. 따라서, 본원에 기술된 바와 같은 핵산 구축물을 세포에서 특정 eRF1 돌연변이체와 함께 발현시키는 것이 유리할 수 있다. 다양한 프로모터, 예컨대 EF1 프로모터 또는 CMV 프로모터를 사용하여 eRF1을 발현시킬 수 있다.
가장 적절하게는, 본 발명의 eRF1 돌연변이체는 증가된 효율의 비-천연 아미노산 혼입을 제공한다.
적절하게는, 본 발명의 eRF1 돌연변이체는 천연 번역 제어에 비해 비-천연 아미노산 혼입 효율을 증가시킨다.
적절하게는, 본 발명의 eRF1 돌연변이체는 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공한다.
이는 본원에 교시된 바와 같이, 예를 들어, 실시예 섹션을 참조로 쉽게 결정될 수 있다.
특정 실시양태에서, 돌연변이체 eRF1은 숙주 세포 내로 통합되고, 적절하게는 숙주 세포 내로 안정적으로 통합된다.
특정 실시양태에서, 돌연변이체 eRF1은 본원에 기술된 핵산 구축물 중 하나 이상으로부터 숙주 세포에서 발현된다.
특정 실시양태에서, 돌연변이체 eRF1을 코딩하는 핵산 서열은 별개의 구축물 또는 별개의 벡터 상에 있다.
TB3-1로 또한 알려진 진핵생물 번역 종결 인자 1 (eRF1)은 인간에서 ETF1 유전자에 의해 코딩되는 단백질이다. 진핵생물에서, 이는 3개 모두의 정지 코돈을 인식하는 유일한 방출 인자이다. 리보솜의 아미노아실 부위에 인-프레임(in-frame) 정지 코돈이 존재하는 것에 의해 단백질 생합성의 종결 및 신생 폴리펩티드 쇄의 방출이 신호된다. 번역 종결 프로세스는 보편적이고, 단백질 방출 인자 (RF) 및 GTP에 의해 매개된다.
예시적인 eRF1 유전자 서열은 진뱅크 등록 번호 AF095901.1에 기술된 바와 같은 야생형 호모 사피엔스 eRF1 유전자 서열이다. 적절하게는, eRF1 유전자는, 예를 들어, 드로소필라 멜라노가스터에 대해, 코돈-최적화될 수 있다.
또한 포유동물 세포에서 shRNA를 사용하여 eRF1 발현을 녹다운시키는 것이 억제의 일시적인 증가를 제공한 후에 해로울 수 있다. 높은 수준의 정지 코돈 번역초과가 또한 발생할 수 있다. 명확하게, 이러한 해로운 효과들을 피해야 하고, 적절하게는 본 개시내용에서 shRNA가 사용되지 않아야 한다.
본 발명에서 유용한 eRF1 돌연변이체가 하기 표에서 개시된다:
* 어떤 eRF1 돌연변이체를 사용할지 선택할 때, 통상의 기술자는 세포 생육성과 증가된 억제 사이의 상호관계를 고려할 것이다. 예를 들어, Δ100 eRF1 돌연변이체는 높은 수준의 정지 코돈 번역초과 및 병든 세포를 초래할 수 있다. 따라서, 적절하게는 본 개시내용에서 Δ100 eRF1 돌연변이체가 사용되지 않는다.
** 혼입 신호로서의 UAG용으로 유용하지 않지만, UGA용 용도가 있을 수 있다.
때때로, 돌연변이되지 않은 부위(들), 예컨대 "L124L"이 언급된다. 명확하게, 이는 야생형 'L'이 바뀌지 않기 때문에 돌연변이가 아니다. 이는 L124가 이러한 특정 eFR1에서 돌연변이되지 않는다, 즉, 위치 L124가 이러한 특정한 돌연변이 조합/이러한 특정한 예시적인 eRF1에서 야생형으로 (L로) 남는다는 것을 나타내는 것으로 이해되어야 한다.
소정의 위치에서의 각각의 돌연변이에 대해, 유사한 효과를 제공할 다수의 밀접하게 관련된 아미노산들이 있는 것으로 여겨진다. '예시적인 돌연변이체'는 철저한 것으로 의도되지 않는다. 상기 칼럼 I에서 확인되는 잔기에 대한 '야생형이외의 것'에 대한 돌연변이가 또한 구상된다. 더욱 적절하게는, 예를 들어 하기 표에 따라, 칼럼 II에서 언급된 잔기에 보존적 치환이 이루어질 수 있다. 하기 표의 두번째 칼럼 내의 동일한 블럭, 바람직하게는 세번째 칼럼의 동일한 줄 내의 아미노산이 서로 치환될 수 있다:
예를 들어, 칼럼 I의 E55가 'E 이외의 것'으로 돌연변이될 수 있다. 더욱 적절하게는, E55가 칼럼 II 내의 특정 돌연변이에 대해 보존적인 아미노산, 예컨대 E55D 또는 E55A 또는 E55G 또는 E55P로 돌연변이될 수 있다. 가장 적절하게는, E55가 칼럼 II에서 구체적으로 언급된 아미노산, 예컨대 E55A 또는 E55D, 가장 적절하게는 E55D로 돌연변이될 수 있다. 이는 칼럼 I에 열거된 다른 잔기들에 동일하게 적용된다.
모든 S123, L124, Y125 돌연변이체가 DLR 검정법에서 E55D에 비교하여 잘 작동하지만 (E55D보다 1-2×더 양호함), 단백질 발현 테스트에서는 E55D보다 덜 작동한다. 본 발명에서 이들이 여전히 유용하지만, 가장 바람직한 돌연변이체는 E55D이다. (sfGFP(3TAG).
일부 돌연변이가 조합되어 존재하지만, 이러한 조합은 본 발명의 특히 바람직한 예이다. 개별적인 eRF1 돌연변이체들의 사용이 개시된다; 적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해 E55, N129, K130, T122, S123, Y125, T58, S60, S64, L125, S123, L124, M51, 및 K130으로 이루어진 군으로부터 선택된 돌연변이를 포함한다. 적절하게는, 상기 돌연변이체 eRF1은 서열식별번호: 4에 비해 E55D, N129P, K130Q, T122Q, S123F, E55A, Y125F, T58K, S60T, S64D, L125F, N129S, S123A, L124I, Y125L, S123R, L124W, Y125R, S123H, L124A, Y125G, M51A, K130M, Y125V, S123L, L124C, Y125S, S123L, L124S, Y125S, S123V, L124T, 및 Y125P로 이루어진 군으로부터 선택된 돌연변이를 포함한다.
eRF1은 일시적인 발현에 의해 또는 게놈 통합에 의해 숙주 세포 내에 제공될 수 있다. 예를 들어, TRex Flip-In 시스템 (인간 HEK293-유래)을 사용하여 안정적인 유전적 배경에서 eRF1 돌연변이체가 유도적으로 발현되게 한다. 한 실시양태에서, 관련 핵산은 일시적인 형질감염에 의해 도입된다. 한 실시양태에서, 관련 핵산은 안정적인 세포주 생성에 의해 도입된다.
M51A/K130M, T122Q/S123F, S70A/G73S, E55D, E55A, N129P/K130Q 및 Y125F를 포함하여 다양한 특히 적절한 돌연변이체 및 조합이 본원에서 기술된다. 적절하게는, 본 개시내용에서 사용되는 eRF1 돌연변이체는 E55에 돌연변이를 포함한다. 적절하게는, 본 개시내용에서 사용되는 eRF1 돌연변이체는 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택된다. 이러한 돌연변이들은 진뱅크 등록 번호 AF095901.1로부터 유래되는 야생형 호모 사피엔스 eRF1 아미노산 서열 또는 이의 코돈-최적화 변이체에 관하여 이루어진다.
eRF1 단백질은 대부분의 진핵생물에 걸쳐 매우 강한 상동성을 나타낸다. 본 발명가들의 돌연변이를 도입하기 위한 예로서 본 발명가들은 인간 eRF1을 사용하였지만, 다른 종으로부터의 eRF1 또한 동일한 돌연변이 (예를 들어 인간 또는 곤충 eRF1 단백질 내의 E55D)를 보유할 수 있다. 본 발명가들은 이러한 대안적인 종 돌연변이체 eRF1 단백질이 본원에서의 예시적인 eRF에 대해 제시된 바와 유사한 기술적 효과를 지닐 것임을 교시한다.
본 발명가들은 바람직한 eRF1 돌연변이체 (조작된 인간 (에이치. 사피엔스) eRF1 변이체)를 사용하여, CHO 세포 (씨. 그리세우스(C. griseus)), HEK 세포 (에이치. 사피엔스) 및 Dmel 세포 (디. 멜라노가스터)를 포함하는 다양한 진핵생물 숙주 세포에서 성공적으로 비-천연 아미노산 혼입을 강화하였다. 이러한 생물들 내의 eRF1 단백질은 고도로 보존된다 (표 1).
표 1: 다양한 종에서의 eRF1의 쌍-방식 유사성. 제공된 백분율은 ClustalW 정렬에 의해 결정된 바와 같은, 단백질에 걸쳐 보존된 아미노산 동일성을 가리킨다.
다양한 단세포 (효모) 및 다세포 (포유동물, 곤충) 진핵생물 사이의 보존 수준을 고려하여, 다양한 진핵생물 종으로부터의 eRF1 변이체가 여러 다른 진핵생물 종 숙주 세포에서 기능성일 것이라는 것이 지지된다. 예를 들어, 숙주 세포는 인간, 마우스, 씨. 엘레강스, 당나귀, 효모 또는 기타 진핵생물 숙주 세포일 수 있다.
적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 67%인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 84%인 아미노산 서열을 갖거나; 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 92%인 아미노산 서열을 갖거나, 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 95%인 아미노산 서열을 갖거나, 적절하게는, 돌연변이체 eRF1은 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 98%인 아미노산 서열을 갖거나, 또는 이를 초과한다.
한 실시양태에서, 적절하게는, 돌연변이체 eFR1에 대해 언급된 구체적인 돌연변이가 도입되기 전에 백분율 동일성 수준이 계산된다. 바람직하게는, 돌연변이체 eFR1에 대해 언급된 구체적인 돌연변이를 포함하여 백분율 동일성 수준이 계산된다.
적절하게는, 숙주 세포는 시험관 내의 것이다. 숙주 세포가 생물 내에 있는 경우, 적절하게는 숙주는 비-인간이다.
본 발명가들은 예시적인 인간 eRF1을 3가지 진핵생물 종 (인간, 햄스터, 파리)로부터의 세포주, 뿐만 아니라 살아 있는 진핵생물 동물 (파리) 내로 도입하였다.
조작된 인간 eRF1은 천연 eRF1이 84%만 보존되는 종 (Dmel 곤충 세포)에서 비-천연 아미노산 혼입을 강화한다.
본 발명가들은 구축물을 사용하여 천연 효모 eRF1을 본 발명가들의 예시적인 인간 eRF1 변이체 (문헌 [Nucleic Acids Res. 2010 Sep;38(16):5479-92]로부터 유래된 플라스미드)로 교체하였다. 이는 다양한 eRF1 단백질이 67%만의 보존 (서열 동일성)으로 사용될 수 있고 광범위한 진핵생물을 포괄한다는 것을 나타낸다.
당연히, eRF1 (또는 변이체)에 대한 핵산 서열은 중요하지 않다 - 한 예시적인 인간 eRF1 변이체가 곤충 세포에서 잘 발현되도록 코돈-최적화되었지만, 인간 세포주에서 또한 작동한다. 따라서, 핵산의 코돈 최적화 (원하는 경우)는 통상의 기술자의 일이다.
앰버 억제가 증가된다는 것이 본 발명의 장점이다. 적절하게는, 본원에 기술된 eRF1 돌연변이체가 앰버 억제에서 사용된다.
추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포, 예컨대 포유동물 세포 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) tRNA 신테타제 및 tRNA 쌍, 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계; ii) 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도가 또한 개시된다.
관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법이 또한 개시된다. 이러한 방법은 (i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 본원에 기술된 바와 같은 진핵생물 세포인 단계; (ii) 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 세포를 eRF1의 돌연변이체의 존재 및 부재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 (iii) eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계를 포함한다.
하나 이상의 돌연변이를 eRF1 내로 혼입시키는 방법은 관련 기술 분야에 널리 공지된 부위-지정 돌연변이유발 등을 포함한다. 적절하게는, 선택되는 돌연변이는 참고문헌 25-30에 기술된 바와 같이 앰버 코돈에서의 종결에 대한 효과가 있는 eRF1 내의 아미노산에서의 돌연변이를 기초로 할 수 있다. 적절하게는, 선택되는 돌연변이는 리보솜 내에서 mRNA 상의 정지 코돈과 상호작용하는 eRF1의 N-말단 도메인에 위치할 수 있다 (도 2a 참조). 바람직하게는, eRF1 돌연변이체는 다른 정지 코돈의 번역초과를 증가시키지 않으면서 선택된 코돈, 예컨대 TAG에 반응하여 효율적인 비-천연 아미노산 혼입을 초래한다.
한 실시양태에서, 본 개시내용에서 방출 인자 돌연변이체, 예컨대 eRF1가 사용되지 않는다.
한 실시양태에서, 숙주 세포로부터 내인성 방출 인자, 예컨대 eRF1의 발현이 감소되거나 결실된다. 이는, 예를 들어, eRF1을 코딩하는 게놈 유전자좌 중 하나 이상의 파괴에 의해, 또는 eRF1의 RNA-매개 유전자 침묵화를 통해 달성될 수 있다.
비-천연 아미노산(들)을 포함하는 단백질의 제조
관심 핵산 서열 내에 존재하는 하나 이상의 특정한 코돈이 비-천연 아미노산을 코딩하도록 할당되어 비-천연 아미노산이 직교 tRNA 신테타제/tRNA 쌍을 사용하여 관심 단백질 내로 유전적으로 혼입될 수 있는, 직교이거나 확장된 유전자 코드가 본 개시내용에서 사용될 수 있다. 직교 tRNA 신테타제/tRNA 쌍은 tRNA에 비-천연 아미노산을 장전시킬 수 있고, 코돈에 반응하여 이러한 비-천연 아미노산을 폴리펩티드 쇄 내로 혼입시킬 수 있다.
코돈은 앰버, 오커, 오팔 코돈, 또는 4중 코돈일 수 있다. 간단하게 코돈은 비-천연 아미노산을 운반하도록 사용될 직교 tRNA에 상응하여야 한다. 적절하게는, 코돈은 앰버이다. 적절하게는, 코돈은 직교 코돈이다.
비-천연 아미노산 혼입은 대체로 앰버 UAG 코돈 상에서 수행된다. 적절하게는, 코돈은 UAG 또는 UGA이고, 가장 적절하게는 UAG (앰버)이다. 예시적인 돌연변이는 앰버 (UAG) 정지 코돈 상에서의 방출 인자의 활성을 최소화한다 (예를 들어 E55D). 기술된 다른 돌연변이들은 앰버 정지 코돈의 인식에 영향을 미치지 않을 수 있지만, UGA 또는 UAA 정지 코돈 (오팔/오커) 상에서의 종결 활성을 감소시킬 수 있다. 이는 S70A, G73S에 의해 예시된다. UAG (앰버) 이외의 코돈을 사용할 때 통상의 기술자는 이들의 요구에 맞도록 eRF1 돌연변이체를 선택할 것이다.
본원에 제시된 구체적인 예가 앰버 코돈 및 상응하는 tRNA/tRNA 신테타제를 사용하였음을 주지하여야 한다. 상기 언급된 바와 같이, 이들은 다양할 수 있다. 대안적으로, 비-천연 아미노산과 함께 작동할 수 있는 대안적인 tRNA/tRNA 신테타제 쌍을 사용하거나 선택하는 수고 없이 다른 코돈을 사용하기 위해, 간단하게 tRNA의 안티코돈 영역을 선택된 코돈에 대한 원하는 안티코돈 영역으로 교환할 수 있다. 안티코돈 영역은 tRNA의 장전 또는 혼입 기능 또는 tRNA 신테타제에 의한 인식에 수반되지 않아서, 이같은 교환은 전적으로 통상의 기술자의 영역에 속한다.
따라서, 원한다면 대안적인 직교 tRNA 신테타제/tRNA 쌍을 사용할 수 있다.
숙주 세포를 사용하여, 하나 이상의 비-천연 아미노산을 포함하는 단백질을 생산할 수 있다 (예를 들어, 발현시킬 수 있다).
본원에 개시된 구축물 또는 벡터가 도입되는 숙주 세포를 tRNA, tRNA 신테타제 및 관심 단백질이 생산되도록 적절한 배지에서 배양하거나 유지시킨다. 배지는 관심 단백질에 비-천연 아미노산(들)이 혼입되도록 비-천연 아미노산(들)을 또한 포함한다. 이같은 단백질은 코딩 서열 내에 본원에 기술된 바와 같은 코돈을 하나 이상 포함하는 핵산에 의해 코딩된다. 이러한 코돈에 반응하여, 직교 tRNA 신테타제/tRNA 쌍이 tRNA에 비-천연 아미노산을 장전시키고, 비-천연 아미노산을 폴리펩티드 쇄 내로 혼입시킨다.
추가 측면에서, 하기 단계를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법이 제공된다: i) 본원에 기술된 구축물(들) 또는 벡터(들)를 포함하는 진핵생물 세포를 제공하는 단계; ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 하나 이상의 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및 iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
tRNA 및 tRNA 신테타제를 포함하고, 하나 이상의 인-프레임 직교 (정지) 코돈이 있는 관심 핵산 서열을 포함하는 본원에 기술된 핵산 구축물들을 숙주 세포 내로 도입함으로써, 비-천연 아미노산(들)을 포함하는 단백질이 제조된다. 숙주 세포를 비-천연 아미노산(들)을 포함하는 생리 용액에 노출시킨 후, 숙주 세포를 관심 단백질의 코딩 서열의 발현을 허용하는 조건 하에 유지시킨다. 이러한 코돈에 반응하여 비-천연 아미노산(들)이 폴리펩티드 쇄 내로 혼입된다.
유리하게는, 1개를 초과하는 비-천연 아미노산이 관심 단백질 내로 혼입된다. 대안적으로, 2개 이상의 비-천연 아미노산이 단백질 내의 2개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 3개의 비-천연 아미노산이 단백질 내의 3개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 4개의 비-천연 아미노산이 단백질 내의 4개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 5개의 비-천연 아미노산이 단백질 내의 5개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 6개의 비-천연 아미노산이 단백질 내의 6개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 7개의 비-천연 아미노산이 단백질 내의 7개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다. 적절하게는, 적어도 8개의 비-천연 아미노산이 단백질 내의 8개 이상의 부위에서 관심 단백질 내로 혼입될 수 있다.
다중 비-천연 아미노산이 관심 단백질 내로 혼입될 경우, tRNA 신테타제/tRNA 쌍이 코돈(들)에 반응하여 비-천연 아미노산의 혼입을 지시할 수 있도록 다중 코돈이 원하는 위치에서 코딩 핵산 서열 내로 혼입될 필요가 있을 것임이 이해될 것이다. 적어도 1, 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 코돈 코딩 핵산이 관심 핵산 서열 내로 혼입될 수 있다.
1가지를 초과하는 유형의 비-천연 아미노산을 관심 단백질 내로 단일 단백질 내로 혼입시키는 것을 원하는 경우, 제2 또는 추가 직교 tRNA-tRNA 신테타제 쌍이 제2 또는 추가 비-천연 아미노산을 혼입시키는데 사용될 수 있다; 적절하게는, 단일 제작 단계에서 2가지 이상의 비-천연 아미노산이 단백질 내의 상이한 규정된 부위 내로 특이적으로 혼입될 수 있도록 상기 제2 또는 추가 직교 tRNA-tRNA 신테타제 쌍은 관심 단백질을 코딩하는 핵산 내의 상이한 코돈을 인식한다. 따라서, 특정 실시양태에서, 2가지 이상의 직교 tRNA-tRNA 신테타제 쌍이 사용될 수 있다.
비-천연 아미노산(들)이 혼입된 관심 단백질이 숙주 세포에서 생산되었으면, 효소, 화학적 및/또는 삼투압 용해 및 물리적 파괴를 포함하는 관련 기술 분야에 공지된 다양한 기술에 의해 이를 세포로부터 추출할 수 있다. 관련 기술 분야의 표준 기술 예컨대 분취용 크로마토그래피, 친화력 정제 또는 임의의 기타 적절한 기술에 의해 관심 단백질을 정제할 수 있다.
비-천연 아미노산
본원에서 사용된 바와 같이, 용어 "비-천연 아미노산"은 단백질에서 천연적으로 발생하는 20개의 아미노산 이외의 아미노산을 지칭한다.
비-천연 아미노산의 비제한적인 예는 하기를 포함한다: p-아세틸-L-페닐알라닌, p-아이오도-L-페닐알라닌, O-메틸-L-티로신, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-Dopa, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비-천연 유사체; 글루타민 아미노산의 비-천연 유사체; 페닐알라닌 아미노산의 비-천연 유사체; 세린 아미노산의 비-천연 유사체; 트레오닌 아미노산의 비-천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로고리형, 에논, 이민, 알데히드, 히드록실아민, 케토, 또는 아미노로 치환된 아미노산, 또는 이들의 조합물; 광-활성화성 가교제가 있는 아미노산; 스핀-표지 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 광-케이징(photocaged) 및/또는 광-이성질화성 아미노산; 비오틴 또는 비오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중원자로 치환된 아미노산; 화학적으로 절단성이거나 광-절단성인 아미노산; 측쇄가 신장된 아미노산; 독성 기를 함유하는 아미노산; 당으로 치환된 아미노산; 탄소-연결 당을 함유하는 아미노산; 산화환원-활성 아미노산; α-히드록시를 함유하는 산; 아미노 티오 산; α, α 2치환 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 고리형 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산.
본원에 기술된 바와 같이 단백질 내로 선택된 하나 이상의 비-천연 아미노산(들)을 혼입시키기 위해, 통상의 기술자는 코돈을 인식하는 직교 tRNA를 장전시킬 수 있는 올바른 신테타제를 간단하게 선택할 수 있다.
상이한 비-천연 아미노산들의 혼입의 구체적인 예가 본원에서 제공된다.
실시예 2에서, (N ε-[(tert-부톡시)카르보닐]-l-리신) 및 (N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신의 혼입이 실연된다. 이러한 화합물들의 구조가 차트 1b에서 제시된다. 이러한 기질 양쪽 모두 PylRS/tRNACUA 쌍에 대한 공지된 효율적인 기질이다 (문헌 [Nat Biotechnol 2014, 32, 465] 및 [J Am Chem Soc 2009, 131, 8720]).
실시예 9에서, Boc-K (N ε-[(tert-부톡시)카르보닐]-l-리신), 노르보넨-K (N ε-노르보르넨-2-일옥시카르보닐-L-리신), 시클로프로펜-K (N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) 및 비시클로닌-K (N ε-([(1R,8S)-비시클로[6.1.0]논-4-인-9-일메톡시]카르보닐)-리신)의 혼입이 제시된다.
WO2010/139948은 직교 tRNA-tRNA 신테타제 쌍을 사용하여 관심 단백질 내로 알킨-아지드 결합을 지지할 수 있는 지방족 또는 직쇄 탄소 백본 아미노산을 혼입시키는 것을 기술한다.
WO2013/10844는 직교 tRNA-tRNA 신테타제 쌍을 사용하여 노르보르넨 아미노산을 관심 단백질 내로 혼입시키는 것을 기술한다.
항체
적절하게는, 관심 핵산 서열은 항체 또는 항체 단편을 코딩한다. 하나 이상의 비-천연 아미노산, 적절하게는 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 비-천연 아미노산이 항체 또는 항체 단편 내로 혼입될 수 있다.
본원에서 사용된 바와 같이, 용어 "항체"는 상응하는 항원에 비-공유결합으로, 가역적으로, 그리고 특이적 방식으로 결합할 수 있는 면역글로불린 패밀리의 단백질을 지칭한다. 이러한 용어는 모노클로날 항체, 인간 항체, 인간화 항체, 낙타류 항체, 키메라 항체, 및 항-이디오타입 (항-Id) 항체를 포함하지만, 이에 제한되지 않는다. 항체는 임의의 아이소타입/클래스일 수 있고, 따라서 IgG, IgE, IgM, IgD, IgA 및 IgY, 또는 항체의 서브클래스, 예컨대 IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2를 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "항체 단편"은 항원의 에피토프와 (예를 들어, 결합, 입체 장애, 안정화/탈안정화, 공간 분포에 의해) 특이적으로 상호작용하는 능력을 유지하는 항체의 하나 이상의 부분을 지칭한다. 결합 단편의 예는 단일쇄 Fv (scFv), 디술피드로 연결된 Fv (sdFv), Fab 단편, F(ab') 단편 (VL, VH, CL 및 CH1 도메인으로 이루어진 1가 단편), F(ab)2 단편 (힌지 영역에서 디술피드 다리로 연결된 2개의 Fab 단편을 포함하는 2가 단편), VH 및 CH1 도메인으로 이루어진 Fd 단편, 항체의 한쪽 팔의 VL 및 VH 도메인으로 이루어진 Fv 단편, VH 도메인으로 이루어진 dAb 단편, 및 단리된 상보성 결정 영역 (CDR), 또는 항체의 기타 에피토프-결합 단편을 포함하지만, 이에 제한되지 않는다. 추가로, Fv 단편의 2개의 도메인인 VL 및 VH가 별개의 유전자에 의해 코딩되지만, 재조합 방법을 사용하여, 이들이 단일 단백질 쇄로서 만들어지게 할 수 있는 합성 링커에 의해 이들이 연결될 수 있고, 이러한 단일 단백질 쇄에서 VL 및 VH 영역은 쌍을 이루어 1가 분자 (단일쇄 Fv ("scFv")로 알려짐)를 형성한다. 이같은 단일쇄 항체가 용어 "항원 결합 단편" 내에 포함된다. 관련 기술 분야의 통상의 기술자에게 공지된 통상적인 기술을 사용하여 이러한 항원 결합 단편들이 수득되고, 단편들을 무손상 항체와 동일한 방식으로 활성에 대해 스크리닝할 수 있다.
항체는 단일특이적, 이중특이적, 또는 다중특이적일 수 있다. 다중특이적 항체는 1개의 표적 단백질의 상이한 에피토프들에 대해 특이적일 수 있거나, 또는 1개를 초과하는 표적 단백질에 대해 특이적인 항원-결합 도메인들을 함유할 수 있다. 항체는 또 다른 기능성 분자, 예컨대 또 다른 펩티드 또는 단백질에 연결될 수 있거나 또는 이와 공동-발현될 수 있다. 예를 들어, 항체 또는 이의 단편이 하나 이상의 다른 분자 물질, 예컨대 또 다른 항체 또는 항체 단편에 기능적으로 연결되어, 제2의 결합 특이성이 있는 이중특이적 또는 다중특이적 항체가 생산될 수 있다. 예를 들어, 화학적 커플링, 유전자 융합, 또는 비-공유결합 회합을 사용하여 기능적 연결이 달성될 수 있다.
다른 예시적인 이중특이적 형식은 scFv-기반 또는 디아바디(diabody) 이중특이적 형식, IgG-scFv 융합물, 이중 가변 도메인 (DVD)-Ig, 쿼드로마(Quadroma), 놉-홀(knobs-into-holes), 통상적인 경쇄 (예를 들어, 통상적인 경쇄 + 놉-홉 등), 크로스맙(CrossMab), 크로스팝(CrossFab), (시드)바디((SEED)body), 류신 지퍼, 듀오바디(Duobody), IgG1/IgG2 및 이중 작용 Fab (DAF)-IgG 이중특이적 형식 (예를 들어, 문헌 [mAbs (2012) 4:6, 1-11] 참조)를 포함한다.
적절하게는, 사용되는 항체는 인간 항체이다. 용어 "인간 항체"는 프레임워크 및 CDR 영역 양쪽 모두가 인간 기원의 서열로부터 유래되는 가변 영역을 갖는 항체를 포함한다. 추가로, 항체가 불변 영역을 함유하면, 불변 영역 또한 이같은 인간 서열, 예를 들어, 인간 생식계열 서열, 또는 돌연변이된 버전의 인간 생식계열 서열, 또는 인간 프레임워크 서열 분석으로부터 유래된 컨센서스 프레임워크 서열을 함유하는 항체로부터 유래된다. 인간 항체는 인간 서열이 코딩하지 않는 아미노산 잔기 (예를 들어, 시험관 내에서의 무작위 또는 부위-특이적 돌연변이유발에 의해 또는 생체 내에서의 체세포 돌연변이에 의해 도입된 돌연변이, 또는 안정성 또는 제작을 촉진하기 위한 보존적 치환)을 포함할 수 있다.
항체 약물 접합체
하나 이상의 비-천연 아미노산이 혼입되어 있는 항체 또는 항체 단편이 항체 약물 접합체 (ADC)를 제조하는데 사용될 수 있다.
ADC는 약물 모이어티에 접합된 항체(들) 또는 항체 단편(들)을 포함한다. 약물 모이어티는 ADC가 존재하는 세포에 원하는 영향을 미치는 임의의 약물 모이어티일 수 있다. 예를 들어, 이는 항암제, 항-혈액 장애 작용제, 항-자가면역 치료제, 항염증제, 항진균제, 항균제, 항기생충제, 항바이러스제, 또는 마취제, 또는 방사성 동위원소 등일 수 있다.
필요하다면 하나 이상의 동일하거나 상이한 약물 모이어티에 항체 또는 항체 단편이 접합될 수 있다. 소정의 생물학적 반응을 변형시키는 약물 모이어티에 항체 또는 항체 단편이 접합될 수 있다. 따라서, 예를 들어, 약물 모이어티는 원하는 생물학적 활성을 지니는 단백질, 펩티드, 또는 폴리펩티드일 수 있다. 이같은 단백질은, 예를 들어, 독소, 세포독소, 단백질, 예컨대 종양 괴사 인자, 시토카인, 아포프토시스 작용제, 항-혈관형성제, 또는 생물학적 반응 변형제, 예컨대 림포카인을 포함할 수 있다.
약물 모이어티를 항체 또는 항체 단편에 접합시키는 다양한 방법이 관련 기술 분야에 널리 공지되어 있다. 예를 들어, 항체에 대한 부위-특이적 약물 접합을 위한 현행 방법이 검토되어 있는 문헌 [MAbs (2014) 6(1): 46-53]을 참조할 수 있다. 단백질의 화학적 변형을 위한 다양한 기술이 또한 관련 기술 분야에 공지되어 있다 (예를 들어, 문헌 [Nat Chem Biol. (2011) 7, 876-84]; [Bioconjugate Techniques, Elsevier (2008)] 및 [Chem Biol. (2010) 17, 213-27]을 참조한다).
링커를 통해 약물 모이어티가 항체 또는 항체 단편에 연결될 수 있다. 본원에서 사용된 바와 같이, "링커"는 항체 또는 항체 단편을 약물 모이어티에 연결할 수 있는 임의의 화학적 모이어티를 지칭한다. 링커는 절단, 예컨대 산-유도 절단, 광-유도 절단, 펩티다제-유도 절단, 에스테라제-유도 절단, 및 디술피드 결합 절단에 감수성일 수 있다 (절단성 링커). 대안적으로, 링커는 절단에 대해 실질적으로 저항성일 수 있다 (예를 들어, 안정적 링커 또는 비-절단성 링커).
관련 기술분야에 공지된 다양한 검정법으로 ADC를 이의 물리적/화학적 성질 및/또는 생물학적 활성에 대해 특성화하고 선택할 수 있다. 예를 들어, 공지된 방법, 예컨대 ELISA, FACS, 비아코어(Biacore) 또는 웨스턴 블롯에 의해 항체를 이의 항원 결합 활성에 대해 테스트할 수 있다. 트랜스제닉 동물 및 세포주가 예방적 또는 치료적 처치로서의 잠재력이 있는 ADC를 스크리닝하는데 특히 유용하다. 유용한 ADC를 스크리닝하는 것은 후보 ADC를 다양한 용량에 걸쳐 트랜스제닉 동물에게 투여하고, 평가되는 질환 또는 장애에 대한 ADC의 효과(들)에 대해 다양한 시점에 검정하는 것을 수반할 수 있다. 대안적으로, 또는 추가적으로, 적용가능한 경우, 질환 유도체에 대한 노출 이전에 또는 이와 동시에 약물을 투여할 수 있다. 후보 ADC를 연속적으로 및 개별적으로, 또는 병행적으로 중등도 또는 고도-처리량(throughput) 스크리닝 형식 하에 스크리닝할 수 있다.
따라서, 추가 측면에서, 하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법이 제공된다: i) 본원에 기술된 진핵생물 세포를 제공하는 단계이며, 여기서 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 것인 단계; ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및 vi) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계. 비-천연 아미노산과 약물 모이어티 사이의 링커가 사용될 수 있다.
한 실시양태에서, 하나 이상 (예를 들어, 2, 3, 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수)의 비-천연 아미노산을 포함하는 항체 또는 항체 단편이 비-천연 아미노산과 약물 모이어티 사이의 연결을 통해 약물 모이어티에 접합된다. 전통적으로, 약물 모이어티는 항체 또는 항체 단편 내의 시스테인 또는 리신 잔기에 비-선택적으로 접합된다. 그러나, 이러한 전략은 종종 비균질한 생성물에 이르고, 이는 ADC의 생물학적, 물리적 및 약리학적 성질의 최적화를 힘들게 한다. 접합 부위 및 화학양론을 정확하게 제어하면서 균질한 ADC를 합성하도록 비-천연 아미노산을 접합점으로 사용하는 것은 개선된 약동학 및 개선된 효능을 포함할 수 있는 다수의 장점을 제공한다. 따라서 부위-특이적 접합 방법이 고도로 바람직하다.
지금까지, 많은 ADC가 항체 당 평균 4개의 약물을 표적화하였다. 이러한 비가 세포독성 및 약동학적 안정성의 최적의 조합으로서 선택되었다 (문헌 [Acc. Chem. Res (2008) 41(1) 98-107] 및 [Clin. Cancer. Res (2004) 10(20):7063-7070] 참조). 따라서, 특정 실시양태는 비-천연 아미노산과 약물 모이어티 사이의 연결을 통해 약물 모이어티에 접합될 수 있거나 또는 접합되는 약 4개의 비-천연 아미노산을 포함하는 항체 또는 항체 단편에 관한 것이다.
한 예시적인 실시양태에서, 항체는 항-HER2/neu IgG1 인간화 항체 또는 이의 변이체 또는 유도체, 예컨대 트라스투주맙(Trastuzumab)이다.
하나 이상의 소형 분자의 접합을 위한 상이한 비-천연 발생 아미노산들 (예를 들어, N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신)이 혼입될 것이다. 이러한 분자는 테트라진 화학을 사용하여 비-천연 아미노산(들)을 함유하는 mAb와 접합될 수 있다. 이러한 분자는 면역 반응을 유도하는 화학적 모이어티 또는 세포독성 분자를 포함할 수 있다.
유리하게는, N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신)이 앰버 코돈에서 매우 높은 혼입율 (그리고, 이에 따라 더 높은 단백질 발현)을 나타낼 것이다. 공공 도메인에서 단백질 접합에 사용되는 다수의 UAA와 비교하여, 시클로프로펜은 더 긴 측쇄 및 용매에 더 많이 노출되는 접합 핸들을 갖는다. 이러한 긴 측쇄는, 앰버-코돈의 높은 혼입율과 조합되어, mAb 스캐폴드 내의 더 많은 부위에서의 UAA의 혼입을 허용할 것이다. 이러한 유연성은 상이한 항체-약물 접합체들에 대해 맞춤제작하는데 중요할 수 있다.
키트
하나 이상의 비-천연 아미노산을 포함하는 관심 단백질을 생산하기 위한 키트가 또한 제공된다.
한 측면에서, (i) 본원에 기술된 핵산 구축물; 또는 (ii) 본원에 기술된 핵산 구축물 조합물; 또는 (iii) 본원에 기술된 벡터; 또는 (iv) 본원에 기술된 벡터 조합물; 또는 (v) 본원에 기술된 세포를 포함하고; (vi) 임의적으로 비-천연 아미노산을 포함하는, 진핵생물 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트가 제공된다.
적절하게는, 키트는 돌연변이체 eRF1을 코딩하는 핵산 구축물 또는 벡터, 또는 이를 포함하는 세포를 추가로 포함한다.
키트는 시약들을 사용하여 이같은 단백질을 생산하는 방법을 기술하는 인쇄된 설명서 물질을 또한 포함할 수 있다.
일반적인 재조합 DNA 기술
본 발명은, 달리 지시되지 않는 한, 화학, 분자생물학, 미생물학 및 재조합 DNA 기술의 통상적인 기술을 사용하고, 이는 관련 기술 분야의 통상의 기술자의 능력 내에 속한다. 이같은 기술이 문헌에 설명되어 있다. 예를 들어, 문헌 [M. Green & J. Sambrook, 2012, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press]을 참조한다. 이러한 교재는 본원에 참조로 포함된다.
이제 본 발명이 번호가 매겨진 항에 의해 기술된다:
제1항
(i) tRNA 신테타제를 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 tRNA 신테타제를 코딩하는 핵산 서열; 및
(ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고,
제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는
tRNA가 핵산 구축물 내에 다중 카피로 존재하는,
진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 tRNA 신테타제 및 tRNA 쌍을 발현시키기 위한 핵산 구축물.
제2항
제1항에 있어서, 핵산 구축물이 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 추가 프로모터에 작동가능하게 연결된 관심 핵산 서열을 코딩하는 핵산 서열을 추가로 포함하는 핵산 구축물.
제3항
제2항에 있어서, 프로모터가 제1 프로모터와 동일한 방향으로 배향되고, 임의적으로는 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 프로모터가 제1 프로모터와 동일하거나 또는 제1 프로모터와 상이한 핵산 구축물.
제4항
제1항 내지 제3항 중 어느 한 항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 서열을 추가로 포함하고, 적절하게는 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되는 핵산 구축물.
제5항
제4항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열 및 tRNA 신테타제를 코딩하는 핵산 서열이 동일한 오픈 리딩 프레임에서 자가-절단 펩티드를 통해 연결된 핵산 구축물.
제6항
(i) 진핵생물 세포에서 관심 핵산 서열을 발현시킬 수 있는 제1 프로모터에 작동가능하게 연결된 관심 핵산 서열을 포함하는 핵산 서열; 및
(ii) tRNA를 발현시킬 수 있는 제2 프로모터에 작동가능하게 연결된 tRNA를 코딩하는 핵산 서열을 포함하고,
제1 및 제2 프로모터가 서로 반대 방향으로 있거나, 또는
tRNA가 핵산 구축물 내에 다중 카피로 존재하는,
진핵생물 세포에서 tRNA, 및 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 관심 핵산 서열을 발현시키기 위한 핵산 구축물.
제7항
제6항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 서열을 추가로 포함하고, 적절하게는 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되는 핵산 구축물.
제8항
제1항 내지 제7항 중 어느 한 항에 있어서, 제1 및 제2 프로모터가 서로 반대 방향으로 있고, tRNA가 핵산 구축물 내에 다중 카피로 존재하는 핵산 구축물.
제9항
제1항 내지 제8항 중 어느 한 항에 있어서, tRNA가 직접적으로 프로모터에 또는 간접적으로 프로모터에 연결되고, 적절하게는 핵산 구축물이 링커로 tRNA에 연결된 종결인자 서열을 포함하는 핵산 구축물.
제10항
제1항 내지 제9항 중 어느 한 항에 있어서, tRNA를 코딩하는 핵산 서열의 각각의 카피가 별개의 프로모터의 제어 하에 놓인 핵산 구축물.
제11항
제1항 내지 제10항 중 어느 한 항에 있어서, 프로모터 배열이 제1 방향으로 배열된 신장 인자 프로모터 및 제2 방향으로 배열된 Pol III 프로모터를 포함하는 핵산 구축물.
제12항
제1항 내지 제11항 중 어느 한 항에 있어서, 제1 프로모터가 EF-1 프로모터이거나 또는 이로부터 유래되는 핵산 구축물.
제13항
제1항 내지 제12항 중 어느 한 항에 있어서, 제2 프로모터가 U6 프로모터이거나 또는 이로부터 유래되는 핵산 구축물.
제14항
제1항 내지 제13항 중 어느 한 항에 있어서, tRNA가 핵산 구축물(들) 상에 4, 5, 6, 7 또는 8개 또는 이를 초과하는 개수의 카피로 존재하는 핵산 구축물.
제15항
제1항 내지 제14항 중 어느 한 항에 있어서, tRNA가 야생형 또는 변이체 tRNA이고, 적절하게는 PylT의 U25C 변이체인 핵산 구축물.
제16항
제1항 내지 제15항 중 어느 한 항에 있어서, 관심 핵산 서열이 적어도 1, 2, 3 또는 4개의 정지 코돈을 포함하는 핵산 구축물.
제17항
제2항 내지 제16항 중 어느 한 항에 있어서, 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 핵산 구축물.
제18항
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고/이거나, 상기 tRNA가 진핵생물 세포 내의 내인성 tRNA 신테타제에 대해 직교이고/이거나, 상기 tRNA 신테타제가 진핵생물 세포 내의 내인성 tRNA에 대해 직교이고 상기 tRNA가 내인성 tRNA 신테타제에 대해 직교인 핵산 구축물.
제19항
제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 핵산 구축물 조합물.
제20항
제19항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열이 별개의 구축물 상에 있는 핵산 구축물 조합물.
제21항
제1항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터.
제22항
제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물을 포함하는 벡터를 포함하는 벡터 조합물.
제23항
제22항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 서열이 별개의 벡터 상에 있는 벡터 조합물.
제24항
제1항 내지 제18항 중 어느 한 항에 따른 핵산 구축물, 제19항 또는 제20항에 따른 핵산 구축물 조합물, 제21항에 따른 벡터, 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하는 세포.
제25항
제24항에 있어서, 돌연변이체 eRF1, 적절하게는 돌연변이체 호모 사피엔스 eRF1을 코딩하는 핵산 구축물을 추가로 포함하는 세포.
제26항
제25항에 있어서, 돌연변이체 eRF1이 E55D, E55A, N129P/K130Q 및 Y125F 또는 이 중 2개 이상의 조합으로 이루어진 군으로부터 선택되고, 적절하게는 돌연변이가 진뱅크 등록 번호 AF095901.1에 기술된 바와 같은 호모 사피엔스 eRF1 유전자 서열에서 이루어진 세포.
제27항
제24항 내지 제26항 중 어느 한 항에 있어서, 세포가 곤충 세포 또는 포유동물 세포인 세포.
제28항
제24항 내지 제27항 중 어느 한 항에 있어서, 세포가 일시적으로 또는 안정적으로 핵산으로 형질감염된 세포.
제29항
(i) 제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물; 또는
(ii) 제19항 또는 제20항에 따른 핵산 구축물 조합물; 또는
(iii) 제21항에 따른 벡터; 또는
(iv) 제22항 또는 제23항에 따른 벡터 조합물; 또는
(v) 제27항 또는 제28항에 따른 곤충 또는 포유동물 세포를 포함하고;
(vi) 임의적으로 비-천연 아미노산을 포함하는,
진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 단백질 내로 혼입시키기 위한 키트.
제30항
제29항에 있어서, 돌연변이체 eRF1을 코딩하는 핵산 구축물 또는 벡터, 또는 이를 포함하는 세포를 추가로 포함하는 키트.
제31항
하기 단계를 포함하는, 진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법:
i) 제27항 또는 제28항에 따른 세포를 제공하는 단계이며, 여기서 상기 세포가 제19항 또는 제20항에 따른 핵산 구축물 조합물 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하는 것인 단계;
ii) 세포를 관심 핵산 서열이 코딩하는 관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및
iii) 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
제32항
제31항에 있어서, 적어도 3, 4, 또는 5개의 비-천연 아미노산이 관심 단백질 내로 혼입되는 방법.
제33항
하기 단계를 포함하는, 항체-약물 접합체를 제조하는 방법:
i) 제27항 또는 제28항에 따른 세포를 제공하는 단계이며, 여기서 상기 세포가 제19항 또는 제20항에 따른 핵산 구축물 조합물 또는 제22항 또는 제23항에 따른 벡터 조합물을 포함하고, 관심 핵산 서열이 항체 또는 항체 단편을 코딩하는 것인 단계;
ii) 세포를 항체 또는 항체 단편 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계;
iii) 비-천연 아미노산이 혼입된 항체 또는 항체 단편을 수득하는 단계; 및
iv) 항체 또는 항체 단편을 비-천연 아미노산을 통해 약물 모이어티와 접합시키는 단계.
제34항
진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한, (i) 제1항 내지 제5항 및 제8항 내지 제18항 중 어느 한 항에 따른 핵산 구축물 및 제6항 내지 제18항 중 어느 한 항에 따른 핵산 구축물; 또는 (ii) 제19항 또는 제20항에 따른 핵산 구축물 조합물; 또는 (iii) 제21항에 따른 벡터; 또는 (iv) 제22항 또는 제23항에 따른 벡터 조합물; 또는 (v) 제27항 또는 제28항에 따른 곤충 또는 포유동물 세포의 용도.
제35항
하기 단계를 포함하는, 진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법:
i) 직교 tRNA 신테타제 및 tRNA 쌍, 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;
ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및
iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA-tRNA 신테타제 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계.
제36항
진핵생물 세포, 적절하게는 포유동물 또는 곤충 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도.
제37항
하기 단계를 포함하는, 관심 단백질 내의 비-천연 아미노산의 혼입을 증가시키는 eRF1의 돌연변이체를 확인하는 방법:
(i) 비-천연 아미노산을 관심 단백질 내로 혼입시킬 수 있는 세포를 제공하는 단계이며, 적절하게는 여기서 상기 세포가 직교 tRNA 신테타제 및 tRNA 쌍, 및 관심 핵산 서열을 발현하고, 임의적으로 돌연변이체 eRF1을 발현하며, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;
관심 단백질 내로 혼입될 비-천연 아미노산의 존재 하에, 그리고 eRF1의 돌연변이체의 존재 및 부재 하에 세포를 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 tRNA 신테타제에 대한 기질인 단계; 및
eRF1의 돌연변이체의 존재 및 부재 하의 관심 단백질 내로의 비-천연 아미노산 혼입 수준을 결정하는 단계이며, 여기서 eRF1의 돌연변이체의 존재 하에 관심 단백질 내로의 비-천연 아미노산 혼입 수준이 증가되는 것이 상기 eRF1 돌연변이체가 관심 단백질 내로의 비-천연 아미노산 혼입을 증가시킨다는 것을 나타내는 것인 단계.
제38항
실질적으로 첨부된 설명 및 도면을 참조로 본원에 기술된 바와 같은 구축물, 벡터, 세포, 키트, 방법 또는 용도.
실시양태의 설명
본 발명의 설명적인 실시양태들이 첨부된 도면을 참조로 본원에서 상세하게 개시되었지만, 본 발명이 명확한 실시양태에 제한되지 않고, 첨부된 청구범위 및 이의 등가물에 의해 규정되는 바와 같은 발명의 범주를 벗어나지 않으면서 통상의 기술자에 의해 그 안에서 다양한 변화 및 변형이 이루어질 수 있는 것으로 이해된다.
추가의 특정한 바람직한 측면이 첨부된 독립항 및 종속항에 기재된다. 종속항의 특색은 적합하게, 그리고 청구범위에 명시적으로 기재된 것들 이외의 조합으로 독립항의 특색들과 조합될 수 있다.
장치 특색이 기능을 제공하도록 작동가능한 것으로 기술된 경우에, 이는 이러한 기능을 제공하거나 또는 이러한 기능을 제공하도록 개조 또는 구성된 장치 특색을 포함하는 것으로 이해될 것이다.
실시예
실시예 1 - 물질 및 방법
DNA 구축물
기존에 기술된 플라스미드 pMbPylRS-mCherry-TAG-EGFP-HA1로부터 리포터 구축물이 유래되었다. 제한 부위를 인간 세포주에서의 발현에 대해 코돈-최적화 (보충 정보 표 S1)된 sfGFP 150TAG (라이프 테크놀러지즈)로 교체하여 플라스미드 CMV-PylRS/CMV-sfGFP(TAG)가 생성되었다. 동일한 영역을 레닐라-TAG-반딧불이 루시페라제 카세트로 교체하여, 플라스미드 CMV-PylRS/CMV-DLR(TAG)이 생성되었다. KOD 핫 스타트(KOD Hot Start) 폴리머라제 (노바젠(Novagen))를 사용하여, 정지 또는 센스 코돈을 pJet1.2 (써모 사이언티픽(Thermo scientific)) 내의 sfGFP 150TAG 또는 레닐라-TAG-반딧불이 루시페라제 카세트 내로 부위-지정 돌연변이유발에 의해 도입하였다. 생성된 돌연변이체들을 pMbPylRS-mCherry-TAG-EGFP-HA 내로 서브클로닝하여, sfGFP 150Leu (CMV-PylRS/CMV-sfGFP), 및 sfGFP 101, 133, 150TAG (CMV-PylRS/CMV-sfGFP(TAG)3), 및 TAA (CMV-PylRS/CMV-DLR(TAA)), TGA (CMV-PylRS/CMV-DLR(TGA)) 및 SER (CMV-PylRS/CMV-DLR)를 함유하는 이중 루시페라제 리포터 플라스미드를 제공하였다.
4×U6 PylT 플라스미드 시리즈의 경우, PB220PA-1 백본 (시스템 바이오사이언시즈(System Biosciences))을 사용하였다. CMV 카세트를 CD532A-2 (시스템 바이오사이언시즈)로부터의 EF-1α 카세트로 교체하고, SpeI/SalI 단편을 PB220PA-1의 SpeI/SalI 내로 서브클로닝하였다. SpeI/AvrII 플랭킹(flanking) 부위가 있는 최적화된 U6 프로모터 / 메타노사르시나 마제이 피롤리신 tRNA 삽입물 (보충 정보 표 S1)을 합성하였다 (라이프 테크놀러지즈). EF1 프로모터의 5'의 독특한 SpeI 부위 내로의 SpeI/AvrII 단편의 반복 삽입에 의해 4×U6 PylT 탠덤(tandem) 카세트를 구축하였다. AG28, CMV-PylRS/CMV-sfGFP 및 CMV-PylRS/CMV-S2로부터의 관련 유전자의 서브클로닝에 의해 (U6-PylT*)4/EF-1α-PylRS, (U6-PylT*)4/EF-1α-sfGFP(TAG) 및 (U6-PylT*)4/EF-1α-sfGFP(TAG)3 플라스미드를 구축하였다. MfeI와 NheI 사이의 mCherry-TAG-EGFP 카세트 sfGFP(TAG)3.
호모 사피엔스 eRF1 유전자 (진뱅크: AF095901.1)를 드로소필라 멜라노가스터에 대해 코돈-최적화하였고 (보충 정보 표 S1), N-말단 His6 태그, C-말단 삼중 정지 (UAAUGAUAG)에 의해 확장시켰다. 헬릭스웹 툴키트(Helixweb toolkit)2를 사용하여 코돈 최적화를 수행하였다. 부위-지정 돌연변이유발 (보충 정보 표 2)에 의해 추가적인 돌연변이를 도입하고, 생성된 구축물을 제한 부위 HindIII/NotI을 사용하여 포유동물 발현 벡터 pcDNATM5/FRT/TO 내로 클로닝하여, peRF1(X) 벡터 (여기서 X는 돌연변이를 나타낸다)를 생성시켰으며, eRF1이 CMV 프로모터로부터 발현된다.
세포 배양, 항체 및 검정법
부착성 HEK293T 세포를 37℃, 5% CO2 대기에서 10% FBS가 보충된 둘베코 변형 이글 배지 (DMEM)-글루타맥스(Glutamax) (깁코(Gibco) 상에서 유지시켰다. 트랜스잇(TransIT)®-293 (마이러스(Mirus)) 형질감염 시약 또는 3:1 PEI:DNA 비의 폴리에틸렌이민 (맥스 PEI(Max PEI), 폴리사이언시즈(Polysciences))을 제조사의 프로토콜에 따라 사용하여 일시적인 형질감염을 수행하였다.
eRF1 (ab30928, 앱캠(Abcam)), 액틴 (#4967, 셀 시그널링 테크놀러지(Cell Signaling Technology)), FLAG (A8592, 시그마-알드리치(Sigma-Aldrich), HIS (27E8, 셀 시그널링 테크놀러지), HA (C29F4, 셀 시그널링 테크놀러지)에 대한 항체 및 상응하는 2차 HRP-연결 항체 (#7074, #7076, #7077, 셀 시그널링 테크놀러지)로의 이뮤노블롯팅에 의해 단백질 발현 및 eRF1 고갈을 확인하였다. eRF1 고갈은 다른 형질감염된 플라스미드와 등량의 시판되는 eRF1 shRNA (sc-37871-SH, 산타 크루즈 바이오테크놀러지(Santa Cruz Biotechnology))로의 형질감염에 의해 달성되었다.
아미노산 1은 시판되었고 (E1610.0025, 바켐(Bachem)), 아미노산 2는 기존에 기술된 바와 같이 합성되었다. 단백질 발현을 위해, 아미노산 용액을 배양 배지 내의 중화된 원액 용액으로서 제조하고, 예비 인큐베이션된 형질감염 혼합물과 함께 (트랜스잇-293, 96웰 플레이트), 또는 형질감염 4시간 후에 배양 배지를 교체하면서 (PEI, 24웰 플레이트, 10 cm 배양 접시, T75 플라스크), 배양 세포에 첨가하였다.
노던
블롯팅
총 RNA를 퀴아졸(Qiazol) 용해 시약 (퀴아젠(Qiagen))을 사용하여 HEK293T 세포로부터 단리하고, 이소프로판올로 침전시켰다. 노던맥스-Gly(NorthernMax-Gly) 키트 (앰비온Ambion))로 노던 블롯팅을 수행하였다; RNA를 글리옥살 로드 염료에서 변성시키고, 2% 아가로스 겔 상에서 분리하고, 양으로 하전된 브라이트스타-플러스(BrightStar-Plus) 나일론 막 (앰비온) 상으로 옮기고, 스트라타링커(Stratalinker) 2400 UV 가교제 (스트라타진(Stratagene))를 통해 UV로 가교시켰다. 막을 하룻밤 동안 37℃에서 5'-비오틴화 DNA 프로브 (5'-GGAAACCCCGGGAATCTAACCCGGCTGAACGGATTTAGAG-3')와 혼성화시켰다. 혼성화된 프로브를 화학발광 핵산 검출 모듈 (써모 사이언티픽)을 사용하여 검출하였다.
이중
루시페라제
검정법
HEK293T 세포를 96웰 플레이트 (코스타(Costar) #3595, 코닝(Corning))에서 웰 당 제안된 양의 2배의 DNA (총 0.2 ㎍) 및 트랜스잇®-293 시약 (0.6 ㎕)을 사용하여 형질감염시켰다. 간략화된 제조사의 프로토콜 (프로메가(Promega))에 따라 이중 루시페라제 검정법을 수행하였다. 16시간의 성장 후, 배양 배지를 제거하고, 세포를 15분 동안 실온에서 20 ㎕의 패시브(passive) 용해 완충제에서 용해시켰다. 그 후, 10 ㎕의 용해물을 백색 96웰 플레이트 (눈크(Nunc) 236105, 써모 사이언티픽) 내의 50 ㎕의 루시페라제 검정법 완충제 II에 첨가하였다. 이어서, 반딧불이 루시페라제 발광을 측정하고 (페라스타 FS(Pherastar FS), BMG 랩테크(BMG Labtech)), 반응을 켄칭시키고, 50 ㎕ 스톱 & 글로(Stop & Glo) 완충제를 첨가한 후 레닐라 발광을 측정하였다. 실험을 4중으로 수행하여, 3회의 반복 실험은 이중 루시페라제 측정에 사용하고, 나머지 반복 실험은 50 ㎕의 RIPA 완충제 (시그마(Sigma)) + 컴플리트(Complete) 프로테아제 억제제 (로슈(Roche))에서의 용해 후에 이뮤노블롯팅에 사용하였다.
sfGFP
변이체의
일시적인 발현
형광 검정법을 위한 sfGFP(TAG) 및 sfGFP(TAG)3의 발현을 24웰 플레이트에서 수행하였다. 관례적으로, 웰 당 100000개의 세포를 시딩하고, 하룻밤 동안 성장시키고, 플라스미드 당 160 ng DNA, 1.5 ㎕의 PEI (1 mg/ml) 및 50 ㎕의 혈청 감소 배지 (옵티-MEM(Opti-MEM), 깁코)를 사용하여 일시적으로 형질감염시켰다. 형질감염 4시간 후, 배지를 교환하고, 아미노산 1 또는 2를 신선한 성장 배지에 첨가하였다. 48시간의 성장 후, 상청액을 조심스럽게 제거하고, 진탕시키면서 세포를 컴플리트 프로테아제 억제제 (로슈)가 첨가된 100 ㎕ RIPA 완충제 (시그마)에서 용해시켰다. 50 ㎕의 용해물을 96웰 플레이트 (코스타 #3595, 코닝) 내로 옮기고, 형광 강도를 485/520 nm에서 결정하였다 (페라스타 FS, BMG 랩테크). 검정 곡선 (보충 도면 S1)을 사용하여 용해물에서 sfGFP를 정량하였다.
검정 목적을 위해, sfGFP를 이. 콜라이 DH10b 세포에서 pBAD 프로모터 제어 하에 p15A-기반 플라스미드로부터 발현시키고, 앞서 기술된 바와 같이 Ni-친화력 크로마토그래피로 정제하였다4. SDS-PAGE 후에 쿠마시 염색으로 단백질 순도를 확인하였다.
컴플리트 프로테아제 억제제 (로슈)가 보충된 RIPA 완충제 (시그마)에서 단계 희석 (단계 당 1:10)하여 280 nm에서의 흡광도 (흡광 계수 0.6845)를 측정함으로써 기준 샘플 내의 절대 단백질 농도를 결정하였다. 소정의 농도의 sfGFP에 대한 형광 강도 (여기 485 nm, 방출 520 nm)를 96웰 플레이트 (코스타, 코닝)에서 50 ㎕의 부피로 3중으로 측정하였다. 소정의 게인 세팅(gain setting) (페라스타 FS, BMG 랩테크)에 대한 마이크로플레이트 판독기의 선형 범위 밖의 측정치를 폐기하고, 나머지 데이터 포인트를 선형 곡선에 핏팅하였다. 세포 용해물 내의 sfGFP 형광의 후속 측정을 동일한 조건 하에 수행하고, 표준 곡선 (프리즘6(Prism6), 그래프패드(Graphpad))를 참조로 sfGFP 농도를 결정하였다.
질량 분광법을 위한 단백질 발현을 10 cm 배양 접시에서 수행하였다. HEK293T를 10 cm 조직 배양 접시에서 15 ㎍ DNA + PEI로 형질감염시켰다. 형질감염 4시간 후 세포 배양 배지를 교환하고, 72시간 동안 아미노산과 함께 인큐베이션하였다. 세포를 PBS로 2회 세정하고, 1 mL RIPA 완충제에서 용해시켰다. 정화된 용해물을 50 ㎕ GFP-트랩(GFP-Trap)® M (크로모테크(ChromoTek))에 첨가하고, 4시간 동안 4℃에서 인큐베이션하였다. 자석으로 비드를 분리하고, 1 mL RIPA, 1 mL PBS, 1 mL PBS+500 mM NaCl, 1 mL ddH2O로 세정하고, 1% 아세트산/ddH2O에서 용출시켰다.
질량 분광법
6130 쿼드로폴(Quadrupole) 분광계가 장착된 애질런트(Agilent) 1200 LC-MS 시스템을 사용하여 전기분무 질량 분광법을 수행하였다. 용매 시스템은 완충제 A로서의 H2O 내의 0.1% 포름산, 및 완충제 B로서의 아세토니트릴 (MeCN) 내의 0.1% 포름산으로 이루어졌다. 214 및 280 nm에서 단백질 UV 흡광도를 모니터링하였다. 양이온 모드에서 단백질 MS를 획득하고, 총 단백질 질량을 MS 켐스테이션(Chemstation) 소프트웨어 (애질런트 테크놀러지즈(Agilent Technologies))에서의 디컨볼루션(deconvolution)으로 계산하였다6.
실시예 2 - tRNA 수준을 증가시키는 것이 비-천연 아미노산 혼입 효율을 증가시킨다
본 발명가들은 포유동물 세포에서의 비-천연 아미노산 혼입의 효율을 증가시키도록 tRNACUA의 발현 수준을 최적화하였다. PylRS, tRNACUA 및 선택된 프로모터의 카피수가 다른 상이한 PylRS 및 tRNA 플라스미드들을 연구원들이 사용하였다17 -20. 그러나, 포유동물 세포에서 이러한 PylRS/tRNACUA 쌍으로 혼입된 비-천연 아미노산을 보유하는 단백질의 수율을 정량하는 보고 또는 앰버 정지 코돈을 함유하지 않는 유전자로부터 발현된 대조군 단백질의 발현에 비교하여 비-천연 아미노산 혼입의 효율을 정량하는 보고가 없다. 이러한 실험들은 포유동물 세포에서의 비-천연 아미노산 혼입이 천연 단백질 합성에 얼마나 잘 필적하는지를 이해하는데 결정적이다.
본 발명가들은 CMV 프로모터 상의 PylRS의 단일 카피 및 U6 프로모터 + CMV 인핸서에 의해 각각 구동되는 tRNACUA의 4개의 카피를 보유하는 플라스미드 b 및 c를 사용하여 비-천연 아미노산 혼입의 효율을 최초로 테스트하였다17 ,19 (구축물 개략도가 차트 1a에서 제시된다). 이러한 시스템은 sfGFP (CMV-sfGFP(TAG))의 위치 150의 앰버 코돈에 반응하여23 1 (N ε-[(tert-부톡시)카르보닐]-l-리신), 또는 2 (N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) (차트 1b) (양쪽 모두 PylRS/tRNACUA 쌍에 대한 공지된 효율적인 기질임21 , 22)의 혼입을 5% 및 7%의 효율로 지시하였다 (도 1a, b); 모든 혼입 효율은 위치 150에 앰버 코돈 대신 류신 코돈을 보유하는 다른 면에서는 동일한 대조군 구축물 (플라스미드 a, 차트 1)로부터 생산된 sfGFP 수준의 백분율로서 보고된다. 다음으로, 본 발명가들은 tRNACUA의 4개의 카피를 최적화된 U6 프로모터 상의 tRNACUA의 단일 카피로 교체하였고, 이는 비-천연 아미노산 혼입 효율을 소량 감소시켰다 (플라스미드 b 및 d).
원래의 4-카피 카세트 (c)와 달리, 새로운 U6 tRNACUA 카세트 (d)는 CMV 인핸서를 함유하지 않고, tRNA에 대한 정확한 5' 끝부분을 생산하며, 이는 뉴클레아제 프로세싱을 필요로 하지 않는다. 노던 블롯 (도 1c)은 d로부터 생산된 Pyl tRNACUA의 수준이 c로부터 생산된 수준에 필적한다는 것을 실연한다. 이는 변경된 tRNA 발현 구축물이 tRNA 유전자의 카피 당 더 많은 카피의 tRNA를 제공한다는 것을 가리킨다. tRNACUA를 U25C 변이체24로 교체하는 것은 혼입 효율을 2.7%-3.5%에서 4.7-5.1%로 약간 증가시켰고 (플라스미드 b 및 e, 차트 1), tRNACUA 수준에 대한 작은 효과가 있었다.
U6 Pyl tRNACUA (U25C를 보유함)의 4개의 카피를 각각 함유하는 탠덤 어레이를 생성시키고, 단백질 코딩 유전자에 대한 프로모터를 CMV에서 EF-1α로 전환하면 (플라스미드 g 및 h, 차트 1), 1 또는 2를 보유하는 sfGFP가 실질적으로 증가되었다. 이러한 시스템에서, 아미노산 1은 앰버 코돈에 반응하여 sfGFP 내에 62%의 효율로 혼입된 한편, 2는 약 129%의 효율로 혼입되었다. 웨스턴 블롯은 단백질 코딩 유전자의 프로모터를 EF-1α로 변화시키는 것이 PylRS (항-FLAG b+e 대 g+h, 도 1b) 또는 wt sfGFP (a 대 f 도 1b)의 수준을 변화시키지 않는다는 것을 실연하여, EF1 α 프로모터로 변화시키는 것에 의해 PylRS 수준 또는 sfGFP 발현의 최대 수준이 변경되지 않는다는 것을 실연한다. 그러나, 노던 블롯은 테스트된 다른 모든 시스템에서보다 이러한 시스템에서 tRNA 수준이 훨씬 더 높다는 것을 실연하여, 본 발명가들이 관찰한 비-천연 아미노산 혼입 효율의 큰 증가가 tRNA 수준의 증가에 의해 야기된다는 것을 강하게 시사한다.
실시예 3 - 선택된 eRF1 변이체의 이소성 발현이 정지 코돈의 번역초과를 증가시키지 않는다.
다음으로, 본 발명가들은 eRF1을 조작하는 것에 의해 다른 정지 코돈의 번역초과를 증가시키지 않으면서 비-천연 아미노산 혼입 효율을 추가로 강화할 수 있는지를 질문하였다. 최적화된 신테타제 및 tRNA 시스템으로 비-천연 아미노산 혼입의 효율이 이미 양호하였지만, 본 발명가들은 eRF1 조작이 이러한 효율을 추가로 개선할 수 있고, 단백질 내의 다중 부위에서 비-천연 아미노산을 효율적으로 혼입시키게 할 수 있다고 구상하였다.
본 발명가들은 유전학 또는 생화학 연구로부터 앰버 코돈에서의 종결에 대한 효과가 있는 것으로 보고되는 eRF1 내의 아미노산 위치를 최초로 확인하였다25 - 30. 이러한 돌연변이들은 리보솜 내에서 mRNA 상의 정지 코돈과 상호작용하는 eRF1의 N-말단 도메인 (도 2a) 내에 있다. 포유동물 세포 내에서의 번역 종결에 대한 eRF1 돌연변이체의 효과를 평가하기 위해, 본 발명가들은 HEK 293T 세포, 및 부가되고 과발현된 인간 eRF1 및 eRF1 돌연변이체를 보유하는 HEK 293T 세포에서 앰버, 오팔 및 오커 정지 코돈에서의 억제인자 tRNA 비의존적 번역초과를 정량하였다 (도 2b). eRF1은 eRF3과 복합체를 형성하고 (eRF1 상의 C-말단 도메인을 통해 주로 매개됨37), 이는 번역 종결을 매개한다. eRF3은 세포 내에 내인성 eRF1에 필적하는 수준으로 존재하고, 따라서 eRF3이 형성될 수 있는 종결 복합체의 개수를 제한한다35. eRF1 N-말단 도메인 돌연변이체의 과발현은 (질량 작용에 의해) 이러한 복합체를 eRF1 돌연변이체를 함유하는 것을 향해 편향시킴으써 eRF1 돌연변이의 표현형을 나타낼 수 있다.
본 발명가들은 각각의 eRF1 변이체를 세포 내로 도입하고 (도 2b), 3가지 이중 루시페라제 리포터를 사용하여 정지 코돈의 기저 번역초과를 측정하였다 (도 2c). 각각의 리포터는 N-말단 레닐라 루시페라제에 이어지는 정지 코돈 (앰버, 오팔 또는 오커) 및 C-말단 반딧불이 루시페라제를 함유하였다31 - 34. 정지 코돈의 번역초과는 0.08 내지 0.12% (TAG 0.09%, TGA 0.12%, TAA 0.08%)였고, 이는 추가 실험에 대한 기준점을 제공한다. eRF1의 이소성 과발현으로 3개 모두의 정지 코돈의 번역초과가 감소하였고 (TAG 0.03%, TGA 0.07%, TAA 0.04%), 이는 세포 내의 eRF1의 수준 증가와 일관된다35. 번역초과의 이러한 감소는 소량이고, 이는 eRF3의 수준이 내인성 eRF1의 수준에 필적하고, eRF3 수준이 형성될 수 있는 기능성 종결 복합체의 개수를 제한한다는 것과 일관된다35.
eRF1 변이체의 도입은 야생형 eRF1의 도입과 관련하여 정지 코돈 번역초과를 증가시켰다. 그러나, 2개를 제외한 테스트된 모든 eRF1 돌연변이체에 대해, 3개 모두의 정지 코돈의 번역초과가 이소성으로 발현된 eRF1의 부재 하에 발견된 수준을 초과하여 증가되지 않았다. 본 발명가들은 대부분의 테스트된 eRF1 변이체의 이소성 발현이 정지 코돈의 번역초과를 기저 수준을 초과하여 증가시키지 않는다는 결론을 내렸다.
정지 코돈의 번역초과를 정상적으로 세포에서 발견되는 수준을 초과하여 증가시키는 2개의 eRF1 돌연변이체는 번역초과를 1.6% (TAA), 2% (TAG) 및 15% (TGA)로 증가시키는 돌연변이체인 eRF1 Δ100, 및 선택적으로 TGA 코돈에서 번역초과를 2배 증가시키는 T122Q, S123F 돌연변이체29이다. shRNA에 의한 내인성 eRF1 수준의 감소는 3개 모두의 정지 코돈에 대해 기저 번역초과를 2 내지 3배 증가시켰다.
모든 정지 코돈의 번역초과에 대한 eRF1 Δ100 돌연변이체의 효과는 예상된 것인데, 이는 잔기가 결실되는 N-말단 도메인이 mRNA 내의 3개 모두의 정지 코돈의 인식을 매개하지만 eRF3과의 상호작용은 매개하지 않기 때문이다36 - 39. 따라서 이러한 돌연변이체는 eRF3과 비활성 복합체를 형성하여, 종결을 매개할 수 있는 기능성 eRF1/eRF3 복합체의 개수를 감소시킬 것으로 예견된다. 유사하게, eRF1에 대한 shRNA가 모든 정지 코돈에 미치는 효과는 예상된 것인데40, eRF1의 감소는 모든 정지 코돈 상에서의 종결의 감소에 이르기 때문이다.
실시예 4 - eRF1 돌연변이체가 비-천연 아미노산 혼입 효율을 증가시킨다.
비-천연 아미노산 혼입에 대한 eRF1, eRF1 돌연변이체 및 shRNA의 효과를 연구하기 위해, 본 발명가들은 세포를 관련된 eRF1 돌연변이체로 형질감염시켰다 (도 2d). 각각의 샘플에 앰버 억제의 이중 루시페라제 리포터인 직교 피롤리실 tRNA - 신테타제 (PylRS)/tRNACUA 쌍의 단일 카피 (차트 1의 b + d로 제시된 배열이지만, sfGFP가 이중 루시페라제 리포터로 교체됨)가 또한 제공되었다. 본 발명가들은 이러한 시스템을 사용하여, eRF1 변이체가 제공하는 강화를 측정할 수 있는 동적 범위를 최대화하게 하였다. 아미노산 1을 모든 세포에 첨가하였다. 한 경우에, 내인성 eRF1에 대한 shRNA 구축물40을 첨가하여, 이소성으로 발현된 eRF1 돌연변이체의 효과를 내인성 eRF1을 녹아웃시키는 것에 비교하였다.
이중 루시페라제 검정법을 사용하여 비-천연 아미노산 혼입 효율에 대한 eRF1의 효과를 결정하였다 (도 2e). 이소형으로 발현된 방출 인자의 부재 하에, 이러한 검정법에서 비-천연 아미노산 혼입의 효율은 약 5.3%였다. 혼입 효율은 야생형 방출 인자의 이소성 발현 시 약간 감소하였고, 내인성 eRF1의 shRNA 녹다운 시 13%로 증가하였다. S70A, G73S 돌연변이체를 제외하고는 1에 대한 혼입 효율이 모든 돌연변이체 방출 인자의 존재 하에 증가하였다. 이러한 돌연변이체는 기존에 이능성(bipotent) UAR 특이적 eRF1로서 기술되었다.28,41
2개의 eRF1 돌연변이체가 가장 효율적인 비-천연 아미노산 혼입을 일으켰다: eRF1 (E55D), 27%; 및 eRF1 (Δ100), 36%. Δ100 돌연변이체 및 E55D 돌연변이체로의 혼입 효율은 이소성으로 발현된 방출 인자를 함유하지 않는 세포에서의 혼입 효율보다 5 내지 7배 더 크다. 흥미롭게, PylRS/tRNACUA 쌍의 존재 및 부재 하에 앰버 번역초과를 강하게 강화하는 한편, eRF1Δ100 돌연변이체는 양쪽 모두의 상황에서 생산된 루시페라제의 총량을 유의하게 감소시켰고, 이는 번역 효율에 대한 전반적인 효과가 있는 3개 모두의 정지 코돈에서의 종결의 극단적인 파괴와 일관된다 (보조 정보 도면 2). 또한, Δ100 돌연변이체는 억제인자 tRNA의 부재 하에 3개 모두의 정지 코돈의 번역초과를 일으킨다; 따라서, 본 발명가들은 이러한 방출 인자 돌연변이체를 더 연구하지 않았다. 본 발명가들은 eRF1 (E55D)에 대한 추가 연구에 집중하였다. 이러한 방출 인자 돌연변이체는 토끼 망상적혈구 리보솜을 사용한 시험관 내 검정법에서 앰버 코돈에 반응하는 것보다 더욱 효율적으로 오커 및 오팔 코돈에 반응하여 개시인자 tRNA로부터 포르밀-메티오닌을 제거하는 것으로 확인되었다.25
실시예 5 - 다중 비-천연 아미노산을 혼입시키기 위한 최적화된 시스템
다음으로, 본 발명가들은 최적화된 신테타제 및 tRNA 시스템과 eRF1의 E55D 돌연변이체를 조합하였다 (도 3). 본 발명가들은 1의 존재 하에 성장된, PylRS/tRNACUA 쌍을 함유하는 세포에 eRF1 (E55D)을 첨가하는 것이 sfGFP(TAG) 내로의 1의 혼입을 62%에서 85%로 증가시킨다는 것을 발견하였다 (도 3a). 유사하게, eRF1 (E55D) 첨가가 GFP의 위치 K101, D133 및 V15014에 앰버 정지 코돈을 함유하는 sfGFP(TAG)3 내로 1이 혼입되는 효율을 5%에서 12%로 증가시켰다 (도 3a, b). sfGFP(TAG)로부터의 sfGFP-1의 수율은 105개의 세포로부터 0.65 ㎍인 한편, sfGFP-(TAG)3으로부터의 sfGFP-(1)3의 수율은 105개의 세포 당 0.1 ㎍이었다 (보조 정보 도면 3; 모든 수율은 시딩된 세포의 개수 당으로 매겨지고, 형질감염 48 h 후에 측정되었다).
본 발명가들은 2의 존재 하에 성장된, PylRS/tRNACUA 쌍을 함유하는 세포에 eRF1 (E55D)을 첨가하는 것이 sfGFP(TAG) 내로의 2의 혼입을 129% 에서 157%로 증가시킨다는 것과 eRF1 (E55D) 첨가가 sfGFP(TAG)3으로부터 sfGFP-(2)3을 생산하는 효율을 11%에서 43%로 4배가 되게 한다는 것을 발견하였다 (도 3c,d). sfGFP(TAG)로부터의 sfGFP-2의 수율은 105개의 세포 당 1.76 ㎍인 한편, sfGFP-(TAG)3으로부터의 sfGFP-(2)3의 수율은 105개의 세포 당 0.49 ㎍이었다 (보조 정보 도면 3). 최적화된 시스템을 함유하는 세포 용해물로부터 전장 sfGFP를 정제하였다 (도 4a). 전기분무 이온화 질량 분광법에서, 각각 sfGFP(TAG) 및 sfGFP(TAG)3으로부터의 sfGFP 내로의 1 및 2의 1개 및 3개의 분자의 부위-특이적 혼입이 실연되었다 (도 4b, 보조 정보 도면 4). 이러한 데이터는, 도 4a에서의 아미노산이 없는 대조군과 함께, eRF1 (E55D)의 존재 하에 비-천연 아미노산이 높은 정확도로 혼입되는 것을 실연한다.
실시예 6 - 유도성 eRF1 돌연변이체의 게놈 통합이 앰버 억제를 강화한다
지금까지 기술된 eRF1-강화 발현 시스템은 세포 내로의 비-천연 아미노산 혼입을 위한 모든 필요한 성분을 도입하기 위해 3개의 플라스미드의 병행 형질감염에 의존한다. eRF1 E55D 돌연변이체의 게놈 통합에 의해, 2개의 플라스미드 (도 1, 구축물 g가 h 또는 i와 조합됨)만 형질감염되어야 해서, 세포 내로 전달되는 이러한 플라스미드의 양을 증가시킨다.
eRF1용으로 테트라시클린 유도성 프로모터를 사용함으로써, 성장 배지에 테트라시클린을 첨가하는 것에 의해 필요할 때 표준 세포 배양 유지 모드에서 고효율 앰버 억제 모드로 전환될 수 있는 세포주를 생성시켰다.
eRF1 변이체를 Flp-In™ T-REx™ 293 세포주 (라이프 테크놀러지즈) 내로 도입하였다. 이러한 세포주는 단일한 전사적으로 활성인 게놈 FRT 표적 부위를 함유하고, 이에 의해 게놈 삽입 부위로 인한 발현 수준 변동이 없게 한다. 따라서 이는 별개의 안정적인 세포주들에서 다중 유전자 구축물의 효과를 비교하기 위한 이상적인 도구이다. 본 발명가들은 pcDNA™5/FRT/TO (라이프 테크놀러지즈)를 기초로 필요한 FRT 공여자 플라스미드를 생성시켰다.
디. 멜라노가스터에 대해 리코딩된 인간 eRF1 wt 및 eRF1 E55D 변이체 양쪽 모두가 게놈 내로 성공적으로 통합되었다. 생성된 Trex 293 wt 및 E55D 세포주가 유도 조건 및 비-유도 조건 양쪽 모두 하에서 수개월 동안 유지될 수 있었고, 이는 무시할 수 있는 독성 효과를 시사한다.
1:1 비의 PylRS/tRNACUA 및 sfGFP 리포터를 함유하는 구축물들 (구축물 g + h/i, 도 1)의 일시적인 형질감염에 의해 앰버 억제 효율을 결정하였다. 0.5 mM 아미노산 2의 존재 하에, 1 ㎍/mL 테트라시클린 첨가로 eRF1 발현을 유도했을 때 sfGFP(wt)와 비교하여 sfGFP(TAG)에서는 75%에서 99%로, sfGFP(TAG)3에서는 8%에서 20%로 앰버 억제가 증가하였다 (도 5a).
관찰된 효과는 eRF1을 일시적인 형질감염에 의해 도입하는 것 (도 4)에 비교하여 덜 뚜렷하다. eRF1에 대한 세포 용해물의 면역염색은 유도 시 eRF1 수준이 성공적으로 상승된다는 것을 나타내지만 (도 5d), 일시적인 형질감염 후의 eRF1 발현 (도 4, b/d)과 비교하여 덜 뚜렷하다. 이는 일시적인 형질감염에 의해 세포 당 다중 카피의 플라스미드가 운반되는 것에 비교하여, 단일한 게놈 통합 부위가 존재하는 것과 일관된다. 내인성인 야생형 eRF1의 존재 하에서는, UAG 코돈에서 종결하는 능력이 있는 야생형 eRF1/eRF3 복합체의 형성을 방지하도록 충분한 eRF1 E55D가 존재하는 경우에만 앰버 억제가 강화될 수 있다.
실시예 7 - shRNA(eRF1)의 구성적 발현이 eRF1 E55D가 안정적으로 통합된 세포주에서 앰버 번역초과를 증가시킨다
eRF1 변이체의 강한 발현이 강화된 앰버 억제를 가능하게 하는 바와 같이 (도 3), 트랜스제닉 eRF1의 존재 하에서의 내인성 eRF1의 감소도 그러할 것이다 (Carnes et al. 2003; Ilegems et al. 2004). shRNA에 의한 내인성 eRF1 수준의 감소는 기저 정지 코돈 번역초과의 비특이적인 증가에 연결된다 (도 3 b, c). 앰버 억제 잠재력이 강화된 안정적인 세포주의 개념에 따라, 이전에 사용된 eRF1 특이적 shRNA 세트를 게놈 내로의 무작위 렌티바이러스 통합에 의해 세포주 내로 도입하였다 (산타 크루즈 바이오테크놀러지). 통합 이벤트가 성공적인 세포를 퓨로마이신에 대한 저항성 획득을 기초로 선별하였다. eRF1 E55D를 함유하는 세포주 및 eRF1 야생형을 함유하는 세포주 양쪽 모두가 생성되었고, 수주 동안 테트라시클린의 존재 및 부재 하에 유지될 수 있었다.
PylRS/tRNACUA 쌍 및 sfGFP(TAG) 또는 sfGFP(TAG)3 리포터 구축물 (플라스미드 g + h/I, 도 1)의 일시적인 형질감염 후에 앰버 억제 효율을 결정하였다. 앰버 억제 효율은 배경값을 초과하는 총 sfGFP 형광으로 제시되고, 동일한 세포주에서의 sfGFP(wt)에 대해 표준화된다.
eRF1 E55D의 통합 및 유도가 0.5 mM 2의 존재 하에 "블랭크(blank)" 부모 세포주인 TRex 293 Flp-In에 비교하여 87%에서 99%로 앰버 억제의 증가를 야기하였다. 대조적으로, eRF1 wt의 유도는 앰버 억제를 평균적으로 81%로 감소시켰다.
eRF1-특이적 shRNA가 구성적으로 발현되는 세포주는 eRF1 E55D 배경에서는 상대적 형광을 114%로 증가시켰지만, eRF1 wt 배경에서는 억제를 79%에서 유지시켰다 (도 5c). Trex 293 Flp-In 부모 세포주에서 sfGFP(TAG)3 리포터로의 앰버 억제 효율은 7.6%였다. eRF1 E55D를 발현하는 안정적인 세포주는 19%로의 앰버 억제 증가를 나타내고, eRF1 E55D 및 shRNA(eRF1) 양쪽 모두를 발현하는 세포주에서 31%로 추가로 증가된다. 대조적으로, eRF1 wt를 발현하는 세포주는 7.6%의 부모 세포주에 비교하여 앰버 억제의 변화를 나타내지 않는다. eRF1 wt 및 shRNA(eRF1) 양쪽 모두를 발현하는 유래된 세포주는 5%로의 억제 효율의 미미한 감소를 나타낸다 (도 5d).
종합적으로, 상대적인 앰버 억제 효율이 eRF1 E55D의 단일 카피의 안정적인 통합에 의해 강화될 수 있고, 내인성 eRF1수준의 감소 또는 eRF1 E55D의 증가된 발현이 추가 강화에 요구된다. 어느 경우든, sfGFP-2의 정량적 발현이 달성될 수 있고, sfGFP-23이 sfGFP의 30-40%의 효율로 생산될 수 있다.
실시예 8 - eRF1 돌연변이체가 Dmel 세포에서 비-천연 아미노산 혼입 효율을 증가시킨다
본 발명가들은 곤충 세포를 기초로 하는 발현 시스템에서의 선택된 eRF1 돌연변이체의 효과를 또한 평가하였다. 드로소필라로부터 유래된 세포주, 예컨대 슈나이더(Schneider) 2 세포가 단백질의 대규모 발현에 일상적으로 사용된다. 이러한 시스템에서의 단백질 내의 비-천연 아미노산 혼입을 엠. 마제이(M. mazei) PylRS/ tRNACUA 쌍 및 적절한 발현 시스템을 사용하여 실연하였다 (Bianco et al. 2012; Elliott et al. 2014).
4개의 구축물을 사용하여 비-천연 아미노산 혼입을 구동시켰다: PylRS/tRNACUA 발현 구축물, GFP-mCherry 또는 GFP-TAG-mCherry를 함유하는 리포터 구축물, UAS 구동제, 및 각각의 eRF1 변이체에 대한 발현 구축물.
종합적으로, Dmel 세포에서의 형질감염 효율이 포유동물 시스템에서보다 더 낮고, 생성된 세포 용해물 및 블롯이 형질감염된 세포 및 형질감염되지 않은 세포의 혼합물을 나타내어, 명확한 효과를 감소시킨다 (도 6a). 시각 지표는 내인성 eRF1 밴드 아래의 이소성 말단절단 eRF1에 상응하는 약한 밴드를 나타내는 Δ100 돌연변이체이다 (도 6b). 도 6a에 제시된 앰버 억제의 정량은 3회의 독립적인 형질감염 실험을 기초로 하고, 상응하는 블롯이 개별적으로 정량된다.
야생형 방출 인자의 발현은 번역초과의 매우 미미한 감소를 야기하는 반면, eRF1 Δ100 돌연변이체의 발현은 번역초과 수준을 4.8%에서 23%로 5배 증가시킨다. 이러한 효과에 말단절단된 GFP의 총량의 강한 감소가 동반되고, 이는 전반적인 번역 프로세스의 현저한 파괴를 시사한다 (도 6b).
E55D 돌연변이체는 15%로 4배 증가되어, 테스트된 변이체들 중 번역초과 수준의 두 번째로 큰 증가를 나타낸다. 유사하게, 돌연변이 E55A 및 NK129PQ가 번역초과를 12%로 약 3배 증가시킨다. UGA 번역초과를 강화하는 것으로 보고된 돌연변이체 S70A G73S은 앰버 억제에 대한 효과를 나타내지 않는다. 세포 환경 및 사용된 리포터 시스템 양쪽 모두에서의 차이에도 불구하고, 이러한 결과들은 이전에 포유동물 세포에서 관찰된 상대적인 효과 크기를 밀접하게 반영한다. 유일한 예외는 돌연변이 Y125F이고, 이는 Dmel 세포에서는 무시할 수 있는 효과를 갖는 것으로 나타나지만, 포유동물 시스템에서는 UAG 번역초과를 개선하였다.
실시예 9 - eRF1 E55D 돌연변이체가 광범위한 비-천연 아미노산 및 tRNA 신테타제 변이체의 혼입 효율을 증가시킨다.
도 7에 나타난 바와 같이, 4개의 별개의 비-천연 아미노산인 Boc-K (N ε-[(tert-부톡시)카르보닐]-l-리신), 노르보넨-K (N ε-노르보르넨-2-일옥시카르보닐-L-리신), 시클로프로펜-K (N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신) 및 비시클로닌-K (N ε-([(1R,8S)-비시클로[6.1.0]논-4-인-9-일메톡시]카르보닐)-리신)의 sfGFP(TAG) 내로의 혼입이 eRF1 E55D 돌연변이체의 존재 하에 개선되었다. 실시예 6에서 생성된 T-REx 293 eRF1 E55D를 eRF1 E55D를 유도적으로 발현시키는데 사용하였다.
1:1 비의 PylRS/tRNACUA 및 sfGFP150TAG 리포터를 함유하는 구축물들 (구축물 g + h/i, 도 1)의 일시적인 형질감염에 의해 앰버 억제 효율을 결정하였다. 웨스턴 블롯팅에 의해 sfGFP 발현을 기초로 앰버 억제 효율을 결정하였다. 모든 경우에, eRF1 E55D 돌연변이체의 존재가 sfGFP 발현을 증가시켰다.
실시예 10 - 논의
본 발명가들은 천연의 번역 대조군에 비교하여 비-천연 아미노산 혼입 효율을 규정하여, 비-천연 아미노산 혼입 효율에서의 개선을 정량적으로 기준화하게 하였다. 본 발명가들에 의해 생성된 최적화된 시스템은 아미노산 1 및 2로 비-천연 아미노산 혼입 효율에서의 17 내지 20배 개선을 제공한다. 아미노산 1의 경우는 혼입 효율이 정지 코돈이 없는 대조군의 5%에서 85%로 증가되는 한편, 아미노산 2의 경우는 혼입 효율이 7%에서 157%로 증가된다. 또한, 최적화된 시스템은 3개의 위치에서 1 및 2가 혼입된 단백질의 수율을 측정불가능하게 낮은 수준에서 정지가 없는 대조군의 12% 및 43%로 각각 증가시킨다.
PylRS/tRNACUA 발현을 최적화하는 tRNACUA 수준의 최적화; 및 조작된 eRF1 변이체의 개발 및 사용을 포함하는 다양한 요인이 비-천연 아미노산 혼입에서의 극적인 개선에 기여한다. 최적화된 PylRS/tRNACUA 시스템을 단독으로 사용할 때 단일 앰버 코돈에 반응하여 비-천연 아미노산의 혼입이 꽤 효율적이지만, eRF1 (예를 들어, E55D)의 첨가에 의해 효율이 추가로 개선된다. 비-천연 아미노산 혼입에 대한 eRF1 돌연변이체의 효과는 비-천연 아미노산을 다중 부위에 혼입하는 경우에 더욱 극적이어서, 3개의 부위에 아미노산 1을 함유하는 단백질의 수율을 2 내지 3배 증가시키고, 3개의 부위에 2를 함유하는 단백질의 수율을 4배 증가시킨다.
실시예 11: 대안적인 eRF1 돌연변이체의 실연
본 발명가들은 HEK 293T 세포주에서의 일시적인 형질감염에 의해 eRF1 변이체를 처음으로 스크리닝하였다. 하기의 표는 스크리닝된 돌연변이를 비-천연 아미노산 혼입 (BocK)에 대한 이의 효과 순으로 정렬하여 열거한다. 관련 프로토콜 및 지원 자료는 상기 실시예에서와 같다.
실시예 12: 다양한 진핵생물 종에서의 eRF1 돌연변이체 기능성
본 발명은 다양한 진핵생물 종에서의 용도가 있다. 본 발명은 곤충 세포 예컨대 파리 세포 (예를 들어 드로소필라), 진균 세포 예컨대 효모 세포 및 기타 진핵생물에서 적용될 수 있다.
본 발명가들은 일시적인 형질감염을 사용하여 돌연변이체 eRF1을 곤충 (Dmel) 세포주 내로 도입하였다.
방법:
D.mel-2 세포 (S2)의 일시적인 형질감염
드로소필라 S2 세포 (D.Mel; 인비트로젠(Invitrogen))를 표준 세포 배양 관례에 따라 T75 플라스크에서 2 mM L-글루타민 및 pen/strep (50 I.U./mL 페니실린, 50 ㎍/mL 스트렙토마이신)이 보강된 완전한 익스프레스(Express) 5 SFM 배지 (라이프 테크놀러지즈 리미티드(Life technologies Ltd.)) 상에서 유지시켰다. 형질감염 24시간 전에, 긁어내거나 진탕시켜서 세포를 탈착시키고, 5 ml의 현탁된 세포를 8 ml의 미리 가온된 배지로 희석하였다. 24웰 플레이트에, 웰 당 0.5 ml의 현탁된 세포를 시딩하고, 하룻밤 동안 성장시켰다. 퓨진 HD(Fugene HD) (프로메가)를 사용하여 세포를 일시적으로 형질감염시켰다. 각각의 웰에 대해, 1.75 ㎕의 퓨진 HD를 15 ㎕의 멸균수와 혼합하고, 실온에서 5분 동안 인큐베이션하였다. 유사하게, 0.75 ㎍의 DNA (각각 0.3 ㎍의 리포터, PylRS/PylT 및 eRF1 구축물, 0.15 ㎍의 GAL4)를 15 ㎕의 멸균수에 희석하고, 희석된 퓨진 HD 시약에 첨가한 후, 실온에서 15분 동안 인큐베이션하였다. 표적 세포를 함유하는 각각의 웰에서, 소비된 성장 배지를 제거하고, 세포를 조심스럽게 500 ㎕ 멸균 PBS로 세정하였다. 그 후, 각각의 웰에 500 ㎕의 익스프레스 5 배지, 0.2 mM CuSO4 (시그마), 2 mM/ml 글루타민 및 비-천연 아미노산 (필요한 경우)을 채웠다. 1을 멸균수/NaOH에 용해시키고 (20 mM 1), 성장 배지에 첨가하였다. 이어서 4 M HCl을 사용하여 pH를 6.5로 조정하였다. 달리 언급되지 않는 한, 성장 배지 내의 2의 최종 농도는 2 mM이었다. 30 ㎕ 형질감염 믹스 중 25 ㎕를 각각의 웰에 점적식으로 첨가하였다. 플레이트를 조심스럽게 진탕시키고, 25℃에서 하룻밤 동안 인큐베이션하였다. 형질감염 16시간 후, 각각의 웰을 PBS로 세정하고, 실온에서 15분 동안 진탕시키면서 세포를 컴플리트 프로테아제 억제제 (로슈)가 첨가된 100 ㎕ RIPA 완충제 (시그마)에서 용해시켰다.
GFP-TAG-mCherry 구축물의 발현에 의해 비-천연 아미노산 혼입을 결정하였다. HEK293T 세포에 대해 기술된 바와 같이, GFP에 대해 면역염색된 블롯 상에서의 정량에 의해 전장 단백질 대 말단절단된 단백질의 비를 결정하였다.
드로소필라 멜라노가스터 유전자 구축물
His6 태그 및 삼중-정지 종결 신호를 함유하는 디. 멜라노가스터 코돈 용법에 대해 최적화된 인간 eRF1 유전자를 BamHI/NotI 제한 부위 (프라이머 eRF1_SG105)를 사용하여 플라스미드 SG105 (Bianco et al., 2012) 내로 클로닝하였다. SG105는 UASp로부터 유래되고, 흰눈 유전자좌의 하류에 제2의 다중 클로닝 부위를 함유한다 (Rørth, 1998). AB51은 U6-PylT 카세트의 6개의 카피 및 UAS-PylRS를 함유한다 (암브라 비안코(Ambra Bianco), 미공개 데이터).
디. 멜라노가스터에서의 비-천연 아미노산 혼입 효율의 결정
드로소필라 배아 주입 서비스 (베스트진 인크(Bestgene Inc.))를 사용하여 P 요소 주입에 의해 eRF1 변이체를 함유하는 트렌스제닉 파리 계통을 생성시켰다. 플라스미드 SG105 내로 클로닝된 eRF1 Δ100 및 E55D 구축물이 성공적으로 미세주입되었고, 각각 9개 및 7개의 독특한 계통으로 반송되었다.
파리 계통 스톡을 16℃에서 사과 플레이트 상에서 유지시켰다. 유전적 교배 및 비-천연 아미노산 혼입 실험을 위해, 파리를 25℃에서 유지시켰다. eRF1 Δ100 또는 E55D 변이체를 함유하는 파리 계통을 FT74-S2-nos 파리 계통으로부터의 처녀 암컷과 교배시켰다. 생성된 후손을 각각의 eRF1 계통에 좌우되는 유전자 마커의 올바른 조합에 대해 스크리닝하고, 추가 실험을 위해 유지시켰다.
FT74-S2-nos 계통은 PylRS/PylTCUA 쌍을 이용한 비-천연 아미노산 혼입을 지지하고, 이중 루시페라제 리포터를 발현한다. 게놈 상의 구축물 통합물은 UAS-이중-루시페라제(TAG) 리포터, UAS-PylRS, U6-PylT 카세트 (삼중-Rep-L)의 4개의 카피, 및 nos-Gal4-VP16 카세트 (블루밍톤(Bloomington) 4937)이다. 이러한 구축물 및 계통의 생성이 문헌 [Bianco et al., 2012]에 논의되어 있다.
화합물 2를 효모 페이스트 내로 혼합하여 파리에 급식하였다. 2를 물/NaOH에 10 mM의 최종 농도로 용해시키고, 페이스트성 경도가 달성될 때까지 건조 효모를 첨가하였다. 1M HCl을 첨가하여 페이스트를 중화시켰다. 파리 계통에서의 비-천연 아미노산 혼입을 측정하기 위해, 비-천연 아미노산 혼입을 위한 필요한 성분들, 뿐만 아니라 eRF1 변이체를 발현하는 각각의 계통의 암컷 파리 15마리를 튜브에서 5마리의 수컷과 짝지우고, 소량의 10 mM 2-효모 페이스트를 공급하였다. 24 및 48시간 후 파리를 신선한 2-효모 페이스트가 있는 새로운 튜브로 옮겼다. 제3일에, 오전에 2-효모 페이스트가 있는 새로운 튜브로 옮기고, 오후에 암컷 파리를 해부하였다.
해부를 위해, 파리를 CO2 패드 상에서 수집하였다. 암컷 파리를 현미경 하의 해부 유리로 옮기고, 후방 끝부분을 조심스럽게 제거하여 흉부로부터 난소를 단리하였다. 10-12마리의 파리로부터의 난소를 PBS 완충제 내에 수집하고, 1.5 ml 미세원심분리 튜브 내로 옮겼다. 튜브를 탁상용 원심분리기에서 최저 설정으로 30초 동안 원심분리하고, 상청액을 제거하였다. 100 ㎕의 1× 패시브 용해 완충제 (프로메가)를 첨가한 후, 용액이 우유와 같은 외관에 도달할 때까지 플라스틱 막자를 사용하여 난소를 갈아서 분쇄하였다. 전속력으로 3분 동안 원심분리하여 잔해물을 제거하였다. 상청액을 조심스럽게 제거하고, 다시 전속력으로 1분 동안 펠릿화하였다. 96웰 형식의 이중 루시페라제 검정법 당 10 ㎕의 이러한 용해물을 샘플 당 3중으로 사용하였다. 포유동물 세포 용해물에 대해 기술된 바와 같이 검정법 (프로메가)을 수행하였다.
도 12를 참조한다.
a. 유전적 배경의 도해. 피롤리실 aaRS/tRNACUA 쌍, 이중-루시페라제 리포터 및 난소-특이적 프로모터를 발현하는 파리 계통 FT74-S2-Nos/TM6으로부터의 처녀 암컷을 미세주입 (베스트진) 후에 eRF1 E55D 또는 Δ100의 무작위 게놈 삽입에 의해 생성된 밸런스(balanced) 파리 계통으로부터의 수컷과 교배시켰다. b, c. 이중 루시페라제 검정법에서의 정지 코돈 번역초과의 측정. 각각의 유전적 교배로부터의 올바른 유전자 마커가 있는 암컷 파리 12마리를 수집하고, 72시간 동안 10 mM CyP-효모 페이스트를 먹였다. 해부에 의해 난소를 수집하고, 풀링하고, UAG 번역초과에 대해 테스트하였다. 패널 b는 eRF1 E55D 통합 이벤트로부터 생성된 모든 파리 계통에 대한 결과를 열거하고, 패널 c는 eRF1 Δ100에 대한 결과를 열거한다.
실시예 13: PylT U25C 및 PylT U25C Opt 변이체 양쪽 모두가 HEK 세포에서 앰버를 효율적으로 억제한다
HEK 세포가 GFP150UAG 및 4× PylT U25C 또는 4× PylT U25C Opt로 형질감염되고, FACS를 통해 GFP 형광에 대해 분석되었으며, GFP-양성 집단이 백분율이 표시되면서 분홍색으로 원을 그리고, 그래프는 반복실험의 MFI이다. 표준 형질감염 및 유동 세포측정법 프로토콜이고, 2 mM BocK에서 발현된다. 도 13을 참조한다.
각각 4× PylT U25C 또는 4× PylT U25C Opt를 이용한 트라스투주맙 중쇄 (위치 A114에 UAG가 있고, LC 및 HC가 별개의 플라스미드 상에 있음)의 웨스턴 블롯. 반복 실험의 블롯 강도가 그래프용으로 측정된다. 표준 형질감염 및 웨스턴 블롯 프로토콜이고, 2 mM BocK에서 발현된다. 도 14 및 도 15를 참조한다.
비교를 위한 모체 엠. 마제이 Pyl tRNA(cua 안티코돈), U25C 유도체, U25C 및 Opt 유도체에 대한 tRNA 클로버잎형 다이어그램. U25C 돌연변이는 녹색으로, 뉴클레오티드 6개의 Opt 돌연변이는 분홍색으로 기재된다. 도 16을 참조한다.
tRNA 변이체들에 대한 DNA 서열의 서열 정렬 (차이는 흑색이다) - CCA 테일이 포유동물 플라스미드에서 명시적으로 코딩되지 않지만, 세포에 의해 전사 후에 부가된다는 것을 주지한다. 도 17을 참조한다.
엠. 마제이 PylT U25C Opt
(1×) 인간 U6 프로모터 :: 엠. 마제이 PylT U25C Opt :: 3' UTR 및 종결인자
클로닝된 바와 같은 (4×) 인간 U6 프로모터 :: 엠. 마제이 PylT U25C Opt :: 3' UTR 및 종결인자
이러한 4× 카세트가 상기 기술된 다양한 벡터, 예컨대 GFP(150 uag), 트라스투주맙 LC 및 HC (114 uag)가 있는 pKYM1 내의 4× PylT U25C 카세트를 교체할 수 있다.
실시예 14: eRF1 E55D가 항체 발현을 증가시킨다.
달리 언급되지 않는 한 모든 실험을 2 mM bocK로 행하였다. "CypK"로 열거된 것은 0.5 mM 시클로프로펜으로 행하였다. 양쪽 모두 피롤리신 모방체이다. HC 및 LC는 별개의 플라스미드 상에 있었고, 표준 PEI 프로토콜을 사용하여 1:1 비로 공동-형질감염시켰다. GFP 연구를 위해, 단일 플라스미드만 형질감염시켰다. 비-천연의 tRNA/신테타제 기구가 GFP/mAb 유전자와 동일한 플라스미드 상에 있기 때문에, 이러한 연구를 위해 추가의 플라스미드가 필요하지 않았다.
양쪽 모두의 항체 유전자, 뿐만 아니라 피롤리신 비-천연 아미노산 tRNA 및 신테타제를 함유하는 단일 벡터로부터 LC-ires-HC 형식으로 항체 발현을 행하였다. 이러한 4×PylT(u25c)/PylS 구축물은 상기 기술된 바와 같다.
eRF1은 표준 발현 벡터인 pcDNA5로부터 발현되었다. eRF1을 항체 플라스미드에 대해 1:5 비로 형질감염시켰다. 현탁 HEK 시스템인 Expi293 세포에서 실험을 행하였고, 이를 표준 프로토콜을 사용하여 PEI로 형질감염시켰다. 배양물은 각각 30 mL였고, 60 ug의 DNA + 180 ug의 PEI를 사용하였으며, 7일 동안 발현시켰다.
HRP에 접합된 항-HC 및 항-LC 항체를 사용하여, 배양물의 상청액으로부터 직접적으로 웨스턴 블롯팅하였다. 중쇄의 위치 Ala114에 UAG 앰버 코돈이 있는 트라스투주맙이 HEK 세포에서 eRF1 E55D와 본 발명가들의 발현 시스템으로 발현 증가를 나타낸다. 도 18을 참조한다.
구축물이 도 19에 있다. 플라스미드 다이어그램이 도 20에 있다. 서열은 하기와 같다.
pKYM1 LC-ires-HC 서열
HC A114X DNA 서열 + 리더 펩티드
LC DNA 서열 + 리더 펩티드
HC + A114X 돌연변이 단백질 서열 - *는 UAG 비-천연 부위를 나타낸다
LC 단백질 서열
실시예 15: eRF1 E55D가 HEK 세포에서 BCN 혼입을 강화한다
HEK293 3일 발현, 1 mM BCN (N엡실론-(비시클로[6.1.0]논-4-인-9-일메톡시)카르보닐-L-리신)), 1:1:1 비의 플라스미드, 상기 기술된 바와 같은 표준 프로토콜. 도 21을 참조한다.
약어
PylRS, 피롤리실-tRNA 신테타제; PylT, 피롤리실-tRNA 신테타제; eRF1, 진핵생물 방출 인자 1; eRF3, 진핵생물 방출 인자 3; sfGFP, 수퍼-폴더(super-folder) 녹색 형광 단백질.
참고문헌
보충 참고문헌
본원에서 인용되거나 기술된 임의의 간행물은 본 출원의 출원일 이전에 개시된 관련 정보를 제공한다. 본원에서의 서술은 본 발명가들이 이같은 개시내용을 선행할 자격이 없다는 것을 인정하는 것으로 해석되지 않아야 한다. 상기 명세서에서 언급된 모든 간행물은 본원에 참조로 포함된다. 본 발명의 다양한 변형 및 변경이 본 발명의 범주 및 취지를 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명이 구체적인 바람직한 실시양태와 관련되어 기술되었지만, 청구된 바와 같은 본 발명이 이같은 구체적인 실시양태에 과도하게 제한되지 않아야 한다는 것을 이해하여야 한다. 실제로, 분자생물학 및 화학 또는 관련 분야의 통상의 기술자에게 자명한, 본 발명을 수행하기 위한 기술된 양식의 다양한 변형이 하기 청구범위의 범주 내인 것으로 의도된다.
보충 표 S1
이러한 연구에서 사용된 합성 유전자의 뉴클레오티드 서열. A. 변형된 U6-PylT* 발현 카세트의 서열. PylT에 밑줄이 그어지고, 안티코돈이 적색으로 표시된다. B. 에이치. 사피엔스 코돈-최적화되고, C-말단 폴리히스티딘 태그가 있는 sfGFP(TAG)의 서열. 위치 150의 앰버 코돈이 적색으로 표시된다. C는 N-말단 폴리히스티딘 태그가 있는, 디. 멜라노가스터에 대한 코돈 최적화 후의 인간 eRF1 서열을 나타낸다.
보충 표 S2
부위-지정 돌연변이 유발에 사용된 올리고뉴클레오티드
서열
차트 1
SEQUENCE LISTING
<110> Medical Research Council
<120> Incorporation of Unnatural Amino Acids into Proteins
<130> |P10195WO|
<140> PCT/GB2015/053141
<141> 2015-10-21
<160> 67
<170> PatentIn version 3.5
<210> 1
<211> 9683
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid expression construct
<400> 1
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 60
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 120
agtgccacct aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 180
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 240
tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac 300
gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa 360
ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct 420
aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa 480
gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc 540
gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtccca ttcgccattc 600
aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 660
gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 720
cgacgttgta aaacgacggc cagtgagcgc gcctcgttca ttcacgtttt tgaacccgtg 780
gaggacgggc agactcgcgg tgcaaatgtg ttttacagcg tgatggagca gatgaagatg 840
ctcgacacgc tgcagaacac gcagctagat taaccctaga aagataatca tattgtgacg 900
tacgttaaag ataatcatgc gtaaaattga cgcatgtgtt ttatcggtct gtatatcgag 960
gtttatttat taatttgaat agatattaag ttttattata tttacactta catactaata 1020
ataaattcaa caaacaattt atttatgttt atttatttat taaaaaaaaa caaaaactca 1080
aaatttcttc tataaagtaa caaaactttt atgagggaca gccccccccc aaagccccca 1140
gggatgtaat tacgtccctc ccccgctagg gggcagcagc gagccgcccg gggctccgct 1200
ccggtccggc gctccccccg catccccgag ccggcagcgt gcggggacag cccgggcacg 1260
gggaaggtgg cacgggatcg ctttcctctg aacgcttctc gctgctcttt gagcctgcag 1320
acacctgggg ggatacgggg aaaaggcctc caaggccact aggaaaaacc gcacttgtcc 1380
ggaaaccccg ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc 1440
aggtttccgg tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt 1500
caagttacgg taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac 1560
ccaagaaatt attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc 1620
aaattaattc taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc 1680
atgggaaata ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg 1740
ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg 1800
tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg 1860
taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt 1920
attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc 1980
taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata 2040
ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac 2100
ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc 2160
tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg 2220
atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct 2280
acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc 2340
tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc 2400
ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac 2460
ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag 2520
atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt 2580
ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta 2640
ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc 2700
ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact 2760
agtaaggatc tgcgatcgct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt 2820
ccccgagaag ttggggggag gggtcggcaa ttgaacgggt gcctagagaa ggtggcgcgg 2880
ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga 2940
accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag 3000
aacacagctg aagcttcgag gggctcgcat ctctccttca cgcgcccgcc gccctacctg 3060
aggccgccat ccacgccggt tgagtcgcgt tctgccgcct cccgcctgtg gtgcctcctg 3120
aactgcgtcc gccgtctagg taagtttaaa gctcaggtcg agaccgggcc tttgtccggc 3180
gctcccttgg agcctaccta gactcagccg gctctccacg ctttgcctga ccctgcttgc 3240
tcaactctac gtctttgttt cgttttctgt tctgcgccgt tacagatcca agctgtgacc 3300
ggcgcctact ctagagctag cgtttaaact taagcttgcc accatggact acaaggacga 3360
cgacgacaag gacaagaagc ccctgaacac cctgatcagc gccacaggac tgtggatgtc 3420
cagaaccggc accatccaca agatcaagca ccacgaggtg tcccggtcca aaatctacat 3480
cgagatggcc tgcggcgatc acctggtcgt caacaacagc agaagcagcc ggacagccag 3540
agccctgcgg caccacaagt acagaaagac ctgcaagcgg tgcagagtgt ccgacgagga 3600
cctgaacaag ttcctgacca aggccaacga ggaccagacc agcgtgaaag tgaaggtggt 3660
gtccgccccc acccggacca agaaagccat gcccaagagc gtggccagag cccccaagcc 3720
cctggaaaac accgaagccg ctcaggccca gcccagcggc agcaagttca gccccgccat 3780
ccccgtgtct acccaggaaa gcgtcagcgt ccccgccagc gtgtccacca gcatctctag 3840
catctcaacc ggcgccacag cttctgccct ggtcaagggc aacaccaacc ccatcaccag 3900
catgtctgcc cctgtgcagg cctctgcccc agccctgacc aagtcccaga ccgaccggct 3960
ggaagtgctc ctgaacccca aggacgagat cagcctgaac agcggcaagc ccttccggga 4020
gctggaaagc gagctgctga gccggcggaa gaaggacctc cagcaaatct acgccgagga 4080
acgggagaac tacctgggca agctggaaag agagatcacc cggttcttcg tggaccgggg 4140
cttcctggaa atcaagagcc ccatcctgat ccccctggag tacatcgagc ggatgggcat 4200
cgacaacgac accgagctga gcaagcagat tttccgggtg gacaagaact tctgcctgcg 4260
gcccatgctg gcccccaacc tgtacaacta cctgcggaaa ctggatcgcg ctctgcccga 4320
ccccatcaag attttcgaga tcggcccctg ctaccggaaa gagagcgacg gcaaagagca 4380
cctggaagag tttacaatgc tgaacttttg ccagatgggc agcggctgca ccagagagaa 4440
cctggaatcc atcatcaccg actttctgaa ccacctgggg atcgacttca agatcgtggg 4500
cgacagctgc atggtgtacg gcgacaccct ggacgtgatg cacggcgacc tggaactgtc 4560
tagcgccgtc gtgggaccca tccctctgga ccgggagtgg ggcatcgata agccctggat 4620
cggagccggc ttcggcctgg aacggctgct gaaagtcaag cacgacttta agaacatcaa 4680
gcgggctgcc agaagcgaga gctactacaa cggcatcagc accaacctgt gatgataagg 4740
atccaaaatg tacagcggcc gcgcccctct ccctcccccc cccctaacgt tactggccga 4800
agccgcttgg aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg 4860
tcttttggca atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg 4920
ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt 4980
cctctggaag cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac 5040
cccccacctg gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca 5100
aaggcggcac aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg 5160
ctctcctcaa gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg 5220
ggatctgatc tggggcctcg gtgcacatgc tttacatgtg tttagtcgag gttaaaaaaa 5280
cgtctaggcc ccccgaacca cggggacgtg gttttccttt gaaaaacacg ataatacctc 5340
cggaatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 5400
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 5460
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 5520
actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 5580
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 5640
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 5700
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 5760
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 5820
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 5880
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 5940
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 6000
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 6060
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 6120
tcttgacgag ttcttctgag tcgacaatca acctctggat tacaaaattt gtgaaagatt 6180
gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc 6240
tttgtatcat gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 6300
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 6360
catcaatgta tcttatcatg tctggaattg actcaaatga tgtcaattag tctatcagaa 6420
gctatctggt ctcccttccg ggggacaaga catccctgtt taatatttaa acagcagtgt 6480
tcccaaactg ggttcttata tcccttgctc tggtcaacca ggttgcaggg tttcctgtcc 6540
tcacaggaac gaagtcccta aagaaacagt ggcagccagg tttagccccg gaattgactg 6600
gattcctttt ttagggccca ttggtatggc tttttccccg tatcccccca ggtgtctgca 6660
ggctcaaaga gcagcgagaa gcgttcagag gaaagcgatc ccgtgccacc ttccccgtgc 6720
ccgggctgtc cccgcacgct gccggctcgg ggatgcgggg ggagcgccgg accggagcgg 6780
agccccgggc ggctcgctgc tgccccctag cgggggaggg acgtaattac atccctgggg 6840
gctttggggg ggggctgtcc ctgatatcta taacaagaaa atatatatat aataagttat 6900
cacgtaagta gaacatgaaa taacaatata attatcgtat gagttaaatc ttaaaagtca 6960
cgtaaaagat aatcatgcgt cattttgact cacgcggtcg ttatagttca aaatcagtga 7020
cacttaccgc attgacaagc acgcctcacg ggagctccaa gcggcgactg agatgtccta 7080
aatgcacagc gacggattcg cgctatttag aaagagagag caatatttca agaatgcatg 7140
cgtcaatttt acgcagacta tctttctagg gttaatctag ctgcatcagg atcatatcgt 7200
cgggtctttt ttccggctca gtcatcgccc aagctggcgc tatctgggca tcggggagga 7260
agaagcccgt gccttttccc gcgaggttga agcggcatgg aaagagtttg ccgaggatga 7320
ctgctgctgc attgacgttg agcgaaaacg cacgtttacc atgatgattc gggaaggtgt 7380
ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc acctgggata ccagttcgtc 7440
gcggcttttc cggacacagt tccggatggt cagcccgaag cgcatcagca acccgaacaa 7500
taccggcgac agccggaact gccgtgccgg tgtgcagatt aatgacagcg gtgcggcgct 7560
gggatattac gtcagcgagg acgggtatcc tggctggatg ccgcagaaat ggacatggat 7620
accccgtgag ttacccggcg ggcgcgcttg gcgtaatcat ggtcatagct gtttcctgtg 7680
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 7740
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 7800
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 7860
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 7920
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 7980
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 8040
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 8100
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 8160
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 8220
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 8280
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 8340
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 8400
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 8460
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 8520
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 8580
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 8640
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 8700
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 8760
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 8820
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 8880
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 8940
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 9000
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 9060
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 9120
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 9180
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 9240
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 9300
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 9360
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 9420
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 9480
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 9540
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 9600
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 9660
acacggaaat gttgaatact cat 9683
<210> 2
<211> 9400
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid expression construct
<400> 2
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 60
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 120
agtgccacct aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 180
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 240
tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac 300
gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa 360
ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct 420
aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa 480
gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc 540
gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtccca ttcgccattc 600
aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 660
gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 720
cgacgttgta aaacgacggc cagtgagcgc gcctcgttca ttcacgtttt tgaacccgtg 780
gaggacgggc agactcgcgg tgcaaatgtg ttttacagcg tgatggagca gatgaagatg 840
ctcgacacgc tgcagaacac gcagctagat taaccctaga aagataatca tattgtgacg 900
tacgttaaag ataatcatgc gtaaaattga cgcatgtgtt ttatcggtct gtatatcgag 960
gtttatttat taatttgaat agatattaag ttttattata tttacactta catactaata 1020
ataaattcaa caaacaattt atttatgttt atttatttat taaaaaaaaa caaaaactca 1080
aaatttcttc tataaagtaa caaaactttt atgagggaca gccccccccc aaagccccca 1140
gggatgtaat tacgtccctc ccccgctagg gggcagcagc gagccgcccg gggctccgct 1200
ccggtccggc gctccccccg catccccgag ccggcagcgt gcggggacag cccgggcacg 1260
gggaaggtgg cacgggatcg ctttcctctg aacgcttctc gctgctcttt gagcctgcag 1320
acacctgggg ggatacgggg aaaaggcctc caaggccact aggaaaaacc gcacttgtcc 1380
ggaaaccccg ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc 1440
aggtttccgg tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt 1500
caagttacgg taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac 1560
ccaagaaatt attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc 1620
aaattaattc taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc 1680
atgggaaata ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg 1740
ggaatctaac ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg 1800
tgtttcgtcc tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg 1860
taagcatatg atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt 1920
attactttct acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc 1980
taattatctc tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata 2040
ggccctcttc ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac 2100
ccggctgaac ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc 2160
tttccacaag atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg 2220
atagtccatt ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct 2280
acgtcacgta ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc 2340
tctaacagcc ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc 2400
ctgcccaact aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac 2460
ggatttagag tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag 2520
atatataaag ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt 2580
ttaaaacata attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta 2640
ttttgtacta atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc 2700
ttgtatcgta tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact 2760
aggaaaaacc gcacttgtcc ggaaaccccg ggaatctaac ccggctgaac ggatttagag 2820
tccattcgat ctacatgatc aggtttccgg tgtttcgtcc tttccacaag atatataaag 2880
ccaagaaatc gaaatacttt caagttacgg taagcatatg atagtccatt ttaaaacata 2940
attttaaaac tgcaaactac ccaagaaatt attactttct acgtcacgta ttttgtacta 3000
atatctttgt gtttacagtc aaattaattc taattatctc tctaacagcc ttgtatcgta 3060
tatgcaaata tgaaggaatc atgggaaata ggccctcttc ctgcccaact agtaaggatc 3120
tgcgatcgct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag 3180
ttggggggag gggtcggcaa ttgaacgggt gcctagagaa ggtggcgcgg ggtaaactgg 3240
gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata 3300
agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacacagctg 3360
aagcttcgag gggctcgcat ctctccttca cgcgcccgcc gccctacctg aggccgccat 3420
ccacgccggt tgagtcgcgt tctgccgcct cccgcctgtg gtgcctcctg aactgcgtcc 3480
gccgtctagg taagtttaaa gctcaggtcg agaccgggcc tttgtccggc gctcccttgg 3540
agcctaccta gactcagccg gctctccacg ctttgcctga ccctgcttgc tcaactctac 3600
gtctttgttt cgttttctgt tctgcgccgt tacagatcca agctgtgacc ggcgcctact 3660
ctagagctag cgaattcgaa tttaaatcgg atcaccacca tggtgtccaa gggcgaggaa 3720
ctgttcaccg gcgtggtgcc catcctggtg gaactggatg gcgacgtgaa cggccacaag 3780
ttctctgtgc ggggagaggg cgaaggcgac gccacaaatg gcaagctgac cctgaagttc 3840
atctgcacca ccggcaagct gcccgtgcct tggcctaccc tcgtgaccac actgacctac 3900
ggcgtgcagt gcttcagcag ataccccgac catatgaagc ggcacgactt cttcaagagc 3960
gccatgcccg agggctacgt gcaggaacgg accatcagct tcaaggacga cggcacctac 4020
aagaccagag ccgaagtgaa gttcgagggc gacaccctcg tgaaccggat cgagctgaag 4080
ggcattgatt tcaaagagga cggcaacatc ctgggccaca agctggagta caacttcaac 4140
agccactagg tgtacatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 4200
atccggcaca acgtggaaga tggcagcgtg cagctggccg accactacca gcagaacacc 4260
cccatcggag atggccccgt gctgctgccc gacaaccact acctgagcac ccagagcgtg 4320
ctgagcaagg accccaacga gaagcgggac cacatggtgc tgctggaatt cgtgaccgcc 4380
gctggcatca cccacggcat ggacgagctg tacaagggca gccaccatca ccatcaccat 4440
tgataaggat cccagttacc atcgatgatc cgcggccgcg cccctctccc tccccccccc 4500
ctaacgttac tggccgaagc cgcttggaat aaggccggtg tgcgtttgtc tatatgttat 4560
tttccaccat attgccgtct tttggcaatg tgagggcccg gaaacctggc cctgtcttct 4620
tgacgagcat tcctaggggt ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg 4680
tcgtgaagga agcagttcct ctggaagctt cttgaagaca aacaacgtct gtagcgaccc 4740
tttgcaggca gcggaacccc ccacctggcg acaggtgcct ctgcggccaa aagccacgtg 4800
tataagatac acctgcaaag gcggcacaac cccagtgcca cgttgtgagt tggatagttg 4860
tggaaagagt caaatggctc tcctcaagcg tattcaacaa ggggctgaag gatgcccaga 4920
aggtacccca ttgtatggga tctgatctgg ggcctcggtg cacatgcttt acatgtgttt 4980
agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg ggacgtggtt ttcctttgaa 5040
aaacacgata atacctccgg aatgattgaa caagatggat tgcacgcagg ttctccggcc 5100
gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 5160
gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 5220
tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 5280
ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 5340
ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 5400
tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 5460
gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 5520
gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 5580
ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 5640
ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 5700
gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 5760
ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 5820
atcgccttct atcgccttct tgacgagttc ttctgagtcg acaatcaacc tctggattac 5880
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 5940
tacgctgctt taatgccttt gtatcatgtt aacttgttta ttgcagctta taatggttac 6000
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 6060
tgtggtttgt ccaaactcat caatgtatct tatcatgtct ggaattgact caaatgatgt 6120
caattagtct atcagaagct atctggtctc ccttccgggg gacaagacat ccctgtttaa 6180
tatttaaaca gcagtgttcc caaactgggt tcttatatcc cttgctctgg tcaaccaggt 6240
tgcagggttt cctgtcctca caggaacgaa gtccctaaag aaacagtggc agccaggttt 6300
agccccggaa ttgactggat tcctttttta gggcccattg gtatggcttt ttccccgtat 6360
ccccccaggt gtctgcaggc tcaaagagca gcgagaagcg ttcagaggaa agcgatcccg 6420
tgccaccttc cccgtgcccg ggctgtcccc gcacgctgcc ggctcgggga tgcgggggga 6480
gcgccggacc ggagcggagc cccgggcggc tcgctgctgc cccctagcgg gggagggacg 6540
taattacatc cctgggggct ttgggggggg gctgtccctg atatctataa caagaaaata 6600
tatatataat aagttatcac gtaagtagaa catgaaataa caatataatt atcgtatgag 6660
ttaaatctta aaagtcacgt aaaagataat catgcgtcat tttgactcac gcggtcgtta 6720
tagttcaaaa tcagtgacac ttaccgcatt gacaagcacg cctcacggga gctccaagcg 6780
gcgactgaga tgtcctaaat gcacagcgac ggattcgcgc tatttagaaa gagagagcaa 6840
tatttcaaga atgcatgcgt caattttacg cagactatct ttctagggtt aatctagctg 6900
catcaggatc atatcgtcgg gtcttttttc cggctcagtc atcgcccaag ctggcgctat 6960
ctgggcatcg gggaggaaga agcccgtgcc ttttcccgcg aggttgaagc ggcatggaaa 7020
gagtttgccg aggatgactg ctgctgcatt gacgttgagc gaaaacgcac gtttaccatg 7080
atgattcggg aaggtgtggc catgcacgcc tttaacggtg aactgttcgt tcaggccacc 7140
tgggatacca gttcgtcgcg gcttttccgg acacagttcc ggatggtcag cccgaagcgc 7200
atcagcaacc cgaacaatac cggcgacagc cggaactgcc gtgccggtgt gcagattaat 7260
gacagcggtg cggcgctggg atattacgtc agcgaggacg ggtatcctgg ctggatgccg 7320
cagaaatgga catggatacc ccgtgagtta cccggcgggc gcgcttggcg taatcatggt 7380
catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 7440
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 7500
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 7560
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 7620
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 7680
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 7740
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 7800
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 7860
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 7920
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 7980
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 8040
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 8100
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 8160
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 8220
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 8280
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 8340
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 8400
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 8460
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 8520
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 8580
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 8640
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 8700
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 8760
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 8820
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 8880
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 8940
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 9000
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 9060
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 9120
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 9180
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 9240
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 9300
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 9360
aaaagggaat aagggcgaca cggaaatgtt gaatactcat 9400
<210> 3
<211> 1320
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimised human eRF1
<400> 3
atggccgatg atccaagcgc cgcagaccgc aatgttgaga tctggaagat aaaaaagctg 60
ataaagagct tggaggccgc acggggcaac ggcacgtcca tgatatccct cattatccca 120
ccaaaggatc agatcagccg tgtggcgaag atgttggcgg atgagttcgg aacggccagt 180
aacattaaaa gtcgcgtgaa ccggctgtcg gtcttgggcg ccatcacttc cgtgcagcaa 240
cgtctgaaac tgtacaacaa agtcccaccc aacggtttgg tcgtctactg cggtacgata 300
gttaccgagg aaggaaagga gaagaaagtg aatattgatt tcgaaccatt taaaccgata 360
aacactagct tgtacttgtg cgacaataag tttcatacag aggcactcac ggccctgctg 420
agcgacgact cgaaattcgg attcattgtc attgatggaa gtggagcgct gttcggcacg 480
ctgcagggta acacgcgcga ggtcttgcac aaattcaccg tggacttgcc caaaaagcat 540
ggccgtggtg gccagagcgc cctcaggttt gcgcggctgc gcatggagaa gcgccataac 600
tacgtgcgca aggtcgcaga gacggctgtg cagctgttca tctcgggtga taaggtaaat 660
gtcgcgggac tggtgctcgc cggcagcgcg gacttcaaaa ccgagctgag tcagtccgac 720
atgttcgatc agcgtctgca gtcgaaggta ctgaagctcg tcgacattag ctacggcggc 780
gagaacggct tcaatcaggc catcgaactg agtaccgaag tcctcagtaa cgtaaagttt 840
attcaggaaa aaaagttgat tggacgctac tttgatgaaa taagccaaga tacgggcaaa 900
tactgttttg gcgtcgagga tactctgaaa gcgctcgaga tgggagcagt ggaaatactc 960
atcgtatatg aaaatctcga tataatgcgc tatgtactgc attgccaagg aacagaagag 1020
gagaaaattc tctacctcac cccggagcaa gagaaggaca agagccattt tacagacaag 1080
gagacgggcc aagagcacga gctcattgag tcgatgccct tgctcgaatg gtttgccaac 1140
aactacaaga agttcggcgc gaccctggaa attgtcacgg ataaatcgca ggagggcagc 1200
cagtttgtga agggcttcgg tggcatcggc ggcatcctcc gctaccgggt ggatttccaa 1260
ggcatggaat atcaaggtgg agatgatgaa ttcttcgatt tggatgatta ctaatgatag 1320
<210> 4
<211> 437
<212> PRT
<213> Homo sapiens
<400> 4
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 5
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 E55D
<400> 5
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Asp Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 6
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 N129P K130Q
<400> 6
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp
115 120 125
Pro Gln Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 7
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eFR1 T122Q S123F
<400> 7
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Gln Phe Leu Tyr Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 8
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 E55A
<400> 8
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Ala Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 9
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 Y125F
<400> 9
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Phe Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 10
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 T58K S60T S64D Y125F N129S
<400> 10
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Lys Ala Thr Asn Ile Lys Asp
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Phe Leu Cys Asp
115 120 125
Ser Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 11
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123A L124I Y125L
<400> 11
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ala Ile Leu Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 12
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123R L124W Y125R
<400> 12
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Arg Trp Arg Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 13
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123H, L124A, Y125G
<400> 13
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr His Ala Gly Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 14
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 M51A K130M
<400> 14
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Ala Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ser Leu Tyr Leu Cys Asp
115 120 125
Asn Met Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 15
<211> 438
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123A Y125V
<400> 15
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Ala Ala Leu Val Leu Cys
115 120 125
Asp Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp
130 135 140
Ser Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly
145 150 155 160
Thr Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp
165 170 175
Leu Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala
180 185 190
Arg Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu
195 200 205
Thr Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly
210 215 220
Leu Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser
225 230 235 240
Asp Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp
245 250 255
Ile Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser
260 265 270
Thr Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile
275 280 285
Gly Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe
290 295 300
Gly Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile
305 310 315 320
Leu Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys
325 330 335
Gln Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu
340 345 350
Lys Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu
355 360 365
Leu Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys
370 375 380
Lys Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly
385 390 395 400
Ser Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr
405 410 415
Arg Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe
420 425 430
Phe Asp Leu Asp Asp Tyr
435
<210> 16
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123L L124C Y125S
<400> 16
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Leu Cys Ser Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 17
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123L L124S Y125S
<400> 17
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Leu Ser Ser Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 18
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant eRF1 S123V L124T Y125P
<400> 18
Met Ala Asp Asp Pro Ser Ala Ala Asp Arg Asn Val Glu Ile Trp Lys
1 5 10 15
Ile Lys Lys Leu Ile Lys Ser Leu Glu Ala Ala Arg Gly Asn Gly Thr
20 25 30
Ser Met Ile Ser Leu Ile Ile Pro Pro Lys Asp Gln Ile Ser Arg Val
35 40 45
Ala Lys Met Leu Ala Asp Glu Phe Gly Thr Ala Ser Asn Ile Lys Ser
50 55 60
Arg Val Asn Arg Leu Ser Val Leu Gly Ala Ile Thr Ser Val Gln Gln
65 70 75 80
Arg Leu Lys Leu Tyr Asn Lys Val Pro Pro Asn Gly Leu Val Val Tyr
85 90 95
Cys Gly Thr Ile Val Thr Glu Glu Gly Lys Glu Lys Lys Val Asn Ile
100 105 110
Asp Phe Glu Pro Phe Lys Pro Ile Asn Thr Val Thr Pro Leu Cys Asp
115 120 125
Asn Lys Phe His Thr Glu Ala Leu Thr Ala Leu Leu Ser Asp Asp Ser
130 135 140
Lys Phe Gly Phe Ile Val Ile Asp Gly Ser Gly Ala Leu Phe Gly Thr
145 150 155 160
Leu Gln Gly Asn Thr Arg Glu Val Leu His Lys Phe Thr Val Asp Leu
165 170 175
Pro Lys Lys His Gly Arg Gly Gly Gln Ser Ala Leu Arg Phe Ala Arg
180 185 190
Leu Arg Met Glu Lys Arg His Asn Tyr Val Arg Lys Val Ala Glu Thr
195 200 205
Ala Val Gln Leu Phe Ile Ser Gly Asp Lys Val Asn Val Ala Gly Leu
210 215 220
Val Leu Ala Gly Ser Ala Asp Phe Lys Thr Glu Leu Ser Gln Ser Asp
225 230 235 240
Met Phe Asp Gln Arg Leu Gln Ser Lys Val Leu Lys Leu Val Asp Ile
245 250 255
Ser Tyr Gly Gly Glu Asn Gly Phe Asn Gln Ala Ile Glu Leu Ser Thr
260 265 270
Glu Val Leu Ser Asn Val Lys Phe Ile Gln Glu Lys Lys Leu Ile Gly
275 280 285
Arg Tyr Phe Asp Glu Ile Ser Gln Asp Thr Gly Lys Tyr Cys Phe Gly
290 295 300
Val Glu Asp Thr Leu Lys Ala Leu Glu Met Gly Ala Val Glu Ile Leu
305 310 315 320
Ile Val Tyr Glu Asn Leu Asp Ile Met Arg Tyr Val Leu His Cys Gln
325 330 335
Gly Thr Glu Glu Glu Lys Ile Leu Tyr Leu Thr Pro Glu Gln Glu Lys
340 345 350
Asp Lys Ser His Phe Thr Asp Lys Glu Thr Gly Gln Glu His Glu Leu
355 360 365
Ile Glu Ser Met Pro Leu Leu Glu Trp Phe Ala Asn Asn Tyr Lys Lys
370 375 380
Phe Gly Ala Thr Leu Glu Ile Val Thr Asp Lys Ser Gln Glu Gly Ser
385 390 395 400
Gln Phe Val Lys Gly Phe Gly Gly Ile Gly Gly Ile Leu Arg Tyr Arg
405 410 415
Val Asp Phe Gln Gly Met Glu Tyr Gln Gly Gly Asp Asp Glu Phe Phe
420 425 430
Asp Leu Asp Asp Tyr
435
<210> 19
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> linker
<400> 19
gacaagtgcg g 11
<210> 20
<211> 1290
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimised MbPylRS
<400> 20
atggactaca aggacgacga cgacaaggac aagaaacccc tggacgtgct gatcagcgcc 60
accggcctgt ggatgagccg gaccggcacc ctgcacaaga tcaagcacca cgaggtgtca 120
agaagcaaaa tctacatcga gatggcctgc ggcgaccacc tggtggtgaa caacagcaga 180
agctgccgga ccgccagagc cttccggcac cacaagtaca gaaagacctg caagcggtgc 240
cgggtgtccg acgaggacat caacaacttt ctgaccagaa gcaccgagag caagaacagc 300
gtgaaagtgc gggtggtgtc cgcccccaaa gtgaagaaag ccatgcccaa gagcgtgtcc 360
agagccccca agcccctgga aaacagcgtg tccgccaagg ccagcaccaa caccagccgc 420
agcgtgccca gccccgccaa gagcaccccc aacagctccg tgcccgcctc tgctcctgct 480
cccagcctga cacggtccca gctggacaga gtggaggccc tgctgtcccc cgaggacaag 540
atcagcctga acatggccaa gcccttccgg gagctggaac ccgagctggt gacccggcgg 600
aagaacgact tccagcggct gtacaccaac gaccgggagg actacctggg caagctggaa 660
cgggacatca ccaagttctt cgtggaccgg ggcttcctgg aaatcaagag ccccatcctg 720
atccccgccg agtacgtgga gcggatgggc atcaacaacg acaccgagct gtccaagcag 780
attttccggg tggacaagaa cctgtgcctg cggcctatgc tggcccccac cctgtacaac 840
tacctgcgga aactggacag aatcctgcct ggccccatca agattttcga agtgggaccc 900
tgctaccgga aagagagcga cggcaaagag cacctggaag agtttacaat ggtgaatttt 960
tgccagatgg gcagcggctg cacccgggag aacctggaag ccctgatcaa agagttcctg 1020
gattacctgg aaatcgactt cgagatcgtg ggcgacagct gcatggtgta cggcgacacc 1080
ctggacatca tgcacggcga cctggaactg agcagcgccg tggtgggacc cgtgtccctg 1140
gaccgggagt ggggcatcga caagccctgg atcggagccg gcttcggcct ggaacggctg 1200
ctgaaagtga tgcacggctt caagaacatc aagcgggcca gcagaagcga gagctactac 1260
aacggcatca gcaccaacct gtgatgataa 1290
<210> 21
<211> 1396
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimised MmPylRS
<400> 21
atggactaca aggacgacga cgacaaggga caagaagccc ctgaacaccc tgatcagcgc 60
cacaggactg tggatgtcca gaaccggcac catccacaag atcaagcacc acgaggtgtc 120
ccggtccaaa atctacatcg agatggcctg cggcgatcac ctggtcgtca acaacagcag 180
aagcagccgg acagccagag ccctgcggca ccacaagtac agaaagacct gcaagcggtg 240
cagagtgtcc gacgaggacc tgaacaagtt cctgaccaag gccaacgagg accagaccag 300
cgtgaaagtg aaggtggtgt ccgcccccac ccggaccaag aaagccatgc ccaagagcgt 360
ggccagagcc cccaagcccc tggaaaacac cgaagccgct caggcccagc ccagcggcag 420
caagttcagc cccgccatcc ccgtgtctac ccaggaaagc gtcagcgtcc ccgccagcgt 480
gtccaccagc atctctagca tctcaaccgg cgccacagct tctgccctgg tcaagggcaa 540
caccaacccc atcaccagca tgtctgcccc tgtgcaggcc tctgccccag ccctgaccaa 600
gtcccagacc gaccggctgg aagtgctcct gaaccccaag gacgagatca gcctgaacag 660
cggcaagccc ttccgggagc tggaaagcga gctgctgagc cggcggaaga aggacctcca 720
gcaaatctac gccgaggaac gggagaacta cctgggcaag ctggaaagag agatcacccg 780
gttcttcgtg gaccggggct tcctggaaat caagagcccc atcctgatcc ccctggagta 840
catcgagcgg atgggcatcg acaacgacac cgagctgagc aagcagattt tccgggtgga 900
caagaacttc tgcctgcggc ccatgctggc ccccaacctg tacaactacc tgcggaaact 960
ggatcgcgct ctgcccgacc ccatcaagat tttcgagatc ggcccctgct accggaaaga 1020
gagcgacggc aaagagcacc tggaagagtt tacaatgctg aacttttgcc agatgggcag 1080
cggctgcacc agagagaacc tggaatccat catcaccgac tttctgaacc acctggggat 1140
cgacttcaag atcgtgggcg acagctgcat ggtgtacggc gacaccctgg acgtgatgca 1200
cggcgacctg gaactgtcta gcgccgtcgt gggacccatc cctctggacc gggagtgggg 1260
catcgataag ccctggatcg gagccggctt cggcctggaa cggctgctga aagtcaagca 1320
cgactttaag aacatcaagc gggctgccag aagcgagagc tactacaacg gcatcagcac 1380
caacctgtga tgataa 1396
<210> 22
<211> 61
<212> DNA
<213> Methanosarcina mazeii
<400> 22
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 60
g 61
<210> 23
<211> 344
<212> DNA
<213> Artificial Sequence
<220>
<223> U6 promoter - linker - terminator
<400> 23
tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 60
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 120
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 180
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 240
gtggaaagga cgaaacaccg gaaacctgat catgtagatc gaatggactc taaatccgtt 300
cagccgggtt agattcccgg ggtttccgga caagtgcggt tttt 344
<210> 24
<211> 260
<212> DNA
<213> Artificial Sequence
<220>
<223> exemplary U6 promoter
<400> 24
tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 60
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 120
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 180
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 240
gtggaaagga cgaaacaccg 260
<210> 25
<211> 556
<212> DNA
<213> Artificial Sequence
<220>
<223> exemplary EF-1 alpha promoter
<400> 25
ctagtaagga tctgcgatcg ctccggtgcc cgtcagtggg cagagcgcac atcgcccaca 60
gtccccgaga agttgggggg aggggtcggc aattgaacgg gtgcctagag aaggtggcgc 120
ggggtaaact gggaaagtga tgtcgtgtac tggctccgcc tttttcccga gggtggggga 180
gaaccgtata taagtgcagt agtcgccgtg aacgttcttt ttcgcaacgg gtttgccgcc 240
agaacacagc tgaagcttcg aggggctcgc atctctcctt cacgcgcccg ccgccctacc 300
tgaggccgcc atccacgccg gttgagtcgc gttctgccgc ctcccgcctg tggtgcctcc 360
tgaactgcgt ccgccgtcta ggtaagttta aagctcaggt cgagaccggg cctttgtccg 420
gcgctccctt ggagcctacc tagactcagc cggctctcca cgctttgcct gaccctgctt 480
gctcaactct acgtctttgt ttcgttttct gttctgcgcc gttacagatc caagctgtga 540
ccggcgccta ctctag 556
<210> 26
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA probe
<400> 26
ggaaaccccg ggaatctaac ccggctgaac ggatttagag 40
<210> 27
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> M. Mazei PylT U25C Opt
<400> 27
ggaaacgtga tcatgtagat cgaacggact ctaaatccgt tcagtggggt tagattcccc 60
acgtttccg 69
<210> 28
<211> 350
<212> DNA
<213> Artificial Sequence
<220>
<223> (1x) Human U6 promoter :: M. Mazei PylT U25C Opt :: 3' UTR and
terminator
<400> 28
cctagttggg caggaagagg gcctatttcc catgattcct tcatatttgc atatacgata 60
caaggctgtt agagagataa ttagaattaa tttgactgta aacacaaaga tattagtaca 120
aaatacgtga cgtagaaagt aataatttct tgggtagttt gcagttttaa aattatgttt 180
taaaatggac tatcatatgc ttaccgtaac ttgaaagtat ttcgatttct tggctttata 240
tatcttgtgg aaaggacgaa acaccggaaa cgtgatcatg tagatcgaac ggactctaaa 300
tccgttcagt ggggttagat tccccacgtt tccggacaag tgcggttttt 350
<210> 29
<211> 1642
<212> DNA
<213> Artificial Sequence
<220>
<223> (4x) Human U6 promoter :: M. Mazei PylT U25C Opt :: 3' UTR and
terminator as cloned
<400> 29
tgggcgatgt gcgctctgcc cactgacggg caccggagcg atcgcagatc ccctagttgg 60
gcaggaagag ggcctatttc ccatgattcc ttcatatttg catatacgat acaaggctgt 120
tagagagata attagaatta atttgactgt aaacacaaag atattagtac aaaatacgtg 180
acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga 240
ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat atatcttgtg 300
gaaaggacga aacaccggaa acgtgatcat gtagatcgaa cggactctaa atccgttcag 360
tggggttaga ttccccacgt ttccggacaa gtgcggtttt tagaattaca acttatatcg 420
tatgggctag actcgagcct agttgggcag gaagagggcc tatttcccat gattccttca 480
tatttgcata tacgatacaa ggctgttaga gagataatta gaattaattt gactgtaaac 540
acaaagatat tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca 600
gttttaaaat tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc 660
gatttcttgg ctttatatat cttgtggaaa ggacgaaaca ccggaaacgt gatcatgtag 720
atcgaacgga ctctaaatcc gttcagtggg gttagattcc ccacgtttcc ggacaagtgc 780
ggtttttgcg gccgcgatat ctgcagaatt cacactggac taggatccga gctccctagt 840
tgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 900
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 960
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 1020
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 1080
gtggaaagga cgaaacaccg gaaacgtgat catgtagatc gaacggactc taaatccgtt 1140
cagtggggtt agattcccca cgtttccgga caagtgcggt ttttggtacc aagcttaagc 1200
agactcgtcg tgactacatt agcctagttg ggcaggaaga gggcctattt cccatgattc 1260
cttcatattt gcatatacga tacaaggctg ttagagagat aattagaatt aatttgactg 1320
taaacacaaa gatattagta caaaatacgt gacgtagaaa gtaataattt cttgggtagt 1380
ttgcagtttt aaaattatgt tttaaaatgg actatcatat gcttaccgta acttgaaagt 1440
atttcgattt cttggcttta tatatcttgt ggaaaggacg aaacaccgga aacgtgatca 1500
tgtagatcga acggactcta aatccgttca gtggggttag attccccacg tttccggaca 1560
agtgcggttt ttcctagtgg ccttggaggc cttttccccg tatcccccca ggtgtctgca 1620
ggctcaaaga gcagcgagaa gc 1642
<210> 30
<211> 10627
<212> DNA
<213> Artificial Sequence
<220>
<223> pKYM1 LC-ires-HC sequence
<400> 30
gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat atacgcgttg acattgatta 60
ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc atatatggag 120
ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc 180
ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac tttccattga 240
cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat 300
atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc 360
cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct 420
attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca 480
cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat 540
caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg 600
cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg 660
agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgg 720
actctagagg atcgaattaa gcttggtacc gccgccacca tgggatggtc atgtatcatc 780
ctttttctag tagcaactgc aaccggtgta cattctgaca tccagatgac ccagtccccg 840
agctctctgt ctgcgtctgt tggtgaccgc gttaccatca cctgccgtgc gtcccaggac 900
gttaacaccg ccgtggcgtg gtatcaacag aaaccgggta aagcgccaaa actgctgatc 960
tactccgcgt ctttcctgta ctctggtgtt ccgtctcgtt tcagcggttc tcgttctggt 1020
actgacttca ccctcaccat ctcttctctg cagccggaag acttcgcgac ctactactgc 1080
cagcagcact acaccacccc accgaccttc ggtcagggca ccaaagttga aatcaaacgt 1140
acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga 1200
actgcctctg ttgtgtgcct gctgaataac ttctacccca gagaagccaa agtgcagtgg 1260
aaggtggaca acgccctgca gagcggaaac agccaggaaa gcgtgacaga gcaggattcc 1320
aaggattcca catacagcct gagcagcaca ctgacactgt ccaaggccga ctacgagaag 1380
cacaaggtgt acgcctgcga agtgacacac cagggactgt cctcccctgt gacaaagagc 1440
ttcaacagag gagaatgctg aggccgcgcc cctctccctc ccccccccct aacgttactg 1500
gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 1560
tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 1620
ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 1680
cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 1740
ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 1800
ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 1860
aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 1920
gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 1980
aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa acacgataat 2040
acctccggaa tgggatggtc atgtatcatc ctttttctag tagcaactgc aaccggtgta 2100
cattctgaag ttcagctggt tgaatctggt ggtggtctgg ttcaaccggg tggctccctg 2160
cgtctgtctt gtgcggcctc tggttttaac atcaaagata cctatatcca ctgggttcgt 2220
caggcgccag gcaaaggtct ggaatgggtt gcgcgtatct acccgaccaa cggttacacc 2280
cgctacgcgg actctgttaa aggtcgtttc accatctctg cggacacctc taaaaacacc 2340
gcgtacctgc agatgaactc tctgcgtgcg gaagacaccg ccgtttacta ctgctctcgt 2400
tggggtggtg acggtttcta cgcgatggac tactggggtc agggtacgct ggttaccgtt 2460
tcttcttagt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc 2520
tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga acctgtgacg 2580
gtctcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag 2640
tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc 2700
cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt 2760
gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 2820
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 2880
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 2940
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 3000
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 3060
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 3120
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 3180
gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 3240
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 3300
cccgtgctgg actccgacgg ctccttcttc ctctatagca agctcaccgt ggacaagagc 3360
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 3420
tacacgcaga agagcctctc cctgtccccg ggttgagctc gagtctagag ggttcgatcc 3480
ctaccggtta gtaatgagtt taaactcgac aatcaacctc tggattacaa aatttgtgaa 3540
agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 3600
atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 3660
tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 3720
tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 3780
ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 3840
cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 3900
gggaagctga cgtcctttcc atggctgctc gcctgtgttg ccacctggat tctgcgcggg 3960
acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 4020
ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 4080
ctttgggccg cctccccgcc tggaaacggg ggaggctaac tgaaacacgg aaggagacaa 4140
taccggaagg aacccgcgct atgacggcaa taaaaagaca gaataaaacg cacgggtgtt 4200
gggtcgtttg ttcataaacg cggggttcgg tcccagggct ggcactctgt cgatacccca 4260
ccgagacccc attggggcca atacgcccgc gtttcttcct tttccccacc ccacccccca 4320
agttcgggtg aaggcccagg gctcgcagcc aacgtcgggg cggcaggccc tgccatagca 4380
gatctgcgca gctctataaa gtaacaaaac ttttatgagg gacagccccc ccccaaagcc 4440
cccagggatg taattacgtc cctcccccgc tagggggcag cagcgagccg cccggggctc 4500
cgctccggtc cggcgctccc cccgcatccc cgagccggca gcgtgcgggg acagcccggg 4560
cacggggaag gtggcacggg atcgctttcc tctgaacgct tctcgctgct ctttgagcct 4620
gcagacacct ggggggatac ggggaaaagg cctccaaggc cactaggaaa aaccgcactt 4680
gtccggaaac cccgggaatc taacccggct gaacggattt agagtccatt cgatctacat 4740
gatcaggttt ccggtgtttc gtcctttcca caagatatat aaagccaaga aatcgaaata 4800
ctttcaagtt acggtaagca tatgatagtc cattttaaaa cataatttta aaactgcaaa 4860
ctacccaaga aattattact ttctacgtca cgtattttgt actaatatct ttgtgtttac 4920
agtcaaatta attctaatta tctctctaac agccttgtat cgtatatgca aatatgaagg 4980
aatcatggga aataggccct cttcctgccc aactaggaaa aaccgcactt gtccggaaac 5040
cccgggaatc taacccggct gaacggattt agagtccatt cgatctacat gatcaggttt 5100
ccggtgtttc gtcctttcca caagatatat aaagccaaga aatcgaaata ctttcaagtt 5160
acggtaagca tatgatagtc cattttaaaa cataatttta aaactgcaaa ctacccaaga 5220
aattattact ttctacgtca cgtattttgt actaatatct ttgtgtttac agtcaaatta 5280
attctaatta tctctctaac agccttgtat cgtatatgca aatatgaagg aatcatggga 5340
aataggccct cttcctgccc aactaggaaa aaccgcactt gtccggaaac cccgggaatc 5400
taacccggct gaacggattt agagtccatt cgatctacat gatcaggttt ccggtgtttc 5460
gtcctttcca caagatatat aaagccaaga aatcgaaata ctttcaagtt acggtaagca 5520
tatgatagtc cattttaaaa cataatttta aaactgcaaa ctacccaaga aattattact 5580
ttctacgtca cgtattttgt actaatatct ttgtgtttac agtcaaatta attctaatta 5640
tctctctaac agccttgtat cgtatatgca aatatgaagg aatcatggga aataggccct 5700
cttcctgccc aactaggaaa aaccgcactt gtccggaaac cccgggaatc taacccggct 5760
gaacggattt agagtccatt cgatctacat gatcaggttt ccggtgtttc gtcctttcca 5820
caagatatat aaagccaaga aatcgaaata ctttcaagtt acggtaagca tatgatagtc 5880
cattttaaaa cataatttta aaactgcaaa ctacccaaga aattattact ttctacgtca 5940
cgtattttgt actaatatct ttgtgtttac agtcaaatta attctaatta tctctctaac 6000
agccttgtat cgtatatgca aatatgaagg aatcatggga aataggccct cttcctgccc 6060
aactagtaag gatctgcgat cgctccggtg cccgtcagtg ggcagagcgc acatcgccca 6120
cagtccccga gaagttgggg ggaggggtcg gcaattgaac gggtgcctag agaaggtggc 6180
gcggggtaaa ctgggaaagt gatgtcgtgt actggctccg cctttttccc gagggtgggg 6240
gagaaccgta tataagtgca gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg 6300
ccagaacaca gctgaagctt cgaggggctc gcatctctcc ttcacgcgcc cgccgcccta 6360
cctgaggccg ccatccacgc cggttgagtc gcgttctgcc gcctcccgcc tgtggtgcct 6420
cctgaactgc gtccgccgtc taggtaagtt taaagctcag gtcgagaccg ggcctttgtc 6480
cggcgctccc ttggagccta cctagactca gccggctctc cacgctttgc ctgaccctgc 6540
ttgctcaact ctacgtcttt gtttcgtttt ctgttctgcg ccgttacaga tccaagctgt 6600
gaccggcgcc tactctagag ctagcgttta aacttaagct tgccaccatg gactacaagg 6660
acgacgacga caaggacaag aagcccctga acaccctgat cagcgccaca ggactgtgga 6720
tgtccagaac cggcaccatc cacaagatca agcaccacga ggtgtcccgg tccaaaatct 6780
acatcgagat ggcctgcggc gatcacctgg tcgtcaacaa cagcagaagc agccggacag 6840
ccagagccct gcggcaccac aagtacagaa agacctgcaa gcggtgcaga gtgtccgacg 6900
aggacctgaa caagttcctg accaaggcca acgaggacca gaccagcgtg aaagtgaagg 6960
tggtgtccgc ccccacccgg accaagaaag ccatgcccaa gagcgtggcc agagccccca 7020
agcccctgga aaacaccgaa gccgctcagg cccagcccag cggcagcaag ttcagccccg 7080
ccatccccgt gtctacccag gaaagcgtca gcgtccccgc cagcgtgtcc accagcatct 7140
ctagcatctc aaccggcgcc acagcttctg ccctggtcaa gggcaacacc aaccccatca 7200
ccagcatgtc tgcccctgtg caggcctctg ccccagccct gaccaagtcc cagaccgacc 7260
ggctggaagt gctcctgaac cccaaggacg agatcagcct gaacagcggc aagcccttcc 7320
gggagctgga aagcgagctg ctgagccggc ggaagaagga cctccagcaa atctacgccg 7380
aggaacggga gaactacctg ggcaagctgg aaagagagat cacccggttc ttcgtggacc 7440
ggggcttcct ggaaatcaag agccccatcc tgatccccct ggagtacatc gagcggatgg 7500
gcatcgacaa cgacaccgag ctgagcaagc agattttccg ggtggacaag aacttctgcc 7560
tgcggcccat gctggccccc aacctgtaca actacctgcg gaaactggat cgcgctctgc 7620
ccgaccccat caagattttc gagatcggcc cctgctaccg gaaagagagc gacggcaaag 7680
agcacctgga agagtttaca atgctgaact tttgccagat gggcagcggc tgcaccagag 7740
agaacctgga atccatcatc accgactttc tgaaccacct ggggatcgac ttcaagatcg 7800
tgggcgacag ctgcatggtg tacggcgaca ccctggacgt gatgcacggc gacctggaac 7860
tgtctagcgc cgtcgtggga cccatccctc tggaccggga gtggggcatc gataagccct 7920
ggatcggagc cggcttcggc ctggaacggc tgctgaaagt caagcacgac tttaagaaca 7980
tcaagcgggc tgccagaagc gagagctact acaacggcat cagcaccaac ctgtgatgag 8040
gatccgcggc cgcgcccctc tccctccccc ccccctaacg ttactggccg aagccggagt 8100
tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 8160
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 8220
tcatcaatgt atcttatcat gtctgtatac cgtcgacctc tagctagagc ttggcgtaat 8280
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 8340
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 8400
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 8460
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8520
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8580
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 8640
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8700
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8760
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8820
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 8880
aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 8940
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9000
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 9060
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9120
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9180
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9240
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9300
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 9360
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 9420
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 9480
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 9540
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 9600
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 9660
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 9720
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 9780
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 9840
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 9900
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9960
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 10020
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 10080
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 10140
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 10200
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 10260
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 10320
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 10380
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 10440
tcgacggatc gggagatctc ccgatcccct atggtcgact ctcagtacaa tctgctctga 10500
tgccgcatag ttaagccagt atctgctccc tgcttgtgtg ttggaggtcg ctgagtagtg 10560
cgcgagcaaa atttaagcta caacaaggca aggcttgacc gacaattgca tgaagaatct 10620
gcttagg 10627
<210> 31
<211> 1404
<212> DNA
<213> Artificial Sequence
<220>
<223> HC A114X DNA sequence with leader peptide
<400> 31
atgggatggt catgtatcat cctttttcta gtagcaactg caaccggtgt acattctgaa 60
gttcagctgg ttgaatctgg tggtggtctg gttcaaccgg gtggctccct gcgtctgtct 120
tgtgcggcct ctggttttaa catcaaagat acctatatcc actgggttcg tcaggcgcca 180
ggcaaaggtc tggaatgggt tgcgcgtatc tacccgacca acggttacac ccgctacgcg 240
gactctgtta aaggtcgttt caccatctct gcggacacct ctaaaaacac cgcgtacctg 300
cagatgaact ctctgcgtgc ggaagacacc gccgtttact actgctctcg ttggggtggt 360
gacggtttct acgcgatgga ctactggggt cagggtacgc tggttaccgt ttcttcttag 420
tcgaccaagg gcccatcggt cttccccctg gcaccctcct ccaagagcac ctctgggggc 480
acagcggccc tgggctgcct ggtcaaggac tacttccccg aacctgtgac ggtctcgtgg 540
aactcaggcg ccctgaccag cggcgtgcac accttcccgg ctgtcctaca gtcctcagga 600
ctctactccc tcagcagcgt ggtgaccgtg ccctccagca gcttgggcac ccagacctac 660
atctgcaacg tgaatcacaa gcccagcaac accaaggtgg acaagaaagt tgagcccaaa 720
tcttgtgaca aaactcacac atgcccaccg tgcccagcac ctgaactcct ggggggaccg 780
tcagtcttcc tcttcccccc aaaacccaag gacaccctca tgatctcccg gacccctgag 840
gtcacatgcg tggtggtgga cgtgagccac gaagaccctg aggtcaagtt caactggtac 900
gtggacggcg tggaggtgca taatgccaag acaaagccgc gggaggagca gtacaacagc 960
acgtaccgtg tggtcagcgt cctcaccgtc ctgcaccagg actggctgaa tggcaaggag 1020
tacaagtgca aggtctccaa caaagccctc ccagccccca tcgagaaaac catctccaaa 1080
gccaaagggc agccccgaga accacaggtg tacaccctgc ccccatcccg ggaggagatg 1140
accaagaacc aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc 1200
gtggagtggg agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg 1260
gactccgacg gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag 1320
caggggaacg tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag 1380
aagagcctct ccctgtcccc gggt 1404
<210> 32
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> LC DNA sequence with leader peptide
<400> 32
atgggatggt catgtatcat cctttttcta gtagcaactg caaccggtgt acattctgac 60
atccagatga cccagtcccc gagctctctg tctgcgtctg ttggtgaccg cgttaccatc 120
acctgccgtg cgtcccagga cgttaacacc gccgtggcgt ggtatcaaca gaaaccgggt 180
aaagcgccaa aactgctgat ctactccgcg tctttcctgt actctggtgt tccgtctcgt 240
ttcagcggtt ctcgttctgg tactgacttc accctcacca tctcttctct gcagccggaa 300
gacttcgcga cctactactg ccagcagcac tacaccaccc caccgacctt cggtcagggc 360
accaaagttg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct 420
gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgctgaataa cttctacccc 480
agagaagcca aagtgcagtg gaaggtggac aacgccctgc agagcggaaa cagccaggaa 540
agcgtgacag agcaggattc caaggattcc acatacagcc tgagcagcac actgacactg 600
tccaaggccg actacgagaa gcacaaggtg tacgcctgcg aagtgacaca ccagggactg 660
tcctcccctg tgacaaagag cttcaacaga ggagaatgct ga 702
<210> 33
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> HC with A114X mutation protein sequence, X121 represents the UAG
unnatural site
<220>
<221> misc_feature
<222> (121)..(121)
<223> Xaa can be any naturally occurring amino acid
<400> 33
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr
20 25 30
Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Leu Val Thr Val Ser Ser Xaa Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp
210 215 220
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
225 230 235 240
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
245 250 255
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
260 265 270
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
275 280 285
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
290 295 300
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
305 310 315 320
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
325 330 335
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
340 345 350
Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu
355 360 365
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
370 375 380
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
385 390 395 400
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
405 410 415
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
420 425 430
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
435 440 445
Gly
<210> 34
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> LC protein sequence
<400> 34
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 35
<211> 372
<212> DNA
<213> Artificial Sequence
<220>
<223> U6-PylT U25C supp table S1
<400> 35
agtcagtcac tagttgggca ggaagagggc ctatttccca tgattccttc atatttgcat 60
atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata 120
ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa 180
ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg 240
gctttatata tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg 300
actctaaatc cgttcagccg ggttagattc ccggggtttc cggacaagtg cggtttttcc 360
taggagtcag tc 372
<210> 36
<211> 750
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP(TAG) H. sapiens optimized, C-terminal HisTag Supp Table S1
<400> 36
atggtgtcca agggcgagga actgttcacc ggcgtggtgc ccatcctggt ggaactggat 60
ggcgacgtga acggccacaa gttctctgtg cggggagagg gcgaaggcga cgccacaaat 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ttggcctacc 180
ctcgtgacca cactgaccta cggcgtgcag tgcttcagca gataccccga ccatatgaag 240
cggcacgact tcttcaagag cgccatgccc gagggctacg tgcaggaacg gaccatcagc 300
ttcaaggacg acggcaccta caagaccaga gccgaagtga agttcgaggg cgacaccctc 360
gtgaaccgga tcgagctgaa gggcatcgat ttcaaagagg acggcaacat cctgggccac 420
aagctggagt acaacttcaa cagccactag gtgtacatca ccgccgacaa gcagaagaac 480
ggcatcaagg ccaacttcaa gatccggcac aacgtggaag atggcagcgt gcagctggcc 540
gaccactacc agcagaacac ccccatcgga gatggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagagcgt gctgagcaag gaccccaacg agaagcggga ccacatggtg 660
ctgctggaat tcgtgaccgc cgctggcatc acccacggca tggacgagct gtacaagggc 720
agccaccatc accatcacca ttaataataa 750
<210> 37
<211> 1338
<212> DNA
<213> Artificial Sequence
<220>
<223> H. sapiens eRF1 D. melanogaster optimized, N-terminal HisTag Supp
Table S1
<400> 37
atgcatcatc accatcacca cgccgatgat ccaagcgccg cagaccgcaa tgttgagatc 60
tggaagataa aaaagctgat aaagagcttg gaggccgcac ggggcaacgg cacgtccatg 120
atatccctca ttatcccacc aaaggatcag atcagccgtg tggcgaagat gttggcggat 180
gagttcggaa cggccagtaa cattaaaagt cgcgtgaacc ggctgtcggt cttgggcgcc 240
atcacttccg tgcagcaacg tctgaaactg tacaacaaag tcccacccaa cggtttggtc 300
gtctactgcg gtacgatagt taccgaggaa ggaaaggaga agaaagtgaa tattgatttc 360
gaaccattta aaccgataaa cactagcttg tacttgtgcg acaataagtt tcatacagag 420
gcactcacgg ccctgctgag cgacgactcg aaattcggat tcattgtcat tgatggaagt 480
ggagcgctgt tcggcacgct gcagggtaac acgcgcgagg tcttgcacaa attcaccgtg 540
gacttgccca aaaagcatgg ccgtggtggc cagagcgccc tcaggtttgc gcggctgcgc 600
atggagaagc gccataacta cgtgcgcaag gtcgcagaga cggctgtgca gctgttcatc 660
tcgggtgata aggtaaatgt cgcgggactg gtgctcgccg gcagcgcgga cttcaaaacc 720
gagctgagtc agtccgacat gttcgatcag cgtctgcagt cgaaggtact gaagctcgtc 780
gacattagct acggcggcga gaacggcttc aatcaggcca tcgaactgag taccgaagtc 840
ctcagtaacg taaagtttat tcaggaaaaa aagttgattg gacgctactt tgatgaaata 900
agccaagata cgggcaaata ctgttttggc gtcgaggata ctctgaaagc gctcgagatg 960
ggagcagtgg aaatactcat cgtatatgaa aatctcgata taatgcgcta tgtactgcat 1020
tgccaaggaa cagaagagga gaaaattctc tacctcaccc cggagcaaga gaaggacaag 1080
agccatttta cagacaagga gacgggccaa gagcacgagc tcattgagtc gatgcccttg 1140
ctcgaatggt ttgccaacaa ctacaagaag ttcggcgcga ccctggaaat tgtcacggat 1200
aaatcgcagg agggcagcca gtttgtgaag ggcttcggtg gcatcggcgg catcctccgc 1260
taccgggtgg atttccaagg catggaatat caaggtggag atgatgaatt cttcgatttg 1320
gatgattact aatgatag 1338
<210> 38
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_E55Af
<400> 38
gaagatgttg gcggatgcct tcggaacggc cagtaac 37
<210> 39
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_E55Ar
<400> 39
gttactggcc gttccgaagg catccgccaa catcttc 37
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_E55Df
<400> 40
gatgttggcg gatgatttcg gaacggccag 30
<210> 41
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_E55Dr
<400> 41
ctggccgttc cgaaatcatc cgccaacatc 30
<210> 42
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_Y125Ff
<400> 42
ccgataaaca ctagcttgtt cttgtgcgac aataagtttc 40
<210> 43
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_Y125Fr
<400> 43
gaaacttatt gtcgcacaag aacaagctag tgtttatcgg 40
<210> 44
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_TS122QFf
<400> 44
catttaaacc gataaaccaa ttcttgtact tgtgcgac 38
<210> 45
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_TS122QFr
<400> 45
gtcgcacaag tacaagaatt ggtttatcgg tttaaatg 38
<210> 46
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_NK129PQf
<400> 46
gcttgtactt gtgcgaccca cagtttcata cagaggcac 39
<210> 47
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_NK129PQr
<400> 47
gtgcctctgt atgaaactgt gggtcgcaca agtacaagc 39
<210> 48
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_SVLG70AVLSf
<400> 48
gcgtgaaccg gctggccgtg ctgagcgcca tcacttcc 38
<210> 49
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_SVLG70AVLSr
<400> 49
ggaagtgatg gcgctcagca cggccagccg gttcacgc 38
<210> 50
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_K130Mf
<400> 50
gtacttgtgc gacaatatgt ttcatacaga ggcac 35
<210> 51
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_K130Mr
<400> 51
gtgcctctgt atgaaacata ttgtcgcaca agtac 35
<210> 52
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_M51Af
<400> 52
gtgtggcgaa ggccttggcg gatgag 26
<210> 53
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> eRF1_M51Ar
<400> 53
ctcatccgcc aaggccttcg ccacac 26
<210> 54
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_Ser_f
<400> 54
ctgaagaacg agcaaatctc cacgggggcc cctaggagat c 41
<210> 55
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_Ser_r
<400> 55
gatctcctag gggcccccgt ggagatttgc tcgttcttca g 41
<210> 56
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TAA_f
<400> 56
gaagaacgag caaatctaaa cgggggcccc taggag 36
<210> 57
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TAA_r
<400> 57
ctcctagggg cccccgttta gatttgctcg ttcttc 36
<210> 58
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TAG_f
<400> 58
gaagaacgag caaatctaga cgggggcccc tagg 34
<210> 59
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TAG_r
<400> 59
cctaggggcc cccgtctaga tttgctcgtt cttc 34
<210> 60
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TGA_f
<400> 60
ctgaagaacg agcaaatctg aacgggggcc cctaggagat c 41
<210> 61
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> DLR_TGA_r
<400> 61
gatctcctag gggcccccgt tcagatttgc tcgttcttca g 41
<210> 62
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_TAG150Lf
<400> 62
cttcaacagc cacctggtgt acatcacc 28
<210> 63
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_TAG150Lr
<400> 63
ggtgatgtac accaggtggc tgttgaag 28
<210> 64
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_D133TAGf
<400> 64
ggcatcgatt tcaaagagta gggcaacatc ctggg 35
<210> 65
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_D133TAGr
<400> 65
cccaggatgt tgccctactc tttgaaatcg atgcc 35
<210> 66
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_K101TAGf
<400> 66
ggaccatcag cttctaggac gacggcacct acaagacc 38
<210> 67
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> sfGFP_K101TAGr
<400> 67
ggtcttgtag gtgccgtcgt cctagaagct gatggtcc 38
Claims (14)
- i) 직교 tRNA 신테타제 - tRNA 쌍, 관심 단백질을 코딩하는 관심 핵산 서열, 및 돌연변이체 eRF1을 발현하는 진핵생물 세포를 제공하는 단계이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호(SEQ ID NO): 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖고, 상기 관심 핵산 서열이 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는 것인 단계;
ii) 진핵생물 세포를 관심 핵산 서열이 코딩하는 단백질 내로 혼입될 비-천연 아미노산의 존재 하에 인큐베이션하는 단계이며, 여기서 상기 비-천연 아미노산이 직교 tRNA 신테타제에 대한 기질인 단계; 및
iii) 진핵생물 세포를 인큐베이션하여, 직교 tRNA 신테타제 - tRNA 쌍을 통해 상기 비-천연 아미노산이 관심 단백질 내로 혼입되도록 하는 단계
를 포함하는, 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키는 방법. - 진핵생물 세포에서 비-천연 아미노산을 관심 단백질 내로 혼입시키기 위한 돌연변이체 eRF1의 용도이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖는 것인 용도.
- 비-천연 아미노산의 관심 폴리펩티드 내로의 혼입을 지시하는 직교 코돈을 포함하는, 관심 폴리펩티드를 코딩하는 핵산의 번역에 의해 비-천연 아미노산을 관심 폴리펩티드 내로 혼입시키는 것을 돕는데 사용하기 위한 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산이며, 여기서 상기 돌연변이체 eRF1이 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖는 것인 돌연변이체 eRF1 폴리펩티드 또는 이를 코딩하는 핵산.
- 제3항의 돌연변이체 eRF1 폴리펩티드 또는 핵산을 포함하는 진핵생물 숙주 세포.
- (i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖는 돌연변이체 eRF1, 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 진핵생물 숙주 세포. - (i) 직교 tRNA 신테타제 - tRNA 쌍, 및
(ii) 서열식별번호: 4의 인간 야생형 eRF1 서열에 대한 서열 동일성이 적어도 60%인 아미노산 서열을 갖는 돌연변이체 eRF1
을 코딩하는 핵산(들), 및
임의적으로, (iii) 비-천연 아미노산의 혼입을 위한 위치에 tRNA가 인식하는 코돈을 포함하는, 관심 단백질을 코딩하는 관심 핵산 서열
을 포함하는 조합물 또는 키트. - 제5항 또는 제6항에 있어서, 비-천연 아미노산, 예컨대 BocK 또는 CypK 또는 BCNK를 추가로 포함하는 진핵생물 숙주 세포, 또는 조합물 또는 키트.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 야생형 eRF1 대조군에 비해 증가된 효율의 비-천연 아미노산 혼입을 제공하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 서열식별번호: 4에 비해
(i) E55
(ii) N129, K130
(iii) T122, S123
(iv) Y125
(v) T58, S60, S64, L125, N129
(vi) S123, L124, Y125
(vii) S123, L124, Y125
(viii) S123, L124, Y125
(ix) M51, K130
(x) S123, L124, Y125
(xi) S123, L124, Y125
(xii) S123, L124, Y125
(xiii) S123, L124, Y125
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트. - 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 돌연변이체 eRF1이 서열식별번호: 4에 비해
(i) E55D
(ii) N129P, K130Q
(iii) T122Q, S123F
(iv) E55A
(v) Y125F
(vi) T58K, S60T, S64D, L125F, N129S
(vii) S123A, L124I, Y125L
(viii) S123R, L124W, Y125R
(ix) S123H, L124A, Y125G
(x) M51A, K130M
(xi) S123A, L124L, Y125V
(xii) S123L, L124C, Y125S
(xiii) S123L, L124S, Y125S
(xiv) S123V, L124T, Y125P
로 이루어진 군으로부터 선택된 돌연변이 또는 돌연변이 조합을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트. - 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 진핵생물 세포가 포유동물 또는 곤충 세포인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 코돈이 정지 코돈이고, 임의적으로는 상기 정지 코돈이 UAG인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 직교 tRNA 신테타제 - tRNA 쌍이 피롤리실-tRNA 신테타제 (PylRS)/PylT tRNACUA 쌍을 포함하는 것인 방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
- 제1항 내지 제10항 중 어느 한 항에 있어서, tRNA가
(i) PylT의 U25C 변이체, 또는
(ii) PylT의 Opt 변이체, 또는
(iii) PylT의 U25C - Opt 변이체인
방법, 용도, 돌연변이체 eRF1 폴리펩티드, 진핵생물 숙주 세포, 또는 조합물 또는 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1419109.2A GB201419109D0 (en) | 2014-10-27 | 2014-10-27 | Incorporation of unnatural amino acids into proteins |
GB1419109.2 | 2014-10-27 | ||
PCT/GB2015/053141 WO2016066995A1 (en) | 2014-10-27 | 2015-10-21 | Incorporation of unnatural amino acids into proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170070238A true KR20170070238A (ko) | 2017-06-21 |
KR102516695B1 KR102516695B1 (ko) | 2023-03-30 |
Family
ID=52103474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177014048A KR102516695B1 (ko) | 2014-10-27 | 2015-10-21 | 단백질 내로의 비-천연 아미노산의 혼입 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10738339B2 (ko) |
EP (1) | EP3212799B1 (ko) |
JP (2) | JP6843044B2 (ko) |
KR (1) | KR102516695B1 (ko) |
CN (1) | CN107002088B (ko) |
BR (1) | BR112017008108A2 (ko) |
CA (1) | CA2965085A1 (ko) |
GB (1) | GB201419109D0 (ko) |
WO (1) | WO2016066995A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013171485A1 (en) | 2012-05-18 | 2013-11-21 | Medical Research Council | Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase. |
GB2528227A (en) | 2014-03-14 | 2016-01-20 | Medical Res Council | Cyclopropene amino acids and methods |
WO2018044143A1 (ko) * | 2016-09-05 | 2018-03-08 | 한국과학기술원 | 목적 단백질의 위치 특이적 변형이 시공간적으로 조절되는 마우스, 이의 제조방법 및 그 용도 |
CN106834349B (zh) * | 2017-02-28 | 2019-12-13 | 中国人民解放军军事医学科学院 | 一种安全性提高的病毒基因递送系统 |
PT3630977T (pt) * | 2017-06-02 | 2024-04-24 | Ambrx Inc | Métodos e composições para promover a produção de proteínas contendo aminoácidos não naturais |
AU2019263303A1 (en) * | 2018-05-01 | 2020-12-24 | Ambrx, Inc. | A method for optimizing antibody expression |
JP2021536263A (ja) * | 2018-09-07 | 2021-12-27 | メディミューン,エルエルシー | 細胞選択の方法 |
CN111718949B (zh) * | 2019-03-19 | 2021-10-01 | 宁波鲲鹏生物科技有限公司 | 利用双质粒系统在蛋白中引入非天然氨基酸 |
CN111850020B (zh) * | 2019-04-25 | 2021-05-07 | 苏州鲲鹏生物技术有限公司 | 利用质粒系统在蛋白中引入非天然氨基酸 |
CN111849929B (zh) * | 2019-04-30 | 2021-05-11 | 苏州鲲鹏生物技术有限公司 | 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶 |
US20240117295A1 (en) | 2021-05-28 | 2024-04-11 | United Kingdom Research And Innovation | Microorganisms and uses thereof |
CN113481239A (zh) * | 2021-07-01 | 2021-10-08 | 四川大学华西医院 | 一种通过Rosa26位点向细胞系中引入非天然氨基酸编码体系的方法及其细胞系 |
WO2023282315A1 (ja) * | 2021-07-07 | 2023-01-12 | 味の素株式会社 | 非天然アミノ酸含有タンパク質の分泌生産法 |
GB202110137D0 (en) | 2021-07-14 | 2021-08-25 | Res & Innovation Uk | Methods for optimising protein production |
CN113699124B (zh) * | 2021-09-08 | 2022-04-12 | 北京大学 | 一种含非天然氨基酸蛋白的制备方法 |
US20230407363A1 (en) * | 2022-04-08 | 2023-12-21 | Absci Corporation | tRNA SYNTHETASES AND METHODS OF USE THEREOF |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006110182A2 (en) * | 2004-10-27 | 2006-10-19 | The Scripps Research Institute | Orthogonal translation components for the in vivo incorporation of unnatural amino acids |
US20120077186A1 (en) * | 2010-05-07 | 2012-03-29 | Oregon Health & Science University | Use of cysteine-derived suppressor trnas for non-native amino acid incorporation |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5590649B2 (ja) | 2007-09-20 | 2014-09-17 | 独立行政法人理化学研究所 | 変異体ピロリジル−tRNA合成酵素及びこれを用いる非天然アミノ酸組み込みタンパク質の製造方法 |
GB2470770A (en) | 2009-06-04 | 2010-12-08 | Medical Res Council | Incorporation of unnatural amino acids having an orthogonal functional group into polypeptides using orthogonal tRNA/tRNA synthetase pairs |
GB201201100D0 (en) | 2012-01-20 | 2012-03-07 | Medical Res Council | Polypeptides and methods |
-
2014
- 2014-10-27 GB GBGB1419109.2A patent/GB201419109D0/en not_active Ceased
-
2015
- 2015-10-21 EP EP15794622.9A patent/EP3212799B1/en active Active
- 2015-10-21 KR KR1020177014048A patent/KR102516695B1/ko active IP Right Grant
- 2015-10-21 BR BR112017008108A patent/BR112017008108A2/pt not_active Application Discontinuation
- 2015-10-21 US US15/521,103 patent/US10738339B2/en active Active
- 2015-10-21 CN CN201580058784.6A patent/CN107002088B/zh active Active
- 2015-10-21 CA CA2965085A patent/CA2965085A1/en not_active Abandoned
- 2015-10-21 JP JP2017519813A patent/JP6843044B2/ja active Active
- 2015-10-21 WO PCT/GB2015/053141 patent/WO2016066995A1/en active Application Filing
-
2020
- 2020-10-22 JP JP2020177605A patent/JP2021035374A/ja not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006110182A2 (en) * | 2004-10-27 | 2006-10-19 | The Scripps Research Institute | Orthogonal translation components for the in vivo incorporation of unnatural amino acids |
US20120077186A1 (en) * | 2010-05-07 | 2012-03-29 | Oregon Health & Science University | Use of cysteine-derived suppressor trnas for non-native amino acid incorporation |
Non-Patent Citations (2)
Title |
---|
EMBO Reports,제3권,9호,881-886면(2002) * |
RNA,제16권,1902-1914면(2010) * |
Also Published As
Publication number | Publication date |
---|---|
GB201419109D0 (en) | 2014-12-10 |
JP2017532043A (ja) | 2017-11-02 |
CN107002088A (zh) | 2017-08-01 |
EP3212799B1 (en) | 2019-04-17 |
JP2021035374A (ja) | 2021-03-04 |
CA2965085A1 (en) | 2016-05-06 |
US20170356023A1 (en) | 2017-12-14 |
JP6843044B2 (ja) | 2021-03-17 |
BR112017008108A2 (pt) | 2017-12-19 |
EP3212799A1 (en) | 2017-09-06 |
WO2016066995A1 (en) | 2016-05-06 |
KR102516695B1 (ko) | 2023-03-30 |
US10738339B2 (en) | 2020-08-11 |
CN107002088B (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102516695B1 (ko) | 단백질 내로의 비-천연 아미노산의 혼입 | |
AU2021250992B2 (en) | Compositions and methods for directing proteins to specific loci in the genome | |
KR102648489B1 (ko) | Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna | |
CN101553506B (zh) | Lingo结合分子及其制药用途 | |
US6165715A (en) | Expression systems | |
US20040105855A1 (en) | Humanized antibodies against human 4-1BB | |
KR20080031024A (ko) | 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 | |
CN1926238A (zh) | 植物细胞中的高效肽生产 | |
CN108715861B (zh) | 一种碱基编辑工具及其应用 | |
JP2024037917A (ja) | 組換えt細胞受容体遺伝子を用いて細胞ベースの治療薬を製造するための技法 | |
CN113508178A (zh) | 用于调节经工程化的基因的表达的微环境传感器 | |
CN103834692A (zh) | 一种用于表达lncRNA的慢病毒载体及其应用 | |
KR102084227B1 (ko) | 인간 형질전환 연골세포주 기반 연골질환 치료제 스크리닝 시스템 | |
TW202216777A (zh) | 四面體抗體 | |
CN112342216B (zh) | 用于提高CHO细胞的表达效率的CRISPR-Cas13d系统以及重组CHO细胞 | |
KR20230019156A (ko) | 유전자 삽입을 위한 다수의 도크들이 있는 세포주 | |
KR20230136172A (ko) | 자기-관용을 파괴하기 위한 백신 조성물 | |
CN113073118B (zh) | Tet-off表达调控系统在级联放大启动子活性中的用途 | |
US20020150912A1 (en) | Reporter system for cell surface receptor-ligand binding | |
CN110514628A (zh) | 一种快速检测O-GlcNAc修饰的生物感应器/方法及应用 | |
CN111684068A (zh) | 工程化的遍在染色质开放元件及其用途 | |
US20230295668A1 (en) | Methods and compositions for integration of a dna construct | |
WO2023091704A1 (en) | Compositions and methods for production of circular nucleic acid molecules | |
US20050003344A1 (en) | AAV2 Rep protein fusions | |
KR102393402B1 (ko) | 세포 내 존재 단백질과 세포 외부로 분비되는 단백질을 동시 발현하는 이중발현벡터를 포함하는 암의 예방 또는 치료용 조성물 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |