KR101171397B1

KR101171397B1 - 진핵 유전자 코드의 확장

Info

Publication number: KR101171397B1
Application number: KR1020057019613A
Authority: KR
Inventors: 제이슨 더블유 친; 애쉬톤 티 크롭; 크리스토퍼 제이 앤더슨; 피터 지 슐츠
Original assignee: 더 스크립스 리서치 인스티튜트
Priority date: 2003-04-17
Filing date: 2004-04-16
Publication date: 2012-08-07
Also published as: ATE542894T1; CN103215227B; IL171128A; WO2004094593A2; CN103289960A; CN103215227A; US20080227195A1; US20120282689A1; CA2520750A1; US7608423B2; US20110217733A1; WO2004094593A3; EP1613735A2; HK1087432A1; US20070166791A1; KR20050119704A; JP2014195463A; US7618775B2; AU2004233083B2; US20070154952A1

Abstract

본 발명은 진핵 세포에서 유전적으로 암호된 아미노산의 수를 확장하는 번역 성분을 생산하기 위한 조성물 및 방법을 제공한다. 상기 성분은 직교 tRNA, 직교 아미노아실-tRNA 신세타제, tRNA/신세타제의 직교 쌍 및 비천연 아미노산을 포함한다. 진핵 세포에서 비천연 아미노산을 갖는 단백질 및 그 생산 방법 또한 제공된다.

Description

진핵 유전자 코드의 확장{EXPANDING THE EUKARYOTIC GENETIC CODE}

본 출원은 2003년 4월 17일에 출원된 Chin 등의 "진핵 유전자 코드의 확장"이라는 제목의 미국 출원 제 60/463,869호, 2003년 6월 18일에 출원된 Chin 등의 "진핵 유전자 코드의 확장"이라는 제목의 미국 출원 제60/479,931호, 2003년 8월 5일에 출원된 Chin 등의 "진핵 유전자 코드의 확장"이라는 제목의 미국 출원 제60/493,014호, 및 2003년 8월 19일에 출원된 Chin 등의 "진핵 유전자 코드의 확장"이라는 제목의 미국 출원 제60/496,548호에 기초한 정규 특허 출원이다. 이들 선행 출원의 각각에 대해 우선권을 주장한다.

본 발명은 국립보건원으로부터의 그랜트 제 GM 62159호하의 지원 및 에너지국으로부터의 그랜트 DE-FG0300ER45812하의 지원으로 이루어졌다. 정부는 본 발명에 대하여 일정 권리를 갖는다.

본 발명은 진핵 세포에서의 번역 생화학에 관한 것이다. 본 발명은 진핵 세포에서 직교(orthogonal) tRNA, 직교 신세타제 및 그 쌍을 생산하는 방법 및 그 조성물에 관한 것이다. 본 발명은 또한 비천연 아미노산의 조성물, 비천연 아미노산을 포함하는 단백질 및 진핵 세포에서 비천연 아미노산을 포함하는 단백질의 생산 방법에 관한 것이다.

박테리아에서 사람까지, 모든 공지의 유기체의 유전자 코드는 동일한 20개의 일반적인 아미노산을 암호한다. 동일한 20개의 천연 아미노산의 상이한 조합은 광합성에서 시그널 전달 및 면역 반응에 이르기까지, 모든 생명의 복잡한 과정을 수행하는 단백질들을 형성한다. 단백질 구조와 기능을 연구하고 변형하기 위해, 과학자들은 유전자 코드 및 단백질의 아미노산 서열을 조작하기 위한 시도를 하였다. 하지만, 단백질을 20개의 유전적으로 암호화되는 표준 구성 블록으로 제한하는(셀레노시스테인(예, A.Bock et al. , (1991), Molecular Microbiology 5: 515-20 참고) 및 피로라이신(예, G. Srinivasan, et al., (2002), Science 296: 1459-62 참고)은 드문 예외임) 유전자 코드에 의해 가해지는 제한을 제거하는 것은 어려웠다.

이러한 제한을 제거하기 위해 일부 진전이 있었으나, 이러한 진전은 제한적이었으며 단백질 구조 및 기능을 합리적으로 조절하는 능력은 여전히 초기 단계이다. 예를 들어, 화학자들은 작은 분자의 구조를 합성하고 조작하기 위한 방법과 전략을 개발하였다(예, E. J. Corey, & X.-M. Cheng, The Logic of Chemical Synthesis (Wiley-Interscience, New York, 1995) 참고). 전체 합성(예, B. Merrifield, (1986), Science 232: 341-7 (1986) 참고), 및 반합성 방법(예, D. Y.Jackson et al., (1994) Science 266: 243-7; 및 P. E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry 69: 923-60 참고)은 펩티드 및 작은 단백질의 합성을 가능하게 하였으나, 이들 방법은 10 킬로 달톤(kDa)을 초과하는 단백질에서는 유용성이 제한되었다. 강력하긴 하지만 돌연변이 방법은 한정된 수의 구조적 변화로 제한된다. 많은 경우, 단백질 전체에 일반적인 아미노산의 밀접한 구 조적 유사체를 경쟁적으로 포함시키는 것이 가능하였다. 예를 들어, R. Furter,(1998), Protein Science 7: 419-26; K. Kirshenbaum, et al., (2002), ChemBioChem 3: 235-7; 및 V. Doring et al., (2001), Science 292: 501-4를 참고한다.

단백질 구조와 기능을 조작하는 능력을 확장시키기 위한 시도에서, 생체외에서 넌센스 코돈에 대한 반응으로 비천연 아미노산이 선택적으로 포함되도록 하는, 화학적으로 아실화된 직교 tRNA를 이용하는 생체외 방법이 개발되었다(예, J. A. Ellman, et al., (1992), Science 255: 197-200 참고). 새로운 구조와 물리적 특성을 갖는 아미노산을 단백질내로 선택적으로 포함시켜 단백질 접힘 및 안정성 그리고 생물분자의 인식과 촉매를 연구하였다. 예를 들어, D. Mendel, et al., (1995), Annual Review of Biophysics and Biomolecular Structure 24: 435- 462; 및 V. W. Cornish, et al. (Mar. 31,1995), Angewandte Chemie-International Edition in English 34: 621-633를 참고한다. 하지만, 이 과정의 화학양론적 특성은 생성될 수 있는 단백질의 양을 심각하게 제한하였다.

비천연 아미노산이 세포내로 미세주사되었다. 예를 들어, 비천연 아미노산을, 화학적으로 잘못 아실화된 테트라히메나 써모필라 tRNA(M. E. Saks, et al. (1996), An engineered Tetrahymena tRNAGIn for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J. Biol. Chem. 271: 23169- 23175), 및 관련 mRNA의 미세주사에 의해 제노푸스 난모세포에서 니코틴 아세틸콜린 수용체내로 도입하였다(M.W.Nowak, et al. (1998), In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system, Method Enzymol. 293: 504-529). 이로 인해 독특한 물리적 또는 화학적 특성을 갖는 측쇄를 함유하는 아미노산의 도입에 의해 난모세포에서 수용체의 상세한 생물물리적 연구가 가능하였다. 예를 들어, D. A. Dougherty (2000), Unnatural amino acids as probes of protein structure and function, Curr. Opin. Chem. Biol. 4: 645-652를 참고한다. 불행히도, 이 방법은 미세주사될 수 있는 세포중의 단백질로 제한되었으며, 관련 tRNA는 생체외에서 화학적으로 아실화되며 재아실화될 수 없으므로, 단백질의 수율이 매우 낮다.

이러한 한계를 극복하기 위하여, 원핵세포 대장균( Escherichia coli)(E.coli)의 단백질 생합성 기계에, 생체내에서 비천연 아미노산의 유전자 암호를 허용하는 새로운 성분을 추가하였다(예, L. Wang, et al., (2001), Science 292: 498-500 참고). 광친화성 라벨 및 광이성질체성 아미노산, 케토 아미노산, 및 당화된 아미노산을 비롯한, 새로운 화학적, 물리적 또는 생물학적 특성을 갖는 많은 새로운 아미노산이 이 방법을 이용하여 앰버 코돈, TAG에 대한 반응으로 대장균에서 효율적으로 그리고 높은 확실성으로 단백질내로 포함되었다. 예를 들어, J. W. Chin et al., (2002), Journal of the American Chemical Society 124: 9026-9027 ; J. W. Chin, & P. G. Schultz, (2002), ChemBioChem 11:1135-1137 ; J. W. Chin, et al., (2002), PNAS United States of America 99: 11020-11024: 및 L. Wang, & P. G. Schultz, (2002), Chem.Comm., 1-10를 참고한다. 하지만, 원핵생물 및 진핵생물의 번역 기계는 크게 보존적이지 않으며, 따라서, 대장균에 추가된 생 합성 기계의 성분은 종종 진핵 세포에서 비천연 아미노산을 단백질내로 부위특이적으로 포함시키기 위해 이용될 수 없다. 예를 들어, 대장균에서 이용되었던 메타노 코커스 잔나시 ( Methanococcus jannaschii ) 티로실-tRNA 신세타제/tRNA 쌍은 진핵 세포에서 직교(orthogonal)가 아니다. 또한, 원핵생물이 아닌 진핵생물에서 tRNA의 전사는 RNA 폴리머라제 III에 의해 실시되고 이것은 진핵 세포에서 전사될 수 있는 tRNA 구조 유전자의 일차 서열에 제한을 가한다. 더욱이, 원핵 세포와 달리, 진핵 세포의 tRNA는 그들이 전사되는 핵으로부터 세포질로 배출되어 번역에서 기능하는 것이 필요하다. 마지막으로, 진핵 80S 리보좀은 70S 원핵 리보좀과 구별된다. 따라서, 진핵 유전자 코드를 확장시키기 위해 생합성 기계의 개선된 성분을 개발할 필요가 있다. 본 발명은 이들 및 기타 필요를 충족시키며, 이는 하기의 설명으로부터 명백할 것이다.

발명의 요약

본 발명은 진핵 세포에서, 성장중인 폴리펩티드 쇄에 비천연 아미노산을 포함시키기 위해 진핵 단백질 생합성 기계에 이용되는 번역 성분, 예를 들어, 직교 아미노아실-tRNA 신세타제(O-RS)와 직교 tRNA(O-tRNA)의 쌍 및 그 개별 성분을 진핵 세포에 제공한다.

본 발명의 조성물은 직교 아미노아실-tRNA 신세타제(O-RS)(예를 들어, 대장균, 바실러스 스테아로써모필러스 (Bacillus stearothermophilus ) 등과 같은 비진핵 유기체로부터 유래된 것)를 포함하는 진핵 세포((예, 사카로마이세스 세레비제(Saccharomyces cerevisiae 세포와 같은) 효모 세포, 포유류 세포, 식물 세포, 조류 세포, 진균 세포, 곤충 세포 등)를 포함하며, 이때 O-RS는 진핵 세포에서 하나 이상의 비천연 아미노산으로 직교 tRNA(O-tRNA)를 우선적으로 아미노아실화시킨다. 선택적으로, 둘 이상의 OtRNA가 주어진 진핵 세포에서 아미노아실화될 수 있다. 한 태양에서, O-RS는 예를 들어, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS에 비하여 예를 들어, 40% 이상, 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 또는 심지어는 90% 또는 그 이상 효율적으로 비천연 아미노산으로 O-tRNA를 아미노아실화한다. 한 구체예에서, 본 발명의 O-RS는 O-RS가 천연 아미노산으로 O-tRNA를 아미노아실화하는 것보다 10배 이상, 20배 이상, 30배 이상 등으로 더 효과적으로 비천연 아미노산으로 O-tRNA를 아미노아실화한다.

한 구체예에서, O-RS 또는 그 일부는 서열 번호 3-35 중 어느 하나(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트)에서 개시된 폴리뉴클레오티드 서열 또는 그의 상보성 폴리뉴클레오티드 서열에 의해 암호 된다. 다른 구체예에서, O-RS는 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63중 어느 다른 서브세트), 및/또는 86에 개시된 아미노산 서열, 또는 그의 보존적 변이체를 포함한다. 다른 구체예에서, O-RS는 예를 들어, 자연 발생(naturally occurring) 티로실 아미노아실-tRNA 신세타제(TyrRS)의 서열과 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 적어도 99.5% 또는 그 이상 동일하며 그룹 A-E로부터의 아미노산 둘 이상을 포함하는 아미노산 서열을 포함한다. 그룹 A는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발린, 이소류신, 류신, 글리신, 세린, 알라닌, 또는 트레오닌을 포함한다. 그룹 B는 대장균 TyrRS의 Asn126에 해당하는 위치에서 아스파테이트를 포함한다. 그룹 C는 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함한다. 그룹 D는 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 알라닌, 발린, 또는 티로신을 포함한다. 그리고 그룹 E는 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다.

이들 그룹의 조합의 임의의 서브세트는 본 발명의 특징이다. 예를 들어, 한 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발생하는 발린, 이소류신, 류신, 또는 트레오닌; 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 또는 글리신; 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 또는 티로신; 및 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 또는 알라닌으로부터 선택되는 둘 이상의 아미노산을 갖는다. 다른 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서의 글리신, 세린, 또는 알라닌, 대장균 TyrRS의 Asn126에 해당하는 위치에서의 아스파테이트, 대장균 TyrRS의 Asp182에 해당하는 위치에서의 아스파라긴, 대장균 TyrRS의 Phe183에 해당하는 위치에서의 알라닌 또는 발린, 및/또는 대장균 TyrRS의 Leu186에 해당하는 위치에서의 메티오닌, 발린, 시스테인, 또는 트레오닌으로부터 선택되는 둘 이상의 아미노산을 포함한다.

다른 구체예에서, O-RS는 천연 아미노산에 비하여 비천연 아미노산에 대해 하나 이상의 개선되거나 증가된 효소 특성을 갖는다. 예를 들어, 천연 아미노산에 비하여 비천연 아미노산의 개선되거나 증가된 특성은 예를 들어, 더 높은 K_m, 더 낮은 K_m, 더 높은 k_cat, 더 낮은 k_cat, 더 낮은 k_cat/k_m, 및 더 높은 k_cat/k_m 등 중 임의의 것을 포함한다.

진핵 세포는 또한 선택적으로 비천연 아미노산을 포함한다. 진핵 세포는 선택적으로 직교 tRNA(O-tRNA)(예, 대장균, 바실러스 스테아로써모필러스, 등과 같은 비진핵 유기체로부터 유래됨)를 포함하며, 이때 O-tRNA는 셀렉터 코돈을 인식하며 O-RS에 의해 비천연 아미노산으로 우선적으로 아미노아실화된다. 한 태양에서, O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 세포에서 이 서열로부터 프로세스되는 tRNA의 효율의 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 99%로 비천연 아미노산을 단백질내로 포함시키는 것을 매개한다. 다른 태양에서, O-tRNA는 서열 번호 65의 서열을 포함하며, O-RS는 서열 번호 36-63(예, 36-47, 48-63 또는 36-63중 임의의 다른 서브세트) 중 어느 하나, 및/또는 86에 개시된 아미노산 서열로 부터 선택되는 폴리펩티드 및/또는 그의 보존적 변이체를 포함한다.

다른 구체예에서, 진핵 세포는 대상 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하는 핵산을 포함하며, 이때 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 한 태양에서, 비천연 아미노산을 포함하는 대상 폴리펩티드의 수율은 폴리뉴클레오티드에 셀렉터 코돈이 없는 세포로부터의 천연 발생 폴리펩티드에 대해 얻어진 것의 2.5% 이상, 5% 이상, 10% 이상, 25% 이상, 30% 이상, 40% 이상, 50% 또는 그 이상이다. 다른 태양에서, 상기 세포는 비천연 아미노산의 존재하에서의 폴리펩티드의 수율의 35% 미만, 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만 등인 수율로, 비천연 아미노산의 부재하에서 대상 폴리펩티드를 생산한다.

본 발명은 또한 직교 아미노아실-tRNA 신세타제(O-RS), 직교 tRNA(O-tRNA), 비천연 아미노산, 및 대상 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하는 핵산을 포함하는 진핵 세포를 제공한다. 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 또한, O-RS는 진핵 세포에서 비천연 아미노산으로 직교 tRNA(O-tRNA)를 우선적으로 아미노아실화하며, 세포는 비천연 아미노산의 존재하에서의 폴리펩티드의 수율의 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만 등의 수율로, 비천연 아미노산의 부재하에서 대상 폴리펩티드를 생산한다.

직교 tRNA(O-tRNA)를 포함하는 진핵 세포를 포함하는 조성물 또한 본 발명의 특징이다. 일반적으로, O-tRNA는 생체내에서 O-tRNA에 의해 인식되는 선별 코돈을 포함하는 폴리뉴클레오티드에 의해 암호화되는 단백질내로 비천연 아미노산이 포함되도록 매개한다. 한 구체예에서, O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 세포에서 이로부터 프로세스되는 tRNA의 효율의 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어 99%의 효율로, 비천연 아미노산을 단백질내로 포함시킨다. 다른 구체예에서, O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열 또는 그의 보존적 변이체를 포함하거나 이로부터 프로세스된다. 다른 구체예에서, O-tRNA는 재생가능한 O-tRNA이다.

본 발명의 한 태양에서, O-tRNA는 전사 후에 변형된다. 본 발명은 또한 진핵 세포에서 O-tRNA를 암호화하는 핵산, 또는 그의 상보성 폴리뉴클레오티드를 제공한다. 한 구체예에서, 상기 핵산은 A 박스 및 B 박스를 포함한다.

본 발명은 또한 번역 성분, 예를 들어, O-RS 또는 O-tRNA/O-RS 쌍을 생산하는 방법( 및 이들 방법에 의해 생산된 번역 성분)을 특징으로 한다. 예를 들어, 본 발명은 진핵 세포에서 비천연 아미노산으로 직교 tRNA를 우선적으로 아미노아실화하는 직교 아미노아실-tRNA 신세타제(O-RS)를 생산하는 방법을 제공한다. 상기 방법은 예를 들어, (a) i) 아미노아실-tRNA 신세타제(RS) 라이브러리의 구성원, ii) 직교 tRNA(O-tRNA), iii) 양성 선별 마커를 암호화하는 폴리뉴클레오티드, 및 iv) 음성 선별 마커를 암호화하는 폴리뉴클레오티드를 포함하는 제 1종의 진핵 세포 집단을 비천연 아미노산 존재하에서 양성 선별에 노출시키는 것을 포함하며, 이때 양성 선별에서 생존하는 세포는 비천연 아미노산의 존재하에서 직교 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함한다. 양성 선별에서 생존하는 세포는 천연 아미노산으로 O-tRNA를 아미노아실화하는 활성 RS를 제거하기 위하여 비천연 아미노산의 부재하에서 음성 선별에 노출된다. 이것은 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 O-RS를 제공한다.

일부 구체예에서, 양성 선별 마커를 암호화하는 폴리뉴클레오티드는 반응 요소에 작동적으로 연결되며 세포는 a) 반응 요소로부터의 전사를 조절하는 전사 조절자 단백질(예, 진핵 전사 조절자 단백질 등)을 암호화하며, b) 하나 이상의 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 추가로 포함한다. 비천연 아미노산으로 아미노아실화된 O-tRNA에 의해 비천연 아미노산이 전사 조절자 단백질내로 포함되면 양성 선별 마커의 전사가 일어난다. 한 구체예에서, 전사 조절자 단백질은 전사 활성자 단백질(예, GAL4, 등)이며, 셀렉터 코돈은 앰버 중지 코돈이며, 예를 들어, 이때 앰버 중지 코돈은 전사 활성자 단백질의 DNA 결합 도메인을 암호화하는 폴리뉴클레오티드의 일부에 또는 그 근처에 위치한다.

양성 선별 마커는 다양한 분자 중 하나일 수 있다. 한 구체예에서, 양성 선별 마커는 성장을 위한 영양 보충물을 포함하며, 선별은 영양 보충물이 없는 배지에서 실시된다. 다른 구체예에서, 양성 선별 마커를 암호화하는 폴리뉴클레오티드는 예를 들어, ura3, leu2, lys2, lacZ 유전자, his3(예를 들어, his3 유전자는 3-아미노트리아졸(3-AT)을 제공하여 검출되는 이미다졸 글리세롤 포스페이트 디하이드라타제를 암호함), 등이다. 또 다른 구체예에서, 양성 선별 마커를 암호화하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

양성 선별 마커에서처럼, 음성 선별 마커는 또한 다양한 분자 중 임의의 것일 수 있다. 일부 구체예에서, 음성 선별 마커를 암호화하는 폴리뉴클레오티드는 전사 조절자 단백질에 의해 전사가 매개되는 반응 요소에 작동적으로 연결된다. 천연 아미노산으로 아미노아실화된 O-tRNA에 의해 전사 조절자 단백질내로 천연 아미노산이 포함되어 음성 선별 마커의 전사를 야기한다. 한 구체예에서, 음성 선별 마커를 암호화하는 폴리뉴클레오티드는 예를 들어, ura3 유전자이며 음성 선별은 5-플루로오로트산(5-FOA)을 포함하는 배지에서 이루어진다. 다른 구체예에서, 음성 선별에 이용된 배지는 음성 선별 마커에 의해 검출가능한 물질로 전환되는 선별 또는 스크리닝 제제를 포함한다. 본 발명의 한 태양에서, 검출가능한 물질은 독성 물질이다. 한 구체예에서, 음성 선별 마커를 암호화하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

일부 구체예에서, 양성 선별 마커 및/또는 음성 선별 마커는 적합한 반응물의 존재하에서 형광을 발하거나 발광 반응을 촉매하는 폴리펩티드를 촉매한다. 본 발명의 한 태양에서, 양성 선별 마커 및/또는 음성 선별 마커는 형광-활성화 세포 분류(FACS) 또는 발광에 의해 검출된다. 일부 구체예에서, 양성 선별 마커 및/또는 음성 선별 마커는 친화성계 스크리닝 마커 또는 전사 조절자 단백질을 포함한다. 한 구체예에서는, 동일한 폴리뉴클레오티드가 양성 선별 마커 및 음성 선별 마커 둘다를 암호한다.

한 구체예에서, 본 발명의 양성 선별 마커 및/또는 음성 선별 마커를 암호화하는 폴리뉴클레오티드는 두개 이상의 셀렉터 코돈을 포함할 수 있으며, 이들 각각 또는 모두는 두개 이상의 상이한 셀렉터 코돈 또는 두개 이상의 동일한 셀렉터 코돈을 포함할 수 있다.

추가의 수준의 선별/스크리닝 엄격도를 또한 본 발명의 방법에 이용할 수 있다. 한 구체예에서, 본 방법은 예를 들어, 단계 (a), (b) 또는 둘다에서 다양한 양의 비활성 신세타제를 제공하는 것을 포함할 수 있으며, 이때 다양한 양의 비활성 신세타제는 추가 수준의 선별 또는 스크리닝 엄격도를 제공한다. 한 구체예에서, O-RS를 생산하기 위한 방법의 단계 (a), (b) 또는 단계 (a) 및 (b)는 예를 들어, 양성 및/또는 음성 선별 마커의 선별 또는 스크리닝 엄격도를 변화시키는 것을 포함한다. 본 방법은 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 O-RS를 추가의 선별, 예를 들어, 추가의 양성 선별, 추가의 음성 선별 또는 추가의 양성 및 음성 선별의 조합에 노출시키는 것을 선택적으로 포함한다.

한 구체예에서, 선별/스크리닝은 예를 들어, 아미노산 투과성의 변화, 번역 효율의 변화, 번역 확실성의 변화 등으로부터 선택된 하나 이상의 양성 또는 음성 선별/스크리닝을 포함한다. 하나 이상의 변화는 단백질을 생산하기 위해 이용되는 직교 tRNA-tRNA 신세타제 쌍의 성분을 암호화하는 폴리뉴클레오티드 하나 이상에서의 돌연변이에 기초한다.

일반적으로, RS의 라이브러리(예, 돌연변이 RS의 라이브러리)는 예를 들어, 비진핵 유기체로부터의, 하나 이상의 아미노아실-tRNA 신세타제(RS)로부터 유래된 RS를 포함한다. 한 구체예에서, RS 라이브러리는 비활성 RS로부터 유래되며, 예를 들어, 비활성 RS는 활성 RS를 돌연변이시켜 생성된다. 다른 구체예에서, 비활성 RS는 아미노산 결합 포켓을 포함하며 결합 포켓을 포함하는 아미노산 하나 이상은 하나 이상의 상이한 아미노산으로 치환되며, 예를 들어, 치환된 아미노산은 알라닌으로 치환된다.

일부 구체예에서, O-RS를 생산하는 방법은 추가로 임의 돌연변이, 부위-특이적 돌연변이, 재조합, 키메라 구조, 또는 임의의 그 조합을 RS를 암호화하는 핵산에서 실시하여, 돌연변이 RS 라이브러리를 생산하는 것을 포함한다. 일부 구체예에서, 상기 방법은 추가로 예를 들어, (c) O-RS를 암호화하는 핵산을 분리하는 단계, (d) 돌연변이된 O-RS(예, 임의 돌연변이유발, 부위-특이적 돌연변이유발, 키메라 구조, 재조합 또는 임의의 그 조합에 의해)를 암호화하는 폴리뉴클레오티드 세트를 핵산으로부터 생성하는 단계, 및 (e) 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 돌연변이된 O-RS가 얻어질 때까지 단계 (a) 및/또는 (b)를 반복하는 단계를 포함한다. 본 발명의 한 태양에서, 단계 (c)-(e)는 2회 이상 실시된다.

O-tRNA/O-RS 쌍을 생산하는 방법은 또한 본 발명의 특징이다. 한 구체예에서, O-RS는 전술한 대로 얻어지며, O-tRNA는 진핵 세포에 내인성인 아미노아실-tRNA 신세타제(RS)에 의해 아미노아실화되는 tRNA 라이브러리의 구성원을 포함하는 세포를 제거하기 위하여, tRNA 라이브러리의 구성원을 포함하는 제 1종의 진핵 세포 집단을 음성 선별에 노출시켜 얻어진다. 이것은 제 1종의 진핵 세포에 직교인 tRNA 집단을 제공한다. 본 발명의 한 태양에서, tRNA의 라이브러리는 예를 들어, 비진핵 유기체로부터의 하나 이상의 tRNA로부터 유래된 tRNA를 포함한다. 본 발명의 다른 태양에서, 아미노아실-tRNA 신세타제(RS) 라이브러리는 예를 들어 비진핵 유기체로부터의 아미노아실-tRNA 신세타제(RS) 하나 이상으로부터 유래된 RS를 포함한다. 본 발명의 또 다른 태양에서, tRNA 라이브러리는 제 1 비진핵 유기체로부터의 하나 이상의 tRNA로부터 유래된 tRNA를 포함한다. 아미노아실-tRNA 신세타제(RS) 라이브러리는 제 2 비진핵 유기체로부터의 아미노아실-tRNA 신세타제(RS) 하나 이상으로부터 유래된 RS를 포함한다. 한 구체예에서, 제 1 및 제 2 비진핵 유기체는 동일하다. 다르게는, 제 1 및 제 2 비진핵 유기체는 상이할 수 있다. 본 발명의 방법에 의해 생산된 구체적인 O-tRNA/O-RS 쌍은 또한 본 발명의 특징이다.

본 발명의 다른 특징은 한 종에서 번역 성분을 생산하고 선별된/스크린된 번역 성분을 제 2 종으로 도입하는 방법이다. 예를 들어, 제 1 종(예, 효모 등과 같은 진핵 종)에서 O-tRNA/O-RS 쌍을 생산하는 방법은 O-tRNA를 암호화하는 핵산 및 O-RS를 암호화하는 핵산을 제 2 종의 진핵 세포(예, 포유류, 곤충, 진균, 조류, 식물 등)내로 도입하는 것을 추가로 포함한다. 제 2 종은 예를 들어, 번역동안, 성장중인 폴리펩티드 쇄내로 비천연 아미노산을 포함시키기 위해 도입된 번역 성분을 이용할 수 있다.

다른 실시예에서, 진핵 세포에서 비천연 아미노산으로 직교 tRNA를 우선적으로 아미노아실화시키는 직교 아미노아실-tRNA 신세타제(O-RS)를 생산하는 방법은 (a) 제 1 종(예, 효모 등과 같은 진핵 종)의 진핵 세포 집단을 비천연 아미노산의 존재하에서 양성 선별에 노출시키는 것을 포함한다. 제 1종의 진핵 세포 각각은 i) 아미노아실-tRNA 신세타제(RS) 라이브러리의 구성원, ii) 직교 tRNA(O-tRNA), iii) 양성 선별 마커를 암호화하는 폴리뉴클레오티드, 및 iv) 음성 선별 마커를 암호화하는 폴리뉴클레오티드를 포함한다. 양성 선별에서 생존하는 세포는 비천연 아미노산의 존재하에서 직교 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함한다. 양성 선별에서 생존하는 세포는 천연 아미노산으로 O-tRNA를 아미노아실화하는 활성 RS를 제거하기 위하여 비천연 아미노산의 부재하에서 음성 선별에 노출되어, 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 O-RS를 제공한다. O-tRNA를 암호화하는 핵산 및 O-RS를 암호화하는 핵산은 제 2 종의 진핵 세포(예, 포유류, 곤충, 진균, 조류, 식물 등)내로 도입된다. 제 2 종에서 번역될 때, 이들 성분은 제 2 종에서 비천연 아미노산을 단백질 또는 대상 폴리펩티드내로 포함시키기 위해 이용될 수 있다. 한 구체예에서, O-tRNA 및/또는 O-RS는 제 2 종의 진핵 세포내로 도입된다.

일부 구체예에서, O-tRNA는 진핵 세포에 내인성인 아미노아실-tRNA 신세타제(RS)에 의해 아미노아실화된 tRNA 라이브러리의 구성원을 포함하는 세포를 제거하기 위하여, tRNA 라이브러리의 구성원을 포함하는 제 1종의 진핵 세포 집단을 음성 선별에 노출시켜 얻어진다. 이것은 제 1 종 및 제 2 종의 진핵 세포에 직교인 tRNA 집단을 제공한다.

한 태양에서, 본 발명은 하나 이상의 비천연 아미노산 및 하나 이상의 번역후 변형을 포함하는 단백질을 포함하는 조성물을 포함하며, 이때 하나 이상의 번역 후 변형은 제 1 반응성 기를 포함하는 하나 이상의 비천연 아미노산에 [3+2] 고리화첨가(cycloaddition)에 의해 제 2 반응성기를 포함하는 분자를 부착하는 것을 포함한다.

따라서, 하나 이상의 비천연 아미노산을 갖는 단백질(또는 대상 폴리펩티드)는 또한 본 발명의 특징이다. 본 발명의 일부 구체예에서, 하나 이상의 비천연 아미노산을 갖는 단백질은 하나 이상의 번역후 변형을 포함한다. 한 구체예에서, 하나 이상의 번역후 변형은 제 1 반응성 기를 포함하는 하나 이상의 비천연 아미노산에 [3+2] 고리화첨가에 의해 제 2 반응성기를 포함하는 분자(예, 염료, 중합체, 예, 폴리에틸렌 글리콜의 유도체, 광가교제, 세포독성 화합물, 친화성 라벨, 바이오틴의 유도체, 수지, 제 2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조인자, 지방산, 탄수화물, 폴리뉴클레오티드(예, DNA, RNA 등) 등)의 부착을 포함한다. 예를 들어, 제 1 반응성기는 알키닐 부분(예, 비천연 아미노산 p-프로파길옥시페닐알라닌에서)(이 기는 또한 때때로 아세틸렌 부분으로 불림)이며 제 2 반응성기는 아지도 부분이다. 다른 예에서는, 제 1 반응성기는 아지도 부분(예, 비천연 아미노산 p-아지도-L-페닐알라닌)이고 제 2 반응성 기는 알키닐 부분이다. 일부 구체예에서, 본 발명의 단백질은 하나 이상의 번역후 변형을 포함하는 하나 이상의 비천연 아미노산(예, 케토 비천연 아미노산)을 포함하며, 이때 하나 이상의 번역후 변형은 당 부분을 포함한다. 일부 구체예에서, 번역후 변형은 진핵 세포의 생체내에서 만들어진다.

일부 구체예에서, 단백질은 진핵 세포에 의해 생체내에서 만들어지는 번역후 변형 하나 이상을 포함하며, 이때 번역 후 변형은 원핵 세포에 의해 만들어지지 않는다. 번역후 변형의 예는 아세틸화, 아실화, 지질-변형, 팔미토일화, 팔미테이트 첨가, 인산화, 당지질-결합 변형, 등을 포함하며 이에 한정되지 않는다. 한 구체예에서, 번역 후 변형은 GlcNAC-아스파라긴 결합에 의해 아스파라긴에 올리고당류를 부착시키는 것을 포함한다(예를 들어, 올리고당류는 (GlcNAc-Man)₂-Man-GlcNAc-GlcNAc 등을 포함함). 다른 구체예에서, 번역후 변형은 GalNAc-세린, GalNAc-트레오닌, GlcNAc-세린, 또는 GlcNAc-트레오닌 결합에 의해 올리고당류(예, Gal-GalNAc, Gal-GlcNAc 등)을 세린 또는 트레오닌에 부착하는 것을 포함한다. 일부 구체예에서, 본 발명의 단백질 또는 폴리펩티드는 분비 또는 국소화 서열, 에피토프 태그, FLAG 태그, 폴리히스티딘 태그, GST 융합, 등을 포함할 수 있다.

일반적으로, 단백질은 예를 들어, 임의의 이용가능한 단백질(예, 치료 단백질, 진단 단백질, 산업용 효소, 또는 그 일부 등)에 60% 이상, 70% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어 99% 이상 또는 그 이상 동일하며, 이들은 하나 이상의 비천연 아미노산을 포함한다. 한 구체예에서, 본 발명의 조성물은 대상 단백질 또는 폴리펩티드 및 부형제(예, 완충액, 약학적 허용 부형제, 등)를 포함한다.

대상 단백질 또는 폴리펩티드는 하나 이상, 둘 이상, 셋 이상, 넷 이상, 다섯 이상, 여섯 이상, 일곱 이상, 여덟 이상, 아홉 이상, 또는 열, 또는 그 이상의 비천연 아미노산을 함유할 수 있다. 비천연 아미노산은 동일하거나 상이할 수 있으며, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 상이한 비천연 아미노산을 포함하는 단백질에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 상이한 부위가 있을 수 있다. 일부 구체예에서, 단백질의 자연 발생 버젼에 존재하는 특정 아미노산 중 하나 이상 내지 모두 미만이 비천연 아미노산으로 치환된다.

단백질(또는 대상 폴리펩티드)의 예는 예를 들어, 사이토카인, 성장 인자, 성장 인자 수용체, 인터페론, 인터루킨, 염증성 분자, 발암유전자 생성물, 펩티드 호르몬, 시그널 전달 분자, 스테로이드 호르몬 수용체, 에리트로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체, 아포지질단백질, 아포단백질, 심방 나트륨뇨배뇨항진 인자, 심방 나트륨뇨배뇨항진 폴리펩티드, 심방 펩티드, C-X-C 케모카인, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-kit 리간드, 사이토카인, CC 케모카인, 단핵구 화학유도인자 단백질-1, 단핵구 화학유도인자 단백질-2, 단핵구 화학유도인자 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, C-kit 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제자, 보체 수용체 1, 사이토카인, DHFR, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1, 상피 성장 인자(EGF), 상피 호중구 활성화 펩티드, 에리트로포이에틴(EPO), 박리 독소, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 사람 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린형 성장 인자(IGF), IGF-1, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터루킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각질세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골형성 단백질, 발암유전자 생성물, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B, 또는 C, 릴랙신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 수퍼항원, 스타필로코커스 내독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 수퍼옥사이드 디스무타제(SOD), 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성인자, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met, p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히아루린/CD44, 코르티코스테론, 젠뱅크 또는 다른 이용가능한 데이터베이스에 존재하는 단백질, 등, 및/또는 그 일부를 포함하며 이에 한정되지 않는다. 한 구체예에서, 대상 폴리펩티드는 전사 조절자 단백질(예, 전사 활성인자 단백질(예, GAL4), 또는 전사 억제자 단백질 등) 또는 그 일부를 포함한다.

진핵 세포에서 GAL4 단백질 또는 그 일부의 조성물은 또한 본 발명의 특징이다. 일반적으로, GAL4 단백질 또는 그 일부는 하나 이상의 비천연 아미노산을 포함한다.

본 발명의 진핵 세포는 유용한 다량으로 비천연 아미노산을 포함하는 단백질을 합성하는 능력을 제공한다. 예를 들어, 비천연 아미노산을 포함하는 단백질은 세포 추출물, 완충액, 약학적 허용 부형제, 등에서 예를 들어 적어도 10 ㎍/리터, 적어도 50 ㎍/리터, 적어도 75 ㎍/리터, 적어도 100 ㎍/리터, 적어도 200 ㎍/리터, 적어도 250 ㎍/리터, 또는 적어도 500 ㎍/리터, 또는 그 이상의 단백질 농도로 생산될 수 있다. 일부 구체예에서, 본 발명의 조성물은 비천연 아미노산을 포함하는 단백질을 적어도 10 ㎍, 적어도 50 ㎍, 적어도 75 ㎍, 적어도 100 ㎍, 적어도 200 ㎍, 적어도 250 ㎍, 또는 적어도 500 ㎍ 또는 그 이상 포함한다.

일부 구체예에서, 대상 단백질 또는 폴리펩티드(또는 그 일부)는 핵산에 의해 암호된다. 일반적으로 핵산은 하나 이상의 셀렉터 코돈, 둘 이상의 셀렉터 코돈, 셋 이상의 셀렉터 코돈, 넷 이상의 셀렉터 코돈, 다섯 이상의 셀렉터 코돈, 여섯 이상의 셀렉터 코돈, 일곱 이상의 셀렉터 코돈, 여덟 이상의 셀렉터 코돈, 아홉 이상의 셀렉터 코돈,, 또는 심지어 열 또는 그 이상의 셀렉터 코돈을 포함한다.

본 발명은 또한 진핵 세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질 하나 이상을 생산하는 방법 (및 그러한 방법에 의해 생산된 단백질)을 제공한다. 상기 방법은 예를 들어, 하나 이상의 셀렉터 코돈을 포함하며 단백질을 암호화하는 핵산을 포함하는 진핵 세포를 적절한 배지에서 성장시키는 것을 포함한다. 진핵 세포는 또한 세포에서 기능하며 셀렉터 코돈을 인식하는 직교 tRNA(O-tRNA) 및 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 직교 아미노아실 tRNA 신세타제(O-RS)를 포함하며, 배지는 비천연 아미노산을 포함한다. 한 구체예에서, O-RS는 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS에 비하여 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어 99% 또는 그 이상 효율적으로 비천연 아미노산으로 O-tRNA를 아미노아실화한다. 다른 구체예에서, O-tRNA는 서열 번호 64 또는 65 또는 그의 상보성 폴리뉴클레오티드 서열을 포함하거나, 이로부터 프로세스되거나, 또는 이에 의해 암호된다. 또 다른 구체예에서, O-RS는 서열 번호 36-63(예, 36-47, 48-63 또는 36-63 중 임의의 다른 서브세트) 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함한다.

한 구체예에서, 상기 방법은 추가로 제 1 반응성 기를 포함하는 비천연 아미노산을 단백질내로 포함시키고; 상기 단백질을 제 2 반응성기를 포함하는 분자(예, 염료, 중합체, 예, 폴리에틸렌 글리콜의 유도체, 광가교제, 세포독성 화합물, 친화성 라벨, 바이오틴의 유도체, 수지, 제 2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조인자, 지방산, 탄수화물, 폴리뉴클레오티드(예, DNA, RNA 등) 등)와 접촉시키는 단계를 포함한다. 제 1 반응성 기는 상기 분자를 [3+2] 고리화첨가를 통해 비천연 아미노산에 부착하기 위해 제 2 반응성기와 반응한다. 한 구체예에서, 제 1 반응성 기는 알키닐 또는 아지도 부분이고 제 2 반응성 기는 아지도 또는 알키닐 부분이다. 예를 들어, 제 1 반응성 기는 알키닐 부분(예, 비천연 아미노산 p-프로파길옥시페닐알라닌에서)이며 제 2 반응성 기는 아지도 부분이다. 다른 예에서는, 제 1 반응성기는 아지도 부분(예, 비천연 아미노산 p-아지도-L-페닐알라닌에서)이고 제 2 반응성 기는 알키닐 부분이다.

일부 구체예에서, 암호된 단백질은 치료 단백질, 진단 단백질, 산업용 효소, 또는 그 일부를 포함한다. 한 구체예에서, 상기 방법에 의해 생산되는 단백질은 추가로 비천연 아미노산을 통해 변형된다. 예를 들어, 비천연 아미노산은 친핵-친전자 반응을 통해, [3+2] 고리화첨가, 등을 통해 변형된다. 다른 구체예에서, 상기 방법에 의해 생산된 단백질은 생체내에서 하나 이상의 번역후 변형(예, N-당화, O-당화, 아세틸화, 아실화, 지질-변형, 팔미토일화, 팔미테이트 첨가, 인산화, 당지질-결합 변형, 등)에 의해 변형된다.

스크리닝 또는 선별 전사 조절자 단백질을 생산하는 방법(및 그러한 방법에 의해 생산된 스크리닝 또는 선별 전사 조절자 단백질)이 또한 제공된다. 상기 방법은 예를 들어, 핵산 결합 도메인을 암호화하는 제 1 폴리뉴클레오티드 서열을 선별하고, 제 1 폴리뉴클레오티드 서열을 돌연변이시켜 하나 이상의 셀렉터 코돈을 포함시키는 것을 포함한다. 이것은 스크리닝 또는 선별 폴리뉴클레오티드 서열을 제공한다. 상기 방법은 또한 예를 들어, 전사 활성화 도메인을 암호화하는 제 2 폴리뉴클레오티드 서열을 선별하고, 제 2 폴리뉴클레오티드 서열에 작동적으로 연결된 스크리닝 또는 선별 폴리뉴클레오티드 서열을 포함하는 구조체를 제공하며, 상기 구조체, 비천연 아미노산, 직교 tRNA 신세타제(O-RS) 및 직교 tRNA(O-tRNA)를 세포내로 도입하는 것을 포함한다. 이들 성분으로, O-RS는 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하고 O-tRNA는 셀렉터 코돈을 인식하고 스크리닝 또는 선별 폴리뉴클레오티드 서열내의 셀렉터 코돈에 대한 반으응로 핵산 결합 도메인내로 비천연 아미노산을 포함시킨다. 이것은 스크리닝 또는 선별 전사 조절자 단백질을 제공한다.

일부 구체예에서, 본 발명의 조성물 및 방법은 진핵 세포를 포함한다. 본 발명의 진핵 세포는 예를 들어, 포유류 세포, 효모 세포, 진균 세포, 식물 세포, 곤충 세포 등 중 임의의 것을 포함한다. 본 발명의 번역 성분은 다양한 유기체, 예, 원핵 유기체(예, 대장균, 바실러스 스테아로써모필러스 등) 또는 고세균과 같은 비진핵 유기체, 또는 예, 진핵 유기체로부터 유래될 수 있다.

본 발명의 셀렉터 코돈은 진핵 단백질 생합성 기계의 유전자 코돈 골격을 확장시킨다. 중지 코돈(예, 앰버 코돈, 오커 코돈, 또는 오팔 중지 코돈), 넌센스 코돈, 희귀 코돈, 4(또는 그 이상) 염기 코돈 등을 비롯한 다양한 셀렉터 코돈 중 임의의 것을 본 발명에 이용할 수 있다.

여기서 개시된 조성물 및 방법에 이용될 수 있는 비천연 아미노산의 예는 p-아세틸-L-페닐알라닌, p-요오도-L-페닐알라닌, 0-메틸-L-티로신, p-프로파길옥시페닐알라닌, p-프로파길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, 0-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 하이드록실, 알케닐, 알키닐, 에테르, 티올, 설포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 하이드록실아민, 케토, 또는 아미노 치환된 아미노산, 또는 임의의 그 조합; 광활성화 가교제를 갖는 아미노산; 스핀-표지된 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 포토케이지드(photocaged) 및/또는 광이성질체성 아미노산; 바이오틴 또는 바이오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중(heavy) 원자 치환된 아미노산; 화학적으로 절단가능하거나 광절단가능한 아미노산; 신장된 측쇄를 가진 아미노산; 독성기를 함유하는 아미노산; 당 치환된 아미노산; 탄소-연결된 당-함유 아미노산; 산화환원 활성 아미노산; α-하이드록시 함유산; 아미노 티오산; α,α 이치환된 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 고리형 아미노산, 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산 등을 포함한다(하지만 이에 한정되지 않는다).

본 발명은 또한 폴리펩티드(O-RS) 및 폴리뉴클레오티드, 예를 들어, O-tRNA, O-RS 또는 그 일부(예, 신세타제의 활성 부위)를 암호화하는 폴리뉴클레오티드, 아미노아실-tRNA 신세타제 돌연변이를 구성하기 위해 이용되는 올리고뉴클레오티드, 하나 이상의 셀렉터 코돈을 포함하는 대상 단백질 또는 폴리펩티드를 암호화하는 폴리뉴클레오티드 등을 제공한다. 예를 들어, 본 발명의 폴리펩티드는 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트) 및/또는 86에 개시된 아미노산 서열을 포함하는 폴리펩티드, 서열 번호 3-35 중 어느 하나(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트)에 개시된 폴리뉴클레오티드 서열에 의해 암호화되는 아미노산 서열을 포함하는 폴리펩티드, 및 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트) 및/또는 86에 개시된 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 3-35중 어느 하나(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트)에 개시된 폴리뉴클레오티드 서열에 의해 암호화되는 아미노산 서열을 포함하는 폴리펩티드에 대해 특이적인 항체와 특이적으로 면역반응하는 폴리펩티드를 포함한다.

자연 발생 티로실 아미노아실-tRNA 신세타제(TyrRS)(예, 서열 번호 2)와 90% 이상 동일한 아미노산 서열을 포함하며 그룹 A-E의 둘 이상의 아미노산을 포함하는 폴리펩티드가 본 발명의 폴리펩티드에 포함된다. 유사하게, 본 발명의 폴리펩티드는 또한 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트) 및/또는 86의 20개 이상의 연속적인 아미노산, 및 그룹 A-E에서 전술한 아미노산 치환을 둘 이상 포함하는 폴리펩티드를 선택적으로 포함한다. 상기 폴리펩티드의 임의의 것의 보존적 변이를 포함하는 아미노산 서열 또한 본 발명의 폴리펩티드로 포함된다.

한 구체예에서, 조성물은 본 발명의 폴리펩티드 및 부형제(완충액, 물, 약학적 허용 부형제 등)을 포함한다. 본 발명은 또한 본 발명의 폴리펩티드와 특이적으로 면역반응하는 항체 또는 항혈청을 제공한다.

폴리뉴클레오티드가 또한 본 발명에서 제공된다. 본 발명의 폴리뉴클레오티드는 하나 이상의 셀렉터 코돈을 갖는 본 발명의 대상 단백질 또는 폴리펩티드를 암호화하는 것을 포함한다. 또한, 본 발명의 폴리뉴클레오티드는 예를 들어, 서열 번호 3-35(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트), 64-85 중 어느 하나에 개시된 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드; 그 폴리뉴클레오티드 서열에 상보적이거나 이를 암호화하는 폴리뉴클레오티드; 및/또는 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트) 및/또는 86에 개시된 아미노산 서열 또는 그의 보존적 변이체를 포함하는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 본 발명의 폴리뉴클레오티드는 또한 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 유사하게, 실질적으로 핵산의 전체 길이에 걸쳐 높은 엄격도 조건하에서 전술한 폴리뉴클레오티드에 하이브리드하는 핵산은 본 발명의 폴리뉴클레오티드이다.

본 발명의 폴리뉴클레오티드는 또한 자연 발생 티로실 아미노아실-tRNA 신세타제(TyrRS)와 90% 이상 동일한 아미노산 서열(예, 서열 번호 2)을 포함하며 그룹 A-E에서 전술한 돌연변이 둘 이상을 포함하는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 전술한 폴리뉴클레오티드와 70% 이상, (또는 75% 이상, 80% 이상, 적어도 85%, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상 또는 그 이상) 동일한 폴리뉴클레오티드 및/또는 전술한 폴리뉴클레오티드 중 임의의 것의 보존적 변이를 포함하는 폴리뉴클레오티드가 또한 본 발명의 폴리뉴클레오티드에 포함된다.

일부 구체예에서, 벡터(예, 플라스미드, 코스미드, 파아지, 바이러스, 등)는 본 발명의 폴리뉴클레오티드를 포함한다. 한 구체예에서, 벡터는 발현 벡터이다. 다른 구체예에서, 발현 벡터는 본 발명의 폴리뉴클레오티드 중 하나 이상에 작동적으로 연결되는 프로모터를 포함한다. 다른 구체예에서, 세포는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함한다.

다른 태양에서, 본 발명은 화합물의 조성물 및 그러한 화합물을 생산하는 방법을 제공한다. 예를 들어, 화합물은 예를 들어, 비천연 아미노산(예, p-(프로파길옥시)-페닐알라닌(예, 도 11의 1)), 아지도 염료(화학 구조 4 및 화학 구조 6에 나타난 것), 알키닐 폴리에틸렌 글리콜(예, 화학 구조 7에 나타난 것)을 포함하며, 이때 n은 예를 들어, 50 내지 10,000, 75 내지 5,000, 100 내지 2,000, 100 내지 1000 등의 정수이다. 본 발명의 구체예에서, 알키닐 폴리에틸렌 글리콜은 예를 들어, 약 5,000 내지 약 100,000 Da, 약 20,000 내지 약 50,000 Da, 약 20,000 내지 약 10,000 Da (예, 20,000 Da)의 분자량을 갖는다.

단백질 및 세포에서, 이들 화합물을 포함하는 다양한 조성물이 또한 제공된다. 한 태양에서, p-(프로파길옥시)-페닐알라닌 비천연 아미노산을 포함하는 조성물은 직교 tRNA를 추가로 포함한다. 비천연 아미노산은 직교 tRNA에 결합(예, 공유적으로)될 수 있으며, 예를 들어, 아미노아실 결합을 통해 직교 tRNA에 공유 결합되거나, 직교 tRNA의 말단 리보스 당의 3' OH 또는 2' OH에 공유결합된다.

본 발명의 한 태양에서, 아지도 염료(예, 화학 구조 4 또는 화학 구조 6)를 포함하는 단백질은 하나 이상의 비천연 아미노산(예, 알키닐 아미노산)을 추가로 포함하며, 이때 아지도 염료는 [3+2] 고리화첨가를 통해 비천연 아미노산에 부착된다.

한 구체예에서, 단백질은 화학 구조 7의 알키닐 폴리에틸렌 글리콜을 포함한다. 다른 구체예에서, 조성물은 하나 이상의 비천연 아미노산(예, 아지도 아미노산)을 추가로 포함하며, 이때 알키닐 폴리에틸렌 글리콜은 [3+2] 고리 첨가를 통해 비천연 아미노산에 부착된다.

다양한 화합물의 합성 방법이 본 발명에 포함된다. 예를 들어, p-(프로파길옥시)페닐알라닌 화합물을 합성하는 방법이 제공된다. 예를 들어, 상기 방법은 (a) 무수 DMF에 N-tert-부톡시카르보닐-티로신 및 K₂CO₃ 를 현탁시키고, (b) 프로파길 브로마이드를 (a)의 반응 혼합물에 첨가하고 하이드록실 및 카르복실기를 알킬화하여, 하기 구조를 갖는 보호된 중간 화합물을 생성하고:

(c) 상기 보호된 중간 화합물을 MeOH중의 무수 HCl과 혼합하고 아민 부분을 탈보호시켜 p-(프로파길옥시)페닐알라닌 화합물을 합성한다. 한 구체예에서, 상기 방법은 추가로 (d) 수성 NaOH 및 MeOH에서 p-(프로파길옥시)페닐알라닌 HCl을 용해시키고 이것을 실온에서 교반시키며, (e) pH를 7로 조절하고, (f) p-(프로파길옥시)페닐알라닌 화합물을 침전시키는 것을 포함한다.

아지도 염료를 합성하는 방법이 또한 제공된다. 예를 들어, 상기 방법은 (a) 설포닐 할라이드 부분을 포함하는 염료 화합물을 제공하고, (b) 3-아지도프로필아민과 트리에틸아민의 존재하에서 염료 화합물을 실온으로 가온하고 3-아지도프로필아민의 아민 부분을 염료 화합물의 할라이드 위치에 결합시켜 아지도 염료를 합성하는 것을 포함한다. 한 구체예에서, 염료 화합물은 댄실 클로라이드를 포함하며, 아지도 염료는 화학 구조 4의 조성물을 포함한다. 한 태양에서, 상기 방법은 반응 혼합물로부터 아지도 염료를 정제하는 것을 추가로 포함한다.

다른 예에서, 아지도 염료를 합성하는 방법은 (a) 아민-함유 염료 화합물을 제공하고, (b) 아민-함유 염료를 적합한 용매에서 카르보디이미드 및 4-(3-아지도프로필카바모일)-부티르산과 배합하고, 산의 카르보닐 기를 염료 화합물의 아민 부분에 결합시켜 아지도 염료를 합성하는 것을 포함한다. 한 구체예에서, 카르보디이민은 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 하이드로클로라이드(EDCI)를 포함한다. 한 태양에서, 아민-함유 염료는 플루오로세인아민을 포함하며, 적합한 용매는 피리딘을 포함한다. 예를 들어, 아민-함유 염료는 플루오르세인아민을 포함하며 아지도 염료는 화학 구조 6의 조성물을 포함한다. 한 태양에서, 상기 방법은 추가로 (c) 아지도 염료를 침전시키고, (d) 침전물을 HCl로 세척하고, (e) 세척된 침전물을 EtOAc에 용해시키고, 그리고 (f) 아지도 염료를 헥산에 침전시키는 것을 추가로 포함한다.

프로파길 아미드 폴리에틸렌 글리콜을 합성하는 방법이 또한 제공된다. 예를 들어, 상기 방법은 실온에서 유기 용매(예, CH₂Cl₂)에서 폴리에틸렌 글리콜(PEG)-하이드록시석신이미드 에스테르와 프로파길아민을 반응시켜 화학 구조 7의 프로파길 아미드 폴리에틸렌 글리콜을 생성하는 것을 포함한다.

한 구체예에서, 상기 방법은 추가로 에틸 아세테이트를 이용하여 프로파길아미드 폴리에틸렌 글리콜을 침전시키는 것을 포함한다. 한 태양에서, 상기 방법은 메탄올에서 프로파길아미드 폴리에틸렌 글리콜을 재결정화하고 진공하에서 생성물을 건조시키는 것을 추가로 포함한다.

키트 또한 본 발명의 특징이다. 예를 들어, 세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질을 생산하는 키트가 제공되며, 이 키트는 O-tRNA를 암호화하는 폴리뉴클레오티드 서열 또는 O-tRNA, 및 O-RS를 암호화하는 폴리뉴클레오티드 서열 또는 O-RS를 함유하는 용기를 포함한다. 한 구체예에서, 키트는 하나 이상의 비천연 아미노산을 추가로 포함한다. 다른 구체예에서, 키트는 단백질을 생산하기 위한 안내서를 추가로 포함한다.

정의

본 발명을 상세히 설명하기 전에, 본 발명은 변화될 수 있는 구체적인 장치 또는 생물학적 시스템에 제한되지 않음이 이해되어야 한다. 여기서 이용된 용어는 단지 구체적인 구체예를 설명할 목적이며 제한하고자 함이 아님이 이해되어야 한다. 본 명세서 및 첨부된 청구범위에서 이용될 때, 단수 형태는 내용이 명확히 달리 나타내지 않으면 복수를 포함한다. 따라서, 예를 들어, "세포"는 둘 이상의 세포의 조합을 포함하며, "박테리아"는 박테리아의 혼합물을 포함한다.

여기서 또는 명세서의 나머지 부분에서 달리 정의되지 않으면, 본원에서 이용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.

상동성: 단백질 및/또는 단백질 서열은 그들이 자연적으로 또는 인공적으로, 공통된 조상 단백질 또는 단백질 서열로부터 유래될 때 "상동성"이다. 유사하게, 핵산 및/또는 핵산 서열은 그들이 자연적으로 또는 인공적으로, 공통된 조상 핵산 또는 핵산 서열로부터 유래될 때 "상동성"이다. 예를 들어, 임의의 자연 발생 핵산은 하나 이상의 셀렉터 코돈을 포함하기 위하여 임의의 이용가능한 돌연변이유발 방법에 의해 변형될 수 있다. 발현될 때, 이 돌연변이된 핵산은 하나 이상의 비천연 아미노산을 포함하는 폴리펩티드를 암호한다. 돌연변이 과정은 물론 하나 이상의 표준 코돈을 추가로 변형시켜 생성된 돌연변이 단백질에서 하나 이상의 표준 아미노산을 변화시킬 수 있다. 상동성은 일반적으로 둘 이상의 핵산 또는 단백질(또는 그 서열) 사이의 서열 유사성으로부터 추론된다. 상동성을 확립하는 데 유용한 서열 간의 유사성의 정확한 퍼센티지는 문제의 핵산 및 단백질에 따라 다르지만, 25% 서열 유사성도 일상적으로 상동성 확립에 이용된다. 더 높은 서열 유사성, 예를 들어, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 또는 그 이상 또한 상동성을 확립하기 위해 이용될 수 있다. 서열 유사성 퍼센티지를 결정하는 방법(예, 디폴트 파라미터를 이용하는 BLASTP 및 BLASTN)이 여기서 개시되며 일반적으로 이용가능하다.

직교(orthogonal): 여기서 이용될 때, 용어 "직교"는 세포 또는 번역 시스템에 내인성인 상응하는 분자에 비하여 감소된 효율로 세포의 내인성 성분과 기능하거나 또는 세포의 내인성 성분과 기능하지 못하는 분자(예, 직교 tRNA(O-tRNA) 및/또는 직교 아미노아실 tRNA 신세타제(O-RS))를 말한다. tRNA 및 아미노아실-tRNA 신세타제의 경우, 직교는 내인성 tRNA 신세타제와 기능하는 내인성 tRNA와 비교하여 직교 tRNA가 내인성 tRNA 신세타제와 기능하지 못하거나 예를 들어, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만의 효율과 같은 감소된 효율로 기능하는 것, 또는 내인성 tRNA와 기능하는 내인성 tRNA 신세타제와 비교할 때 직교 아미노아실-tRNA 신세타제가 내인성 tRNA와 기능하지 못하거나 예를 들어, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만의 효율과 같은 감소된 효율로 기능하는 것을 말한다. 직교 분자는 세포에서 기능성 내인성 상보적 분자가 결핍되어 있다. 예를 들어, 세포에서 직교 tRNA는 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비교할 때, 감소되거나 심지어는 제로의 효율로 세포의 내인성 RS에 의해 아미노아실화된다. 다른 예에서, 직교 RS는 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비교할 때, 감소되거나 심지어는 제로의 효율로 대상 세포에서 내인성 tRNA를 아미노아실화한다. 첫번째 직교 분자와 기능하는 두번째 직교 분자가 세포내로 도입될 수 있다. 예를 들어, 직교 tRNA/RS 쌍은 상응하는 tRNA/RS 내인성 쌍에 비하여 효율(예, 50% 효율, 60% 효율, 70% 효율, 75% 효율, 80% 효율, 90% 효율, 95% 효율, 또는 99% 또는 그 이상의 효율)로 세포에서 함께 기능하는 도입된 상보성 성분을 포함한다.

상보성: 용어 "상보성"는 예를 들어, O-RS가 O-tRNA를 아미노아실화하는 것처럼, 함께 기능할 수 있는 직교 쌍, O-tRNA 및 O-RS의 성분을 말한다.

우선적으로 아미노아실화하다: 용어 "우선적으로 아미노아실화하다"는 자연 발생 tRNA를 아미노아실화하는 O-RS 또는 O-tRNA를 생성하기 위해 이용되는 출발 물질에 비교할 때, O-RS가 비천연 아미노산을 아미노아실화하는 효율, 예, 70 % 효율, 75 % 효율, 85% 효율, 90% 효율, 95 % 효율, 또는 99% 또는 그 이상의 효율을 말한다. 비천연 아미노산은 높은 확실성, 예를 들어, 주어진 셀렉터 코돈에 대해 75% 초과 효율, 주어진 셀렉터 코돈에 대해 80% 초과 효율, 주어진 셀렉터 코돈에 대해 90% 초과 효율, 주어진 셀렉터 코돈에 대해 95% 초과 효율, 또는 주어진 셀렉터 코돈에 대해 99% 초과 또는 그 이상 효율로 성장중인 폴리펩티드 쇄내로 포함된다.

셀렉터 코돈: 용어 "셀렉터 코돈"은 번역 과정에서 O-tRNA에 의해 인식되고 내인성 tRNA에 의해 인식되지 않는 코돈을 말한다. O-tRNA 안티코돈 루프는 mRNA상의 셀렉터 코돈을 인식하여 그 아미노산, 예, 비천연 아미노산을 폴리펩티드내의 이 부위에 포함시킨다. 셀렉터 코돈은 예를 들어, 중지 코돈, 예, 앰버, 오커 및 오팔 코돈과 같은 넌센스 코돈; 4 이상 염기 코돈; 희귀 코돈; 천연 또는 비천연 염기쌍에서 유래된 코돈 등을 포함할 수 있다.

억제자 tRNA: 억제자 tRNA는 예를 들어, 셀렉터 코돈에 반응하여 아미노산을 폴리펩티드쇄내로 포함시키기 위한 기작을 제공함으로써 주어진 번역 시스템에서 메신저 RNA(mRNA)의 판독을 변화시키는 tRNA이다. 예를 들어, 억제자 tRNA는 예를 들어, 중지 코돈, 4 염기 코돈; 희귀 코돈 등을 통과해 판독할 수 있다.

재생성 tRNA: 용어 "재생성 tRNA"는 번역동안 하나 이상의 폴리펩티드 쇄 내로 아미노산(예, 비천연 아미노산)을 포함시키기 위해 아미노아실화되고 아미노산으로(예, 비천연 아미노산) 반복하여 재아미노아실화될 수 있는 tRNA를 말한다.

번역 시스템: 용어 "번역 시스템"은 자연 발생 아미노산을 성장중인 폴리펩티드 쇄(단백질)내로 포함시키는 성분의 집합적 세트를 말한다. 번역 시스템의 성분은 예를 들어, 리보좀, tRNA, 신세타제, mRNA, 아미노산 등을 포함할 수 있다. 본 발명의 성분(예, ORS, OtRNA, 비천연 아미노산 등)은 생체외 또는 생체내 번역 시스템, 예, 진핵 세포, 예, 효모 세포, 포유류 세포, 식물 세포, 조류 세포, 진균 세포, 곤충 세포, 등에 첨가될 수 있다.

비천연 아미노산: 여기서 이용될 때, 용어 "비천연 아미노산"은 20개의 자연 발생 아미노산, 셀레노 시스테인 또는 피로라이신 중 하나가 아닌 임의의 아미노산, 변형된 아미노산, 및/또는 아미노산 유사체를 말한다.

로부터 유래된: 여기서 이용될 때, 용어 "로부터 유래된"은 특정 분자 또는 유기체로부터 분리되거나 그로부터의 정보를 이용하여 만들어진 성분을 말한다.

비활성 RS: 여기서 이용될 때, 용어 "비활성 RS"는 아미노산으로 그 천연 짝 tRNA를 더 이상 아미노아실화할 수 없도록 돌연변이된 신세타제를 말한다.

양성 선별 또는 스크리닝 마커: 여기서 이용될 때, 용어 "양성 선별 또는 스크리닝 마커"는 존재할 때, 예, 발현되거나 활성화될 때, 양성 선별 마커가 없는 세포로부터 양성 선별 마커가 있는 세포가 구별되도록 하는 마커를 말한다.

음성 선별 또는 스크리닝 마커: 여기서 이용될 때, 용어 "음성 선별 또는 스크리닝 마커"는 존재할 때, 예, 발현되거나 활성화될 때, (예를 들어, 원하는 특성을 보유한 세포와 비교하여) 원하는 특성을 보유하지 않은 세포가 확인되도록 하는 마커를 말한다.

리포터: 여기서 이용될 때, "리포터"는 대상 시스템의 표적 성분을 선별하기 위해 이용될 수 있는 성분을 말한다. 예를 들어, 리포터는 형광 스크리닝 마커(예, 녹색 형광 단백질), 발광 마커(예, 반딧불 루시퍼라제 단백질), 친화성 계 스크리닝 마커, 또는 his3, ura3, leu2, lys2, lacZ, β-gal/lacZ(β-갈락토시다제), Adh(알코올 디하이드로게나제) 등과 같은 선별가능한 마커 유전자를 포함할 수 있다.

진핵 유기체: 여기서 이용될 때, 용어 "진핵 유기체"는 동물(예, 포유류, 곤충, 파충류, 새 등), 섬모충류, 식물(예, 단자엽, 쌍자엽, 조류 등), 진균, 효모, 편모류, 마이크로스포리디아, 원생 생물 등과 같은 계통유전학적 도메인 유카리야(Eucarya)에 속하는 유기체를 말한다.

비진핵 유기체: 여기서 이용될 때, 용어 "비진핵 유기체"는 비진핵 유기체를 말한다. 예를 들어, 비진핵 유기체는 유박테리아(예, 대장균, 써머스 써모필러스, 바실러스 스테아로써모필러스, 등) 계통유전학 도메인, 또는 고세균(예, 메타노코커스 잔나시 ( Methanococcus jannaschii ), 메타노박테리움 써모오토트로피쿰(Methanobacterium thermoautotrophicum ), 할로페락스 볼캐니( Haloferax volcanii ) 및 할로박테리움 ( Halobacterium ) 종 NRC-1과 같은 할로박테리움 , 아키 오글로버스 펄지더스(Archaeoglobus fulgidus ), 피로코커스 푸리오서스 ( Pyrococcus furiosus ), 피 로코커스 호리코시 ( Pyrococcus horikoshii ), 유로피룸 페르닉스(Aeuropyrum pernix ) 등) 계통유전학 도메인에 속할 수 있다.

항체: 여기서 이용될 때, 용어 "항체"는 분석물(항원)에 특이적으로 결합하고 인식하는, 면역글로불린 유전자 또는 면역글로불린 유전자들에 의해 실질적으로 암호화되는 폴리펩티드 또는 그 단편을 포함하며 이에 한정되지 않는다. 그 예는 폴리클로날, 모노클로날, 키메라, 및 단일쇄 항체 등을 포함한다. Fab 단편 및 파아지 디스플레이를 비롯한 발현 라이브러리에 의해 생산된 단편을 비롯한 면역글로불린의 단편 또한 여기서 이용되는 용어 "항체"에 포함된다. 항체 구조 및 용어를 위해 예를 들어, Paul, Fundamental Immunology, 4th Ed. , 1999, Raven Press, New York을 참고한다.

보존적 변이체: 용어 "보존적 변이체"는 보존적 변이체가 기초한 성분, 예, O-tRNA 또는 O-RS과 유사하게 기능적으로 수행하지만 서열에 변화를 갖는, 번역 성분, 예, 보존적 변이체 O-tRNA 또는 보존적 변이체 O-RS를 말한다. 예를 들어, O-tRNA와 보존적 변이체 O-tRNA가 동일한 서열을 갖지 않지만, O-RS는 상보성 O-tRNA 또는 보존적 변이체 O-tRNA를 비천연 아미노산으로 아미노아실화할 것이다. 보존적 변이체는 보존적 변이체가 상응하는 O-tRNA 또는 O-RS에 상보성인 한, 예를 들어, 하나의 변이, 두 변이, 세 변이, 네 변이, 또는 다섯 이상의 변이를 서열에서 가질 수 있다.

선별 또는 스크리닝 제제: 여기서 이용될 때, 용어 "선별 또는 스크리닝 제제"는 존재할 때, 집단으로부터 일부 성분의 선별/스크리닝을 허용하는 제제를 말한다. 예를 들어, 선별 또는 스크리닝 제제는 예를 들어, 영양소, 항생제, 빛의 파장, 항체, 발현된 폴리뉴클레오티드(예, 전사 조절자 단백질) 등을 포함하며 이에 한정되지 않는다. 선별 제제는 예를 들어, 농축, 강도 등에 의해 변화될 수 있다.

검출가능한 물질: 여기서 이용될 때, 용어 "검출가능한 물질"은 활성화되거나, 변화되거나, 발현될 때, 집단으로부터 일부 성분의 선별/스크리닝을 허용하는 제제를 말한다. 예를 들어, 검출가능한 물질은 화학 제제, 예를 들어 5-플루로오로트산(5-FOA)일 수 있으며, 이것은 일부 조건, 예를 들어, URA3 리포터의 발현하에서 검출가능해져, 예를 들어 URA3 리포터를 발현하는 세포를 죽인다.

도 1, 패널 A, B 및 C는 진핵 세포, 예, 에스.세레비제(S.cerevisiae)의 유전자 코드를 확장시키기 위한 일반적인 양성 및 음성 선별 계획을 도식적으로 예시한다. 패널 A는 GAL4에서 TAG 코돈의 앰버 억제에 의해 유도되는, 리포터 유전자의 활성화된 전사를 도식적으로 예시한다. DNA 결합 도메인은 스트라이프 박스로 나타내지고 주요 및 숨은 활성화 도메인은 음영처리된 박스에 나타난다. 패널 B는 리포터 유전자의 예, 예를 들어 MaV203에서 HIS3, LacZ, URA3을 예시한다. 패널 C는 선별 계획에 이용될 수 있는 플라스미드, 예, pEcTyrRS/tRNA_CUA 및 pGADGAL4xxTAG를 도식적으로 예시한다.

도 2는 선별 배지에서 1차 생산 GAL4 리포터의 EcTyrRS 및 tRNA_CUA 의존성 표현형을 예시한다. DB-AD는 GAL4 DNA 결합 도메인과 활성화 도메인 사이의 융합체이다. DB-TAG-AD는 DB와 AD 사이에서 합성 링커중의 티로신 코돈을 대체하는 TAG 코돈을 갖는다. A5는 활성 부위의 5 잔기가 알라닌으로 돌연변이된 EcTyrRS의 비활성 버젼이다.

도 3, 패널 A 및 B는 선별 배지에서 2차 생산 GAL4 리포터의 EcTyrRS 및 tRNA_CUA 의존성 표현형을 예시한다. DNA 결합 도메인은 스트라이프 박스로 나타to고 주요 및 숨은 활성화 도메인은 음영처리된 박스에 나타난다. 패널 A는 GAL4에서 단일 아미노산 돌연변이를 갖는 구조체를 예시한다. 패널 B는 GAL4에서 두 아미노산 돌연변이를 갖는 구조체를 예시한다.

도 4 패널 A, B, 및 C는 MaV203에서 EcTyrRS 및 다양한 리포터가 있거나 없는 pGADGAL4(T44TAG, R110TAG)를 예시한다. 패널 A는 X-gal,-Ura, 또는 -Leu,-Trp의 존재하에서의 결과를 나타낸다. 패널 B는 다양한 농도의 3-AT의 존재하에서의 결과를 나타낸다. 패널 C는 다양한 퍼센티지의 5-FOA의 존재하에서의 결과를 나타낸다.

도 5 패널 A 및 B는 다양한 GAL4 돌연변이, 예, 잔기 T44(A) 및 R110(B)가 허용성 부위인 돌연변이를 이용한 ONPG 가수분해를 예시한다. 패널 A는 T44 부위에서의 다양한 타입의 돌연변이를 이용한 ONPG 가수분해 측정을 예시한다. 패널 B는 R110 부위에서의 다양한 타입의 돌연변이를 이용한 ONPG 가수분해 측정을 예시한다. 'GAL4'는 pCL1로 형질전환된 MaV203이며 오프스케일 ~ 600 ONPG 가수분해 단위였다. '무'는 GAL4 DB와 GAL4 AD를 암호화하는 플라스미드로 별도로 형질전환된 MaV203이다.

도 6은 활성 EcTyrRS 클론의 선별을 보여준다. pEcTyrRS-tRNA_CUA:pA5-tRNA_CUA의 1:10 혼합물을 함유하는 MaV203을 (-Leu, -Trp) 플레이트(좌측) 또는 (-Leu,-Trp,-His + 50 mM 3-AT) 플레이트(우측)에 10³ 희석으로 도말하고 XGAL 오버레이를 이용하여 처리하였다.

도 7, 패널 A와 B. 패널 A는 결합된 티로신을 가진 비.스테아로써모필러스 티로실-tRNA 신세타제의 활성 부위의 입체도를 예시한다. 돌연변이된 잔기가 나타 나며 대장균 티로실-tRNA 신세타제 Tyr³⁷(비. 스테아로써모필러스 TyrRS 잔기 Tyr³⁴), Asn¹²⁶ (Asn¹²³), Asp¹⁸² (Asp¹⁷⁶), phe¹⁸³(Phe¹⁷⁷), 및 Leu¹⁸⁶(Leu¹⁸⁰)로부터의 잔기에 해당한다. 패널 B는 비천연 아미노산(좌에서 우로) p-아세틸-L-페닐알라닌(1), p-벤조일-L-페닐알라닌(2), p-아지도-L-페닐알라닌(3), O-메틸-L-티로신(4), 및 p-요오도-L-티로신(5)의 예의 구조식을 예시한다.

도 8, 패널 A,B,C 및 D. 패널 A는 진핵 세포에서 직교 tRNA, 직교 아미노아실 신세타제 또는 직교 tRNA/RS의 쌍을 위한 선별/스크리닝에 이용될 수 있는 벡터 및 리포터 구조체를 예시한다. 패널 B는 선별 배지에서 활성(TyrRS) 또는 비활성(A5RS) 아미노아실-tRNA 신세타제에 반응하여 GAL4 반응성 HIS3, URA3 및 lacZ 반응성 리포터를 보유하는 효모의 표현형을 예시한다. 패널 C는 진핵 세포, 예, UAA가 비천연 아미노산인 에스. 세레비제에서 추가의 아미노산을 암호화하는 돌연변이 신세타제를 선별하기 위해 이용되는 선별 도식의 예를 예시한다. 패널 D는 p-아세틸-L-페닐알라닌을 이용한 선별로부터 분리된 효모의 표현형을 예시한다.

도 9는 도 7, 패널 B에 나타난 비천연 아미노산을 유전적으로 암호화하는 에스.세레비제에서 사람 수퍼옥사이드 디스무타제 (hSOD)(33TAG)HIS의 단백질 발현을 예시한다.

도 10, 패널 A-H는 도 7, 패널 B에 나타난 비천연 아미노산(Y*로 표시)을 함유하는 트립틱 펩티드 VY*GSIK(서열 번호 87)의 탠덤 질량 스펙트럼을 예시한다. 패널 A는 비천연 아미노산 p-아세틸-L-페닐알라닌(1)을 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 B는 비천연 아미노산 p-벤조일-L-페닐알라닌(2)을 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 C는 비천연 아미노산 p-아지도-L-페닐알라닌(3)을 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 D는 비천연 아미노산 O-메틸-L-티로신(4)을 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 E는 비천연 아미노산 p-요오도-L-티로신(5)을 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 F는 위치 Y*에서 아미노산 티로신(Y)를 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다. 패널 H는 위치 Y*에서 아미노산 류신(L)를 갖는 트립틱 펩티드의 탠덤 질량 스펙트럼을 예시한다.

도 11은 두 가지 비천연 아미노산 (1) 파라-프로파길옥시페닐알라닌 및 (2) 파라-아지도페닐알라닌의 예를 예시한다.

도 12, 패널 A, B, 및 C는 도 11에 나타난 비천연 아미노산 1 및 2의 존재 또는 부재하에서 SOD 발현을 예시한다. 패널 A는 겔코드 블루 염색 실험을 예시한다. 패널 B는 항-SOD 항체를 이용한 웨스턴 블롯을 예시한다. 패널 C는 항-6xHis 항체를 이용한 웨스턴 블롯을 예시한다.

도 13, 패널 A, B, 및 C는 [3+2] 고리 첨가에 의한 단백질 표지화를 예시한다. 패널 A는 합성된 염료 라벨 3-6을 예시한다. 패널 B는 SOD와 염료 사이의 반응을 예시한다. 패널 C는 인-겔(in-gel) 형광 스캐닝 및 겔코드 블루 염색을 예시한다.

도 14는 우라실이 없는 SD 배지에서 도 11에 나타난 1 또는 2의 부재 또는 존재하에서 신세타제 돌연변이로 형질전환된 진핵 세포, 예, 에스.세레비제 세포의 성장을 예시한다.

도 15, 패널 A와 B는 위치 Y*에서 아지드(Az)(패널 A) 또는 알킨(Al)(패널 B) 비천연 아미노산을 함유하는 트립틱 펩티드 VY*GSIK(서열 번호 87)의 탠덤 질량 스펙트럼을 예시하며 그들의 예상된 단편 이온 질량이 나타난다. 화살표는 각 펩티드를 위한 관찰된 b(청색) 및 y(적색) 이온 시리즈를 나타낸다.

도 16은 비천연 아미노산, 예, 파라-프로파길옥시페닐알라닌의 성장중인 폴리펩티드 쇄내로의 생체내 포함 및 이 비천연 아미노산을 통한 [3+2]-고리 첨가 반응에 의한 작은 유기 분자와의 생물접합을 예시한다.

도 17, 패널 A, B 및 C는 [3+2] 고리화첨가를 이용한, 비천연 아미노산을 포함하는 단백질의 PEG화를 예시한다. 패널 A는 Cu(I) 및 인산염 완충액(PB)의 존재하에서 아지도 아미노산(예, N₃-SOD)을 포함하는 단백질과 프로파길 아미드 PEG의 반응을 예시한다. 패널 B는 겔 분석에 의한 단백질의 PEG화를 예시한다. 패널 C는 프로파길 아미드 PEG의 합성을 예시한다.

발명의 상세한 설명

유전자 코드에 의해 가해지는 화학적 제한을 넘어, 진핵 세포에서 직접 단백질의 구조를 유전적으로 변형시키는 능력은 세포 과정을 탐침하고 조작하기 위한 강력한 분자 도구를 제공할 것이다. 본 발명은 진핵 세포에서 유전적으로 암호된 아미노산의 수를 확장시키는 번역 성분을 제공한다. 이들은 tRNA(예, 직교 tRNA(O-tRNA)), 아미노아실-tRNA 신세타제(예, 직교 신세타제(O-RS)), O-tRNA/O-RS의 쌍, 및 비천연 아미노산을 포함한다.

일반적으로, 본 발명의 O-tRNA는 진핵 세포에서 효율적으로 발현되고 프로세스되고 번역에서 기능하지만, 숙주의 아미노아실-tRNA 신세타제에 의해 크게 아미노아실화되지 않는다. 셀렉터 코돈에 반응하여, 본 발명의 O-tRNA는 일반적인 20개 아미노산 중 어느 것도 암호하지 않는 비천연 아미노산을 mRNA 번역동안 성장중인 폴리펩티드 쇄에 전달한다.

본 발명의 O-RS는 진핵 세포에서 비천연 아미노산으로 본 발명의 O-tRNA를 우선적으로 아미노아실화하지만, 세포질의 숙주 tRNA는 아미노아실화하지 않는다. 더욱이, 본 발명의 아미노아실-tRNA 신세타제의 특이성은 임의의 내인성 아미노산을 배제시키는 한편 비천연 아미노산의 수용을 제공한다. 예시적인 O-RS의 아미노산 서열을 포함하는 폴리펩티드, 또는 그 일부 또한 본 발명의 특징이다. 또한, 번역 성분, O-tRNA, O-RS 및 그 일부를 암호화하는 폴리뉴클레오티드는 본 발명의 특징이다.

본 발명은 또한 진핵 세포에서 사용하기 위한 비천연 아미노산을 이용하는, 원하는 번역 성분, 예, O-RS, 및 /또는 직교 쌍(직교 tRNA 및 직교 아미노아실-tRNA 신세타제)를 생산하는 방법을 제공한다. 예를 들어, 대장균으로부터의 티로실-tRNA 신세타제/tRNA_CUA 쌍은 본 발명의 O-tRNA/O-RS 쌍이다. 또한, 본 발명은 또한 한 진핵 세포에서 번역 성분을 선별/스크리닝하고 일단 선별/스크린되면 상이한 진핵 세포(선별/스크리닝에 사용되지 않았던 진핵 세포)에서 이들 성분을 이용하는 방법을 특징으로 한다. 예를 들어, 진핵 세포를 위한 번역 성분을 생산하기 위한 선별/스크리닝 방법은 효소, 예, 사카로마이세스 세레비제에서 이루어질 수 있으며, 이어서 선별된 이들 성분은 다른 진핵 세포, 예, 다른 효모 세포, 포유류 세포, 곤충 세포, 식물 세포, 진균 세포 등에서 이용될 수 있다.

본 발명은 진핵 세포에서 단백질을 생산하기 위한 방법을 추가로 제공하며, 이때 단백질은 비천연 아미노산을 포함한다. 단백질은 본 발명의 번역 성분을 이용하여 생산된다. 본 발명은 또한 비천연 아미노산을 포함하는 단백질(및 본 발명 방법에 의해 생산된 단백질)을 제공한다. 대상 단백질 또는 폴리펩티드는 또한 원핵 세포에 의해 만들어지지 않는 번역 후 변형, 예, [3+2] 고리화첨가 또는 친핵-친전자 반응을 통해 첨가되는 것 등을 포함할 수 있다. 일부 구체예에서, 비천연 아미노산을 이용하여 전사 조절자 단백질을 생산하는 방법(및 그러한 방법에 의해 생산된 단백질) 또한 본 발명에 포함된다. 비천연 아미노산을 포함하는 단백질을 포함하는 조성물 또한 본 발명의 특징이다.

비천연 아미노산을 갖는 단백질 또는 폴리펩티드를 생산하기 위한 키트 또한 본 발명의 특징이다.

직교 아미노아실 - tRNA 신세타제(O- RS )

진핵 세포에서 대상 단백질 또는 폴리펩티드에서 비천연 아미노산을 특이적으로 포함시키기 위하여, 신세타제의 기질 특이성은 일반적인 20 아미노산 중 어느 것이 아닌 원하는 비천연 아미노산만이 tRNA에 충전되도록 변화된다. 직교 신세타제가 뒤섞인 경우, 표적 위치에서 천연 및 비천연 아미노산의 혼합물을 갖는 돌연변이 단백질이 얻어질 것이다. 본 발명은 구체적인 비천연 아미노산에 대한 기질 특이성을 변화시킨 직교 아미노아실-tRNA 신세타제를 생산하는 조성물 및 방법을 제공한다.

직교 아미노아실-tRNA 신세타제(O-RS)를 포함하는 진핵 세포는 본 발명의 특징이다. O-RS는 진핵 세포에서 비천연 아미노산으로 직교 tRNA(O-tRNA)를 우선적으로 아미노아실화한다. 일부 구체예에서, O-RS는 하나보다 많은 비천연 아미노산, 예, 둘 이상, 셋 이상 등을 이용한다. 따라서, 본 발명의 O-RS는 상이한 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 능력을 가질 수 있다. 이것은 세포에서 인내될 수 있는 비천연 아미노산 또는 비천연 아미노산의 조합의 선별에 의해 및/또는 그들의 포함에 대해 세포에서 인내되는 비천연 아미노산의 상이한 양의 선별에 의해 추가의 조절 수준을 허용한다.

본 발명의 O-RS는 선택적으로 천연 아미노산에 비하여 비천연 아미노산에 대하여 하나 이상의 개선되거나 증가된 효소 특성을 갖는다. 이들 특성은 자연 발생 아미노산, 예, 20개의 공지된 일반 아미노산 중 하나에 비하여, 비천연 아미노산을 위한 더 높은 Km, 더 낮은 Km, 더 높은 kcat, 더 낮은 kcat, 더 낮은 kcat/km, 더 높은 kcat/km 등을 포함한다.

선택적으로, O-RS는 O-RS를 포함하는 폴리펩티드에 의해 및/또는 O-RS 또는 그 일부를 암호화하는 폴리뉴클레오티드에 의해 진핵 세포에 제공될 수 있다. 예를 들어, O-RS 또는 그 일부는 서열 번호 3-35(예, 3-19, 20-34, 또는 서열 3-35 중 임의의 다른 서브세트) 중 어느 하나에 개시된 폴리뉴클레오티드 서열, 또는 그의 상보성 폴리뉴클레오티드 서열에 의해 암호된다. 다른 예에서, O-RS는 서열 번호 36-63(예, 36-47, 48-63, 또는 36-63의 임의의 다른 서브세트) 중 어느 하나 및/또는 86에 개시된 아미노산 서열, 또는 그의 보존적 변이를 포함한다. 예시적인 O-RS 분자의 서열을 위해서는 예를 들어 표 5, 6, 및 8, 및 여기서 개시된 실시예 6을 참고한다.

O-RS는 또한 자연 발생 티로실 아미노아실-tRNA 신세타제(TyrRS)의 서열(예, 서열 번호 2에 개시된 서열)과 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 심지어 적어도 99.5 % 동일한 아미노산 서열을 포함할 수 있으며 그룹 A-E 중 둘 이상의 아미노산을 포함한다. 그룹 A는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발린, 이소류신, 류신, 글리신, 세린, 알라닌, 또는 트레오닌을 포함한다. 그룹 B는 대장균 TyrRS의 Asn126에 해당하는 위치에서 아스파테이트를 포함한다. 그룹 C는 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함한다. 그룹 D는 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 알라닌, 발린, 또는 티로신을 포함한다. 그리고 그룹 E는 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다. 이들 그룹의 조합의 임의의 서브세트는 본 발명의 특징이다. 예를 들어, 한 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발생하는 발린, 이소류신, 류신, 또는 트레오닌; 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 또는 글리신; 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 또는 티로신; 및 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 또는 알라닌으로부터 선택되는 둘 이상의 아미노산을 갖는다. 다른 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서의 글리신, 세린, 또는 알라닌, 대장균 TyrRS의 Asn126에 해당하는 위치에서의 아스파테이트, 대장균 TyrRS의 Asp182에 해당하는 위치에서의 아스파라긴, 대장균 TyrRS의 Phe183에 해당하는 위치에서의 알라닌 또는 발린, 및/또는 대장균 TyrRS의 Leu186에 해당하는 위치에서의 메티오닌, 발린, 시스테인, 또는 트레오닌으로부터 선택되는 둘 이상의 아미노산을 포함한다. 또한, 표 4, 표 6 및 표 8을 참고한다.

O-RS외에, 본 발명의 진핵 세포는 추가의 성분, 예, 비천연 아미노산을 포함할 수 있다. 진핵 세포는 또한 직교 tRNA(O-tRNA)(예, 대장균, 바실러스 스테아로써모필러스, 등과 같은 비진핵 유기체에서 유래)를 포함하며, 이때 O-tRNA는 셀렉터 코돈을 인식하며 O-RS에 의해 비천연 아미노산으로 우선적으로 아미노아실화된다. 대상 폴리펩티드를 암호화하며 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 포함하는 핵산, 또는 이들 중 둘 이상의 조합이 또한 세포에 존재할 수 있다.

한 태양에서, O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 세포에서 이로부터 프로세스되는 tRNA의 효율의 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어 99%의 효율로, 비천연 아미노산을 단백질내로 포함시킨다. 다른 태양에서, O-tRNA는 서열 번호 65를 포함하며, O-RS는 서열 번호 36-63(예, 36-47, 48-63, 또는 36-63의 임의의 다른 서브세트) 중 어느 하나 및/또는 86에 개시된 폴리펩티드 서열, 및/또는 그의 보존적 변이체를 포함한다. 예시적인 O-RS 및 O-tRNA 분자의 서열을 위해서는 표 5 와 실시예 6을 참고한다.

한 예에서, 진핵 세포는 직교 아미노아실-tRNA 신세타제(O-RS), 직교 tRNA(O-tRNA), 비천연 아미노산, 및 대상 폴리펩티드를 암호화하며 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 포함하는 핵산을 포함한다. O-RS는 진핵 세포에서 비천연 아미노산으로 직교 tRNA(O-tRNA)를 우선적으로 아미노아실화하며, 세포는 예를 들어 비천연 아미노산의 존재하에서의 폴리펩티드의 수율의 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만, 등의 수율로 비천연 아미노산의 부재하에서 대상 폴리펩티드를 생산한다.

본 발명의 특징인, O-RS를 생산하는 방법은 야생형 신세타제의 골격으로부터 돌연변이 신세타제 집단을 생성시키고 이어서 일반적인 20개 아미노산에 비하여 비천연 아미노산에 대한 그들의 특이성에 기초하여 돌연변이된 RS를 선별하는 것을 포함한다. 그러한 신세타제를 분리하기 위하여, 상기 선별 방법은 (i) 초기 선별로부터의 원하는 신세타제의 활성이 낮고 집단이 작을 수 있으므로 민감하며, (ii) 다른 선별 회차에서 선별 엄격도를 변화시키는 것이 바람직하므로 "조절성"이며, (iii) 다른 비천연 아미노산을 위해 상기 방법을 이용할 수 있으므로 일반적이다.

진핵 세포에서 비천연 아미노산으로 직교 tRNA을 우선적으로 아미노아실화하는 직교 아미노아실-tRNA 신세타제(O-RS)를 생산하는 방법은 일반적으로 양성 선별 및 후속되는 음성 선별의 조합을 적용하는 것을 포함한다. 양성 선별에서, 양성 마커의 비필수 위치에 도입된 셀렉터 코돈의 억제는 진핵 세포가 양성 선별 압력하에서 생존하도록 한다. 비천연 아미노산의 존재하에서, 생존자는 비천연 아미노산으 로 직교 억제자 tRNA를 충전하는 활성 신세타제를 암호한다. 음성 선별에서, 음성 마커의 비필수 위치에 도입된 셀렉터 코돈의 억제는 천연 아미노산 특이성을 갖는 신세타제를 제거한다. 음성 및 양성 선별의 생존자는 비천연 아미노산만으로(또는 적어도 우선적으로) 직교 억제자 tRNA를 아미노아실화(충전)시키는 신세타제를 암호한다.

예를 들어, 상기 방법은 (a) 비천연 아미노산의 존재하에서, 제 1종의 진핵 세포 집단을 양성 선별에 노출시키는 단계, 및 (b) 천연 아미노산으로 O-tRNA를 아미노아실화하는 활성 RS를 제거하기 위하여 비천연 아미노산의 부재하에서, 양성 선별에서 생존한 세포를 음성 선별에 노출하는 단계를 포함하여 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화 하는 O-RS를 제공하며, 이때 진핵 세포 각각은 i) 아미노아실-tRNA 신세타제(RS) 라이브러리의 구성원, ii) 직교 tRNA(O-tRNA), iii) 양성 선별 마커를 암호화하는 폴리뉴클레오티드, 및 iv) 음성 선별 마커를 암호화하는 폴리뉴클레오티드를 포함하며, 양성 선별에서 생존하는 세포는 비천연 아미노산의 존재하에서 직교 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함한다.

양성 선별 마커는 다양한 분자 중 하나일 수 있다. 한 구체예에서, 양성 선별 마커는 성장을 위한 영양 보충물을 포함하며, 선별은 영양 보충물이 없는 배지에서 실시된다. 양성 선별 마커를 암호화하는 폴리뉴클레오티드의 예는, 세포의 아미노산 보조영양요구성의 보충에 기초한 리포터 유전자, his3(예를 들어, his3 유전자는 3-아미노트리아졸(3-AT)을 제공하여 검출되는 이미다졸 글리세롤 포스페이 트 디하이드라타제를 암호함), ura3 유전자, leu2 유전자, lys2 유전자, lacZ 유전자, adh 유전자 등이다. 예를 들어, G. M. Kishore, & D. M. Shah, (1988), Amino acid biosynthesis inhibitors as herbicides, Annual Review of Biochemistry 57: 627- 663를 참고한다. 한 구체예에서, lacZ 생산은 오르토-니트로페닐-β-D-갈락토피라노시드(ONPG) 가수분해에 의해 검출된다. 예를 들어, I. G. Serebriiskii, & E. A. Golemis, (2000), Uses of lacZ to study gene function : evaluation of beta-galactosidase assays employed in the yeast two-hybrid system, Analytical Biochemistry 285: 1-15를 참고한다. 추가의 양성 선별 마커는 예를 들어, 루시퍼라제, 녹색 형광 단백질(GFP), YFP, EGFP, RFP, 항생제 내성 유전자의 생성물(예, 클로람페니콜 아세틸트랜스퍼라제(CAT)), 전사 조절자 단백질(예, GAL4) 등을 포함한다. 선택적으로, 양성 선별 마커를 암호화하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

양성 선별 마커를 암호화하는 폴리뉴클레오티드는 반응 요소에 작동적으로 연결될 수 있다. 반응 요소로부터 전사를 조절하는 전사 조절자 단백질을 암호화하며 하나 이상의 셀렉터 코돈을 포함하는 추가의 폴리뉴클레오티드가 존재할 수 있다. 비천연 아미노산으로 아미노아실화된 O-tRNA에 의해 전사 조절자 단백질내로 비천연 아미노산이 포함되어 양성 선별 마커를 암호화하는 폴리뉴클레오티드(예, 리포터 유전자)의 전사를 일으킨다. 예를 들어, 도 1A를 참고한다. 선택적으로, 셀렉터 코돈은 전사 조절자 단백질의 DNA 결합 도메인을 암호화하는 폴리뉴클레오티드 또는 실질적으로 그 근처에 위치한다.

음성 선별 마커를 암호화하는 폴리뉴클레오티드는 전사 조절자 단백질에 의해 그로부터의 전사가 매개되는 반응 요소에 작동적으로 연결될 수 있다. 예를 들어, A. J. DeMaggio, et al., (2000), The yeast split-hybrid system, Method Enzymol. 328: 128-137; H. M. Shih, et al., (1996), A positive genetic selection for disrupting protein-protein interactions : identification of CREB mutations that prevent association with the coactivator CBP, Proc. Natl. Acad. Sci. U. S. A. 93: 13896- 13901; M. Vidal, et al., (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system. [comment], Proc. Natl. Acad. Sci. U. S. A. 93: 10321-10326; 및, M. Vidal, et al., (1996), Reverse two-hybrid and One-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions. [comment], Proc. Natl. Acad. Sci. U. S. A. 93: 10315-10320를 참고한다. 천연 아미노산으로 아미노아실화된 O-tRNA에 의해 전사 조절자 단백질내로 천연 아미노산이 포함되어 음성 선별 마커의 전사를 야기한다. 선택적으로, 음성 선별 마커는 셀렉터 코돈을 포함한다. 한 구체예에서, 본 발명의 양성 선별 마커 및/또는 음성 선별 마커는 두개 이상의 셀렉터 코돈을 포함할 수 있으며, 이들 각각 또는 모두는 두개 이상의 상이한 셀렉터 코돈 또는 동일한 셀렉터 코돈 둘 이상을 포함할 수 있다.

전사 조절자 단백질은 핵산 서열(예, 반응 요소)에 (직접 또는 간접적으로) 결합하며 반응 요소에 작동적으로 연결된 서열의 전사를 조절하는 분자이다. 전사 조절자 단백질은 전사 활성자 단백질(예, GAL4, 핵 호르몬 수용체, AP1, CREB, LEF/tcf 패밀리 구성원, SMAD, VP16, SP1, 등), 전사 억제자 단백질(예, 핵 호르몬 수용체, Groucho/tle 패밀리, 인그래일드(Engrailed) 패밀리, 등), 또는 환경에 따라 두 활성 모두 가질 수 있는 단백질(예, LEF/tcf, 호모박스 단백질 등)일 수 있다. 반응 요소는 일반적으로 전사 조절자 단백질 또는 전사 조절자 단백질과 함께 작용하는 추가의 제제에 의해 인식되는 핵산 서열이다.

전사 조절자 단백질의 다른 예는 전사 활성자 단백질, GAL4이다(예, 도 1A 참고). 예를 들어, A. Laughon, et al., (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL gene, Molecular & Cellular Biology 4: 268-275; A. Laughon, & R. F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4: 260-267; L. Keegan, et al., (1986), Separation of DNA binding from the transcription-activating function of a eukaryotic regulatory protein, Science 231 : 699-704 ; 및 M. Ptashne, (1988), How eukaryotic transcriptional activators work, Nature 335: 683-689를 참고한다. 이 881 아미노산 단백질의 N-말단 147 아미노산은 특이적으로 DNA 서열에 결합하는 DNA 결합 도메인(DBD)을 형성한다. 예를 들어, M. Carey, et al.,(1989), An amino-terminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol. 209: 423-432; 및 E. Giniger, et al., Specific DNA binding of GAL4, a positive regulatory protein of yeast, Cell 40: 767-774를 참고한다. DBD는 삽입된 단백질 서열에 의해, DNA에 결합할 때 전사 를 활성화할 수 있는 C-말단 113 아미노산 활성화 도메인(AD)에 연결된다. 예를 들어, J. Ma, & M. Ptashne,(1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell 48 : 847-853 : 및 J. Ma, & M. Ptashne, (1987), The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell 50: 137-142를 참고한다. 앰버 코돈을 예를 들어, GAL4의 N-말단 DBD 및 그것의 C-말단 AD 모두를 함유하는 단일 폴리펩티드의 N-말단 DBD를 향해 배치함으로써, O-tRNA/O-RS 쌍에 의한 앰버 억제는 GAL4에 의한 전사 활성화에 연결될 수 있다(도 1, 패널 A). GAL4 활성화 리포터 유전자는 상기 유전자를 이용하여 양성 및 음성 선별 모두를 실행하기 위하여 이용될 수 있다(도 1, 패널 B).

음성 선별에 이용되는 배지는 음성 선별 마커에 의해 검출가능한 물질로 전환되는 선별 또는 스크리닝 제제를 포함할 수 있다. 본 발명의 한 태양에서, 검출가능한 물질은 독성 물질이다. 음성 선별 마커를 암호화하는 폴리뉴클레오티드는 예를 들어, ura3 유전자일 수 있다. 예를 들어, URA3 리포터는 GAL4 DNA 결합 부위를 함유하는 프로모터의 조절하에 놓일 수 있다. 음성 선별 마커가 예를 들어, 셀렉터 코돈을 갖는 GAL4를 암호화하는 폴리뉴클레오티드의 번역에 의해 생산될 때, GAL4는 URA3의 전사를 활성화한다. 음성 선별은 ura3 유전자의 유전자 생성물에 의해 검출가능한 물질(예, 세포를 죽이는 독성 물질)로 전환되는 5-플루오로오로트산(5-FOA)를 포함하는 배지에서 이루어진다. 예를 들어, J. D. Boeke, et al., (1984), A positive selection for mutants lacking orotidine-5'-phosphate decarboxylase activity in yeast : 5-fluoroorotic acid resistance, Molecular & General Genetics 197: 345-346; M. Vidal, et al. , (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system. [comment], Proc. Natl. Acad. Sci. U. S. A. 93: 10321-10326; 및 M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions. [comment], Proc. Natl. Acad. Sci. U. S. A. 93: 10315-10320를 참고한다. 또한 도 8C를 참고한다.

양성 선별 마커에서처럼, 음성 선별 마커는 또한 다양한 분자 중 하나일 수 있다. 한 구체예에서, 양성 선별 마커 및/또는 음성 선별 마커는 적합한 반응물의 존재하에서 형광하거나 발광 반응을 촉매하는 폴리펩티드이다. 예를 들어, 음성 선별 마커는 루시퍼라제, 녹색 형광 단백질(GFP), YFP, EGFP, RFP, 항생제 내성 유전자의 생성물(예, 클로람페니콜 아세틸트랜스퍼라제(CAT)), lacZ 유전자의 생성물, 전사 조절자 단백질(예, GAL4) 등을 포함한다. 본 발명의 한 태양에서, 양성 선별 마커 및/또는 음성 선별 마커는 형광-활성화된 세포 분류(FACS)에 의해 또는 발광에 의해 검출된다. 다른 예에서는, 양성 선별 마커 및/또는 음성 선별 마커는 친화성 계 스크리닝 마커를 포함한다. 동일한 폴리뉴클레오티드가 양성 선별 마커와 음성 선별 마커 둘다를 암호할 수 있다.

선별/스크리닝 엄격도의 추가 수준을 또한 본 발명의 방법에서 이용할 수 있다. 선별 또는 스크리닝 엄격도는 O-RS를 생산하기 위하여 본 방법의 하나 또는 모든 단계에서 변화될 수 있다. 이것은 예를 들어, 양성 및/또는 음성 선별 마커를 암호화하는 폴리뉴클레오티드에서 반응 요소의 양을 변화시키거나, 단계의 하나 또는 모두에 다양한 양의 비활성 신세타제를 첨가하거나, 이용되는 선별/스크리닝제제의 양을 변화시키는 등을 포함할 수 있다. 양성 및/또는 음성 선별을 추가로 더 실시할 수 있다.

선별 또는 스크리닝은 또한 예를 들어, 아미노산 투과성의 변화, 번역 효율의 변화, 번역 확실성의 변화 등으로부터 선택된 하나 이상의 양성 또는 음성 선별/스크리닝을 포함한다. 하나 이상의 변화는 단백질을 생산하기 위해 이용되는 직교 tRNA-tRNA 신세타제 쌍의 성분을 암호화하는 폴리뉴클레오티드 하나 이상에서의 돌연변이에 기초한다.

모델 농축 연구는 또한 과다한 비활성 신세타제로부터 활성 신세타제를 신속하게 선별하기 위해 이용될 수 있다. 양성 및/또는 음성 모델 선별 연구가 이루어질 수 있다. 예를 들어, 잠재적인 활성 아미노아실-tRNA 신세타제를 포함하는 진핵 세포를 다양한 과량의 비활성 아미노아실-tRNA 신세타제와 혼합한다. 비선별 배지에서 성장하고 예를 들어, X-GAL 오버레이에 의해 분석된 세포와 선별 배지에서(예, 히스티딘 및/또는 우라실 부재하에서) 성장하였으며 생존할 수 있으며 예를 들어, X-GAL 분석에 의해 분석된 세포 사이에서 비율 비교를 한다. 음성 모델 선별의 경우, 잠재적인 활성 아미노아실-tRNA 신세타제를 다양한 과량의 비활성 아미노아실-tRNA 신세타제와 혼합하고 음성 선별 물질, 예, 5-FOA로 선별한다.

일반적으로, RS 라이브러리(예, 돌연변이 RS 라이브러리)는 예를 들어, 비진핵 유기체로부터의 하나 이상의 아미노아실-tRNA 신세타제(RS)로부터 유래된 RS를 포함한다. 한 구체예에서, RS 라이브러리는 비활성 RS로부터 유래되며, 예를 들어, 이경우 비활성 RS는 활성 RS를 예를 들어 신세타제의 활성 부위에서, 신세타제의 편집 기작 부위에서, 신세타제의 다른 도메인을 배합하여 다른 부위에서, 돌연변이시켜 생성된다. 예를 들어, RS의 활성 부위의 잔기는 예를 들어, 알라닌 잔기로 돌연변이된다. 알라닌 돌연변이된 RS를 암호화하는 폴리뉴클레오티드는 알라닌 잔기를 모든 20 개 아미노산으로 돌연변이유발하기 위한 주형으로 이용된다. 돌연변이 RS의 라이브러리는 O-RS를 생산하기 위해 선별/스크린된다. 다른 구체예에서, 비활성 RS는 아미노산 결합 포켓을 포함하며 결합 포켓을 구성하는 아미노산 하나 이상은 하나 이상의 상이한 아미노산으로 치환된다. 한 예에서, 치환된 아미노산은 알라닌으로 치환된다. 선택적으로, 알라닌 돌연변이된 RS를 암호화하는 폴리뉴클레오티드는 알라닌 잔기를 모든 20 개 아미노산으로 돌연변이유발하기 위한 주형으로 이용되고 스크린/선별된다.

O-RS를 생산하는 방법은 추가로 당업계에 공지된 다양한 돌연변이유발 기법을 이용하여 RS의 라이브러리를 생산하는 것을 포함할 수 있다. 예를 들어, 돌연변이 RS는 부위-특이적인 돌연변이, 임의 점 돌연변이, 상동성 재조합, DNA 셔플링(shuffling) 또는 다른 회귀성 돌연변이유발 방법, 키메라 구조 또는 임의의 그 조합에 의해 생성될 수 있다. 예를 들어, 돌연변이 RS의 라이브러리는 둘 이상의 다른, 예를 들어, 보다 작은, 덜 다양한 "서브-라이브러리"로부터 생산될 수 있다. 신세타제가 양성 및 음성 선별/스크리닝 전략에 노출되면, 이들 신세타제는 이어서 추가의 돌연변이유발에 노출될 수 있다. 예를 들어, O-RS를 암호화하는 핵산이 분 리될 수 있으며, (예를 들어, 임의 돌연변이유발, 부위-특이적 돌연변이유발, 재조합 또는 임의의 그 조합에 의해) 돌연변이된 O-RS를 암호화하는 폴리뉴클레오티드 세트를 핵산으로부터 생성할 수 있으며; 이들 개별 단계 또는 이들 단계의 조합은 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 돌연변이 O-RS가 얻어질 때까지 반복될 수 있다. 본 발명의 한 태양에서, 단계들은 적어도 두번 실시된다.

O-RS를 생산하기 위한 추가의 상세 사항은 "직교 tRNA-아미노아실tRNA 신세타제 쌍의 생산을 위한 방법 및 조성물"이라는 제목의 WO2002/086075호에서 발견될 수 있다. 또한, Hamano-Takaku et al., (2000) A mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine, Journal of Biological Chemistry, 275 (51): 40324-40328 ; Kiga et al. (2002), An engineered Escherichia coli tyrosyl-tRNAsynthetase for site-specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cell-free system, PNAS 99 (15): 9715-9723; 및 Francklyn et al., (2002), Aminoacyl-tRNA synthetases : Versatile players in the changing theater of translation ; RNA,8 : 1363-1372를 참고한다.

직교 tRNA

직교 tRNA(O-tRNA)를 포함하는 진핵 세포가 본 발명에 의해 제공된다. 직교 tRNA는 생체내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오 티드에 의해 암호화되는 단백질내로 비천연 아미노산을 포함시킨다. 일부 구체예에서, 본 발명의 O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 세포에서 이로부터 프로세스되는 tRNA의 효율의 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어 99%의 효율로, 비천연 아미노산을 단백질내로 포함시킨다. 여기서 표 5를 참고한다.

본 발명의 O-tRNA의 예는 서열 번호 65이다. (실시예 6과 표 5를 참고한다.) 서열 번호 65는 예를 들어, 세포의 내인성 스플라이싱 및 프로세싱 기계를 이용하여 세포에서 선택적으로 프로세스되며 변형되어 활성 O-tRNA를 형성하는 프리-스플라이싱/프로세싱 전사물이다. 일반적으로, 그러한 프리-스플라이싱 전사물 집단은 세포에서 활성 tRNA 집단을 형성한다(활성 tRNA는 하나 이상의 활성 형태일 수 있다). 본 발명은 또한 O-tRNA의 보존적 변이체 및 그것의 가공된 세포 생성물을 포함한다. 예를 들어, O-tRNA의 보존적 변이체는 서열 번호 65의 O-tRNA처럼 기능하며 tRNA L-모양 구조를 예를 들어 프로세스된 형태에서 유지하지만 동일한 서열을 갖지 않는(그리고 야생형 tRNA 분자외의 것인) 분자를 포함한다. 일반적으로, 본 발명의 O-tRNA는 셀렉터 코돈에 반응하여 폴리뉴클레오티드에 의해 암호화되는 단백질내로 비천연 아미노산을 포함시키는 것을 다시 매개하기 위하여 생체내에서 재아미노아실화될 수 있으므로, 재생성 O-tRNA이다.

원핵생물이 아닌 진핵생물에서 tRNA의 전사는 RNA 폴리머라제 III에 의해 실시되고 이것은 진핵 세포에서 전사될 수 있는 tRNA 구조 유전자의 일차 서열에 제한을 가한다. 또한, 진핵 세포에서, tRNA는 번역에서 기능하기 위하여, 그들이 전 사되는 핵으로부터 세포질로 배출되는 것이 필요하다. 본 발명의 O-tRNA를 암호화하는 핵산 또는 그의 상보성 폴리뉴클레오티드는 또한 본 발명의 특징이다. 본 발명의 한 태양에서, 본 발명의 O-tRNA를 암호화하는 핵산은 내부 프로모터 서열, 예, A 박스(예, TRGCNNAGY) 및 B 박스 (예, GGTTCGANTCC, 서열 번호 88)을 포함한다. 본 발명의 O-tRNA는 또한 전사 후 변형될 수 있다. 예를 들어, 진핵생물에서 tRNA의 전사 후 변형은 RnaseP 및 3'-엔도뉴클레아제 각각에 의해 5' 및 3'-인접 서열의 제거를 포함한다. 3'-CCA 서열의 첨가는 또한 진핵생물에서 tRNA 유전자의 전사후 변형이다.

한 구체예에서, O-tRNA는 제 1종의 진핵 세포의 집단을 음성 선별에 노출시킴으로써 얻어지며, 이때 진핵 세포는 tRNA 라이브러리의 구성원을 포함한다. 음성 선별은 진핵 세포에 내인성인 아미노아실-tRNA 신세타제(RS)에 의해 아미노아실화된 tRNA의 라이브러리의 구성원을 포함하는 세포를 제거한다. 이것은 제 1종의 진핵 세포에 직교인 tRNA의 집단을 제공한다.

다르게는, 또는 비천연 아미노산을 폴리펩티드에 포함시키기 위한 전술한 다른 방법과 함께, 트랜스-번역 시스템을 이용할 수 있다. 이 시스템은 대장균에 존재하는 tmRNA로 불리는 분자에 관련된다. 이 RNA 분자는 알라닐 tRNA에 구조적으로 관련되며 알라닐 신세타제에 의해 아미노아실화된다. tmRNA와 tRNA 사이의 차이는 안티코돈 루프가 특별한 큰 서열로 대체된다는 것이다. 이 서열은 주형으로서 tmRNA내에 암호된 개방 판독 프레임을 이용하여 중지된 서열 상에서의 번역을 리보좀이 재개하도록 한다. 본 발명에서, 직교 신세타제로 우선적으로 아미노아실화되 고 비천연 아미노산으로 충전되는 직교 tmRNA가 생성될 수 있다. 상기 시스템에 의해 유전자를 전사함으로써, 리보좀은 특적 부위에서 중지하며, 비천연 아미노산이 이 부위에 도입되고, 직교 tmRNA내에 암호된 서열을 이용하여 번역이 재개된다.

재조합 직교 tRNA를 생산하기 위한 추가 방법은 예를 들어, "직교 tRNA-아미노아실tRNA 신세타제 쌍의 생산을 위한 방법 및 조성물" 제목의 국제 특허 출원 WO2002/086075호에서 찾을 수 있다. 또한, Forster et al., (2003) Programnming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100(11) : 6353-6357; 및 Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100 (10): 5676-5681를 참고한다.

직교 tRNA 및 직교 아미노아실 - tRNA 신세타제 쌍

직교 쌍은 O-tRNA, 예, 억제자 tRNA, 프레임쉬프트 tRNA, 등 및 O-RS로 이루어진다. O-tRNA는 내인성 신세타제에 의해 아실화되지 않으며 비천연 아미노산을, 생체내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 암호화되는 단백질내로 포함시킬 수 있다. O-RS는 O-tRNA를 인식하며 진핵 세포에서 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화한다. 그러한 방법에 의해 생산된 직교 쌍과 함께 직교 쌍을 생산하기 위한 방법 및 진핵 세포에서 사용하기 위한 직교 쌍의 조성물이 본 발명에 포함된다. 다수의 직교 tRNA/신세타제 쌍의 개발은 진핵 세포에서 상이한 코돈을 이용하여 다수의 비천연 아미노산을 동시에 포함시킬 수 있다.

진핵 세포에서 직교 O-tRNA/O-RS 쌍은 쌍, 예, 넌센스 억제자 쌍을 비효율적인 교차 종 아미노아실화를 갖는 상이한 유기체로부터 수입함으로써 생산될 수 있다. O-tRNA 및 O-RS는 진핵 세포에서 효율적으로 발현되고 프로세스되며, O-tRNA는 핵으로부터 세포질로 효율적으로 배출된다. 예를 들어, 하나의 그러한 쌍은 대장균으로부터의 티로실-tRNA 신세타제/tRNA_CUA 쌍이다(예를 들어, H. M. Goodman, et al., (1968), Nature 217: 1019-24; 및 D. G. Barker, et al., (1982), FEBS Letters 150: 419-23를 참고한다). 대장균 티로실-tRNA 신세타제는 둘다 에스 . 세레비제의 세포질에서 발현될 때 그의 짝 대장균 tRNA_CUA 를 효율적으로 아미노아실화하지만, 에스 . 세레비제 tRNA를 아미노아실화하지 않는다. 예를 들어, H. Edwards, & P. Schimmel, (1990), Molecular & Cellular Biology 10: 1633-41; 및 H.Edwards, et al., (1991), PNAS United States of America 88: 1153-6을 참고한다. 또한, 대장균 티로실 tRNA_CUA 는 에스 . 세레비제 아미노아실-tRNA 신세타제를 위한 빈약한 기질이지만(예, V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11: 2744-51 참고), 에스 . 세레비제에서 단백질 번역에서는 효율적으로 기능한다. 예를 들어, H. Edwards, & P. Schimmel, (1990) Molecular & Cellular Biology 10: 1633-41 ; H. Edwards, et al., (1991), PNAS United States of America88 : 1153-6; 및, V. Trezeguet, et al., (1991), Molecular & Cellular Biologv 11: 2744-51를 참고한다. 더욱이, 이 콜리 TyrRS는 tRNA에 연결된 비천연 아미노산을 프루프리드(proofread)하기 위한 편집 기작을 갖지 않는다.

O-tRNA와 O-RS는 자연 발생이거나 자연 발생 tRNA 및/또는 RS의 돌연변이에 의해 유도될 수 있으며, 이것은 다양한 유기체로부터 tRNA 라이브러리 및/또는 RS 라이브러리를 생성한다. "공급원 및 숙주" 섹션을 참고한다. 다양한 구체예에서, O-tRNA와 O-RS는 하나 이상의 유기체로부터 유래된다. 다른 구체예에서, O-tRNA는 첫번째 유기체로부터의 자연 발생 또는 돌연변이된 자연 발생 tRNA로부터 유래되며 O-RS는 두번째 유기체로부터의 자연 발생 또는 돌연변이된 자연 발생 RS로부터 유래된다. 한 구체예에서, 첫번째 및 두번째 비진핵 유기체는 동일하다. 다르게는, 첫번째 및 두번째 비진핵 유기체는 상이할 수 있다.

O-RS 및 O-tRNA의 생산 방법을 위해서는 "직교 아미노아실-tRNA 신세타제"와 "O-tRNA" 제목의 섹션을 참고한다. 또한 "직교 tRNA-아미노아실 tRNA 신세타제 쌍의 생산 방법 및 조성물" 제목의 국제 특허 출원 WO2002/086075호를 참고한다.

확실성, 효율 및 수율

확실성은 원하는 분자, 예, 비천연 아미노산 또는 아미노산이 원하는 위치에서 성장중인 폴리펩티드내로 포함되는 정확성을 말한다. 본 발명의 번역 성분은 셀렉터 코돈에 반응하여 비천연 아미노산을 높은 확실성으로 단백질내로 포함시킨다. 예를 들어, 본 발명의 성분을 이용하여, (예를 들어 셀렉터 코돈에 반응하여) 원하는 위치에서 성장중인 폴리펩티드내로 원하는 비천연 아미노산을 포함시키는 효율은 예를 들어, 특정 천연 아미노산이 원하는 위치에서 성장중인 폴리펩티드 쇄 내로 원치 않게 포함되는 것과 비교할 때 75% 초과, 85% 초과, 95% 초과, 또는 심지어는 99% 초과 또는 그 이상이다.

효율은 또한 관련 대조구에 비교할 때, O-RS가 비천연 아미노산으로 O-tRNA를 아미노아실화하는 정도를 말할 수 있다. 본 발명의 O-RS는 그들의 효율에 의해 정의될 수 있다. 본 발명의 일부 구체예에서, O-RS는 다른 O-RS에 비교된다. 예를 들어, 본 발명의 O-RS는 예를 들어, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS 또는 표5의 다른 구체적인 RS가 O-tRNA를 아미노아실화하는 효율의 40% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 심지어는 99% 또는 그 이상의 효율로 비천연 아미노산으로 O-tRNA를 아미노아실화한다. 다른 구체예에서, 본 발명의 O-RS는 O-RS가 천연 아미노산으로 O-tRNA를 아미노아실화하는 것보다 10배 이상, 20배 이상, 30배 이상, 등으로 더 효율적으로 O-tRNA를 아미노아실화한다.

본 발명의 번역 성분을 이용하여, 비천연 아미노산을 포함하는 대상 폴리펩티드의 수율은 폴리뉴클레오티드가 셀렉터 코돈이 결핍된 세포로부터의 자연 발생 대상 폴리펩티드에 대해 얻어진 수율의 5% 이상, 10% 이상, 적어도 20%, 30% 이상, 40% 이상, 50% 또는 그 이상이다. 다른 태양에서, 세포는 비천연 아미노산의 존재하에서 폴리펩티드의 수율의 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만 등의 수율로 비천연 아미노산의 부재하에서 대상 폴리펩티드를 생산한다.

공급원 및 숙주 유기체

본 발명의 직교 번역 성분은 일반적으로 진핵 세포 또는 번역 시스템에서 사용하기 위한 비진핵 유기체로부터 유래된다. 예를 들어, 직교 O-tRNA는 비진핵 유 기체, 예, 유박테리아(예, 대장균, 써머스 써모필러스 , 바실러스 스테아 로써모필러스, 등), 또는 고세균(예, 메타노코커스 잔나시 , 메타노박테리움 써모오 토트로피쿰, 할로페락스 볼캐니 및 할로박테리움 종 NRC-1과 같은 할로박테리움 , 아키오글로버스 펄지더스 , 피로코커스 푸리오서스 , 피로코커스 호리코시 , 유로피룸 페르닉스 등)으로부터 유래될 수 있으며, 직교 O-RS는 비진핵 유기체, 예, 유박테리아(예, 대장균, 써머스 써모필러스 , 바실러스 스테아로써모필러스, 등) 또는 고세균(예, 메타노코커스 잔나시 , 메타노박테리움 써모오토트로피쿰 , 할로페 락스 볼캐니 및 할로박테리움 종 NRC-1과 같은 할로박테리움 , 아키오글로버스 펄지더스 , 피로코커스 푸리오서스 , 피로코커스 호리코시 , 유로피룸 페르닉스등)로부터 유래될 수 있다. 다르게는, 예를 들어, 식물, 조류, 선충류, 진균, 효모, 동물(예, 포유류, 곤충, 절지동물 등) 또는 기타와 같은 진핵 공급원 또한 이용될 수 있으며, 예를 들어, 이때 성분들은 세포 또는 대상 번역 시스템에 직교이거나, 또는 이들은 세포 또는 번역 시스템에 직교이도록 변형된다(예, 돌연변이됨).

O-tRNA/O-RS 쌍의 개별 성분은 동일한 유기체 또는 상이한 유기체로부터 유래될 수 있다. 한 구체예에서, O-tRNA/O-RS 쌍은 동일한 유기체로부터 온다. 예를 들어, O-tRNA/O-RS 쌍은 대장균으로부터의 티로실-tRNA 신세타제/tRNA_CUA 쌍으로부터 유래될 수 있다. 다르게는, O-tRNA/O-RS 쌍의 O-tRNA 및 O-RS는 선택적으로 상이한 유기체로부터 온다.

직교 O-tRNA, O-RS 또는 O-tRNA/O-RS 쌍은 비천연 아미노산을 갖는 폴리펩티드를 생산하기 위해 진핵 세포에서 선별되거나 스크린되고/거나 이용될 수 있다. 진핵 세포는 다양한 공급원, 예, 식물(예, 단자엽, 또는 쌍자엽과 같은 복합 식물), 조류, 선충류, 진균, 효모(예, 사카로마이세스 세레비제), 동물(예, 포유류, 곤충, 절지동물 등) 등으로부터 올 수 있다. 본 발명의 번역 성분을 갖는 진핵 세포의 조성물들은 또한 본 발명의 특징이다.

본 발명은 한종 및/또는 두번째 종에서 선택적 사용을 위한 한 종에서의 효율적인 스크리닝을 제공한다(선택적으로, 추가의 선별/스크리닝 없음). 예를 들어, O-tRNA/O-RS의 성분은 한 종, 예, 쉽게 조작되는 종(예, 효모 세포 등)에서 선별 또는 스크린되고 두번째 진핵 종, 예, 식물(예, 단자엽, 또는 쌍자엽과 같은 복합 식물), 조류, 선충류, 진균, 효모(예, 사카로마이세스 세레비제), 동물(예, 포유류, 곤충, 절지동물 등) 등 내로 도입되어, 두번째 종에서 비천연 아미노산의 생체내 포함에 사용된다.

예를 들어, 사카로마이세스 세레비제(에스.세레비제)는 단핵 세포이며 신속한 생성 시간을 가지며 상대적으로 잘 규명된 유전학을 가지므로 첫번째 진핵 종으로 선택될 수 있다. 예를 들어, D. Burke, et al., (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY를 참고한다. 더욱이, 진핵 생물의 번역 기계가 보다 보존적이므로 (예, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminooacyl-tRNA synthetases as phylogenetic probes, Canadian Journal of Biochemistry 58: 213- 218; 및, (2001) The Ribosome. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 참고), 에스 . 세레비제에서 발견된 비천연 아미노산의 포함을 위한 aaRS 유전자는 보다 고등한 진핵 유기체내로 도입되고, 짝 tRNA와 함께(예, K. Sakamoto, et al., (2002) Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30: 4692-4699; 및, C. Kohrer, et al., (2001), Import of amber and ochre suppressor tRNAs into mammalian cells : a general approach to site-specific insertion of amino acid analogues into proteins, Proc. Natl. Acad. Sci. U. S. A. 98: 14310-14315 참고) 비천연 아미노산을 포함시키기 위해 이용될 수 있다.

한 예에서, 여기서 개시된 대로 첫번째 종에서 O-tRNA/O-RS를 생산하는 방법은 O-tRNA를 암호화하는 핵산 및 O-RS를 암호화하는 핵산을 두번째 종(예, 포유류, 곤충, 진균, 조류, 식물 등)의 진핵 세포내로 도입하는 것을 추가로 포함한다. 다른 예에서, 진핵 세포에서 비천연 아미노산으로 직교 tRNA를 우선적으로 아미노아실화하는 직교 아미노아실 tRNA 신세타제(O-RS)를 생산하는 방법은 (a) 비천연 아미노산의 존재하에서, 제 1종의 진핵 세포 집단(예, 효모 등)을 양성 선별에 노출시키는 단계를 포함한다. 진핵 세포 각각은 i) 아미노아실-tRNA 신세타제(RS) 라이브러리의 구성원, ii) 직교 tRNA(O-tRNA), iii) 양성 선별 마커를 암호화하는 폴리뉴클레오티드, 및 iv) 음성 선별 마커를 암호화하는 폴리뉴클레오티드를 포함한다. 양성 선별에 생존하는 세포는 비천연 아미노산의 존재하에서 직교 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함한다. 양성 선별에 생존하는 세포는 천연 아미노 산으로 O-tRNA를 아미노아실화하는 활성 RS를 제거하기 위하여 비천연 아미노산의 부재하에서, 음성 선별에 노출시킨다. 이로 인해 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 O-RS를 얻게 된다. O-tRNA를 암호화하는 핵산 및 O-RS를 암호화하는 핵산(또는 성분 O-tRNA 및/또는 O-RS)을 제 2의 종의 진핵 세포, 예, 포유류, 곤충, 진균, 조류, 식물 등에 도입한다. 일반적으로 O-tRNA는 제 1종의 진핵 세포 집단을 음성 선별에 노출시켜 얻어지며, 이때 진핵 세포는 tRNA 라이브러리의 구성원을 포함한다. 음성 선별은 진핵 세포에 내인성인 아미노아실-tRNA 신세타제(RS)에 의해 아미노아실화되는 tRNA 라이브러리 구성원을 포함하는 세포를 제거하며, 이는 제 1 종 및 제 2 종의 진핵 세포에 직교인 tRNA 집단을 제공한다.

셀렉터 코돈

본 발명의 셀렉터 코돈은 단백질 생합성 기계의 유전자 코돈 골격을 확장시킨다. 예를 들어, 셀렉터 코돈은 예를 들어, 독특한 3 염기 코돈, 넌센스 코돈, 예, 정지 코돈, 예, 앰버 코돈(UAG), 오팔 코돈(UGA), 비천연 코돈, 4 이상 염기 코돈, 희귀 코돈 등을 포함한다. 많은 셀렉터 코돈을 원하는 유전자, 예, 하나 이상, 둘 이상, 셋 초과 등 내로 도입할 수 있다. 일단 유전자가 다수 카피의 주어진 셀렉터 코돈을 포함하거나 또는 다수의 상이한 셀렉터 코돈, 또는 그 임의의 조합을 포함할 수 있다.

한 구체예에서, 상기 방법은 진핵 세포의 생체내에서 비천연 아미노산을 포함시키기 위한 중지 코돈인 셀렉터 코돈을 사용하는 것에 관련된다. 예를 들어, 중지 코돈, 예, UAG를 인식하는 O-tRNA가 생산되고 원하는 비천연 아미노산으로 O-RS 에 의해 아미노아실화된다. 이 O-tRNA는 자연 발생하는 숙주의 아미노아실-tRNA 신세타제에 의해서는 인식되지 않는다. 종래의 부위-지시된 돌연변이유발을 이용하여 대상 폴리펩티드에서 관심 부위에 중지 코돈, 예, TAG를 도입할 수 있다. 예를 들어, Sayers, J. R. , et al. (1988), 5',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res 791- 802를 참고한다. O-RS, O-tRNA 및 대상 폴리펩티드를 암호화하는 핵산이 생체내에서 배합될 때, 비천연 아미노산은 UAG 코돈에 반응하여 포함되어 특정 위치에서 비천연 아미노산을 함유하는 폴리펩티드를 제공한다.

비천연 아미노산의 생체내에서의 포함은 진핵 숙주 세포의 큰 동요없이 이루어질 수 있다. 예를 들어, UAG 코돈의 억제 효율은 O-tRNA, 예, 앰버 억제자 tRNA, 와 진핵 방출 인자(예, eRF)(중지 코돈에 결합하여 리보좀으로부터 성장중인 펩티드의 방출을 개시함) 사이의 경쟁에 의존하며, 억제 효율은 예를 들어, O-tRNA, 예 억제자 tRNA의 발현 수준의 증가에 의해 조절될 수 있다.

셀렉터 코돈은 또한 확장된 코돈, 예, 4 이상 염기 코돈, 예, 4,5,6 또는 그 이상 염기 코돈을 포함한다. 4 염기 코돈의 예는 예를 들어, AGGA, CUAG, UAGA, CCCU 등을 포함한다. 5 염기 코돈의 예는 예를 들어, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC 등을 포함한다. 본 발명의 특징은 프레임쉬프트 억제에 기초한 확장된 코돈을 사용하는 것을 포함한다. 4 이상 염기 코돈은 예를 들어, 하나 또는 다수의 비천연 아미노산을 동일한 단백질내로 삽입할 수 있다. 예를 들어, 안티코돈 루프, 예, 적어도 8-10 nt 안티코돈 루프를 갖는 돌연변이된 O-tRNA, 예, 특별한 프레임쉬프트 억제자 tRNA의 존재하에서, 4 이상 염기 코돈은 단일 아미노산으로 판독된다. 다른 구체예에서, 안티코돈 루프는 예를 들어, 적어도 4-염기 코돈, 적어도 5-염기 코돈, 또는 적어도 6-염기 코돈 또는 그 이상을 해독할 수 있다. 256개의 가능한 4염기 코돈이 있으므로, 4 이상 염기 코돈을 이용하여 동일한 세포에서 다수의 비천연 아미노산이 암호될 수 있다. Anderson et al., (2002) Exploring the Limits of Codora and Anticodon Size, Chemistry and Biology, 9: 237-244; Magliery, (2001) Expanding the Genetic Code : Selection of Efficient Suppressors of Four-base Codons and Identification of"Shifty"Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307: 755-769를 참고한다.

예를 들어, 4염기 코돈은 생체외 생합성 방법을 이용하여 비천연 아미노산을 단백질내로 포함시키기 위해 이용되었다. 예를 들어, Ma et al. , (1993) Biochemistry, 32: 7939; 및 Hohsaka et al., (1999) J. Am. Chem. Soc.. 121: 34를 참고한다. CGGG 및 AGGU를 이용하여, 두 개의 화학적으로 아실화된 프레임쉬프트 억제자 tRNA로 생체외에서 2-나프틸알라닌 및 라이신의 NBD 유도체를 동시에 스트렙타비딘내로 포함시켰다. 예를 들어, Hohsaka et al., (1999) J. Am. Chem. Soc. , 121: 12194를 참고한다. 생체 내 연구에서, 무어 등은 NCUA 안티코돈을 갖는 tRNALeu 유도체가 UAGN 코돈을 억제하는 능력을 검사하였으며(N은 U,A,G 또는 C), 4 염기 UAGA가 0 또는 -1 프레임의 해독이 거의 없이 13 내지 26%의 효율로 UCUA 안티코돈을 갖는 tRNALeu에 의해 해독될 수 있음을 밝혔다. Moore et al., (2000) J. Mol.Biol., 298: 195를 참고한다. 한 구체예에서, 희귀 코돈 또는 넌센스 코돈에 기초한 확장된 코돈이 본 발명에서 이용될 수 있으며, 이는 다른 원치않는 부위에서 미스센스 리드쓰루(readthrough) 및 프레임쉬프트 억제를 감소시킬 수 있다.

주어진 시스템을 위해, 셀렉터 코돈은 또한 천연 3 염기 코돈 중 하나를 포함할 수 있으며, 이때 내인성 시스템은 천연 염기 코돈을 사용하지 않는다(또는 드물게 사용한다). 예를 들어, 이것은 천연 3 염기 코돈을 인식하는 tRNA가 없는 시스템, 및/또는 3 염기 코돈이 희귀 코돈인 시스템을 포함한다.

셀렉터 코돈은 선택적으로 비천연 염기쌍을 포함한다. 이들 비천연 염기쌍은 기존의 유전자 알파벳을 추가로 확장한다. 하나의 여분의 염기쌍은 3염기 코돈의 수를 64에서 125로 증가시킨다. 세번째 염기쌍의 특성은 안정하고 선택적인 염기쌍형성, 폴리머라제에 의해 높은 확실성으로 DNA내로 효율적인 효소적 포함, 및 초기의 비천연 염기쌍의 합성 후 효율적인 연속적인 프라이머 연장을 포함한다. 방법 및 조성물을 위해 적응될 수 있는 비천연 염기쌍의 설명은 예를 들어, Hirao, et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20: 177-182를 포함한다. 다른 관련 문헌은 하기에 열거된다.

생체내 사용을 위해, 비천연 뉴클레오시드는 막 투과성이며 인산화되어 상응하는 트리포스페이트를 형성한다. 또한, 증가된 유전자 정보는 안정하며 세포 효소에 의해 파괴되지 않는다. 베너 등의 이전의 노력은 전통적인 왓슨-크릭 쌍에서의 것들과 상이한 수소 결합 패턴을 이용하였으며, 그 중 가장 주목할만한 예는 이소-C:이소-C 쌍이다. 예를 들어, Switzer et al., (1989) J. Am. Chem. Soc. , 111: 8322; 및 Piccirilli et al., (1990) Nature, 343: 33; Kool, (2000) Curr. Opin. Chem. Biol., 4: 602를 참고한다. 일반적으로 이들 염기는 어느 정도 천연 염기와 잘못 짝을 이루며 효소적으로 복사될 수 없다. 쿨 및 동료들은 염기 사이의 소수성 팩킹 상호작용이 수소 결합을 대신하여 염기쌍 형성을 유도할 수 있음을 입증하였다. Kool, (2000) Curr. Opin. Chem.Biol., 4: 602; 및 Guckian and Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825를 참고한다. 상기 모든 요건을 만족하는 비천연 염기쌍을 개발하기 위해, 슐츠, 로메스버그 및 동료들은 비천연 소수성 염기 시리즈를 체계적으로 합성하여 연구하였다. PICS:PICS 자가쌍은 천연 염기쌍보다 안정한 것으로 밝혀졌으며, 대장균 DNA 폴리머라제 I의 클리나우 단편(KF)에 의해 DNA내로 효율적으로 포함될 수 있다. 예를 들어, McMinn et al., (1999) J. Am. Chem. Soc., 121: 11586; 및 Ogawa et al., (2000) J. Am. Chem. Soc., 122: 3274를 참고한다. 3MN:3MN 자가쌍은 생물학적 기능에 충분한 효율 및 선택성으로 KF에 의해 합성될 수 있다. 예를 들어, Ogawa et al., (2000) J. Am. Chem. Soc., 122: 8803을 참고한다. 하지만, 두 염기 모두는 추가 복제를 위해 쇄 종결자로 작용한다. PICS 자가쌍을 복제하기 위해 이용될 수 있는 돌연변이 DNA 폴리머라제가 최근에 개발되었다. 또한, 7 AI 자가쌍이 복제될 수 있다. 예를 들어, Tae et al., (2001) J. Am. Chem.Soc., 123: 7439를 참고한다. 신규의 금속염기 쌍, Dipic:Py 또한 개발되었으며 이는 Cu(II) 결합시 안정한 쌍을 형성한다. Meggers et al., (2000) J. Am. Chem.Soc., 122: 10714을 참고한다. 확장 코돈 및 비천연 코돈은 천연 코돈에 대해 고유하게 직교이므로, 본 발명의 방법은 그들을 위한 직교 tRNA를 생성하기 위해 이 특성을 이용할 수 있다.

번역 우회 시스템 또한 원하는 폴리펩티드에서 비천연 아미노산을 포함시키기 위해 이용될 수 있다. 번역 우회 시스템에서, 큰 서열은 유전자내로 삽입되지만 단백질로 번역되지 않는다. 서열은 리보좀이 서열을 건너뛰고 삽입 하류에서 번역을 재개하도록 유도하는 단서를 제공하는 구조를 함유한다.

비천연 아미노산

여기서 이용될 때, 비천연 아미노산은 셀레노시스테인 및/또는 피로라이신 및 하기의 20개의 유전적으로 암호화되는 알파-아미노산외의 임의의 아미노산, 변형된 아미노산, 또는 아미노산 유사체를 말한다: 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 발린. 알파-아미노산의 일반 구조는 화학식 I에 의해 예시된다:

비천연 아미노산은 일반적으로 화학식 I을 갖는 임의의 구조이며 이때 R 기는 20개의 천연 아미노산에서 이용된 것외의 임의의 치환기이다. 20개의 아미노산의 구조를 위해서는 예를 들어, Biochemistry by L. Stryer,3rd ed. 1988, Freeman and Company, New York을 참고한다. 본 발명의 비천연 아미노산은 20개의 알파-아미노산외의 자연 발생 화합물일 수 있다.

본 발명의 비천연 아미노산은 일반적으로 측쇄에서 천연 아미노산과 상이하므로, 비천연 아미노산은 다른 아미노산, 예, 천연 또는 비천연 아미노산과, 그들이 자연 발생 단백질에서 형성되는 것과 동일한 방식으로 다른 아미노산과 아미드 결합을 형성한다. 하지만, 비천연 아미노산은 천연 아미노산과 구별되는 측쇄기를 갖는다. 예를 들어, 화학식 I의 R은 선택적으로 알킬-, 아릴-, 케토-, 아지도-, 하이드록실-, 히드라진, 시아노-, 할로-, 히드라지드, 알케닐, 알키닐, 에테르, 티올, 셀레노-, 설포닐-, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로사이클릭, 에논, 이민, 알데히드, 에스테르, 티오산, 하이드록실아민, 아민, 등, 또는 임의의 그 조합을 포함한다. 다른 대상 비천연 아미노산은 광활성화 가교제, 스핀-표지된 아미노산, 형광 아미노산, 금속 결합 아미노산, 금속-함유 아미노산, 방사성 아미노산, 신규의 기능성 기를 갖는 아미노산, 다른 분자와 공유 또는 비공유적으로 상호작용하는 아미노산, 포토케이지 및/또는 광이성체화 아미노산, 바이오틴 또는 바이오틴-유사체 함유 아미노산, 케노 함유 아미노산, 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산, 중 원자 치환된 아미노산, 화학적으로 절단가능하거나 광절단가능한 아미노산, 천연 아미노산에 비하여 신장된 측쇄를 갖는 아미노산(예, 폴리에테르 또는 장쇄 탄화수소, 예, 약 5 초과, 약 10 초과 탄소 등), 탄소-연결된 당-함유 아미노산, 산화환원-활성 아미노산, 아미노티오산 함유 아미노산, 및 하나 이상의 독성 부분을 함유하는 아미노산을 포함하며 이에 한정되 지 않는다. 일부 구체예에서, 비천연 아미노산은 예를 들어 단백질을 고체 지지체에 연결하기 위해 이용되는 광활성화 가교제를 갖는다. 한 구체예에서, 비천연 아미노산은 아미노산 측쇄에 부착된 당류 부분(예, 당화된 아미노산) 및/또는 다른 탄수화물 변형을 갖는다.

신규한 측쇄를 갖는 비천연 아미노산에 더하여, 비천연 아미노산은 또한 예를 들어, 화학식 II와 III의 구조에 의해 나타나는 변형된 백본 구조를 선택적으로 포함한다:

상기에서, Z는 일반적으로 OH, NH₂, SH, NH-R', 또는 S-R'을 포함하며; X와 Y는 동일하거나 상이할 수 있으며, 일반적으로 S 또는 O를 포함하며, R과 R'은 선택적으로 동일하거나 상이하며, 일반적으로 화학식 I을 갖는 비천연 아미노산을 위해 전술한 R 기를 위한 치환기와 동일한 리스트 및 수소로부터 선택된다. 예를 들어, 본 발명의 비천연 아미노산은 화학식 II와 III에 의해 예시되는 아미노 또는 카르복실기에서 치환을 포함한다. 이 타입의 비천연 아미노산은 α-하이드록시산, α-티오산, α-아미노티오카르복실레이트를 포함하여 이에 한정되지 않으며, 예를 들어, 일반적인 20개 천연 아미노산에 해당하는 측쇄 또는 비천연 측쇄를 갖는다. 또한, α-탄소에서의 치환은 선택적으로 L, D, 또는 α-α-이치환된 아미노산, 예, D-글루타메이트, D-알라닌, D-메틸-O-티로신, 아미노부티르산, 등을 포함한다. 다른 구조적인 대안은 프롤린 유사체 및 3,4,6,7,8, 및 9원 고리 프롤린 유사체와 같은 고리형 아미노산, 치환된 β-알라닌 및 γ-아미노 부티르산과 같은 β 및 γ 아미노산을 포함한다.

예를 들어, 많은 비천연 아미노산이 티로신, 글루타민, 페닐알라닌 등과 같은 천연 아미노산에 기초한다. 티로신 유사체는 파라-치환된 티로신, 오르토-치환된 티로신, 및 메타 치환된 티로신을 포함하며, 이때 치환된 티로신은 예를 들어, 케토 기(예, 아세틸기), 벤조일기, 아미노기, 히드라진, 하이드록시아민, 티올기, 카르복시기, 이소프로필기, 메틸기, C₆-C₂₀ 직쇄 또는 분지쇄 탄화수소, 포화 또는 불포화 탄화수소, O-메틸기, 폴리에테르기, 니트로기, 알키닐기 등을 포함한다. 또한, 다중 치환된 아릴 고리 또한 고려된다. 본 발명의 글루타민 유사체는 α-하이드록시 유도체, γ-치환된 유도체, 고리형 유도체, 및 아미드 치환된 글루타민 유도체를 포함하며 이에 한정되지 않는다. 페닐알라닌 유사체의 예는 파라-치환된 페닐알라닌, 오르토-치환된 페닐알라닌, 및 메타-치환된 페닐알라닌을 포함하며 이에 한정되지 않으며, 이때 치환기는 예를 들어, 하이드록시기, 메톡시기, 메틸기, 알릴기, 알데히드, 아지도, 요오도, 브로모, 케토기(예, 아세틸기), 벤조일, 알키닐기, 등을 포함한다. 비천연 아미노산의 구체적인 예는 p-아세틸-L-페닐알라닌, p- 프로파길옥시페닐알라닌, O-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오로화된 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-요오도-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 및 이소프로필-L-페닐알라닌 등을 포함하며 이에 한정되지 않는다. 비천연 아미노산의 구조의 예는 도 7, 패널 B 및 도 11에 예시된다. 다양한 비천연 아미노산의 추가의 구조는 예를 들어, "비천연 아미노산의 생체내 포함" 제목의 WO 2002/085923호의 도 16, 17, 18, 19, 26, 및 29에 제공된다. 또한 추가의 메티오닌 유사체를 위해서는, Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation, PNAS 99: 19-24의 도 1 구조 2-5를 참고한다.

한 구체예에서, 비천연 아미노산(예, p-(프로파길옥시)-페닐알라닌)을 포함하는 조성물이 제공된다. p-(프로파길옥시)-페닐알라닌을 포함하는 다양한 조성물 및 예를 들어 단백질 및/또는 세포가 또한 제공된다. 한 태양에서, p-(프로파길옥시)-페닐알라닌 비천연 아미노산을 포함하는 조성물은 추가로 직교 tRNA를 포함한다. 비천연 아미노산은 직교 tRNA에 (예를 들어, 공유적으로) 결합될 수 있으며, 예를 들어, 아미노-아실 결합을 통해 직교 tRNA에 공유 결합되거나, 직교 tRNA의 말단 리보스 당의 3'OH 또는 2'OH에 공유결합될 수 있다.

비천연 아미노산을 통해 단백질내로 포함될 수 있는 화학 부분은 단백질의 다양한 잇점 및 조작을 제공한다. 예를 들어, 케토 기능기의 독특한 반응성은 생체외 및 생체내에서 많은 히드라진- 또는 하이드록실아민-함유 시약 중 임의의 것으로 단백질을 선택적으로 변형시키는 것을 허용한다. 예를 들어, 중 원자 비천연 아미노산은 X-선 구조 데이터를 추적하는 데 유용할 수 있다. 비천연 아미노산을 이용하여 중 원자를 부위-특이적으로 도입하면 중 원자를 위한 위치를 선택함에 있어서 선택성 및 유연성을 제공한다. 광반응성 비천연 아미노산(예, 벤조페논 및 아릴아지드(예, 페닐아지드) 측쇄를 갖는 아미노산)은 예를 들어, 단백질의 생체내 및 생체외 광가교를 허용한다. 광반응성 비천연 아미노산의 예는 예를 들어, p-아지도-페닐알라닌 및 p-벤조일-페닐알라닌을 포함하며 이에 한정되지 않는다. 광반응성 비천연 아미노산을 갖는 단백질은 이어서 광반응성기 여기의 시간적(및/또는 공간적) 조절에 의해 의지대로 가교될 수 있다. 한 예에서, 비천연 아미노산의 메틸기는 예를 들어, 핵 자기 공명 및 진동 분광법을 사용하여, 국소 구조 및 동력학의 프로브로서 동위원소 표지된 메틸기 등으로 치환될 수 있다. 예를 들어, 알키닐 또는 아지도 기능기는 [3+2]고리화첨가 반응을 통해 단백질을 분자로 선택적으로 변형시킬 수 있도록 한다.

비천연 아미노산의 화학 합성

상기에서 제공된 비천연 아미노산의 다수는 예를 들어, 시그마(미국) 또는 알드리치(미국, 와이오밍주, 밀워키 소재)로부터 시판된다. 시판되지 않는 것들은 여기서 제공되거나 다양한 문헌에서 제공된 대로 또는 공지된 표준 방법을 이용하여 선택적으로 합성된다. 유기 합성 기법의 경우, Organic Chemistry by Fessendon and Fessendon, (1982, Second Edition, Willard Grant Press, Boston Mass. ) ; Advanced Organic Chemistry by March (Third Edition, 1985, Wiley and Sons, New York); 및 Advanced Organic Chemistry by Carey and Sundberg (Third Edition, Parts A and B, 1990, Plenum Press, New York)를 참고한다. 비천연 아미노산의 합성을 설명하는 추가의 문헌은 예를 들어, "비천연 아미노산의 생체내 포함" 제목의 WO 2002/085923호, Matsoukas et al., (1995) J. Med.Chem.. 38,4660-4669 ; King, F. E. & Kidd, D. A. A. (1949) A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem. Soc., 3315-3319; Friedman, O. M. & Chatterrji, R. (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81,3750-3752 ; Craig, J. C. et al. (1988) Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline (Chloroquine). J. Org. Chem. 53,1167-1170 ; Azoulay, M. , Vilmont, M. & Frappier, F. (1991) Glutamin analogues as Potential Antimalarials,. Eur. J. Med. Chem. 26,201-5 ; Koskinen, A. M. P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54,1859-1866 ; Christie, B. D. & Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the total Synthesis of (+)- Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem. 1989: 1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry : Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43: 4297- 4308; 및, Subasinghe et al., (1992) Quisqualic acid analogues : synthesis of beta- heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate- sensitized site. J. Med. Chem. 35: 4602-7를 참고한다. 또한, 2002년 12월 22일에 출원된 변호사 문서 번호 P1001US00의 "단백질 어레이" 제목의 특허 출원을 참고한다.

본 발명의 한 태양에서, p-(프로파길옥시)페닐알라닌 화합물을 합성하는 방법이 제공된다. 이 방법은 예를 들어, (a) N-tert-부톡시카르보닐-티로신 및 K₂CO₃를 무수 DMF에 현탁시키고; (b) (a)의 반응 혼합물에 프로파길 브로마이드를 첨가하고 하이드록실 및 카르복실기를 알킬화하여 구조

를 갖는 보호된 중간체 화합물을 얻고; (c) 상기 보호된 중간체 화합물을 MeOH중의 무수 HCl과 혼합하고 아민 부분을 탈보호하여 p-(프로파길옥시)페닐알라닌 화합물을 합성하는 것을 포함한다. 한 구체예에서, 상기 방법은 추가로 (d) p-(프로파길옥시)페닐알라닌 HCl을 수성 NaOH와 MeOH에 용해시키고 이것을 실온에서 교반하고; (e) pH를 7로 조절하고; 그리고 (f) p-(프로파길옥시)페닐알라닌 화합물을 침전시키는 것을 포함한다. 예를 들어, 실시예 4의 프로파길옥시페닐알라닌의 합성을 참고한다.

비천연 아미노산의 세포 흡수

진핵 세포에 의한 비천연 아미노산의 흡수는 예를 들어, 단백질내로 포함시키기 위하여 비천연 아미노산을 고안하고 선별할 때 일반적으로 고려되는 한가지 사안이다. 예를 들어, α-아미노산의 높은 전하 밀도는 이들 화합물이 세포 투과성이기 어려움을 제안한다. 천연 아미노산은 단백질계 수송시스템의 집합을 통해 진핵 세포내로 흡수된다. 만일 있다면 어느 비천연 아미노산이 세포에 의해 흡수되는지를 평가하는 신속한 스크린이 이루어질 수 있다. 예를 들어, 2002년 12월 22일에 출원된 변호사 문서 번호 P1001US00의 "단백질 어레이" 제목 출원 및 Liu, D. R. & Schultz, P. G. (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS United States 96:4780-4785의 독성 분석을 참고한다. 다양한 분석으로 흡수를 쉽게 분석하지만, 세포 흡수 경로를 잘 받아들이는 비천연 아미노산을 고안하는 대신 생체내에서 아미노산을 생성하는 생합성 경로를 제공할 수도 있다.

비천연 아미노산의 생합성

아미노산 및 기타 화합물의 생산을 위한 많은 생합성 경로가 이미 존재한다. 특정 비천연 아미노산을 위한 생합성 방법은 천연에, 예를 들어 진핵 세포에 존재하지 않을 수 있지만, 본 발명은 그러한 방법을 제공한다. 예를 들어, 비천연 아미노산을 위한 생합성 경로는 새로운 효소를 첨가하거나 기존의 숙주 세포 경로를 변형시켜 숙주 세포에서 선택적으로 생성된다. 추가의 새로운 효소는 선택적으로 자연 발생 효소이거나 인공적으로 발생된 효소이다. 예를 들어, p-아미노페닐알라닌의 생합성("비천연 아미노산의 생체내 포함"이라는 제목의 WO2002/085923호의 실시 예에 제시됨)은 다른 유기체로부터의 공지 효소의 조합의 첨가에 의존한다. 이들 효소를 위한 유전자는 이 유전자를 포함하는 플라스미드로 세포를 형질전환시켜 진핵 세포내로 도입될 수 있다. 세포에서 발현될 때, 상기 유전자는 원하는 화합물을 합성하기 위한 효소 경로를 제공한다. 선택적으로 첨가되는 효소 타입의 예는 하기 실시예에 제공된다. 추가 효소 서열은 예를 들어, 젠뱅크에서 찾을 수 있다. 인공적으로 발생된 효소는 또한 동일한 방식으로 세포내로 첨가될 수 있다. 이러한 방식으로, 세포의 세포 기계 및 자원은 비천연 아미노산을 생산하도록 조작된다.

생합성 경로에 사용하기 위한 신규한 효소를 생산하거나 기존 경로의 진화를 위해 다양한 방법이 이용가능하다. 예를 들어, 맥시젠 인크.(www. maxygen. com에서 이용가능)에 의해 개발된 것과 같은, 회귀성 재조합을 선택적으로 이용하여 새로운 효소와 경로를 개발할 수 있다. 예를 들어, Stemmer (1994),'Rapid evolution of a protein in vitro by DNA shuffling, Nature 370 (4): 389-391 ; 및, Stemmer, (1994), DNA shuffling by random fragmentation and reassembly : In vitro recombination for molecular evolution, Proc. Natl. Acad. Sci. USA., 91: 10747-10751을 참고한다. 유사하게 제넨코어(www.genencor. com에서 이용가능)에 의해 개발된 DesignPath^TM을 선택적으로, 예를 들어, 세포에서 O-메틸-L-티로신을 생성하기 위한 경로를 조작하기 위하여, 대사 경로 조작에 이용한다. 이 기법은 예를 들어, 기능 유전체학을 통해 확인된 새로운 유전자, 및 분자 진화 및 디자인의 조합을 이용하여 숙주 유기체에서 기존 경로를 재구성한다. 디버사 코포레이션(www.diversa.com에서 이용가능함)은 또한 예를 들어, 새로운 경로를 생성하기 위 하여 유전자의 라이브러리 및 유전자 경로를 신속하게 스크리닝하기 위한 기법을 제공한다.

일반적으로, 본 발명의 조작된 생합성 경로로 생산된 비천연 아미노산은 효율적인 단백질 생합성을 위해 충분한 농도, 예를 들어, 천연 세포 양으로 생산되지만, 다른 아미노산의 농도에 영향을 주가나 세포 자원을 고갈시킬 정도로 생산되지는 않는다. 이러한 방식으로 생체내에서 생산된 일반적인 농도는 약 10 mM 내지 약 0.05 mM이다. 일단 세포가 특정 경로에 필요한 효소를 생산하기 위해 이용되는 유전자를 포함하는 플라스미드로 형질전환되고 비천연 아미노산이 생성되면, 생체내 선별을 선택적으로 이용하여 리보좀 단백질 합성 및 세포 성장을 위해 비천연 아미노산의 생산을 추가로 최적화시킨다.

비천연 아미노산을 갖는 폴리펩티드

하나 이상의 비천연 아미노산을 갖는 대상 단백질 또는 폴리펩티드는 본 발명의 특징이다. 본 발명은 또한 본 발명의 조성물과 방법을 이용하여 생산된 하나 이상의 비천연 아미노산을 갖는 폴리펩티드 또는 단백질을 포함한다. 부형제(예, 약학적 허용 부형제)가 또한 단백질과 존재할 수 있다.

진핵 세포에서 하나 이상의 비천연 아미노산을 갖는 대상 단백질 또는 폴리펩티드를 생산함으로써, 단백질 또는 폴리펩티드는 일반적으로 진핵성 번역후 변형을 포함할 것이다. 일부 구체예에서, 단백질은 하나 이상의 비천연 아미노산 및 진핵 세포에 의해 생체내에서 만들어진 하나 이상의 번역후 변형을 포함하며, 이때 번역후 변형은 원핵 세포에 의해서는 만들어지지 않는다. 예를 들어, 번역후 변형 은 예를 들어, 아세틸화, 아실화, 지질-변형, 팔미토일화, 팔미테이트 첨가, 인산화, 당지질-결합 변형, 당화 등을 포함한다. 한 태양에서, 번역후 변형은 GlcNAc-아스파라긴 결합에 의해 아스파라긴에 올리고당(예, (GlcNAc-Man)₂-Man-GlcNAc-GlcNAc))을 부착시키는 것을 포함한다. 또한, 진핵 단백질의 N-결합된 올리고당의 일부 예를 열거하는 표 7을 참고한다(추가의 잔기가 또한 존재할 수 있다). 다른 태양에서, 번역후 변형은 GalNAc-세린 또는 GalNAc-트레오닌 결합, 또는 GlcNAc-세린 또는 GlcNAc-트레오닌 결합에 의해 세린 또는 트레오닌에 올리고당(예, Gal-GaINAc,Gal-GlcNAc, 등)을 부착하는 것을 포함한다.

[표 7]

또 다른 태양에서, 번역후 변형은 전구체의 단백질분해성 가공(예, 칼시토닌 전구체, 칼시토닌 유전자-관련 펩티드 전구체, 프리프로파라티로이드 호르몬, 프리프로인슐린, 프로인슐린, 프리프로-오피오멜라노코르틴, 프로-오피오멜라노코르틴 등), 다수서브유닛 단백질내로의 조립 또는 거대분자 조립, 세포에서 다른 부위로의 번역(예, 소포체, 골지체, 핵, 리소좀, 페록시좀, 미토콘드리아, 엽록체, 액포 등과 같은 기관으로, 또는 분비 경로를 통하여)을 포함한다. 일부 구체예에서, 단백질은 분비 또는 국소화 서열, 에피토프 태그, FLAG 태그, 폴리히스티딘 태그, GST 융합체 등을 포함한다.

비천연 아미노산의 한 가지 잇점은 추가의 분자를 첨가하기 위해 이용될 수 있는 추가의 화학 부분을 제시한다는 것이다. 이들 변형은 진핵 세포의 생체내에서, 또는 생체외에서 만들어질 수 있다. 따라서, 일부 구체예에서, 번역후 변형은 비천연 아미노산을 통해서이다. 예를 들어, 번역후 변형은 친핵성-친전자성 반응을 통할 수 있다. 단백질의 선택적인 변형을 위해 현재 이용되는 대부분의 반응은 친핵 및 친전자 반응 파트너 사이의 공유 결합 형성, 예를 들어, α-할로케톤과 히스티딘 또는 시스테인 측쇄의 반응에 관련된다. 이들 경우에서 선택성은 단백질내의 친핵 잔기의 수 및 접근성에 의해 결정된다. 본 발명의 단백질에서, 다른 보다 선택적인 반응, 예를 들어, 비천연 케토-아미노산과 히드라지드 또는 아미노옥시 화합물의 생체내 및 생체외 반응을 이용할 수 있다. 예를 들어, Cornish, et al., (1996) Am. Chem.Soc., 118:8150-8151 ; Mahal, et al., (1997) Science, 276: 1125-1128; Wang, et al., (2001) Science 292: 498-500; Chin, et al., (2002) Am. Chem. Soc. 124: 9026-9027; Chin, et al., (2002) Proc. Natl. Acad.Sci., 99: 11020- 11024; Wang, et al., (2003) Proc. Natl. Acad.Sci., 100: 56-61; Zhang, et al., (2003) Biochemistry, 42: 6735-6746; 및, Chin, et al., (2003) Science(in press)를 참고한다. 이것은 형광단, 가교제, 당 유도체 및 세포독성 분자를 비롯한 많은 시약으로 어느 단백질이든지 선택적으로 표지할 수 있도록 한다. 또한 2003년 10월 15일에 출원된 "당단백질 합성" 제목의 미국 특허 출원 제10/686,944호를 참고한다. 예를 들어, 아지도 아미노산을 통한 번역후 변형은 또한 스타우딩거 연결(예, 트리아릴포스핀 시약을 이용)을 통해 만들어질 수 있다. 예를 들어, Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation, PNAS 99: 19-24를 참고한다.

본 발명은 단백질의 선택적 변형을 위한 다른 매우 효율적인 방법을 제공하며, 이는 예를 들어, 아지드 또는 알키닐 부분을 함유한 비천연 아미노산(예, 도 11의 2 및 1 참고)을 셀렉터 코돈에 대한 반응으로 단백질내로 유전적으로 포함시키는 것에 관련된다. 이들 아미노산 측쇄는 이어서, 예를 들어, 후이스겐(Huisgen) [3+2] 고리화첨가 반응에 의해, 예를 들어 알키닐 또는 아지드 유도체를 각각 이용하여 변형될 수 있다(예, Padwa, A. in Comprehensive Organic Synthesis, Vol. 4, (1991) Ed. Trost, B. M. , Pergamon, Oxford, p. 1069-1109; 및, Huisgen, R. in 1. 3-Dipolar Cvcloaddition Chemistry, (1984) Ed. Padwa, A. , Wiley, New York, p. 1- 176 참고). 예를 들어, 도 16을 참고한다. 이 방법은 친핵성 치환보다는 고리화첨가에 관련되므로, 단백질은 매우 높은 선택성으로 변형될 수 있다. 이 반응은 촉매량의 Cu(I)를 반응 혼합물에 첨가하여 우수한 위치선택성(1,4 > 1,5)으로 수성 조건에서 실온에서 실시될 수 있다. 예를 들어, Tornoe, et al. , (2002) Ore. Chem. 67: 3057-3064; 및, Rostovtsev, et al. , (2002) Angew. Chem. Int. Ed. 41: 2596- 2599를 참고한다. 이용될 수 있는 다른 방법은 테트라시스테인 모티프를 갖는 비스아르세닉 화합물에서의 리간드 교환이며, 예를 들어, Griffin, et al. , (1998) Science 281: 269-272를 참고한다.

[3+2] 고리화첨가를 통해 본 발명의 단백질에 첨가될 수 있는 분자는 아지도 또는 알키닐 유도체를 갖는 임의의 분자를 포함한다. 예를 들어, 실시예 3 및 5를 참고한다. 그러한 분자는 염료, 형광단, 가교제, 당 유도체, 중합체(예, 폴리에틸렌 글리콜의 유도체), 광가교제, 세포독성 화합물, 친화성 라벨, 바이오틴의 유도체, 수지, 비드, 제 2 단백질 또는 폴리펩티드(또는 그 이상), 폴리뉴클레오티드(예, DNA, RNA 등), 금속 킬레이터, 보조인자, 지방산, 탄수화물 등을 포함하며 이에 한정되지 않는다. 예를 들어, 도 13A 및 실시예 3과 5를 참고한다. 이들 분자는 알키닐기를 갖는 비천연 아미노산, 예, p-프로파길옥시페닐알라닌, 또는 아지도기를 갖는 비천연아미노산, 예, p-아지도-페닐알라닌에 첨가될 수 있다. 예를 들어, 도 13B 및 도 17A를 참고한다.

다른 태양에서, 본 발명은 그러한 분자를 포함하는 조성물 및 이들 분자, 예, 아지도 염료(화학 구조 4 및 화학 구조 6에 나타난 것들), 알키닐 폴리에틸렌 글리콜(예, 화학 구조 7에 나타난 것들)를 생산하는 방법을 제공하며, 이때 n은 예를 들어, 50 내지 10,000, 75 내지 5,000, 100 내지 2,000, 100 내지 1,000 사이의 정수이다. 본 발명의 구체예에서, 알키닐 폴리에틸렌 글리콜은 약 5,000 내지 약 100,000 Da, 약 20,000 내지 약 50,000 Da, 약 20,000 내지 약 10,000 Da (e. g. , 20,000 Da), 등의 분자량을 갖는다.

이들 화합물을 포함하는 다양한 조성물, 예를 들어, 단백질 및 세포가 또한 제공된다. 본 발명의 한 태양에서, 아지도 염료(예, 화학 구조 4 또는 화학 구조 6)를 포함하는 단백질은 추가로 하나 이상의 비천연 아미노산(예, 알키닐 아미노산)을 포함하며, 이때 아지도 염료는 [3+2] 고리화첨가를 통해 비천연 아미노산에 부착된다.

한 구체예에서, 단백질은 화학 구조 7의 알키닐 폴리에틸렌 글리콜을 포함한다. 다른 구체예에서, 상기 조성물은 추가로 하나 이상의 비천연 아미노산(예, 아지도 아미노산)을 포함하며, 이때 알키닐 폴리에틸렌 글리콜은 [3+2] 고리화첨가를 통해 비천연 아미노산에 부착된다.

아지도 염료의 합성 방법이 또한 제공된다. 예를 들어, 한 가지 그러한 방법 은 (a) 설포닐 할라이드 부분을 포함하는 염료 화합물을 제공하는 단계; (b) 3-아지도프로필아민 및 트리에틸아민의 존재하에서 염료 화합물을 실온으로 가온하고 3-아지도프로필아민의 아민 부분을 염료 화합물의 할라이드 위치에 결합시켜 아지도 염료를 합성하는 단계를 포함한다. 한 구체예에서, 염료 화합물은 댄실 클로라이드를 포함하며, 아지도 염료는 화학 구조 4의 조성물을 포함한다. 한 태양에서, 상기 방법은 반응 혼합물로부터 아지도 염료를 정제하는 것을 추가로 포함한다. 예를 들어, 실시예 5를 참고한다.

다른 예에서, 아지도 염료 합성 방법은 (a) 아민-함유 염료 화합물을 제공하는 단계; (b) 아민-함유 염료 화합물을 적합한 용매에서 카르보디이미드 및 4-(3-아지도프로필카바모일)-부티르산과 배합하고 산의 카르보닐기를 염료 화합물의 아민 부분에 결합시켜 아지도 염료를 합성하는 단계를 포함한다. 한 구체예에서, 카르보디이민은 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 하이드로클로라이드(EDCI)를 포함한다. 한 태양에서, 아민-함유 염료는 플루오르세인아민을 포함하며, 적합한 용매는 피리딘을 포함한다. 예를 들어, 아민-함유 염료는 플루오르세인아민을 선택적으로 포함하며 아지도 염료는 화학 구조 6의 조성물을 선택적으로 포함한다. 한 구체예에서, 상기 방법은 (c) 아지도 염료를 침전시키는 단계; (d) 침전물을 HCl로 세척하는 단계; (e) EtOAc에 세척된 침전물을 용해시키는 단계; 및 (f) 아지도 염료를 헥산에 침전시키는 단계를 추가로 포함한다. 예를 들어, 실시예 5를 참고한다.

프로파길 아미드 폴리에틸렌 글리콜을 합성하는 방법이 또한 제공된다. 예를 들어, 상기 방법은 실온에서 유기 용매에서(예, CH₂Cl₂) 프로파길아민을 폴리에틸렌 글리콜(PEG)-하이드록시석신이미드 에스테르와 반응시켜, 화학 구조 7의 프로파길 아미드 폴리에틸렌 글리콜을 얻는 것을 포함한다. 한 구체예에서, 상기 방법은 에틸 아세테이트를 이용하여 프로파길아미드 폴리에틸렌 글리콜을 침전시키는 것을 포함한다. 한 태양에서, 상기 방법은 추가로 메탄올에서 프로파길아미드 폴리에틸렌 글리콜을 재결정화시키고; 진공에서 생성물을 건조시키는 것을 포함한다. 실시예 5를 참고한다.

본 발명의 진핵 세포는 유용한 대량으로 비천연 아미노산을 포함하는 단백질을 합성하는 능력을 제공한다. 한 태양에서, 상기 조성물은 선택적으로, 예를 들어, 10 마이크로그램 이상, 50 마이크로그램 이상, 75 마이크로그램 이상, 100 마이크로그램 이상, 200 마이크로그램 이상, 250 마이크로그램 이상, 500 마이크로그램 이상, 적어도 1 밀리그램, 적어도 10 밀리그램, 또는 그 이상의, 비천연 아미노산을 포함하는 단백질, 또는 생체내 단백질 생산 방법으로 얻어질 수 있는 양을 포함한다(재조합 단백질 생산 및 정제에 관한 상세 사항은 여기서 제공된다). 다른 태양에서, 단백질은 예를 들어, 세포 용해물, 완충액, 약학적 완충액, 또는 다른 액체 현탁액(예, 약 1 nl 내지 약 100 L의 부피)에서 예를 들어, 10 마이크로그램 이상 단백질/리터, 50 마이크로그램 이상 단백질/리터, 75 마이크로그램 이상 단백질/리터, 100 마이크로그램 이상 단백질/리터, 200 마이크로그램 이상 단백질/리터, 250 마이크로그램 이상 단백질/리터, 500 마이크로그램 이상 단백질/리터, 적어도 1 밀리그램 단백질/리터, 또는 적어도 10 밀리그램 단백질/리터 또는 그 이상 의 농도로 조성물에 존재한다. 진핵 세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질의 다량의 생산(예, 다른 방법, 예, 생체외 번역으로 가능한 것보다 많은 양)은 본 발명의 특징이다.

비천연 아미노산의 포함은 예를 들어, 단백질 구조 및/또는 기능의 변화를 맞추기 위해, 예를 들어, 프로테아제 표적 부위의 크기, 산성도, 친핵성, 수소 결합, 소수성, 접근성을 변화시키기 위해, 부분(예, 단백질 어레이를 위해)에 표적화하기 위해 이루어질 수 있다. 비천연 아미노산을 포함하는 단백질은 개선된 또는 심지어는 완전히 새로운 촉매적 또는 물리적 특성을 가질 수 있다. 예를 들어, 하기 특성은 비천연 아미노산을 단백질내로 포함시켜 변형된다: 독성, 생물분포, 구조적 특성, 분광법적 특성, 화학 및/또는 광화학적 특성, 촉매 능력, 반감기(예, 혈청 반감기), 다른 분자와 예를 들어, 공유 또는 비공유적으로 반응하는 능력 등. 하나 이상의 비천연 아미노산을 포함하는 단백질을 포함하는 조성물은 예를 들어, 신규의 치료제, 진단제, 촉매 효소, 산업용 효소, 결합 단백질(예, 항체), 및 단백질 구조 및 기능 연구를 위해 유용하다. 예를 들어, Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4: 645-652를 참고한다.

본 발명의 한 태양에서, 조성물은 하나 이상, 예를 들어, 둘 이상, 셋 이상, 넷 이상, 다섯 이상, 여섯 이상, 일곱 이상, 여덟 이상, 아홉 이상, 적어도 열 또는 그 이상의 비천연 아미노산을 갖는 단백질 하나 이상을 포함한다. 비천연 아미노산은 동일하거나 상이할 수 있으며, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또 는 10 또는 그 이상의 상이한 비천연 아미노산을 포함하는 단백질에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 또는 그 이상의 상이한 부위가 있을 수 있다. 다른 태양에서, 조성물은 단백질에 존재하는 특정 아미노산 중 하나 이상 모두 미만이 비천연 아미노산으로 치환된 단백질을 포함한다. 하나보다 많은 비천연 아미노산을 갖는 주어진 단백질의 경우, 비천연 아미노산은 동일하거나 상이할 수 있다(예, 단백질은 비천연 아미노산 둘 이상의 상이한 타입을 포함하거나, 또는 동일한 비천연 아미노산 둘을 포함할 수 있다). 둘보다 많은 비천연 아미노산을 갖는 주어진 단백질의 경우, 비천연 아미노산은 동일하거나 상이하거나 또는 하나 이상의 상이한 비천연 아미노산과 다수의 비천연 아미노산의 조합일 수 있다.

비천연 아미노산을 포함하는 임의의 단백질(또는 그 일부)(및 예를 들어 하나 이상의 셀렉터 코돈을 포함하는 상응하는 임의의 암호 핵산)은 본 조성물 및 방법을 이용하여 생산될 수 있다. 예를 들어, 관련된 번역 시스템에서 하나 이상의 적절한 셀렉터 코돈을 포함시키기 위한 임의의 이용가능한 돌연변이 방법을 변형시켜, 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있는 수십만 가지의 공지의 단백질을 확인하지는 않는다. 공지 단백질을 위한 일반적인 서열 레퍼토리는 젠뱅크 EMBL, DDBJ 및 NCBI를 포함한다. 다른 레퍼토리는 인터넷을 조사하여 확인될 수 있다.

일반적으로, 단백질은 임의의 이용가능한 단백질(예, 치료 단백질, 진단 단백질, 산업용 효소, 또는 그 일부 등)에 60% 이상, 70% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 또는 99% 이상, 또는 그 이상 동일하며, 이들은 하나 이상의 비천연 아미노산을 포함한다. 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있는 치료, 진단, 및 다른 단백질의 예는 예를 들어, 알파-1 안티트립신, 안지오스타틴, 항용혈인자, 항체(항체에 대한 추가 상세사항은 이하에서 확인), 아포지질단백질, 아포단백질, 심방 나트륨뇨배뇨항진 인자, 심방 나트륨노배뇨항진 폴리펩티드, 심방 펩티드, C-X-C 케모카인(예, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), 칼시토닌, CC 케모카인(예, 단핵구 화학유인인자 단백질-1, 단핵구 화학유인인자 단백질-2, 단핵구 화학유인인자 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262), CD40 리간드, C-kt 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제자, 보체 수용체 1, 사이토카인(예, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1), 상피 성장 인자(EGF), 에리트로포이에틴(EPO, 하나이상의 비천연 아미노산의 포함에 의한 변형을 위한 바람직한 표적을 대표), 박리 독소 A와 B, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 헤지호그 단백질(예, 소닉, 인디안, 디저트), 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 사람 혈청 알부민, 인슐린, 인슐린형 성장 인자(IGF), 인터페론(예, IFN-α, IFN-β, IFN-γ), 인터루킨(예, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 등) 각질세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골형성 단백 질, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬(예, 인간 성장 호르몬), 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B, 및 C, 릴랙신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체(IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 수퍼 항원, 즉, 스타필로코커스 내독소(SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), 수퍼옥사이드 디스무타제(SOD), 독성 쇼크 증후군 독소(TSST-1), 티모신 알파 1, 조직 플라스미노겐 활성인자, 종양 괴사 인자 베타(TNF-β), 종양 괴사 인자 수용체(TNFR), 종양 괴사 인자 알파(TNF-α), 혈관 내피 성장 인자(VEGEF), 유로키나제, 및 기타 다수를 포함하며 이에 한정되지 않는다.

여기서 개시된 비천연 아미노산의 생체내 포함을 위한 조성물 및 방법을 이용하여 만들어질 수 있는 한 부류의 단백질은 전사 조절자 또는 그 일부를 포함한다. 예시적인 전사 조절자는 세포 성장, 분화, 조절 등을 조절하는 전사 조절자 단백질 및 유전자를 포함한다. 전사 조절자는 원핵체, 바이러스, 및 진균, 식물, 효모, 곤충, 및 포유류를 포함하는 동물을 비롯한 진핵체에서 발견되어 광범위한 치료 표적을 제공한다. 발현 및 전사 활성자는 많은 기작에 의해, 예를 들어 수용체에 결합하여, 시그널 전달 캐스캐이드를 자극함으로써, 전사 인자의 발현 조절에 의해, 프로모터 및 인핸서에의 결합에 의해, 프로모터 및 인핸서에 결합하는 단백질에의 결합에 의해, DNA를 풀어서, 프리-mRNA를 스플라이스하여, RNA를 폴리아데닐화하여, 그리고 RNA를 분해하여 전사를 조절한다. 예를 들어, 진핵 세포에서 GAL4 단백질 또는 그 일부의 조성물은 또한 본 발명의 특징이다. 일반적으로, GAL4 단백질 또는 그 일부는 하나 이상의 비천연 아미노산을 포함한다. 또한 "직교 아미노아실-tRNA 신세타제" 제목의 섹션을 참고한다.

본 발명의 한 부류의 단백질(예, 하나 이상의 비천연 아미노산을 갖는 단백질)은 사이토카인, 염증 분자, 성장 인자, 그 수용체, 및 발암유전자 생성물, 예, 인터루킨(예, IL-1, IL-2, IL-8 등), 인터페론, FGF,IGF-I,IGF-II, FGF, PDGF, TNF, TGF-α, TGF-β, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 및 히아루린/CD44와 같은 발현 활성자; 시그널 전달 분자 및 상응하는 발암유전자 생성물, 예, Mos, Ras, Raf, 및 Met; 및 전사 활성자 및 억제자, 예, p53, Tat, Fos, Myc, Jun, Myb, Rel, 및 에스트로겐, 프로게스테론, 테스토스테론, 알도스테론, LDL 수용체 리간드 및 코르티코스테론을 위한 것과 같은 스테로이드 호르몬 수용체를 포함한다.

하나 이상의 비천연 아미노산을 갖는 효소(예, 산업용 효소), 또는 그 일부가 또한 본 발명에 의해 제공된다. 효소의 예는 예를 들어, 아미다제, 아미노산 라세마제, 아실라제, 디할로게나제, 디옥시게나제, 디아릴프로판 퍼옥시다제, 에피머라제, 에폭사이드 하이드롤라제, 에스테라제, 이소머라제, 키나제, 글루코스 이소머라제, 글리코시다제, 글리코실 트랜스퍼라제, 할로퍼옥시다제, 모노옥시게나제(예, p450), 리파제, 리그닌 퍼옥시다제, 니트릴 하이드라타제, 니트릴라제, 프로테아제, 포스파타제, 서브틸리진, 트랜스아미나제, 및 뉴클레아제를 포함하며 이에 한정되지 않는다.

이들 단백질의 다수는 시판되며(예, 시그마 바이오사이언스 2002 카타로그 및 가격 리스트 참고), 상응하는 단백질 서열 및 유전자 및, 일반적으로 많은 그 변이체는 공지되어 있다(예, 젠뱅크 참고). 이들 중 임의의 것은 예를 들어, 하나 이상의 치료, 진단 또는 효소 특성에 대하여 단백질을 변화시키기 위하여, 본 발명에 따른 하나 이상의 비천연 아미노산을 삽입하여 변형될 수 있다. 치료적으로 관련된 특성의 예는 혈청 반감기, 저장 반감기, 안정성, 면역원성, 치료 활성, 검출능력(예, 비천연 아미노산에 리포터 기를(예, 라벨 또는 라벨 결합 부위) 포함시켜), LD₅₀ 또는 다른 부작용의 감소, 위장관을 통과해 신체로 들어가는 능력(예, 경구 이용성), 등을 포함한다. 진단 특성의 예는 저장 반감기, 안정성, 진단 활성, 검출가능성 등을 포함한다. 관련 효소 특성의 예는 저장 반감기, 안정성, 효소 활성, 생산 능력 등을 포함한다.

다양한 다른 단백질 또한 본 발명의 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있다. 예를 들어, 본 발명은 하나 이상의 백신 단백질에서 하나 이상의 천연 아미노산을 비천연 아미노산으로 치환하는 것을 포함할 수 있으며, 예를 들어, 감염성 진균, 예, 아스퍼질러스 ( Aspergillus ), 캔디다( Candida ) 종; 박테리아, 특히 병원성 박테리아의 모델로 작용하는 대장균, 및 스타필로코커스(Staphylococcus)(예, 아우레우스 ( aureus )), 또는 스트렙토코커스( Streptococus )(예, 뉴모니애(pneumoniae)와 같은 중요한 박테리아; 포자충강(예, 플라스모디아(Plasmodia)), 근족충류(예, 엔트아메바 ( Entamoeba )) 및 편모충(트리파노조마(Trypanosoma), 레이쉬마니아 ( Leishmania ), 트리코모나스( Trichomonas ), 기아르디 아(Giardia) 등)과 같은 원생동물; (+) RNA 바이러스(예는 폭스바이러스, 예, 백시 니아; 피코나바이러스, 예, 폴리오; 토가바이러스, 예, 루벨라; 플라비바이러스, 예, HCV; 및 코로나바이러스를 포함), (-) RNA 바이러스(예, 랍도바이러스, 예, VSV; 파라믹소바이러스, 예, RSV; 오르토믹소바이러스, 예, 인플루엔자; 부니아바이러스; 및 아레나바이러스), dsDNA 바이러스(예, 레오바이러스), RNA 대 DNA 바이러스, 즉, 레트로바이러스, 예, HIV 및 HTLV, 및 헤파티티스 B와 같은 일부 DNA 대 RNA 바이러스를 포함한다.

곤충 내성 단백질(예, Cry 단백질), 전분 및 지질 생산 효소, 식물 및 곤충 독소, 독소-내성 단백질, 마이코톡신 탈독성화 단백질, 식물 성장 효소(예, 리불로스 1,5-비스포스페이트 카르복실라제/옥시게나제, "RUBISCO"), 리폭시게나제(LOX), 및 포스포에놀피루베이트(PEP) 카르복실라제와 같은 농업 관련 단백질 또한 비천연 아미노산 변형에 적합한 표적이다.

본 발명은 또한 하나 이상의 비천연 아미노산을 포함하는 하나 이상의 단백질을 진핵 세포에서 생산하는 방법(및 그러한 방법에 의해 생산된 단백질)을 제공한다. 예를 들어, 상기 방법은 하나 이상의 셀렉터 코돈을 포함하며 단백질을 암호화하는 핵산을 포함하는 진핵 세포를 적절한 배지에서 성장시키는 것을 포함한다. 진핵 세포는 또한 세포에서 기능하고 셀렉터 코돈을 인식하는 직교 tRNA(O-tRNA); 및 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 직교 아미노아실 tRNA 신세타제(O-RS)를 포함하며, 배지는 비천연 아미노산을 포함한다.

한 구체예에서, 상기 방법은 추가로 제 1 반응성 기를 포함하는 비천연 아미 노산을 단백질내로 포함시키고, 상기 단백질을 제 2 반응성 기를 포함하는 분자(예, 염료, 중합체, 예, 폴리에틸렌 글리콜의 유도체, 광가교제, 세포독성 화합물, 친화성 라벨, 바이오틴의 유도체, 수지, 제 2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조인자, 지방산, 탄수화물, 폴리뉴클레오티드(예, DNA, RNA 등) 등)와 접촉시키는 것을 포함한다. 제 1 반응성 기는 제 2 반응성 기와 반응하여 상기 분자를 [3+2] 고리화첨가를 통해 비천연 아미노산에 부착시킨다. 한 구체예에서, 제 1 반응성 기는 알키닐 또는 아지도 부분이고 제 2 반응성 기는 아지도 또는 알키닐 부분이다. 예를 들어, 제 1 반응성 기는 알키닐 부분이고(예, 비천연 아미노산 p-프로파길옥시페닐알라닌에서) 제 2 반응성 기는 아지도 부분이다. 다른 실시예에서, 제 1 반응성 기는 아지도 부분이고(예, 비천연 아미노산 p-아지도-L-페닐알라닌에서) 제 2 반응성 기는 알키닐 부분이다.

한 구체예에서, O-RS는 예를 들어, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS에 비하여 50% 이상 효율적으로 비천연 아미노산으로 O-tRNA를 아미노아실화한다. 다른 구체예에서, O-tRNA는 서열 번호 65 또는 64 또는 그의 상보성 폴리뉴클레오티드 서열을 포함하거나, 이로부터 프로세스되거나, 이에 의해 암호된다. 또 다른 구체예에서, O-RS는 서열 번호 36-63 중 어느 하나(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트) 및/또는 86에 개시된 아미노산 서열을 포함한다.

암호된 단백질은 예를 들어, 치료 단백질, 진단 단백질, 산업용 효소, 또는 그 일부를 포함할 수 있다. 선택적으로, 상기 방법에 의해 생산된 단백질은 비천연 아미노산을 통해 추가로 변형된다. 예를 들어, 상기 방법에 의해 생산된 단백질은 생체내에서 하나 이상의 번역후 변형에 의해 선택적으로 변형된다.

스크리닝 또는 선별 전사 조절자 단백질을 생산하는 방법(그리고 그러한 방법에 의해 생산된 스크리닝 또는 선별 전사 조절자 단백질)이 또한 제공된다. 예를 들어, 방법은 핵산 결합 도메인을 암호화하는 제 1 폴리뉴클레오티드 서열을 선별하고, 제 1 폴리뉴클레오티드 서열을 돌연변이시켜 하나 이상의 셀렉터 코돈을 포함시키는 것을 포함한다. 이것은 스크리닝 또는 선별 폴리뉴클레오티드 서열을 제공한다. 상기 방법은 또한 전사 활성화 도메인을 암호화하는 제 2 폴리뉴클레오티드 서열을 선별하고, 제 2 폴리뉴클레오티드 서열에 작동적으로 연결된 스크리닝 또는 선별 폴리뉴클레오티드 서열을 포함하는 구조체를 제공하며, 그리고 상기 구조체, 비천연 아미노산, 직교 tRNA 신세타제(O-RS) 및 직교 tRNA(O-tRNA)를 세포내로 도입하는 것을 포함한다. 이들 성분으로, O-RS는 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하며 O-tRNA는 셀렉터 코돈을 인식하고 비천연 아미노산을 스크리닝 또는 선별 폴리뉴클레오티드 서열내의 셀렉터 코돈에 반응하여 핵산 결합 도메인내로 포함시켜, 스크리닝 또는 선별 전사 조절자 단백질을 제공한다.

일부 구체예에서, 본 발명의 방법 및/또는 조성물에서 대상 단백질 또는 폴리펩티드(또는 그 일부)는 핵산에 의해 암호된다. 일반적으로, 핵산은 하나 이상의 셀렉터 코돈, 둘 이상의 셀렉터 코돈, 셋 이상의 셀렉터 코돈, 넷 이상의 셀렉터 코돈, 다섯 이상의 셀렉터 코돈, 여섯 이상의 셀렉터 코돈, 일곱 이상의 셀렉터 코돈, 여덟 이상의 셀렉터 코돈, 아홉 이상의 셀렉터 코돈, 또는 심지어 열 또는 그 이상의 셀렉터 코돈을 포함한다.

대상 단백질 또는 폴리펩티드를 암호화하는 유전자는 당업계에 공지되고 이하에서 "돌연변이유발 및 기타 분자 생물학 기법"하에서 설명되는 방법을 이용하여 돌연변이되어 예를 들어, 비천연 아미노산의 포함을 위한 하나 이상의 셀렉터 코돈을 포함할 수 있다. 예를 들어, 대상 단백질을 위한 핵산은 하나 이상의 셀렉터 코돈을 포함하도록 돌연변이되어, 하나 이상의 비천연 아미노산의 삽입을 제공한다. 본 발명은 예를 들어, 하나 이상의 비천연 아미노산을 비롯한, 임의의 단백질의 돌연변이 버젼과 같은 임의의 그러한 변이체를 포함한다. 유사하게, 본 발명은 또한 상응하는 핵산, 즉, 하나 이상의 비천연 아미노산을 암호화하는 하나 이상의 셀렉터 코돈을 갖는 임의의 핵산을 포함한다.

한 예시적인 구체예에서, 본 발명은 GAL4의 Thr44, Arg110TAG 돌연변이를 포함하는 조성물(및 본 발명 방법에 의해 생산된 조성물)을 제공하며, 이때 GAL4 단백질은 하나 이상의 비천연 아미노산을 포함한다. 다른 구체예에서, 본 발명은 사람 수퍼옥사이드 디스무타제(hSOD)의 Trp33TAG 돌연변이를 포함하는 조성물을 제공하며, 이때 hSOD 단백질은 하나 이상의 비천연 아미노산을 포함한다.

비천연 아미노산을 포함하는 재조합 단백질의 정제

본 발명의 단백질, 예, 비천연 아미노산을 포함하는 단백질, 비천연 아미노산을 포함하는 단백질에 대한 항체 등은 공지되고 당업계에서 이용되는 표준 과정에 따라 부분적으로 또는 거의 균질하게 정제될 수 있다. 따라서, 본 발명의 폴리펩티드는 예를 들어, 암모늄 설페이트 또는 에탄올 침전, 산 또는 염기 추출, 컬럼 크로마토그래피, 친화성 컬럼 크로마토그래피, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 하이드록실아파타이트 크로마토그래피, 렉틴 크로마토그래피, 겔 전기영동 등을 비롯한 공지 방법에 의해 회수되고 정제될 수 있다. 단백질 재접힘 단계는 정확하게 접힌 성숙 단백질을 만들 때 필요에 따라 이용될 수 있다. 고성능 액체 크로마토그래피(HPLC), 친화성 크로마토그래피 또는 다른 적합한 방법을 고순도가 필요한 최종 정제 단계에서 이용할 수 있다. 한 구체예에서, 비천연 아미노산(또는 비천연 아미노산을 포함하는 단백질)에 대한 항체가, 하나 이상의 비천연 아미노산을 포함하는 단백질의 친화성계 정제를 위한 정제 시약으로 이용된다. 일단 필요에 따라, 부분적으로 또는 균질하게 정제되면, 폴리펩티드는 선택적으로 예를 들어, 분석 성분, 치료 시약 또는 항체 생산을 위한 면역원으로 이용된다.

여기서 언급된 다른 문헌에 더하여, R. Scopes, Protein Purification, Springer-Verlag, N. Y. (1982); Deutscher, Methods in Enzymology Vol. 182: Guide to Protein Purification, Academic Press, Inc. N. Y. (1990); Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.; Bollag et al. (1996) Protein Methods, 2nd Edition Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook Humana Press, NJ, Harris and Angal (1990) Protein Purification Applications: A Practical Approach IRL Press at Oxford, Oxford, England; Harris and Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford, Oxford, England; Scopes (1993) Protein Purification: Principles and Practice 3rd Edition Springer Verlag, NY; Janson and Ryden (1998) Protein Purification: Principles, High Resolution Methods and Applications, Second Edition Wiley-VCH, NY; 및 Walker (1998) Protein Protocols on CD-ROM Humana Press, NJ; 및 거기서 인용된 문헌에 개시된 것을 포함한, 다양한 정제/단백질 접힘 방법이 공지되어 있다.

진핵 세포에서 비천연 아미노산을 가진 대상 단백질 또는 폴리펩티드를 생산하는 한 가지 잇점은 일반적으로 단백질 또는 폴리펩티드가 그들의 천연 형태로 접힐 것이라는 것이다. 하지만, 본 발명의 일부 구체예에서, 당업자는 합성, 발현 및/또는 정제 후, 단백질이 관련 폴리펩티드의 원하는 형태와 상이한 형태를 가질 수 있음을 인식할 것이다. 본 발명의 한 태양에서, 발현된 단백질은 선택적으로 변성되고 이어서 복원된다. 이것은 예를 들어, 샤페로닌을 대상 단백질 또는 폴리펩티드에 첨가함으로써 및/또는 구아니딘 HCl과 같은 케이오트로픽(chaotropic) 제제에 단백질을 가용화시켜 이루어진다.

일반적으로, 발현된 폴리펩티드를 변성하고 환원시키고 이어서 폴리펩티드가 바람직한 형태로 재접힘되도록 하는 것이 때때로 바람직하다. 예를 들어, 구아니딘, 우레아, DTT, DTE, 및/또는 샤페로닌을 대상 번역 생성물에 첨가할 수 있다. 단백질을 환원, 변성 및 복원하는 방법은 공지되어 있다(예, 상기 문헌, 및 Debinski, et al. (1993) J. Biol.Chem., 268: 14065-14070; Kreitman and Pastan (1993) Bioconjug. Chem., 4: 581-585; 및 Buchner, et al., (1992) Anal. Biochem., 205: 263-270 참고). 데빈스키 등은 예를 들어, 구아니딘-DTE에서 인클 루젼 바디 단백질의 변성 및 환원을 개시한다. 단백질은 예를 들어, 산화된 글루타치온 및 L-아르기닌을 함유한 산화환원 완충액에서 다시 접힐 수 있다. 재접힘 시약은 하나 이상의 폴리펩티드 또는 다른 발현 생성물과 접촉하도록 유동하거나 다르게는 이동하거나, 그 역일 수 있다.

항체

한 태양에서, 본 발명은 본 발명의 분자, 예, 비천연 아미노산을 포함하는 신세타제, tRNA, 및 단백질에 대한 항체를 제공한다. 본 발명의 분자에 대한 항체는 예를 들어, 본 발명 분자의 정제를 위한 정제 시약으로 유용하다. 또한, 항체는 예를 들어 분자의 존재 또는 위치(예, 생체내 또는 인시추)를 추적하기 위하여, 비천연 아미노산을 포함하는 신세타제, tRNA, 또는 단백질의 존재를 나타내기 위한 지시자 시약으로 이용될 수 있다.

본 발명의 항체는 면역글로불린 유전자 또는 면역글로불린 유전자의 단편에 의해 거의 또는 부분적으로 암호된 하나 이상의 폴리펩티드를 포함하는 단백질일 수 있다. 인식된 면역글로불린 유전자는 카파, 람다, 알파, 감마, 델타, 입실론 및 뮤 불변 영역 유전자, 및 무수한 면역글로불린 가변 영역 유전자를 포함한다. 경쇄는 카파 또는 람다로 분류된다. 중쇄는 감마, 뮤, 알파, 델타, 또는 입실론으로 분류되며, 이는 다시 각각 면역글로불린 부류, IgG, IgM, IgA, IgD 및 IgE를 정의한다. 전형적인 면역글로불린(예, 항체) 구조 단위는 사량체를 포함한다. 각 사량체는 하나의 "경"쇄(약 25 kD) 및 하나의 "중"쇄(약 50-70 kD)를 갖는 두 개의 동일한 폴리펩티드 쇄 쌍으로 이루어진다. 각 쇄의 N-말단은 주로 항원 인식을 책임지 는 약 100 내지 110 또는 그 이상의 아미노산의 가변 영역을 정의한다. 용어 가변 경쇄(VL) 및 가변 중쇄(VH)는 각각 이들 경쇄 및 중쇄를 가리킨다.

항체는 그대로의 면역글로불린으로 또는 다양한 펩티다제를 이용한 분해에 의해 생산된 잘 규명된 많은 단편으로 존재한다. 따라서, 예를 들어, 펩신은 힌지 영역에서 이황화 결합 이하에서 항체를 분해하여 그 자체가 이황화 결합에 의해 VH-CH에 연결된 경쇄인 Fab의 이량체인 F(ab')₂를 생산한다. F(ab')₂는 온화한 조건하에서 환원되어 힌지 영역에서 이황화 결합을 절단하여 F(ab')₂ 이량체를 Fab' 단량체로 전환시킬 수도 있다. Fab' 단량체는 본질적으로 힌지 영역의 일부를 갖는 Fab이다(다른 항체 단편의 상세한 설명을 위해서는 Fundamental Immunology, 4 addition, W. E. Paul, ed. , Raven Press, N. Y. (1999)를 참고한다). 다양한 항체 단편이 본래 항체의 분해의 면에서 정의되는 한편, 당업자는 그러한 Fab' 단편 등이 화학적으로 드 노보(de novo)로 또는 재조합 DNA 방법을 이용하여 합성될 수도 있음을 이해할 것이다. 따라서, 여기서 이용될 때, 용어 항체는 또한 선택적으로 전체 항체의 변형에 의해 생산되거나 또는 재조합 DNA 기법에 의해 드 노보 합성된 항체 단편을 포함한다. 항체는 가변 중쇄 및 가변 경쇄가 연결되어(직접 또는 펩티드 링커를 통해) 연속 폴리펩티드를 형성하는 단일쇄 Fv(sFv 또는 scFv) 항체를 비롯한 단일쇄 항체를 포함한다. 본 발명의 항체는 예를 들어, 폴리클로날, 모노클로날, 키메라, 인간화, 단일쇄, Fab 단편, Fab 발현 라이브러리에 의해 생산된 단편 등일 수 있다.

일반적으로, 본 발명의 항체는 다양한 분자 생물학적 또는 약학적 과정에서 일반 시약으로서 그리고 치료 시약으로서 유용하다. 폴리클로날 및 모노클로날 항체를 생산하는 방법이 이용가능하며, 본 발명의 항체를 제조하는 데 적용될 수 있다. 예를 들어, Borrebaeck (ed) (1995) Antibody Engineering, 2nd Edition Freeman and Company, NY (Borrebaeck); McCafferty et al. (1996) Antibody Engineering, A Practical Approach IRL at Oxford Press, Oxford, England (McCafferty), 및 Paul (1995) Antibody Engineering Protocols Humana Press, Towata, NJ (Paul); Paul (ed. ), (1999) Fundamental Immunology, Fifth edition Raven Press, N. Y.; Coligan (1991) Current Protocols in Immunology Wiley/Greene, NY; Harlow and Lane(1989) Antibodies: A Laboratory Manual Cold Spring Harbor Press, NY; Stites et al. (eds. ) Basic and Clinical Immunology (4th ed. ) Lange Medical Publications, Los Altos, CA, 및 그 안의 인용문헌; Goding (1986) Monoclonal Antibodies: Principles and Practice (2d ed. ) Academic Press, New York, NY; 및 Kohler and Milstein (1975) Nature 256:495-497를 비롯한 많은 기본 교과서가 표준 항체 생산 과정을 설명한다.

예를 들어, 동물 내로의 항원의 주사에 의존하지 않는 항체 제제를 위한 다양한 재조합 기법이 개발되었으며 본 발명에 이용될 수 있다. 예를 들어, 파아지 또는 유사한 벡터에서 재조합 항체의 라이브러리를 생성하고 선별하는 것이 가능하다. 예를 들어, Winter et al. (1994) Making Antibodies by Phage Display Technology Annu. Rev. Immunol. 12: 433-55 및 그안에 인용된 문헌을 참고한다. 또한, Griffiths and Duncan (1998) Strategies for selection of antibodies by phage display Curr Opin Biotechnol 9:102-8 ; Hoogenboom et al. (1998) Antibody phage display technology and its applications Inmunotechnology 4: 1-20; Gram et al. (1992) in vitro selection and affinity maturation of antibodies from a nai've combinatorial immunoglobulin library PNAS 89:3576-3580 ; Huse et al. (1989) Science 246: 1275-1281; 및 Ward, et al. (1989) Nature 341: 544-546를 참고한다.

한 구체예에서, 항체 라이브러리는 균사 박테리오파아지의 표면상의 연합된 중쇄 및 경쇄 가변 도메인의 디스플레이를 위해 클론된 V 유전자의 레파토리(예, 림프구 집단으로부터 수집되거나 생체외에서 조립됨)를 포함할 수 있다. 파아지는 항원에 결합함으로써 선택된다. 가용성 항체는 파아지 감염된 박테리아로부터 발현되며 항체는 예를 들어, 돌연변이유발을 통해 개량될 수 있다. 예를 들어, Balint and Larrick (1993) Antibody Engineering by Parsimonious Mutagenesis Gene 137: 109-118; Stemmer et al. (1993) Selection of an Active Single Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR Biotechniques 14 (2): 256-65; Crameri et al. (1996) Construction and evolution of antibody- phage libraries by DNA shuffling Nature Medicine 2: 100-103; 및 Crameri and Stemmer (1995) Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18: 194-195를 참고한다.

재조합 항체 파아지 시스템의 클로닝과 발현을 위한 키트가 또한 공지이며 예를 들어, 아머샴-파마시아 바이오테크놀로지(스웨덴, 웁살라 소재)로부터 "재조합 파아지 항체 시스템, 마우스 ScFv 모듈"이 이용가능하다. 박테리오파아지 항체 라이브러리는 또한 쇄 셔플링에 의해 고 친화성 사람 항체를 만들기 위해 생산되었다(예, Marks et al. (1992) By-Passing Immunization : Building High Affinity Human Antibodies by Chain Shuffling Biotechniques 10: 779-782를 참고한다). 항체가 많은 시판되는 서비스가(예를 들어, 베틸 래보래토리즈(텍사스주, 몽고메리), 아나와(스위스), 유로젠텍(벨기에 및 미국 펜실베니아주 필라델피아) 및 기타에 의해 제조될 수 있음을 인식할 것이다.

일부 구체예에서, 예를 들어, 항체가 치료적으로 투여되는 경우, 본 발명의 항체를 "인간화"하는 것이 유용하다. 인간화 항체의 사용은 (예, 환자가 사람일 때) 치료 항체에 대한 원치 않는 면역 반응의 발생을 감소시키는 경향이 있다. 상기에서 항체 언급은 인간화 전략을 설명한다. 인간화 항체에 더하여, 사람 항체 또한 본 발명의 특징이다. 사람 항체는 특징적으로 사람 면역글로불린 서열로 이루어진다. 사람 항체는 다양한 방법(예, 래릭 등의 미국 특허 제5,001,065호 참고)을 이용하여 생산될 수 있다. 트리오마 기법에 의해 사람 항체를 생산하기 위한 일반적인 접근법이 Ostberg et al. (1983), Hybridoma 2: 361-367, Ostberg의 미국 특허 제 4,634,664호 및 Engelman et al.의 미국 특허 제4,634,666호에 개시된다.

단백질의 정제 및 검출에서 항체를 이용하는 다양한 방법이 공지되어 있으며 여기서 개시된 비천연 아미노산을 포함하는 단백질을 검출하고 정제하는 데 적용될 수 있다. 일반적으로, 항체는 ELISA, 웨스턴 블롯팅, 면역화학, 친화성 크로마토그래피 방법, SPR, 및 기타 다수 방법에 유용한 시약이다. 전술한 문헌들은 ELISA 분석, 웨스턴 블롯, 표면 플라스몬 공명(SPR) 등을 어떻게 실시하는 지에 대해 상세 사항을 제공한다.

본 발명의 한 태양에서, 본 발명의 항체 자체는 비천연 아미노산을 포함하여, 대상 특성(예, 개선된 반감기, 안정성, 독성 등)을 갖는 항체를 제공한다. 또한, "비천연 아미노산을 갖는 폴리펩티드" 제목의 섹션을 참고한다. 항체는 현재 임상 시험에 사용되는 모든 화합물의 거의 50%를 차지하며(Wittrup, (1999) Phage on display Tibtech 17: 423-424) 그리고 항체는 진단 시약으로 흔히 이용된다. 따라서, 비천연 아미노산으로 항체를 변형시키는 능력은 이들 유용한 시약을 변형시키기 위한 중요한 도구를 제공한다.

예를 들어, 진단 분야에의 Mab의 많은 용례가 있다. 분석은 간단한 점 테스트에서 종양 영상화에 이용되는 듀퐁 머크사의 방사성 표지된 NR-LU-10 MAb와 같은 보다 복잡한 방법까지 다양하다(Rusch et al. (1993) NR-LU-10 monoclonal antibody scanning. A helpful new adjunct to computed tomography in evaluating non-small-cell lung cancer. J Thorac Cardiovasc Surg 106: 200- 4). 언급된 바처럼, MAb는 ELISA, 웨스턴 블롯팅, 면역화학, 친화성 크로마토그래피 방법 등을 위한 주요 시약이다. 임의의 그러한 진단 항체는 하나 이상의 비천연 아미노산을 포함하도록 변형되어, 예를 들어 표적에 대한 항체의 특이성 또는 친화성을 변화시키거나, 또는 예를 들어, 비천연 아미노산에서 검출가능한 표지(예, 분광그래프, 형광, 발광 등)를 포함시켜 하나 이상의 검출가능한 특성을 변화시킬 수 있다.

유용한 항체 시약의 한 부류는 치료 항체이다. 예를 들어, 항체는 항체-의존성 세포-매개 세포독성(ADCC) 또는 보체-매개 용해(CML)에 의한 파괴를 위해 종양 세포를 표적화하여 종양 성장을 멈추게 하는 종양-특이적 MAb일 수 있다(이들 일반적인 타입의 항체는 때때로 "마술 총알"로 불림). 한 가지 예는 비호킨스 림프종의 치료를 위한 항-CD20 MAb인 리툭산이다(Scott(1998) Rituximab : a new therapeutic monoclonal antibody for non- Hodgkin's lymphom Cancer Pract 6: 195-7). 두번째 예는 종양 성장의 중요한 성분과 간섭하는 항체에 관련된다. 헤르셉틴은 전이성 유방암의 치료를 위한 항-HER-2 모노클로날 항체이며, 이 작용 기작을 갖는 항체의 예를 제공한다(Baselga et al. (1998) Recombinant humanized anti-HER2antibody (Herceptin) enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu overexpressing human breast cancer xenografts [발표된 정오표는 Cancer Res (1999) 59 (8): 2020에 나타남], Cancer Res 58: 2825-31). 세번째 예는 대상 종양 또는 다른 부위에 세포독성 화합물(독소, 방사성뉴클라이드 등)을 직접 전달하기 위한 항체에 관한 것이다. 예를 들어, 한 용례 Mab는 방사선을 직접 전립선 종양 세포에 표적화하는 90Y-결합된 항체인 CYT-356이다(Deb et al. (1996) Treatmentof hormone-refractory prostate cancer with 90Y CYT-356 monoclonal antibody Clin Cancer Res 2: 1289-97). 네번째 용례는 항체-지시된 효소 프로드러그 요법이며, 이때 종양에 동시국소화된 효소는 종양 근처에서 전신적으로 투여된 프로드러그를 활성화시킨다. 예를 들어, 카르복시펩티 다제 A에 결합된 항-Ep-CAM1 항체는 직장결장 암의 치료를 위해 개발중이다(Wolfe et al. (1999) Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxypeptidase Al : in vitro and in vivo studies with prodrugs of methotrexate and thethymidylate synthase inhibitors GW1031 and GW1843 Bioconjug Chem 10: 38-48). 다른 항체(예, 안타고니스트)는 치료 효과를 위하여 정상 세포 기능을 특이적으로 억제하도록 고안된다. 예로는 급성 기관 이식 거부를 감소시키기 위해 존슨 앤 존슨에서 제공하는 항-CD3 MAb인 오르토클론 OKT3가 있다(Strate et al. (1990) Orthoclone OKT3 as first-line therapy in acute renal allograft rejection Transplant Proc 22: 219-20.). 다른 부류의 항체 제품은 아고니스트이다. 이들 Mab는 치료 효과를 위하여 정상 세포 기능을 특이적으로 증가시키도록 고안된다. 예를 들어, 신경치료를 위한 아세틸콜린 수용체의 Mab-계 아고니스트를 개발중이다(Xie et al. (1997) Directdemonstration of MuSK involvement in acetylcholine receptor clustering throughidentification of agonist ScFv Nat. Biotechnol. 15: 768-71). 이들 항체 중 임의의 것은 하나 이상의 비천연 아미노산을 포함하여 하나 이상의 치료 특성(특이성, 친화성, 혈청반감기 등)을 개선하도록 변형될 수 있다.

다른 부류의 항체 제품은 새로운 기능을 제공한다. 이 그룹의 주요 항체는 효소의 촉매 능력을 모방하도록 조작된 Ig 서열과 같은 촉매 항체이다(Wentworth and Janda (1998) Catalytic antibodies Curr Opin Chem Biol 2: 138-44). 예를 들어, 흥미로운 용례는 중독 치료를 위하여 생체내에서 코케인을 가수분해시키기 위 하여 촉매 항체 mAb-15A10을 이용하는 것에 관련된다(Mets et al. (1998) A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats Proc Natl Acad Sci U S A 95: 10176-81). 촉매 항체는 또한 하나 이상의 비천연 아미노산을 포함하도록 변형되어 하나 이상의 대상 특성을 개선할 수 있다.

면역반응성에 의한 폴리펩티드의 정의

본 발명의 폴리펩티드가 다양한 새로운 폴리펩티드 서열(예, 여기서 번역 시스템에서 합성된 단백질의 경우 비천연 아미노산을 포함, 또는 예, 신규의 신세타제의 경우에는 표준 아미노산의 신규 서열)을 제공하므로, 폴리펩티드는 또한 예를 들어, 면역 분석에서 인식될 수 있는 새로운 구조적 특징을 제공한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 항체 또는 항체의 생성 및 그러한 항체 또는 항혈청에 의해 결합되는 폴리펩티드는 본 발명의 특징이다.

예를 들어, 본 발명은 (서열 번호 36-63(예, 36-47, 48-63, 또는 36-63의 임의의 다른 서브세트) 및/또는 86) 중 하나 이상으로부터 선택된 아미노산 서열을 포함하는 면역원에 대해 생성된 항체 또는 항혈청과 특이적으로 결합하거나 이와 특이적으로 면역반응하는 신세타제 단백질을 포함한다. 다른 상동체와의 교차반응성을 제거하기 위하여, 항체 또는 항혈청은 야생형 대장균 티로실 신세타제(TyrRS)(예, 서열 번호 2)와 같은 이용가능한 대조구 신세타제 상동체로 추출된다.

한 일반적인 포맷에서, 면역분석은 서열 번호 36-63(예, 36-47, 48-63, 또는 36-63의 임의의 다른 서브세트) 및/또는 86 중 하나 이상에 해당하는 서열 중 하나 이상 또는 그 상당한 서열(즉, 제공된 전체 길이 서열의 적어도 약 30%)를 포함하는 폴리펩티드 하나 이상에 대해 생성된 폴리클로날 항혈청을 이용한다. 서열 번호 36-63 및 86으로부터 유래된 가능한 폴리펩티드 면역원 세트는 이하에서 "면역원성 폴리펩티드"로 총체적으로 불린다. 생성된 항혈청은 선택적으로 대조구 신세타제 상동체에 대해 낮은 교차반응성을 갖도록 선택되며 임의의 그러한 교차반응성은 예를 들어, 면역분석에서 폴리클로날 항혈청의 사용에 앞서 하나 이상의 대조구 신세타제 상동체를 이용한 면역흡착에 의해 제거된다.

면역분석에 사용하기 위한 항혈청을 생산하기 위하여, 면역원성 폴리펩티드 중 하나 이상이 전술한 대로 생산되고 정제된다. 예를 들어, 재조합 단백질은 재조합 세포에서 생산될 수 있다. 마우스의 교배 주(마우스의 사실상 유전적 동일성으로 인해 결과가 보다 재현성이 높으므로 이 분석에서 이용됨)를 프로인트 아쥬반트와 같은 표준 아쥬반트와 함께 면역원성 단백질 및 표준 마우스 면역화 프로토콜을 이용하여 면역시킨다(예, 특이적 면역반응성을 결정하기 위하여 이용될 수 있는 항체 생성, 면역분석 포맷 및 조건의 표준 설명을 위해서는 Harlow and Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York를 참고한다). 추가의 문헌 및 항체의 설명이 또한 여기서 개시되며 면역반응성에 의해 폴리펩티드를 정의/검출하는 항체를 만들기 위해 적용될 수 있다. 다르게는, 여기서 개시된 서열로부터 유래된 하나 이상의 합성 또는 재조합 폴리펩티드는 담체 단백질에 접합되며 면역원으로 이용된다.

폴리클로날 혈청은 면역분석, 예, 고체 지지체에 고정된 면역원성 단백질 하 나 이상을 이용한 고체상 면역분석에서 면역원성 폴리펩티드에 대해 수집되고 적정된다. 10⁶ 이상의 역가를 갖는 폴리클로날 항혈청이 선별되고 수집되어, 대조구 신세타제 폴리펩티드로 추출되어, 추출되고 수집되고 적정된 폴리클로날 항혈청을 생산한다.

추출되고 수집되고 적정된 폴리클로날 항혈청은 비교 면역분석에서 대조구 상동체에 대한 교차반응성에 대해 시험된다. 이 비교 분석에서, 대조구 신세타제 상동체에의 결합과 비교할 때, 면역원성 신세타제에 대한 역가된 폴리클로날 항혈청의 결합에 대해 적어도 약 5-10배 더 높은 시그널 대 노이즈 비로 귀결되는 차별적 결합 조건을 추출되고 적정된 폴리클로날 항혈청에 대해 결정한다. 즉, 결합/세척 반응의 엄격도는 알부민 또는 탈지유와 같은 비특이적 경쟁자의 첨가에 의해 및/또는 염 조건, 온도, 및/또는 기타를 조절하여 조절한다. 이들 결합/세척 조건은 시험 폴리펩티드(면역원성 폴리펩티드 및/또는 대조구 폴리펩티드와 비교되는 폴리펩티드)가 수집되고 추출된 폴리클로날 항혈청에 의해 특이적으로 결합되는 지를 결정하기 위한 후속 분석에서 이용된다. 구체적으로, 차별적 결합 조건하에서 대조구 신세타제 상동체보다 적어도 2-5 배 더 높은 시그널 대 노이즈 비, 및 면역원성 폴리펩티드에 비교하여 적어도 약 1/2 시그널 대 노이즈 비를 나타내는 시험 폴리펩티드는 공지의 신세타제에 비하여 면역원성 폴리펩티드 및 따라서 본 발명의 폴리펩티드와 상당한 구조적 유사성을 공유한다.

다른 예에서, 경쟁적 결합 포맷의 면역분석은 시험 폴리펩티드의 검출에 이용된다. 예를 들어, 전술한 대로, 교차반응성 항체는 대조구 폴리펩티드와의 면역 흡착에 의해 수집된 항혈청 혼합물로부터 제거된다. 이어서 면역원성 폴리펩티드는 추출되고 수집된 항혈청에 노출되는 고체 지지체에 고정된다. 시험 단백질이 수집되고 추출된 항혈청에의 결합에 대해 경쟁하기 위해 분석에 첨가된다. 시험 단백질이 고정된 단백질에 비하여 수집되고 추출된 항혈청에 결합하기 위해 경쟁하는 능력은 결합을 위해 경쟁하기 위해 분석에 첨가된 면역원성 폴리펩티드의 능력에 비교된다(면역원성 폴리펩티드는 수집된 항혈청에의 결합에 대해 고정된 면역원성 폴리펩티드와 효과적으로 경쟁한다). 시험 단백질을 위한 퍼센트 교차반응성은 표준 계산을 이용하여 계산된다.

평행 분석에서, 대조 단백질이 수집되고 추출된 항혈청에 결합하는 능력은 선택적으로 면역원성 폴리펩티드가 항혈청에 결합하기 위해 경쟁하는 능력에 비교하여 결정된다. 다시, 대조구 폴리펩티드를 위한 퍼센트 교차-반응성이 표준 계산을 이용하여 계산된다. 퍼센트 교차반응성이 대조 폴리펩티드에 비하여 시험 폴리펩티드에 대하여 적어도 5-10배 높은 경우 및/또는 시험 폴리펩티드의 결합이 면역원성 폴리펩티드의 결합의 범위내에 있는 경우, 시험 폴리펩티드는 수집되고 추출된 항혈청에 특이적으로 결합하는 것으로 말해진다.

일반적으로, 면역흡착되고 수집된 항혈청은 여기서 개시된 대로 경쟁적 결합 면역분석에서 이용되어 임의의 시험 폴리펩티드를 면역원성 및/또는 대조구 폴리펩티드에 비교할 수 있다. 이 비교를 하기 위하여, 면역원성, 시험 및 대조구 폴리펩티드는 광범위한 농도로 각각 분석되며 추출된 항혈청의, 예를 들어, 고정된 대조, 시험 또는 면역원성 단백질에의 결합의 50%를 억제하는 데 필요한 각 폴리펩티드의 양은 표준 기법을 이용하여 결정된다. 만일 경쟁적 분석에서 결합에 필요한 시험 폴리펩티드의 양이 필요한 면역원성 폴리펩티드의 양의 2배 미만이면, 그 양이 대조 폴리펩티드에 비하여 적어도 약 5-10배 높으면 시험 폴리펩티드는 면역원성 단백질에 대해 생성된 항체에 특이적으로 결합하는 것으로 말해진다.

특이성의 추가 결정으로서, 수집된 항혈청은 생성된 면역원성 폴리펩티드 추출되고 수집된 항혈청의, 면역흡착에 사용된 면역원성 폴리펩티드에 대한 결합이 거의 또는 전혀 검출되지 않을 때까지, 면역원성 폴리펩티드(대조 폴리펩티드가 아님)로 완전히 면역흡착된다. 이어서 이 완전히 면역흡착된 항혈청은 시험 폴리펩티드와의 반응성에 대해 시험된다. 반응성이 거의 또는 전혀 관찰되지 않으면(즉, 완전히 면역흡착된 항혈청의 면역원성 폴리펩티드에 대한 결합에 대해 2배 이하의 시그널 대 노이즈 비가 관찰되면), 시험 폴리펩티드는 면역원성 단백질에 의해 유도된 항혈청에 의해 특이적으로 결합된다.

약학 조성물

본 발명의 폴리펩티드 또는 단백질(예, 신세타제, 하나 이상의 비천연 아미노산을 포함하는 단백질 등)은 예를 들어, 적합한 약학 담체와 함께, 치료 용도를 위해 선택적으로 이용된다. 그러한 조성물은 예를 들어, 치료적으로 유효한 양의 화합물, 및 약학적 허용 담체 또는 부형제를 포함한다. 그러한 담체 또는 부형제는 염수, 완충된 염수, 덱스트로스, 물, 글리세롤, 에탄올, 및/또는 그 조합을 포함하며 이에 한정되지 않는다. 제제는 투여 모드에 적합하도록 만들어진다. 일반적으로, 단백질을 투여하는 방법은 공지되어 있으며 본 발명의 폴리펩티드의 투여에 적 용될 수 있다.

본 발명의 폴리펩티드 하나 이상을 포함하는 치료 조성물은 공지된 방법에 따라, 효능, 조직 대사를 확인하고, 투여량을 추정하기 위하여, 하나 이상의 적절한 생체외 및/또는 생체내 질병 동물 모델에서 선택적으로 시험된다. 구체적으로, 투여량은 천연 아미노산 상동체에 대한 비천연 아미노산의 활성, 안정성 또는 기타 적합한 척도(예, 하나 이상의 비천연 아미노산을 포함하도록 변형된 EPO의 천연 아미노산 EPO에의 비교)에 의해, 즉 관련 분석에서 초기에 결정될 수 있다.

투여는 분자를 혈액 또는 조직 세포와 접촉하도록 도입하기 위해 일반적으로 이용되는 임의의 경로에 의해 이루어진다. 본 발명의 비천연 아미노산 폴리펩티드는 선택적으로 하나 이상의 약학적 허용 담체와 함께 임의의 적합한 방식으로 투여된다. 본 발명의 내용에서 그러한 폴리펩티드를 환자에게 투여하는 적합한 방법이 이용가능하며, 특정 조성물을 투여하기 위해 둘 이상의 경로가 이용될 수 있음에도 불구하고, 특정 경로는 종종 다른 경로보다 더 즉각적이고 더 효과적인 작용 또는 반응을 제공할 수 있다.

약학적 허용 담체는 부분적으로는 투여되는 구체적인 조성물에 의해 그리고 조성물을 투여하기 위해 이용되는 구체적인 방법에 의해 결정된다. 따라서, 본 발명의 약학 조성물의 적합한 제제가 다수 있다.

폴리펩티드 조성물은 경구, 정맥내, 복강내, 근육내, 경피, 피하, 국소, 혀밑, 또는 직장 수단을 비롯하여 이에 한정되지 않는 많은 경로에 의해 투여될 수 있다. 비천연 아미노산 폴리펩티드 조성물은 또한 리포좀을 통해 투여될 수 있다. 그러한 투여 경로와 적절한 제형은 일반적으로 공지되어 있다.

비천연 아미노산 폴리펩티드는 단독으로 또는 다른 적합한 성분과 조합하여 또한 흡입에 의해 투여될 에어로졸 제제로 만들어질 수 있다(즉, "분무기로 뿜어질 수" 있다). 에어로졸 제제는 디클로로디플루오로메탄, 프로판, 질소 등과 같은 가압된 허용성 추진제내에 놓여질 수 있다.

예를 들어, 관절내(연골내), 정맥내, 근육내, 진피내, 복강내, 및 피하 경로에 의해서와 같은 비경구 투여에 적합한 제제는 항산화제, 완충액, 박테리아저해제, 및 제제가 목적하는 수용체의 혈액과 등장성이 되도록 하는 용질을 포함하는, 수성 및 비수성의, 등장성 멸균 주사 용액, 및 현탁제, 가용화제, 농후제, 안정화제, 및 방부제를 포함할 수 있는 수성 및 비수성 멸균 현탁액을 포함한다. 포장된 핵산의 제제는 앰퓰 및 바이알과 같은, 단위-투여량 또는 다중-투여량의 밀봉된 용기로 제공될 수 있다.

비경구 투여 및 정맥내 투여는 바람직한 투여 방법이다. 특히, 천연 아미노산 상동체 치료제(예, 일반적으로 EPO, GCSF, GMCSF, IFN, 인터루킨, 항체, 및/또는 임의의 다른 약학적으로 전달되는 단백질)를 위해 이미 사용중인 투여 경로는 현재 사용중인 제제와 함께, 본 발명의 비천연 아미노산을 포함하는 단백질(예, 현재의 치료 단백질의 PEG화된 변이체 등)을 위한 바람직한 투여 경로 및 제제를 제공한다.

본 발명에서, 환자에게 투여되는 투여량은 시간이 지남에 따라 환자에서 유익한 치료 반응을 일으키거나, 또는 예를 들어, 용례에 따라, 병원균 또는 다른 적 절한 활성에 의한 감염을 억제하기에 충분하다. 투여량은 구체적인 조성물/제제의 효능, 및 이용되는 비천연 아미노산 폴리펩티드의 활성, 안정성 또는 혈청 반감기 및 환자의 상태, 및 치료될 환자의 체중 또는 표면적에 의해 결정된다. 투여량의 크기는 또한 구체적인 환자에서 구체적인 조성물/제제의 투여에 수반되는 임의의 부작용의 존재, 특성 및 정도 등에 의해 결정된다.

질병(예, 암, 유전 질병, 당뇨병, AIDS, 등)의 치료 또는 예방에서 투여될 조성물/제제의 유효량을 결정할 때, 의사는 순환 혈장 수준, 제제 독성, 병의 진행, 및/또는 관련되는 경우 항-비천연 아미노산 폴리펩티드 항체의 생산을 평가한다.

예를 들어, 70 킬로그램 환자에게 투여되는 투여량은 일반적으로 현재 사용되는 치료 단백질의 투여량에 해당하는 범위내이며, 관련 조성물의 변경된 활성 또는 혈청 반감기에 대해 조절된다. 본 발명의 조성물/제제는 항체 투여, 백신 투여, 세포독성 제제의 투여, 천연 아미노산 폴리펩티드, 핵산, 뉴클레오티드 유사체, 생물학적 반응 변형제 등을 비롯한 임의의 공지의 치료에 의해 치료 상태를 보충할 수 있다.

투여의 경우, 본 발명의 제제는 관련 제제의 LD-50 및/또는 예를 들어, 환자의 무게 및 전체 건강에 적용되는 대로, 다양한 농도에서 비천연 아미노산의 임의의 부작용의 관찰에 의해 결정된 속도로 투여된다. 투여는 단일 또는 분할 투여량을 통해 이루어질 수 있다.

만일 제제를 주사받고 있는 환자가 열, 오한, 또는 근육통을 일으키면, 이 환자는 적절한 투여량의 아스피린, 이부프로펜, 아세트아미노펜 또는 기타 통증/열 조절 약물이 주어진다. 열, 근육통 및 오한과 같은 주사에 대한 반응을 경험하는 환자는 이후 주사 30분 전에 아스피린, 아세트아미노펜, 또는 예를 들어, 디페닐하이드라민으로 미리 처방될 수 있다. 해열제 및 항히스타민제에 빨리 반응하지 않는 보다 심한 오한 및 근육통을 위해서는 메페리딘이 이용된다. 치료는 반응의 심각도에 따라 지연되거나 끊어진다.

핵산 및 폴리펩티드 서열 및 변이체

상기 및 이하에서 개시된 대로, 본 발명은 핵산 폴리뉴클레오티드 서열 및 폴리펩티드 아미노산 서열, 예, O-tRNA 및 O-RS, 및 예, 상기 서열을 포함하는 조성물 및 방법을 제공한다. 상기 서열의 예, 예를 들어, O-tRNA 및 O-RS가 여기서 개시된다(표 5, 예, 서열 번호 3-65, 86, 및 서열 번호 1과 2 외의 것들 참고). 하지만, 당업자는 본 발명이 여기서 개시된 서열들, 예, 실시예 및 표 5에 한정되지 않음을 이해할 것이다. 당업자는 본 발명이 또한 여기서 개시된 기능, 예, O-tRNA 또는 O-RS를 암호화하는, 다수의 관련된 및 무관한 서열을 제공함을 이해할 것이다.

본 발명은 또한 폴리펩티드(O-RS) 및 폴리뉴클레오티드, 예, O-tRNA, O-RS 또는 그 일부(예, 신세타제의 활성 부위)를 암호화하는 폴리뉴클레오티드, 아미노아실-tRNA 신세타제 돌연변이를 구성하기 위해 이용되는 올리고뉴클레오티드 등을 제공한다. 예를 들어, 본 발명의 폴리펩티드는 서열 번호 36-63(예, 36-47, 48-63, 또는 36-63 중 임의의 다른 서브세트), 및/또는 86에 나타난 아미노산 서열을 포함 하는 폴리펩티드, 서열 번호 3-35(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트) 중 임의의 하나에 나타난 폴리뉴클레오티드 서열에 의해 암호화되는 아미노산 서열을 포함하는 폴리펩티드, 및 서열 번호 36-63, 및/또는 86 중 어느 하나에 나타난 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 3-35(예, 3-19, 20-35, 또는 서열 3-35 중 임의의 다른 서브세트) 중 임의의 하나에 나타난 폴리뉴클레오티드 서열에 의해 암호화되는 아미노산 서열을 포함하는 폴리펩티드를 포함한다.

또한 자연 발생 티로실 아미노아실-tRNA 신세타제(TyrRS)(예, 서열 번호 2)와 90% 이상 동일한 아미노산 서열을 포함하며 그룹 A-E의 아미노산 둘 이상을 포함하는 폴리펩티드도 본 발명의 폴리펩티드중에 포함된다. 예를 들어, 그룹 A는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발린, 이소류신, 류신, 글리신, 세린, 알라닌, 또는 트레오닌을 포함한다. 그룹 B는 대장균 TyrRS의 Asn126에 해당하는 위치에서 아스파테이트를 포함한다. 그룹 C는 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함한다. 그룹 D는 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 알라닌, 발린, 또는 티로신을 포함한다. 그리고 그룹 E는 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다. 이들 그룹의 조합의 임의의 서브세트는 본 발명의 특징이다. 예를 들어, 한 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발생하는 발린, 이소류신, 류신, 또는 트레오닌; 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 또는 글리신; 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 또는 티로신; 및 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 또는 알라닌으로부터 선택되는 둘 이상의 아미노산을 갖는다. 다른 구체예에서, O-RS는 대장균 TyrRS의 Tyr37에 해당하는 위치에서의 글리신, 세린, 또는 알라닌, 대장균 TyrRS의 Asn126에 해당하는 위치에서의 아스파테이트, 대장균 TyrRS의 Asp182에 해당하는 위치에서의 아스파라긴, 대장균 TyrRS의 Phe183에 해당하는 위치에서의 알라닌 또는 발린, 및/또는 대장균 TyrRS의 Leu186에 해당하는 위치에서의 메티오닌, 발린, 시스테인, 또는 트레오닌으로부터 선택되는 둘 이상의 아미노산을 포함한다. 유사하게, 본 발명의 폴리펩티드는 또한 서열 번호 36-63(예, 36-47, 48-63, 또는 36-63중 임의의 다른 서브세트), 및/또는 86의 20개 이상의 연속적인 아미노산 및 그룹 A-E에서 전술한 아미노산 치환 둘 이상을 포함하는 폴리펩티드를 포함한다. 또한, 표 4, 표 6, 및/또는 표 8을 참고한다. 전술한 폴리펩티드 중 임의의 것의 보존적 변이를 포함하는 아미노산 서열이 또한 본 발명의 폴리펩티드로서 포함된다.

한 구체예에서, 조성물은 본 발명의 폴리펩티드와 부형제(예, 완충액, 물, 약학적 허용 부형제 등)를 포함한다. 본 발명은 또한 본 발명의 폴리펩티드와 특이적으로 면역반응하는 항체 또는 항혈청을 제공한다.

폴리뉴클레오티드가 또한 본 발명에서 제공된다. 본 발명의 폴리뉴클레오티드는 본 발명의 대상 단백질 또는 폴리펩티드를 암호화하거나 또는 하나 이상의 셀렉터 코돈을 포함하는 것 또는 둘다인 것을 포함한다. 예를 들어, 본 발명의 폴리뉴클레오티드는 예를 들어, 서열 번호 3-35(예, 3-19, 20-35, 또는 3-35중 임의의 다른 서브세트), 64-85 중 어느 하나에 개시된 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드; 상보성이거나 그 폴리뉴클레오티드 서열을 암호화하는 폴리뉴클레오티드; 및/또는 서열 번호 36-63 및/또는 86 중 어느 하나에 개시된 아미노산 서열 또는 그의 보존적 변이체를 포함하는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 본 발명의 폴리뉴클레오티드는 또한 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 유사하게, 실질적으로 핵산의 전체 길이에 걸쳐 매우 엄격한 조건하에서 전술한 폴리뉴클레오티드에 하이브리드하는 핵산이 본 발명의 폴리뉴클레오티드이다.

본 발명의 폴리뉴클레오티드는 또한 자연 발생 티로실 아미노아실-tRNA 신세타제(TyrRS)(서열 번호 2)의 서열과 90% 이상 동일한 아미노산 서열을 포함하며 그룹 A-E에서 나타낸 둘 이상의 돌연변이를 포함하는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 전술한 폴리뉴클레오티드에 70% 이상, (또는 75% 이상, 80% 이상, 적어도 85%, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상 이상) 동일한 폴리뉴클레오티드 및/또는 전술한 폴리뉴클레오티드 중 어느 것의 보존적 변이체를 포함하는 폴리뉴클레오티드가 또한 본 발명의 폴리뉴클레오티드에 포함된다. 또한 표 4, 표 6 및/또는 표 8을 참고한다.

일부 구체예에서, 벡터(예, 플라스미드, 코스미드, 파아지, 바이러스, 등)는 본 발명의 폴리뉴클레오티드를 포함한다. 한 구체예에서, 벡터는 발현 벡터이다. 다른 구체예에서, 발현 벡터는 본 발명의 폴리뉴클레오티드 중 하나 이상에 작동적으로 연결된 프로모터를 포함한다. 다른 구체예에서, 세포는 본 발명의 폴리뉴클레 오티드를 포함하는 벡터를 포함한다.

당업자는 또한 개시된 서열의 많은 변이체가 본 발명에 포함됨을 이해할 것이다. 예를 들어, 기능적으로 동일한 서열을 생산하는 개시된 서열의 보존적 변이체가 본 발명에 포함된다. 하나 이상의 개시된 서열에 하이브리드하는, 핵산 폴리뉴클레오티드 서열의 변이체가 본 발명에 포함되는 것으로 고려된다. 개시된 서열의 독특한 하위서열은 예를 들어, 표준 서열 비교 기법에 의해 결정할 때, 본 발명에 포함된다.

보존적 변이체

유전자 코드의 축퇴성으로 인해, "침묵 치환"(즉, 암호된 폴리펩티드에서 변화를 야기하지 않는 핵산 서열의 치환)은 아미노산을 암호화하는 모든 핵산 서열의 함축된 특징이다. 유사하게, 아미노산 서열에서 하나 또는 몇몇 아미노산이 매우 유사한 특성을 가진 다른 아미노산으로 치환되는 "보존적 아미노산 치환"은 또한 개시된 구조체에 매우 유사한 것으로 쉽게 확인된다. 각 개시 서열의 그러한 보존적 변이체는 본 발명의 특징이다.

특정 핵산 서열의 "보존적 변이체"는 동일하거나 또는 본질적으로 동일한 아미노산 서열을 암호화하는 핵산을 의미하며, 또는 핵산이 아미노산 서열을 암호하지 않는 경우에는 본질적으로 동일한 서열을 의미한다. 당업자는 암호된 서열에서 단일 아미노산 또는 작은 분율의 아미노산을 변화, 첨가 또는 결실하는 개별적인 치환, 결실 또는 첨가는 그 변화가 아미노산의 결실, 아미노산의 첨가, 또는 화학적으로 유사한 아미노산으로 아미노산의 치환을 야기하는 경우에는 "보존적으로 변 형된 변이체"이다. 따라서, 본 발명의 열거된 폴리펩티드 서열의 "보존적 변이체"는 폴리펩티드 서열의 아미노산의 작은 분율, 일반적으로 5% 미만, 더욱 일반적으로 2% 미만, 또는 1% 미만이 동일한 보존적 치환 그룹의 보존적으로 선별된 아미노산으로 치환되는 것을 포함한다. 마지막으로, 비기능성 서열의 첨가와 같은, 핵산 분자의 암호된 활성을 변화시키지 않는 서열의 첨가는 기본 핵산의 보존적 변이이다.

기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 공지되어 있다. 하기는 서로를 위한 "보존적 치환"을 포함하는 천연 아미노산을 함유하는 그룹을 예시한다.

보존적 치환 그룹

1	알라닌(A) 세린(S) 트레오닌(T)
2	아스파르트산(D) 글루탐산(E)
3	아스파라긴(N) 글루타민(Q)
4	아르기닌(R) 라이신(K)
5	이소류신(I) 류신(L) 메티오닌(M) 발린(V)
6	페닐알라닌(F) 티로신(Y) 트립토판(W)

핵산 하이브리드화

비교 하이브리드화를 이용하여 본 발명의 핵산의 보존적 변이체를 포함하는 본 발명의 핵산을 확인할 수 있으며, 이 비교 하이브리드화 방법은 본 발명의 핵산을 구별하는 바람직한 방법이다. 또한, 높은, 매우 높은 그리고 매우 매우 높은 엄격도 조건하에서 서열 번호 3-35(예, 3-19, 20-35, 또는 3-35의 임의의 다른 서브 세트)에 의해 나타내지는 핵산에 하이브리드하는 표적 핵산이 본 발명의 특징이다. 그러한 핵산의 예는 주어진 핵산 서열과 비교할 때 하나 또는 몇몇의 침묵 또는 보 존적 핵산 치환을 갖는 것들을 포함한다.

시험 핵산은, 완전히 매치되는 프로브가 매치되지 않는 표적 핵산에의 하이브리드화에 대해 관찰되는 것의 적어도 약 5-10배 높은 시그널 대 노이즈 비로 완전히 매치되는 상보성 표적에 결합하는 조건하에서, 표적에의 프로브의 하이브리드화의 적어도 1/2 만큼 높은 시그널 대 노이즈 비로, 완전히 매치되는 상보성 표적에 비하여 적어도 1/2 만큼 잘 프로브가 하이브리드할 때, 프로브 핵산에 특이적으로 하이브리드하는 것으로 말해진다.

핵산은 그들이 일반적으로 용액에서 연합할 때 "하이브리드"한다. 핵산은 수소 결합, 용매 배제, 염기 쌓임 등과 같은 잘 규명된 물리화학적 힘으로 인해 하이브리드한다. 핵산의 하이브리드화에 대한 광범위한 설명은 Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes part I chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays, " (Elsevier, New York), 및 상기의 Ausubel에서 발견된다. Hames and Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England, (Hames and Higgins 1) 및 Hames and Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England (Hames and Higgins 2)는 올리고뉴클레오티드를 비롯하여 DNA와 RNA의 합성, 표지화, 검출 및 정량화에 대한 상세 사항을 제공한다.

서던 또는 노던 블롯에서 필터상의 100개 초과 상보성 잔기를 갖는 상보성 핵산의 하이브리드화를 위한 엄격한 하이브리드화 조건의 예는 42℃에서 1 mg 헤파 린과 50% 포르말린이며 하이브리드화는 밤새 실시된다. 엄격한 세척 조건의 예는 15분동안 65℃에서 0.2x SSC 세척이다(SSC 완충액의 설명을 위해 상기 샘브룩 참고). 종종 높은 엄격도 세척은 배경 프로브 시그널을 제거하기 위해 낮은 엄격도 세척이 선행한다. 낮은 엄격도 세척의 예는 15분동안 40 ℃에서 2X SSC이다. 일반적으로, 특정 하이브리드화 분석에서 무관한 프로브를 위해 관찰된 것의 5배(또는 그 이상)의 시그널 대 노이즈 비는 특이적 하이브리드화의 검출을 나타낸다.

서던 및 노던 하이브리드화와 같은 핵산 하이브리드화 실험에서 "엄격한 하이브리드화 세척 조건"은 서열 의존성이며, 다른 환경 파라미터하에서 상이하다. 핵산의 하이브리드화에 대한 상세한 설명은 상기의 Tijssen(1993) 및 Hames and Higgins, 1과 2에 나타난다. 엄격한 하이브리드화 및 세척 조건은 임의의 시험 핵산에 대해 실험적으로 결정될 수 있다. 예를 들어, 매우 엄격한 하이브리드화 및 세척 조건을 결정함에 있어, 하이브리드화 및 세척 조건은 선택된 기준 세트가 충족될 때까지 점점 증가된다(예, 온도 상승, 염 농도 감소, 세제 농도 감소 및/또는 하이브리드화 또는 세척에서 포르말린과 같은 유기 용매 농도 증가에 의해). 예를 들어, 하이브리드화 및 세척 조건은 프로브가 매치되지 않는 표적에의 하이브리드화에 대해 관찰된 것의 적어도 5배 높이의 시그널 대 노이즈 비로 완전히 매치되는 상보성 표적에 결합할 때까지 점점 증가된다.

"매우 엄격한" 조건은 특정 프로브의 열 용융점(Tm)과 동일하도록 선택된다. Tm은 시험 서열의 50%가 완전히 매치되는 프로브에 하이브리드하는 온도이다(한정된 이온 강도 및 pH하에서). 본 발명의 목적을 위하여, 일반적으로, "매우 엄격한" 하이브리드화 및 세척 조건은 한정된 이온 강도 및 pH에서 특정 서열을 위한 Tm보다 약 5℃ 더 낮도록 선택된다.

"극히 높은 엄격도" 하이브리드화 및 세척 조건은 완전히 매치되는 상보성 표적 핵산에의 프로브의 결합을 위한 시그널 대 노이즈 비가 매치되지 않는 표적 핵산에의 하이브리드화에 대해 관찰된 것의 10배 이상 높이일 때까지 하이브리드화 및 세척 조건의 엄격도가 증가되는 것이다. 그러한 조건하에서, 완전히 매치되는 상보성 표적 핵산의 적어도 1/2의 시그널 대 노이즈 비로 프로브에 하이브리드하는 표적 핵산은 극히 높은 엄격도 조건하에서 프로브에 결합하는 것으로 말해진다.

유사하게, 관련된 하이브리드화 분석의 하이브리드화 및/또는 세척 조건을 점점 증가시켜 더 높은 수준의 엄격도를 결정할 수 있다. 예를 들어, 하이브리드화 및 세척 조건의 엄격도는 완전히 매치되는 상보성 표적 핵산에의 프로브의 결합을 위한 시그널 대 노이즈 비가 매치되지 않는 표적 핵산에의 하이브리드화에 대해 관찰된 것의 10배 이상, 20배, 50배, 100배 또는 500배 이상일 때까지 증가된다. 그러한 조건하에서, 완전히 매치되는 상보성 표적 핵산의 적어도 1/2의 시그널 대 노이즈 비로, 프로브에 하이브리드하는 표적 핵산은 극히 극히 높은 엄격도 조건하에서 프로브에 결합하는 것으로 말해진다.

엄격한 조건하에서 서로 하이브리드하지 않는 핵산은 그들이 실질적으로 동일한 폴리펩티드를 암호한다면 여전히 실질적으로 동일하다. 이것은 예를 들어, 핵산의 한 카피가 유전자 코드에 의해 허용되는 최대의 코돈 축퇴성을 이용하여 생성될 때 발생한다.

독특한 하위서열

한 태양에서, 본 발명은 여기서 개시된 O-tRNA와 O-RS의 서열로부터 선택되는 핵산내의 독특한 하위서열을 포함하는 핵산을 제공한다. 독특한 하위서열은 임의의 공지의 O-tRNA와 O-RS의 핵산 서열에 해당하는 핵산과 비교하여 독특하다. 배열은 예를 들어 디폴트 파라미터로 고정된 BLAST를 이용하여 실시될 수 있다. 임의의 독특한 하위서열은 예를 들어, 본 발명의 핵산을 확인하기 위한 프로브로서 유용하다.

유사하게, 본 발명은 여기서 개시된 O-RS의 서열로부터 선택되는 폴리펩티드내의 독특한 하위서열을 포함하는 폴리펩티드를 포함한다. 여기서, 독특한 하위서열은 임의의 공지의 폴리펩티드 서열에 해당하는 폴리펩티드와 비교하여 독특하다.

본 발명은 또한 엄격한 조건하에서, O-RS의 서열로부터 선택되는 폴리펩티드내의 독특한 하위서열을 암호화하는 독특한 암호 올리고뉴클레오티드에 하이브리드하는 표적 핵산을 제공하며, 이때 독특한 하위서열은 대조 폴리펩티드(예, 본 발명의 신세타제가 예를 들어 돌연변이에 의해 유도된 모 서열) 중 어느 것에 해당하는 폴리펩티드에 비하여 독특하다. 독특한 서열은 전술한 대로 결정된다.

서열 비교, 동일성, 및 상동성

둘 이상의 핵산 또는 폴리펩티드 서열에서 용어 "동일한" 또는 퍼센트 "동일성"은 하기하는 서열 비교 알고리즘 중 하나(또는 당업자가 이용가능한 다른 알고리즘)를 이용하거나 시각적 관찰로 측정할 때, 최대 일치되게 배열되고 비교될 때, 동일하거나 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 퍼센티지를 갖는 둘 이상의 서열 또는 하위서열을 말한다.

두 개의 핵산 또는 폴리펩티드(예, O-tRNA 또는 O-RS를 암호화하는 DNA, 또는 O-RS의 아미노산 서열)에서 "실질적으로 동일한"은 서열 비교 알고리즘 중 하나(또는 당업자가 이용가능한 다른 알고리즘)를 이용하거나 시각적 관찰로 측정할 때, 최대 일치되게 배열되고 비교될 때, 적어도 약 60%, 바람직하게는 80%, 가장 바람직하게는 90-95% 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 둘 이상의 서열 또는 하위서열을 의미한다. 그러한 "실질적으로 동일한" 서열은 일반적으로 실제 조상과 관련없이 "상동성"인 것으로 고려된다. 바람직하게는, "실질적인 동일성"은 적어도 약 50 잔기 길이인 서열 영역, 더욱 바람직하게는 적어도 약 100 잔기 영역에 걸쳐 존재하며, 그리고 가장 바람직하게는 서열은 적어도 약 150 잔기, 또는 비교되는 두 서열의 전길이에 걸쳐 실질적으로 동일하다.

서열 비교 및 상동성 결정의 경우, 일반적으로 한 서열은 시험 서열이 비교되는 기준 서열로 작용한다. 서열 비교 알고리즘을 이용할 때, 시험 및 기준 서열은 컴퓨터에 입력되며, 필요하면 하위 서열 좌표가 지정되며 서열 알고리즘 프로그램 파라미터가 지정된다. 이어서 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여, 기준 서열에 대한 시험 서열을 위한 퍼센트 서열 동일성을 계산한다.

비교를 위한 적절한 서열 배열은 예를 들어, Smith & Waterman, Adv. Appl. Math. 2: 482 (1981)의 국소 상동성 알고리즘에 의해, Needleman & Wunsch, J. Mol. Biol. 48 : 443 (1970)의 상동성 배열 알고리즘에 의해, Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85 : 2444 (1988)의 유사성 조사 방법에 의해, 이들 알고리즘의 컴퓨터화된 실행에 의해(와이오밍주 매디슨의 575 사이언스 드라이브의 위스콘신 제네틱스 소프트웨어 패키지에서 GAP, BESTFIT, FASTA, 및 TFASTA), 또는 시각적 관찰에 의해 (이하의 Ausubel et al., 참고) 실시될 수 있다.

퍼센트 서열 동일성 및 서열 유사성을 결정하는 데 적합한 알고리즘의 한 예는 BLAST 알고리즘이며, 이는 Altschul et al., J. Mol. Biol. 215: 403-410 (1990)에 개시된다. BLAST 분석을 실시하기 위한 소프트웨어는 생물공학 정보를 위한 국립 센터를 통해 공개되어 이용된다(www. ncbi. nlm. nih. gov/). 이 알고리즘은 데이터베이스 서열내의 같은 길이의 단어와 배열될 때 매치되거나 일부 양성 값의 역치 점수 T를 만족하는 질문 서열에서 짧은 길이의 단어를 확인하여 높은 점수의 서열 쌍(HSP)을 먼저 확인하는 것에 관련된다. T는 이웃 단어 점수 역치(Altschul et al., 상기)로 불린다. 이들 초기 이웃 단어 히트는 이들을 함유한 더 긴 HSP를 찾기 위한 조사를 시작하기 위한 시작점으로 작용한다. 단어 히트는 이어서 축적 배열 점수가 증가될 수 있는 만큼 각 서열을 따라 양 방향으로 확장된다. 축적 점수는 뉴클레오티드 서열의 경우, 파라미터 M(매치하는 잔기 쌍을 위한 보상 점수, 항상 0보다 큼) 및 N(미스매치 잔기를 위한 페널티 점수, 항상 0보다 작음)을 이용하여 계산된다. 아미노산 서열의 경우, 스코어링 매트릭스를 이용하여 축적 점수를 계산한다. 각 방향에서 단어 히트의 연장은 축적 배열 점수가 그 최대 성사 값으로부터 양 X만큼 부족할 때, 축적 점수가 하나 이상의 음성 스코어링 잔기 배열로 인해 0 이하로 갈때, 또는 어느 서열의 끝에 도달할 때 중단된다. BLAST 알고리즘 파라미터 W, T, 및 X는 배열의 민감도 및 속도를 결정한다. BLASTN 프로그램( 뉴클레오티드 서열의 경우)은 디폴트로서 단어길이(W) 11, 예상치(E) 10, 컷오프 100, M=5, N=-4를 이용하며, 두 쇄의 비교를 이용한다. 아미노산 서열의 경우, BLASTP 프로그램은 단어길이(W) 3, 예상치(E) 10, 및 BLOSUM62 스코어링 매트릭스를 디폴트로 이용한다(Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci. USA 89: 10915 참고).

퍼센트 서열 동일성을 계산하는 것에 더하여, BLAST 알고리즘은 또한 두 서열간의 유사성의 통계적 분석을 실시한다(예, Karlin & Altschul, Proc. Nat'1. Acad. Sci. USA 90: 5873-5787 (1993) 참고). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 최소 합 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열간의 매치가 우연히 일어날 확률을 나타낸다. 예를 들어, 기준 핵산에의 시험 핵산의 비교에서 최소 합 확률이 약 0.1 미만, 더욱 바람직하게는 약 0.01 미만, 그리고 가장 바람직하게는 약 0.001 미만이면 핵산은 기준 서열에 유사한 것으로 간주된다.

돌연변이유발 및 기타 분자 생물학 기법

분자 생물학적 기법을 개시하는 일반 교과서는 Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods inEnzymology volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning-A Laboratory Manual (2nd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") 및 Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc. , (1999년까지 보충됨) ("Ausubel"))를 포함한다. 이들 교과서는 돌연변이유발, 벡터의 이용, 프로모터 및 예를 들어, 비천연 아미노산을 포함하는 단백질의 생산을 위한 셀렉터 코돈을 포함하는 유전자의 생성, 직교 tRNA, 직교 신세타제 및 그 쌍에 관련된 많은 관련 토픽을 개시한다.

다양한 타입의 돌연변이유발을 본 발명에서 이용하여, 예를 들어, tRNA 라이브러리를 생산하고, 신세타제 라이브러리를 생산하고, 대상 단백질 또는 폴리펩티드에 비천연 아미노산을 암호화하는 셀렉터 코돈을 삽입한다. 이들은 부위-지시된, 임의 점 돌연변이유발, 상동성 재조합, DNA 셔플링 또는 기타 회귀성 돌연변이유발 방법, 키메라 구조, 우라실 함유 주형을 이용한 돌연변이유발, 올리고뉴클레오티드-지시된 돌연변이유발, 포스포로티오에이트-변형된 DNA 돌연변이유발, 갭을 갖는 이중 DNA를 이용하는 돌연변이유발 등 또는 임의의 그 조합을 포함하며 이에 한정되지 않는다. 추가의 적합한 방법은 점 미스매치 회복, 회복-결핍 숙주 균주를 이용하는 돌연변이유발, 제한-선별 및 제한-정제, 결실 돌연변이유발, 전체 유전자 합성에 의한 돌연변이유발, 이중쇄 파괴 회복, 등을 포함한다. 예를 들어, 키메라 구조체에 관련되는 돌연변이유발은 또한 본 발명에 포함된다. 한 구체예에서, 돌연변이유발은 자연 발생 분자 또는 변형되거나 돌연변이된 자연 발생 분자의 공지의 정보, 예, 서열, 서열 비교, 물리적 특성, 결정 구조 등에 의해 안내될 수 있다.

상기 교과서 및 여기서 개시된 예들은 이들 과정을 설명한다. 추가의 정보는 하기의 문헌 및 그 안에 인용된 참고문헌에 개시된다: Ling et al., Approaches to DNA mutagenesis : an overview, Anal Biochem. 254 (2): 157-178 (1997); Dale et al., Oligonucleotide-directed random mutagenesis using the phosphorothioate method, Methods Mol. Biol. 57: 369-374 (1996); Smith, In vitro mutagenesis, Ann. Rev. Genet. 19: 423-462 (1985); Botstein & Shortle, Strategies and applications of in vitro mutagenesis, Science 229: 1193-1201 (1985); Carter, Site-directed mutagenesis, Biochem. J. 237: 1-7 (1986); Kunkel, The efficiency of oligonucleotide directed mutagenesis, in Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds. , Springer Verlag, Berlin))(1987) ; Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection, Proc. Natl. Acad. Sci. USA 82: 488-492 (1985); Kunkel et al., Rapid and efficient site-specific mutagenesis without phenotypic selection, Methods in Enzymol. 154,367-382 (1987); Bass et al., Mutant Trp repressors with new DNA-binding specificities, Science 242: 240-245(1988) ; Methods in Enzymol. 100: 468- 500 (1983); Methods in Enzvmol. 154: 329-350(1987) ; Zoller & Smith, Oligonucleotide-directed mutagenesis using Ml3-derived vectors : an efficient and general procedure for the production of point mutations in any DNA fragment, Nucleic Acids Res. 10: 6487-6500(1982) ; Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, Methods in Enzymol. 100: 468-500 (1983); Zoller & Smith, Oligonucleotide-directed mutagenesis : a simple method using two oligonucleotide primers and a single-stranded DNA template, Methods in Enzymol. 154: 329-350(1987) ; Taylor et al. , The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA, Nucl. Acids Res. 13: 8749-8764 (1985); Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA, Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis, Nucl. Acids Res. 14:9679-9698 (1986); Sayers et al.,Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, Nucl. Acids Res. 16: 791-802 (1988); Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucl. Acids Res. 16: 803-814; Kramer et al., The gapped duplex DNA approach to oligonucleotide-directed mutation construction, Nucl. Acids Res. 12: 9441- 9456(1984) ; Kramer & Fritz Oligonucleotide-directed construction of mutations via gapped duplex DNA, Methods in Enzymol. 154: 350-367(1987) ; Kramer et al., Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide- directed construction of mutations, Nucl. Acids Res. 16: 7207 (1988); Fritz et al., Oligonucleotide-directed construction of mutations : a gapped duplex DNA procedure without ezynmatic reactions in vitro, Nucl. Acids Res. 16: 6987-6999(1988) ; Kramer et al., Point Mismatch Repair, Cell 38 : 879-887 (1984); Carter et al., Improved oligonucleotide site-directed mutagenesis using M13 vectors, Nucl. Acids Res. 13: 4431-4443(1985) ; Carter, Improved oligonucleotide-directed mutagenesis using M13 vectors, Methods inEnzymol. 154 : 382-403(1987) ; Eghtedarzadeh & Henikoff, Use of oligonucleotides to generate large deletions, Nucl. Acids 14: 5115 (1986); Wells et al., Importance of hydrogen-bond fonation in stabilizing the transition state of subtilisin, Phil. Trans. R. Soc. Lond. A 317: 415-423(1986) ; Nambiar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223: 1299-1301 (1984); Sakamar and Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin), Nucl. Acids Res. 14: 6361-6372(1988) ; Wells et al., Cassette mutagenesis : an efficient method for generation of multiple mutations at defined sites, Gene 34: 315-323 (1985);Grundstrom et al., Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis, Nucl. Acids Res. 13:3305-3316(1985) ; Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli : a method for site-specific mutagenesis, Proc. Natl. Acad. Sci. USA, 83: 7177-7181 (1986); Arnold, Protein engineering for unusual environments, Current Opinion in Biotechnology 4: 450-455 (1993); Sieber, et al., Nature Biotechnology, 19: 456- 460(2001). W. P. C. Stemmer, Nature 370,389-91 (1994); 및, I. A. Lorimer,I. Pastan, Nucleic Acids Res. 23,3067-8 (1995)를 포함한다. 상기 방법 중 다수의 추가의 상세 사항은 Methods in Enzymology Volume 154에 개시되며, 이는 또한 다양한 돌연변이유발 방법에 있어서 문제점들을 위한 유용한 조절을 설명한다.

본 발명은 또한 직교 tRNA/RS 쌍을 통해 비천연 아미노산을 생체내 포함시키기 위한 진핵 숙주 세포 및 유기체에 관한 것이다. 숙주 세포는 본 발명의 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드를 포함하는 구조체, 예, 본 발명의 벡터, 예를 들어 클로닝 벡터 또는 발현 벡터로 유전적으로 조작된다(예, 형질전환, 형질도입 또는 형질감염됨). 벡터는 예를 들어, 플라스미드, 박테리아, 바이러스, 천연 폴리뉴클레오티드, 또는 접합 폴리뉴클레오티드 형태일 수 있다. 벡터는 전기 천공(From et al. , Proc. Natl. Acad. Sci. USA 82,5824(1985)), 바이러스 벡터에 의한 감염, 작은 비드 또는 입자의 매트릭스내에서 또는 표면에서 핵산을 가진 작은 입자에 의한 고속 충격 침투(Klein etal., Nature327, 70-73 (1987))를 비롯한 표준 방법에 의해 세포 및/또는 미생물내로 도입된다.

조작된 숙주 세포는 예를 들어, 스크리닝 단계, 프로모터 활성화 또는 형질전환체 선별과 같은 활성을 위해 적절하게 변형된 종래의 영양 배지에서 배양될 수 있다. 이들 세포는 선택적으로 형질전환 유기체내로 배양될 수 있다. 예를 들어, 세포 분리 및 배양(예, 후속되는 핵산 분리를 위해)을 위한 기타 유용한 문헌은 Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York and the references cited therein; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) 및 Atlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL를 포함한다.

세포내로 표적 핵산을 도입하는 몇몇 공지의 방법이 이용가능하며 어느 것이든 본 발명에 이용될 수 있다. 이들은 DNA를 함유한 원형질체와 수용 세포의 융합, 전기천공, 입자 충격, 및 바이러스 벡터(이하에서 추가 설명)을 이용한 감염 등을 포함한다. 박테리아 세포는 본 발명의 DNA 구조체를 함유한 플라스미드의 수를 증폭시키기 위해 이용될 수 있다. 박테리아는 로그 상으로 성장되며 박테리아내의 플라스미드는 공지된 다양한 방법에 의해 분리될 수 있다(예, Sambrook 참고). 또한, 많은 키트가 박테리아로부터 플라스미드를 정제하기 위해 시판된다(예, 파마시아 바이오텍의 EasyPrep^TM, FlexiPrep^TM, 스트라타젠의 StrataClean^TM, 및 퀴아젠의 QIAprep^TM 참고). 이어서, 분리되고 정제된 플라스미드를 추가로 조작하고, 세포를 형질감염시키기 위하여 이용하거나 유기체 감염을 위해 관련 벡터내로 포함시킨다. 일반적인 벡터는 전사 및 번역 종결자, 전사 및 번역 개시 서열, 및 특정 표적 핵산의 발현의 조절을 위해 유용한 프로모터를 함유한다. 벡터는 선택적으로 하나 이 상의 독립적인 종결자 서열을 함유하는 제너릭 발현 카세트, 진핵체 또는 원핵체 또는 둘다에서 카세트의 복제를 허용하는 서열(예, 셔틀 벡터) 및 원핵 및 진핵 시스템을 위한 선별 마커를 포함한다. 벡터는 원핵체, 진핵체 또는 바람직하게는 둘다에서 복제 및 통합을 위해 적합하다. Giliman & Smith, Gene8 : 81 (1979); Roberts, et al., Nature, 328: 731(1987); Schneider, B., et al., Protein Expr. Purif. 6435: 10 (1995); Ausubel, Sambrook, Berger(모두 상기함)를 참고한다. 클로닝에 유용한 박테리아 및 박테리오파아지의 카타로그는 예를 들어, ATCC에 의해 제공되며, 예를 들어 ATCC에 의해 발행된 The ATCC Catalogue of Bacteria and Bacteriophage (1992) Gherna et al. (eds)가 있다. 서열 결정, 클로닝 및 분자생물학의 다른 태양을 위한 추가의 기본적인 과정 및 이론적 고려사항은 또한 Watson et al. (1992) Recombinant DNA Second Edition Scientific American Books, NY에 개시된다. 또한, 본질적으로 임의의 핵산(및 표준이건 비표준이건, 사실상 임의의 표지된 핵산)은 미드랜드 서티파이드 리전트 컴퍼니(텍사스 미드랜드 소재, mcrc.com), 더 그레이트 어메리칸 진 컴퍼니(캘리포니아 라모나 소재, www.genco.com), 익스프레스젠 인크.(일리노이 시카고 소재, www.expressgen.com), 오페론 테크놀러지 인크.(캘리포니아 아라메다 소재) 및 기타와 같은 다양한 시판 회사로부터 맞춤 또는 표준 주문 될 수 있다.

키트

키트 또한 본 발명의 특징이다. 예를 들어, 세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질을 생산하기 위한 키트가 제공되며, 이때 키트는 O-tRNA 및/또는 O-tRNA를 암호화하는 폴리뉴클레오티드 서열 및/또는 O-RS를 암호화하는 폴리뉴클레오티드 서열 및/또는 O-RS을 함유하는 용기를 포함한다. 한 구체예에서, 키트는 하나 이상의 비천연 아미노산을 추가로 포함한다. 다른 구체예에서, 키트는 단백질을 생산하기 위한 안내서를 추가로 포함한다.

하기 실시예는 본 발명을 예시하기 위한 것이며 제한하기 위한 것이 아니다. 당업자는 본 발명의 범위를 벗어나지 않고 변화될 수 있는 다양한 중요하지 않은 파라미터를 인식할 것이다.

실시예 1: 진핵 세포에 비천연 아미노산을 포함시키는 아미노아실 - tRNA 신세 타제의 생산 방법 및 조성물

새로운 물리적, 화학적 또는 생물학적 특성을 갖는 비천연 아미노산을 포함시키기 위해 진핵 유전자 코드를 확장시키면 이들 세포에서 단백질 기능을 분석하고 조절하기 위한 강력한 도구를 제공할 것이다. 이 목표를 위하여, 사카로마이세스 세레비제(S.cerevisiae)에서 앰버 코돈에 대한 반응으로 높은 확실성으로 단백질내로 비천연 아미노산을 포함시키는 아미노아실-tRNA 신세타제의 분리를 위한 일반적인 접근법이 개시된다. 이 방법은 GLA4의 DNA 결합 도메인과 전사 활성화 도메인 사이에서 앰버 코돈의 억제에 의한, GAL4 반응성 리포터 유전자, HIS3, URA3 또는 LacZ의 활성화에 기초한다. 활성 대장균 티로실-tRNA 신세타제(EcTyrRS) 변이체의 양성 선별을 위한 GAL4 리포터의 최적화가 개시된다. 비활성 EcTyrRS 변이체의 음성 선별은 또한 '독성 대립유전자'로서 성장 배지에 첨가된 작은 분자(5-플루로 오로트산(5-FOA))의 사용에 의해 URA3 리포터를 이용하여 개발되었다. 중요하게 양성 및 음성 선별은 단일 세포에서 엄격도 범위를 이용하여 실시할 수 있다. 이것은 돌연변이 신세타제의 큰 라이브러리로부터 일정 범위의 아미노아실-tRNA 신세타제(aaRS) 활성의 분리를 촉진할 수 있다. 원하는 aaRS 표현형을 분리하기 위한 방법의 힘은 모델 선별에 의해 입증된다.

대장균(E.coli)의 유전자 코드에 비천연 아미노산의 최근의 첨가는 생체외 및 생체내에서 단백질 구조 및 기능을 분석하고 조작하기 위한 강력한 새로운 접근법을 제공한다. 광친화성 라벨, 중원자, 케토 및 올레핀기 및 발색단을 갖는 아미노산을 일반적인 20개 아미노산과 경쟁하는 효율 및 확실성으로 대장균에서 단백질내로 포함시켰다. 예를 들어, Chin, et al., (2002), Addition of a Photocrosslinker to the Genetic Code of Escherichia coli, Proc. Natl. Acad. Sci. U. S. A. 99: 11020-11024; Chin and Schultz, (2002), In vivo Photocrosslinking with Unnatural Amino Acid Mutagenesis, Chem BioChem 11: 1135-1137; Chin et al. , (2002), Addition of p-Azido-L-phenylalanine to the Genetic code of Escherichia coli, J. Am. Chem. Soc. 124: 9026-9027; Zhang et al. , (2002), The selective incorporation of alkenes into proteins in Escherichia coli, Angewandte Chemie. International Ed. in English 41: 2840-2842; 및, Wang and Schultz, (2002), Expanding the Genetic Code, Chem. Comm. 1-10를 참고한다.

비천연 아미노산은 화학적으로 잘못아실화된 테트라히메나 써모필라 tRNA( 예, M. E. Saks, et al. (1996), An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J. Biol. Chem. 271: 23169-23175) 및 관련 mRNA의 미세주사에 의해 제노푸스 난모세포에서 니코틴 아세틸콜린 수용체내로 도입되었었다(예, M. W. Nowak, et al. (1998), In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system, Method Enzymol. 293: 504-529). 이것은 독특한 물리적 또는 화학적 특성을 갖는 측쇄를 함유한 아미노산의 도입에 의해 난모세포에서 수용체의 상세한 생물물리적 연구를 가능하게 하였다. 예를 들어, D. A. Dougherty (2000), Unnatural amino acids as probes of protein structure and function, Curr. Opin. Chem. Biol. 4: 645-652를 참고한다. 불행히도, 이 방법은 미세주사될 수 있는 세포에서의 단백질에 한정되며, tRNA가 생체외에서 화학적으로 아실화되고 재아실화될 수 없으므로, 단백질의 수율이 매우 낮다. 이것은 다시 단백질 기능을 분석하기 위해 민감한 기법이 필요하게 만든다.

앰버 코돈에 대한 반응으로 진핵 세포에서 비천연 아미노산을 단백질내로 유전적으로 포함시키는 것은 흥미롭다. 또한, H. J. Drabkin et al., (1996), Amber suppression in mammalian cells dependent upon expression of an Escherichia coli aminoacyl-tRNA synthetase gene, Molecular & Cellular Biology 16: 907- 913; A. K. Kowal, et al. , (2001), Twenty-first aminoacyl-tRNA synthetase-suppressor tRNA pairs for possible use in site-specific incorporation of amino acid analogues into proteins in eukaryotes and in eubacteria. [comment], Proc. Natl. Acad. Sci. U. S. A. 98: 2268-2273 ; 및, K. Sakamoto, et al. , (2002), Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30: 4692-4699를 참고한다. 이것은 tRNA가 그들의 짝 신세타제에 의해 재아실화되어 다량의 돌연변이 단백질을 야기하므로, 상당한 기술적 및 실용적 잇점을 가질 것이다. 더욱이, 원리적으로 유전되는, 유전적으로 암호된 아미노아실-tRNA 신세타제 및 tRNA는 지수적 희석없이 많은 세포 분열을 통해 비천연 아미노산이 단백질내로 포함되도록 한다.

대장균의 유전자 코드에 새로운 아미노산을 추가하는 데 필요한 단계들이 개시되었으며(예, D. R. Liu, & P. G. Schultz, (1999), Progress toward the evolution of an organism with an expanded genetic code, Proc. Natl. Acad. Sci. U. S. A. 96: 4780-4785), 유사한 원리가 진핵체의 유전자 코드를 확장시키는 데 유용할 수 있다. 첫번째 단계에서, 직교 아미노아실-tRNA 신세타제(aaRS)/tRNA_CUA 쌍이 확인된다. 이 쌍은 숙주 세포 번역 기계와 기능하는 것이 필요하지만, aaRS는 아미노산으로 임의의 내인성 tRNA를 충전하지 않아야 하며 tRNA_CUA는 내인성 신세타제에 의해 아미노아실화되지 않아야 한다. 예, D. R. Liu, et al., Engineering a tRNA and aminoacyl-tRNA synthetase for the site-specific incorporation of unnatural amino acids into proteins in vivo, Proc. Natl. Acad. Sci. U. S. A. 94: 10092- 10097 참고. 두번째 단계에서, 비천연 아미노산만을 이용할 수 있는 이들 aaRS/tRNA 쌍이 돌연변이 aaRS의 라이브러리로부터 선택된 다. 대장균에서 MjTyrRS의 변이체를 이용하는 비천연 아미노산의 선별은 이단계 '이중 체(sieve) 선별을 이용하여 실시하였다. 예, D. R. Liu, & P. G. Schultz, (1999), Progress toward the evolution of an organism with an expanded genetic code, Proc. Natl. Acad. Sci. U. S. A. 96: 4780- 4785 참고. 변형된 선별 방법이 진핵 세포에서 이용된다.

사카로마이세스 세레비제는 단핵세포이고, 빠른 생성 기간을 가지며 상대적으로 잘 규명된 유전학을 가지므로, 진핵 숙주 유기체로 선택되었다. 예, D. Burke, et al., (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 참고. 더욱이, 진핵체의 번역 기계는 매우 보존되어 있으므로(예, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes, Canadian Journal of Biochemistry 58: 213-218; 및, (2001) The Ribosome. Cold Spring harbor Laboratory Press, Cold Spring Harbor, NY 참고), 에스.세레비제에서 발견된 비천연 아미노산의 포함을 위한 aaRS 유전자는 보다 고등한 진핵 유기체내로 '절단 및 접합'되고, 짝 tRNA와 함께 비천연 아미노산을 포함시키기 위해 이용될 수 있다(예, Sakamoto, et al., (2002) Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30: 4692-4699; 및, C. Kohrer, et al., (2001), Import of amber and ochre suppressor tRNAs into mammalian cells : a general approach to site- specific insertion of amino acid analogues into proteins, Proc. Natl. Acad. Sci. U. S. A. 98: 14310-14315 참고). 에스.세레비제의 유전자 코드의 확장은 따라서 복잡한 다세포 진핵 유기체의 유전자 코드를 확장시키는 관문이다. 예를 들어, M. Buvoli, et al., (2000), Suppression of nonsense mutations in cell culture and mice by multimerized suppressor tRNA genes, Molecular & Cellular Biology 20: 3116-3124를 참고한다. 이전에 대장균의 유전자 코드를 확장시키기 위해 이용되었던 메타노코커스 잔나시 TyrRS(MjTyrRS)/tRNA로부터 유래된 티로실 쌍(예, L. Wang, & P. G. Schultz, (2002), Expanding the Genetic Code, Chem. Comm. 1-10)은 진핵 유기체에서 직교가 아니며(예, P. Fechter, et al.,(2001), Major tyrosine identity determinants in Methanococcus jannaschii and Saccharomyces cerevisiae tRNA (Tyr) are conserved but expressed differently, Eur. J. Biochem. 268: 761-767), 진핵 유전자 코드를 확장시키기 위해 새로운 직교 쌍이 필요하다. 쉼멜과 동료들은 대장균 티로실-tRNA 신세타제(EcTyrRS)/tRNA_CUA 쌍이 에스.세레비제에서 앰버 코돈을 억제하며, 대장균 tRNA_CUA는 효모 시토졸에서 내인성 아미노아실 tRNA 신세타제에 의해 충전되지 않는다(도 2). 또한, 예를 들어, H. Edwards, et al., (1991), An Escherichia coli tyrosine transfer RNA is a leucine-specific transfer RNA in the yeast Saccharomyces cerevisiae, Proc. Natl. Acad. Sci. U. S. A. 88 : 1153-1156; 및, H. Edwards, & P. Schimmel (1990), A bacterial amber suppressor in Saccharomyces cerevisiae is selectively recognized by a bacterial aminoacyl-tRNA synthetase, Molecular & Cellular Biology 10: 1633-1641를 참고한다. 또한, EcTyrRS는 생체외에서 효모 tRNA를 충전하지 않는 것으로 나타났다. 예를 들어, Y. Kwok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes, Canadian Journal of Biochemistry 58: 213-218 ; B. P. Doctor, et al., (1966), Studies on the species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Symp. Quant. Biol. 31: 543-548 ; 및, K. Wakasugi, et al., (1998), Genetic code in evolution : switching species-specific aminoacylation with a peptide transplant, EMBO Journal 17: 297-305를 참고한다. 따라서, EcTyrRS/tRNA_CUA 쌍은 고등 유기체에서뿐만 아니라 에스.세레비제에서 직교쌍을 위한 후보이다(예, A. K. Kowal, et al., (2001), Twenty-first aminoacyl-tRNA synthetase-suppressor tRNA pairs for possible use in site-specific incorporation of aminoacid analogues into proteins in eukaryotes and in eubacteria. commefztj, Proc. Natl. Acad. Sci. U. S. A.98 (2001) 2268-2273).

대장균에서 EcTyrRS의 기질 특이성을 넓히기 위하여, 니시무라 및 동료들은 EcTyrRS의 돌연변이의 에러 프론 PCR 생성된 라이브러리를 스크린하여 3-아자티로신을 포함시키는 능력이 개선된 돌연변이를 발견하였다. 예를 들어, F. Hamano- Takaku, et al., (2000), A mutant Escherichia coli tyrosyltRNA synthetase utilizes the unnatural amino acid azatyrosine more efficiently than tyrosine, J. Biol. Chem. 275: 40324-40328를 참고한다. 하지만, 이 아미노산은 대장균의 프로테옴을 통해 포함되며, 발생된 효소는 여전히 기질로서 티로신을 선호한다. 요코야마 및 동료들은 밀 배(wheat germ) 번역 시스템에서 EcTyrRS의 고안된 활성 부위 변이체의 작은 집단을 스크린하여 티로신보다 더 효과적으로 3-요오도티로신을 이용하는 EcTyrRS 변이체를 발견하였다. D. Kiga, et al., (2002), An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system, Proc. Natl. Sci. U. S. A. 99: 9715-9720를 참고한다. 대장균에서 개발한 효소(예, J. W. Chin, et al. , (2002), Addition of a Photocrosslinker to the Genetic Code of Escherichia coli, Proc. Natl. Acad. Sci. U. S. 99: 11020-11024; J. W. Chin, et al. , (2002), Addition of p-Azido-L-phenylalanine to the Genetic code of Escherichia coli, J. Am. Chem. Soc. 124: 9026-9027 ; L. Wang, et al. , (2001), Expanding the genetic code of Escherichia coli, Science 292: 498-500 ; 및, L. Wang, et al. , (2002), Adding L-3-(2-naphthyl) alanine to the genetic code of E-coli, J. Am. Chem. Soc. 124: 1836-1837 참고)와 대조적으로, 이 효소는 비천연 아미노산의 부재하에서 티로신을 포함시킨다. 예를 들어, D. Kiga, et al., (2002), An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system, Proc. Natl. Acad. Sci. U. S. A. 99: 9715-9720를 참고한다. 최근에는, 요코야마 및 동료는 또한 이 EcTyrRS 돌연변이가 바실러스 스테아로써모필러스로부터의 tRNA_CUA와 기능하여 포유류 세포에서 앰버 코돈을 억제함을 입증하였다. K. Sakamoto, et al., (2002), Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30: 4692-4699를 참고한다.

필요 사항은 진핵 유전자 코드에 추가된 임의의 아미노산이 일반 20개 아미노산과 유사한 확실성으로 포함되어야 하는 것이다. 이 목표를 이루기 위해, 앰버 코돈 TAG에 대한 반응으로 일반 아미노산이 아닌 비천연 아미노산을 포함시키기 위해 에스.세레비제에서 기능하는 EcTyrRS/tRNACUA 변이체를 찾기 위해 일반적인 생체내 선별 방법을 이용하였다. 선별의 주요 이점은 비천연 아미노산을 선택적으로 포함시키는 효소가 생체외에서 스크린된 것의 6-7 차수의 양의 더 큰 다양성으로, 10⁸ EcTyrRS 활성 부위 변이체의 라이브러리로부터 신속하게 선별되고 농축될 수 있다는 것이다. 예를 들어, D. Kiga, et al., (2002), An engineered Escherichia coli tyrosyl-tRNA synthetase for site- specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system, Proc. Natl. Acad. Sci. U. S. A. 99: 9715- 9720를 참고한다. 이러한 다양성 증가는 매우 높은 확실성으로 다양한 범위의 유용한 기능 기를 포함시키기 위한 EcTyrRS 변이체를 분리할 가능성을 크게 증가시킨다. 예를 들어, L. Wang, & P. G. Schultz, (2002), Expanding the Genetic Code, Chem. Comm. 1-10를 참고한다.

에스.세레비제에의 선별 접근을 확장하기 위해, 전사 활성자 단백질 GAL4를 이용하였다(도 1 참고). 예를 들어, A. Laughon, et al. , (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4: 268-275; A. Laughon, & R. F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4: 260-267; L. Keegan, et al., (1986), Separation of DNA binding from the transcription-activating function of a eukaryotic regulatory protein, Science 231: 699-704 ; 및, M. Ptashne, (1988), How eukaryotic transcriptional activators work, Nature 335:683-689를 참고한다. 이 881 아미노산 단백질의 N-말단 147 아미노산은 특이적으로 DNA 서열에 결합하는 DNA 결합 도메인(DBD)을 형성한다. 예를 들어, M. Carey, et al., (1989), An amino-terminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol. 209: 423-432; 및, E. Giniger, et al., (1985), Specific DNA binding of GAL4, a positive regulatory protein of yeast, Cell 40: 767-774을 참고한다. DBD는 중간의 단백질 서열에 의해, DNA에 결합할 때 전사를 활성화할 수 있는 C-말단 113 아미노산 활성화 도메인(AD)에 연결된다. 예를 들어, J. Ma, & M. Ptashne, (1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell 48: 847-853: 및, J. Ma, & M. Ptashne,(1987), The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell 50: 137-142를 참고한다. GAL4의 N-말단 DBD 및 그 C-말단 AD 둘다를 함유한 단일 폴리펩티드의 N-말단 DBD를 향해 앰버 코돈을 위치시켜, EcTyrRS/tRNA_CUA 쌍에 의한 앰버 억제가 GAL4에 의한 전사 활성화에 연결될 수 있을 것으로 보인다(도 1, 패널 A). 적절한 GAL4 활성화된 리포터 유전자의 선택에 의해, 양성 및 음성 선별 둘다 상기 유전자로 실시될 수 있다(도 1, 패널 B). 세포의 아미노산 영양요구성의 보충에 기초한 많은 리포터 유전자를 양성 선별에 이용할 수 있지만(예, URA3, LEU2, HISS, LYS2), HIS3 유전자는 그것이 암호화하는 단백질(이미다졸 글리세롤 포스페이트 디하이드라타제)의 활성이 3-아미노트리아졸(3-AT)의 첨가에 의해 투여량 의존 방식으로 조절될 수 있으므로, 매력적인 리포터 유전자이다. 예를 들어, G. M. Kishore, & D. M. Shah, (1988), Amino acid biosynthesis inhibitors as herbicides, Annual Review of Biochemistry 57: 627-663를 참고한다. 에스 . 세레비제에서는, 보다 적은 유전자가 음성 선별을 위해 이용되었다. 성공적으로 이용된 몇 가지 음성 선별 전략 중 하나(예, A. J. De Maggio, et al. , (2000), The yeast split-hybrid system, Method Enzymol. 328 : 128-137 ; H. M. Shih, et al. , (1996), A positive genetic selection for disrupting protein-protein interactions: identification of CREB mutations that prevent association with the coactivator CBP, Proc.Natl.Acad.Sci.U.S.A. 93:13896-13901; M. Vidal, et al.,(1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A. 93:10321-10326; 및 M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions.[comment], Proc.Natl.Acad.Sci.U.S.A.93:10315-10320)는 비달 및 동료들에 의해 개발된 '역 이-하이브리드' 시스템에 개시된 URA3/5-플루로오로트산(5-FOA) 음성 선별(예, J.D. Boeke, et al., (1984), A positive selection for mutants lacking orotidine-5'-phosphate decarboxylase activity in yeast: 5-fluoroorotic acid resistance, Molecualr & General Genetics 197:345-346) 시스템이다. M. Vidal, et al.,(1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A. 93:10321-10326; 및 M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions.[comment], Proc.Natl.Acad.Sci.U.S.A.93:10315-10320를 참고한다. 역 이-하이브리드 시스템에서, 유전적으로 통합된 URA3 리포터는 GAL4 DNA 결합 부위를 함유하는 엄격하게 조절되는 프로모터하에 놓여진다. 상호작용하는 두 단백질이 GAL4 DBD 및 GAL4 AD에의 융합체로 생산될 때, 이들은 GAL4의 활성을 재구성하며 URA3의 전사를 활성화시킨다. 5-FOA의 존재하에서, URA3 유전자 생성물은 5-FOA를 독성 생성물로 전환시켜 세포를 죽인다. 상기한 J.D.Boeke, et al.을 참고한다. 이 선별은 단백질-단백질 상호작용을 파괴하는 단백질 및 단백질-단백질 상호작용을 파괴하는 돌연변이를 선 별하기 위해 이용되었다. 단백질-단백질 상호작용의 소분자 억제제를 스크리닝하기 위한 변이체 또한 개시되었다. 예를 들어, Huang, & S.L. Schreiber, (1997), A yeast genetic system for selecting small molecule inhibitors of protein-protein interactions in nanodroplets, Proc.Natl.Acad.Sci.U.S.A. 94:13396-13401를 참고한다.

전길이 GAL4에서 앰버 코돈의 적절한 선택은 효모 세포에서 히스티딘 또는 우라실 영양요구성을 보충하기 위해 HIS3 또는 URA3 GAL4 활성화된 리포터를 이용하여 활성 EcTyrRS 변이체를 위한 효율적인 양성 선별을 허용한다. 더욱이, URA3 리포터를 5-FOA의 존재하에서 비활성 EcTyrRS 변이체를 위한 음성 선별에서 이용할 수 있다. 또한, lacZ를 이용하는 비색 분석은 효모 세포에서 아미노아실-tRNA 신세타제 활성을 판독하기 위해 이용될 수 있다.

결과 및 토의

EcTyrRS 유전자가 구성적 ADH1 프로모터의 조절하에서 발현되었으며, tRNA_CUA 유전자가 동일한 높은 카피 효모 플라스미드(pEcTyrRStRNA_CUA, 도 1, 패널 C)로부터 발현되었다. pEcTyrRStRNA_CUA,및 키메라 GAL4 구조체의 DNA 결합 도메인과 활성화 도메인 사이의 단일 앰버 돌연변이를 함유하는 저 카피 리포터를 MaV203내로 동시형질전환시킬 경우, 세포는 히스티딘이 결핍되고 10-20 mM 3-AT를 함유한 선별 배지에서 성장하였다(도 2). MaV203 세포를 동일한 GAL4 구조체 및 비활성 신세타제 돌연변이(A5) 또는 EctRNA 유전자가 없는 구조체로 형질전환시켰을 때, 10 mM 3-AT 에서 성장은 관찰되지 않았다(도 2). 이들 실험은 EcTyrRS가 ADH1 프로모터로부터 기능성 형태로 구성적으로 발현될 수 있으며, MaV203에서 최소의 내인성 앰버 억제가 있으며, 이 시스템에서 효모 신세타제에 의한 EctRNA_CUA의 충전이 거의 없음을 확립한다. 예를 들어, H.Edwards, et al., (1991), An Escherichia coli tyrosine transfer RNA is a leucine-specific transfer RNA in the yeast Saccharomyces cerevisiae, Proc.Natl.Acad.Sci.U.S.A. 88:1153-1156; 및 H. Edwards, & P.Schimmel, (1990), A bacterial amber suppressor in Saccharomyces cerevisiae is selectively recognized by a bacterial aminoacyl-tRNA synthetase, Molecular & Cellular Biology 10:1633-1641을 참고한다. EcTyrRS가 에스.세레비제 tRNA를 충전하지 않으므로(예, Y.Kwok, & J.T.Wong, (1980), Evolutionary relationship between Halobacterium cutirubum and eukaryotes determined by use of aminoacyl-tRNA synthetase as phylogenetic probes, Canadian Journal of Biochemistry 58 : 213-218 ; B. P. Doctor, et al., (1966), Studies on the species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Sump. Quant. Biol. 31: 543-548; 및, K. Wakasugi, et al., (1998), Genetic code inevolution : switching species-specific aminoacylation with a peptide transplant, EMBO Journal 17: 297-305), 이들 실험은 EcTyrRS/EctRNA_CUA가 에스 . 세레비제에서 직교쌍임을 확인한다.

1세대 GAL4 키메라가 약한 HIS3 리포터의 전사를 활성화시킬 수 있었던 반 면, 20 mM을 초과하는 3-AT의 농도에서 또는 - URA 플레이트에서 상당한 성장을 허용하기에 충분하게 MaV203에서 URA3 리포터의 전사를 활성화시킬 수는 없었다(도 2). EcTyrRS의 선별 목적을 위하여, 변이체인 2 세대 GAL4 구조체를 만들었다. 이 GAL4 리포터는 보다 활성적이고, 더 큰 동력학적 범위를 가지며, 역전체(revertant)의 축적을 피하도록 고안되었다. GAL4 리포터의 활성을 증가시키기 위하여, 강한 ADH1 프로모터의 조절하에서 DBD-AD 융합체의 두배의 전사 활성화 활성을 갖는 전길이 GAL4를 이용하였으며(예, J. Ma, & M. Ptashne,(1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell 48: 847-853), 높은 카피수의 2-㎛ 플라스미드(초기 GAL4 키메라의 센트로머 플라스미드의 10-30 배 카피수를 가짐)를 이용하였다. 플라스미드의 카피 수 및 그것이 암호화하는 단백질의 활성의 증가는 리포터의 동정 범위를 확장시킨다. 앰버 돌연변이는 아미노산 잔기 2와 147을 암호화하는 GAL4 유전자의 영역에 표적화되었다(도 3). 이 영역은 서열 특이적 DNA 결합에 충분하며(예, M. Carey, et al. , (1989), An amino-terminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol. 209: 423-432), GAL4 유전자에서 첫번째 숨은 활성화 도메인의 5' 측에 놓여(예, J. Ma, & M. Ptashne, (1987) Deletion analysis of GAL4 defines two transcriptional activating segments, Cell48 : 847-853), 앰버 억제의 부재하에서 생산된 절단된 생성물이 전사를 활성화시킬 것이 예상되지 않는다. 돌연변이시킬 아미노산 코돈의 선택은 GAL4에서 이전의 포화 돌연변이유발 선별(예,M. Johnston, & J. Dover, (1988), Mutational analysis of the GAL4-encoded transcriptional activator protein of Saccharomyces cerevisiae, Genetics 120: 63-74), 및 GAL4의 N-말단 DNA 결합 도메인의 X-선 구조(R.Marmorstein, et al. , (1992), DNA recognition by GAL4 : structure of a protein-DNA complex.[comnent], Nature 356: 408-414; 및, J. D. Baleja, et al., (1992), Solution structure of the DNA-binding domain of Cd2-GAL4 from S. cerevisiae. [comnent],Nature 356: 450-453) 및 그 이량체화 영역의 NMR 구조에 의해 안내되었다. 예를 들어, P. Hidalgo, et al., (2001),Recruitment of the transcriptional machinery through GAL11P : structure and interactions of the GAL4 dimerization domain, Genes & Development 15:1007-1020를 참고한다.

전길이 GAL4를 작은 pUC계 벡터내로 클로닝하여 부위 지시된 돌연변이유발에 의해 10 개의 단일 앰버 돌연변이를 (아미노산 L3, I13, T44, F68, R110, V114, T121, I127, S131, T145를 위한 코돈에서) 신속하게 구성하였다. 이어서 GAL4 및 얻어진 앰버 돌연변이를 전길이 ADH1 프로모터의 조절하에서 2-㎛ 효모 벡터내로 서브클로닝하여 pGADGAL4 및 pGADGAL4(xxTAG)로 지정된 앰버 돌연변이 시리즈를 생성하였으며(도 1, 패널 C), 이때 xx는 앰버 코돈으로 돌연변이된 GAL4 유전자의 아미노산 코돈을 나타낸다. 각 GAL4 돌연변이는 EcTyrRS/tRNA_CUA 또는 A5/tRNA_CUA와 MaV203 세포내로 동시형질전환되어, 형질전환체를 류신 및 트립토판 자가영양성(protrophy)으로 전환시켰다. pGADGAL4 자체는 매우 낮은 효율로(GAL4 앰버 돌연변이의 10-3 배 미만) 형질전환되었으며 그러한 높은 카피에서는 MaV203 세포에 해로울 것이며; GAL4의 앰버 돌연변이에서는 그러한 효과는 관찰되지 않았다.

활성 또는 사멸 신세타제의 존재하에서, GAL4 리포터의 표현형은 - URA 플레이트에서, 그리고 0.1% 5-FOA 플레이트에서 분석하였다(도 3, 패널 A). 다섯 개의 GAL4 돌연변이(L3TAG, I13TAG, T44TAG, F68TAG, S131TAG)가 - URA 플레이트에서 성장하였으며, 야생형 또는 비활성 EcTyrRS의 존재하에서 0.1% 5-FOA에서는 성장하지 못하였다. 이들 앰버 돌연변이에서, 내인성 억제는 MaV203에서 URA3 리포터의 동적 범위를 넘어 EcTyrRS/tRNA_CUA 매개 억제를 추진하기에 명백히 충분하다. 다섯 개의 GAL4 단일 앰버 돌연변이(R110TAG, V114TAG, T121TAG,I127TAG, T145TAG)는 우라실 부재하 및 EcTyrRS/tRNA_CUA 존재하에서(그러나 A5/tRNA_CUA는 아님) 성장하였으며 5-FOA에서는 역 표현형을 나타냈다. 이들 돌연변이는 MaV203에서 URA3 리포터의 동적 범위내에 속하는 EcTyrRS 의존성 표현형을 나타낸다. - URA 및 0.1% 5-FOA 둘다에서 가장 깨끗한 EcTyrRS 의존성 표현형이 GAL4의 R110 TAG 돌연변이에서 관찰되었다. 하지만, 이 돌연변이는 A5로 동시형질전환될 때 X-GAL 분석에서 일부 청색을 나타냈다. 동적 범위를 개선하기 위해, GAL4의 여섯 개의 이중 앰버 돌연변이 시리즈를 R110TAG를 함유하도록 만들었다(도 3, 패널 B)(L3TAG,R110TAG ; I13TAG,R110TAG ; T44TAG,R110TAG ; R110TAG, T121TAG;R110TAG, I127TAG; R110TAG, T145TAG). 이들 이중 돌연변이 중 네 개(I13TAG,R110TAG ;R110TAG, T121TAG;R110TAG, I127TAG 및 T145TAG, R110TAG)는 우라실 부재하에서 성장할 수 없었으며 0.1% 5-FOA에서 성장하였다. 이들 이중 돌연변이는 플레이트 분석의 동적 범위 밖의 활성을 갖는다. 이중 돌연변이 중 둘 (L3TAG,R110TAG 및 T44TAG,R110TAG)은 야생형 EcTyrRS/tRNA_CUA의 존재하에서 성장하였으나, - URA 플레이트에서 A5/tRNA_CUA로는 성장하지 않았으며; 이들 돌연변이는 또한 5-FOA에서 예상되는 상호간 표현형을 나타냈다. 이들 두 GAL4 돌연변이 중 더 활성인 pGADGAL4 (T44TAG,R110TAG)는 보다 상세한 특성규명을 위해 선별되었다(도 4). pGADGAL4 (T44TAG, R110TAG)/pEcTyrRS-tRNA_CUA 를 함유하는 MaV203은 X-GAL에서 청색이었으나 pA5/tRNA_CUA를 함유하는 상응하는 균주는 아니었다. 유사하게 pGADGAL4 (T44TAG,R110TAG)/pEcTyrRS/tRNA_CUA 를 함유하는 MaV203은 75 mM까지의 3-AT 농도를 갖는 플레이트 및 - URA 플레이트에서는 잘 성장하지만 pA5/tRNA_CUA를 함유하는 상응하는 균주는 10 mM 3AT에서 또는 우라실의 부재하에서 성장하지 못했다. 함께 고려할 때, pGADGAL4 (T44TAG, R110TAG)의 EcTyrRS 의존성 표현형은 MaV203에서 URA3, HIS3, 및 lacZ 리포터의 동적 범위를 확장시킬 수 있다.

GAL4의 활성을 변화시키지 않고 다양한 아미노산을 치환하는 능력이 비천연 아미노산을 단백질내로 포함시킬 수 있는 돌연변이 아미노아실-tRNA 신세타제의 선별에 유용할 것이므로, T44 또는 R110이 티로신외의 아미노산으로 치환된 GAL4 돌연변이의 활성을 결정하는 것이 흥미로웠다. 예를 들어, M. Pasternak, et al. , (2000), A new orthogonal suppressor tRNA/aminoacyl-tRNA synthetase pair for evolving an organism with an expanded genetic code, Helvetica Chemica Acta 83 : 2277를 참고한다. GAL4에서 잔기 T44의 다섯 개의 돌연변이 시리즈(T44Y, T44W, T44F, T44D, T44K)를 pGADGAL4 (R110TAG)에서 구성하였으며, 이는 pGADGAL4 자체가 독성이기 때문이다. pGADGAL4 (T44TAG)에서 GAL4,(R110Y, R110W, R110F, R110D, R110K)에서 위치 R110에서의 유사한 돌연변이 시리즈를 구성하였다. 이들 돌연변이는 본 발명자들이 단백질내로 포함시키는 데 관심이 있지만 또한 허용성의 엄격한 시험으로서 양성 및 음성 하전된 잔기를 함유하는 큰 소수성 아미노산 측쇄에 대해 치우쳐 있다. 각 돌연변이는 MaV203내로 pEcTyrRS/tRNA_CUA와 동시형질전환시키고 오르토-니트로페닐-β-D-갈락토피라노시드(ONPG) 가수분해에 의해 lacZ 생산에 대해 leu+ trp+ 분리체를 분석하였다(도 5). T44 또는 R110에 대해 치환된 상이한 아미노산을 갖는 GAL4를 함유하는 세포사이에서 활성의 변이는 모든 경우에 3배 미만이었다. 이 최소의 변이성은 이들 부위의 GAL4의 전사 활성의 변화없이 아미노산 치환을 허용함을 입증한다. 선별 플레이트에서 분석된 단일 앰버 돌연변이의 활성으로부터 예상되는 대로, GAL4(R110TAG) 배경에서 만들어진 T44의 돌연변이는 GAL4(T44TAG) 배경에서 만들어진 R110의 돌연변이보다 ONPG의 가수분해가 더 느렸다.

모델 농축 연구를 실시하여 시스템이 과량의 비활성 신세타제로부터 활성 신세타제를 선별하는 능력을 검사하였다(표 1, 표 2, 도 6). 이 선별은 비천연 아미노산의 존재하에서 변이체 라이브러리로부터 활성 신세타제를 선별하는 능력을 모델링한다. GAL4(T44, R110) 및 A5/tRNA_CUA를 함유한 MaV203 세포를, OD₆₆₀ 및 비선택성 -leu, -trp 배지에 도말되고 X-GAL 오버레이에 의해 분석할 때 청색으로 변하는 콜로니 분획에 의해 판단할 때, 10 내지 10⁶ 배 과량의 GAL4(T44TAG, R110TAG) 및 A5/tRNA_CUA와 혼합하였다. 50 mM 3-AT에서 또는 우라실의 부재하에서 생존할 수 있는 세포들을 선별하였다. X-GAL 분석에서 청색인, 3-AT 또는 -URA에서 생존하는 세포 대 흰색인 세포의 비는, 선별 부재하에서 동일한 비와 비교할 때, 양성 선별이 10⁵ 을 초과하는 인자만큼 사멸 신세타제로부터 활성 신세타제를 농축할 수 있음을 명확히 나타낸다(표 1). 1:10⁵보다 큰 출발 비를 위한 정확한 농축 측정은 일반적으로 가능하지 않았으며, 이는 10⁶ 이하의 세포가 무관한 표현형으로 이끄는 세포 사이에서 상당한 크로스토크없이 편리하게 도말될 수 있기 때문이다.

[표 1]

기능성 EcTyrRS를 위한 모델 양성 선별

a) OD₆₆₀에 의해 결정됨

b) X-GAL에서

[표 2]

비기능성 EcTyrRS를 위한 모델 음성 선별

a) OD₆₆₀에 의해 결정됨

b) X-GAL에서

비천연 아미노산의 존재하에서 양성 선별 후, 선별된 세포는 천연 아미노산을 이용할 수 있는 신세타제 및 추가된 비천연 아미노산을 이용할 수 있는 신세타제를 함유할 것이다. 비천연 아미노산만을 이용할 수 있는 신세타제를 분리하기 위하여, 천연 아미노산을 이용하는 신세타제를 암호화하는 세포는 선별된 클론으로부터 제거되어야 한다. 이것은 비천연 아미노산이 유지되고 천연 아미노산과 기능하는 신세타제가 제거되는 음성 선별로 이루어질 수 있다. 모델 음성 선별은 모델 양성 선별과 유사한 방식으로 실시되었다. EcTyrRS/tRNA_CUA를 10 내지 10⁵ 배 과량의 A5/tRNA_CUA와 혼합하고 0.1% 5-FOA에서 선별을 실시하였다. X-GAL 분석에서 흰색이었던, 0.1% 5-FOA에서 생존하는 세포 대 청색이었던 세포의 비를 비선별 조건하에서의 동일 비와 비교하면, 음성 선별이 적어도 0.6 X 10⁴의 인자만큼 활성 신세타제로부터 사멸 신세타제를 농축할 수 있음이 명백하다. 1:10⁴ 를 넘는 시작 비를 위한 정확한 농축 측정은 일반적으로 가능하지 않았으며, 이는 10⁵이하의 세포는 무관한 표현형으로 이끄는 세포 사이에서 상당한 크로스토크없이 편리하게 도말될 수 있기 때문이다.

비천연 아미노산을 인식하는 aaRS의 양성 선별 및 천연 아미노산을 인식하는 aaRS의 음성 선별을 허용하는 일반적인 접근법이 개발되었다. 선별의 엄격도를 변화시켜, 다양한 신세타제 활성을 분리할 수 있다. EcTyrRS의 변이체를 이용하는 모델 선별에 이 방법을 적용하면 1회의 양성 선별에서 10⁵을 초과하는 농축 및 1회의 음성 선별에서 0.6 X 10⁴ 을 초과하는 농축을 나타냈다. 이들 관찰은 이 방법이 다양한 측쇄를 갖는 비천연 아미노산을 에스 . 세레비제에서 단백질내로 부위특이적으로 포함시키기 위해 기능하는 직교 아미노아실-tRNA 신세타제에의 신속한 접근을 제공할 수 있음을 제안한다. 더욱이, 에스 . 세레비제에서 발생한 효소는 고등 유기체에서 이용될 수 있다.

재료 및 방법

벡터 구성

tRNA_CUA 유전자는 프라이머

, 및 pESCSU3URA로부터의

를 이용하는 PCR에 의해 증폭되었다. 이것 및 모든 다른 PCR 반응은 로쉐로부터의 익스팬드 PCR 키트를 이용하여 제조자의 지시에 따라 실시되었다. NheI 및 AgeI을 이용한 제한 엔도 뉴클레아제 분해 후, 이 tRNA 유전자를 2 ㎛ 벡터 pESCTrp(스트라타젠)내의 동일한 부위 사이에 삽입하여 ptRNA_CUA를 생성하였다. 전길이 ADH1 프로모터는 프라이머 PADHf:

및 AgeI 및 EcoRI으로 분해된 pADHR:

를 이용하여 pDBLeu(인비트로겐)로부터 PCR 증폭시켰다. EcTyrRS는 프라이머

및

로 증폭되었다. EcTyrRS PCR 생성물을 EcoRI 및 NotI으로 분해하였다. 이어서 ptRNA_CUA를 AgeI 및 NotI으로 분해하였다. 이들 세 가지 DNA의 삼중 연결에 의해 pEcTyrRS-tRNA_CUA 를 얻었다. 활성 부위에서 아미노산 잔기(37, 126, 182, 183 및 186)이 알라닌으로 돌연변이된 플라스미드 pA5-tRNA_CUA를, 올리고뉴클레오티드 F37Afwd:

N126Afwd:

182, 183, 186A,

및 그들의 역 보체, 및 인접 올리고뉴클레오티드, 4783:

3256:

및 주형으로서 pEcTyrRS-tRNA_CUA 를 이용하여 생성하였다. PCR 생성물을 EcoRI과 NotI으로 분해하고 동일한 효소로 분해하여 방출된 pEcTyrRS-tRNA_CUA의 큰 단편내로 연결시켰다. 1 세대 DB-AD 리포터를 구성하기 위하여, GAL4 DNA 결합 도메인을 전방 프라이머 pADfwd:

또는 pADfwd(TAG):

및 ADrev:

를 이용하여 pGADT7(클론테크)로부터 PCR 증폭하였다. 이들 PCR 생성물을 제조자의 지시에 따라 클로나제 과정을 이용하여 벡터 pDEST3-2(인비트로겐)내로 클로닝하여, pDB-AD 및 pDB-(TAG)-AD를 얻었다. PGADGAL4 및 변이체를 구성하기 위하여, GAL4 유전자를 프라이머 ADH1428-1429

및 GAL4C:

를 이용하여 PCR에 의해 pCL1(클론테크)로부터 증폭시켰다. 이 단편은 제조자의 지시에 따라 벡터 pCR2.1 TOPO(인비트로겐)내로 클로닝시켰다. GAL4 유전자를 함유하는 클론(pCR2.1 TOPOGAL4)을 HindIII로 분해하고 2.7 kb GAL4 단편을 겔 정제하고, HindIII로 분해되고 소 장 포스파타제로 처리되고 겔 정제된 pGADT7의 큰 단편에 연결시켰다. GAL4 유전자의 변이체를, 보충 정보에 열거된 프라이머를 이용하여 pCR2.1에서 제조자의 지시에 따라 실시된 퀵체인지 반응(스트라타젠)에 의해 생성하였다. GAL4 돌연변이를 야생형 GAL4 유전자와 동일한 방식으로 pGADT7에 클로닝하였다. 모든 최종 구조체는 DNA 서열 결정에 의해 확인하였다.

효모 배지 및 조작

에스 . 세레비제 균주 MaV203(인비트로겐)은 MATα;leu2-3,112;trp1 109 ;his3 △200 ; ade2-101 ;cyh2^R ;cyh1^R ; GAL4 △;gal80 △; GAL1 :: lacZ ;HIS3UASGAL1 : HIS3＠LYS2 ;SPAL1OUASGAL1::URA3이다. 효모 배지는 클론테크로부터 구입하였으며, 5-FOA와 X-GAL은 인비트로겐으로부터 그리고 3-AT는 BIO101로부터 구입하였다. YPER(효모 단백질 추출 시약) 및 ONPG는 피어스 케미컬로부터 구입하였다. 플라스미드 형질전환은 PEG/리튬 아세테이트 방법에 의해 실시되었으며(예, D. Burke, et al. , (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) 형질전환체는 적절한 합성의 완전한 드롭아웃 배지에서 선별되었다. 다양한 플라스미드 조합에 의해 MaV203에 부여된 표현형을 시험하기 위하여, 각 형질전환의 합성의 완전한 드롭아웃 플레이트로부터의 효모 콜로니를 15 ㎕의 멸균수에 재현탁시키고 대상 선별 배지상에 스트리크하였다. 각 표현형은 다섯 이상 개의 콜로니로 확인하였다. 아가로즈 오버레이 방법에 의해 X-GAL 분석을 실시하였다. I. G. Serebriiskii, & E. A. Golemis, (2000),Uses of lacZ to study gene function : evaluation of beta-galactosidase assays employed in the yeast two-hybrid system, Analytical Biochemistry 285 : 1-15을 참고한다. 요약하면, 콜로니 또는 세포 패치를 니트클로로포름의 수회 첨가에 의해 아가 플레이트상에서 용해시킨다. 클로로포름 증발 후, 0.25 g/L의 XGAL을 함유하며 0.1 M Na₂PO₄ 로 완충된 1% 아가로즈를 플레이트 표면에 가하였다. 일단 아가로즈가 고정되면, 플레이트를 12시간동안 37 ℃에서 항온처리하였다. ONPG 분석은, 96웰 블록내의 1ml의 SD-leu,-trp에 단일 콜로니를 접종하고 교반하면서 30 ℃에서 항온처리하여 실시하였다. 세포 100 ㎕ 및 몇몇 세포 희석액의 OD₆₆₀을 96웰 미세적정 플레이트에서 평행하게 기록하였다. 세포(100 ㎕)를 YPER:ONPG(1X PBS, 50% v/v YPER, 20mM MgCl₂, 0.25 % v/v β-머캡토에탄올, 및 3 mM ONPG) 100 ㎕와 혼합하고 37℃에서 교반하면서 항온처리하였다. 색상이 발생하면, 원심분리에 의해 세포를 침전시키고, 상등액을 깨끗한 96 웰 미세적정 플레이트(Nunclon, cat # 167008)에 옮기고, A420을 기록하였다. 나타난 모든 데이터는 적어도 4 개의 독립 클론으로부터의 시험의 평균이며 나타난 에러 막대는 표준 편차를 나타낸다. 식:베타-갈락토시다제 단위=1000 A420/(V.t.OD₆₆₀)을 이용하여 ONPG 가수분해를 계산하였으며, 이때 V는 밀리리터로 나타낸 세포 부피이며, t는 분으로 나타낸 항온처리 시간이다. 예를 들어, I. G. Serebriiskii, & E. A. Golemis, (2000), Uses of lacZ to studygenefunction : evaluation of beta-galactosidase assays employed in the yeast two- hybrid system, Analytical Biochemistry 285: 1-15를 참고한다. 1 베타-갈락토시다제 단위는 세포 당 분당 1 μmol의 ONPG의 가수분해에 해당한다. 상기한 Serebriiskii and Golemis를 참고한다. 분광광도 판독은 SPECTRAmax190 플레이트 판독기에서 실시하였다.

모델 선별

양성 선별: 두 개의 밤샘 배양물을 SD -Leu, -Trp에서 성장시켰다. 하나는 EcTyrRS-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 MaV203이며 다른 하나는 pA5-tRNASU3/pGADGAL4(T44,R110TAG)를 보유하였다. 이들 세포를 원심분리에 의해 수집하고 볼텍싱에 의해 0.9% NaCl에 재현탁시켰다. 두 세포 용액을 동일한 OD₆₆₀으로 희석하였다. EcTyrRS-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 MaV203을 7 차수의 양에 걸쳐 시리즈로 희석하고 각 희석액을 1:1 부피:부피로 pA5-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 미희석 MaV203과 혼합하여 활성 및 비활성 티로실-tRNA 신세타제를 함유하는 세포의 한정된 비를 생성하였다. 각 비를 위해, 세포의 수가 감소되지만 EcTyrRS-tRNA_CUA/pGADGAL4(T44,R110TAG) 및 pA5-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 세포의 비는 유지되는 두 번째 연속 희석을 실시하였다. 이들 희석액을 SD-Leu,-trp, SD-Leu,-Trp,-URA 및 SD-Leu,-Trp,-His + 50mM 3-AT에 도말하였다. 60시간 후, 각 플레이트 상의 콜로니의 수를 이글 아이 CCD 카메라(스트라타젠)를 이용하여 계수하고, 생존자의 표현형을 X-GAL 베타-갈락토시다제 분석으로 확인하였다. 몇몇 개별 청색 또는 흰색 콜로니로부터의 세포를 분리하여 SD -leu, -trp에서 포화될 때까지 성장시키고 플라스미드 DNA를 표준 방법에 의해 분리하였다. EcTyrRS 변이체의 정체는 DNA 서열 결정에 의해 확인하였다.

음성 선별: 모델 음성 선별은 pA5-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 MaV203을 연속 희석하고 EcTyrRS-tRNA_CUA/pGADGAL4(T44,R110TAG)를 보유하는 MaV203의 고정 밀도와 혼합하는 것을 제외하고는 양성 선별과 유사한 방식으로 실시되었다. 세포를 SD -leu, -trp + 0.1% 5-FOA에 도말하고, 48시간 후 콜로니를 계수하고 전술한 대로 플레이트를 처리하였다.

하기 올리고뉴클레오티드(표 3)는 퀵체인지 돌연변이유발에 의해 부위-지시된 돌연변이를 구성하기 위하여 그들의 역 보체와 함께 이용되었다. 돌연변이의 위치는 진한 글자로 표시된다.

[표 3]

부위-지시된 돌연변이를 구성하기 위해 이용된 올리고뉴클레오티드

실시예 2: 확장된 진핵 유전자 코드

사카로마이세스 세레비제의 유전자 코드에 비천연 아미노산을 첨가하기 위한 일반적이고 신속한 경로가 개시된다. 넌센스 코돈 TAG에 대한 반응으로, 효율적으로 높은 확실성으로 다섯 개의 아미노산을 단백질에 포함시켰다. 이들 아미노산의 측쇄는 케토기를 함유하며, 이는 광범위한 화학적 프로브 및 시약; 구조 연구를 위한 중 원자-함유 아미노산; 및 단백질 상호작용의 세포 연구를 위한 광가교제로 생체외 및 생체내에서 독특하게 변형될 수 있다. 이 방법은 효모에서 단백질 구조 및 기능을 조작하는 능력에 대한 유전자 코드에 의한 제한을 제거할 뿐만 아니라, 다세포 진핵체의 유전자 코드의 체계적인 확장에의 관문을 제공한다.

화학자들이 작은 분자의 구조를 합성하고 조작하기 위한 강력한 방법 및 전략의 어레이를 개발했음에도 불구하고(예, E. J. Corey, & X. -M. Cheng, The Logic of Chemical Synthesis (Wiley-Interscience, New York, 1995) ), 단백질 구조와 기능을 이성적으로 조절하는 능력은 아직 초기이다. 돌연변이유발 방법은 많은 경우에 프로테옴 전체에 걸쳐 일반적인 아미노산의 밀접한 구조적 유사체를 경쟁적으로 포함시키는 것이 가능했던 많은 경우에도 불구하고, 일반 20개 아미노산 빌딩 블록에 제한된다. 예를 들어, K. Kirshenbaum, et al. , (2002), ChemBioChem 3: 235-7; 및, V. Doring et al. , (2001), Science 292: 501-4를 참고한다. 전체 합성(예, B. Merrifield, (1986), Science 232: 341-7 (1986) ), 및 반합성 방법(예, D. Y. Jackson et al. , (1994) Science 266: 243-7; 및, P. E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry 69: 923-60)은 펩티드와 작은 단 백질의 합성을 가능하게 했지만, 10 kDa이 넘는 단백질에서는 유용성이 제한된다. 화학적으로 아실화된 직교 tRNA에 관련되는 생합성 방법은(예, D. Mendel, et al. , (1995), Annual Review of Biophysics and Biomolecular Structure 24: 435-462; 및, V. W. Cornish, et al. (Mar. 31,1995), Angewandte Chemie-International Edition in English 34: 621-633) 생체외에서(예, J. A. Ellman, et al. , (1992), Science 255: 197-200) 그리고 미세주사된 세포에서(예, D. A. Dougherty, (2000), Current Opinion in Chemical Biology 4: 645-52), 보다 큰 단백질내로 비천연 아미노산이 포함되도록 한다. 하지만, 이 과정의 화학양론적 특성은 생성될 수 있는 단백질의 양을 심각하게 제한하였다. 따라서, 상당한 노력에도 불구하고, 단백질의 특성 및 가능하게는 전체 유기체가 20개의 유전적으로 암호화되는 아미노산에 의해(피로라이신 및 셀레노시스테인의 드문 예외를 가지고) 진화동안 제한되었다(예, A. Bock et al. , (1991), Molecular Microbiology 5: 515-20; 및, G. Srinivasan, et al. , (2002), Science 296: 1459-62).

이러한 제한을 극복하기 위하여, 원핵 대장균(대장균)의 단백질 생합성 기계에 새로운 성분을 첨가하였으며(예, L. Wang, et al., (2001), Science 292: 498-500 참고), 이는 생체내에서 유전적으로 암호된 비천연 아미노산을 가능하게 하였다. 새로운 화학적, 물리적 또는 생물학적 특성을 갖는 많은 새로운 아미노산이 앰버 코돈 TAG에 대한 반응으로 효율적이고 선택적으로 단백질내로 포함되었다. 예를 들어, J. W. Chin et al. , (2002), Journal of the American Chemical Society 124: 9026-9027; J. W. Chin, & P. G. Schultz, (2002), ChemBioChem 11: 1135- 1137; J. W. Chin, et al. , (2002), PNAS United States of America 99: 11020-11024: 및, L. Wang, & P. G. Schultz, (2002), Chem. Comm., 1: 1-10를 참고한다. 하지만, 번역 기계는 원핵체와 진핵체 사이에서 잘 보존되지 않으므로, 대장균에 첨가된 생합성 기계의 성분들은 일반적으로 진핵 세포에서 세포 과정을 연구하거나 조작하기 위하여 비천연 아미노산을 단백질내로 부위 특이적으로 포함시키기 위해 이용될 수 없다.

따라서, 진핵 세포에서 유전적으로 암호된 아미노산의 수를 확장시킬 번역 성분을 생성하였다. 사카로마이세스 세레비제는 유용한 모델 진핵체이고, 유전적 조작이 용이하며(예, D. Burke, et al. , (2000), Methods in Yeast Genetics (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY)), 그 번역 기계가 고등 진핵체와 매우 상동성이므로(T. R. Hughes, (2002), Funct. Integr. Genomics 2: 199-211), 초기 진핵 숙주 유기체로서 선택되었다. 에스.세레비제에의 새로운 빌딩 블록의 추가는 독특한 코돈, tRNA, 및 효모 번역 기계의 임의 성분과 교차반응하지 않는 아미노아실-tRNA 신세타제(aaRS)를 필요로 한다(예, Noren et al. , (1989) Science 244: 182 ; Furter (1998) Protein Sci. 7: 419; 및, Liu et al. , (1999) PNAS USA 96: 4780). 하나의 후보 직교 쌍은 대장균으로부터의 앰버 억제자 티로실-tRNA 신세타제-tRNA_CUA 쌍이다(예, H. M. Goodman, et al., (1968), Nature 217: 1019-24; 및, D. G. Barker, et al., (1982), FEBS Letters 150: 419- 23 참고). 대장균 티로실-tRNA 신세타제(TyrRS)는 에스 . 세레비제에서 둘다 유전적 으로 암호될 때 대장균 tRNA_CUA를 효율적으로 아미노아실화하지만, 에스 세레비제 세포질 tRNA는 아미노아실화하지 않는다. 예를 들어, H. Edwards, & P. Schimmel, (1990), Molecular & Cellular Biology 10: 1633-41; 및, H. Edwards, et al. , (1991), PNAS United States of America 88: 1153-6를 참고한다. 또한, 대장균 티로실 tRNA_CUA는 에스 . 세레비제 아미노아실-tRNA 신세타제를 위한 빈약한 기질이지만(예, V. Trezeguet, et al. , (1991), Molecular & Cellular Biology 11:2744-51.), 프로세스되고 핵으로부터 세포질로 배출되며(예, S. L. Wolin, & A. G. Matera, (1999) Genes & Development 13: 1-10) 에스 . 세레비제에서 단백질 번역에서 효율적으로 기능한다. 예를 들어, H. Edwards, & P. Schimmel, (1990) Molecular & Cellular Biology 10: 1633-41; H. Edwards, et al. , (1991), PNAS United States of America 88: 1153-6; 및, V. Trezeguet, et al. , (1991), Molecular & Cellular Biology 11: 2744-51를 참고한다. 더욱이, 대장균 TyrRS는 편집 기작을 가지지 않으며 따라서 tRNA에 연결된 비천연 아미노산을 프루프리드하지 않는다.

직교 TyrRS의 아미노산 특이성을 변화시켜 내인성 아미노산이 아닌 원하는 비천연 아미노산으로 tRNA_CUA를 아미노아실화하도록 하기 위하여, TyrRS의 큰 라이브러리를 생성하고 유전적 선별에 노출시켰다. 바실러스 스테아로써모필러스로부터의 상동성 TyrRS의 결정 구조를 기초로 하여(예, P. Brick, et al. , (1989), Journal of Molecular Biology 208: 83), 결합된 티로신의 아릴 고리의 파라 위치 의 6.5 Å 이내에 있는 이 콜리 TyrRS의 활성 부위내의 다섯 잔기(비. 스테아로써모필러스, 도 7, 패널 A)를 돌연변이시켰다. 예를 들어, 돌연변이의 EcTyrRS 라이브러리를 생성하기 위하여, 돌연변이의 표적이 된 다섯 위치를 먼저 알라닌 코돈으로 전환시켜 A5RS 유전자를 생산하였다. 이것을 유전자내의 독특한 PstI 부위에서 두 플라스미드 사이에서 분할하였다. 라이브러리는 공지된 기법에 의해 개시된 대로 주로 생성되었다(예, Stemmer et al. , (1993) Biotechniques 14: 256-265). 한 플라스미드는 A5RS 유전자의 5' 절반을 함유하며, 다른 플라스미드는 A5RS 유전자의 3' 절반을 함유한다. 돌연변이유발은 전체 플라스미드의 증폭을 위한 올리고뉴클레오티드 프라이머를 이용한 PCR에 의해 각 단편에서 실시되었다. NNK(N = A + G + T + C 그리고 K = G + T) 및 BsaI 제한 엔도뉴클레아제 인식 부위를 함유한 프라이머를 도핑하였다. BsaI을 이용한 분해 및 연결에 의해 두 개의 원형 플라스미드를 얻었으며, 각각은 EcTyrRS 유전자의 절반의 돌연변이 카피를 함유하였다. 이어서 두 플라스미드를 PstI으로 분해하고 연결하여 단일 플라스미드로 조립하여, 전길이 돌연변이 유전자의 조립을 얻었다. 돌연변이 EcTyrRS 유전자를 이 플라스미드로부터 잘라내고 EcoRI과 NotI 부위 사이에서 pA5RS/tRNA_CUA내로 연결시켰다. 라이브러리를 PEG-리튬 아세테이트 방법을 이용하여 에스 . 세레비제 MaV203:pGADGAL4(2TAG)내로 형질전환시켜 ~ 10⁸ 개의 독립 형질전환체를 얻었다.

에스.세레비제의 선별 균주[MaV203: pGADGAL4 (2 TAG) (예, M. Vidal, et al. , (1996), PNAS United States of America 93: 10321-6; M. Vidal, et al., (1996), PNAS United States of America 93: 10315-201 및, Chin et al. , (2003) Chem. Biol. 10: 511) 참고]를 상기 라이브러리로 형질전환시켜 10⁸ 개의 독립적인 형질전환체를 얻고 1 mM 비천연 아미노산의 존재하에서 성장시켰다(도 8, 패널 C). 전사 활성자 GAL4에서 두 개의 허용성 앰버 코돈의 억제는 전길이 GAL4의 생산 및 GAL4-반응성 HIS3, URA3 및 lacZ 리포터 유전자의 전사 활성화를 야기한다(도 8, 패널 A). 예를 들어, 허용성 코돈은 Gal4의 T44와 R110을 위한 것이다. 우라실이 결핍되거나(-ura) 또는 20 mM 3-아미노트리아졸(예, G. M. Kishore, & D. M. Shah,(1988), Annual Review of Biochemistry 57,627-63) (3-AT, His3 단백질의 경쟁적 억제자)을 함유하고 히스티딘이 결핍된(-his) 배지에서 HIS3과 URA3의 발현은 활성 aaRS-tRNA_CUA 쌍을 발현하는 클론이 양성 선별되도록 한다. 만일 돌연변이 TyrRS가 아미노산으로 tRNA_CUA를 충전시키면, 세포는 히스티딘과 우라실을 생합성하며 생존한다. 생존 세포는 3-AT와 비천연 아미노산의 부재하에서 증폭되어, 비천연 아미노산을 선택적으로 포함하는 세포로부터 전길이 GAL4를 제거한다. 앰버 코돈에 반응하여 내인성 아미노산을 포함하는 클론을 제거하기 위하여, 세포를 0.1% 5-플루오로오트산(5-FOA)를 함유하지만 비천연 아미노산이 결핍된 배지에서 성장시켰다. 천연 아미노산으로 GAL4 앰버 돌연변이를 억제한 결과, URA3을 발현하는 세포는 5-FOA를 독성 생성물로 전환시켜 세포를 죽인다. 예를 들어, J. D. Boeke, et al.,(1984), Molecular & General Genetics 197: 345-6를 참고한다. 생존 클론을 비천연 아미노산 존재하에서 증폭시키고 다시 양성 선별한다. lacZ 리포터는 활성 및 비활성 신세타제-tRNA 쌍이 비색계에 의해 구별되도록 한다(도 8, 패널 B).

이 접근법을 이용하여, 구별되는 입체 및 전자 특성을 갖는 다섯 개의 새로운 아미노산(도 7, 패널 B)을 에스 . 세레비제의 유전자 코드에 독립적으로 첨가하였다. 이들 아미노산은 p-아세틸-L-페닐알라닌(1), p-벤조일-L-페닐알라닌(2), p-아지도-L-페닐알라닌(3), O-메틸-L-티로신(4), 및 p-요오도-L-페닐알라닌(5)(도 7, 패널 B에서 숫자로 표시됨)을 포함한다. p-아세틸-L-페닐알라닌의 케토 기능기의 독특한 반응성은 생체외 및 생체내에서 하이드라진- 또는 하이드록실아민-함유 시약의 어레이로 단백질을 선택적으로 변형시키도록 한다(예, V. W. Cornish, et al. , (Aug. 28,1996), Journal of the American Chemical Society118 :8150-8151 ; 및, Zhang, Smith, Wang, Brock, Schultz, 준비중). p-요오도-L-페닐알라닌의 중 원자는 X-선 구조 데이터를 추적하는 데 유용함을 입증할 수 있다(다중파장 변칙 회절의 사용으로). p-벤조일-L-페닐알라닌 및 p-아지도-L-페닐알라닌의 벤조페논 및 페닐아지드 측쇄는 단백질의 효율적인 생체내 및 생체외 광가교를 허용한다(예, Chin et al. , (2002)J. Am. Chem. Soc., 124: 9026; Chin and Schultz, (2002) Chem. Bio. Chem. 11: 1135; 및, Chin et al. , (2002) PNAS, USA 99: 11020). O-메틸-L-티로신의 메틸기는 핵 자기 공명 및 진동 분광법을 사용하여 국소 구조 및 동력학의 프로브로서 방사성 표지된 메틸기로 쉽게 치환될 수 있다. 3회의 선별(양성-음성-양성) 후, -ura에서 또는 20 mM 3-AT - his 배지에서의 생존이 선택된 비천연 아미노산의 첨가에 엄격하게 의존하는 몇몇 콜로니를 분리하였다. 도 8, 패널 D 참고. 동일한 클론은 1 mM 비천연 아미노산의 존재하에서만 x-gal에서 청색이었 다. 이들 실험은 관찰된 표현형이 발생된 아미노아실-tRNA 신세타제-tRNA_CUA 쌍 및 그들의 짝 아미노산의 조합으로부터 생김을 입증한다(표 4 참고).

예를 들어, 돌연변이 신세타제를 선별하기 위하여, 세포(~ 10⁹)를 4시간동안 액체 SD-leu, -trp + 1 mM 아미노산에서 성장시켰다. 이어서 세포를 원심분리에 의해 수집하고, 0.9% NaCl에 재현탁시키고, SD-leu, -trp,-his + 20 mM 3-AT, + 1mM 비천연 아미노산 또는 SD-leu, -trp,-ura, + 1 mM 비천연 아미노산에 도말하였다. 30℃에서 48시간 내지 60 시간 후, 세포를 플레이트로부터 긁어 액체 SD-leu, -trp에 넣고 30 ℃에서 15시간동안 성장시켰다. 세포를 원심분리에 의해 수집하고, 0.9% NaCl에 재현탁시키고, SD-leu, -trp + 0.1 % 5-FOA에 도말하였다. 30℃에서 48시간 후, 세포를 플레이트로부터 긁어 액체 SD-leu, -trp + 1mM 비천연 아미노산에 넣고 15 시간 동안 성장시켰다. 세포를 원심분리에 의해 수집하고, 0.9% NaCl에 재현탁시키고, SD -leu, -trp -his + 20 mM 3-AT, +1 mM 비천연 아미노산 또는 SD -leu, -trp, -ura, + 1 mM 비천연 아미노산에 도말하였다. 선별된 세포의 표현형을 스크린하기 위하여, 각 선별로부터의 콜로니(192)를 SD -leu, -trp의 0.5 mL을 함유하는 96 웰 블록의 웰로 옮기고 24시간동안 30 ℃에서 성장시켰다. 글리세롤(50% v/v; 0.5 mL)을 각 웰에 첨가하고, 세포 레플리카(replica)를 1 mM 비천연 아미노산의 존재 또는 부재하에서 아가(SD-leu, -trp ; SD-leu, -trp,-his, + 20 mM 3-AT; SD-leu, -trp,- ura)상에 도말하였다. X-Gal 분석을 아가로즈 오버레이 방법을 이용하여 SD -leu, -trp 플레이트에서 실시하였다.

관찰된 표현형이 직교 TyrRS/tRNA 쌍에 의한 비천연 아미노산의 부위 특이적 포함으로 인한 것임을 추가로 입증하기 위하여, 각 비천연 아미노산을 함유하는 사람 수퍼옥사이드 디스무타제 1(hSOD)의 돌연변이(예, H. E. Parge, et al. , (1992), PNAS United States of America 89: 6109-13)를 생성시키고 특징을 규명하였다.

예를 들어, C-말단 헥사히스티딘 태그를 암호화하는 DNA의 첨가, 및 사람 수퍼옥사이드 디스무타제 유전자에서 Trp33을 위한 코돈의 앰버 코돈으로의 돌연변이를 주형으로 PS356(ATCC)을 이용한 오버랩 PCR에 의해 실시하였다. hSOD(Trp33 TAG)HIS를 pYES2.1(미국 캘리포니아주 칼스바드에 소재하는 인비트로겐)로부터의 GAL1 프로모터와 CYC1 종결자 사이에 클로닝하였다. pECTyrRS-tRNA_CUA 유래 플라스미드상의 돌연변이 신세타제 및 tRNA 유전자는 pYES2.1hSOD(Trp 33 TAG)HIS와 함께 균주 InvSc(인비트로겐) 내로 동시형질전환되었다. 단백질 발현을 위하여, 세포를 SD -trp, -ura +라피노즈에서 성장시키고 갈락토스를 첨가하여 0.5의 OD₆₆₀에서 발현을 유도하였다. HSOD 돌연변이를 Ni-NTA 크로마토그래피(퀴아젠, 미국 캘리포니아주 발렌시아 소재)에 의해 정제하였다.

위치 33에서 앰버 코돈을 함유하는 유전자로부터 헥사-히스티딘-태그된 hSOD의 생산은 엄격하게 p-아세틸PheRS-1-tRNA_CUA 및 1 mM p-아세틸-L-페닐알라닌 (밀도계에 의해 < 0.1%, 어느 한 성분의 부재하에서)에 의존적이었다(도 9 참고). p-아세틸-L-페닐알라닌을 함유하는 전길이 hSOD를 50 ng/ml의 수율로 정제하였으며(예, Ni-NTA 친화성 크로마토그래피에 의해), 대장균 TyrRStRNA_CUA를 함유하는 세포로부터 정제된 것과 비교할만하다. 비교를 위하여, 야생형 hSODHIS는 동일한 조건하에서 250 ng/ml의 수율로 정제될 수 있다.

도 9는 비천연 아미노산을 유전적으로 암호화하는 에스 . 세레비제에서 hSOD(33TAG)HIS의 단백질 발현을 예시한다(도 7, 패널 B에서 예시되며 도 7, 패널 B에서 그들의 번호에 의해 도 9에서 표시됨). 도 9의 상부는 번호로 표시된 비천연 아미노산의 존재(+) 및 부재(-)하에서 효모로부터 정제된 hSOD의 SDS-폴리아크릴아미드 겔 전기영동을 예시하며, 이것은 쿠마시를 이용한 도 7, 패널 B 염색에서 예시된 비천연 아미노산에 해당한다. 세포는 표시된 아미노산에 대해 선별된 돌연변이 신세타제-tRNA 쌍을 함유한다. 도 9의 중심부는 hSOD에 대한 항체로 프로브된 웨스턴 블롯을 예시한다. 도 9의 바닥부는 C-말단 His6 태그에 대한 항체로 프로브된 웨스턴 블롯을 예시한다.

포함된 아미노산의 정체는 돌연변이 단백질의 트립신 분해물을 액체 크로마토그래피 및 탠덤 질량 분광계에 노출시켜 결정하였다. 예를 들어, 질량 분광법의 경우, 단백질 밴드는 콜로이드 쿠마시 염색으로 가시화하였다. 야생형 및 돌연변이 SOD에 해당하는 겔 밴드를 폴리아크릴아미드 겔로부터 잘라내고, 1.5 mm 사각형으로 자르고, 환원시키고 알킬화하여, 개시된 대로 트립신 가수분해시켰다. 예를 들어, A. Shevchenko, et al., (1996), Analytical Chemistry 68, 850-858를 참고한다. 비천연 아미노산을 함유하는 트립신 펩티드를 LCQ 이온 트랩 질량 분광계를 이용하여 나노유동 역상 HPLC/μESI/MS에 의해 분석하였다. 액체 크로마토그래피 탠 덤 질량 분광법(LC-MS/MS) 분석을 나노스프레이 HPLC(Agilent 1100 시리즈)를 갖춘 피니간 LCQ 데카 이온 트랩 질량 분광계(써모 피니간)에서 실시하였다. 예, 도 10, 패널 A-H 참고.

비천연 아미노산(Y*로 표시됨)을 함유하는 펩티드 Val-Y*-Gly-Ser-Ile-Lys (서열 번호 87)의 단일 및 이중 하전된 이온에 해당하는 전구체 이온을 분리하고 이온 트랩 질량 분광계로 단편화하였다. 단편 이온 질량을 명확하게 할당하여, p-아세틸-L-페닐알라닌의 부위 특이적 포함을 확인하였다(도 10, 패널 A 참고). p-아세틸-L-페닐알라닌 대신 티로신 또는 다른 아미노산의 표시는 관찰되지 않았으며, 최소 99.8% 포함 순도가 펩티드 스펙트럼의 시그널 대 노이즈 비로부터 얻어졌다. 단백질 발현에서 유사한 확실성 및 효율은 hSOD내로 p-벤조일-L-페닐알라닌, p-아지도-L-페닐알라닌, 0-메틸-L-티로신 또는 p-요오도-L-페닐알라닌을 포함시키기 위해 p-벤조일PheRS-1, p-아지도PheRS-1, O-meTyrRS-1, 또는 p-요오도PheRS-1를 이용하였을 때 관찰되었다(도 9, 및 도 10, 패널 A-H 참고). 실험에서, p-아지도-L-페닐알라닌은 샘플 제제에서 p-아미노-L-페닐알라닌으로 환원되며, 후자는 질량 스펙트럼에서 관찰된다. 환원은 p-아지도-L-페닐알라닌을 함유하는 정제된 SOD의 화학적 유도에 의해 생체내에서 발생하지 않는다. 대조 실험에서는, 트립토판, 티로신 및 류신을 위치 33에서 함유하는 헥사-히스티딘-태그된 hSOD를 제조하고 질량 분광법에 노출시켰다(도 10, 패널 F, G 및 H 참고). 아미노산 33을 함유하는 이온은 이들 샘플의 질량 스펙트럼에서 명확히 보였다.

에스 . 세레비제의 유전자 코드에의 다섯 개의 비천연 아미노산의 독립적인 첨 가는 본 방법의 일반성을 입증하며, 스핀-표지된, 금속-결합, 또는 광이성체화 아미노산을 비롯한 다른 비천연 아미노산에 적용될 수 있음을 제안한다. 이 방법은 새로운 또는 개선된 특성을 갖는 단백질의 생성을 허용할 뿐만 아니라 효모에서 단백질 기능의 조절을 촉진할 수 있다. 더욱이, 포유류 세포에서, 대장균 티로실-tRNA 신세타제는 비. 스테아로써모필러스 tRNA_CUA와 직교 쌍을 형성한다. 예를 들어, Sakamoto et al. , (2002) Nucleic Acids Res. 30: 4692를 참고한다. 따라서, 고등 진핵체의 유전자 코드에 비천연 아미노산을 추가하기 위하여 효모에서 개발된 아미노아실-tRNA 신세타제를 이용할 수 있다.

[표 4]

선별된 아미노아실-tRNA 신세타제의 서열

a. 이들 클론은 또한 Asp165Gly 돌연변이를 함유한다.

실시예 3: 새로운 반응성을 갖는 아미노산의 진핵체의 유전자 코드에의 첨가

[3+2] 고리화첨가에 기초한 단백질에의 생물접합의 부위 특이적이고, 신속하며, 신뢰성있고 비가역적인 방법이 입증된다. 매우 선택적인 방식으로 생리적 조건하에서 단백질을 변형시키는 화학 반응이 매우 필요하다. 예를 들어, Lemineux, & Bertozzi, (1996) TIBTECH, 16: 506-513를 참고한다. 단백질의 선택적 변형을 위해 현재 이용되는 대부분의 반응은 친핵 및 친전자 반응 파트너 사이의 공유 결합 형성, 예, α-할로케톤과 히스티딘 또는 시스테인 측쇄의 반응에 관련된다. 이들 경우에서 선택성은 단백질의 친핵성 잔기의 수와 접근성에 의해 결정된다. 합성 또는 반합성 단백질의 경우, 비천연 케토-아미노산과 하이드라지드 또는 아미노옥시 화합물과의 반응과 같은 다른 보다 선택적인 반응이 이용될 수 있다. 예를 들어, Cornish, et al. , (1996) Am. Chem.Soc., 118: 8150-8151; 및, Mahal, et al. , (1997) Science, 276:1125-1128를 참고한다. 최근에는, 변경된 아미노산 특이성을 갖는 직교 tRNA-신세타제 쌍을 이용하여 박테리아와 효모에서, 케톤 함유 아미노산(예, Wang, et al. , (2003) Proc. Natl. Acad. Sci., 100: 56-61; Zhang, et al. , (2003) Biochemistry, 42: 6735-6746; 및, Chin, et al., (2003) Science(in press) 참고)을 비롯한 비천연 아미노산을 유전적으로 암호화하는 것이 가능해졌다(예, Wang, et al. , (2001) Science 292: 498-500; Chin, et al. , (2002) Am. Chem. Soc. 124: 9026-9027; 및, Chin, et al. , (2002) Proc. Natl. Acad.Sci., 99: 11020-11024 참고), 이 방법은 형광단, 가교제 및 세포독성 분자를 비롯한 많은 시약으로 사실상 모든 단백질을 선택적으로 표지화하는 것을 가능하게 만들었다.

단백질의 선택적 변형을 위한 매우 효율적인 방법이 개시되며, 이는 아지드 또는 아세틸렌 함유 비천연 아미노산을 앰버 넌센스 코돈 TAG에 대한 반응으로 단백질내로 유전적으로 포함시키는 것에 관련된다. 이들 아미노산 측쇄는 이어서 각각 알키닐(아세틸렌) 또는 아지드 유도체를 이용하여 후이스겐 [3+2] 고리화첨가 반응에 의해(예, Padwa, A. in Comprehensive Organic Synthesis. Vol. 4, (1991) Ed. Trost, B. M. , Pergamon, Oxford, p. 1069-1109; 및, Huisgen, R. in 1, 3-Dipolar Cvcloaddition Chemistry, (1984) Ed. Padwa, A. , Wiley, New York, p. 1-176 참고) 변형될 수 있다. 이 방법은 친핵 치환보다는 고리화첨가에 관련되므로, 단백질은 극히 높은 선택성으로 변형될 수 있다(이용될 수 있는 다른 방법은 테트라시스테인 모티프를 갖는 비스아르세닉 화합물에서의 리간드 교환이며, 예를 들어, Griffin, et al. , (1998) Science 281: 269-272를 참고한다). 이 반응은 촉매량의 Cu(I)를 반응 혼합물에 첨가하여 우수한 위치선택성(1,4 > 1,5)으로 수성 조건에서 실온에서 실시될 수 있다. 예를 들어, Tornoe, et al. , (2002) Ore. Chem. 67: 3057-3064; 및, Rostovtsev, et al. , (2002) Angew. Chem. Int. Ed. 41: 2596- 2599를 참고한다. 사실, 핀과 동료들은 본래의 광저기 모자이크 바이러스의 표면상에서 이 아지드-알킨[3+2] 고리화첨가가 실시될 수 있음을 보여주었다. Wang, et al., (2003) J. Am. Chem.Soc., 125: 3192-3193를 참고한다. 아지도기의 단백질내로의 친전자성 도입 및 후속 [3+2] 고리화첨가의 다른 예를 위해서는 Speers, et al. , (2003) J. Am. Chem.Soc., 125:4686-4687를 참고한다.

알키닐(아세틸렌) 또는 아지드 기능기를 독특한 부위에서 진핵 단백질내로 선택적으로 도입하기 위해, 생성된 직교 TyrRS/tRNA_CUA 쌍을 아세틸렌 및 아지도 아미노산, 도 11의 1 및 2 를 유전적으로 암호화하는 효모에서 생성시켰다. 생성된 단백질은 생리적 조건하에서 후속되는 고리화첨가 반응에서 형광단으로 효율적으로 그리고 선택적으로 표지될 수 있다.

앞서, 대장균 티로실 tRNA-tRNA 신세타제 쌍은 효모에서 직교로 입증되었으며, 즉, tRNA 또는 신세타제는 내인성 효모 tRNA 또는 신세타제와 교차 반응하지 않는다. 예를 들어, Chin, et al. , (2003) Chem. Biol. , 10: 511- 519를 참고한다. 이 직교 tRNA-신세타제 쌍은 TAG 코돈에 대한 반응으로 많은 비천연 아미노산을 효모에서 선택적이고 효율적으로 포함시키기 위해 이용되어 왔다(예, Chin, et al. , (2003) Science, 참고). 도 11의 아미노산 1 또는 2를 수용하기 위해 대장균 티로실-tRNA 신세타제의 아미노산 특이성을 변화시키기 위해, ~ 10⁷ 돌연변이의 라이브러리를 Tyr³⁷, Asn¹²⁶, Asp¹⁸², Phe¹⁸³, 및 Leu¹⁸⁶ 를 위한 코돈을 임의화시켜 생성하였다. 이들 다섯 잔기는 비. 스테아로써모필러스로부터의 상동성 신세타제의 결정 구조에 기초하여 선택된다. 구체적인 아미노산이 기질로서 작용하기 위한 신세타제를 얻기 위해, 전사 활성자 GAL4를 위한 유전자의 Thr⁴⁴ 및 Arg¹¹⁰ 를 위한 코돈이 앰버 넌센스 코돈(TAG)으로 전환된 선별 도식을 이용하였다. 예, Chin, et al. , (2003) Chem. Biol. , 10: 511- 519를 참고한다. MaV203: pGADGAL4 (2TAG) 효모 균주에서 이들 앰버 코돈의 억제는 전길이 GAL4의 생산을 야기하며(예, Keegan, et al., (1986) Science, 231: 699-704; 및, Ptashne, (1988) Nature, 335: 683-689 참고), 이것은 다시 HIS3 및 URA3 리포터 유전자의 발현을 유도한다. 후자 유전자 생성물은 히스티딘 및 우라실 영양요구성을 보충하여 도 11의 1 또는 2의 존재하에서 활성 신세타제 돌연변이를 보유한 클론이 선별되도록 한다. 내인성 아미노산을 충전하는 신세타제는 도 11의 1 또는 2가 결핍되지만 URA3에 의해 독성 생성물로 전환되는 5-플루오로오로트산을 함유하는 배지에서 성장시켜 제거한다. 상기 라이브러리를 3회의 선별(양성, 음성, 양성)을 통과시켜, 도 11의 1에 대해 선택적인 신세타제(pPR-EcRS1-5) 및 표 8에서 나타난 도 11의 2에 대해 선택적인 신세타제(pAZ-EcRS1-6)을 확인하였다.

모든 신세타제는 보존된 Asn126을 비롯하여 강한 서열 유사성을 나타내어, 이 잔기를 위해 중요한 기능적 역할을 제안한다. 놀랍게도, 도 11의 1과 2에 결합하도록 발생된 신세타제 pPR-EcRS-2 및 pAZ-EcRS-6는 동일한 서열로 수렴되었다(Tyr³⁷→Thr³⁷, Asn¹²⁶→ Asn¹²⁶, Asp¹⁸²→Ser¹⁸², 및 Phe¹⁸³ → Ala¹⁸³, Leu¹⁸⁶→ Leu¹⁸⁶). 결합된 티로신의 페놀성 하이드록시기와 Tyr³⁷ 및 Asp¹⁸² 사이의 두 수소 결합은 각각 Thr과 Ser으로의 돌연변이에 의해 파괴된다. Phe¹⁸³은 Ala로 전환되어, 가능하게는 비천연 아미노산의 수용을 위한 더 많은 공간을 제공한다. 이 신세타제(및 기타 신세타제)가 기질로서 어느 아미노산을 수용하는 지를 확인하기 위하여, 신세타제 플라스미드를 보유한 선별된 균주를 우라실이 없지만(동일한 결과가 히스티딘이 없는 배지에 대해 얻어짐) 도 11의 1 또는 2로 보충된 배지에서 성장시켰다. 성장 결과는 다섯 개의 알킨 신세타제 중 네 개가 두 비천연 아미노산을 그것의 tRNA에 부하할 수 있음을 밝혔다. 아지도 신세타제는 단지 pAZ-EcRS-6(pPR-EcRS-2와 동일)만이 도 11의 1과 2 둘다로 그 tRNA를 아미노아실화할 수 있으므로 더욱 선택적인 것으로 보인다. 도 11의 1 또는 2의 부재하에서 성장이 검출되지 않았다는 사실은 신세타제가 기질로서 20개의 일반 아미노산 중 어느 것도 받아들이지 않음을 제안한다. 도 14 참고.

모든 추가 실험을 위하여 pPR-EcRS-2(pAZ-EcRS-6)를 이용하여, 발현 균주를 함유한 배지에 도 11의 1 또는 2를 첨가하여 비천연 아미노산이 포함될 지를 조절할 수 있었다. 단백질 생산을 위하여, C-말단 6X His 태그에 융합된 사람 수퍼옥사이드 디스무타제-1(SOD)의 허용성 잔기 Trp³³을 위한 코돈을 TAG로 돌연변이시켰다. 예를 들어, 사람 수퍼옥사이드 디스무타제(Trp³³TAG)HIS를 pYES2.1(미국 캘리포니아주 칼스바드에 소재하는 인비트로겐)로부터의 GAL1 프로모터와 CYC1 종결자 사이에 클로닝하였다. 돌연변이 신세타제 및 pECTyrRS-tRNA_CUA 유래 플라스미드상의 tRNA 유전자는 pYES2.1SOD(Trp³³ TAG)HIS와 함께 균주 InvSc(인비트로겐) 내로 동시형질전환되었다. 단백질 발현을 위하여, 세포를 SD -trp, -ura +라피노즈에서 성장시키고 갈락토스를 첨가하여 0.5의 OD₆₆₀에서 발현을 유도하였다. 단백질을 도 11의 1 또는 2 1 mM의 존재 또는 부재하에서 발현시키고 Ni-NTA 크로마토그래피(퀴아젠, 미국 캘리포니아 발렌시아 소재)에 의해 정제하였다.

SDS-PAGE 및 웨스턴 블롯에 의한 분석 결과 도 11의 1 또는 2의 부재하에서의 단백질 발현에 밀도계 비교하여 판단할 때 99%를 넘는 확실성의 비천연 아미노산 의존성 단백질 발현이 밝혀졌다. 도 12 참고. 포함된 아미노산의 정체를 확인하기 위하여, 트립신 분해물을 액체 크로마토그래피 및 탠덤 질량 분광법에 노출시켰다.

예를 들어, 야생형 및 돌연변이 hSOD를 니켈 친화성 컬럼을 이용하여 정제하고 콜로이드 쿠마시 염색에 의해 단백질 밴드를 가시화하였다. 야생형 및 돌연변이 SOD에 해당하는 겔 밴드를 폴리아크릴아미드 겔로부터 잘라내고, 1.5 mm 사각형으로 자르고, 환원시키고 알킬화하여, 개시된 대로 트립신 가수분해시켰다. 예를 들어, A. Shevchenko, et al., (1996), Analytical Chemistry 68, 850-858를 참고한다. 비천연 아미노산을 함유하는 트립신 펩티드를 LCQ 이온 트랩 질량 분광계를 이용하여 나노유동 역상 HPLC/μESI/MS에 의해 분석하였다. 도 15, 패널 A와 B 참고. 액체 크로마토그래피 탠덤 질량 분광법(LC-MS/MS) 분석을 나노스프레이 HPLC(Agilent 1100 시리즈)를 갖춘 피니간 LCQ 데카 이온 트랩 질량 분광계(써모 피니간)에서 실시하였다.

비천연 아미노산(Y*로 표시됨)을 함유하는 펩티드 VY*GSIK (서열 번호 87)의 단일 및 이중 하전된 전구체 이온에 해당하는 전구체 이온을 분리하고 이온 트랩 질량 분광계로 단편화하였다. 단편 이온 질량을 명확하게 할당하여, 각 비천연 아미노산의 부위 특이적 포함을 확인하였다. LC MS/MS는 이 위치에서 천연 아미노산의 포함을 나타내지 않았다. 모든 돌연변이를 위한 펩티드의 시그널 대 노이즈 비는 1000을 초과하여, 99.8%보다 우수한 포함 확실성을 제안하였다. 도 15, 패널 A와 B 참고.

작은 유기 분자가 아지드-알킨[3+2] 고리화첨가 반응에 의해 단백질에 접합될 수 있음을 입증하기 위하여, 아세틸렌기 또는 아지도기를 함유하며 댄실 또는 플루오르세인 형광단을 보유한 도 13, 패널 A에 나타난 염료 3-6을 합성하였다(여 기의 실시예 5 참고). 고리화첨가 자체는 2 mM의 도 13, 패널 A에 나타난 3-6, 1 mM CuSO₄, 및 ~ 1 mg 구리선의 존재하에서 포스페이트 완충액(PB)중의 0.01 mM 단백질로 37 ℃에서 4시간동안 실시하였다. (도 13, 패널 B 참고).

예를 들어, PB 완충액(pH = 8)중의 단백질 45 ㎕에 1 ㎕의 CuSO₄(물중의 50 mM), 2 ㎕의 염료(에탄올중의 50 mM), 2 ㎕의 트리스(1-벤질-1H-[1,2,3]트리아졸-4-일메틸)아민(DMSO중의 50 mM), 및 Cu 선을 첨가하였다. 실온 또는 37 ℃에서 4시간 또는 4 ℃에서 밤새 후, 450 ㎕ H20를 첨가하고 혼합물을 투석막(10 kDa 컷오프)을 통과해 회전시켰다. 원심분리에 의해 2 x 500 ㎕로 상등액을 세척한 후, 용액을 50 ml 부피로 만들었다. 샘플 20 ml을 SDS-PAGE로 분석하였다. 때때로 H₂0/MeOH/AcOH (5: 5: 1)에 밤새 담궈서 나머지 염료를 겔로부터 제거할 수 있다. 환원제로서 트리스(카르복시에틸)포스핀의 사용은 일반적으로 덜 효율적인 표지화를 야기한다. 초기의 관찰(예, Wang, Q. et al. , (2003) J. Am. Chem. Soc. 125: 3192- 3193)과 대조적으로, 트리스(트리아졸일)아민 리간드의 존재 또는 부재는 반응의 결과에 큰 영향을 갖지 않았다.

투석 후, 표지된 단백질을 SDS-PAGE에 의해 분석하고, 도 13, 패널 A에서 나타난 댄실 염료 3-4(λex = 337 nm, λem = 506 nm) 의 경우에는 밀도계 또는 도 13, 패널 A에 나타난 플루오르세인 염료 5-6의 경우에는(λex = 483 nm, λem = 516 nm) 포스포르영상기를 이용하여 인-겔 영상화시켰다. 예를 들어, Blake, (2001) Curr. Opin. Pharmacol., 1: 533-539; Wouters, et al., (2001) Trends in Cell Biology 11: 203-211; 및, Zacharias, et al., (2000) Curr. Opin. Neurobiol., 10: 416-421를 참고한다. 표지된 단백질은 형광단의 부위 특이적인 부착을 나타내는 트립신 분해물의 LC MS/MS 분석에 의해 특성을 밝혔으며 전환율은 평균 75%였다(예, 도 13, 패널 A로 나타난 5 또는 6으로 표지된 SOD를 위한 A₂₈₀/A₄₉₅ 값의 비교에 의해 결정됨). 이 생물접합의 선택성은 도 13, 패널 A에 나타난 3 및 알킨 단백질 또는 도 13, 패널 A에 나타난 4 및 아지도 단백질 사이에 관찰가능한 반응이 없다는 사실에 의해 확인된다.

[표 8]

1을 위해 선별된 pPR-EcRS 및 2를 위해 선별된 pAZ-EcRS(도 11에 나타남)

실시예 4: 알킨 아미노산의 합성

본 발명의 한 태양에서, 본 발명은 알키닐 아미노산을 제공한다. 알키닐 아미노산의 구조의 예는 화학식 IV에 의해 예시된다:

알킨 아미노산은 일반적으로 화학식 IV의 구조를 가지며, 이때 R₁은 20개 천연 아미노산 중 하나에 사용되는 치환기이며 R₂는 알키닐 치환기이다. 예를 들어, 도 11에서 1은 파라-프로파길옥시페닐알라닌의 구조를 예시한다. p-프로파길옥시페닐알라닌은 예를 들어, 하기에 개요된 대로 합성될 수 있다. 이 구체예에서, p-프로파길옥시페닐알라닌의 합성은 시판되는 N-Boc-티로신으로부터 시작하는 3 단계로 완성될 수 있다.

예를 들어, N-tert-부톡시카르보닐-티로신(2 g, 7 mmol, 1 당량) 및 K₂C0₃ (3 g, 21 mmol, 3 당량)을 무수 DMF(15 mL)에 현탁시켰다. 프로파길 브로마이드(2.1 ml, 21 mmol, 3 당량, 톨루엔중의 80% 용액)를 천천히 첨가하고 반응 혼합물을 실온에서 18시간동안 교반하였다. 물(75 ml) 및 Et₂0 (50 mL)을 첨가하고, 층을 분리하고 수성 상을 Et₂0 (2 x 50 mL)로 추출하였다. 합쳐진 유기층을 건조시키고(MgSO₄) 감압하에서 용매를 제거하였다. 생성물을 황색 오일로 얻었으며(2.3 g, 91%) 추가 정제 없이 다음 단계에서 이용하였다. Boc-보호된 생성물은 하기에서 화학 구조 8로 예시된다:

8

2-tert-부톡시카르보닐아미노-3-[4-(프롭-2-이닐옥시)페닐]-프로피온산 프로파길 에스테르

아세틸 클로라이드(7 ml)를 0 ℃의 메탄올(60 ml)에 주의깊게 첨가하여 MeOH중의 무수 HCl의 5 M 용액을 얻었다. 이전 단계의 생성물(2 g, 5.6 mmol)을 첨가하고 반응물을 주위 온도로 가온시키면서 4시간동안 교반하였다. 감압하에서 휘발물을 제거한 후, 황색 고체(1.6 g, 98%)(화학 구조 9 참고)를 얻어 다음 단계에 직접 이용하였다.

9

2-아미노-3-[4-(프롭-2-이닐옥시)페닐]-프로피온산 프로파길 에스테르

이전 단계로부터의 프로파길 에스테르(1.6 g, 5.5 mmol)를 수성 2N NaOH(14 ml)과 MeOH(10 ml)의 혼합물에 용해시켰다. 실온에서 1.5 시간 교반 후, 농축 HCl을 첨가하여 pH를 7로 조절하였다. 물(20 ml)을 첨가하고 혼합물을 밤새 4℃에서 유지하였다. 침전물을 여과하고, 차가운 물로 세척하고, 진공에서 건조시켜, 도 11의 1(2-아미노-3-페닐프로피온산(1))(p-프로파길옥시페닐알라닌으로 알려짐) 1.23 g(90%)을 백색 고체로 얻었다. ¹H NMR (400MHz,D₂0) (D₂0 중의 포타슘 염)

[C₁₂H₁₃NO₃ (M+1)은 220.0968을 필요로 함].

실시예 5: [3+2] 고리화첨가를 통해 비천연 아미노산을 갖는 단백질에 분자 첨가하기

한 태양에서, 본 발명은 추가의 치환 분자에 연결된 비천연 아미노산을 포함하는 단백질의 관련 조성물 및 방법을 제공한다. 예를 들어, 추가의 치환기는 [3+2] 고리화첨가를 통해 비천연 아미노산에 첨가될 수 있다. 예를 들어, 도 16을 참고한다. 예를 들어, 원하는 분자(예, 알킨 삼중 결합 또는 아지도 기와 같은 제 2 반응성기를 포함)의, 비천연 아미노산을 가진 단백질(아지도 기 또는 삼중 결합과 같은 제 1 반응성 기를 가짐)에의 [3+2] 고리화첨가는 [3+2] 고리화첨가 반응을 위한 공개된 조건을 따라 이루어질 수 있다. 예를 들어, PB 완충액(pH = 8)중의 비천연 아미노산 포함 단백질은 CuSO₄, 원하는 분자, 및 Cu 선에 첨가된다. 혼합물을 항온처리(실온 또는 37 ℃에서 4시간 또는 4 ℃에서 밤새 후)한 후, H₂0를 첨가하고 투석막을 통해 혼합물을 여과한다. 예를 들어, 겔 분석에 의해 첨가에 대해 샘플을 분석할 수 있다.

그러한 분자의 예는 예를 들어, 도 13, 패널 A의 식 3,4,5, 및 6의 구조를 갖는 분자와 같은, 삼중 결합 또는 아지도 기를 갖는 분자를 포함하며 이에 한정되지 않는다. 더욱이, 삼중 결합 또는 아지도 기는 중합체(예, 폴리(에틸렌 글리콜) 및 유도체), 가교제, 추가의 염료, 광가교제, 세포독성 화합물, 친화성 라벨, 바이오틴, 당류, 수지, 비드, 제 2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조 인자, 지방산, 탄수화물, 폴리뉴클레오티드(예, DNA, RNA 등) 등과 같은 다른 대상 분자의 구조내로 포함될 수 있으며, 이는 또한 [3+2] 고리화첨가에 이용될 수 있다.

본 발명의 한 태양에서, 도 13, 패널 A의 식 3,4,5,또는 6을 갖는 분자는 후술하는 대로 합성될 수 있다. 예를 들어, 도 13, 패널 A의 3 및 화학 구조 3에 나타난 알킨 염료는 0 ℃의 CH₂Cl₂(10 ml)중의 댄실 클로라이드 (500 mg, 1.85 mmol, 1 당량) 및 트리에탄올아민(258 ㎕, 1.85 mmol, 1 당량)의 용액에 프로파길아민(250 ㎕, 3.71 mmol, 3 당량)을 첨가하여 합성되었다. 1시간 동안 교반한 후, 반응 혼합물을 실온으로 가온하고 추가 시간동안 교반하였다. 휘발물을 진공에서 제거하고 조 생성물을 실리카겔에서의 크로마토그래피에 의해 정제하여(Et₂0/헥산 = 1 : 1) 황색 고체의 도 13, 패널 A의 3을 얻었다. 분석 데이터는 문헌에 보고된 것과 동일하다. 예를 들어, Bolletta, F et al. , (1996) Organometallics 15: 2415-17를 참고한다. 본 발명에 이용될 수 있는 알킨 염료의 구조의 예는 화학 구조 3에 나타난다:

도 13, 패널 A의 4 및 하기 화학 구조 4에 나타난 아지도 염료는 0 ℃의 CH₂Cl₂(10 ml)중의 댄실 클로라이드 (500 mg, 1.85 mmol, 1 당량) 및 트리에탄올아민(258 ㎕, 1.85 mmol, 1 당량)의 용액에 3-아지도프로필아민(Carboni, B et al., (1993) J.Org.Chem. 58:3736-3741에 개시됨)(371 mg, 3.71 mmol, 3 당량)을 첨가하여 합성되었다. 1시간 동안 교반한 후, 반응 혼합물을 실온으로 가온하고 추가 시간동안 교반하였다. 휘발물을 진공에서 제거하고 조 생성물을 실리카겔에서의 크로마토그래피에 의해 정제하여(Et₂0/헥산 = 1 : 1) 황색 오일의 도 13, 패널 A의 4를 얻었다.

(4원 탄소 원자의 모든 시그널이 ¹³C NMR 스펙트럼에서 가시적이지는 않다); HRMS(CI) m/z 334.1336[C₁₅H₂0N₅0₂S(M+1)은 334.1332를 요구함]. 아지도 염료의 구조의 예는 화학 구조 4에 나타난다:

도 13, 패널 A의 5 및 하기 화학 구조 5에 나타난 알킨 염료는 실온에서 피리딘(2 ml)중의 플루오르세인아민(150 mg, 0.43 mmol. 1 당량) 및 10-운데시노산 (79 mg, 0.43, 1 당량)의 용액에 EDCI(1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 하이드로클로라이드)(83 mg, 0.43 mmol, 1 당량)을 첨가함으로써 합성되었다. 현탁액을 밤새 교반하고 반응 혼합물을 H₂0(15 ml)에 부었다. 상기 용액을 농축 HCl을 첨가하여 산성화시켰다(pH<2). 1시간동안 교반한 후, 침전물을 여과하고, H₂0(5 ml)로 세척하고 소량의 EtOAc에 용해시켰다. 헥산을 첨가하여 도 13, 패널 A의 5를 오렌지색 결정으로 침전시키고, 이를 수집하여 진공에서 건조시켰다(138 mg, 63%). 분석 데이터는 문헌에 보고된 것과 동일하다. 예를 들어, Crisp, G. T.; & Gore, J. (1997) Tetrahedron 53: 1505-1522를 참고한다. 알킨 염료의 구조의 예는 화학 구조 5에 나타난다:

도 13, 패널 A의 6 및 하기 화학 구조 6에 나타난 아지도 염료는 실온에서 피리딘(2 ml)중의 플루오르세인아민(150 mg, 0.43 mmol, 1 당량) 및 4-(3-아지도프로필카르바모일)-부티르산(예, 3-아지도프로필아민을 글루타르산 무수물과 반응시켜 합성됨)(92 mg, 0.43, 1 당량)의 용액에 EDCI(83 mg, 0.43 mmol, 1 당량)을 첨가함으로써 합성되었다. 현탁액을 밤새 교반하고 반응 혼합물을 H₂0(15 ml)에 부었다. 상기 용액을 농축 HCl을 첨가하여 산성화시켰다(pH<2). 1시간동안 교반한 후, 침전물을 여과하고, 1N HCl(3x3 ml)로 세척하고 소량의 EtOAc에 용해시켰다. 헥산 을 첨가하여 도 13, 패널 A의 6을 오렌지색 결정으로 침전시키고, 이를 수집하여 진공에서 건조시켰다(200 mg, 86%).

(4원 탄소 원자의 모든 시그널이 ¹³C NMR 스펙트럼에서 가시적이지는 않음); HRMS (CI) m/z 544.1835 [C₂₈H₂₅N₅0₇(M+1)은 544.1827을 요구한다]. 아지도 염료의 구조의 예는 화학 구조 6에 나타난다:

한 구체예에서, PEG 분자는 또한 비천연 아미노산, 예, 아지도 아미노산 또는 프로파길 아미노산을 갖는 단백질에 첨가될 수 있다. 예를 들어, 프로파길 아미드 PEG(예, 도 17, 패널 A에 예시됨)는 [3+2]고리화첨가를 통해 아지도 아미노산을 갖는 단백질에 첨가될 수 있다. 예를 들어, 도 17, 패널 A를 참고한다. 도 17, 패널 B는 첨가된 PEG 치환기를 갖는 단백질의 겔 분석을 예시한다.

본 발명의 한 태양에서, 프로파길 아미드 PEG(예, 도 17, 패널 A에 예시됨)는 후술하는 대로 합성될 수 있다. 예를 들어, CH₂Cl₂(1 ml)중의 프로파길아민(30 ㎕)의 용액을 20 kDa PEG-하이드록시석신이미드 에스테르(120 mg, 넥타로부터 구매)에 첨가하였다. 반응물을 실온에서 4시간동안 교반하였다. 이어서 Et₂O(10ml)을 첨가하고, 침전물을 여과하고, Et₂O(10ml)을 첨가하여 MeOH(1 ml)로부터 두번 재결정화하였다. 생성물을 진공하에서 건조시켜 백색 고체(105 mg, 88% 수율)를 얻었다. 도 17, 패널 C를 참고한다.

실시예 6: 예시적인 O- RS 및 O- tRNA

예시적인 O-tRNA는 서열 번호 65를 포함한다(표 5 참고). 예시적인 O-RS는 서열 번호 36-63, 86을 포함한다(표 5 참고). O-RS 또는 그 일부(예, 활성 부위)를 암호화하는 폴리뉴클레오티드의 예는 서열 번호 3-35를 포함한다. 또한, O-RS의 예시적인 아미노산 변화는 표 6에 나타난다.

[표 6]

a. 이들 클론은 또한 Asp165Gly 돌연변이를 함유한다.

여기서 개시된 실시예 및 구체예는 예시적인 목적이며 다양한 변형 또는 변화가 당업자에게 제안될 것이며 이들은 본 출원 및 첨부된 청구범위의 정신과 범위내에 포함됨이 이해된다.

전술한 발명은 명확히 하고 이해를 돕기 위하여 다소 상세하게 설명되었지만, 본 명세서를 읽음으로써 당업자는 형태 및 상세 사항에 있어서 다양한 변화가 본 발명의 범위를 벗어나지 않고 만들어질 수 있음을 알 것이다. 예를 들어, 여기서 개시된 모든 기법 및 장치는 다양한 조합으로 이용될 수 있다. 여기서 인용된 모든 문헌, 특허, 특허 출원 및/또는 다른 문서는 그 전체가 각 개별 문헌, 특허, 특허 출원, 및/또는 다른 문서가 개별적으로 참고로 포함되는 것으로 나타내진 것 처럼 동일하게 모든 목적을 위하여 그 전체가 참고로 포함된다.

[표 5]

a. 이들 클론은 또한 Asp165Gly 돌연변이를 함유한다.

SEQUENCE LISTING <110> The Scripps Research Institute Chin, Jason W Cropp, T Ashton Anderson, J Christopher Schultz, Peter G <120> EXPANDING THE EUKARYOTIC GENETIC CODE <130> 54-000240US/PC <160> 104 <170> PatentIn version 3.3 <210> 1 <211> 1275 <212> DNA <213> Escherichia coli <400> 1 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcgctcta ttgcggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg cgaacaacta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gttgcagggt 540 tatgacttcg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 2 <211> 424 <212> PRT <213> Escherichia coli <400> 2 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Tyr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Asp Phe Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 3 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 3 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 4 <211> 1275 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 4 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcac ttgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc agcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatacgtatg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 5 <211> 1275 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 5 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 6 <211> 1275 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 6 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 7 <211> 1275 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 7 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcac gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacagcct gctgcagggt 540 tatacgatgg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 8 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 8 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 9 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 9 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 10 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 10 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 11 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 11 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattcg tatgcctgtg cgaacaaaca gtacggtgtg 540 <210> 12 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 12 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 13 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 13 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcctttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct attgcctgtt cgaacaaaca gtacggtgtg 540 <210> 14 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 14 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt attgcctgtt tgaacaaaca gtacggtgtg 540 <210> 15 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 15 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt attgcctgtt tgaacaaaca gtacggtgtg 540 <210> 16 <211> 540 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 16 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tctggtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaagg ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaatt gttatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatatg cgtgcctgtg agaacaaaca gtacggtgtg 540 <210> 17 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 17 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcatttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaaggtc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatggt atggcctgtg ctaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccaatgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 18 <211> 609 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 18 caggtgacgg acgaggaagc gttagcagag cgactggcgc aaggcccgat cgcactcggt 60 tgtggcttcg atcctaccgc tgacagcttg catttggggc atcttgttcc attgttatgc 120 ctgaaacgct tccagcaggc gggccacaag ccggttgcgc tggtaggcgg cgcgacgggt 180 ctgattggcg acccgagctt caaagctgcc gagcgtaagc tgaacaccga agaaactgtt 240 caggagtggg tggacaaaat ccgtaagcag gttgccccgt tcctcgattt cgactgtgga 300 gaaaactctg ctatcgcggc caataattat gactggttcg gcaatatgaa tgtgctgacc 360 ttcctgcgcg atattggcaa acacttctcc gttaaccaga tgatcaacaa agaagcggtt 420 aagcagcgtc tcaaccgtga agatcagggg atttcgttca ctgagttttc ctacaacctg 480 ctgcagggtt atggttttgc ctgtttgaac aaacagtacg gtgtggtgct gcaaattggt 540 ggttctgacc agtggggtaa catcacttct ggtatcgacc tgacccgtcg tctgcatcag 600 aatcaggtg 609 <210> 19 <211> 591 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 19 gcgttagcag agcgactggc gcaaggcccg atcgcactcg ggtgtggctt cgatcctacc 60 gctgacagct tgcatttggg gcatcttgtt ccattgttat gcctgaaacg cttccagcag 120 gcgggccaca agccggttgc gctggtaggc ggcgcgacgg gtctgattgg cgacccgagc 180 ttcaaagctg ccgagcgtaa gctgaacacc gaagaaactg ttcaggagtg ggtggacaaa 240 atccgtaagc aggttgcccc gttcctcgat ttcgactgtg gagaaaactc tgctatcgcg 300 gccaataatt atgactggtt cggcaatatg aatgtgctga ccttcctgcg cgatattggc 360 aaacacttct ccgttaacca gatgatcaac aaagaagcgg ttaagcagcg tctcaaccgt 420 gaagatcagg ggatttcgtt cactgagttt tcctacaacc tgctgcaggg ttatggttat 480 gcctgtatga acaaacagta cggtgtggtg ctgcaaattg gtggttctga ccagtggggt 540 aacatcactt ctggtatcga cctgacccgt cgtctgcatc agaatcaggt g 591 <210> 20 <211> 621 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (26)..(26) <223> n is a, c, g, or t <220> <221> misc_feature <222> (612)..(612) <223> n is a, c, g, or t <220> <221> misc_feature <222> (618)..(618) <223> n is a, c, g, or t <400> 20 gggctggtag cccaggtgac ggacgnagaa gcgttagcag agcgactggc gcaaggcccg 60 atcgcactcc tttgtggctt cgatcctacc gctgacagct tgcatttggg gcatcttgtt 120 ccattgttat gcctgaaacg cttccagcag gcgggccaca agccggttgc gctggtaggc 180 ggcgcgacgg gtctgattgg cgacccgagc ttcaaagctg ccgagcgtaa gctgaacacc 240 gaagaaactg ttcaggagtg ggtggacaaa atccgtaagc aggttgcccc gttcctcgat 300 ttcgactgtg gagaaaactc tgctatcgcg gccaataatt atgactggtt cggcaatatg 360 aatgtgctga ccttcctgcg cgatattggc aaacacttct ccgttaacca gatgatcaac 420 aaagaagcgg ttaagcagcg tctcaaccgt gaagatcagg ggatttcgtt cactgagttt 480 tcctacaacc tgctgcaggg ttattctatg gcctgtgcga acaaacagta cggtgtggtg 540 ctgcaaattg gtggttctga ccagtggggt aacatcactt ctggtatcga cctgacccgt 600 cgtctgcatc anaatcangt g 621 <210> 21 <211> 588 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 21 ttagcagagc gactggcgca aggcccgatc gcactcgttt gtggcttcga tcctaccgct 60 gacagcttgc atttggggca tcttgttcca ttgttatgcc tgaaacgctt ccagcaggcg 120 ggccacaagc cggttgcgct ggtaggcggc gcgacgggtc tgattggcga cccgagcttc 180 aaagctgccg agcgtaagct gaacaccgaa gaaactgttc aggagtgggt ggacaaaatc 240 cgtaagcagg ttgccccgtt cctcgatttc gactgtggag aaaactctgc tatcgcggcc 300 aataattatg actggttcgg caatatgaat gtgctgacct tcctgcgcga tattggcaaa 360 cacttctccg ttaaccagat gatcaacaaa gaagcggtta agcagcgtct caaccgtgaa 420 gatcagggga tttcgttcac tgagttttcc tacaacctgc tgcagggtta ttctgcggcc 480 tgtgcgaaca aacagtacgg tgtggtgctg caaattggtg gttctgacca gtggggtaac 540 atcacttctg gtatcgacct gacccgtcgt ctgcatcaga atcaggtg 588 <210> 22 <211> 600 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (403)..(403) <223> n is a, c, g, or t <220> <221> misc_feature <222> (513)..(513) <223> n is a, c, g, or t <220> <221> misc_feature <222> (515)..(515) <223> n is a, c, g, or t <220> <221> misc_feature <222> (518)..(518) <223> n is a, c, g, or t <220> <221> misc_feature <222> (531)..(531) <223> n is a, c, g, or t <400> 22 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcct gtgtggcttc 60 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 120 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 180 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 240 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 300 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 360 gatattggca aacacttctc cgttaaccag atgatcaaca aanaagcggt taagcagcgt 420 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 480 tattcggctg cctgtgcgaa caaacagtac ggngnggngc tgcaaattgg nggttctgac 540 caggggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca aaatcaggtg 600 <210> 23 <211> 591 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (588)..(588) <223> n is a, c, g, or t <400> 23 gcgttagcag agcgactggc gcaaggcccg atcgcactcg tttgtggctt cgatcctacc 60 gctgacagct tgcatttggg gcatcttgtt ccattgttgt gcctgaaacg cttccagcag 120 gcgggccaca agccggttgc gctggtaggc ggcgcgacgg gtctgattgg cgacccgagc 180 ttcaaagctg ccgagcgtaa gctgaacacc gaagaaactg ttcaggagtg ggtggacaaa 240 atccgtaagc aggttgcccc gttcctcgat ttcgactgtg gagaaaactc tgctatcgcg 300 gccaataatt atgactggtt cggcaatatg aatgtgctga ccttcctgcg cgatattggc 360 aaacacttct ccgttaacca gatgatcaac aaagaagcgg ttaagcagcg tctcaaccgt 420 gaagatcagg ggatttcgtt cactgagttt tcctacaacc tgctgcaggg ttatagtgcg 480 gcctgtgtta acaaacagta cggtgtggtg ctgcaaattg gtggttctga ccagtggggt 540 aacatcactt ctggtatcga cctgacccgt cgtctgcatc agaatcangt g 591 <210> 24 <211> 600 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 24 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcat ttgtggcttc 60 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 120 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 180 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 240 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 300 gctatcgcgg ccaatgatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 360 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 420 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 480 tataattttg cctgtgtgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 540 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 600 <210> 25 <211> 579 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 25 cgactggcgc aaggcccgat cgcactcacg tgtggcttcg atcctaccgc tgacagcttg 60 catttggggc atcttgttcc attgttatgc ctgaaacgct tccagcaggc gggccacaag 120 ccggttgcgc tggtaggcgg cgcgacgggt ctgattggcg acccgagctt caaagctgcc 180 gagcgtaagc tgaacaccga agaaactgtt caggagtggg tggacaaaat ccgtaagcag 240 gttgccccgt tcctcgattt cgactgtgga gaaaactctg ctatcgcggc caataattat 300 gactggttcg gcaatatgaa tgtgctgacc ttcctgcgcg atattggcaa acacttctcc 360 gttaaccaga tgatcaacaa agaagcggtt aagcagcgtc tcaaccgtga agatcagggg 420 atttcgttca ctgagttttc ctacaatctg ctgcagggtt attcggctgc ctgtcttaac 480 aaacagtacg gtgtggtgct gcaaattggt ggttctgacc agtggggtaa catcacttct 540 ggtatcgacc tgacccgtcg tctgcatcag aatcaggtg 579 <210> 26 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or t <220> <221> misc_feature <222> (599)..(599) <223> n is a, c, g, or t <400> 26 cgggggctgg tancccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgggtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct atggcctgtt tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctganc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 27 <211> 625 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (600)..(600) <223> n is a, c, g, or t <400> 27 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca atctgctgca gggttattcg gctgcctgtc ttaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgaacctgan 600 ccgtcgtctg catcaaaatc aagtg 625 <210> 28 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 28 cgggggctgg taccccaagt gacggacgag gaaacgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tctcttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcaggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg atggcctgtg tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 29 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 29 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgcgtgcgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaagg ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct tatgcctgtc ttaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 30 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 30 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgcgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg atggcctgtt gtaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 31 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 31 cgggggctgg taccccaagt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcgctgag 480 ttttcctaca acctgctgca gggttatacg tttgcctgta tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 32 <211> 606 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 32 gtgacggacg aggaagcgtt agcagagcga ctggcgcaag gcccgatcgc actcacgtgt 60 ggcttcgatc ctaccgctga cagcttgcat ttggggcatc ttgttccatt gttatgcctg 120 aaacgcttcc agcaggcggg ccacaagccg gttgcgctgg taggcggcgc gacgggtctg 180 attggcgacc cgagcttcaa agctgccgag cgtaagctga acaccgaaga aactgttcag 240 gagtgggtgg acaaaatccg taagcaggtt gccccgttcc tcgatttcga ctgtggagaa 300 aactctgcta tcgcggccaa taattatgac tggttcggca atatgaatgt gctgaccttc 360 ctgcgcgata ttggcaaaca cttctccgtt aaccagatga tcaacaaaga agcggttaag 420 cagcgtctca accgtgaaga tcaggggatt tcgttcactg agttttccta caatctgctg 480 cagggttatt cggctgcctg tcttaacaaa cagtacggtg tggtgctgca aattggtggt 540 tctgaccagt ggggtaacat cacttctggt atcgacctga cccgtcgtct gcatcagaat 600 caggtg 606 <210> 33 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 33 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattcg atggcctgta cgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 34 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or t <400> 34 cgggggctgg tancccaagt gacggacggg gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcagttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatctcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt tttgcctgtc tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 35 <211> 624 <212> DNA <213> artificial <220> <223> artificial synthetase <400> 35 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tttgcctgta ctaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 36 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 36 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 37 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 37 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 38 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 38 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 39 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 39 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 40 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 40 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 41 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 41 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 42 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 42 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ser Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 43 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 43 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 44 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 44 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Arg Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 45 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 45 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 46 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 46 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Phe Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 47 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 47 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Tyr Ala Cys Met Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 48 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 48 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 49 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 49 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 50 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 50 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 51 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 51 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 52 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 52 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asp Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Asn Phe Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 53 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 53 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 54 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 54 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 55 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 55 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 56 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 56 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ser Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 57 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 57 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ala Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 58 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 58 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ala Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Cys Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 59 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 59 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Phe Ala Cys Met Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 60 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 60 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Val Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 61 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 61 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Thr Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 62 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 62 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ser Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Phe Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 63 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 63 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Phe Ala Cys Thr Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 64 <211> 129 <212> DNA <213> Escherichia coli <400> 64 agcttcccga taagggagca ggccagtaaa aagcattacc ccgtggtggg gttcccgagc 60 ggccaaaggg agcagactct aaatctgccg tcatcgacct cgaaggttcg aatccttccc 120 ccaccacca 129 <210> 65 <211> 129 <212> RNA <213> Escherichia coli <400> 65 agcuucccga uaagggagca ggccaguaaa aagcauuacc ccgugguggg guucccgagc 60 ggccaaaggg agcagacucu aaaucugccg ucaucgaccu cgaagguucg aauccuuccc 120 ccaccacca 129 <210> 66 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 66 atgaagtagc tgtcttctat cgaacaagca tgcg 34 <210> 67 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 67 cgaacaagca tgcgattagt gccgacttaa aaag 34 <210> 68 <211> 33 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 68 cgctactctc ccaaatagaa aaggtctccg ctg 33 <210> 69 <211> 32 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 69 ctggaacagc tatagctact gatttttcct cg 32 <210> 70 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 70 gccgtcacag attagttggc ttcagtggag actg 34 <210> 71 <211> 33 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 71 gattggcttc ataggagact gatatgctct aac 33 <210> 72 <211> 33 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 72 gcctctatag ttgagacagc atagaataat gcg 33 <210> 73 <211> 35 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 73 gagacagcat agatagagtg cgacatcatc atcgg 35 <210> 74 <211> 37 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 74 gaataagtgc gacatagtca tcggaagaga gtagtag 37 <210> 75 <211> 35 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 75 ggtcaaagac agttgtaggt atcgattgac tcggc 35 <210> 76 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 76 cgctactctc cccaaattta aaaggtctcc gctg 34 <210> 77 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 77 cgctactctc cccaaatata aaaggtctcc gctg 34 <210> 78 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 78 cgctactctc cccaaatgga aaaggtctcc gctg 34 <210> 79 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 79 cgctactctc cccaaagata aaaggtctcc gctg 34 <210> 80 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 80 cgctactctc cccaaaaaaa aaaggtctcc gctg 34 <210> 81 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 81 gccgtcacag attttttggc ttcagtggag actg 34 <210> 82 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 82 gccgtcacag attatttggc ttcagtggag actg 34 <210> 83 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 83 gccgtcacag attggttggc ttcagtggag actg 34 <210> 84 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 84 gccgtcacag atgatttggc ttcagtggag actg 34 <210> 85 <211> 34 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 85 gccgtcacag ataaattggc ttcagtggag actg 34 <210> 86 <211> 424 <212> PRT <213> artificial <220> <223> artificial synthetase <400> 86 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Gly Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 87 <211> 6 <212> PRT <213> artificial <220> <223> tryptic peptide including unnatural amino acids <220> <221> misc_feature <222> (2)..(2) <223> X is an unnatural amino acid (p-acetyl-L-phenylalanine, p-benzoyl-L-phenylalanine, p-azido-L-phenylalanine, O-methyl-L-tyrosine, or p-iodo-L-phenylalanine) or trypotophan, tyrosine, or leucine <400> 87 Val Xaa Gly Ser Ile Lys 1 5 <210> 88 <211> 11 <212> DNA <213> artificial <220> <223> B box <220> <221> misc_feature <222> (8)..(8) <223> n is a, c, g, or t <400> 88 ggttcgantc c 11 <210> 89 <211> 82 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 89 ggggggaccg gtggggggac cggtaagctt cccgataagg gagcaggcca gtaaaaagca 60 ttaccccgtg gtgggttccc ga 82 <210> 90 <211> 90 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 90 ggcggcgcta gcaagcttcc cgataaggga gcaggccagt aaaaagggaa gttcagggac 60 ttttgaaaaa aatggtggtg ggggaaggat 90 <210> 91 <211> 68 <212> DNA <213> artificial <220> <223> oligonucleotide primer <220> <221> misc_feature <222> (1)..(1) <223> n=I <220> <221> misc_feature <222> (14)..(14) <223> n=I <400> 91 nggggggacc ggtngggggg accggtcggg atcgaagaaa tgatggtaaa tgaaatagga 60 aatcaagg 68 <210> 92 <211> 62 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 92 gggggggaat tcagttgatt gtatgcttgg tatagcttga aatattgtgc agaaaaagaa 60 ac 62 <210> 93 <211> 86 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 93 tcataacgag aattccggga tcgaagaaat gatggtaaat gaaataggaa atctcataac 60 gagaattcat ggcaagcagt aacttg 86 <210> 94 <211> 72 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 94 ttactacgtg cggccgcatg gcaagcagta acttgttact acgtgcggcc gcttatttcc 60 agcaaatcag ac 72 <210> 95 <211> 28 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 95 ccgatcgcgc tcgcttgcgg cttcgatc 28 <210> 96 <211> 27 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 96 atcgcggcga acgcctatga ctggttc 27 <210> 97 <211> 40 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 97 gttgcagggt tatgccgccg cctgtgcgaa caaacagtac 40 <210> 98 <211> 26 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 98 gccgctttgc tatcaagtat aaatag 26 <210> 99 <211> 21 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 99 caagccgaca accttgattg g 21 <210> 100 <211> 60 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 100 ggggacaagt ttgtacaaaa aagcaggcta cgccaatttt aatcaaagtg ggaatattgc 60 <210> 101 <211> 60 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 101 ggggacaagt ttgtacaaaa aagcaggcta ggccaatttt aatcaaagtg ggaatattgc 60 <210> 102 <211> 58 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 102 ggggaccact ttgtacaaga aagctgggtt actctttttt tgggtttggt ggggtatc 58 <210> 103 <211> 22 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 103 aagctatacc aagcatacaa tc 22 <210> 104 <211> 49 <212> DNA <213> artificial <220> <223> oligonucleotide primer <400> 104 acaaggcctt gctagcttac tctttttttg ggtttggtgg ggtatcttc 49

Claims

직교(orthogonal) 아미노아실-tRNA 신세타제(O-RS), 직교 tRNA(O-tRNA), 하나 이상의 비천연 아미노산 및 셀렉터 코돈을 포함하는 대상 재조합 핵산을 포함하는 진핵 세포로서,

이때 O-RS는 구성적 프로모터를 이용하여 진핵 세포 내에서 발현되고;

O-RS는 진핵 세포 내에서 상기 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하며;

O-tRNA는 진핵 세포 내에서 발현되고 셀렉터 코돈을 특이적으로 인식하며;

진핵 세포는 셀렉터 코돈에 응답하여 번역 중에 대상 재조합 핵산에 의해 암호화되는 대상 단백질 내로 상기 비천연 아미노산을 특이적으로 혼입하며;

진핵 세포는 상기 비천연 아미노산의 존재하에서의 대상 단백질의 수율의 30% 미만의 수율로 비천연 아미노산의 부재하에서 대상 핵산을 대상 단백질로 번역하는 것인 진핵 세포.
제1항에 있어서, O-RS 또는 그 일부가 서열 번호 3-19 중 어느 하나에 개시된 폴리뉴클레오티드 서열에 의해 암호화되거나, 또는 O-RS가 서열 번호 36-47, 또는 86 중 어느 하나에 개시된 아미노산 서열, 또는 그의 보존적 변이체로 이루어진 것인 진핵 세포.
제1항에 있어서, O-RS가 자연 발생(naturally occurring) 티로실 아미노아실-tRNA 신세타제(TyrRS)의 아미노산 서열로 구성되나, 하기로 이루어진 군으로부터 선택되는 아미노산 둘 이상을 포함하는 것인 진핵 세포:

A) 대장균 TyrRS의 Tyr37에 해당하는 위치에서 발린, 이소류신, 류신, 또는 트레오닌;

B) 대장균 TyrRS의 Asp182에 해당하는 위치에서 트레오닌, 세린, 아르기닌, 또는 글리신;

D) 대장균 TyrRS의 Phe183에 해당하는 위치에서 메티오닌, 또는 티로신;

E) 대장균 TyrRS의 Leu186에 해당하는 위치에서 세린, 또는 알라닌.
제1항에 있어서, O-RS가 비진핵 유기체, 대장균 및 바실러스 스테아로써모필러스(Bacillus stearothermophilus)로 이루어진 군으로부터 선택되는 유기체로부터 유래된 것인 진핵 세포.
제1항에 있어서, 진핵 세포가 효모 세포, 사카로마이세스 세레비제(Saccharomyces cerevisiae) 세포, 포유류 세포, 식물 세포, 조류(algae) 세포, 진균 세포 또는 곤충 세포인 진핵 세포.
제1항에 있어서, O-RS는 천연 아미노산에 비하여 하나 이상의 비천연 아미노산을 위해 개량되거나 향상된 하나 이상의 효소 특성을 가지며, 이 특성은 더 높은 K_m, 더 낮은 K_m, 더 높은 k_cat, 더 낮은 k_cat, 더 낮은 k_cat/k_m, 및 더 높은 k_cat/k_m으로 이루어진 군으로부터 선택되는 것인 진핵 세포.
제1항에 있어서, 진핵 세포는 비천연 아미노산을 포함하고, 상기 비천연 아미노산은 p-아세틸-L-페닐알라닌, p-요오도-L-페닐알라닌, 0-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, 0-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 하이드록실, 알케닐, 알키닐, 에테르, 티올, 설포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 하이드록실아민, 케토, 또는 아미노 치환된 아미노산, 또는 임의의 그 조합; 광활성화 가교제를 갖는 아미노산; 스핀-표지된 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 포토케이지드(photocaged) 및/또는 광이성질체성 아미노산; 바이오틴 또는 바이오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중(heavy) 원자 치환된 아미노산; 화학적으로 절단가능하거나 광절단가능한 아미노산; 신장된 측쇄를 가진 아미노산; 독성기를 함유하는 아미노산; 당 치환된 아미노산; 탄소-연결된 당-함유 아미노산; 산화환원 활성 아미노산; α-하이드록시 함유산; 아미노 티오산; α,α 이치환된 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 고리형 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산으로 이루어진 군으로부터 선택되는 것인 진핵 세포.
제1항에 있어서, O-tRNA는 비진핵 유기체, 대장균 및 바실러스 스테아로써모필러스(Bacillus stearothermophilus)로 이루어진 군으로부터 선택되는 유기체로부터 유래된 것인 진핵 세포.
제1항에 있어서, O-tRNA는 서열 번호 65에 해당하는 핵산의 세포 프로세싱에 의해 세포에서 생산되며, O-RS는 서열 번호 36-47, 86 및 그의 보존적 변이체로 이루어진 군으로부터 선택되는 폴리펩티드 서열을 포함하는 것인 진핵 세포.
제1항에 있어서, 대상 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하는 핵산을 추가로 포함하며, 이때 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 것인 진핵 세포.
제10항에 있어서, 하나 이상의 비천연 아미노산을 포함하는 대상 폴리펩티드의 수율이 폴리뉴클레오티드에 셀렉터 코돈이 없는 세포로부터의 자연 발생 대상 폴리펩티드를 위해 얻어진 수율의 5% 이상이거나, 또는 세포가 하나 이상의 비천연 아미노산의 존재하에서의 폴리펩티드의 수율의 5% 미만의 수율로 하나 이상의 비천연 아미노산의 부재하에서 대상 폴리펩티드를 생산하는 것인 진핵 세포.
제10항에 있어서, 대상 폴리펩티드는 치료 단백질, 진단 단백질, 산업용 효소, 전사 조절자 단백질, 전사 활성인자 단백질, GAL4, 전사 억제자 단백질, 사이토카인, 성장 인자, 성장 인자 수용체, 인터페론, 인터루킨, 염증성 분자, 발암유전자 생성물, 펩티드 호르몬, 시그널 전달 분자, 스테로이드 호르몬 수용체, 에리트로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체, 아포지질단백질, 아포단백질, 심방 나트륨뇨배뇨항진 인자, 심방 나트륨뇨배뇨항진 폴리펩티드, 심방 펩티드, C-X-C 케모카인, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-kit 리간드, CC 케모카인, 단핵구 화학유도인자 단백질-1, 단핵구 화학유도인자 단백질-2, 단핵구 화학유도인자 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제자, 보체 수용체 1, DHFR, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1, 상피 성장 인자(EGF), 상피 호중구 활성화 펩티드, 박리 독소, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 헤지호그 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 사람 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린형 성장 인자(IGF), IGF-I, IGF-II, IFN-α, IFN-β, IFN-γ, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각질세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골형성 단백질, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B, 또는 C, 릴랙신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 ICAM-1, 가용성 인터루킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 수퍼항원, 스타필로코커스 내독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 수퍼옥사이드 디스무타제(SOD), 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성인자, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met, p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히아루린/CD44, 및 코르티코스테론으로 이루어진 군으로부터 선택된 단백질 또는 단백질의 일부를 포함하는 것인 진핵 세포.
제1항에 있어서, O-tRNA는 전사 후 변형되는 것인 진핵 세포.
하기를 포함하는, 하나 이상의 비천연 아미노산을 포함하는 하나 이상의 단백질을 진핵 세포에서 생산하는 방법:

하나 이상의 셀렉터 코돈을 포함하며 단백질을 암호화하는 핵산을 포함하는 진핵 세포를 배지에서 성장시키는 단계로서,

이때 배지는 비천연 아미노산을 포함하고,

진핵 세포는 세포에서 기능하며 셀렉터 코돈을 인식하는 직교 tRNA(O-tRNA) 및 구성적 프로모터의 조절 하에서 진핵 세포 내에서 발현되고 상기 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화함으로써 진핵 세포가 상기 비천연 아미노산의 존재하에서의 대상 단백질의 수율의 30% 미만의 수율로 비천연 아미노산의 부재하에서 대상 핵산을 대상 단백질로 번역하도록 하는 직교 아미노아실 tRNA 신세타제(O-RS)를 포함하는 단계.
제1항에 있어서, O-tRNA는 유박테리아(eubacteria) O-tRNA로부터 유래하고, O-RS는 유박테리아 O-RS로부터 유래한 것인 진핵 세포.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제