KR20080113226A - 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현 - Google Patents

비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현 Download PDF

Info

Publication number
KR20080113226A
KR20080113226A KR1020087024575A KR20087024575A KR20080113226A KR 20080113226 A KR20080113226 A KR 20080113226A KR 1020087024575 A KR1020087024575 A KR 1020087024575A KR 20087024575 A KR20087024575 A KR 20087024575A KR 20080113226 A KR20080113226 A KR 20080113226A
Authority
KR
South Korea
Prior art keywords
trna
amino acid
protein
phenylselenocysteine
amino acids
Prior art date
Application number
KR1020087024575A
Other languages
English (en)
Inventor
지앙윤 왕
피터 지 슐츠
Original Assignee
더 스크립스 리서치 인스티튜트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 스크립스 리서치 인스티튜트 filed Critical 더 스크립스 리서치 인스티튜트
Publication of KR20080113226A publication Critical patent/KR20080113226A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 비천연 아미노산 페닐셀레노시스테인을 E. 콜라이(E. coli)와 같은 진정세균 숙주 세포에서 생성된 단백질 내로 도입할 수 있는, tRNA와 아미노아실-tRNA 합성효소의 오르소고날(orthogonal) 쌍에 관한 것이다. 본 발명은, 예를 들어 단 비제한적 예로서 신규 오르소고날 아미노아실-tRNA 합성효소, 신규 합성효소 분자를 코딩하는 폴리뉴클레오티드, 신규 합성효소의 동정 및 제조 방법, 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 생성 방법, 및 번역 시스템을 제공한다. 본 발명은 또한 단백질 내의 페닐셀레노시스테인 잔기의 표적화 변형을 통해 변형 단백질(예를 들어, 지질화된 단백질)을 생성시키는 방법을 제공한다.

Description

비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현{GENETICALLY PROGRAMMED EXPRESSION OF PROTEINS CONTAINING THE UNNATURAL AMINO ACID PHENYLSELENOCYSTEINE}
본 출원은, 각 내용이 각기 모든 목적을 위해 전체적으로 본원에 참조 인용되는 미국 가출원 특허 출원 일련번호 제60/783,272호(2006년 3월 16일 출원) 및 미국 가출원 특허 출원 일련번호 제60/861,456호(2006년 11월 28일 출원)에 대한 우선권 및 이익을 주장한다.
연방 지원 연구 및 개발 하에 이루어진 발명에 대한 권리에 관한 진술
본 발명은 허가 제GM62159호 하에 미국립보건원으로부터 정부 지원을 받아 이루어졌다. 미 정부는 본 발명에 대한 특정 권리를 가질 수 있다.
기술 분야
본 발명은 번역 생화학의 분야에 속한다. 본 발명은 비천연 아미노산을 단백질 내로 도입하는, 오르소고날(orthogonal) tRNA, 오르소고날 아미노아실-tRNA 합성효소, 및 이들의 쌍의 제조 및 사용을 위한 조성물 및 방법에 관한 것이다. 본 발명은 또한 상기와 같은 쌍을 이용하여 세포 내에 단백질을 생성시키는 방법, 및 그 방법에 의해 제조된 단백질에 관한 것이다.
단백질 구조 및 기능 연구는 역사적으로 천연 발생 아미노산의 반응성 기를 사용하여 이용가능한 성질 및 반응 화학작용에 의존해 왔다. 안타깝게도, 세균에서 인간에 이르는 모든 공지된 유기체는 동일한 20종의 공통된 아미노산을 코딩한다. 이 20종의 아미노산은 놀랍게도 한정된 수의 작용기, 즉 질소 염기, 카르복실산 및 아미드, 알코올 및 티올기를 포함한다. R-기의 그러한 한정된 선택은 단백질 구조 및 기능의 연구를 제한하였고, 여기에서 그 연구는 천연 발생 아미노산의 화학적 성질에 의해 한정된다. 예를 들어, 한정된 수의 천연 발생 반응성 R-기는 단백질 내의 다른 아미노산들을 배제하면서 고도로 표적화된 단백질 변형을 일으키는 능력을 제한하였다.
단백질과 관련된 화학선택적 결찰 반응은 단백질-단백질 상호작용 및 세포내 신호 전달의 연구, 및 신규 단백질 치료제 발생을 비제한적 예로 포함하는 각종 목적들을 위해 극히 중요하다. 당업계에 현재 이용되는 대부분의 선택적인 단백질 변형 반응은 단백질 아미노산 측쇄 내의 천연 발생 친핵성 잔기를 표적화하는 친핵성 및 친전자성 반응 파트너들 사이의 공유결합 형성, 예를 들어 α-할로 케톤과 히스티딘 또는 시스테인 측쇄의 반응과 관련된다. 이 경우에서의 선택성은 단백질 내 친핵성 잔기의 수 및 접근가능성에 의해 결정된다. 안타깝게도, 천연 발생 단백질은 빈번하게 좋지 않은 위치에 있는(예를 들어, 접근불가능한) 반응 부위 또는 다중 반응 표적(예를 들어, 라이신, 히스티딘 및 시스테인 잔기)을 함유하고, 이로써 변형 반응에서 낮은 선택성을 초래하여, 친핵성/친전자성 시약에 의한 고도 표적화 단백질 변형을 어렵게 만든다. 또한, 변형 부위는 전형적으로 라이신, 히스티딘 또 는 시스테인의 천연 발생 친핵성 측쇄에 한정된다. 다른 부위에서의 변형은 어렵거나 불가능하다.
당업계에 필요한 것은, 단백질 구조 및 기능을 변형시키고 연구하고자 하는 목적을 위해 비천연 아미노산을 단백질 내로 도입하기 위한 신규 방법으로서, 비천연 아미노산이 신규 반응 화학작용 또는 기타 성질, 예를 들어 천연 발생 아미노산에서는 발견되지 않는 생물학적 성질을 가지는 방법이다. 당업계에서는, 고도로 선택적인 방식으로 단백질을 변형시키고, 또한 생리학적 조건 하에 단백질을 변형시키는 단백질 변형 반응을 위한 신규 방법을 창출할 필요가 상당히 있다. 당업계에 필요한 것은, 단백질 변형을 생성시키는 신규 방법으로서, 변형이 고도로 특이적인 방법, 예를 들어 어느 천연 발생 아미노산에서도 교차반응하거나 부반응이 일어나지 않는 방법이다. 고도로 특이적인 단백질 변형 방법을 위한 신규 화학작용은 단백질 구조의 연구, 및 치료 단백질의 생성에 있어 매우 다양한 용도를 가진다.
단백질 지질화
단백질 지질화는 단백질 국소화, 적절한 세포내 단백질 트래피킹(trafficking) 및 단백질-단백질 상호작용과 관련된 핵심적 번역후 변형이다. 단백질의 지질화는 빈번하게 적절한 생물학적 활성을 위해 필요하다. 이 특성은 일부 치료 단백질의 개발을 위해 중요하다. 지질화는 또한 단백질-단백질 상호작용 및 세포내 신호전달의 연구에 있어서도 중요하다. 안타깝게도, 본연의(native) 지질화되지 않은 형태의 단백질을 이용하여 지질화된 단백질을 생성하기 위한 시험관내 화학선택적 결찰은 극히 어렵고, 일반적으로는 독특한 표면 노출 시스테인 잔기의 변형에 한정된다.
많은 세포내 단백질의 생물학적 활성은 파르네실, 미리스토일 및 팔미토일 부분과 같은 지질 잔기에 의한 시스테인의 변역후 변형에 의존하는, 세포막과의 결합을 필요로 한다(Chernomordik 및 Kozlov(2003), Annual Review of Biochemistry 72:175-207). 예를 들어, 많은 G-단백질-결합 수용체는 팔미토일화되고, Ras 단백질은 파르네실화됨과 동시에 팔미토일화된다(Chernomordik 및 Kozlov(2003), Annual Review of Biochemistry 72:175-207). 단백질 파르네실화는 안정하고 비가역적인 변형인 반면, 팔미토일화는 가역적이며, 이로써 이는 단백질 기능의 동적 제어 및 세포막에 대한 특이적 표적화를 초래한다(Rocks 등(2005), Science 307(5716):1746-1752). 또한, γ-카르복시글루탐산은 응고 캐스케이드에서의 칼슘-의존성 막 접착을 위해 중요한 필수적 변형이다(Davie 등(1991), Biochemistry 30(43):10363-10370).
오르소고날 번역 시스템
한정된 유전 코드의 한계를 극복하기 위한 한 방법은 유전 코드를 확장하고 생물학적 범주에 대해 신규 반응성 성질을 가지는 아미노산을 부가하는 것이다. 원핵생물 및 진핵생물 유기체 모두에 있어 단백질에 다양한 비천연 아미노산을 생체내 특이적으로 도입하기 위한 일반적 방법론이 개발되었다. 이 방법은 생체내 폴리펩티드 번역 중에 소정의 위치에 있는 원하는 비천연 아미노산을 삽입하기 위해 적당한 셀렉터 코돈을 인식하는 오르소고날 단백질 번역 성분에 의존한다. 이 방법은 셀렉터 코돈을 인식하는 오르소고날 tRNA(O-tRNA)를 이용하는데, 여기에서 상응하 는 특이적 오르소고날 아미노아실-tRNA 합성효소(O-RS)는 O-tRNA를 비천연 아미노산으로 충전한다. 이 성분은 숙주 유기체 내의 내인성 tRNA, RS, 아미노산 또는 코돈 중 어느 것과도 상호 작용하지 않는다(즉, 그것은 오르소고날이어야 한다). 그러한 오르소고날 tRNA-RS 쌍의 이용으로, 다수의 구조적으로 다양한 비천연 아미노산을 유전적으로 코딩할 수 있게 되었다.
하나 이상의 비천연 아미노산을 포함하는 단백질의 제조에 적당한 오르소고날 번역 시스템을 이용하는 실무가 오르소고날 번역 시스템의 일반적 생성 방법과 같이 일반적으로 당업계에 공지되어 있다. 예를 들어, 국제 특허 공개 공보 제WO 2002/086075호(발명의 명칭: "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS"); 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"); 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE"); 제WO 2005/019415호(2004년 7월 7일 출원); 제WO 2005/007870호(2004년 7월 7일 출원); 제WO 2005/007624호(2004년 7월 7일 출원); 및 제WO 2006/110182호(2005년 10월 27일 출원)(발명의 명칭: "ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVO INCORPORATION OF UNNATURAL AMINO ACIDS")를 참조한다. 이들 출원은 각각 전체적으로 본원에 참조 인용된다. 비천연 아미노산이 도입된 오르소고날 번역 시스템, 및 이의 생성 및 사용 방법의 부가적 논의에 대해, 또한 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Chem . Commun . (Camb.) 1:1-11(2002)]; 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Angewandte Chemie Int . Ed ., 44(1):34-66(2005)]; 문헌 [Xie 및 Schultz, "An Expanding Genetic Code", Methods 36(3):227-238(2005)]; 문헌 [Xie 및 Schultz, "Adding Amino Acids to the Genetic Repertoire", Curr . Opinion in Chemical Biology 9(6):548-554(2005)]; 문헌 [Wang 등, "Expanding the Genetic Code", Annu . Rev . Biophys . Biomol . Struct ., 35:225-249(2006)]; 및 문헌 [Xie 및 Schultz, "A Chemical Toolkit for Proteins - an Expanded Genetic Code", Nat . Rev . Mol . Cell Biol ., 7(10):775-782(2006)]을 참조한다.
비천연 아미노산을 단백질 내로 도입하는 오르소고날 번역 성분으로서, 비천연 아미노산이 소정의 위치에 도입될 수 있고, 비천연 아미노산이, 단백질 내 다른 위치와의 교차 반응 또는 부반응을 제외하면서 아미노산이 특이적 변형(예를 들어, 지질화)에 대한 표적으로 작용하도록 하는 신규 화학적 성질을 가지는 상기 오르소고날 번역 성분의 개발이 당업계에 필요하다. 본원에 기재된 본 발명은 상기 필요 및 다른 필요를 충족하며, 이는 하기 개시내용을 검토할 때 자명하게 될 것이다.
발명의 개요
본 발명은 생체내(예를 들어, 숙주 세포내)에서 셀렉터 코돈, 예를 들어 엠버 정지 코돈에 대한 반응으로 성장하는 폴리펩티드 사슬에 비천연 아미노산 페닐셀레노시스테인을 도입하기 위한 조성물 및 방법을 제공한다. 이 조성물은 숙주 세포 번역 기구(machinery)와 상호작용하지 않는, 오르소고날-tRNA(O-tRNA)와 오르소고날 아미노아실-tRNA 합성효소(O-RS)의 쌍을 포함한다. 즉, O-tRNA는 내인성 숙주 세포 아미노아실-tRNA 합성효소에 의해 (천연 또는 비천연) 아미노산으로 충전되지 않는다(혹은 유의적 수준으로 충전되지 않는다). 유사하게, 본 발명에 의해 제공되는 O-RS는, 유의적 수준 또는 일부 경우에서는 검출가능한 수준으로 어떠한 내인성 tRNA도 (천연 또는 비천연) 아미노산으로 충전하지 않는다. 이 신규 조성물은 번역적으로 도입된 비천연 아미노산을 갖는 다량의 단백질이 생성되도록 한다. 페닐셀레노시스테인 비천연 아미노산의 화학적 성질은 또한 그 잔기의 표적화 변형이 원하는 접합(conjugation), 예를 들어 비제한적 예로서 지질 접합을 생성하도록 한다. 그러한 특이적으로 변형된 폴리펩티드는 치료제로서, 또한 생체의학적 연구에서 용도를 가질 수 있다.
일부 측면에서, 본 발명은 번역 시스템을 제공한다. 이 시스템은 제1 오르소고날 아미노아실-tRNA 합성효소(O-RS), 제1 오르소고날 tRNA(O-tRNA), 및 페닐셀레노시스테인인 제1 비천연 아미노산을 포함하는데, 여기에서 제1 O-RS는 제1 O-tRNA를 제1 비천연 아미노산 페닐셀레노시스테인으로 우선적으로 아미노아실화한다. 일부 측면에서, O-RS는, 동일한 O-tRNA, 페닐셀레노시스테인 및 서열 번호 4, 6 또는 8의 아미노산 서열을 포함한 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상인 효율로, O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화한다.
번역 시스템은 각종 공급원들로부터 유래된 성분을 사용할 수 있다. 한 실시양태에서, 시스템에 사용된 O-RS는 서열 번호 4, 6 또는 8의 아미노산 서열 및 이의 보존적 변이체를 포함할 수 있다. 일부 실시양태에서, O-tRNA는 엠버 억제자 tRNA이다. 일부 실시양태에서, O-tRNA는 서열 번호 1을 포함하거나 그 서열에 의해 코딩된다.
일부 측면에서, 번역 시스템은, 관심 단백질을 코딩하는 핵산을 추가로 포함하는데, 여기에서 핵산은 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈을 포함한다.
일부 측면에서, 번역 시스템은 제2 비천연 아미노산을 이용하는 제2 오르소고날 쌍(즉, 제2 O-RS 및 제2 O-tRNA)를 포함하고, 이에 따라 시스템은 이제 폴리펩티드 내의 상이한 선택된 부위에 둘 이상의 상이한 비천연 아미노산을 도입할 수 있다. 이 이중 시스템에서, 제2 O-RS는 제2 O-tRNA를 제1 비천연 아미노산과 상이한 제2 비천연 아미노산으로 우선적으로 아미노아실화하고, 제2 O-tRNA는 제1 O-tRNA에 의해 인식되는 셀렉터 코돈과 상이한 셀렉터 코돈을 인식한다.
일부 실시양태에서, 번역 시스템은 숙주 세포 내에 있다(또한, 숙주 세포를 포함한다). 사용되는 숙주 세포는, O-RS 및 O-tRNA가 숙주 세포 환경에서 자체의 오르소고날성을 보유하는 한, 특별히 한정되지 않는다. 숙주 세포는 진정세균 세포, 예컨대 E. 콜라이일 수 있다. 숙주 세포는 O-RS 또는 O-tRNA를 비롯한, 번역 시스템의 성분을 코딩하는 하나 이상의 폴리뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, O-RS를 코딩하는 폴리뉴클레오티드는 서열 번호 5, 7 또는 9의 뉴클레오티드 서열을 포함한다.
본 발명은 또한 선택된 위치에 하나 이상의 비천연 아미노산을 가지는 단백질의 생성 방법을 제공한다. 이 방법은 상기 기재된 번역 시스템을 이용한다. 일반적으로, 이 방법은, (i) 페닐셀레노시스테인인 제1 비천연 아미노산; (ii) 제1 오르소고날 아미노아실-tRNA 합성효소(O-RS); (iii) 제1 오르소고날 tRNA(O-tRNA)(여기에서, O-RS는 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화함); 및 (iv) 단백질을 코딩하는 핵산[여기에서, 핵산은 제1 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈(임의적으로 엠버 코돈)을 포함함]을 포함하는 번역 시스템을 제공하는 단계로 시작된다. 이어서 방법은 셀렉터 코돈에 대한 반응으로 단백질의 번역 과정 중에 단백질 내 선택된 위치에 비천연 아미노산을 도입함으로써, 선택된 위치에 비천연 아미노산 단백질을 생성한다. 이 방법의 일부 측면에서, O-RS는 동일한 O-tRNA, 페닐셀레노시스테인 및 서열 번호 4, 6 또는 8의 아미노산 서열을 포함하는 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상인 효율로, O-tRNA를 페닐셀레노시스테인으로 우선적으로 아미노아실화한다. 일부 측면에서, 번역 시스템은 O-RS를 코딩하는 핵산을 포함한다.
이 방법은 각종 시약을 이용하여 광범위하게 적용될 수 있다. 일부 실시양태에서, O-RS를 코딩하는 폴리뉴클레오티드가 제공된다. 일부 실시양태에서, O-RS는 서열 번호 4, 6 또는 8의 아미노산 서열, 또는 이의 보존적 변이체를 포함한다. 임의적으로, 방법에 사용되는 번역 시스템은, O-RS를 코딩하는 핵산, 예를 들어 서열 번호 5, 7 또는 9의 핵산을 포함한다.
이 방법의 일부 실시양태에서, 번역 시스템 제공 단계는 부위-지정 돌연변이유발에 의해 야생형 아미노아실-tRNA 합성효소의 아미노산 결합 포켓을 돌연변이화고, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 수득된 O-RS을 선택하는 것을 포함한다. 선택 단계는 부위-지정 돌연변이유발 후에 수득된 아미노아실-tRNA 합성효소 분자의 풀(pool)로부터 O-RS를 양성으로 또한 음성으로 선택하는 것을 포함할 수 있다. 일부 실시양태에서, 제공 단계는 O-tRNA, 예를 들어 엠버 억제자 tRNA인 O-tRNA 또는 서열 번호 1의 폴리뉴클레오티드를 포함하거나 그것에 의해 코딩되는 O-tRNA를 코딩하는 폴리뉴클레오티드를 제공한다. 이 방법들에서, 제공 단계는 또한 번역 시스템에 의해 이용되는 엠버 셀렉터 코돈을 포함하는 핵산을 제공할 수 있다.
이 방법은 또한 하나 초과의 비천연 아미노산을 단백질 내로 도입하기 위해 변형될 수 있다. 그 방법에서, 제2 오르소고날 번역 시스템이 제1 번역 시스템과 함께 이용되는데, 여기에서 제2 시스템은 상이한 아미노산 및 셀렉터 코돈 특이성을 가진다. 예를 들어, 제공 단계는 제2 O-RS 및 제2 O-tRNA를 제공하는 것을 포함할 수 있는데, 여기에서 제2 O-RS는 제2 O-tRNA를 제1 비천연 아미노산과 상이한 제2 비천연 아미노산으로 우선적으로 아미노아실화하고, 제2 O-tRNA는 제1 O-tRNA에 의해 인식되는 셀렉터 코돈과 상이한 핵산 내 셀렉터 코돈을 인식한다.
비천연 아미노산으로 단백질을 생성시키는 방법은 또한 숙주 세포와 관련하여 수행될 수 있다. 이 경우에, 비천연 아미노산, O-RS, O-tRNA, 및 단백질을 코딩하는 하나 이상의 셀렉터 코돈을 갖는 핵산을 포함하는 숙주 세포가 제공되는데, 이 때 그 숙주 세포의 배양으로 비천연 아미노산이 도입되게 된다. 일부 실시양태에서, 제공 단계는 진정세균 숙주 세포(예를 들어, E. 콜라이)를 제공하는 것을 포함한다. 일부 실시양태에서, 제공 단계는 O-RS를 코딩하는 폴리뉴클레오티드를 함유하는 숙주 세포를 제공하는 것을 포함한다. 예를 들어, O-RS를 코딩하는 폴리뉴클레오티드는 서열 번호 5, 7 또는 9의 뉴클레오티드 서열을 포함할 수 있다.
이 방법의 일부 변형법에서, 절차는 페닐셀레노시스테인을 폴리펩티드 내로 도입한 후, 그 페닐셀레노시스테인을 변형하는 단계를 추가로 포함한다. 예를 들어, 페닐셀레노시스테인은 선택된 위치에 있는 데히드로알라닌으로 전환되도록 하는 특정 조건 하에서 반응할 수 있다. 이 반응은 산화 제거에 의한 것일 수 있다. 반응은 페닐셀레노시스테인을 과산화수소에 노출함으로써 수행될 수 있다.
본 발명은 또한 지질이 표시된 선택된 위치에서 접합되는, 지질화된 단백질의 생성 방법을 제공한다. 이 방법은 상기 기재된 번역 시스템을 이용한다. 일반적으로, 이 방법은, (i) 페닐셀레노시스테인인 비천연 아미노산; (ii) 오르소고날 아미노아실-tRNA 합성효소(O-RS); (iii) 오르소고날 tRNA(O-tRNA)(여기에서, O-RS는 O-tRNA를 페닐셀레노시스테인으로 우선적으로 아미노아실화함); 및 (iv) 단백질을 코딩하는 핵산[여기에서, 핵산은 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈(임의적으로 엠버 코돈)을 포함함]을 포함하는 번역 시스템을 제공하는 단계로 시작된다. 이어서 방법은 셀렉터 코돈에 대한 반응으로 단백질의 번역 과정 중에 단백질 내 선택된 위치에 페닐셀레노시스테인을 도입한다. 이어서 그 페닐셀레노시스테인은 반응하여, 선택된 위치에 데히드로알라닌을 생성하고, 이는 다시 지질과 반응하여 지질화된 아미노산 부분을 생성하며, 이로써 단백질 내 선택된 위치에 지질을 가지는 단백질을 생성한다.
이 방법의 일부 측면에서, 페닐셀레노시스테인을 반응시킴은 산화 제거 또는 과산화수소에의 노출에 의한 것이다. 일부 측면에서, 데히드로알라닌과 반응한 접합 지질은 티오팔미트산, 파르네실머캅탄 또는 1-헥사데칸티올일 수 있다. 이에 따라 형성된, 지질화 아미노산은 팔미토일시스테인, 파르네실시스테인 및 S-헥사데실시스테인이다. 데히드로알라닌의 변형은 전형적으로 마이클 부가(Michael Addition) 반응에 의한 것이다.
본 발명은 또한 선택된 위치에 데히드로알라닌 잔기를 가지는 단백질의 생성 방법을 제공한다. 이 방법은 상기 기재된 번역 시스템을 이용한다. 일반적으로, 이 방법은, (i) 페닐셀레노시스테인인 비천연 아미노산; (ii) 오르소고날 아미노아실-tRNA 합성효소(O-RS); (iii) 오르소고날 tRNA(O-tRNA)(여기에서, O-RS는 O-tRNA를 페닐셀레노시스테인으로 우선적으로 아미노아실화함); 및 (iv) 단백질을 코딩하는 핵산[여기에서, 핵산은 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈(임의적으로 엠버 코돈)을 포함함]을 포함하는 번역 시스템을 제공하는 단계로 시작된다. 방법은 이어서 셀렉터 코돈에 대한 반응으로 단백질의 번역 과정 중에 단백질 내 선택된 위치에 페닐셀레노시스테인을 도입한다. 그 페닐셀레노시스테인은 이어서 반응하여, 선택된 위치에 데히드로알라닌을 생성한다. 이 방법들의 일부 측면에서, 페닐셀레노시스테인을 반응시킴은 산화 제거 또는 과산화수소에의 노출에 의한 것이다.
본 발명은 또한 핵산 및 단백질을 포함한 각종 조성물들을 제공한다. 조성물의 성질은, 조성물이 특정된 핵산 또는 단백질을 포함한다는 것을 제외하고는 특별히 한정되지 않는다. 본 발명의 조성물은 임의의 성질을 갖는, 임의의 수의 부가적 성분들을 포함할 수 있다.
예를 들어, 본 발명은 O-RS 폴리펩티드를 포함하는 조성물로서, 그 폴리펩티드가 서열 번호 4, 6 또는 8의 아미노산 서열, 또는 이의 보존적 변이체를 포함하는 조성물을 제공한다. 일부 측면에서, 보존적 변이체 폴리펩티드는 O-tRNA, 비천연 아미노산, 및 서열 번호 4, 6, 8 또는 10의 아미노산 서열을 포함한 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상인 효율로, 동족체(cognate) 오르소고날 tRNA(O-tRNA)를 비천연 아미노산으로 아미노아실화한다. 본 발명은 또한 상기 폴리펩티드들 중 임의의 것을 코딩하는 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 이 폴리뉴클레오티드는 서열 번호 5, 7 또는 9의 뉴클레오티드 서열을 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 세포 내에 있다.
본 발명은 또한 서열 번호 5, 7 또는 9의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 조성물을 제공한다. 일부 실시양태에서, 본 발명은 폴리뉴클레오티드를 포함하는 벡터, 예를 들어 발현 벡터를 제공한다. 일부 실시양태에서, 본 발명은 상기 기재된 벡터를 포함하는 세포를 제공한다.
정의
본 발명을 상세히 기술하기 전, 본 발명은 특별한 생물학적 시스템으로 한정되지 않으며, 그 생물학적 시스템도 물론 다양할 수 있다는 것을 이해하도록 한다. 또한, 본원에서 사용되는 용어는 특별한 실시양태를 단지 기술하기 위한 것으로, 한정하기 위한 것은 아님을 이해하도록 한다. 본 명세서 및 첨부된 청구의 범위에 사용되는, 단수 형태는 내용상 명확히 달리 명시하지 않는 한 복수 형태의 언급된 대상을 포함한다. 따라서, 예를 들어 "세포"라는 언급은 둘 이상의 세포의 조합물을 포함하고; "폴리뉴클레오티드"라는 언급은 실질적으로 그 폴리뉴클레오티드의 많은 복사체들을 포함한다.
여기에서 및 본 명세서의 하기 나머지 부분에서 달리 정의하지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 분야에서 통상의 기술을 가진 자에 의해 통상적으로 이해되는 바와 동일한 의미를 가진다.
오르소고날(Orthogonal): 본원에서 사용되는 용어 "오르소고날"은 세포 또는 번역 시스템에 대한 내인성을 가진 상응하는 분자에 비해 감소된 효율을 가진 세포의 내인성 성분들과 함께 작용하거나, 세포의 내인성 성분들과 함께 작용하지 못하는 분자(예를 들어, 오르소고날 tRNA(O-tRNA) 및/또는 오르소고날 아미노아실-tRNA 합성효소(O-RS))를 지칭한다. tRNA 및 아미노아실-tRNA 합성효소의 문맥에서, 오르소고날은 내인성 tRNA 합성효소와 함께 작용하는 내인성 tRNA에 비해 내인성 tRNA 합성효소와 함께 작용하는 오르소고날 tRNA, 또는 내인성 tRNA와 함께 작용하는 내인성 tRNA 합성효소에 비해 내인성 tRNA와 함께 작용하는 오르소고날 아미노아실-tRNA 합성효소의 불능 또는 감소된 효율, 예컨대 20% 미만의 효율, 10% 미만의 효율, 5% 미만의 효율 또는 1% 미만의 효율을 의미한다. 오르소고날 분자는 세포 내에서 기능적으로 정상인 내인성 상보적 분자를 가지지 않는다. 예를 들어, 세포 내 오르소고날 tRNA는 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비해 감소되거나 심지어 0%인 효율로 세포의 임의의 내인성 RS에 의해 아미노아실화된다. 또 다른 예에서, 오르소고날 RS는 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비해 감소되거나 심지어 0%인 효율로 관심 세포의 임의의 내인성 tRNA를 아미노아실화한다. 제1 오르소고날 분자와 함께 작용하는 제2 오르소고날 분자를 세포 내로 도입할 수 있다. 예를 들어, 오르소고날 tRNA/RS 쌍은 대조군, 예컨대 상응하는 tRNA/RS 내인성 쌍 또는 활성 오르소고날 쌍(예를 들어, 티로실 오르소고날 tRNA/RS 쌍)의 효율에 비해 일정 효율(예를 들어, 45% 효율, 50% 효율, 60% 효율, 70% 효율, 75% 효율, 80% 효율, 90% 효율, 95% 효율 또는 99% 이상의 효율)로 세포 내에서 함께 작용하는, 도입된 상보적 성분들을 포함한다.
오르소고날 티로실-tRNA: 본원에서 사용되는 오르소고날 티로실 tRNA(티로실-O-tRNA)는 관심 번역 시스템에 대해 오르소고날성을 갖는 tRNA이며, 여기에서 tRNA는 (1) 천연 발생 티로실-tRNA와 동일하거나 실질적으로 유사하거나, (2) 천연 또는 인공 돌연변이유발에 의해 천연 발생 티로실-tRNA로부터 유도되거나, (3) (1) 또는 (2)의 야생형 또는 돌연변이체 티로실-tRNA의 서열을 취하는 임의의 과정에 의해 유도되거나, (4) 야생형 또는 돌연변이체 티로실-tRNA와 상동성을 나타내거나, (5) 도 2에서 티로실-tRNA 합성효소에 대한 기질로서 표시된 임의의 예시적 tRNA와 상동성을 나타내거나, (6) 도 2에서 티로실-tRNA 합성효소에 대한 기질로서 표시된 임의의 예시적 tRNA의 보존적 변이체이다. 티로실-tRNA는 아미노산으로 충전된 상태로 존재할 수 있거나 충전되지 않은 상태로 존재할 수 있다. "티로실-O-tRNA"는 동족체 합성효소에 의해 티로신 또는 류신 외의 아미노산, 예컨대 비천연 아미노산으로 임의적으로 충전(아미노아실화)된다는 것도 이해하도록 한다. 사실상, 본 발명의 티로실-O-tRNA는 번역과정 동안에 셀렉터 코돈에 대한 반응으로 본질적으로 임의의 천연 또는 인공 아미노산을 성장하는 폴리펩티드 내로 삽입시키는 데 유리하게 사용된다는 것을 인식할 것이다.
오르소고날 티로실 아미노산 합성효소: 본원에서 사용되는 오르소고날 티로실 아미노산 합성효소(티로실-O-RS)는 관심 번역 시스템 내에서 티로실-O-tRNA를 아미노산으로 우선적으로 아미노아실화하는 효소이다. 티로실-O-RS가 티로실-O-tRNA 상에 로딩하는 아미노산은 임의의 천연, 비천연 또는 인공 아미노산일 수 있고 본원에서 한정되지 않는다. 그 합성효소는 임의적으로 천연 발생 티로실 아미노산 합성효소와 동일하거나 상동성을 나타내거나, 도 2에서 O-RS로서 표시된 합성효소와 동일하거나 상동성을 나타낸다. 예를 들어, O-RS는 도 2의 티로실-O-RS의 보존적 변이체일 수 있고/있거나, 도 2의 O-RS와 서열이 50%, 60%, 70%, 80%, 90%, 95%, 98% 또는 99% 이상 동일할 수 있다.
동족체(cognate): 용어 "동족체"는, 예를 들어 오르소고날 tRNA 및 오르소고날 아미노아실-tRNA 합성효소와 함께 작용하거나 서로에 대한 특이성의 일부를 가지는 성분들을 지칭한다. 그 성분들은 상보적인 것으로서 지칭될 수도 있다.
우선적으로 아미노아실화 한다: 오르소고날 번역 시스템에 대하여 본원에서 사용되는 O-RS는 그 자신이 발현 시스템 내에서 임의의 내인성 tRNA를 충전시키는 것보다 더 효율적으로 O-tRNA를 아미노산으로 충전시킬 때 동족체 O-tRNA를 "우선적으로 아미노아실화한다". 즉, O-tRNA 및 임의의 소정의 내인성 tRNA가 대략적으로 동등한 몰 비로 번역 시스템에 존재하는 경우, O-RS는 내인성 tRNA를 충전시키는 것보다 더 자주 O-tRNA를 충전시킬 것이다. 바람직하게는, O-tRNA 및 내인성 tRNA가 동등한 몰 농도로 번역 시스템에 존재하는 경우, ORS에 의해 충전된 내인성 tRNA에 대한 O-RS에 의해 충전된 O-tRNA의 상대적 비율은 바람직하게는 O-RS가 O-tRNA만을 충전시키거나 거의 O-tRNA만을 충전시킬 정도로 높다. O-tRNA 및 O-RS가 동등한 몰 농도로 존재하는 경우, O-RS에 의해 충전되는 O-tRNA와 내인성 tRNA 사이의 상대적 비율은 1:1 초과, 바람직하게는 약 2:1 이상, 보다 바람직하게는 5:1, 보다 더 바람직하게는 10:1, 더욱 더 바람직하게는 20:1, 더욱 더 바람직하게는 50:1, 보다 더 바람직하게는 75:1, 더욱 더 바람직하게는 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 또는 그 이상이다.
O-RS는 (a) O-RS가 내인성 tRNA에 비해 O-tRNA를 우선적으로 아미노아실화하는 경우, 및 (b) O-RS가 O-tRNA를 임의의 천연 아미노산으로 아미노아실화하는 것에 비해 아미노아실화가 비천연 아미노산에 대해 특이적인 경우, "O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다". 즉, 비천연 아미노산 및 천연 아미노산이 O-RS 및 O-tRNA를 포함하는 동몰 양으로 번역 시스템에 존재하는 경우, O-RS는 천연 아미노산보다 더 빈번하게 비천연 아미노산을 O-tRNA에 로딩할 것이다. 바람직하게는, 천연 아미노산으로 충전된 O-tRNA에 대한 비천연 아미노산으로 충전된 O-tRNA의 상대적 비율은 높다. 보다 바람직하게는, O-RS는 O-tRNA만을, 또는 거의 O-tRNA만을 비천연 아미노산으로 충전한다. 천연 아미노산 및 비천연 아미노산이 동몰 농도로 번역 시스템에 존재하는 경우, 비천연 아미노산을 사용한 O-tRNA의 충전과 천연 아미노산을 사용한 O-tRNA의 충전 사이의 상대적 비율은 1:1 초과, 바람직하게는 약 2:1 이상, 보다 바람직하게는 5:1, 보다 더 바람직하게는 10:1, 더욱 더 바람직하게는 20:1, 더욱 더 바람직하게는 50:1, 더욱 더 바람직하게는 75:1, 더욱 더 바람직하게는 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 또는 그 이상이다.
셀렉터 코돈: 용어 "셀렉터 코돈"은 번역과정에서 O-tRNA에 의해서는 인식되나 내인성 tRNA에 의해서는 인식되지 않는 코돈을 지칭한다. O-tRNA 안티코돈 루프(loop)는 mRNA 상의 셀렉터 코돈을 인식하여 그의 아미노산, 예컨대 비천연 아미노산을 폴리펩티드 내의 인식된 부위 내로 도입한다. 셀렉터 코돈은, 예를 들어 넌센스(nonsense) 코돈, 예컨대 정지 코돈, 예를 들어 앰버(amber), 오커(ochre) 및 오팔(opal) 코돈; 4개 이상의 염기로 이루어진 코돈; 희귀 코돈; 천연 또는 비천연 염기 쌍 등으로부터 유도된 코돈 등을 포함할 수 있다.
억제자( suppressor ) tRNA: 억제제 tRNA는 전형적으로 폴리펩티드의 번역 과정 중에 예를 들어 셀렉터 코돈에 대한 반응으로 아미노산을 도입함으로써 소정의 번역 시스템 내의 메신저 RNA(mRNA)의 판독을 변경시키는 tRNA이다. 일부 측면에서, 본 발명의 셀렉터 코돈은 억제자 코돈, 예를 들어 정지 코돈(예를 들어, 앰버, 오커 또는 오팔 코돈), 4 염기 코돈, 희귀 코돈 등이다.
억제 활성: 본원에서 사용되는 용어 "억제 활성"은 일반적으로, 다른 경우라면 번역의 종료 또는 오역(mistranslation)(예를 들어, 프레임이동)을 초래하게 되는 코돈(예를 들어, 앰버 코돈 또는 4개 이상의 염기로 이루어진 코돈인 셀렉터 코돈)을 통한 번역 판독을 허용하는 tRNA(예를 들어, 억제자 tRNA)의 능력을 지칭한다. 억제자 tRNA의 억제 활성은 제2 억제자 tRNA에 비해, 또는 대조군 시스템, 예컨대 O-RS가 결여된 대조군 시스템에 비해, 관찰된 번역 판독 활성율(%)로서 표시될 수 있다.
본 발명은 억제 활성을 정량화할 수 있는 다양한 방법을 제공한다. 관심 셀렉터 코돈(예를 들어, 앰버 코돈)에 대한 특별한 O-tRNA 및 O-RS의 억제율은 그 자산을 코딩하는 핵산 내에 셀렉터 코돈을 포함하는 소정의 발현된 시험 마커(예를 들어, LacZ)가 관심 번역 시스템에서 나타내는 활성율(%)을 지칭하는데, 여기에서 관심 발현 시스템은 양성 대조군 구축물(construct)에 비해 O-RS 및 O-tRNA를 포함하고, 여기에서 양성 대조군은 O-tRNA, O-RS 및 셀렉터 코돈을 가지지 않는다. 따라서, 예를 들어 셀렉터 코돈을 가지지 않은 활성 양성 대조군 마커 구축물이 소정의 번역 시스템에서 해당 마커 분석에 대한 유니트(unit)로 X의 관찰된 활성을 나타내는 경우, 셀렉터 코돈을 포함하는 시험 구축물의 억제율(%)은 시험 마커 구축물이 O-tRNA 및 O-RS를 포함하는 번역 시스템에서 발현된다는 점을 제외하고 양성 대조군 마커가 발현된 환경 조건과 본질적으로 동일한 환경 조건 하에서 시험 마커 구축물이 나타내는 X의 활성율(%)이다. 전형적으로, 시험 마커를 발현하는 번역 시스템은 또한 O-RS 및 O-tRNA에 의해 인식되는 아미노산도 포함한다. 임의적으로, 억제율(%) 측정은 O-tRNA 및/또는 O-RS에 의해 인식되는 O-tRNA, O-RS 및/또는 관련 아미노산을 포함하지 않는 시스템에서 시험 마커와 동일한 셀렉터 코돈을 포함하는 "배경" 또는 "음성" 대조군 마커 구축물과 시험 마커의 비교에 의해 달성된다. 이 음성 대조군은 관심 번역 시스템에서 마커로부터의 배경 신호 효과를 고려하여 억제율 측정을 표준화하는 데 유용하다.
억제 효율은 당업계에 공지된 다수의 검정 중 임의의 검정에 의해 결정될 수 있다. 예를 들어, β-갈락토시다제 리포터 검정이 이용될 수 있는데, 예를 들어 유도체화된 lacZ 플라스미드(이 때, 구축물은 lacZ 핵산 서열 내에 셀렉터 코돈을 가짐)가 본 발명의 O-tRNA를 포함하는 플라스미드와 함께 적절한 유기체(예를 들어, 오르소고날 성분들이 사용될 수 있는 유기체)로부터 유래된 세포 내로 도입된다. 동족체 합성효소도 또한 (발현된 경우에는 동족체 합성효소를 코딩하는 폴리펩티드 또는 폴리튜클레오티드로서) 도입될 수 있다. 세포는 소정의 밀도, 예를 들어 약 0.5의 OD600까지 배지 중에서 성장시키고, β-갈락토시다제 검정을, 예컨대 베타플루오르(BetaFluor)TM β-갈락토시다제 분석 키트[노바겐(Novagen)]를 사용하여 수행한다. 억제율(%)은 비교 대조군에 대한 상대적인 샘플 활성율로서, 예를 들어 셀렉터 코돈보다 원하는 위치에서 상응하는 센스 코돈을 가진 유도체화된 lacZ 구축물로부터 관찰된 값으로서 계산될 수 있다.
번역 시스템: 용어 "번역 시스템"은 아미노산을 성장하는 폴리펩티드 쇄(단백질) 내로 도입하는 성분을 지칭한다. 번역 시스템의 성분은, 예를 들어 리보좀, tRNA, 합성효소, mRNA 등을 포함할 수 있다. 본 발명의 O-tRNA 및/또는 O-RS는 시험관내 또는 생체내 번역 시스템, 예를 들어 비-진핵 세포, 예컨대 (E. 콜라이와 같은) 세균, 또는 진핵 세포, 예컨대 효모 세포, 포유동물 세포, 식물 세포, 해조류 세포, 진균류 세포, 곤충 세포 등에 첨가될 수 있거나 이들의 일부일 수 있다.
비천연 아미노산: 본원에서 사용되는 용어 "비천연 아미노산"은 20종의 공통된 천연 발생 아미노산 중 하나가 아닌 임의의 아미노산, 변형된 아미노산 및/또는 아미노산 유사체를 지칭한다. 예를 들어, 비천연 아미노산인 페닐셀레노시스테인(도 1, 구조 1 참조)이 본 발명에서 사용될 수 있다.
~로부터 유도된: 본원에서 사용되는 용어 "~로부터 유도된"은 특별한 분자 또는 유기체로부터 단리되거나, 특별한 분자 또는 유기체 또는 특별한 분자 또는 유기체의 정보를 사용하여 만든 성분을 지칭한다. 예를 들어, 제2 폴리펩티드로부터 유도된 폴리펩티드는 제2 폴리펩티드의 아미노산 서열과 동일하거나 실질적으로 유사한 아미노산 서열을 포함할 수 있다. 폴리펩티드의 경우, 유도된 종은, 예를 들어 천연 발생 돌연변이유발, 인공 지정 돌연변이유발 또는 인공 랜덤 돌연변이유발에 의해 수득될 수 있다. 폴리펩티드를 유도하는 데 이용되는 돌연변이유발은 의도적으로 지정될 수 있거나 의도적으로 무작위적일 수 있거나, 각각의 조합일 수 있다. 제1 폴리펩티드로부터 유도된 상이한 폴리펩티드를 생성하기 위한 폴리펩티드의 돌연변이유발은 (예를 들어, 중합효소 부정확성에 의해 야기된) 무작위적 사건일 수 있고, 유도된 폴리펩티드는, 예를 들어 본원에서 논의된 바와 같은, 적절한 선택 방법에 의해 동정될 수 있다. 폴리펩티드의 돌연변이유발은 전형적으로 그 폴리펩티드를 코딩하는 폴리뉴클레오티드의 조작을 수반한다.
양성 선택(selection) 또는 선별(screening) 마커: 본원에서 사용되는 용어 "양성 선택 또는 선별 마커"는 존재하는 경우, 예컨대 발현되거나 활성화 등이 일어난 경우 특징을 갖는 세포 예를 들어, 양성 선택 마커를 가진 세포를 그 특징을 가지지 않는 세포로부터 구별시켜주는 마커를 지칭한다.
음성 선택 또는 선별 마커: 본원에서 사용되는 용어 "음성 선택 또는 선별 마커"는 존재하는 경우, 예컨대 발현되거나 활성화 등이 일어난 경우(예를 들어, 선택된 성질 또는 특징을 갖는 세포와 비교할 때) 상기 성질 또는 특징을 가지지 않는 세포를 구별시켜주는 마커를 지칭한다.
리포터: 본원에서 사용되는 용어 "리포터"는 관심 시스템의 표적 성분들을 동정하고/하거나 선택하는 데 사용될 수 있는 성분을 지칭한다. 예를 들어, 리포터는 항생제 내성 또는 감수성을 부여하는 단백질, 예컨대 효소(예를 들어, β-락타마제, 클로람페니콜 아세틸트랜스퍼라제(CAT) 등), 형광 선별 마커(예를 들어, 녹색 형광 단백질(예를 들어, (GFP), YFP, EGFP, RFP 등), 발광 마커(예를 들어, 초파리 루시퍼라제 단백질), 친화성 기초 선별 마커, 또는 양성 또는 음성 선택가능한 마커 유전자, 예컨대 lacZ, β-gal/lacZ(β-갈락토시다제), ADH(알코올 탈수소효소), his3, ura3, leu2, lys2 등을 포함할 수 있다.
진핵생물: 본원에서 사용되는 용어 "진핵생물"은 진핵생물 계에 속하는 유기체를 지칭한다. 일반적으로, 진핵생물은 그들의 전형적인 다세포 조직화(단, 오로지 다세포 조직화로만 한정되지 않음; 예컨대, 효모), 막-결합 핵 및 다른 막-결합 소기관의 존재, 선형 유전 물질(예를 들어, 선형 염색체), 오페론의 부재, 인트론, 메세지 캡핑(message capping) 및 폴리-A mRNA의 존재, 및 다른 생화학적 특징, 예컨대 구별가능한 리보좀 구조에 의해 원핵생물로부터 구별될 수 있다. 진핵생물은, 예를 들어 동물(예를 들어, 포유동물, 곤충, 파충류, 조류 등), 섬모충, 식물(예를 들어, 단자엽, 쌍자엽, 해조류 등), 진균류, 효모, 편모충, 미포자충(microsporidia), 원생생물 등을 포함한다.
원핵생물: 본원에서 사용되는 용어 "원핵생물"은 모네라 계(Kingdom Monera)(원핵생물계로도 지칭됨)에 속하는 유기체를 지칭한다. 일반적으로, 원핵생물은 그들의 단세포 조직화, 발아 또는 분열(fission)에 의한 무성 생식, 막-결합 핵 또는 다른 막-결합 소기관의 부재, 원핵 염색체, 오페론의 존재, 인트론, 메세지 캡핑 및 폴리-A mRNA의 부재, 및 다른 생화학적 특징, 예컨대 구별가능한 리보좀 구조에 의해 진핵생물로부터 구별될 수 있다. 원핵생물에는 진정세균(Eubacteria) 및 고세균(Archaea)(종종 "원시세균(Archaebacteria)"으로 불림)이 포함된다. 시아노박테리아(청녹색 해조류) 및 마이코플라즈마는 종종 모네라계하에 별도로 분류된다.
세균: 본원에서 사용되는 용어 "세균" 및 "진정세균"은 고세균으로부터 구별될 수 있는 원핵생물을 지칭한다. 유사하게, 고세균은 진정세균으로부터 구별될 수 있는 원핵생물을 지칭한다. 진정세균과 고세균은 다수의 형태학적 및 생화학적 기준에 의해 구별될 수 있다. 예를 들어, 리보좀 RNA 서열에서의 차이, RNA 중합효소 구조, 인트론의 존재 또는 부재, 항생제 감수성, 세포 벽 펩티도글리칸 및 다른 세포 벽 성분들의 존재 또는 부재, 막 지질의 분지 구조 대 비분지 구조, 및 히스톤 및 히스톤-유사 단백질의 존재/부재를 이용하여 유기체를 진정세균 또는 고세균으로 분류한다.
진정세균의 예에는 에쉐리키아 콜라이, 써머스 써모필러스( Thermus thermophilus)바실러스 스테아로써모필러스( Bacillus stearothermophilus )가 포함된다. 고세균의 예에는 메타노코커스 잔나쉬이( Methanococcus jannaschii)(Mj), 메타노사르시나 메이제이 ( Methanosarcina mazei )( Mm ), 메타노박테리움 써모오토트로피 컴( Methanobacterium thermoautotrophicum )( Mt ), 메타노코커스 마리팔루디스( Methanococcus maripaludis ), 메타노파이러스 칸들레 리(Methanopyrus kandleri), 할로박테리움, 예컨대 할로페락스 볼케니이(Haloferax volcanii) 할로박테리움 NRC-1, 아카에오글로버스 풀기더스(Archaeoglobus fulgidus)(Af), 파이로코커스 푸리오서스 ( Pyrococcus furiosus )( Pf ), 파이로코커스 호리코쉬이 ( Pyrococcus horikoshii )( Ph ), 파이로바큘럼 애로필럼 ( Pyrobaculum aerophilum ), 파이로코커스 애비스시( Pyrococcus abyssi), 설폴로버스 솔파타리커스 ( Sulfolobus solfataricus )( Ss ), 설폴로버스 토코다이이( Sulfolobus tokodaii ), 애우로파이럼 페르닉스 ( Aeuropyrum pernix )( Ap ), 써모플라스마 애시도필럼 ( Thermoplasma acidophilum ) 써모플라스마 볼케이늄( Thermoplasma volcanium)이 포함된다.
보존적 변이체: 본원에서 사용되는, 번역 성분의 영역에서의 용어 "보존적 변이체"는 기능적으로 기준 성분과 유사한 작용을 하는 번역 성분, 예를 들어 보존적 변이체 O-tRNA 또는 보존적 변이체 O-RS를 지칭하고, 기준 O-tRNA 또는 O-RS와 비교할 때 서열 내에 변이를 가진 보존적 변이체는, 예를 들어 O-tRNA 또는 O-RS와 유사하다. 예를 들어, O-RS 또는 이 O-RS의 보존적 변이체는 동족체 O-tRNA를 비천연 아미노산, 예를 들어 N-아세틸갈락토스아민 잔기를 포함하는 아미노산으로 아미노아실화할 것이다. 본 실시예에서, O-RS와 보존적 변이체 O-RS는 동일한 아미노산 서열을 가지지 않는다. 보존적 변이체가 동족체의 상응하는 O-tRNA 또는 O-RS와 여전히 상보적인(예를 들어, 그것과 작용하는) 한, 그 보존적 변이체는 서열 내에 예를 들어, 1개의 변이, 2개의 변이, 3개의 변이, 4개의 변이 또는 5개 이상의 변이를 가질 수 있다.
일부 실시양태에서, 보존적 변이체 O-RS는 그 자신의 기원인 O-RS에 비해 하나 이상의 보존적 아미노산 치환을 포함한다. 일부 실시양태에서, 보존적 변이체 O-RS는 그 자신의 기원인 O-RS에 비해 하나 이상의 보존적 아미노산 치환을 포함할 뿐만 아니라, O-RS의 생물학적 활성을 보유하는데, 예를 들어 보존적 변이체 O-RS는 그 자신의 기원인 모 O-RS의 생물학적 활성의 10% 이상, 또는 20% 이상, 30% 이상 또는 40% 이상을 보유한다. 일부 바람직한 실시양태에서, 보존적 변이체 O-RS는 그 자신의 기원인 모 O-RS 분자의 생물학적 활성의 50% 이상을 보유한다. 보존적 변이체 O-RS의 보존적 아미노산 치환은 아미노산 결합 포켓을 포함한 O-RS의 임의의 도메인에서 일어날 수 있다.
선택 또는 선별제: 본원에서 사용되는 용어 "선택 또는 선별제"는 존재하는 경우, 집단으로부터 특정 성분들의 선택/선별을 가능하게 하는 시약을 지칭한다. 예를 들어, 선택 또는 선별제는, 예를 들어 영양소, 항생제, 광 파장, 항체, 발현된 폴리뉴클레오티드 등일 수 있으나, 이들로 한정되지 않는다. 선택제는, 예를 들어 농도, 강도 등에 의해 다양해질 수 있다.
~에 대한 반응으로: 본원에서 사용되는 용어 "~에 대한 반응으로"는 본 발명의 O-tRNA가 셀렉터 코돈을 인식하고 그 tRNA에 결합된 비천연 아미노산이 성장하는 폴리펩티드 쇄 내로 도입되는 것을 매개하는 과정을 지칭한다.
코딩하다: 본원에서 사용되는 용어 "코딩하다"는 중합체성 거대분자 또는 서열 스트링(string) 내의 정보를 사용하여 제1 분자 또는 서열 스트링과 상이한 제2 분자 또는 서열 스트링을 생성시키는 임의의 과정을 지칭한다. 본원에서 사용되는 상기 용어는 광범위하게 사용되며, 다양하게 응용될 수 있다. 일부 측면에서, 용어 "코딩하다"는, 이중-가닥 DNA 분자의 한 가닥이 DNA-의존성 DNA 중합효소에 의해 새로이 합성된 상보적 시스터 가닥을 코딩하기 위한 주형으로서 사용되는, 반-보존적 DNA 복제 과정을 지칭한다.
또 다른 측면에서, 용어 "코딩하다"는 한 분자 내의 정보를 사용하여 제1 분자와 상이한 화학적 성질을 가진 제2 분자를 생성시키는 임의의 과정을 지칭한다. 예를 들어, DNA 분자는 (예를 들어, DNA-의존성 RNA 중합효소를 사용하는 전사 과정에 의해) RNA 분자를 코딩할 수 있다. 또한, RNA 분자는 번역 과정에서와 같이 폴리펩티드를 코딩할 수 있다. 번역 과정을 기술하는 데 사용되는 용어 "코딩하다"는 아미노산을 코딩하는 3 염기 코돈으로 확장된다. 일부 측면에서, RNA 분자는, 예를 들어 RNA-의존성 DNA 중합효소를 사용하는 역전사 과정에 의해 DNA 분자를 코딩할 수 있다. 또 다른 측면에서, DNA 분자는 폴리펩티드를 코딩할 수 있는데, 여기에서 이 경우에서 사용되는 "코딩하다"는 전사 과정 및 번역 과정 양자 모두를 수반한다는 것을 이해할 것이다.
도 1은 비천연 아미노산 페닐셀레노시스테인의 화학 구조(구조 1), 및 페닐셀레노시스테인으로부터 유래될 수 있는 구조를 제공한다. 이 구조에는 데히드로알라닌(2), 팔미토일시스테인(3), 파르네실시스테인(4), S-헥사데실시스테인(5) 및 감마-카르복시글루탐산(6)이 포함된다.
도 2는 본 발명에 따른 각종 용도를 갖는 뉴클레오티드 및 아미노산 서열을 제공한다.
발명의 상세한 설명
본 발명은 20종의 천연 발생 아미노산에 의해 한정되는 번역 시스템을 이용한다는 고유의 제한점에 대한 해결책을 제공한다. 그 해결책에는, 오르소고날 번역 시스템을 이용한 비천연 아미노산 페닐셀레노시스테인(도 1, 구조 1)의 단백질로의 프로그램화 부위-특이적 생합성 도입과 관련된 조성물 및 방법이 포함된다. 페닐셀레노시스테인의 단백질로의 도입은, 비천연 아미노산의 성장하는 폴리펩티드 사슬 내로의 도입에 대한 신호를 전달하는 셀렉터 코돈을 함유한 관심 단백질을 코딩하는 폴리뉴클레오티드를 공학처리(engineering)함으로써 임의의 원하는 위치에 일어나도록 프로그램화될 수 있다.
본 발명은 적당한 동족체 억제자 O-tRNA(를 들어, 서열 번호 1의 O-tRNA)를 페닐셀레노시스테인으로 충전하는 능력을 갖는 신규 아미노아실-tRNA 합성효소(O-RS)를 포함하는 신규 조성물을 제공한다. 이 O-RS는 세균 숙주 세포에서 O-tRNA를 비천연 아미노산 페닐셀레노시스테인으로 선택적으로 충전하는 메타노코커스 잔나쉬이 티로실-tRNA 합성효소의 신규 돌연변이체이다. 가장 바람직하게는, 오르소고 날 성분은 숙주 세포(예를 들어, E. 콜라이 세포)의 번역 기구의 내인성 숙주 성분과 상호작용하지 않는다.
본 발명의 O-RS는 서열 번호 4, 6 또는 8의 O-RS를 포함할 수 있다. 본 발명은 또한 이 O-RS 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 본 개시 내용은 또한 셀렉터 코돈에 대한 반응으로 페닐셀레노시스테인 비천연 아미노산을 부위-특이적으로 도입하기 위해 진정세균 내에서 기능하는 신규 O-tRNA/O-RS 쌍의 진화를 위한 방법을 기술한다.
본 발명은 또한 셀렉터 코돈(예를 들어, 엠버 넌센스 코돈, TAG)에 대한 반응으로 단백질에 (바람직하게는 생체내) 페닐셀레노시스테인(도 1, 구조 1)을 매우 효율적이고 부위-특이적으로 유전 도입하기 위한 방법을 제공한다. 유전적으로 이 신규 방법 및 조성물은 예를 들어 세균의 숙주 시스템에 사용될 수 있다.
일부 경우에서, 페닐셀레노시스테인 비천연 아미노산은 이어서 본 개시 내용에 기재된 바와 같이, 폴리펩티드 내로 도입된 후에, 특이적으로 또한 입체선택적으로 변형될 수 있다. 페닐셀레노기의 반응 화학으로 인해, 비천연 아미노산이 도입되는 단백질이 극히 높은 선택도로 변형될 수 있다. 일부 경우에서, 페닐셀레노시스테인 비천연 아미노산 반응성 기는 생체내 시스템과 완전히 단리되어, 반응 선택도를 향상시킨다는 이점을 가진다. 일부 측면에서, 변형 반응이 단백질을 수반하는 시험관내 및 생체내 접합 반응 모두를 허용하는, 비교적 온화한 반응 조건을 이용하고, 숙주 세포 생육성 및/또는 단백질 생물학적 활성을 보존함으로써 수행될 수 있다.
일부 측면에서, 도입된 페닐셀레노시스테인 부분이 변형되고, 그 변형된 생성물은 이어서 예를 들어 접합 반응에 의해 다시 변형된다.
(단백질을 코딩하는 개방 해독 프레임(open reading frame) 내 셀렉터 코돈에 상응하는) 단백질 내 선택된 위치에 궁극적으로 접합되는 물질의 성질은 특별히 한정되지 않고, 임의의 원하는 실체, 예를 들어 지질, 염료, 형광체, 가교제, 당류 유도체, 중합체(예를 들어, 폴리에틸렌 글리콜의 유도체), 광가교제, 세포독성 화합물, 친화성 표제, 비오틴의 유도체, 수지, 비이드, 제2 단백질 또는 폴리펩티드(또는 그 이상 차수의 것), 폴리뉴클레오티드(들)(예를 들어, DNA, RNA 등), 금속 킬레이트화제, 보조인자, 지방산, 탄수화물 등이 포함된다.
일부 측면에서, 본 발명을 입증하기 위해(다만, 본 발명을 한정하지 않음), 본원의 개시 내용은 모델 단백질, 예를 들어 미오글로빈, 인간 성장 호르몬 및 GFP 내로 도입된 페닐셀레노시스테인 비천연 아미노산 부분을 기술한다. 페닐셀레노시스테인 비천연 아미노산의 도입이 임의의 특별한 단백질에 한정되는 것으로 의도되지 않는다. 페닐셀레노시스테인 비천연 아미노산의 임의의 원하는 관심 단백질로의 도입이 본 개시 내용의 지침을 이용하여 달성될 수 있음이 명백할 것이다. 단독으로 또는 다른 상이한 비천연 아미노산과 조합되는 하나 이상의 페닐셀레노시스테인 비천연 아미노산을 포함하는 단백질의 발생은 각종 목적들을 위해, 예를 들어 치료 단백질에서의 용도 및 연구 목적을 위한 용도에 유리하다.
페닐셀레노시스테인의 변형
일부 측면에서, 본 발명은 페닐셀레노시스테인 아미노산 잔기의 폴리펩티드 내로 도입된 후의 페닐셀레노시스테인 아미노산 잔기의 변형 방법을 제공한다. 그러한 한 변형, 예를 들어 산화 절단은 페닐셀레노시스테인 아미노산 잔기를 α,β-불포화 아미노산 데히드로알라닌(도 1, 구조 2 참조)로 유리하게 전환시킬 수 있다. 이 데히드로알라닌 비천연 아미노산은 또한 반응성이고, 후속하여 변형될 수 있다.
본 발명은 페닐셀레노시스테인을 데히드로알라닌으로 전환시키기 위한, 임의의 특별한 메커니즘(예를 들어, 산화 제거) 또는 특이적 반응 조건(예를 들어, 과산화수소에의 노출)에 한정되는 것으로 의도되지 않는다. 당업자는 페닐셀레노시스테인 잔기를 데히드로알라닌으로 전환하기 위해 본 발명에서 동등하게 사용될 수 있는 각종 적당한 대안적 메커니즘 및 반응 조건을 인식할 것이다.
데히드로알라닌의 변형
일부 측면에서, 본 발명은 폴리펩티드 내의 데히드로알라닌 비천연 아미노산 잔기의 추가 변형 방법을 제공한다. 데히드로알라닌 잔기는 반응성이고, 매우 특이적인 변형 반응에서 표적화될 수 있다. 이 방법은 지질화된 단백질을 생성하기 위해 지질 접합체를 형성하는 데 특히 유용하다.
본원에 기재된 바와 같이, 비천연 아미노산 데히드로알라닌의 마이클 부가 반응은 프로그램화된 부위-특이적 번역후 변형을 갖는 단백질을 초래한다. 예를 들어, 데히드로알라닌의 티오-지질과의 반응은 지질화된 단백질을 발생시킬 수 있다. 예를 들어, 티오팔미트산과 반응은 팔미토일시스테인(도 1, 구조 3 참조)을 초래하고, 파르네실머캅탄과 반응은 파르네실시스테인을 생성하며(도 1, 구조 4 참조), 말론산염과의 반응은 γ-카르복시글루탐산을 생성시킨다(도 1, 구조 6 참조). 또한, 1-헥사데칸티올과의 반응은 S-헥사데실시스테인(도 1, 구조 5 참조)을 초래한다.
본 명세서가 이 예들을 제공하고 있으나, 본 발명은 데히드로알라닌의 변형(접합)에서 임의의 특별한 메카니즘(예를 들어, 마이클 부가 경로) 또는 특이적 시약(티오-지질)에 한정되는 것으로 의도되지 않는다. 당업자는 데히드로알라닌 잔기의 변형을 위해 본 발명에서 동등하게 사용될 수 있는 각종 적당한 대안적 메카니즘, 반응 조건 및 시약을 인식할 것이다. 실제로, 데히드로알라닌 잔기의 변형은 지질 접합에 한정되지 않고, 이 접합 메커니즘은 데히드로알라닌의 부위에서 폴리펩티드에 임의의 원하는 부분에 접합되도록 사용될 수 있다.
오르소고날 tRNA / 아미노아실 - tRNA 합성효소 기술
본 발명의 신규 조성물 및 방법의 이해는 오르소고날 tRNA 및 오르소고날 아미노아실-tRNA 합성효소 쌍과 관련된 활성의 이해를 필요로 한다. 부가적 비천연 아미노산을 유전 코드에 부가하기 위해, 숙주 번역 기구에서 효율적으로 작용할 수 있으면서도, 당해 번역 시스템에 대한 내인성 합성효소 및 tRNA와 무관하게 작용한다는 의미에서, 당해 번역 시스템에 대해 "오르소고날" 성질을 갖는 아미노아실-tRNA 합성효소 및 적절한 tRNA를 포함하는 신규 오르소고날 쌍이 필요하다. 오르소고날 쌍의 원하는 특징은 임의의 내인성 tRNA에 의해 해독되지 않는 특정한 코돈, 예를 들어 셀렉터 코돈만을 해독하거나 인식하는 tRNA, 및 그의 동족체 tRNA를 1개의 특정한 비천연 아미노산으로만 우선적으로 아미노아실화하는 (또는 "충전시키 는") 아미노아실-tRNA 합성효소를 포함한다. 또한, O-tRNA는 전형적으로 내인성 합성효소에 의해 아미노아실화되지 않는다 (또는 아미노아실화가 잘 되지 않는다). 예를 들어, E. 콜라이 숙주 시스템에서 오르소고날 쌍은, 예를 들어 E. 콜라이에서 40종이 존재하는 임의의 내인성 tRNA와 교차-반응하지 않는 아미노아실-tRNA 합성효소, 및 예를 들어, E. 콜라이에서 21종이 존재하는 임의의 내인성 합성효소에 의해 아미노아실화되지 않는 오르소고날 tRNA를 포함할 것이다.
하나 이상의 비천연 아미노산을 포함하는 단백질의 제조에 적당한 오르소고날 번역 시스템의 일반 원칙이, 오르소고날 번역 시스템의 생성을 위한 일반 방법과 같이, 당업계에 공지되어 있다. 예를 들어, 국제 특허 공개 공보 제WO 2002/086075호(발명의 명칭: "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINO ACYL-tRNA SYNTHETASE PAIRS"); 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"); 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE"); 제WO 2005/019415호(2004년 7월 7일 출원); 제WO 2005/007870호(2004년 7월 7일 출원); 제WO 2005/007624호(2004년 7월 7일 출원); 및 제WO 2006/110182호(2005년 10월 27일 출원)(발명의 명칭: "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS")를 참조한다. 이 공보들 각각은 전체적으로 본원에 참조 인용된다. 비천연 아미노산이 도입된 오르소고날 번역 시스템 및 이의 생성 및 사용 방법의 논의를 위해, 또한 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Angewandte Chemie Int . Ed ., 44(1):34-66(2005)], 문헌 [Xie 및 Schultz, "An Expanding Genetic Code", Methods 36(3):227-238(2005)]; 문헌 [Xie 및 Schultz, "Adding Amino Acids to the Genetic Repertoire", Curr. Opinion in Chemical Biology 9(6): 548-554(2005)]; 문헌 [Wang 등, "Expanding the Genetic Code", Anna . Rev . Biophys . Biomol . Struct., 35:225-249(2006)]; 및 문헌 [Ryu 및 Schultz, "Efficient Incorporation of Unnatural Amino Acids into Proteins in Escherichia coli", Nat. Methods (4):263-265(2006)]를 참조하고; 이들 내용은 각기 전체적으로 본원에 참조 인용된다.
오르소고날 번역 시스템
오르소고날 번역 시스템은 일반적으로 오르소고날 tRNA(O-tRNA), 오르소고날 아미노아실 tRNA 합성효소(O-RS) 및 비천연 아미노산을 포함하는 (E. 콜라이와 같은 원핵생물의 세포일 수 있는) 세포를 포함하는데, 여기에서 O-RS는 O-tRNA를 비천연 아미노산으로 아미노아실화한다. 본 발명의 오르소고날 쌍은 O-tRNA, 예를 들어 억제자 tRNA, 프레임이동(frameshift) tRNA 등, 및 동족체 O-RS를 포함한다. 본 발명의 오르소고날 시스템은 전형적으로, 숙주 세포와 관련하여, 또는 숙주 세포의 부재 하에 O-tRNA/O-RS 쌍을 포함할 수 있다. 다중 성분 시스템에 부가하여, 본 발명은 또한 신규 개별 성분, 예를 들어 신규 오르소고날 아미노아실-tRNA 합성효소 폴리펩티드(예를 들어, 서열 번호 4, 6 또는 8), 및 그 폴리펩티드를 코딩하는 폴리뉴클레오티드(예를 들어, 서열 번호 5, 7 또는 9)를 제공한다.
일반적으로, 오르소고날 쌍이 셀렉터 코돈을 인식하고 이 셀렉터 코돈에 대한 반응으로 아미노산을 로딩하는 경우, 오르소고날 쌍은 셀렉터 코돈을 "억제"한 다고 언급된다. 즉, 번역 시스템(예를 들어, 세포)의 내인성 기구에 의해 인식되지 않는 셀렉터 코돈은 통상적으로 충전되지 않고, 이는 다른 방식으로는 핵산으로부터 번역될 폴리펩티드의 생성을 차단할 수 있다. 오르소고날 쌍 시스템에서, O-RS는 O-tRNA를 특정 비천연 아미노산으로 아미노아실화한다. 충전된 O-tRNA는 셀렉터 코돈을 인식하고, 셀렉터 코돈에 의해 유발되는 번역 블록을 억제한다.
일부 측면에서, 본 발명의 O-tRNA는 셀렉터 코돈을 인식하고, 본원의 서열목록에 나와 있는 바와 같은 폴리뉴클레오티드 서열을 포함하거나 그 서열에 의해 코딩되는 O-tRNA의 억제 효율과 비교할 때 셀렉터 코돈에 대한 반응으로 동족체 합성효소의 존재 하에 적어도 대략 예를 들어, 45%, 50%, 60%, 75%, 80% 또는 90% 이상의 억제 효율을 포함한다.
일부 실시양태에서, O-RS 및 O-tRNA가 함께 있는 경우의 억제 효율은 O-RS가 없는 경우의 O-tRNA의 억제 효율보다 대략 예를 들어, 5배, 10배, 15배, 20배 또는 25배 이상 더 높다. 일부 측면에서, O-RS 및 O-tRNA가 함께 있는 경우의 억제 효율은 본원의 서열목록에 나와 있는 바와 같은 오르소고날 합성효소 쌍의 억제 효율의 적어도 대략 예를 들어, 35%, 4 0%, 45%, 50%, 60%, 75%, 80% 또는 90% 이상이다.
숙주 세포는 비천연 아미노산을 성장하는 폴리펩티드 사슬로, 예를 들어 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 통해 도입하기 위해 O-tRNA/O-RS 쌍을 사용하는데, 여기에서 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 특정 바람직한 측면에서, 세포는 하나 이상의 부가적 O-tRNA/O-RS 쌍을 포함할 수 있는데, 여기에서 부가적 O-tRNA가 상이한 비천 연 아미노산을 갖는 부가적 O-RS에 의해 로딩된다. 예를 들어, O-tRNA 중 하나는 4 염기 코돈을 인식할 수 있고, 다른 O-tRNA는 정지 코돈을 인식할 수 있다. 대안적으로, 다수의 상이한 정지 코돈 또는 다수의 상이한 4 염기 코돈이 동일한 코딩 핵산 내에 사용될 수 있다
언급된 바와 같이, 일부 실시양태에서, 세포 또는 기타 번역 시스템 내에는 하나 초과의 비천연 아미노산을 폴리펩티드 내로 도입하도록 하는 다수의 O-tRNA/O-RS 쌍이 존재한다. 예를 들어, 세포는 부가적인 상이한 O-tRNA/O-RS 쌍 및 제2 비천연 아미노산을 포함할 수 있는데, 여기에서 이 부가적 O-tRNA는 제2 셀렉터 코돈을 인식하고, 이 부가적 O-RS는 O-tRNA를 제2 비천연 아미노산으로 우선적으로 아미노아실화한다. 예를 들어, O-tRNA/O-RS 쌍(여기에서, O-tRNA는 예를 들어 엠버 셀렉터 코돈을 인식함)을 포함하는 세포는 제2 오르소고날 쌍을 추가로 포함할 수 있는데, 여기에서 제2 O-tRNA는 상이한 셀렉터 코돈, 예를 들어 오팔 코돈, 4 염기 코돈 등을 인식한다. 바람직하게는, 상이한 오르소고날 쌍은 상이한 공급원으로부터 유래되며, 이는 상이한 셀렉터 코돈의 인식을 용이하게 할 수 있다.
특정 실시양태에서, 시스템은 오르소고날 tRNA(O-tRNA), 오르소고날 아미노아실-tRNA 합성효소(O-RS), 비천연 아미노산, 및 관심 폴리펩티드를 포함하는 핵산을 포함한 E. 콜라이 세포와 같은 세포를 포함하는데, 여기에서 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 번역 시스템은 본원에 기재된 바와 같은 O-tRNA/O-RS 쌍`및 비천연 아미노산과 조합된 무세포 시스템, 예를 들어 다양한 시중 입수가능한 "시험관내" 전사/번역 시스템들 중 임의의 시스템일 수도 있다.
O-tRNA 및/또는 O-RS는 천연적으로 발생될 수 있거나, 예를 들어 각종 유기체 중 임의의 유기체로부터 유래된 tRNA의 라이브러리 및/또는 RS의 라이브러리를 발생시키고/시키거나 다양한 이용가능한 돌연변이유발 기법 중 임의의 기법을 이용하여 천연 발생 tRNA 및/또는 RS를 돌연변이화함으로써 유래될 수 있다. 예를 들어, 오르소고날 tRNA/아미노아실-tRNA 합성효소 쌍의 생성을 위한 한 기법은, 예를 들어 숙주 세포 외의 한 공급원 또는 다수의 공급원으로부터 유래된 (숙주 세포에 대한) 이종성 tRNA/합성효소 쌍을 숙주 세포 내로 이입시키는 단계를 포함한다. 그 이종성 합성효소 후보의 성질은, 예를 들어 임의의 숙주 세포 tRNA를 충전하지 않는 성질을 포함하며, 이종성 tRNA 후보물질의 성질은, 예를 들어 그것이 어떠한 의 숙주 세포 합성효소에 의해서도 아미노아실화되지 않는다는 성질을 포함한다. 또한, 이종성 tRNA는 모든 숙주 세포 합성효소에 대해 오르소고날성을 가진다. 오르소고날 쌍을 생성하기 위한 제2 기법은 O-tRNA 또는 O-RS를 선별하고/하거나 선택하는 기초가 되는 돌연변이체 라이브러리를 생성시키는 단계를 포함한다. 이 기법들은 조합될 수도 있다.
오르소고날 tRNA(O- tRNA )
본 발명의 오르소고날 tRNA(O-tRNA)는 바람직하게, 예를 들어 생체내 또는 시험관내, O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질 내로의 비천연 아미노산의 도입을 매개한다. 특정 실시양태에서, 본 발명의 O-tRNA는 본원의 서열목록에서 O-tRNA 서열에 기재된 바와 같은 폴 리뉴클레오티드 서열을 포함하거나 그 서열에 의해 코딩되는 O-tRNA와 비교 시, 셀렉터 코돈에 대한 반응으로 동족체 합성효소의 존재 하에 적어도 대략 예를 들어, 45%, 50%, 60%, 75%, 80% 또는 90% 이상의 억제 효율을 포함한다.
억제 효율은 당업계에 공지된 다수의 검정들 중 임의의 검정에 의해 측정될 수 있다. 예를 들어, β-갈락토시다제 리포터 검정을 이용할 수 있는데, 예를 들어 (구축물이 lacZ 핵산 서열 내에 셀렉터 코돈을 가지는 경우) 유도체화된 lacZ 플라스미드가 본 발명의 O-tRNA를 포함하는 플라스미드와 함께 적절한 유기체(예를 들어, 오르소고날 성분들이 사용될 수 있는 유기체)로부터의 세포 내로 도입된다. 동족체 합성효소도 (발현된 때, 그 동족체 합성효소를 코딩하는 폴리펩티드 또는 폴리뉴클레오티드로서) 도입될 수 있다. 세포가 배지 중에서 원하는 밀도, 예를 들어 약 0.5의 OD600까지 성장하고, β-갈락토시다제 검정을, 예컨대 베타플루오르(BetaFluor)™ β-갈락토시다제 분석 키트[노바겐(Novagen)]를 사용하여 수행한다. 억제율(%)은 비교 대조군에 대한 상대적인 샘플 활성율(%)로서, 예를 들어 셀렉터 코돈이 아닌 원하는 위치에 상응하는 센스 코돈을 가지는, 유도체화된 lacZ 구축물로부터 관찰된 값으로서 계산될 수 있다.
본 발명의 O-tRNA의 예가 본원의 서열목록에 기재되어 있는데, 예를 들어 도 2 및 서열 번호 1을 참조한다. 또한, 본원의 개시 내용은 부가적 동등 O-tRNA 종의 설계에 대한 지침을 제공한다. RNA 분자, 예컨대 O-RS mRNA 또는 O-tRNA 분자에서, 티민(T)은 소정의 서열 또는 이의 상보체에 대해 우라실(U)로 치환된다(또는 코딩 DNA의 경우, 이와 반대로 우라실(U)이 티민으로 치환된다). 대체로 기능성에 있어 동등한 분자를 발생시키기 위해 염기에 대한 부가적 변형이 존재할 수도 있다.
본 발명은 또한 본원의 특별한 O-tRNA에 상응하는 O-tRNA의 보존적 변이를 포괄한다. 예를 들어, O-tRNA의 보존적 변이에는, 예를 들어 본원의 서열목록에 기재된 바와 같이, 특별한 O-tRNA와 유사하게 기능하며 적절한 자가-상보성에 의해 tRNA L-형상의 구조를 유지하지만, 예를 들어 본원의 서열목록 또는 도 2에 기재된 것들과 동일한 서열을 가지지 않는 분자들로서, 바람직하게는 야생형 tRNA 분자 이외의 분자들이 포함된다.
O-tRNA를 포함하는 조성물은 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 추가로 포함할 수 있는데, 여기에서 ORS는 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다. 특정 실시양태에서, O-tRNA를 포함하는 조성물은 (예를 들어, 시험관내 또는 생체내) 번역 시스템을 추가로 포함할 수 있다. 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드로서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 포함하는 핵산 또는 이들 중 하나 이상의 조합이 세포 내에 존재할 수도 있다.
오르소고날 tRNA(O-tRNA)의 생성 방법도 또한 본 발명의 한 특성이다. 그 방법에 의해 생성된 O-tRNA도 또한 본 발명의 한 특성이다. 본 발명의 특정 실시양태에서, O-tRNA는 돌연변이체의 라이브러리를 발생시킴으로써 생성될 수 있다. 돌연변이체 tRNA의 라이브러리는 당업계에 공지되어 있는 각종 돌연변이유발 기법들에 의해 발생될 수 있다. 예를 들어, 돌연변이체 tRNA는, 예를 들어 서열 번호 1의 O- tRNA의 부위-특이적 돌연변이유발, 랜덤 점 돌연변이유발, 상동성 재조합, DNA 셔플링(shuffling) 또는 다른 반복적 돌연변이유발법, 키메라 구축, 또는 이들의 임의의 조합에 의해 발생될 수 있다.
부가적 돌연변이는 tRNA의 원하는 루프 또는 영역, 예를 들어 안티코돈 루프, 수용체 줄기(stem), D 암(arm) 또는 루프, 가변성 루프, TPC 암 또는 루프, tRNA 분자의 다른 영역 또는 이들의 조합에서 특별한 위치(들), 예를 들어 비보존적 위치(들), 보존적 위치, 무작위 위치(들), 또는 이들의 조합 위치에서 도입될 수 있다. 전형적으로, tRNA 내의 돌연변이는 셀렉터 코돈의 인식을 허용하도록 돌연변이체 tRNA의 라이브러리의 각 구성원의 안티코돈 루프를 돌연변이화하는 단계를 포함한다. 방법은 추가 서열을 O-tRNA에 부가하는 단계를 추가로 포함할 수 있다. 전형적으로, O-tRNA는 원하는 RS에 대한 그의 친화성을 보존하면서 출발 물질, 예를 들어 복수개의 tRNA 서열에 비해 원하는 유기체에 대한 개선된 오르소고날성을 보유한다.
방법은 임의적으로 tRNA 및/또는 아미노아실-tRNA 합성효소의 서열의 유사성 (및/또는 추정된 상동성)을 분석하여, 특정 유기체에 대해 오르소고날성을 가지는 것으로 보이는 O-tRNA, O-RS 및/또는 이들의 쌍에 대한 잠재적 후보를 결정하는 단계를 포함한다. 당업계에 공지되어 있으며 본원에 기재되어 있는 컴퓨터 프로그램이 상기 분석에 사용될 수 있는데, 예를 들어 BLAST 및 파일업(pileup) 프로그램이 사용될 수 있다. 한 예에서, E. 콜라이에서 사용하기 위한 잠재적인 오르소고날 번역 성분들을 선택하기 위해, 진정세균 유기체와의 높은 서열 유사성을 나타내지 않 는 합성효소 및/또는 tRNA를 선택한다.
전형적으로, O-tRNA는 제1 종의 세포로 이루어진 집단을 예를 들어, 음성 선택함으로써 수득되는데, 여기에서 세포는 복수개의 잠재적 O-tRNA의 구성원을 포함한다. 그 음성 선택은 세포에 대해 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 잠재적 O-tRNA로 이루어진 라이브러리의 구성원을 포함하는 세포를 제거한다. 이는 제1 종의 세포에 대해 오르소고날성을 갖는 tRNA의 풀을 제공한다.
특정 실시양태에서, 음성 선택에서, 셀렉터 코돈(들)은 음성 선택 마커, 예를 들어 항생제 내성을 부여하는 효소, 예컨대 β-락타마제, 검출가능한 생성물을 부여하는 효소, 예컨대 β-갈락토시다제, 클로람페니콜 아세틸트랜스퍼라제(CAT), 예를 들어 비필수 위치(예를 들어, 여전히 기능성 바나제(barnase)를 생산하는 위치)에 있는 바나제 등과 같은 독성 물질 등을 코딩하는 폴리뉴클레오티드 내로 도입된다. 선별/선택은 임의적으로 선별제(예를 들어, 앰피실린과 같은 항생제)의 존재 하에 세포 집단을 성장시킴으로써 수행된다. 한 실시양태에서, 선택제의 농도는 다양하다.
예를 들어, 억제자 tRNA의 활성을 측정하기 위해, 셀렉터 코돈의 생체내 억제에 기초한, 예를 들어 음성 선택 마커를 코딩하는 폴리뉴클레오티드, 예를 들어 β-락타마제(bla)에 대한 유전자 내로 도입된 넌센스(예를 들어, 정지) 또는 프레임이동 돌연변이에 기초한 선택 시스템이 사용된다. 예를 들어, 특별한 위치(예를 들어, A184)에서 셀렉터 코돈을 가진 폴리뉴클레오티드 변이체, 예를 들어 bla 변 이체가 구축된다. 세포, 예컨대 세균은 이 폴리뉴클레오티드로 형질전환된다. 내인성 E. 콜라이 합성효소에 의해 효율적으로 충전될 수 없는 오르소고날 tRNA의 경우, 항생제 내성, 예컨대 앰피실린 내성은 플라스미드로 형질전환되지 않은 세균에 대한 항생제 내성과 비슷하거나 이보다 더 낮아야 한다. tRNA가 오르소고날 tRNA가 아닌 경우, 또는 tRNA를 충전시킬 수 있는 이종 합성효소가 상기 시스템 내에서 동시-발현되는 경우, 보다 높은 수준의 항생제, 예컨대 앰피실린 내성이 관찰된다. 플라스미드로 형질전환되지 않은 세포와 거의 동등한 항생제 농도를 가진 LB 아가 플레이트 상에서 성장할 수 없는 세포, 예를 들어 세균이 선택된다.
독성 물질(예를 들어, 리보뉴클레아제 또는 바나제)의 경우, 복수개의 잠재적 tRNA의 구성원이 내인성 숙주, 예컨대 에쉐리키아 콜라이 합성효소에 의해 아미노아실화되는 경우(즉, 상기 숙주, 예컨대 에쉐리키아 콜라이 합성효소에 대한 오르소고날 tRNA가 아닌 경우), 셀렉터 코돈은 억제되고, 생성된 독성 폴리뉴클레오티드 생성물은 세포 사멸을 초래한다. 오르소고날 tRNA 또는 비-기능성 tRNA를 보유하는 세포는 생존한다.
한 실시양태에서, 원하는 유기체에 대해 오르소고날성을 가지는 tRNA의 풀은, 셀렉터 코돈이 예를 들어, β-락타마제 유전자와 같은 약물 내성 유전자에 의해 코딩되는 양성 선택 마커에 위치되어 있는 양성 선택에 적용된다. 양성 선택은, 세포에 대해 오르소고날성을 가지는 tRNA의 풀의 구성원을 코딩하거나 포함하는 폴리뉴클레오티드, 양성 선택 마커를 코딩하는 폴리뉴클레오티드, 및 동족체 RS를 코딩하는 폴리뉴클레오티드를 포함하는 세포에 대해 수행된다. 특정 실시양태에서, 제2 세포 집단은 음성 선택에 의해 제거되지 않은 세포를 포함한다. 폴리뉴클레오티드는 세포 내에서 발현되고, 세포는 선택제, 예컨대 앰피실린의 존재 하에 성장된다. 그 후, tRNA는 동시 발현된 동족체 합성효소에 의해 아미노아실화되며 이 셀렉터 코돈에 대한 반응으로 아미노산을 삽입하는 그것의 능력에 대해 선택된다. 전형적으로, 이 세포들은 비-기능성 tRNA(들), 또는 관심 합성효소에 의해 효율적으로 인식될 수 없는 tRNA를 보유하는 세포에 비해 억제 효율에서의 상승을 보인다. 비-기능성 tRNA, 또는 관심 합성효소에 의해 효율적으로 인식되지 않는 tRNA를 보유하는 세포는 항생제에 대해 민감하다. 그러므로, (i) 내인성 숙주, 예를 들어 에쉐리키아 콜라이 합성효소에 대한 기질이 아니고; (ii) 관심 합성효소에 의해 아미노아실화될 수 있으며; (iii) 번역에 있어서 기능성을 나타내는 tRNA는 상기 양 선택 모두에서 생존한다.
따라서, 동일한 마커가 그 자신이 선별되는 배경에 따라 양성 마커 또는 음성 마커일 수 있다. 즉, 마커는 그 자신에 대해 선별되는 경우에는 양성 마커이지만, 그 자신에 반하여 선별되는 경우에는 음성 마커이다.
전술된 방법에서 선별, 예를 들어 양성 선택, 음성 선택 또는 양성 선택 및 음성 선택 양자 모두의 엄격도는 임의적으로 선택 엄격도를 달리하는 것을 포함한다. 예를 들어, 바나제는 극히 독성이 강한 단백질이기 때문에, 음성 선택의 엄격도는 상이한 수의 셀렉터 코돈을 바나제 유전자 내로 도입하고/하거나 유도가능한 프로모터를 사용함으로써 조절될 수 있다. 또 다른 예에서, 선택 또는 선별제의 농도(예를 들어, 앰피실린 농도)는 다양하다. 본 발명의 일부 측면에서, 엄격도는 원 하는 활성이 초기 순환 동안 낮을 수 있기 때문에 다양하다. 그러므로, 엄격도가 보다 낮은 선택 기준이 초기 수행에서 적용되고, 엄격도가 보다 높은 기준이 선별의 후기 수행에서 적용된다. 특정 실시양태에서, 음성 선택, 양성 선택 또는 음성 선택 및 양성 선택 양자 모두가 수회 반복될 수 있다. 다수의 상이한 음성 선택 마커, 양성 선택 마커 또는 음성 선택 마커 및 양성 선택 마커 양자 모두가 사용될 수 있다. 특정 실시양태에서, 양성 선택 마커와 음성 선택 마커는 동일할 수 있다.
다른 유형의 선택/선별이 본 발명에서 오르소고날 번역 성분, 예를 들어 O-tRNA, O-RS, 및 셀렉터 코돈에 반응하여 비천연 아미노산을 로딩하는 O-tRNA/O-RS 쌍을 생성시키는 데 사용될 수 있다. 예를 들어, 음성 선택 마커, 양성 선택 마커 또는 음성 선택 마커 및 양성 선택 마커 양자 모두가 적절한 반응물의 존재 하에 형광을 나타내거나 발광 반응을 촉진하는 마커를 포함할 수 있다. 또 다른 실시양태에서, 마커의 생성물은 형광-활성화 세포 분류(FACS) 또는 발광에 의해 검출된다. 임의적으로, 그 마커는 친화성에 기초한 선별 마커를 포함한다. 또한, 문헌 [Francisco, J. A. 등(1993) Production and fluorescence - activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface. Proc Natl Acad Sci U S A. 90: 10444-8]을 참조한다.
재조합 오르소고날 tRNA를 생성시키기 위한 부가적 방법을, 예를 들어 국제 특허 공개 공보 제WO 2002/086075호(발명의 명칭: "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS"), 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE") 및 제WO 2005/019415호(2004년 7월 7일 출원)에서 찾아볼 수 있다. 또한, 문헌 [Forster 등(2003), Programming peptidomimetic synthetases by translating genetic codes designed de novo, PNAS 100(11):6353-6357]; 및 문헌 [Feng 등(2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100(10): 5676-5681]을 참조한다.
오르소고날 아미노아실 - tRNA 합성효소(O- RS )
본 발명의 O-RS는 시험관내 또는 생체내에서 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다. 본 발명의 O-RS는 O-RS를 포함하는 폴리펩티드 및/또는 O-RS 또는 이의 일부를 코딩하는 폴리뉴클레오티드에 의해 번역 시스템, 예를 들어 세포에 제공될 수 있다. 예를 들어, 한 예의 O-RS는 서열 번호 4, 6 또는 8에 나와 있는 아미노산 서열, 또는 이의 보존적 변이체를 포함한다. 또 다른 예에서, O-RS 또는 이의 일부는 본원의 서열목록 또는 실시예에 기재된 서열을 포함하는, 아미노산을 코딩하는 폴리뉴클레오티드 서열 또는 이들의 상보적 폴리뉴클레오티드 서열에 의해 코딩된다. 예를 들어, 서열 번호 5, 7 또는 9의 폴리뉴클레오티드를 참조한다.
O-tRNA와 함께 사용하기 위한 오르소고날 아미노아실-tRNA 합성효소(O-RS), 예를 들어 O-RS를 동정하는 방법도 또한 본 발명의 한 특성이다. 예를 들어, 그 방법은 제1 종의 세포로 이루어진 집단을 선택, 예를 들어 양성 선택하는 단계를 포함하는데, 여기에서 세포는 1) 복수개의 아미노아실-tRNA 합성효소(RS)의 구성원(예를 들어, 복수개의 RS에는 돌연변이체 RS, 상기 제1 종 외의 종으로부터 유래된 RS, 또는 돌연변이체 RS 및 상기 제1 종 외의 종으로부터 유래된 RS 양자 모두가 포함될 수 있다); 2) (예를 들어, 하나 이상의 종으로부터의) 오르소고날 tRNA(O-tRNA); 및 3) (예를 들어, 양성) 선택 마커를 코딩하며 하나 이상의 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 개별적으로 포함한다. 세포는 복수개의 RS 구성원을 가지지 않거나 감소된 양의 복수개의 RS 구성원을 가진 세포에 비해 억제 효율의 상승을 보여주는 세포에 대해 선택되거나 선별된다. 억제 효율은 당업계에 공지되어 있으며 본원에 기재된 바와 같은 기법에 의해 측정될 수 있다. 억제 효율이 상승된 세포는 O-tRNA를 아미노아실화하는 활성 RS를 포함한다. 제1 종으로부터의 tRNA로 이루어진 제1 세트의 활성 RS에 의한 (시험관내 또는 생체내) 아미노아실화 수준은 제2 종으로부터의 tRNA로 이루어진 제2 세트의 활성 RS에 의한 (시험관내 또는 생체내) 아미노아실화 수준과 비교된다. 아미노아실화 수준은 검출가능한 물질(예를 들어, 표지된 비천연 아미노산)에 의해 결정될 수 있다. 전형적으로, 제1 tRNA 세트에 비해 제2 tRNA 세트를 더 효율적으로 아미노아실화하는 활성 RS를 선택함으로써, O-tRNA와 함께 사용할 효율적인 (최적화된) 오르소고날 아미노아실-tRNA 합성효소를 제공한다. 이 방법에 의해 동정된 O-RS도 또한 본 발명의 한 특성이다.
아미노아실화를 결정하기 위해 다수의 검정들 중 임의의 검정을 이용할 수 있다. 이 검정은 시험관내 또는 생체내에서 수행될 수 있다. 예를 들어, 시험관내 아미노아실화 검정은, 예를 들어 문헌 [Hoben 및 Soll(1985), Methods Enzymol. 113:55-59]에 기재되어 있다. 아미노아실화는 리포터를 오르소고날 번역 성분들과 함께 사용하고 단백질을 코딩하는, 하나 이상의 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 발현하는 세포 내에서 상기 리포터를 검출함으로써 결정될 수도 있다. 국제 특허 공개 공보 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"); 및 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE")도 또한 참조한다.
동정된 O-RS는 원하는 비천연 아미노산만이 O-tRNA에 충전되고 공통된 20종의 아미노산들 중 임의의 아미노산은 O-tRNA에 충전되지 않도록 합성효소의 기질 특이성이 변경되도록 더 조작될 수 있다. 비천연 아미노산에 대한 기질 특이성을 가진 오르소고날 아미노아실-tRNA 합성효소를 발생시키는 방법은, 예를 들어 상기 합성효소 내의 활성 부위, 상기 합성효소 내의 편집(editing) 기작 부위, 합성효소의 상이한 도메인들의 조합에 의한 상이한 부위 등에서 상기 합성효소를 돌연변이화하는 단계, 및 선택 과정을 적용하는 단계를 포함한다. 양성 선택 후 음성 선택이 이어지는 조합에 기초한 기법이 이용된다. 양성 선택에서, 양성 마커의 비필수 위치(들)에 도입된 셀렉터 코돈의 억제는 세포가 양성 선택 압력 하에서 생존할 수 있게 한다. 따라서, 생존 세포는 천연 아미노산 및 비천연 아미노산 양자 모두의 존재 하에서 오르소고날 억제자 tRNA를 천연 아미노산 또는 비천연 아미노산으로 충전시키는 활성 합성효소를 코딩한다. 음성 선택에서, 음성 마커의 비필수 위치(들)에 도입된 셀렉터 코돈의 억제는 비천연 아미노산 특이성을 가진 합성효소를 제거한다. 음성 선택 및 양성 선택 양자 모두에서의 생존 세포는 오르소고날 억제자 tRNA를 비천연 아미노산으로만 아미노아실화하는(충전시키는) 합성효소를 코딩 한다. 이어서, 이 합성효소는 부가적 돌연변이유발, 예를 들어 DNA 셔플링 또는 다른 반복적 돌연변이유발법으로 돌연변시킬 수 있다.
돌연변이체 O-RS의 라이브러리는 당업계에 공지된 다양한 돌연변이유발 기법을 이용하여 발생시킬 수 있다. 예를 들어, 돌연변이체 RS는 부위-특이적 돌연변이유발, 랜덤 점 돌연변이유발, 상동성 재조합, DNA 셔플링 또는 다른 반복적 돌연변이유발법, 키메라 구축 또는 이의 임의의 조합에 의해 생성될 수 있다. 예를 들어, 돌연변이체 RS로 이루어진 라이브러리는 2개 이상의 다른, 예컨대 보다 작고 보다 덜 다양한 "서브-라이브러리"로부터 생성될 수 있다. RS의 키메라 라이브러리도 본 발명에 포함된다. 다양한 유기체(예를 들어, 진정세균 또는 고세균과 같은 미생물)로부터의 tRNA 합성효소로 이루어진 라이브러리, 예컨대 천연 다양성을 포함하는 라이브러리[예를 들어, 미국 특허 제6,238,884호(Short 등); 미국 특허 제5,756,316호(Schallenberger 등); 미국 특허 제5,783,431호(Petersen 등); 미국 특허 제5,824,485호(Thompson 등); 및 미국 특허 제5,958,672호(Short 등) 참조]가 임의적으로 구축되어 오르소고날 쌍에 대해 선별된다는 것을 주목하도록 한다.
일단 합성효소가 양성 및 음성 선택/선별 기법에 적용되면, 이 합성효소를 더 돌연변이화할 수 있다. 예를 들어, O-RS를 코딩하는 핵산을 단리할 수 있고; (예를 들어, 랜덤 돌연변이유발, 부위-특이적 돌연변이유발, 재조합 또는 이들의 임의의 조합에 의해) 돌연변이된 O-RS를 코딩하는 폴리뉴클레오티드 세트를 상기 핵산으로부터 발생시킬 수 있고; 이 개별 단계들 또는 이 단계들의 조합을, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 돌연변이 O-RS가 수득될 때 까지 반복할 수 있다. 본 발명의 일부 측면에서, 그 단계들은 수회, 예를 들어 2회 이상 수행된다.
부가적 선택/선별 엄격도 수준도 또한 O-tRNA, O-RS 또는 이들의 쌍을 생성시키기 위한 본 발명의 방법에서 이용될 수 있다. O-RS를 생성시키기 위한 본 방법의 한 단계 또는 두 단계에 대한 선택 또는 선별 엄격도는 달라질 수 있다. 이것은, 예를 들어 사용된 선택제/선별제의 양을 변화시키는 것 등을 포함할 수 있다. 부가적 회수의 양성 및/또는 음성 선택을 또한 수행할 수도 있다. 선택 또는 선별은 아미노산 투과성의 변화, 번역 효율에서의 변화, 번역 신뢰도 변화 등 중 하나 이상을 포함할 수도 있다. 전형적으로, 하나 이상의 변화는 단백질을 생성하기 위해 오르소고날 tRNA-tRNA 합성효소를 사용하는 유기체 내 하나 이상의 유전자 내 돌연변이에 기초한다.
O-RS의 생성 및 합성효소의 기질 특이성의 변경에 대한 부가적 일반 상세 내용을 국제 특허 공개 공보 제WO2002/086075호(발명의 명칭: "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYLtRNA SYNTHETASE PAIRS") 및 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE")에서 찾아볼 수 있다. 또한, 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Angewandte Chemie Int . Ed ., 44(1):34-66(2005)]도 또한 참조하고, 이의 내용은 전체적으로 본원에 참조 인용된다.
공급원 및 숙주 유기체
본 발명의 오르소고날 번역 성분(O-tRNA 및 O-RS)은, 임의의 다른 종으로부 터의 숙주 번역 시스템에서 사용하기 위한 임의의 유기체 (또는 유기체의 조합물)로부터 유래될 수 있는데, 단 O-tRNA/O-RS 성분 및 숙주 시스템은 오르소고날 방식으로 작동한다. 오르소고날 쌍으로부터의 O-tRNA 및 O-RS는 동일한 유기체로부터 유래될 필요는 없다. 일부 측면에서, 오르소고날 성분들 진균세포 숙주 시스템에서 사용하기 위한 고세균 유전자(즉, 원시세균)로부터 유래된다.
예를 들어, 오르소고날 O-tRNA는 고세균 유기체, 예를 들어 원시세균(archaebacterium), 예컨대 메타노코커스 잔나쉬이 , 메타노박테리움 써모오토트로피컴( Methanobacterium thermoautotrophicum ), 할로박테리움 ( Halobacterium ), 예컨대 할로페락스 볼케니이 ( Haloferax volcanii )할로박테리움 NRC -1, 아카에오글로버스 풀기더스 ( Archaeoglobus fulgidus ), 파이로코커스 푸리오서 스( Pyrococcus furiosus), 파이로코커스 호리코쉬이 ( Pyrococcus horikoshii ), 애우로파이럼 페르닉스( Aeuropyrum pernix ), 메타노코커스 마리팔루디스( Methanococcus maripaludis), 메타노파이러스 칸들레리 ( Methanopyrus kandleri ), 메타노사르시나 메이제이( Methanosarcina mazei )( Mm ), 파이로바큘럼 애로필럼( Pyrobaculum aerophilum), 파이로코커스 애비스시 ( Pyrococcus abyssi ), 설폴로버스 솔파타리커스( Sulfolobus solfataricus )( Ss ), 설폴로버스 토코다이이 ( Sulfolobus tokodaii ), 써모플라스마 애시도필럼( Thermoplasma acidophilum ), 써모플라스마 볼케이 늄( Thermoplasma volcanium ) 등, 또는 진정세균, 예컨대 에쉐리키아 콜라이 , 써머 스 써모필러스(Thermus thermophilus), 바실러스 섭틸리스(Bacillus subtilus), 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 등으로부터 유래될 수 있는 반면, 오르소고날 O-RS는 유기체 또는 유기체들의 조합물, 예를 들어 원시세균, 예컨대 메타노코커스 잔나쉬이, 메타노박테리움 써모오토트로피컴 , 할로박테리움 , 예컨대 할로페락스 볼케니이 할로박테리움 NRC -1, 아카에오글로버스 풀기더스 , 파이로코커스 푸리오서스 , 파이로코커스 호리코쉬이 , 애우로파이럼 페르닉스 , 메타노코커스 마리팔루디스 , 메타노파이러스 칸들레리 , 메타노사르시나 메이제이 , 파이로바큘럼 애로필럼 , 파이로코커스 애비스시 , 설폴로버스 솔파타리커스 , 설폴로버스 토코다이이 , 써모플라스마 애시도필럼 , 써모플라스마 볼케이늄 등, 또는 진정세균, 예컨대 에쉐리키아 콜라이 , 써머스 써모필러스 , 바실러스 섭틸리스 , 바실러스 스테아로써모필러스 등으로부터 유래될 수 있다. 한 실시양태에서, 진핵생물 공급원, 예를 들어 식물, 해조류, 원생동물, 진균류, 효모, 동물(예를 들어, 포유동물, 곤충, 절지동물 등) 등도 O-tRNA 및 O-RS의 공급원으로서 사용될 수 있다.
O-tRNA/O-RS 쌍의 개별 성분은 동일한 유기체 또는 상이한 유기체로부터 유래될 수 있다. 한 실시양태에서, O-tRNA/O-RS 쌍은 동일한 유기체로부터 유래된다. 대안으로, O-tRNA/O-RS 쌍의 O-tRNA 및 O-RS는 상이한 유기체로부터 유래된다.
O-tRNA, O-RS 또는 O-tRNA/O-RS 쌍은 생체내 또는 시험관내에서 선택 또는 선별되고/되거나, 세포 예를 들어, 진정세균 세포 내에서 사용되어, 비천연 아미노산을 가진 폴리펩티드를 생성시킬 수 있다. 사용되는 진정세균 세포는, 예를 들어 단 비제한적 예로서 에쉐리키아 콜라이, 써머스 써모필러스, 바실러스 섭틸리스, 바실러스 스테아로써모필러스 등이 있다. 본 발명의 번역 성분들을 포함하는 진정세균 세포의 조성물도 본 발명의 한 특성이다.
또한, 또 다른 종에서 사용하기 위해 한 종에서 O-tRNA 및/또는 O-RS를 선별하는 것에 대해, 국제 특허 공개 공보 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE")(2004년 4월 16일 출원)를 참조한다.
(예를 들어, O-RS, O-tRNA 및 비천연 아미노산을 포함하는) 오르소고날 번역 시스템이 배양된 숙주 세포를 사용하여, 비천연 아미노산을 가진 단백질을 생성시킬 수 있다 하더라도, 본 발명의 오르소고날 번역 시스템이 온전한 생존가능한 숙주 세포를 필요로 하는 것으로 의도되지 않는다. 예를 들어, 오르소고날 번역 시스템은 세포 추출물의 존재 하에 무세포 시스템을 사용할 수 있다. 사실상, 단백질의 생성을 위한 무세포 시험관내 전사/번역 시스템의 사용은 잘 확립된 기법이다. 본원에 기재된 오르소고날 번역 시스템 성분들을 사용하여 비천연 아미노산을 가진 단백질을 생성시키기 위한 이들 시험관내 시스템의 적용은 본 발명의 범위 내에 족히 속한다.
셀렉터 코돈
본 발명의 셀렉터 코돈은 단백질 생합성 기구의 유전 코돈 골격을 확장시킨다. 예를 들어, 셀렉터 코돈은, 예를 들어 유니크(unique) 3 염기 코돈, 넌센스 코돈, 예컨대 정지 코돈, 예를 들어 앰버 코돈(UAG) 또는 오팔 코돈(UGA), 비천연 코돈, 4개 이상의 염기로 이루어진 코돈, 희귀 코돈 등을 포함한다. 다수의 셀렉터 코돈, 예를 들어 하나 이상, 두 개 이상, 세 개 이상 등의 셀렉터 코돈이 원하는 유전자 내로 도입될 수 있다. 상이한 셀렉터 코돈을 사용함으로써, 이들 상이한 셀렉터 코돈을 사용하는 다수의 비천연 아미노산, 예를 들어 하나 이상의 비천연 아 미노산의 동시적인 부위-특이적 도입을 허용하는 다수의 오르소고날 tRNA/합성효소 쌍을 사용할 수 있다.
한 실시양태에서, 본 방법은 생체내 세포에서 비천연 아미노산을 도입하기 위한 정지 코돈인 셀렉터 코돈의 사용을 수반한다. 예를 들어, 정지 코돈을 인식하며 ORS에 의해 비천연 아미노산으로 아미노아실화되는 O-tRNA가 제조된다. 이 O-tRNA는 천연 발생 숙주의 아미노아실-tRNA 합성효소에 의해 인식되지 않는다. 통상적인 부위-지정 돌연변이유발을 이용하여 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 내의 관심 부위에 정지 코돈을 도입할 수 있다. 예를 들어, 문헌 [Sayers, J.R. 등(1988), 5',3' Exonuclease in phosphorothioate - based oligonucleotide - directed mutagenesis, Nucleic Acids Res ., 791-802]을 참조한다. O-RS, O-tRNA, 및 관심 폴리펩티드를 코딩하는 핵산이 예를 들어, 생체내에서 조합되는 경우, 비천연 아미노산이 정지 코돈에 대한 반응으로 도입됨으로써 특정 부위에서 비천연 아미노산을 함유하는 폴리펩티드를 제공한다. 본 발명의 한 실시양태에서, 셀렉터 코돈으로서 사용된 정지 코돈은 앰버 코돈 UAG 및/또는 오팔 코돈 UGA이다. UAG 및 UGA 양자 모두가 셀렉터 코돈으로서 사용되는 유전 코드는 가장 풍부한 종결 신호인 오커 넌센스 코돈 UAA를 보존하면서 22종 아미노산을 코딩할 수 있다.
생체내 비천연 아미노산의 도입은 숙주 세포에게 유의한 악영향을 주지 않으면서 수행될 수 있다. 예를 들어, 에쉐리키아 콜라이와 같은 비-진핵세포에서, UAG 코돈에 대한 억제 효율은 O-tRNA, 예를 들어 앰버 억제자 tRNA와 방출 인자 1(RF1)(이것은 UAG 코돈에 결합하고 리보좀으로부터의 성장하는 펩티드의 방출을 개시함) 사이의 경쟁에 달려 있기 때문에, 억제 효율은, 예를 들어 O-tRNA, 예컨대 억제자 tRNA의 발현 수준을 증가시키거나 RF1 결핍 균주를 사용함으로써 조절할 수 있다. 진핵세포에서, UAG 코돈에 대한 억제 효율은 O-tRNA, 예를 들어 앰버 억제자 tRNA와 진핵생물 방출 인자(예를 들어, eRF)(이것은 정지 코돈에 결합하고 리보좀으로부터의 성장하는 펩티드의 방출을 개시함) 사이의 경쟁에 달려 있기 때문에, 억제 효율은, 예를 들어 O-tRNA, 예컨대 억제자 tRNA의 발현 수준을 증가시킴으로써 조절할 수 있다. 또한, 부가적 화합물, 예를 들어 디티오트레이톨(DTT)과 같은 환원제도 존재할 수 있다.
비천연 아미노산도 희귀 코돈으로 코딩될 수 있다. 예를 들어, 시험관내 단백질 합성 반응에서 아르기닌 농도가 감소된 경우, 희귀 아르기닌 코돈인 AGG는 알라닌으로 아실화된 합성 tRNA에 의한 Ala의 삽입에 효율적인 것으로 입증되었다. 예를 들어, 문헌 [Ma 등, Biochemistry, 32:7939(1993)]을 참조한다. 이 경우, 합성 tRNA는 에쉐리키아 콜라이에서 소수의 종으로서 존재하는 천연 발생 tRNAArg와 경쟁한다. 추가로, 몇몇 유기체는 모든 3벌 염기 코돈을 사용하지는 않는다. 마이크로코커스 루테우스(Micrococcus luteus)에서 사용되지 않는 코돈인 AGA는 시험관내 전사/번역 추출물 중에서의 아미노산의 삽입을 위해 사용되고 있다. 예를 들어, 문헌 [Kowal 및 Oliver, Nucl . Acid . Res ., 25:4685(1997)]을 참조한다. 본 발명의 성분들은 생체내 이 희귀 코돈들을 사용하도록 제조될 수 있다.
셀렉터 코돈은 또한 확장된 코돈, 예를 들어 4개 이상의 염기로 이루어진 코 돈, 예컨대 4개, 5개 또는 6개 이상의 염기로 이루어진 코돈을 포함할 수도 있다. 4 염기 코돈의 예에는, 예를 들어 AGGA, CUAG, UAGA, CCCU 등이 포함된다. 5 염기 코돈의 예에는, 예를 들어 AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC 등이 포함된다. 본 발명의 방법은 프레임이동 억제에 기초한 확장된 코돈을 사용하는 것을 포함한다. 4개 이상의 염기로 이루어진 코돈은, 예를 들어 하나 또는 다수의 비천연 아미노산을 동일한 단백질 내로 삽입시킬 수 있다. 다른 실시양태에서, 안티코돈 루프는, 예를 들어 4개 이상의 염기로 이루어진 코돈, 5개 이상의 염기로 이루어진 코돈 또는 6개 이상의 염기로 이루어진 코돈을 해독할 수 있다. 256개의 가능한 4 염기 코돈이 존재하기 때문에, 4개 이상의 염기로 이루어진 코돈을 사용하여 다수의 비천연 아미노산을 동일한 세포 내에서 코딩할 수 있다. 문헌 [Anderson 등(2002), Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237-244]; 및 문헌 [Magliery(2001), Expanding the Genetic Code : Selection of Efficient Suppressors of Four - base Codons and Identification of "Shifty" Four - base Codons with a Library Approach in Escherichia coli , J. Mol. Biol . 307: 755-769]을 참조한다.
예를 들어, 4 염기 코돈은 시험관내 생합성 방법을 이용하여 비천연 아미노산을 단백질 내로 도입하는 데 사용되어 왔다. 예를 들어, 문헌 [Ma 등(1993), Biochemistry, 32:7939]; 및 문헌 [Hohsaka 등(1999), J. Am . Chem . Soc . 121:34]을 참조한다. CGGG 및 AGGU는 화학적으로 아실화된 2개의 프레임이동 억제자 tRNA를 사용하여 시험관내에서 2-나프틸알라닌 및 라이신의 NBD 유도체를 스트렙타비딘 내로 동시에 도입하는 데 사용되었다. 예를 들어, 문헌 [Hohsaka 등(1999), J. Am . Chem. Soc ., 121:12194]을 참조한다. 생체내 연구에서, Moore 등은 UAGN 코돈(N은 U, A, G 또는 C일 수 있음)을 억제하는 NCUA 안티코돈을 가진 tRNALeu 유도체의 능력을 조사하여, 4 염기 코돈인 UAGA가 0 또는 -1 프레임으로 거의 해독되지 않으면서 UCUA 안티코돈을 가진 tRNALeu에 의해 13 내지 26%의 효율로 해독될 수 있다는 것을 발견하였다. 문헌 [Moore 등(2000), J. Mol . Biol ., 298:195]을 참조한다. 한 실시양태에서, 다른 원치 않는 부위에서 미스센스(missense) 판독 및 프레임이동 억제를 감소시킬 수 있는, 희귀 코돈 또는 넌센스 코돈에 기초한 확장된 코돈이 본 발명에서 사용될 수 있다. 4 염기 코돈이 다양한 오르소고날 시스템에서 셀렉터 코돈으로서 사용되어 왔다. 예를 들어, 국제 특허 공개 공보 제WO 2005/019415호; 제WO 2005/007870호; 및 제WO 2005/07624호를 참조한다. 또한, 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Angewandte Chemie Int. Ed., 44(1):34-66(2005)]를 참조하고, 이의 내용은 전체적으로 본원에 참조 인용된다. 하기 실시예는 앰버 셀렉터 코돈을 사용하지만, 다양한 비천연 아미노산 O-RS에 대해 전술된 돌연변이와 유사한 돌연변이를 포함하도록 개질된 4 염기 O-tRNA 및 합성효소를 포함하도록 본원의 실시예를 변형시킴으로써 4개 이상의 염기로 이루어진 코돈도 사용할 수 있다.
소정의 시스템에 있어서, 셀렉터 코돈은 천연 3 염기 코돈들 중 하나를 포함할 수도 있는데, 여기에서 내인성 시스템은 천연 염기 코돈을 사용하지 (또는 거의 사용하지) 않는다. 예를 들어, 이는 천연 3 염기 코돈을 인식하는 tRNA를 가지지 않은 시스템, 및/또는 3 염기 코돈이 희귀 코돈인 시스템을 포함한다.
셀렉터 코돈은 임의적으로 비천연 염기 쌍을 포함한다. 그러한 비천연 염기 쌍은 기존 유전자 알파벳을 더 확장시킨다. 한 여분의 염기 쌍은 3 염기 코돈의 수를 64개에서 125개로 증가시킨다. 세 번째 염기 쌍의 성질은 안정한 선택적 염기쌍 형성, 중합효소에 의한 높은 신뢰도의 DNA 내로의 효율적인 효소적 도입, 및 초기(nascent) 비천연 염기 쌍의 합성 후 효율적인 연속적 프라이머 연장을 포함한다. 방법 및 조성물에 적용될 수 있는 비천연 염기 쌍의 설명은, 예를 들어 [Hirao 등(2002) An unatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology . 20:177-182]을 포함한다. 또한 문헌 [Wu, Y. 등, (2002) J. Am . Chem . Soc . 124:14626-14630]을 참조한다. 다른 관련 발행물이 하기에 열거되어 있다.
생체내에서 사용하는 경우, 비천연 뉴클레오시드는 막 투과성을 나타내며, 인산화되어 상응하는 삼인산염을 형성한다. 또한, 증가된 유전 정보는 안정하고 세포내 효소에 의해 파괴되지 않는다. 베너(Benner) 및 다른 사람들에 의해 이루어진 과거 노력은, 정규 와슨-크릭(Watson-Crick) 쌍에서의 수소 결합 패턴과 상이한 수소 결합 패턴을 이용하였는데, 이중 가장 주목할 만한 예는 이소-C:이소-G 쌍이다. 예를 들어, 문헌 [Switzer 등(1989), J. Am . Chem . Soc ., 111:8322]; 및 문헌 [Piccirilli 등(1990) Nature, 343:33; Kool,(2000) Curr . Opin . Chem . Biol ., 4:602]을 참조한다. 일반적으로, 이들 염기는 천연 염기와 어느 정도 잘못된 염기 쌍을 형성하며, 효소적으로 복제될 수 없다. 쿨(Kool) 및 그의 동료들은 염기들 사이의 소수성 팩킹(packing) 상호작용이 수소 결합을 대체하여 염기 쌍의 형성을 유도할 수 있다는 점을 입증하였다. 문헌 [Kool,(2000) Curr . Opin . Chem . Biol ., 4:602]; 및 문헌 [Guckian 및 Kool(1998), Angew. Chem. Int. Ed. Engl., 36, 2825)을 참조할 수 있다. 모든 상기 요건을 만족시키는 비천연 염기 쌍을 개발하려는 노력으로, 슐츠(Schultz), 로메스버그(Romesberg) 및 동료들은 일련의 비천연 소수성 염기들을 체계적으로 합성하여 연구하였다. PICS:PICS 자가-쌍(self-pair)은 천연 염기 쌍보다 안정한 것으로 밝혀졌고, 에쉐리키아 콜라이 DNA 중합효소 I의 클레노우(Klenow) 단편(KF)에 의해 DNA 내로 효율적으로 도입될 수 있다. 예를 들어, 문헌 [McMinn 등(1999) J. Am . Chem . Soc ., 121:11586]; 및 문헌 [Ogawa 등(2000) J. Am. Chem . Soc ., 122:3274]을 참조한다. 3MN:3MN 자가-쌍은 생물학적 기능에 충분한 효율 및 선택성을 갖는 KF에 의해 합성될 수 있다. 예를 들어, 문헌 [Ogawa 등(2000) J. Am. Chem. Soc. 122:8803]을 참조한다. 그러나, 염기 양자 모두 부가적 복제를 위한 사슬 종결자로 작용한다. 최근, 돌연변이 DNA 중합효소는 PICS 자가-쌍을 복제하는 데 사용될 수 있는 것으로 밝혀졌다. 또한, 7AI 자가-쌍도 복제될 수 있다. 예를 들어, 문헌 [Tae 등(2001) J. Am . Chem . Soc ., 123:7439]을 참조한다. 또한, 새로운 메탈로염기 쌍인 Dipic:Py도 개발되었으며, 이는 염기 쌍은 Cu(II)와의 결합 시 안정한 쌍을 형성한다. 문헌 [Meggers 등(2000) J. Am . Chem. Soc ., 122:10714]을 참조할 수 있다. 확장된 코돈 및 비천연 코돈은 본질적으로 천연 코돈에 대해 오르소고날하기 때문에, 본 발명의 방법은 이 성질을 이용 하여 이들에 대한 오르소고날 tRNA를 발생시킬 수 있다.
또한, 번역 우회(translational bypassing) 시스템을 사용하여 관심 폴리펩티드로 비천연 아미노산을 도입할 수 있다. 번역 우회 시스템에서, 큰 서열은 유전자 내로 삽입되지만, 단백질로 번역되지는 않는다. 서열은 리보좀이 서열 상에서 호핑하여(hopping), 삽입 부위의 다운스트림(downstream)에서 번역을 재개하도록 유도하는 신호(cue)로서 작용하는 구조를 포함한다.
비천연 아미노산
본원에서 사용되는 비천연 아미노산은 셀레노시스테인 및/또는 피롤라이신, 및 하기 20종의 유전적으로 코딩된 알파-아미노산을 제외한 임의의 아미노산, 변형된 아미노산 또는 아미노산 유사체를 지칭한다: 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신 및 발린. 알파-아미노산의 일반 구조는 하기 화학식 I로 표시된다:
Figure 112008070151815-PCT00001
비천연 아미노산은 전형적으로 화학식 I(상기 식 중, R기는 20종의 천연 아미노산에서 사용되는 치환기 이외의 임의의 치환기임)을 갖는 임의의 구조이다. 20종의 천연 아미노산의 구조에 대해서는, 예를 들어 문헌 [Biochemistry , L. Stryer, 제3판. 1988, Freeman and Company, New York]을 참조한다. 본 발명의 비천연 아미노산이 상기 20종의 알파-아미노산 외의 천연 발생 화합물일 수 있다는 것을 주목한다.
본 발명의 비천연 아미노산은 전형적으로 측쇄에서 천연 아미노산과 상이하기 때문에, 비천연 아미노산은 천연 발생 단백질에서 형성되는 방식과 동일한 방식으로 다른 아미노산, 예를 들어 천연 또는 비천연 아미노산과 아미드 결합을 형성한다. 그러나, 비천연 아미노산은 이들을 천연 아미노산으로부터 구별시켜 주는 측쇄 기를 가진다.
본원에서 특히 관심을 끄는 것은 비천연 아미노산 페닐셀레노시스테인(도 1, 구조 1 참조)이다. 페닐셀레노시스테인 비천연 아미노산에 부가하여, 다른 비천연 아미노산이, 예를 들어 본 발명에 의해 제공되는 오르소고날 쌍과 함께 적절한 제2 O-RS/O-tRNA 쌍을 이용하여, 관심 폴리펩티드 내로 동시에 도입될 수 있다. 그러한 많은 부가적 비천연 아미노산들과 적당한 오르소고날 쌍이 공지되어 있다. 본 개시 내용 및 그 안에 인용된 참조문헌들을 참조한다. 예를 들어, 문헌 [Wang 및 Schultz, "Expanding the Genetic Code", Angewandte Chemie Int . Ed, 44(1):34-66(2005)]; 문헌 [Xie 및 Schultz, "An Expanding Genetic Code", Methods 36(3):227-238(2005)]; 문헌 [Xie 및 Schultz, "Adding Amino Acids to the Genetic Repertoire", Curr . Opinion in Chemical Biology 9(6):548-554(2005)]; 및 문헌 [Wang 등, "Expanding the Genetic Code", Annu . Rev . Biophys . Biomol . Struct., 35:225-249(2006)]을 참조하고, 이들의 내용은 각기 전체적으로 본원에 참조 인용된다.
도 1, 구조 1에 나와 있는 페닐셀레노시스테인 비천연 아미노산이 본원에 기재된 실시예에서 일차적 관심이 있는 것이나, 본 발명은 그 구조에 엄격히 한정되는 것은 아니다. 실제로, 도 1, 구조 1에 나와 있는 페닐셀레노시스테인의 원리 특성을 보유하고, 또한 본 발명의 아미노아실-tRNA 합성효소(예를 들어, 서열 번호 4, 6 및 8의 O-RS)에 의해 특이적으로 인식되는, 각종의 용이하게 유래되고 구조적으로 관련된 유사체도 바로 생성될 수 있다. 이 관련된 아미노산 유사체들도 본 발명의 범주 내에 속하는 것으로 의도된다.
다른 비천연 아미노산에 있어서, 예를 들어 화학식 I에서의 R은 임의적으로 알킬-, 아릴-, 아실-, 히드라진, 시아노-, 할로-, 히드라지드, 알케닐, 에테르, 붕산염, 보론산염, 포스포, 포스포노, 포스핀, 에논, 이민, 에스테르, 히드록실아민, 아민 등, 또는 이들의 임의의 조합물을 포함한다. 다른 비천연 관심 아미노산은 광활성화가능한 가교 결합제를 포함하는 아미노산, 스핀-표지 아미노산, 형광 아미노산, 금속 결합 아미노산, 금속 함유 아미노산, 방사능 아미노산, 새로운 작용기를 갖는 아미노산, 다른 분자와 공유적으로 또는 비공유적으로 상호작용하는 아미노산, 포토케이징되고/되거나 광이성질체화가능한 아미노산, 바이오틴 또는 바이오틴 유사체를 포함하는 아미노산, 케토 함유 아미노산, 글리코실화된 아미노산, 아미노산 측쇄에 부착된 당류 잔기, 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산, 중원자로 치환된 아미노산, 화학적으로 절단될 수 있고/있거나 광절단될 수 있는 아미노산, 천연 아미노산에 비해 연장된 측쇄를 갖는 아미노산(예를 들어, 탄 소수 약 5 초과, 약 10 초과 등의 장쇄 탄화수소 또는 폴리에테르), 탄소-결합 당 함유 아미노산, 아미노 티오산 함유 아미노산, 및 하나 이상의 독성 잔기를 포함하는 아미노산을 포함하나 이들로 한정되지 않는다.
또 다른 측면에서, 본 발명은 하기 화학식 IV로 표시되는 일반 구조를 가진 비천연 아미노산을 제공한다:
Figure 112008070151815-PCT00002
이 구조를 갖는 비천연 아미노산은 전형적으로, R1이 20종의 천연 아미노산 중 하나(예를 들어, 티로신 또는 페닐알라닌)에서 사용된 치환기이고, R2가 치환기인 임의의 구조이다. 따라서, 이러한 유형의 비천연 아미노산은 천연 아미노산 유도체로서 간주될 수 있다.
도 1, 구조 1에 나와 있는 페닐셀레노시스테인 구조를 함유하는 비천연 아미노산에 부가하여, 비천연 아미노산은 또한 임의적으로 예를 들어, 하기 화학식 II 및 화학식 III으로 표시되는 변형된 골격 구조를 포함할 수도 있다:
Figure 112008070151815-PCT00003
Figure 112008070151815-PCT00004
(상기 식에서, Z는 전형적으로 OH, NH2, SH, NH-R' 또는 S-R'를 포함하고; X 및 Y는 동일하거나 상이할 수 있으며 전형적으로 S 또는 O를 포함하고, R 및 R'는 임의적으로 동일하거나 상이할 수 있으며 전형적으로 화학식 I을 갖는 비천연 아미노산에 대해 전술한 R 기에 대한 치환기들의 동일한 목록 및 수소로부터 선택됨). 예를 들어, 본 발명의 비천연 아미노산은 임의적으로 화학식 II 및 화학식 III으로 표시되는 아미노 또는 카르복실 기에서의 치환을 포함한다. 그러한 종류의 비천연 아미노산은, 예컨대 20종의 공통된 천연 아미노산에 상응하는 측쇄 또는 비천연 측쇄를 갖는 α-히드록시산, α-티오산, α-아미노티오카르복실산염을 포함하나 이들로 한정되지 않는다. 또한, α-탄소에서의 치환은 임의적으로 L, D 또는 α-α-이치환 아미노산, 예를 들어 D-글루탐산염, D-알라닌, D-메틸-O-티로신, 아미노부티르산 등을 포함한다. 다른 구조적 대체물은 시클릭 아미노산, 예를 들어 프롤린 유사체 뿐만 아니라, 3, 4, 6, 7, 8 및 9원 고리 프롤린 유사체, β 및 γ 아미노산, 예컨대 치환된 β-알라닌 및 γ-아미노 부티르산을 포함한다.
일부 측면에서, 본 발명은 L-구조형태의 비천연 아미노산을 이용한다. 그러나, 본 발명이 L-구조형태의 비천연 아미노산의 사용으로 한정되는 것으로 의도되지 않는다. 이 비천연 아미노산들의 D-거울상이성질체도 본 발명에서 사용될 수 있 음이 구상된다.
본 발명에서 사용될 수 있는 비천연 아미노산은 도 1, 구조 1에 나와 있는 페닐셀레노시스테인 비천연 아미노산에 엄격히 한정되지 않는다. 당업자라면 천연 발생 아미노산의 매우 각종의 비천연 유사체들이 용이하게 유래됨을 인식할 것이다. 예를 들어, 단 비제한적 예로서 티로신으로부터 유래된 비천연 아미노산이 용이하게 생성된다. 티로신 유사체에는, 예를 들어 파라-치환 티로신, 오르토-치환 티로신 및 메타-치환 티로신이 포함되고, 여기에서 치환 티로신은 알키닐 기, 아세틸 기, 벤조일 기, 아미노 기, 히드라진, 히드록시아민, 티올 기, 카르복시 기, 이소프로필 기, 메틸 기, C6-C20 직쇄 또는 분지쇄 탄화수소, 포화 또는 불포화 탄화수소, O-메틸 기, 폴리에테르 기, 니트로 기 등을 포함한다. 또한, 다-치환 아릴 고리도 구상된다. 본 발명의 글루타민 유사체는 α-히드록시 유도체, γ-치환 유도체, 시클릭 유도체 및 아미드 치환 글루타민 유도체를 포함하나 이들로 한정되지 않는다. 예시적인 페닐알라닌 유사체는 파라-치환 페닐알라닌, 오르토-치환 페닐알라닌, 및 메타-치환 페닐알라닌을 포함하나, 이들로 한정되지 않으며, 여기에서 치환기는 알키닐 기, 히드록시 기, 메톡시 기, 메틸 기, 알릴 기, 알데히드, 니트로, 티올 기 또는 케토 기 등 등을 포함한다. 비천연 아미노산의 구체예에는 p-에틸티오카르보닐-L-페닐알라닌, p-(3-옥소부타노일)-L-페닐알라닌, 1,5-단실-알라닌, 7-아미노-쿠마린 아미노산, 7-히드록시-쿠마린 아미노산, 니트로벤질-세린, O-(2-니트로벤질)-L-티로신, p-카르복시메틸-L-페닐알라닌, p-시아노-L-페닐알라닌, m-시 아노-L-페닐알라닌, 비페닐알라닌, 3-아미노-L-티로신, 비피리딜 알라닌, p-(2-아미노-1-히드록시에틸)-L-페닐알라닌, p-이소프로필티오카르보닐-L-페닐알라닌, 3-니트로-L-티로신 및 p-니트로-L-페닐알라닌이 포함된다. 또한, p-프로파르길옥시페닐알라닌, 3,4-디히드록시-L-페닐알라닌(DHP), 3,4,6-트리히드록시-L-페닐알라닌, 3,4,5-트리히드록시-L-페닐알라닌, 4-니트로-페닐알라닌, p-아세틸-L-페닐알라닌, O-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 3-니트로-티로신, 3-티올-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파(L-Dopa), 불화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-요오도-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌 등이 포함된다. 각종 비천연 아미노산의 구조가 본원에 인용된 참조문헌에 개시되어 있다, 또한 국제 특허 공개 공보 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKAR YOTIC GENETIC CODE")"; 및 제WO 2006/110182호(발명의 명칭: "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS")(2005년 10월 27일 출원)를 참조한다.
비천연 아미노산의 화학적 합성
전술한 비천연 아미노산의 대다수는, 예를 들어 시그마(Sigma)(미국 소재) 또는 알드리히(Aldrich)(미국 위스콘신주 밀워키 소재)로부터 상업적으로 입수가능하다. 상업적으로 입수가능하지 않은 비천연 아미노산은 임의적으로 다양한 문헌에 기재된 바와 같이 합성되거나 당업자에게 공지된 표준 방법을 사용하여 합성된다. 유기 합성 기법에 대해, 예를 들어 문헌 [Organic Chemistry , Fessendon and Fessendon, (1982, 제2판, Willard Grant Press, Boston Mass.)]; 문헌 [Advanced Organic Chemistry , March(제3판, 1985, Wiley and Sons, New York)]; 및 문헌 [Advanced Organic Chemistry , Carey 및 Sundberg(제3판, A 및 B 파트, 1990, Plenum Press, New York)]을 참조한다. 비천연 아미노산의 합성을 기술하는 부가적 문헌에는, 예를 들어 국제 특허 공개 공보 제WO 2002/085923호(발명의 명칭: "In vivo incorporation of Unnatural Amino Acids"), 문헌 [Matsoukas 등(1995) J. Med. Chem ., 38, 4660-4669]; 문헌 [King 및 Kidd(1949), A New Synthesis of Glutamine and of γ- Dipeptides of Glutamic Acid from Phthylated Internediates", J. Chem . Soc., 3315-3319]; 문헌 [Friedman 및 Chatterrji(1959), Synthesis of Derivatives of Glutamine as Model Substrates for Anti - Tumor Agents, J. Am . Chem . Soc . 81, 3750-3752]; 문헌 [Craig 등(1988), Absolute Configuration of the Enantiomers of 7- Chloro -4 [[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine), J. Org . Chem . 53, 1167-1170]; 문헌 [Azoulay 등(1991), Glutamine analogues as Potential Antimalarials, Eur . J. Med . Chem . 26, 201-5]; 문헌 [Koskinen 및 Rapoport(1989), Synthesis of 4- Substituted Prolines as Conformationally Constrained Amino Acid Analogues, J. Org . Chem . 54, 1859-1866]; 문헌 [Christie 및 Rapoport(1985), Synthesis of Optically Pure Pipecolates from L- Asparagine. Application to the Total Synthesis of (+)- Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization , J. Org . Chem . 1989:1859-1866]; 문헌 [Barton 등(1987), Synthesis of Novel α- Amino - Acids and Derivatives Using Radical Chemistry : Synthesis of L- and D-α- Amino - Adipic Acids, L-α- aminopinelic Acid and Appropriate Unsaturated Derivatives , Tetrahedron Lett . 43:4297-4308]; 및 문헌 [Subasinghe 등(1992), Quisqualic acid analogues : synthesis of betaheterocyclic 2- aminopropanoic acid derivatives and their activity at a novel quisqualate - sensitized site, J. Med. Chem . 35: 4602-7]을 포함한다. 또한, 국제 특허 공개 공보 제WO 2004/058946호(발명의 명칭: "PROTEIN ARRAYS", 2003년 12월 22일 출원)를 참조한다.
비천연 아미노산의 세포내 흡수
세포에 의한 비천연 아미노산 흡수는, 예를 들어 단백질 내로 도입하기 위해 비천연 아미노산을 설계하고 선택할 때, 전형적으로 고려되는 한 사항이다. 예를 들어, α-아미노산의 높은 전하 밀도는 이 화합물이 세포를 투과하기 어렵다는 것을 제시한다. 천연 아미노산은 종종 다양한 아미노산 특이성 수준을 나타내는 일군의 단백질-기재 수송 시스템을 통해 세포 내로 흡수된다. 비천연 아미노산이 세포에 의해 흡수된다면 어떤 비천연 아미노산이 세포에 의해 흡수되는지를 평가하는 신속 선별을 수행할 수 있다. 예를 들어, 국제 특허 공개 공보 제WO 2004/058946호(발명의 명칭: "PROTEIN ARRAYS")(2003년 12월 22일 출원); 및 문헌 [Liu 및 Schultz(1999), Progress toward the evolution of an organism with an expanded genetic code, PNAS 96: 4780-4785]에 기재된 독성 분석을 참조한다. 흡수는 다양한 검정으로 용이하게 분석되지만, 세포내 흡수 경로를 따라 흡수될 수 있는 비천연 아미노산의 설계에 대한 대안은 생체내에서 아미노산을 생성시키는 생합성 경로를 제공하는 것이다.
비천연 아미노산의 생합성
아미노산 및 다른 화합물들을 제조하기 위한 많은 생합성 경로들이 세포에 이미 존재한다. 특별한 비천연 아미노산에 대한 생합성 방법이 자연계, 예를 들어 세포에 존재하지 않을 수 있으나, 본 발명은 그러한 방법을 제공한다. 예를 들어, 비천연 아미노산에 대한 생합성 경로는 임의적으로 새로운 효소를 첨가하거나 기존 숙주 세포 경로를 변형시킴으로써 숙주 세포에서 발생된다. 새로운 부가적 효소로는 임의적으로 천연 발생 효소 또는 인공적으로 유도된 효소가 있다. 예를 들어, (국제 특허 공개 공보 제WO 2002/085923호의 실시예에서 제시된 바와 같은) p-아미노페닐알라닌의 생합성은 다른 유기체로부터의 공지된 효소의 조합물의 첨가에 의존한다. 이 효소들에 대한 유전자는 유전자를 포함하는 플라스미드를 사용하여 세포를 형질전환시킴으로써 세포 내로 도입될 수 있다. 그 유전자는 세포에서 발현될 때, 원하는 화합물을 합성하는 효소적 경로를 제공한다. 임의적으로 첨가되는 효소 종류의 예는 하기 실시예에서 제공된다. 부가적 효소의 서열은, 예를 들어 유전자은행(Genbank)에서 찾아볼 수 있다. 또한, 인공적으로 유도된 효소는 임의적으로 동일한 방식으로 세포 내로 첨가된다. 이 방식으로, 세포내 기구 및 세포내 자원을 조작하여, 비천연 아미노산을 생성시킨다.
사실상, 시험관내 또는 생체내에서 생합성 경로, 기존 경로의 개발 또는 비천연 아미노산의 제조에 사용하기 위한 신규 효소를 제조하는 다양한 방법들 중 임의의 방법이 이용될 수 있다. 효소 및 다른 생합성 경로 성분들을 개발하기 위한 많은 이용가능한 방법들을 본 발명의 방법에 적용하여, 비천연 아미노산을 생성시킬 수 있다(또는, 사실상 새로운 기질 특이성 또는 기타 관심 활성을 가진 합성효소를 개발할 수 있다). 예를 들어, 경우에 따라 DNA 셔플링을 이용하여 시험관내 또는 생체내에서 비천연 아미노산의 생성 (또는 신규 합성효소의 생성)을 위한 신규 효소 및/또는 이 효소의 경로를 개발한다. 예를 들어, 문헌 [Stemmer(1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4):389-391]; 및 문헌 [Stemmer(1994), DNA shuffling by random fragmentation and reassembly : In vitro recombination for molecular evolution, Proc . Natl . Acad . Sci. USA ., 91:10747-10751]을 참조한다. 관련 방법들은 관련(예를 들어, 상동성) 유전자 패밀리(familiy)를 셔플링하여 원하는 특징을 가진 효소들을 신속히 개발한다. 그러한 "패밀리 유전자 셔플링" 방법의 예를 문헌 [Crameri 등(1998), DNA shuffling of a family of genes from diverse species accelerates directed evolution, Nature, 391(6664): 288-291]에서 찾아볼 수 있다. (생합성 경로 성분 또는 합성효소 여부를 불문한) 신규 효소는, 예를 들어 문헌 [Ostermeier 등(1999), "A combinatorial approach to hybrid enzymes independent of DNA homology", Nature Biotech 17: 1205]에 기재된 바와 같이 "혼성 효소의 생성을 위한 점진적 말단절단(truncation)"("ITCHY")으로서 알려진 DNA 재조합 절차를 이용 하여 발생시킬 수도 있다. 이 방법은 하나 이상의 시험관내 또는 생체내 재조합 방법에 대한 기질로서 작용할 수 있는 효소 또는 다른 경로 변이체 라이브러리를 발생시키는 데 이용될 수도 있다. 예를 들어, 문헌 [Ostermeier 등(1999), "Combinatorial Protein Engineering by Incremental Truncation", Proc . Natl . Acad. Sci . USA, 96: 3562-67], 및 문헌 [Ostermeier 등(1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts", Biological and Medicinal Chemistry, 7: 2139-44]도 또한 참조한다. 또 다른 방법은, 예를 들어 비천연 아미노산 (또는 신규 합성효소)의 제조에 대한 생합성 반응을 촉진하는 능력에 대해 선택된 효소 또는 다른 경로 변이체 라이브러리를 제조하기 위해 기하급수적이고 동시적인 돌연변이유발을 이용한다. 이 방법에서, 관심 서열 내의 잔기들로 이루어진 작은 군을 동시에 무작위화하여 각각의 변경된 위치에서 기능성 단백질을 생성시키는 아미노산들을 동정한다. 비천연 아미노산(또는 신규 합성효소)의 생성을 위한 신규 효소를 제조하기 위해 본 발명에 적용될 수 있는 그러한 절차의 예를 문헌 [Delegrave 및 Youvan(1993), Biotechnology Research 11:1548-1552]에서 찾아볼 수 있다. 또 다른 방법에서, 효소 및/또는 경로 성분 공학처리를 위한 도핑된(doped) 또는 축퇴성 올리고뉴클레오티드를 사용하는 랜덤 또는 세미-랜덤 돌연변이유발, 예를 들어 문헌 [Arkin 및 Youvan(1992), "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis", Biotechnology 10:297-300]; 또는 문헌 [Reidhaar-Olson 등(1991), "Random mutagenesis of protein sequences using oligonucleotide cassettes", Methods Enzymol . 208:564-86]의 일반적인 돌연변이유발법의 사용에 의해 적용될 수 있다. 폴리뉴클레오티드 재조립(reassembly) 및 부위-포화 돌연변이유발을 이용하는, 종종 "비-확률적" 돌연변이유발로 지칭되는 또 다른 방법을 이용하여, 효소 및/또는 경로 성분들을 생성시킬 수 있고, 이어서 상기 효소 및/또는 경로 성분들은 (예를 들어, 생체내에서 비천연 아미노산의 생성을 위한) 하나 이상의 합성효소 또는 생합성 경로 기능을 수행하는 능력에 대해 선별될 수 있다. 예를 들어, Short의 국제 특허 공개 공보 제WO 00/46344호(발명의 명칭: "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES")를 참조한다.
그러한 돌연변이유발법에 대한 대안은 유기체의 전체 게놈을 재조합하고, 생성된 자손(progeny)을 특정한 경로 기능(종종 "전체 게놈 셔플링"으로 지칭됨)에 대한 선택하는 단계를 포함한다. 이 방법은, 예를 들어 비천연 아미노산(또는 이의 중간체)를 생성시키는 능력에 대한 유기체(예를 들어, E. 콜라이 또는 다른 세포)의 게놈 재조합 및 선택에 의해 본 발명에 적용될 수 있다. 예를 들어, 문헌 [Patnaik 등(2002), "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology 20(7): 707-712]; 및 문헌 [Zhang 등(2002), "Genome shuffling leads to rapid phenotypic improvement in bacteria" Nature 415(6872): 644-646]에 교시된 방법은 생체내에서 비천연 아미노산을 생성시키기 위해 세포내의 기존 및/또는 신규 경로를 개발하기 위한 경로 설계에 적용될 수 있다.
예를 들어 원하는 화합물의 제조를 위한 유기체 및 대사 경로 공학처리를 위 한 다른 기법도 이용가능하며, 비천연 아미노산의 생성에 적용될 수도 있다. 유용한 경로 공학처리 방법을 교시하는 발행물의 예에는, 문헌 [Nakamura 및 White(2003), "Metabolic engineering for the microbial production of 1,3-propanediol" Curr . Opin. Biotechnol . 14(5):454-9; Berry 등(2002) "Application of Metabolic Engineering to improve both the production and use of Biotech Indigo" J. Industrial Microbiology and Biotechnology 28:127-133]; 문헌 [Banta 등(2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry . 41(20), 6226-36]; 문헌 [Selivonova 등(2001), "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645)], 및 많은 다른 문헌들이 포함된다.
사용 방법과 무관하게, 전형적으로 본 발명의 공학처리된 생합성 경로를 이용하여 생성된 비천연 아미노산은 효율적인 단백질 생합성에 충분한 농도, 예를 들어 세포내 본래 양으로 제조되나, 다른 세포내 아미노산의 농도에 유의한 영향을 미치거나 세포내 자원들을 고갈시킬 정도로 제조되는 것은 아니다. 이 방식으로 생체내에서 제조된 전형적인 농도는 약 10 mM 내지 약 0.05 mM이다. 일단 세포가 특별한 경로에 필요한 효소를 제조하도록 공학처리되고 비천연 아미노산이 생성되면, 임의적으로 생체내 선택을 이용하여, 리보좀에 의한 단백질 합성 및 세포 성장 양자 모두를 위한 비천연 아미노산의 제조를 더 최적화시킨다.
비천연 아미노산의 도입을 위한 오르소고날 성분
본 발명은, 예를 들어 생체내에서 셀렉터 코돈, 예를 들어 앰버 정지 코돈, 넌센스 코돈, 4개 이상의 염기로 이루어진 코돈 등에 대한 반응으로 비천연 아미노산 페닐셀레노시스테인(도 1, 구조 1 참조)을 성장하는 폴리펩티드 사슬 내로 도입하기 위한 오르소고날 성분의 생성을 위한 조성물 및 방법을 제공한다. 예를 들어, 본 발명은 오르소고날-tRNA (O-tRNA), 오르소고날 아미노아실-tRNA 합성효소(O-RS) 및 이들의 쌍을 제공한다. 이 쌍은 비천연 아미노산을 성장하는 폴리펩티드 사슬로 도입하는 데 사용될 수 있다.
본 발명의 조성물은 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 포함하는데, 여기에서 O-RS는 O-tRNA를 페닐셀레노시스테인으로 우선적으로 아미노아실화한다. 특정 실시양태에서, O-RS는 서열 번호 4, 6 또는 8을 포함한 아미노산 서열, 이의 보존적 변이체를 포함한다. 본 발명의 특정 실시양태에서, O-RS는 임의의 내인성 tRNA에 비해 O-tRNA를 특별한 비천연 아미노산으로 우선적으로 아미노아실화하고, 여기에서 O-RS는 O-tRNA에 대해 선호적이고, 비천연 아미노산으로 충전된 O-tRNA:동일한 비천연 아미노산으로 충전된 내인성 tRNA의 비가 1:1 초과이고, 더욱 바람직하게는 O-RS가 O-tRNA만을 충전하거나, 거의 O-tRNA만을 충전한다.
O-RS를 포함하는 조성물은 오르소고날 tRNA(O-tRNA)을 임의적으로 추가로 포함할 수 있는데, 여기에서 O-tRNA는 셀렉터 코돈을 인식한다. 전형적으로, 본 발명의 O-tRNA는 서열목록에 나와 있는 바와 같은 폴리뉴클레오티드 서열(예를 들어, 서열 번호 1)을 포함하거나 그 서열에 의해 코딩되는 O-tRNA의 억제 효율에 비해 셀렉터 코돈에 대한 반응으로 동족체 합성효소의 존재 하에 적어도 대략, 예를 들어 45%, 50%, 60%, 75%, 80% 또는 90% 이상의 억제 효율을 포함한다. 한 실시양태에서, O-RS 및 O-tRNA가 함께 있는 경우의 억제 효율은 O-RS가 없는 경우, O-tRNA의 억제 효율보다 예를 들어, 5배, 10배, 15배, 20배 또는 25배 이상 더 높다. 일부 측면에서, O-RS 및 O-tRNA가 함께 있는 경우의 억제 효율은 메타노코커스 잔나쉬이로부터 유래된 오르소고날 티로실-tRNA 합성효소의 억제 효율의 45% 이상이다.
O-tRNA를 포함하는 조성물은 임의적으로 세포(예를 들어, 진정세균 세포, 예컨대 E. 콜라이 세포 등, 또는 진핵생물 세포, 예컨대 효모 세포), 및/또는 번역 시스템을 포함할 수 있다.
번역 시스템을 포함하는 세포(예를 들어, 진정세균 세포 또는 효모 세포)도 또한 본 발명에 의해 제공되는데, 여기에서 번역 시스템은 오르소고날-tRNA(O-tRNA); 오르소고날 아미노아실-tRNA 합성효소(O-RS); 및 페닐셀레노시스테인 비천연 아미노산을 포함한다. 전형적으로, O-RS는 임의의 내인성 tRNA에 비해, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는데, 여기에서 O-RS는 tRNA에 대해 선호적이고, 비천연 아미노산으로 충전된 O-tRNA:동일한 비천연 아미노산으로 충전된 내인성 tRNA의 비가 1:1 초과이고, 더욱 바람직하게는 O-RS가 O-tRNA만을 충전하거나, 거의 O-tRNA만을 충전한다. O-tRNA는 제1 셀렉터 코돈을 인식하고, O-RS는 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다. 한 실시양태에서, O-tRNA는 서열 번호 1에 나와 있는 폴리뉴클레오티드 서열 또는 이의 상보적 폴리뉴클레오티드 서열을 포함하거나 그 서열에 의해 코딩된다. 한 실시양태에서, O-RS는 서열 번호 4, 6, 8 또는 10에 나와 있는 아미노산 서열, 또는 이의 보존적 변이체를 포함한다.
본 발명의 세포는 부가적 상이한 O-tRNA/O-RS 쌍 및 제2 비천연 아미노산을 임의적으로 추가로 포함할 수 있는데, 여기에서 이 O-tRNA는 제2 셀렉터 코돈을 인식하고, 이 O-RS는 상응하는 O-tRNA를 제2 비천연 아미노산으로 우선적으로 아미노아실화하며, 여기에서 제2 아미노산은 제1 비천연 아미노산과 상이하다. 임의적으로, 본 발명의 세포는 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한 핵산을 포함하는데, 여기에서 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다.
특정 실시양태에서, 본 발명의 세포는, 오르소고날-tRNA(O-tRNA), 오르소고날 아미노아실-tRNA 합성효소(O-RS), 비천연 아미노산, 및 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한 핵산을 포함하는 진정세균 세포(예를 들어, E. 콜라이)인데, 여기에서 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 본 발명의 특정 실시양태에서, O-RS는, O-RS가 임의의 내인성 tRNA를 아미노아실화하는 효율을 초과하는 효율로, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다.
본 발명의 특정 실시양태에서, 본 발명의 O-tRNA는 본원의 서열목록 또는 실시예에 나와 있는 바와 같은 폴리뉴클레오티드 서열, 또는 이의 상보적인 폴리뉴클레오티드 서열을 포함하거나 그 서열에 의해 코딩된다. 본 발명의 특정 실시양태에서, O-RS는 서열목록에 나와 있는 아미노산 서열 또는 이의 보존적 변이체를 포함 한다. 한 실시양태에서, O-RS 또는 이의 일부는 본원의 서열목록 또는 실시예에 나와 있는 폴리뉴클레오티드 서열, 또는 이의 상보적 폴리뉴클레오티드 서열에 의해 코딩된다.
본 발명의 O-tRNA 및/또는 O-RS는 각종 유기체(예를 들어, 진핵생물 및/또는 진핵생물외 유기체) 중 임의의 유기체로부터 유래될 수 있다.
폴리뉴클레오티드도 또한 본 발명의 한 특성이다. 본 발명의 폴리뉴클레오티드(예를 들어, 서열 번호 5, 7 또는 9)는 본원의 서열목록에 나와 있는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 인공(예를 들어, 수동-제조되고, 천연적으로 발생되지 않은) 폴리뉴클레오티드를 포함하고/하거나, 상기 서열에 대해 상보적이다. 본 발명의 폴리뉴클레오티드는 또한 고도로 엄격한 조건 하에 실질적으로 핵산의 전체 길이에 걸쳐 상기 폴리뉴클레오티드에 혼성화되는 핵산을 포함할 수도 있다. 본 발명의 폴리뉴클레오티드는 또한 천연 발생 tRNA 또는 이에 상응하는 코딩 핵산의 서열과 예를 들어 75% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 그 이상으로 동일한 (단, 천연 발생 tRNA 또는 이에 상응하는 코딩 핵산이 아닌) 폴리뉴클레오티드를 포함하는데, 여기에서 tRNA는 셀렉터 코돈, 예를 들어 4 염기 코돈을 인식한다. 상기 서열 및/또는 상기 서열의 보존적 변이체를 포함하는 폴리뉴클레오티드 중 임의의 것과 예를 들어 80% 이상, 90% 이상, 95% 이상, 98% 이상 또는 그 이상 동일한 인공 폴리뉴클레오티드도 또한 본 발명의 폴리뉴클레오티드 내에 포함된다.
본 발명의 폴리뉴클레오티드를 포함하는 벡터도 또한 본 발명의 한 특성이 다. 예를 들어, 본 발명의 벡터는 플라스미드, 코스미드, 파지, 바이러스, 발현 벡터 등을 포함할 수 있다. 본 발명의 벡터를 포함한 세포도 또한 본 발명의 한 특성이다.
O-tRNA/O-RS 쌍의 성분의 생성 방법도 또한 본 발명의 특성이다. 이 방법에 의해 생성된 성분도 또한 본 발명의 특성이다. 예를 들어, 세포에 대해 오르소고날성을 갖는 하나 이상의 tRNA(O-tRNA)의 생성 방법은, 돌연변이체 tRNA의 라이브러리를 발생시키는 단계; 돌연변이체 tRNA의 라이브러리의 각 구성원의 안티코돈 루프를 돌연변이화하여 셀렉터 코돈을 인식하도록 함으로써 잠재적 O-tRNA의 라이브러리를 제공하는 단계; 및 제1 종의 세포의 제1 집단을 음성 선택하는 단계를 포함하고, 여기에서 세포는 잠재적 O-tRNA의 라이브러리의 한 구성원을 포함한다. 음성 선택은 세포에 대해 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 잠재적 O-tRNA의 라이브러리의 구성원을 포함하는 세포를 제거한다. 이는 제1 종의 세포에 대해 오르소고날성을 갖는 tRNA의 풀을 제공함으로써, 하나 이상의 O-tRNA를 제공한다. 본 발명의 방법에 의해 생성되는 O-tRNA도 또한 제공된다.
특정 실시양태에서, 그 방법은 제1 종의 세포의 제2 집단을 양성 선택하는 것을 추가로 포함하는데, 여기에서 세포는 제1 종의 세포에 대해 오르소고날성인 tRNA의 풀의 구성원, 동족체 아미노아실-tRNA 합성효소 및 양성 선택 마커를 포함한다. 양성 선택을 이용하여, 세포를 동족체 아미노아실-tRNA 합성효소에 의해 아미노아실화되고 양성 선택 마커의 존재 하에 원하는 반응을 나타내는 tRNA의 풀의 구성원을 포함하는 상기 세포에 대해 선택 또는 선별함으로써, O-tRNA를 제공한다. 특정 실시양태에서, 세포의 제2 집단은 음성 선택에 의해 제거되지 않은 세포를 포함한다.
O-tRNA를 비천연 아미노산으로 충전하는 오르소고날-아미노아실-tRNA 합성효소의 동정 방법도 또한 공지되어 있다. 예를 들어, 그 방법은 제1 종의 세포의 집단을 선택하는 단계를 포함하는데, 여기에서 세포는 각기 1) 복수개의 아미노아실-tRNA 합성효소(RS)의 구성원(예를 들어, 복수개의 RS에는 돌연변이체 RS, 상기 제1 종 외의 종으로부터 유래된 RS, 또는 돌연변이체 RS 및 상기 제1 종 외의 종으로부터 유래된 RS 양자 모두가 포함될 수 있음); 2) (예를 들어, 하나 이상의 종으로부터의) 오르소고날 tRNA(O-tRNA); 및 3) 양성 선택 마커를 코딩하며 하나 이상의 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 포함한다.
세포(예를 들어, 숙주 세포)는, 복수개의 RS 구성원을 가지지 않거나 감소된 양으로 가지는 세포에 비해 억제 효율의 증진을 나타내는 세포에 대해 선택 또는 선별된다. 이 선택/선별된 세포는 O-tRNA를 아미노아실화하는 활성 RS를 포함한다. 그 방법에 의해 동정된 오르소고날 아미노아실-tRNA 합성효소도 또한 본 발명의 한 특성이다.
선택된 위치에 비천연 아미노산을 갖는 세포(예를 들어, 진정세균 세포, 예컨대 E. 콜라이 세포 등, 또는 효모 세포) 내 단백질의 생성 방법도 또한 본 발명의 한 특성이다. 예를 들어, 그 방법은 하나 이상의 셀렉터 코돈을 포함하면서 단백질을 코딩하는 핵산을 포함하는 세포를 적절한 배지에서 성장시키는 단계, 비천연 아미노산을 제공하는 단계, 및 하나 이상의 셀렉터 코돈으로 핵산의 번역 과정 중에 단백질 내 특정된 위치에 비천연 아미노산을 도입함으로써 단백질을 생성시키는 단계를 포함한다. 세포는, 세포 내에서 기능하면서 셀렉터 코돈을 인식하는 오르소고날-tRNA(O-tRNA); 및 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 추가로 포함한다. 이 방법에 의해 생성된 단백질도 또한 본 발명의 한 특성이다.
본 발명은 또한 페닐셀레노시스테인을 포함한 단백질을 포함하는 조성물을 제공한다. 특정 실시양태에서, 단백질은 공지된 단백질, 예를 들어 인간 성장 호르몬, 치료 단백질, 진단 단백질, 산업용 효소, 또는 이들의 일부의 아미노산 서열과 75% 이상 동일한 아미노산 서열을 포함한다. 임의적으로, 조성물은 약학적으로 허용가능한 담체를 포함한다.
핵산 및 폴리펩티드 서열 및 변이체
본원에 기재된 바와 같이, 본 발명은 예를 들어 O-tRNA 및 O-RS를 코딩하는 폴리뉴클레오티드 서열, 및 폴리펩티드 아미노산 서열, 예를 들어 O-RS, 및 예를 들어 상기 폴리뉴클레오티드 및 폴리펩티드 서열을 포함하는 조성물, 시스템 및 방법을 제공한다. 상기 서열, 예를 들어 O-tRNA 및 O-RS 아미노산 및 뉴클레오티드 서열의 예가 본원에 개시되어 있다(도 2 참조). 그러나, 당업자라면 본 발명이 본원에, 예를 들어 실시예 및 서열목록에 구체적으로 언급된 서열로 한정되지 않는다는 것을 인식할 것이다. 당업자라면 본 발명이 또한 본원에 기재된 기능을 가진 많은 관련 서열, 예를 들어 본원에 개시된 O-RS의 보존적 변이체를 코딩하는 폴리뉴클레오티드 및 폴리펩티드를 제공한다는 것을 인식할 것이다.
동족체 O-tRNA를 페닐셀레노시스테인으로 아미노아실화할 수 있는 오르소고날 합성효소 종 (O-RS)의 구축 및 분석이 실시예 1에 기재되어 있다. 이 실시예는 비천연 아미노산 페닐셀레노시스테인을 도입할 수 있는 O-RS 종의 구축 및 분석을 기재하고 있다.
본 발명은 폴리펩티드(O-RS) 및 폴리뉴클레오티드, 예를 들어 O-tRNA, O-RS 또는 이의 부분을 코딩하는 폴리뉴클레오티드, 아미노아실-tRNA 합성효소 클론을 단리하기 위해 사용되는 올리고뉴클레오티드 등을 제공한다. 본 발명의 폴리뉴클레오티드는 하나 이상의 셀렉터 코돈을 이용하여 본 발명의 관심 단백질 또는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한다. 또한, 본 발명의 폴리뉴클레오티드에는 예를 들어 서열 번호 5, 7 또는 9에 나와 있는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드, 및 그것의 폴리뉴클레오티드 서열에 상보적이거나 그 서열을 코딩하는 폴리뉴클레오티드가 포함된다. 본 발명의 폴리뉴클레오티드에는 또한 서열 번호 4, 6 또는 8을 포함하는 O-RS 아미노산 서열을 코딩하는 임의의 폴리뉴클레오티드가 포함된다. 유사하게, 고도로 엄격한 조건 하에 실질적으로 핵산의 전체 길이에 걸쳐 상기 폴리뉴클레오티드에 혼성화되는 (또한, 천연 발생 폴리뉴클레오티드가 아닌) 인공 핵산이 본 발명의 폴리뉴클레오티드이다. 한 실시양태에서, 조성물은 본 발명의 폴리펩티드 및 부형제(예를 들어, 완충액, 물, 약학적으로 허용가능한 부형제 등)를 포함한다. 본 발명은 또한 본 발명의 폴리펩티드와 특이적으로 면역반응성을 갖는 항체 또는 항혈청을 제공한다. 인공 폴리뉴클레오티드는 인간에 의해 제조되고, 천연적으로 발생되지 않은 폴리뉴클레오티드이다.
본 발명의 폴리뉴클레오티드는 또한 천연 발생 tRNA의 서열과 예를 들어 75% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 그 이상으로 동일한(단, 천연 발생 tRNA이 아닌) 인공 폴리뉴클레오티드를 포함한다. 폴리뉴클레오티드는 또한 천연 발생 tRNA의 서열과 예를 들어 75% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 그 이상으로 동일한(단, 100% 동일하지는 않은) 인공 폴리뉴클레오티드를 포함한다.
특정 실시양태에서, 벡터(예를 들어, 플라스미드, 코스미드, 파지, 바이러스 등)는 본 발명의 폴리뉴클레오티드를 포함한다. 한 실시양태에서, 벡터는 발현 벡터이다. 또 다른 실시양태에서, 발현 벡터는 본 발명의 하나 이상의 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함한다. 또 다른 실시양태에서, 세포는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함한다.
당업자라면 개시된 서열들의 많은 변이체도 본 발명에서 사용될 수 있다는 것을 인식할 것이다. 예를 들어, 기능적으로 동일한 서열을 생성시키는 개시된 서열의 보존적 변이체가 본 발명에 포함된다. 하나 이상의 개시된 서열에 혼성화되는, 핵산 폴리뉴클레오티드 서열의 변이체도 본 발명에 포함되는 것으로 간주된다. 예를 들어 표준 서열 비교 기법에 의해 결정되는, 본원에 개시된 서열의 독특한 하위서열도 또한 본 발명에 포함된다.
보존적 변이체
유전 코드의 축퇴성(degeneracy)으로 인해, "침묵 치환"(즉, 코딩된 폴리펩티드에서의 변경을 초래하지 않는 핵산 서열에서의 치환)은 아미노산 서열을 코딩 하는 모든 핵산 서열의 내포된 특징이다. 유사하게, 아미노산 서열 내의 하나 또는 한정된 수의 아미노산이 고도로 유사한 성질을 가진 상이한 아미노산으로 치환되는 "보존적 아미노산 치환"도 개시된 구축물과 매우 유사한 것으로서 용이하게 확인된다. 각 개시된 서열의 그러한 보존적 변이체도 본 발명의 한 특성이다.
특별한 핵산 서열의 "보존적 변이체"는 동일하거나 본질적으로 동일한 아미노산 서열을 코딩하는 핵산을 지칭하거나, 핵산이 아미노산 서열을 코딩하지 않는 경우, 본질적으로 동일한 서열을 지칭한다. 당업자는 코딩된 서열 내에서 단일 아미노산 또는 적은 비율의 아미노산(전형적으로 5% 미만, 보다 더 전형적으로 4%, 2% 또는 1% 미만)을 변경시키거나, 부가하거나 결실시키는 개별 치환, 결실 또는 부가가 아미노산의 결실, 아미노산의 부가, 또는 화학적으로 유사한 아미노산으로의 아미노산의 치환을 초래하는 "보존적으로 변형된 변이"라는 것을 인식할 것이다. 따라서, 본 발명의 열거된 폴리펩티드 서열의 "보존적 변이"는 폴리펩티드 서열의 적은 비율, 전형적으로 5% 미만, 보다 전형적으로 2% 또는 1% 미만을 동일한 보존적 치환 기의 아미노산으로 치환시키는 것을 포함한다. 마지막으로, 핵산 분자의 코딩된 활성을 변경시키지 않는 서열의 부가, 예를 들어 비기능적 서열의 부가는 기본 핵산의 보존적 변이이다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표가 당업계에 잘 공지되어 있고, 여기에서 아미노산 잔기는 유사한 화학적 성질(예를 들어, 방향족 측쇄 또는 양으로 하전된 측쇄)을 가진 또 다른 아미노산 잔기로 치환되므로, 폴리펩티드 분자의 기능성을 실질적으로 변화시키지 않는다. 하기 표는 유사한 화학적 성질 의 천연 아미노산을 함유하는 예시적 군을 나타내는데, 여기에서 군 내의 치환은 "보존적 치환"이다.
보존적 아미노산 치환
비극성 및/또는 지방족 측쇄 극성 비하전 측쇄 방향족 측쇄 양으로 하전된 측쇄 음으로 하전된 측쇄
글리신 알라닌 발린 류신 이소류신 프롤린 세린 트레오닌 시스테인 메티오닌 아스파라긴 글루타민 페닐알라닌 티로신 트립토판 라이신 아르기닌 히스티딘 아스파르트산염 글루탐산염
핵산 혼성화
비교 혼성화를 이용하여, 본원의 핵산의 보존적 변이체를 포함한, 본 발명의 핵산을 동정할 수 있고, 이 비교 혼성화 방법은 본 발명의 핵산을 구별하는 바람직한 방법이다. 또한, 높은 엄격도의 조건, 매우 높은 엄격도의 건조 및 극도로 매우 높은 엄격도의 조건 하에서, 서열 번호 5, 7, 9 또는 11로 표시되는 핵산에 혼성화되는 표적 핵산도 본 발명의 특성이다. 그러한 핵산의 예에는 소정의 핵산 서열에 비해 하나 또는 몇개의 침묵 또는 보존적 핵산 치환을 가진 핵산이 포함된다.
시험 핵산은, 그 자신이 완벽하게 매칭되는(matched) 상보적 표적에 대한 프로브에 50% 이상 혼성화될 때, 즉 완벽하게 매칭되는 프로브가 매칭되지 않은 표적 핵산들 중 임의의 핵산과의 혼성화에 대해 관찰된 것보다 약 5× 내지 10× 이상 더 높은 신호 대 노이즈 비로 완벽하게 매칭되는 상보적 표적에 결합하는 조건 하에서 시험 핵산이 표적과 프로브의 혼성화보다 절반 이상 더 높은 신호 대 노이즈 비로 혼성화되는 경우, 프로브 핵산에 특이적으로 혼성화된다고 말한다.
핵산은 이들이 전형적으로 용액 중에서 결합될 때 "혼성화된다". 핵산은 특징이 잘 규명되어 있는 다양한 물리화학적 힘, 예컨대 수소 결합, 용매 배제, 염기 적층 등으로 인해 혼성화된다. 핵산의 혼성화에 대한 광범위한 지침은 문헌 [Tijssen(1993), Laboratory Techniques in Biochemistry and Molecular Biology --Hybridization with Nucleic Acid Probes, Part I, Chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays", (Elsevier, New York)]뿐만 아니라, 문헌 [Current Protocols in Molecular Biology, Ausubel 등, eds., Current Protocols , Greene Publishing Associates, Inc.와 John Wiley & Sons, Inc.의 합작 회사(2004년 증보 개정판)]에서도 찾아볼 수 있고, 문헌 [Hames 및 Higgins(1995), Gene Probes 1 and Gene Probes 2, IRL Press at Oxford University Press, Oxford, England]은 올리고뉴클레오티드를 비롯한 DNA 및 RNA의 합성, 표지, 검출 및 정량화에 대한 상세한 설명을 제공한다.
서던(Southern) 또는 노던(Northern) 블롯에서 필터 상에 100개 이상의 상보적 잔기를 가진 상보적 핵산의 혼성화를 위한 엄격한 혼성화 조건의 한 예는 42℃에서 1 mg의 헤파린을 함유하는 50% 포르말린이며, 여기에서 혼성화는 밤새 수행된다. 엄격한 세척 조건의 예는 15분 동안 65℃에서 0.2×SSC를 사용한 세척이다(SSC 완충액에 대한 설명에 대해서는 문헌 [Sambrook 등, Molecular Cloning A Laboratory Manual(제3판), 제1-3권, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001] 참조). 종종, 높은 엄격도 세척 전에는 배경 프로브 신호를 제거하기 위해 낮은 엄격도 세척이 선행된다. 예시적인 낮은 엄격도 세척은 15 분 동안 40℃에서 2×SSC를 사용한 세척이다. 일반적으로, 특별한 혼성화 검정에서 관련없는 프로브에 대해 관찰된 신호 대 노이즈 비의 5배 (또는 그 이상) 신호 대 노이즈 비는 특이적 혼성화의 검출을 표시한다.
핵산 혼성화 실험(예를 들어, 서던 혼성화 및 노던 혼성화)와 관련하여 "엄격한 혼성화 세척 조건"은 서열 의존적이고, 상이한 환경 파라미터 하에서 상이하다. 핵산의 혼성화에 대한 광범위 지침은 상기 문헌 [Tijssen(1993), Laboratory Techniques in Biochemistry and Molecular Biology -- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays", (Elsevier, New York)], 및 문헌 [Hames 및 Higgins(1995), Gene Probes 1 and Gene Probes 2, IRL Press at Oxford University Press, Oxford, England]에서 찾아볼 수 있다. 엄격한 혼성화 및 세척 조건은 임의의 시험 핵산에 대해 실험적으로 용이하게 결정될 수 있다. 예를 들어, 엄격한 혼성화 및 세척 조건의 결정에 있어서, 선택된 기준 세트를 충족시킬 때까지 (예를 들어, 혼성화 또는 세척에서 온도 증가, 염 농도 감소, 세제 농도 증가 및/또는 유기 용매, 예컨대 포르말린 농도의 증가에 의해) 혼성화 및 세척 조건을 점점 강화시킨다. 예를 들어, 높은 엄격도의 혼성화 및 세척 조건에서, 매칭되지 않은 표적과 프로브의 혼성화에 대해 관찰되는 신호 대 노이즈 비보다 5× 이상 더 높은 신호 대 노이즈 비로 프로브가 완벽하게 매칭되는 상보적 표적에 결합할 때까지 혼성화 및 세척 조건을 점점 강화시킨다.
"매우 엄격한" 조건은 특별한 프로브에 대한 열적 융점(Tm)과 동등하도록 선택된다. Tm은 시험 서열의 50%가 (한정된 이온 강도 및 pH 하에) 완벽하게 매칭되는 프로브에 혼성화하는 온도이다. 본 발명의 목적을 위해, 일반적으로, "매우 엄격한" 혼성화 및 세척 조건은 한정된 이온 강도 및 pH에서 특정 서열에 대한 Tm보다 약 5℃ 정도 낮도록 선택된다.
"매우 높은 엄격도" 혼성화 및 세척 조건은 완벽하게 매칭되는 상보적 표적 핵산과 프로브의 결합에 대한 신호 대 노이즈 비가 임의의 매칭되지 않은 표적 핵산과의 혼성화에 대해 관찰된 신호 대 노이즈 비보다 10배 이상 더 높아질 때까지 혼성화 및 세척 조건의 엄격도가 증가되는 조건이다. 그러한 조건 하에서 완벽하게 매칭되는 상보적 표적 핵산의 1/2 이상의 신호 대 노이즈 비로 프로브에 혼성화하는 표적 핵산은 매우 높은 엄격도 조건 하에서 프로브에 결합한다고 말한다.
유사하게, 더욱 더 높은 엄격도 수준은 관련 혼성화 검정의 혼성화 및/또는 세척 조건을 점점 강화시킴으로써 결정될 수 있다. 예를 들어, 완벽하게 매칭되는 상보적 표적 핵산과 프로브의 결합에 대한 신호 대 노이즈 비가 임의의 매칭되지 않는 표적 핵산과의 혼성화에 대해 관찰된 신호 대 노이즈 비보다 적어도 10배, 20배, 50배, 100배, 또는 500배 또는 그 이상 높아질 때까지 혼성화 및 세척 조건의 엄격도를 증가시킨다. 그러한 조건 하에 서 완벽하게 매칭되는 상보적 표적 핵산에 대한 신호 대 노이즈 비의 1/2 이상인 신호 대 노이즈 비로 프로브에 혼성화하는 표적 핵산은 극도로 높은 엄격도 조건 하에서 프로브에 결합한다고 말한다.
엄격한 조건 하에서 서로 혼성화하지 않는 핵산은 이들이 코딩하는 폴리펩티드가 실질적으로 동일한 경우, 여전히 실질적으로 동일하다. 이는, 예를 들어 유전 코드에 의해 허용되는 최대 코돈 축퇴성을 사용하여 핵산의 복사체를 생성할 때 일어난다.
독특한 하위서열
일부 측면에서, 본 발명은 본원에 개시된 0-tRNA 및 O-RS의 서열로부터 선택된 핵산 내의 독특한 하위서열을 포함하는 핵산을 제공한다. 독특한 하위서열은 임의의 공지된 O-tRNA 또는 O-RS 핵산 서열에 상응하는 핵산과 비교 시에 독특하다. 정렬은, 예를 들어 디폴트 파라미터로 설정된 BLAST를 사용하여 수행할 수 있다. 임의의 독특한 하위서열은, 예를 들어 본 발명의 핵산 또는 관련 핵산을 확인하기 위한 프로브로서 유용하다.
유사하게, 본 발명은 본원에 개시된 O-RS의 서열로부터 선택된 폴리펩티드 내의 독특한 하위서열을 포함하는 폴리펩티드를 포함한다. 여기에서, 독특한 하위서열은 임의의 공지된 폴리펩티드 서열에 상응하는 폴리펩티드와 비교 시에 독특하다.
본 발명은 또한 엄격한 조건 하에서 O-RS의 서열로부터 선택된 폴리펩티드 내의 독특한 하위서열을 코딩하는 독특한 코딩 올리고뉴클레오티드에 혼성화하는 표적 핵산을 제공하며, 여기에서 독특한 하위서열은 임의의 대조군 폴리펩티드(예를 들어 돌연변이에 의해 유도된 본 발명의 합성효소의 모(parental) 서열)에 상응하는 폴리펩티드와 비교 시에 독특하다. 독특한 서열은 전술한 바와 같이 결정된 다.
서열 비교, 동일성 및 상동성
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "동일한" 또는 "동일성(%)"은, 최대 상응성에 대해 비교되고 정렬될 때, 하기 서열 비교 알고리즘 (또는 당업자가 입수할 수 있는 다른 알고리즘) 중 하나를 이용하거나 육안 조사를 이용하여 측정한 때, 동일하거나 또는 특정화 비율(%)의 아미노산 잔기 또는 뉴클레오티드를 가지는 2개 이상의 서열 또는 하위서열을 의미한다.
2개의 핵산 또는 폴리펩티드(예를 들어, O-tRNA 또는 O-RS를 코딩하는 DNA, 또는 O-RS의 아미노산 서열)와 관련하여 문구 "실질적으로 동일한"은 최대 상응성에 대해 비교되고 정렬된 경우, 서열 비교 알고리즘을 이용하거나 육안 조사를 이용하여 측정할 때 약 60%, 약 80%, 약 90 내지 95%, 약 98% 또는 약 99% 이상, 또는 그 이상의 뉴클레오티드 또는 아미노산 잔기 동일성을 가지는 2개 이상의 서열 또는 하위서열을 의미한다. 그러한 "실질적으로 동일한" 서열은 전형적으로 실제 모 서열에 대한 언급 없이 "상동성"을 갖는 것으로 간주된다. 바람직하게는, "실질적 동일성"은 길이가 약 50개 이상의 잔기로 이루어진 서열의 영역에 걸쳐, 더 바람직하게는 약 100개 이상의 잔기로 이루어진 영역에 걸쳐 존재하며, 가장 바람직하게는 서열은 약 150개 이상의 잔기 또는 비교될 2개 서열의 전체 길이에 걸쳐 실질적으로 동일하다.
단백질 및/또는 단백질 서열은, 공통된 모 단백질 또는 단백질 서열로부터 자연적으로 또는 인공적으로 유도되는 경우, "상동성"을 가진다. 유사하게, 핵산 및/또는 핵산 서열은 공통된 모 핵산 또는 핵산 서열로부터 자연적으로 또는 인공적으로 유도되는 경우, 상동성을 가진다. 예를 들어, 임의의 천연 발생 핵산은 하나 이상의 셀렉터 코돈을 포함하도록 임의의 이용가능한 돌연변이유발법에 의해 변형될 수 있다. 발현되는 경우, 이 돌연변이 핵산은 하나 이상의 비천연 아미노산을 포함하는 폴리펩티드를 코딩한다. 물론 돌연변이 과정은 하나 이상의 표준 코돈을 추가로 변경하여, 생성된 돌연변이 단백질 내에서도 하나 이상의 표준 아미노산을 변경시킬 수 있다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질 (또는 이의 서열) 사이의 서열 유사성으로부터 추정된다. 상동성을 입증하는 데 유용한 서열 사이의 정확한 유사성(%)은 해당 핵산 및 단백질에 따라 다르지만, 관용적으로 25% 정도의 낮은 서열 유사성이 상동성을 확립하는 데 사용된다. 보다 높은 수준의 서열 유사성(예를 들어, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 그 이상) 또한 상동성을 확립하는 데 사용될 수 있다. 서열 유사성(%)을 결정하기 위한 방법(예를 들어, 디폴트 파라미터를 사용하는 BLASTP 및 BLASTN)은 본원에 기재되어 있으며 일반적으로 입수가능하다.
서열 비교 및 상동성 결정을 위해, 전형적으로 한 서열은 시험 서열과 비교되는 기준 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 서열 및 기준 서열을 컴퓨터에 입력하고, 필요하다면 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 그 후, 서열 비교 알고리즘은 지정된 프로그램 파라미터를 기초로 하여 기준 서열에 대한 시험 서열(들)의 서열 동일성(%)을 계산한다.
비교를 위한 서열의 최적 정렬은, 예를 들어 문헌 [Smith 및 Waterman, Adv . Appl. Math . 2:482(1981)]의 국소 상동성 알고리즘, 문헌 [Needleman 및 Wunsch, J. Mol . Biol . 48:443(1970)]의 상동성 정렬 알고리즘, 문헌(Pearson and Lipman, Proc . Nat'l . Acad . Sci . USA 85:2444(1988))의 유사성 조사 방법, 이들 알고리즘의 자동화 실행(위스콘신주 매디슨 사이언스 드라이브 575 지네틱스 컴퓨터 그룹, 위스콘신 지네틱스 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA), 또는 육안 조사(일반적으로 문헌 [Current Protocols in Molecular Biology, Ausubel 등, ed., Current Protocols, Breene Publishing Associates, In.와 John Wiley & Sons, Inc.의 합작 회사(2004년 증보 개정판)] 참조)로 수행할 수 있다.
서열 동일성(%) 및 서열 유사성(%)을 결정하는 데 적합한 알고리즘의 한 예는 문헌 [Altschul 등, J. Mol . Biol . 215:403-410(1990)]에 기재되어 있는 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국립생명공학 정보센터(National Center fro Biotechnology Information) 웹사이트를 통해 공개적으로 입수가능하다. 이 알고리즘은 먼저 데이터베이스 서열에서 동일한 길이의 워드와 정렬될 때 일정한 양성 값 역치 점수 T와 일치하거나 이를 만족시키는 길이 W의 짧은 워드를 질의(query) 서열에서 동정함으로써 높은 점수를 기록하는 서열 쌍(HSP)을 확인하는 단계를 수반한다. T는 인접 워드 점수 역치로서 언급된다(상기 문헌 [Altschul 등, J. Mol . Biol . 215:403-410(1990)] 참조). 그러한 초기 인접 워드 히트(hit)는 이들을 포함하는 더 긴 HSP를 찾는 선별을 개시하기 위한 시드(seed)로 작용한다. 이어서, 워드 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양 방향으로 확장된다. 뉴클레오티드 서열에 대한 누적 점수는 파라미터 M(1쌍의 매칭 잔기에 대한 보상 점수; 항상 > 0) 및 N(미스매칭된 잔기에 대한 벌점; 항상 < 0)을 사용하여 계산한다. 아미노산 서열의 경우, 점수화 매트릭스를 이용하여 누적 점수를 계산한다. 각 방향에서 워드 히트의 확장은, 누적 정렬 점수가 그의 최대 달성 값으로부터 X 양만큼 떨어졌을 때; 음의 점수를 기록한 하나 이상의 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 떨어졌을 때; 또는 어느 한 서열이 말단에 도달했을 때 정지된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감수성 및 속도를 결정한다. (뉴클레오티드 서열의 경우) BLASTN 프로그램은 디폴트로서 워드 길이(W) 11, 기대값(E) 10, 컷오프 100, M=5, N=-4, 및 양 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 워드 길이(W) 3, 기대 값(E) 10, 및 BLOSUM62 점수화 매트릭스를 사용한다(문헌 [Henikoff 및 Henikoff(1989), Proc . Natl . Acad . Sci . USA 89:10915] 참조).
서열 동일성(%)을 계산하는 것 외에, BLAST 알고리즘은 2개 서열 사이의 유사성의 통계학적 분석도 수행한다(예를 들어, 문헌 [Karlin and Altschul, Proc . Nat'l. Acad . Sci . USA 90:5873-5787(1993)] 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 2개의 뉴클레오티드 또는 아미노산 서열 사이에 매칭이 우연히 일어날 확률을 표시하는 최소 합계 확률(P(N))이다. 예를 들어, 기준 핵산과 시험 핵산의 비교에서 최소 합계 확률이 약 0.1 미만, 더 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만일 때, 핵산은 기준 서열과 유사한 것으로 간주된다.
돌연변이유발 및 다른 분자생물학 기법
본 발명에 사용되는 본 발명의 폴리뉴클레오티드 및 폴리펩티드는 분자생물학적 기법을 이용하여 조작될 수 있다. 분자생물학적 기법을 설명하는 일반 문헌에는 문헌 [Berger 및 Kimmel, Guide to Molecular Cloning Techniques , Methods in Enzymology, 제152권(1987), Academic Press, Inc., San Diego, CA]; 문헌 [Sambrook 등, Molecular Cloning - A Laboratory Manual(제3판), 제1-3권, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001], 및 문헌 [Current Protocols in Molecular Biology, Ausubel 등, eds., Current Protocols, Greene Publishing Associates, Inc.와 John Wiley & Sons, Inc.의 합작 회사(2004년 증보 개정판)]이 포함된다. 그 문헌에는, 예를 들어 다른 비천연 아미노산을 포함하는 단백질의 생산을 위한 셀렉터 코돈, 오르소고날 tRNA, 오르소고날 합성효소 및 이들의 쌍을 포함하는 유전자의 발생과 관련된 돌연변이유발법, 벡터의 사용, 프로모터 및 다른 다수의 관련 주제가 기재되어 있다.
예를 들어, tRNA 분자를 돌연변이화하기 위해, tRNA의 라이브러리를 생성시키기 위해, 합성효소 라이브러리를 생성시키기 위해, 관심 단백질 또는 폴리펩티드 내에 비천연 아미노산을 코딩하는 셀렉터 코돈을 삽입하기 위해, 본 발명에서 다양한 유형들의 돌연변이유발법을 이용할 수 있다. 이 돌연변이유발법에는 부위-지정 돌연변이유발, 랜덤 점 돌연변이유발, 상동성 재조합, DNA 셔플링 또는 다른 반복적 돌연변이유발법, 키메라 구축, 우라실을 함유하는 주형을 사용한 돌연변이유발, 올리고뉴클레오티드-지정 돌연변이유발, 포스포로티오에이트-변형 DNA 돌연변이유 발, 갭 이중 DNA를 사용한 돌연변이유발 등, 또는 이들의 임의의 조합이 포함된다. 다른 적절한 방법에는 점 미스매치 복구, 복구-결함 숙주 균주를 사용한 돌연변이유발, 제한-선택 및 제한-정제, 결실 돌연변이유발, 전체 유전자 합성에 의한 돌연변이유발, 이중 가닥 절단 복구 등이 포함된다. 예를 들어, 키메라 구축물을 사용한 돌연변이유발 또한 본 발명에 포함된다. 한 실시양태에서, 돌연변이유발법은 천연 발생 분자 또는 변경되거나 돌연변이된 천연 발생 분자의 공지된 정보, 예컨대 서열, 서열 비교, 물성, 결정 구조 등에 의해 결정될 수 있다.
숙주 세포는 본 발명의 폴리뉴클레오티드 또는 폴리뉴클레오티드를 포함하는 구축물, 예컨대 클로닝 벡터 또는 발현 벡터일 수 있는 벡터로 유전적으로 공학처리(예를 들어, 형질전환, 형질도입 또는 형질감염)된다. 예를 들어, 오르소고날 tRNA, 오르소고날 tRNA 합성효소, 및 유도체화될 단백질에 대한 코딩 영역은 원하는 숙주 세포에서 기능성을 갖는 유전자 발현 조절 요소에 작동가능하게 연결된다. 전형적인 벡터는 전사 및 번역 종결자, 전사 및 번역 개시 서열, 및 특별한 표적 핵산의 발현 조절에 유용한 프로모터를 포함한다. 임의적으로, 그 벡터는 하나 이상의 독립적인 종결자, 진핵생물 또는 원핵생물, 또는 이들 양자 모두에서 카세트의 복제를 허용하는 서열(예를 들어, 셔틀 벡터), 및 원핵세포 시스템 및 진핵세포 시스템 양자 모두를 위한 선택 마커를 포함하는 일반 발현 카세트를 포함한다. 벡터는 원핵생물, 진핵생물, 또는 바람직하게는 이들 양자 모두에서 복제 및/또는 일체화에 적합하다. 문헌 [Giliman 및 Smith, Gene 8:81(1979)]; 문헌 [Roberts 등, Nature, 328:731(1987)]; 문헌 [Schneider, B 등, Protein Expr . Purif . 6435:10(1995)]; 문헌 [Current Protocols in Molecular Biology, Ausubel 등, eds., Current Protocols, Greene Publishing Associates, Inc.와 John Wiley & Sons, Inc.의 합작 회사(2004년 증보 개정판)]; 문헌 [Sambrook 등, Molecular Cloning - A Laboratory Manual(제3판), 제1-3권, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001]; 및 문헌 [Berger 및 Kimmel, Guide to Molecular Cloning Techniques , Methods in Enzymology , 제152권(1987), Academic Press, Inc., San Diego, CA]을 참조한다. 벡터는, 예를 들어 플라스미드, 세균, 바이러스, 네이키드(naked) 폴리뉴클레오티드, 또는 접합된 폴리뉴클레오티드의 형태일 수 있다. 벡터는 전기천공법(문헌 [Fromm 등, Proc . Natl . Acad . Sci . USA 82, 5824(1985)]), 바이러스 벡터에 의한 감염, 소형 비드 또는 입자로 이루어진 매트릭스 내에 또는 표면 상에 핵산을 가진 소립자에 의한 고속 탄도(ballistic) 침투(문헌 [Klein 등, Nature 327, 70-73(1987))) 등을 비롯한 표준 방법에 의해 세포 및/또는 미생물 내로 도입된다.
E. 콜라이 내에서 앰버 정지 코돈(UAG)에 대한 반응으로 비천연 아미노산을 단백질 내로 부위-특이적으로 도입하기 위한, 매우 효율적이고 다용도인 단일 플라스미드 시스템이 개발되었다. 이 새로운 시스템에서, 메타노코커스 잔나쉬이 억제자 tRNAtyr(CUA)와 티로실-tRNA 합성효소로 이루어진 쌍은 대부분의 E. 콜라이 발현 벡터와 상용가능한 단일 플라스미드에서 코딩된다. 최적 2차 구조 및 tRNA 프로세싱을 위해, proK 프로모터 및 종결자의 조절 하에 놓인 단일시스트론(monocistronic) tRNA 오페론을 구축하였다. 그 합성효소에 대한 glnS 프로모터 의 돌연변이 형태의 도입은 억제 효율 및 신뢰도를 유의하게 증가시켰다. 억제 효율의 증가는 상기 합성효소 상의 특별한 돌연변이(D286R)에 의해서뿐만 아니라 tRNA 유전자의 다중 카피에 의해서도 수득되었다(Kobayashi 등, "Structural basis for orthogonal tRNA specificities of tyrosyl-tRNA synthetases for genetic code expansion", Nat. Struct. Biol., 10(6):425-432[2003]). 최적화된 시스템의 보편성은 단백질 기능 및 구조 연구에 있어서의 독특한 유용성이 이미 입증된 여러 상이한 비천연 아미노산의 매우 효율적이고 정확한 도입에 의해서도 입증되었다.
클로닝에 유용한 세균 및 박테리오파지의 카달로그는 예를 들어 ATCC, 예컨대 ATCC에 의해 발행된 문헌 [The ATCC Catalogue of Bacteria and Bacteriophag(1996) Gherna 등(편저)]에 의해 제공된다. 시퀀싱, 클로닝 및 분자생물학의 다른 측면에 대한 부가적 기본 절차 및 기초적 이론 고려사항도 또한 문헌 [Sambrook 등, Molecular Cloning - A Laboratory Manual(제3판), 제1-3권, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001]; 문헌 [Current Protocols in Molecular Biology, Ausubel 등, eds., Current Protocols, Greene Publishing Associates, Inc.와 John Wiley & Sons, Inc.의 합작 회사(2004년 증보 개정판)]; 및 문헌 [Watson 등(1992) Recombinant DNA 제2판 Scientific American Books, NY)에서 찾아볼 수 있다. 또한, 본질적으로 임의의 핵산 (및 표준 핵산이든 아니면 비표준 핵산이든 사실상 임의의 표지된 핵산)은 다양한 상업적 공급처(예를 들어, 미드랜드 서티파이드 리에이전트 컴퍼니(Midland Certified Reagent Company)(미국 텍사스주 미드랜드 소재), 더 그레이트 아메리칸 진 컴퍼니(The Great American Gene Company)(미국 캘리포니아주 라모나 소재), 익스프레스젠 인코포레이티드(ExpressGen Inc.)(미국 일리노이주 시카고 소재), 오페론 테크놀로지스 인코포레이티드(Operon Technologies Inc.)(미국 캘리포니아주 알라메다 소재) 및 다른 많은 공급처) 중 임의의 공급처로부터 맞춤 주문받거나 또는 일반 주문받을 수 있다.
공학처리된 숙주 세포는, 예를 들어 선별 단계, 프로모터의 활성화 또는 형질전환체의 선택과 같은 공정에 적절하도록 변형된 통상적인 영양 배지 중에서 배양할 수 있다. 이 세포는 임의적으로 형질전환 유기체로 배양될 수 있다. 예를 들어, 세포 단리 및 배양(예를 들어, 후속 핵산 단리)에 유용한 다른 참고문헌에는 문헌 [Freshney(1994) Culture of Animal Cells , a Manual of Basic Technique, 제3판, Wiley-Liss, New York] 및 이 문헌에 인용된 참고문헌 [Payne 등(1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY]; 문헌 [Gamborg 및 Phillips(편저)(1995) Plant Cell , Tissue and Organ Culture]; 문헌 [Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York)], 및 [Atlas 및 Parks(편저), The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL]이 포함된다.
관심 단백질 및 폴리펩티드
특정된 위치에 비천연 아미노산을 이용하여 세포 내 단백질을 생성시키는 방법도 또한 본 발명의 한 특성이다. 예를 들어, 방법은 하나 이상의 셀렉터 코돈을 포함하고 단백질을 코딩하는 핵산을 포함한 세포를 적절한 배지에서 성장시키는 단 계; 및 비천연 아미노산을 제공하는 단계를 포함하는데, 여기에서 세포는 세포에서 기능하고 셀렉터 코돈을 인식하는 오르소고날-tRNA(O-tRNA); 및 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 추가로 포함한다. 이 방법에 의해 생성된 단백질도 또한 본 발명의 한 특성이다.
특정 실시양태에서, O-RS는 발현 시스템 내에서 임의의 내인성 tRNA에 비해 동족체 O-tRNA의 아미노아실화에 대해 더 선호성을 가진다. O-tRNA 및 O-RS가 동등한 몰 농도로 존재하는 경우, O-RS에 의해 충전되는 O-tRNA와 내재성 tRNA 사이의 상대적 비는 1:1 초과, 보다 바람직하게는 약 2:1 이상, 보다 더 바람직하게는 5:1, 더욱 더 바람직하게는 10:1, 보다 더 바람직하게는 20:1, 더욱 더 바람직하게는 50:1, 보다 더 바람직하게는 75:1, 더욱 더 바람직하게는 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 또는 그 이상이다.
본 발명은 또한 비천연 아미노산을 포함한 단백질을 포함하는 조성물을 제공한다. 특정 실시양태에서, 단백질은 치료 단백질, 진단 단백질, 산업용 효소 또는 이의 일부의 아미노산 서열과 75% 이상 동일한 아미노산 서열을 포함한다.
본 발명의 조성물 및 본 발명의 방법에 의해 제조된 조성물은 임의적으로 세포 내에 있다. 이에 따라 본 발명의 O-tRNA/O-RS 쌍 또는 개별 성분은 숙주 시스템의 번역 기구에 사용될 수 있고, 이로써 비천연 아미노산이 단백질 내로 도입되게 된다. 국제 특허 공개 공보 제WO 2004/094593호(2004년 4월 16일 출원)(발명의 명칭: "EXPANDING THE EUKAR YOTIC GENETIC CODE"), 및 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINOS")가 이 방법을 기재하고 있고, 본원에 참조 인용된다. 예를 들어, O-tRNA/O-RS 쌍이 숙주, 예를 들어 에쉐리키아 콜라이 세포 내로 도입될 때, 그 쌍은 생체내 셀렉터 코돈에 대한 반응으로 페닐셀레노시스테인과 같은 비천연 아미노산이 단백질 내로 도입되게 한다. 시스템에 첨가된 비천연 아미노산은 성장 배지에 외인적으로 첨가될 수 있는 합성 아미노산, 예컨대 페닐알라닌 또는 티로신의 유도체일 수 있다. 임의적으로, 본 발명의 조성물은 시험관내 번역 시스템 또는 생체내 시스템(들) 내에 있을 수 있다.
본 발명의 세포는 큰 유용량의 비천연 아미노산을 포함하는 단백질을 합성하는 능력을 제공한다. 일부 측면에서, 조성물은 임의적으로 예를 들어 10 마이크로그램 이상, 50 마이크로그램 이상, 75 마이크로그램 이상, 100 마이크로그램 이상, 200 마이크로그램 이상, 250 마이크로그램 이상, 500 마이크로그램 이상, 1 밀리그램 이상, 10 밀리그램 이상, 또는 그 이상의 양, 또는 생체내 단백질 생성 방법(재조합 단백질 생성 및 정제에 대한 상세 내용이 본원에 나와 있음)으로 달성될 수 있는 양의 비천연 아미노산을 포함한 단백질을 포함한다. 또 다른 측면에서, 단백질은 임의적으로, 예를 들어 세포 용매물, 완충액, 약학적 완충액 또는 기타 액체 현탁액 내(예를 들어, 예컨대 약 1 nL 내지 약 100 L의 임의의 체적), 조성물 내에 예를 들어 리터 당 10 마이크로그램 이상의 단백질, 리터 당 50 마이크로그램 이상의 단백질 리터 당 75 마이크로그램 이상의 단백질, 리터 당 100 마이크로그램 이상의 단백질, 리터 당 200 마이크로그램 이상의 단백질, 리터 당 250 마이크로그램 이상의 단백질, 리터 당 500 마이크로그램 이상의 단백질, 리터 당 1 밀리그램 이 상의 단백질, 또는 리터 당 10 밀리그램 이상의 단백질의 농도로 존재한다, 예를 들어 하나 이상의 비천연 아미노산을 포함하는 세포 내에서 다량(예를 들어, 다른 방법, 예를 들어 시험관내 번역으로 전형적으로 가능한 양을 초과하는 양)의 단백질을 생성시키는 것도 본 발명의 특성이다.
비천연 아미노산의 도입은 단백질 구조 및/또는 기능의 변화를 조정하기 위해 예를 들어, 크기, 산도, 친핵성, 수소 결합, 소수성, 단백질분해효소 표적 부위의 접근가능성, (예를 들어, 단백질 어레이의 경우) 잔기에 대한 표적, 표지 또는 반응성 기의 도입 등을 변화시키기 위해 수행될 수 있다. 비천연 아미노산을 포함하는 단백질은 개선된 또는 심지어 완전히 새로운 촉매 활성 또는 물성을 가질 수 있다. 예를 들어, 독성, 생체분포, 구조적 성질, 분광학적 성질, 화학적 성질 및/또는 광화학적 성질, 촉매 능력, 반감기(예를 들어, 혈청 반감기), 예를 들어 공유 Ehe는 비공유적으로 다른 분자와 반응하는 능력 등의 성질을, 임의적으로 비천연 아미노산을 단백질 내에 포함시킴으로써 변형시킨다. 하나 이상의 비천연 아미노산을 포함하는 단백질을 포함하는 조성물은 예를 들어, 새로운 치료, 진단, 촉매 효소, 산업용 효소, 결합 단백질(예를 들어, 항체), 및 예를 들어, 단백질 구조 및 기능 연구에 유용하다. 예를 들어, 문헌 [Dougherty,(2000) Unnatural Amino Acids as Probe of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652]을 참조한다
본 발명의 일부 측면에서, 조성물은 1개 이상, 예를 들어 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상 또는 그 이상의 비천연 아미노산을 가진 하나 이상의 단백질을 포함한다. 그 비천연 아미노산은 동일하거나 상이할 수 있는데, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 이상의 상이한 비천연 아미노산을 포함하는 단백질 내에 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상 또는 그 이상의 상이한 부위가 존재할 수 있다. 또 다른 측면에서, 조성물은 단백질에 존재하는 (전부는 아닌) 1개 이상의 특별한 아미노산이 비천연 아미노산인 단백질을 포함한다. 1개 이상의 비천연 아미노산을 가진 소정의 단백질의 경우, 비천연 아미노산은 동일하거나 상이할 수 있다(예를 들어, 단백질은 2개 이상의 상이한 유형의 비천연 아미노산을 포함하거나, 2개 이상의 동일한 비천연 아미노산을 포함할 수 있다). 2개 이상의 비천연 아미노산을 가진 소정의 단백질의 경우, 비천연 아미노산은 동일하거나 상이하거나, 하나 이상의 상이한 비천연 아미노산과 동일한 종류의 다수의 비천연 아미노산의 조합물일 수 있다.
비천연 아미노산을 포함하는, 본질적으로 임의의 단백질 (또는 이의 일부) (및 예를 들어 1개 이상의 셀렉터 코돈을 포함하는, 임의의 상응하는 코딩 핵산)은 본원의 조성물 및 방법을 사용하여 생성될 수 있다. 공지된 수많은 단백질을 동정하기 위해 어떠한 시도도 하지 않고, 예를 들어 관련 번역 시스템 내에 1개 이상의 적절한 셀렉터 코돈이 포함되도록 임의의 이용가능한 돌연변이 방법을 조정함으로써 임의의 공지된 단백질이 하나 이상의 비천연 아미노산을 포함하도록 변형시킬 수 있다. 공지진 단백질에 대한 통상의 서열 저장 기관에는 유전자은행, EMBL, DDBJ 및 NCBI가 포함된다. 다른 저장 기관은 인터넷 검색에 의해 쉽게 찾을 수 있 다.
전형적으로, 단백질은 임의의 이용가능한 단백질(예를 들어, 치료 단백질, 진단 단백질, 산업용 효소 또는 이의 일부 등)과 예를 들어 60% 이상, 70% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상 또는 그 이상 동일하며, 하나 이상의 비천연 아미노산을 포함한다. 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있는 치료 단백질, 진단 단백질 및 다른 단백질의 예를 2004년 4월 16일 출원된 국제특허공개 공보 제WO2004/094593호(2004년 4월 16일 출원)(발명의 명칭: "EXPANDING THE EUKAR YOTIC GENETIC CODE"); 및 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS")에서 찾아볼 수 있지만, 이들로 한정되는 것은 아니다. 1개 이상의 비천연 아미노산을 포함하도록 변형될 수 있는 치료 단백질, 진단 단백질 및 다른 단백질의 예에는 예를 들어, 히루딘, 인간 성장 호르몬, RAS, 알파-1 항트립신, 앤지오스타틴, 항용혈성 인자, 항체(항체에 대한 상세한 설명이 이하에 제공됨), 아폴리포단백질, 아포단백질, 심방성 나트륨이뇨 인자, 심방성 나트륨이뇨 폴리펩티드, 심방성 펩티드, C-X-C 케모카인(예를 들어, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), 칼시토닌, CC 케모카인(예를 들어, 단핵세포 화학유인물질 단백질-1, 단핵세포 화학유인물질 단백질-2, 단핵세포 화학유인물질 단백질-3, 단핵세포 염증성 단백질-1 알파, 단핵세포 염증성 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262), CD40 리간드, C-키트 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토카인(예 를 들어, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1), 상피 성장 인자(EGF), 에리트로포이에틴("EPO"), 익스폴리에이팅(Exfoliating) 독소 A 및 B, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀(Gonadotropin), 성장 인자, 헤지호그(Hedgehog) 단백질(예를 들어, Sonic, Indian, Desert), 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, 인슐린, 인슐린-유사 성장 인자(IGF), 인터페론(예를 들어, IFN-α, IFN-β, IFN-γ), 인터루킨(예를 들어, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12 등), 케라티노사이트 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르튜린(Neurturin), 호중구 억제 인자(NIF), 온코스타틴 M, 골생성 단백질, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬(예를 들어, 인간 성장 호르몬), 플레이오트로핀, 단백질 A, 단백질 G, 발열원성 외독소 A, B 및 C, 렐랙신(Relaxin), 레닌(Renin), SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체(IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), 가용성 TNF 수용체, 소마토메딘(Somatomedin), 소마토스타틴(Somatostatin), 소마토트로핀(Somatotropin), 스트렙토키나제, 수퍼항원, 즉 스타필로코컬 장독소(SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), 수퍼옥사이드 디스뮤타제(SOD), 독성 쇼크증후군 독소(TSST-1), 티모신(Thymosin) 알파 1, 조직 플라스미노겐 활성화자, 종양 괴사 인자 베타(TNF 베타), 종양 괴사 인자 수용체(TNFR), 종양 괴사 인자-알파(TNF 알파), 혈관 내피세포 성장 인자(VEGEF), 유로키나제 및 다른 많은 것들이 포함되나, 이에 한정되지 않는다.
비천연 아미노산을 생체내에서 단백질 내로 도입하기 위한 본원에 기재된 조성물 및 방법을 사용하여 제조될 수 있는 단백질의 한 부류는 전사 조절자 또는 이의 일부를 포함한다. 전사 조절자의 예에는 세포 성장, 분화, 조절 등을 조절하는 유전자 및 전사 조절자 단백질이 포함된다. 전사 조절자는 원핵생물, 바이러스 및 진핵생물(예컨대, 진균류, 식물, 효모, 곤충, 및 포유동물을 비롯한 동물을 포함함)에서 발견되며, 이는 광범위한 치료 표적을 제공한다. 발현 및 전사 활성화자는 많은 기작을 통해, 예를 들어 수용체에 결합하고, 신호 전달 캐스케이드를 자극하고, 전사 인자의 발현을 조절하고, 프로모터 및 인핸서에 결합하고, 프로모터 및 인핸서에 결합하는 단백질에 결합하고, DNA를 풀고, pre-mRNA를 스플라이싱하고, RNA를 폴리아데닐화하고, RNA를 분해시킴으로써 전사를 조절한다는 것이 인식될 것이다.
본 발명의 단백질의 한 부류(예를 들어, 하나 이상의 비천연 아미노산을 가지는 단백질)는 생물학적 활성 단백질, 예컨대 사이토카인, 염증성 분자, 성장 인자, 이들의 수용체 및 종양유전자 생성물, 예컨대 인터루킨(예를 들어, IL-1, IL-2, IL-8 등), 인터페론, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-α, TGF-β, EGF, KGF, SCF/c-키트, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1 및 히알루린/CD44; 신호 전달 분자 및 상응하는 종양유전자 생성물, 예컨대 Mos, Ras, Raf 및 Met; 및 전사 활성화자 및 억제자, 예컨대 p53, Tat, Fos, Myc, Jun, Myb, Rel; 및 스테로이드 호르몬 수용체, 예컨대 에스트로겐, 프로게스테론, 테스토스테론, 알도 스테론, LDL 수용체 리간드 및 코르티코스테론에 대한 수용체를 포함한다.
본 발명에 의해 하나 이상의 비천연 아미노산을 가지는 효소(예를 들어, 산업용 효소) 또는 이의 일부가 제공된다. 효소의 예에는, 예를 들어 아미다제(amidase), 아미노산 라세마제(racemase), 아실라제(acylase), 데할로게나제(dehalogenase), 디옥시게나제(dioxygenase), 디아릴프로판 퍼옥시다제, 에피머라제(epimerase), 에폭시드 히드롤라제(hydrolase), 에스터라제, 이소머라제, 키나제, 글루코스 이소머라제, 글리코시다제, 글리코실 트랜스퍼라제, 할로퍼옥시다제, 모노옥시게나제(예를 들어, p450), 리파제, 리그닌 퍼옥시다제, 니트릴 히드라타제(hydratase), 니트릴라제(nitrilase), 단백질분해효소, 포스파타제, 섭틸리신, 트랜스아미나제 및 뉴클레아제가 포함되나, 이에 한정되지 않는다.
이들 단백질의 대다수는 시판되고 있으며(예를 들어, 시그마 바이오사이언시스(Sigma BioSciences) 참조), 상응하는 단백질 서열 및 유전자, 및 전형적으로 이들의 많은 변이체가 공지되어 있다(예를 들어, 유전자은행 참조). 임의의 이들 단백질은 본 발명에 따라 하나 이상의 비천연 아미노산의 삽입에 의해 변형되어, 예를 들어 그의 1개 이상의 관심 치료적, 진단적 또는 효소적 성질이 변경될 수 있다. 치료적으로 관련된 성질의 예에는 혈청 반감기, 저장 수명 반감기, 안정성, 면역원성, 치료 활성, (예를 들어, 리포터 기(예를 들어, 표지 또는 표지 결합 부위)를 비천연 아미노산에 포함시켜 얻는) 검출용이성, LD50의 감소 또는 다른 부작용, 위관을 통해 체내로 들어가는 능력(예를 들어, 경구 이용가능성) 등을 포함한다. 관련된 진단적 성질의 예에는 저장 수명 반감기, 안정성, 진단 활성, 검출용이성 등이 포함된다. 관련 효소적 특성의 예에는 저장 수명 반감기, 안정성, 효소적 활성, 생산 용량 등이 포함된다.
각종 다른 단백질도 또한 본 발명의 조성물 및 방법을 이용하여 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있다. 예를 들어, 본 발명은 비천연 아미노산을 갖는 하나 이상의 백신 단백질, 예컨대 감염성 진균류, 예컨대 아스퍼길러스( Aspergillus ), 칸디다( Candida ) 종; 세균, 특히 병원성 세균에 대한 모델로 사용되는 E. 콜라이뿐만 아니라, 스타필로코커스( Staphylococcus )(예를 들어, 아루레우스( aureus )), 또는 스트렙토코커스( Streptococcus )(예를 들어, 뉴모니 아( pneumoniae ))와 같이 의학적으로 중요한 세균; 포자류(예를 들어, 플라스모디아( Plasmodia )), 근족충류(예를 들어, 엔타모에바 ( Entamoeba )) 및 편모충(트리파노소마( Trypanosoma ), 레이쉬마니아 ( Leishmania ), 트리코모나스( Trichomonas ), 지아르디아( Giardia ) 등)과 같은 원생동물; (+) RNA 바이러스(예를 들어, 폭스바이러스, 예컨대 백시니아 ( vaccina ); 피코르나바이러스, 예컨대 폴리오 ( polio ); 토가바이러스, 예컨대 루벨라 ( rubella ); 플라비바이러스, 예컨대 HCV; 및 코로나바이러스를 포함함), (-) RNA 바이러스(예컨대, 래브도바이러스, 예컨대 VSV; 파라믹소빔세스, 예컨대 RSV; 오소믹소빔세스, 예컨대 인플루엔자; 번야바이러스; 및 아레나바이러스), dsDNA 바이러스(예를 들어, 레오바이러스), RNA로부터 DNA를 합성하는 바이러스, 즉 레트로바이러스, 예컨대 HIV 및 HTLV, 및 DNA로부터 RNA를 합성하는 일부 바이러스, 예컨대 헤파티티스 B와 같은 바이러스로부터 유래된 단백질 내의 하 나 이상의 천연 아미노산을 치환시키는 것을 포함할 수 있다.
곤충 내성 단백질(예를 들어, Cry 단백질), 전분 및 지질 생성 효소, 식물 및 곤충 독소, 독소-내성 단백질, 미코톡신 해독 단백질, 식물 성장 효소(예를 들어, 리불로스 1,5-비스포스페이트 카르복실라제/옥시게나제 "RUBISCO"), 리폭시게나제(LOX), 및 포스포에놀피루베이트(PEP) 카르복실라제와 같이 농업 관련 단백질도 또한 비천연 아미노산 변형에 적합한 표적이다.
특정 실시양태에서, 본 발명의 방법 및/또는 조성물 내의 관심 단백질 또는 폴리펩티드 (또는 이의 일부)가 핵산에 코딩된다. 전형적으로, 핵산은 하나 이상의 셀렉터 코돈, 2개 이상의 셀렉터 코돈, 3개 이상의 셀렉터 코돈, 4개 이상의 셀렉터 코돈, 5개 이상의 셀렉터 코돈, 6개 이상의 셀렉터 코돈, 7개 이상의 셀렉터 코돈, 8개 이상의 셀렉터 코돈, 9개 이상의 셀렉터 코돈, 10개 또는 그 이상의 셀렉터 코돈을 포함한다.
관심 단백질 또는 폴리펩티드를 코딩하는 유전자는 당업자에게 잘 공지되어 있으면서 본 명세서의 "돌연변이유발 및 기타 분자생물학 기법(Mutagenesis and Other Molecular Biology Techniques)"에 기재된 방법을 사용하여, 비천연 아미노산의 도입을 위한 하나 이상의 셀렉터 코돈을 포함하도록 돌연변이화될 수 있다. 예를 들어, 관심 단백질에 대한 핵산은 하나 이상의 비천연 아미노산의 삽입을 위해 제공된 하나 이상의 셀렉터 코돈을 포함하도록 돌연변이화한다. 본 발명은, 예를 들어 하나 이상의 비천연 아미노산을 포함하는 임의의 단백질의 임의의 그러한 변이체, 예를 들어 돌연변이체를 포함한다. 유사하게, 본 발명은 상응하는 핵산, 즉 하나 이상의 비천연 아미노산을 코딩하는 하나 이상의 셀렉터 코돈을 가진 임의의 핵산을 포함한다.
비천연 아미노산을 포함하는 단백질을 제조하기 위해, 오르소고날 tRNA/RS 쌍을 통해 비천연 아미노산을 생체내에서 도입하기에 적합한 숙주 세포 및 유기체를 사용할 수 있다. 숙주 세포는 오르소고날 tRNA를 발현하는 하나 이상의 벡터, 오르소고날 tRNA 합성효소, 및 유도체화될 단백질을 코딩하는 벡터로 유전적으로 공학처리된다(예를 들어, 형질전환, 형질도입 또는 형질감염된다). 이 성분들 각각은 동일한 벡터 상에 존재할 수 있거나, 별도의 벡터 상에 존재할 수 있거나, 또는 2개의 성분은 한 벡터 상에 존재하고 제3 성분은 제2 벡터 상에 존재할 수 있다. 상기 벡터는, 예를 들어 플라스미드, 세균, 바이러스, 네이키드 폴리뉴클레오티드 또는 접합된 폴리뉴클레오티드의 형태일 수 있다.
면역반응성에 의한 폴리펩티드의 정의
본 발명의 폴리펩티드가 각종 새로운 폴리펩티드 서열(예를 들어, 본원의 번역 시스템에서 합성된 단백질의 경우, 비천연 아미노산을 포함하는 폴리펩티드, 또는 예를 들어 신규 합성효소의 경우, 표준 아미노산의 신규 서열을 포함하는 폴리펩티드)을 제공하기 때문에, 그 폴리펩티드는, 예를 들어 면역학적 분석에서 인식될 수 있는 새로운 구조적 특성도 제공한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 항혈청의 생성뿐만 아니라, 항혈청에 결합하는 폴리펩티드는 본 발명의 한 특성이다. 본원에서 사용되는 용어 "항체"는 실질적으로 면역글로불린 유전자 또는 면역글로불린 유전자들에 의해 코딩되는 폴리펩티드, 또는 피분석물(항원)에 특이적으로 결합하여 인식하는 상기 폴리펩티드의 단편을 포함하나, 이에 한정되는 것은 아니다. 예로는 다중클론 항체, 단일클론 항체, 키메라 항체 및 단쇄 항체 등이 있다. Fab 단편, 및 파지 디스플레이를 비롯한 발현 라이브러리에 의해 생성된 단편을 비롯한 면역글로불린 단편 또한 본원에서 사용되는 용어 "항체"에 포함된다. 예를 들어, 항체 구조 및 용어에 대해서는 문헌 [Paul, Fundamental Immunology, 제4판, 1999, Raven Press, New York]을 참조한다.
면역분석에서 사용하기 위한 항혈청을 생성하기 위해, 본원에 기재된 바와 같이 하나 이상의 면역원성 폴리펩티드를 생성시키고 정제한다. 예를 들어, 재조합 단백질은 재조합 세포에서 생성될 수 있다. 사실상 유전적으로 동일하기 때문에 결과가 더 재현가능하므로 본 분석에서 사용되는 근친교배 마우스 종을 표준 아주반트(adjuvant)(예를 들어, 프로인트(Freund's) 아쥬반트) 및 표준 마우스 면역화 프로토콜과 함께 사용된 면역원성 단백질(들)로 면역화한다(예를 들어, 항체 생성, 면역분석 포맷, 및 구체적인 면역반응성을 측정하는 데 이용될 수 있는 조건에 대한 표준 설명을 위해, 문헌 [Harlow 및 Lane(1988) Antibodies . A Laboratory Manual, Cold Spring Harbor Publications, New York]을 참조한다). 단백질, 항체, 항혈청 등에 대한 부가적 상세한 설명은 국제 특허 공개 공보 제WO 2004/094593호(발명의 명칭: "EXPANDING THE EUKARYOTIC GENETIC CODE"); 제2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"); 제WO 2004/035605호(발명의 명칭: "GLYCOPROTEIN SYNTHESIS"); 및 제WO 2004/058946호(발명의 명칭: "PROTEIN ARRAYS")에서 찾을 수 있다.
O- tRNA , O- RS , 및 O- tRNA /O- RS 쌍의 용도
본 발명의 조성물 및 본 발명의 방법에 의해 제조된 조성물은 임의적으로 세포 내에 있다. 이에 따라 본 발명의 O-tRNA/O-RS 쌍 또는 개별 성분은 숙주 시스템의 번역 기구에 사용될 수 있고, 이로써 비천연 아미노산이 단백질 내로 도입되게 된다. 국제 특허 공개 공보 제WO 2002/085923호(발명의 명칭: "IN VIVO INCORPORATION OF UNNATURAL AMINOS"가 이 방법을 기재하고 있고, 본원에 참조 인용된다. 예를 들어, O-tRNA/O-RS 쌍이 숙주, 예를 들어 에쉐리키아 콜라이 또는 효모 내로 도입될 때, 그 쌍은 생체내 셀렉터 코돈, 예를 들어 엠버 넌센스 코돈에 대한 반응으로, 비천연 아미노산이 단백질, 예를 들어 미오글로빈 시험 단백질 또는 치료 단백질 내로 도입되도록 한다. 임의적으로, 본 발명의 조성물은 시험관내 번역 시스템 또는 세포내 생체내 시스템(들) 내에 있을 수 있다. 비천연 아미노산을 갖는 단백질은 광범위한 용도들 중 임의의 용도에 사용될 수 있다. 예를 들어, 단백질 내로 도입된 비천연 부분은 광범위한 변형들 중 임의의 변형, 예를 들어 표지 또는 염료와 같은 소분자 및/또는 생체분자를 갖는 다른 단백질과 가교되도록 하기 위한 표적으로 작용할 수 있다. 이러한 변형으로, 비천연 아미노산의 도입은 향상된 치료 단백질을 초래할 수 있고, 효소의 촉매 기능을 변경 또는 향상시키기 위해 사용될 수 있다. 일부 측면에서, 단백질 내 비천연 아미노산의 도입 및 후속 변형은 단백질 구조, 다른 단백질과의 상호작용 등에 대한 연구를 도모할 수 있다.
키트
키트도 또한 본 발명의 한 특성이다. 예를 들어, 세포 내 하나 이상의 비천 연 아미노산을 포함하는 단백질을 제조하기 위한 키트가 제공되는데, 여기에서 키트는 O-tRNA를 코딩하는 폴리뉴클레오티드 서열, 및/또는 O-tRNA, 및/또는 O-RS를 코딩하는 폴리뉴클레오티드 서열, 및/또는 O-RS를 보유하기 위한 용기를 포함한다. 한 실시양태에서, 키트는 비천연 아미노산 페닐셀레노시스테인을 추가로 포함한다. 또 다른 실시양태에서, 키트는 단백질 및/또는 숙주 세포를 생성시키기 위한 지시 물질을 추가로 포함한다.
하기 실시예는 청구된 본 발명을 설명하기 위해 제공되는 것이나 본 발명을 한정하기 위해 제공된 것은 아니다. 당업자는 청구된 본 발명의 범위를 벗어나지 않으면서 변경될 수 있는 다양한 비임계적 파라미터를 인식할 것이다. 본원에 기재된 실시예 및 실시양태는 단지 설명하기 위한 목적으로 제공된 것이고, 이러한 취지의 각종 변형 또는 변화가 당업자에게 제안되고 이는 본원의 사상 및 취지와 첨부된 특허청구범위의 범주 내에 속함을 이해하도록 한다.
실시예
페닐셀레노시스테인에 대해 특이적인 돌연변이체 합성효소의 유전적 선택
페닐셀레노시스테인 반응성 화학
셀레늄은 유기 합성 및 생물학 모두에 있어 필수적인 원소이다. 페닐셀레노 부분이 온화한 조건 하에서 산화될 수 있고, 셀레녹시드의 자발적 신(syn) 제거가 올레핀 형성을 초래함이 입증되었다. 이 기법은 전반적 합성에 있어 광위적으로 사용되어왔다.
셀레늄 함유의 비천연 아미노산을 단백질 내로 도입하면, 단백질의 매우 선택적인 번역후 변형에 대한 선호적 표적이 발생될 것이며, 예를 들어 선택적으로 지질화된 단백질이 생성될 것이다. 그와 같은 한 비천연 셀레노 아미노산이, 페닐셀레나이드 또는 Se-페닐-L-셀레노시스테인이라고도 동의적으로 칭해지는 페닐셀레노시스테인이다(CAS 등록 번호 71128-82-0). 이 구조는 도 1, 구조 1에 나와 있다. 이 비천연 아미노산은 예를 들어 시그마
Figure 112008070151815-PCT00005
-알드리히
Figure 112008070151815-PCT00006
컴퍼니 인코포레이티드로부터 카달로그 번호 50827에서 입수될 수 있다.
페닐셀레노시스테인 아미노산 잔기의 산화 절단은 α,β-불포화 아미노산 데히드로알라닌(도 1, 구조 2 참조)을 초래한다. 데히드로알라닌은 다수의 천연 발생 펩티드에서 발견된다(Chatterjee 등(2005), Chemical Reviews 105(2):633-683). 비보호 시스테인 잔기를 함유하는 디히드로펩티드는 분자내 입체선택적 접합을 겪어, 이로써 시클릭 란티오닌계를 생성시키게 된다(Chatterjee 등(2005), Chemical Reviews 105(2):633-683). 란티오닌계는 번역후 변형된 항생제의 한 부류인 란티바이오틱(lantibiotics)에서 발견되는 구조이다(Chatterjee 등(2005), Chemical Reviews 105(2):633-683).
비천연 아미노산 데히드로알라닌(도 1, 구조 2 참조)의 마이클 부가 반응은 번역후 변형을 갖는 단백질을 초래할 수 있는데, 예를 들어 티오-지질과의 반응에 의해 지질화된 단백질을 발생시킬 수 있다. 보다 구체적으로, 티오팔미트산과의 반응은 팔미토일시스테인을 초래하고(도 1, 구조 3 참조), 파르네실머캅탄과의 반응은 파르네실시스테인을 제공하며(도 1, 구조 4 참조), 말론산염과의 반응은 γ-카 르복시글루탐산을 생성시킨다(도 1, 구조 6 참조). 또한, 1-헥사데칸티올과의 반응은 S-헥사데실시스테인을 초래한다(도 1, 구조 5 참조). S-헥사데실시스테인이 본연의 번역후 변형은 아니나, 단백질 내 이 잔기의 존재는 원하는 성질을 가질 수 있는데; 예를 들어, 그것은 인간 혈청 알부민 결합 및 보다 높은 생체내 단백질 안정성을 초래할 수 있다.
페닐셀레노시스테인 잔기의 표적화 변형에 의한 폴리펩티드의 지질화는 원하는 성질, 예컨대 막 국소화, 향상된 생체내 안정성(즉, 향상된 반감기) 및 지질 용해성을 가질 수 있다. 또한, 지질화된 형태의 일부 단백질은 생물학적으로 활성인 형태이다.
페닐셀레노시스테인을 포함하는 단백질의 생성
비천연 아미노산을 E. 콜라이, 효모 및 포유동물 세포의 유전 코드에 계통적으로 부가하기 위한 방법이 과거 기재되었다. 그러한 방법은 내인성 숙주 tRNA, 아미노아실-tRNA 합성효소 또는 아미노산과의 교차 반응없이, 독특한 코돈에 대한 반응으로 소정의 아미노산을 선택적으로 도입하는 능력으로 정의되는 오르소고날성을 가지는 넌센스 억제자 tRNA 및 아미노아실-tRNA 합성효소(RS) 쌍의 진화에 기초한다.
본 발명은 성장하는 폴리펩티드 사슬 내로의 비천연 아미노산 페닐셀레노시스테인의 유전적으로 프로그램화된 번역 도입을 허용하는 오르소고날 시약을 생성시킴으로써, 비천연 아미노산 페닐셀레노시스테인을 함유하는 폴리펩티드를 생체내 생성시키기 위한 조성물 및 방법을 제공한다. 또한, 이 오르소고날 시스템의 사용 으로 비천연 아미노산 함유의 다량의 폴리펩티드(즉, 다른 합성 방법을 이용할 때 가능한 양보다 더 많은 양의 폴리펩티드)가 생성된다. 페닐셀레노시스테인을 포함하는 폴리펩티드는 표적화 변형 반응, 예를 들어 비제한적 예로서 본 명세서의 교시에 따른 인공적으로 지질화된 폴리펩티드의 발생을 위해 사용될 수 있다. 그러한 변형 단백질은 향상된 치료제를 포함하나 이에 한정되지 않는 각종 용도들을 가진다.
페닐셀레노시스테인(도 1, 구조 1)을 독특하게 삽입하는 오르소고날 tRNA/aaRS 쌍을 발생시키기 위해, E. 콜라이 합성효소에 의해 인식되지 않는 공학처리된 M. 잔나쉬이 넌센스 억제자(MjtRNATyrC UA)를 특이적으로 충전하는 메타노코커 잔나쉬이 티로실-tRNA 합성효소(MjTyrRS)의 활성 부위 돌연변이체의 라이브러리를 사용하였다. 문헌 [Wang 등(2006), Annual Review of Biophysics and Biomolecular Structure 35:225-249]에 기재된 합성효소 라이브러리 pBK-lib5가 선별에 사용되고, 일련의 양성 및 음성 선택에 적용되었다. 양성 선택에서의 생존은 페닐셀레노시스테인의 존재 하에 클로람페니콜 아세틸 트랜스퍼라제(CAT)에서의 엠버 돌연변이의 억제 시에 부수적이었고; 음성 선택에서의 생존은 페닐셀레노시스테인의 부재 하에 독성 바나제 단백질을 코딩하는 유전자에서의 엠버 돌연변이의 부적절한 억제에 대해 부수적이었다. 클론은, 그것이 엠버 코돈에 대한 반응으로 독특하게 페닐셀레노시스테인을 도입하는 경우에만 양성 및 음성 선택 라운드 모두에서 생존한다.
이 선택 후, 허용 부위에 엠버 돌연변이 셀렉터 코돈을 갖는 CAT 유전자를 가지는 세포가 페닐셀레노시스테인의 존재 하에서만 클로르암페니콜의 존재 하에 생존하도록 한 클론 후보물질을 동정하였다. 페닐셀레노시스테인의 부재 하에서는, 그 동일한 세포는 클로르암페니콜의 존재 하에서 성장하지 않았고, 이는 내인성 아미노산의 도입으로부터 배경 생존이 없거나 거의 없는 효율적인 페닐셀레노시스테인 도입과 일치한다.
후보물질 돌연변이체 합성효소 클론의 시퀀싱은, 각기 오르소고날 번역 시스템에서 기능할 수 있는 3가지 상이한 합성효소 단리물을 나타냈다.
클론 1(PhSeRS-SD): Y32W, L65E, H70G, D158Q, L162S
클론 2(PhSeRS-K4): Y32W, L65H, H70G, F108N, Q109S, D158S, L162E
클론 3(PhSeRS-K5): Y32W, L65H, A67G, H70G, F108K, Q109S, D158E, L162E
이 클론들은 하기 표에 추가로 요약되어 있다.
메타노코커스 잔나쉬이 티로실 - tRNA 합성효소 아미노산 서열
와일드형 및 돌연변이체
32 65 67 70 108 109 158 162 서열 번호
야생형 Tyr Leu Ala His Phe Gln Asp Leu 2
돌연변이체 클론 1(SD) Trp Glu Ala Gly Phe Gln Gln Ser 4
돌연변이체 클론 2(K4) Trp His Ala Gly Asn Ser Ser Glu 6
돌연변이체 클론 3(K5) Trp His Gly Gly Lys Ser Glu Glu 8
단리된 3가지 돌연변이체 합성효소들 중, 클론 2 합성효소(PhSeRS-K4)이 최 고의 활성 및 특이성을 가졌다. 각각의 이 클론 및 상응하는 야생형 종의 완전 뉴클레오티드 및 아미노산 서열이 도 2에 제공되어 있다.
오르소고날 합성효소 확인
본원에 기재된 돌연변이체 합성효소를 이용하여, 위치 4에 엠버 셀렉터 코돈(TAG4)을 함유하는 미오글로빈 모델 단백질이 1.5 내지 2 mg/L 수율로 발현되었고, 페닐셀레노시스테인의 부재 하에서는 배경 발현을 가지지 않았다. 페닐셀레노시스테인을 함유하는 이 모델 단백질을 후번역 변형에 추가로 적용시켜, γ-카르복시글루탐산(도 1 구조 6)을 생성시켰고, 이는 고해상 질량분광법을 이용하여 확인되었다.
페닐셀레노시스테인을 포함하는 2가지 부가적 모델 단백질은 또한 본원에 기재된 돌연변이체 합성효소 및 생체내 오르소고날 생성 시스템을 이용하여 3 내지 5 mg/L 수율로 발현되었다. 페닐셀레노시스테인을 함유하는 인간 성장 호르몬(hGH)이 생성되었다. 페닐셀레노시스테인 형태의 생성 후에, 단백질을 변형시켜, S-헥사데실시스테인을 함유하는 hGH를 생성시켰다. 마우스 내 변형 hGH의 인간 혈청 알부민 결합 성질 및 생체내 반감기가 현재 시험 중이다.
본원에 기재된 오르소고날 시약을 또한 사용하여, 페닐셀레노시스테인을 함유하는 녹색 형광 단백질(GFP)을 생성시켰다. 그러한 형태의 단백질을 또한 후속하여 변형시켜, 대안적으로 S-헥사데실시스테인, 파르네실시스테인 및 팔미토일시스테인 형태의 GFP을 형성시켰다. 이 지질화된 형태의 GFP의 막-표적화 성질이 현재 시험 중이다.
따라서, 본 발명은 비천연 아미노산 페닐셀레노시스테인(도 1, 구조 1 참조)을 함유하는 단백질의 유전적 프로그램화 생성을 위한 조성물 및 방법을 제공한다. 과산화수소에 의한 후속적 산화 제거로 원하는 위치에 데히드로알라닌(도 1, 구조 2 참조)이 생성된다. 이 데히드로알라닌 부분은 이어서 각종 2차 변형 반응들에서 표적화될 수 있다.
상기와 같은 본 발명은 보다 명료하게 하고 이해를 돕기 위한 목적으로 다소 상세히 기재되었으나, 본 발명의 진정한 범주를 벗어나지 않는 한, 형태 및 세부사항에서의 다양한 변화가 가해질 수 있음이 본 개시내용을 읽은 당업자에게 명백할 것이다. 모든 공보, 특허, 특허출원, 및/또는 본원에서 인용된 기타 문헌은 마치 개별 공보, 특허, 특허출원 및/또는 기타 문헌이 모든 목적을 위해 참조 인용되는 것으로 개별적으로 나타내어지는 것과 같은 동일한 정도로 모든 목적을 위해 완전히 참조 인용된다.
SEQUENCE LISTING <110> The Scripps Research Institute WANG, JIANGYUN SCHULTZ, PETER G <120> GENETICALLY PROGRAMMED EXPRESSION OF PROTEINS CONTAINING THE UNNATURAL AMINO ACID PHENYLSELENOCYSTEINE <130> 54-001820US <140> US 11/724,039 <141> 2007-03-13 <160> 9 <170> PatentIn version 3.4 <210> 1 <211> 77 <212> RNA <213> Artificial <220> <223> nonsense suppressor tyrosyl-tRNA CUA derived from Methanococcus jannaschii <400> 1 ccggcgguag uucagcaggg cagaacggcg gacucuaaau ccgcauggcg cugguucaaa 60 uccggcccgc cggacca 77 <210> 2 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 2 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Tyr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 3 <211> 918 <212> DNA <213> Methanococcus jannaschii <400> 3 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttacatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagatta 918 <210> 4 <211> 306 <212> PRT <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 4 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Trp 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Glu Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gln Ile His 145 150 155 160 Tyr Ser Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 5 <211> 921 <212> DNA <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 5 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tagagttggc tgatttaggg gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tcaaattcat 480 tatagtggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 6 <211> 306 <212> PRT <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 6 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Trp 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 His Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Asn Ser Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ser Ile His 145 150 155 160 Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 7 <211> 921 <212> DNA <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 7 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tacatttggc tgatttaggc gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga aaattctctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa ttctattcat 480 tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 8 <211> 306 <212> PRT <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 8 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Trp 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 His Leu Gly Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Lys Ser Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Glu Ile His 145 150 155 160 Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 9 <211> 921 <212> DNA <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 9 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tacatttggg tgatttaggc gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga aaagtctctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgagattcat 480 tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921

Claims (51)

  1. (a) 페닐셀레노시스테인인 제1 비천연 아미노산;
    (b) 제1 오르소고날(orthogonal) 아미노아실-tRNA 합성효소(O-RS); 및
    (c) 제1 오르소고날 tRNA(O-tRNA)를 포함하고,
    여기서, 상기 제1 O-RS는 상기 제1 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화하는 번역 시스템.
  2. 제1항에 있어서, 상기 제1 O-RS는, 상기 O-tRNA, 상기 페닐셀레노시스테인, 및 서열 번호 4, 6 또는 8의 아미노산 서열을 포함하는 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상의 효율로, 상기 제1 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화하는 번역 시스템.
  3. 제1항에 있어서, 상기 제1 O-RS는 서열 번호 4, 6, 8에 제시된 아미노산 서열 및 이의 보존적 변이체로 구성된 군으로부터 선택되는 아미노산 서열을 포함하는 번역 시스템.
  4. 제1항에 있어서, 상기 제1 O-tRNA는 엠버 억제자 tRNA인 번역 시스템.
  5. 제1항에 있어서, 상기 제1 O-tRNA는 서열 번호 1에 제시된 폴리뉴클레오티드 서열을 포함하거나 그 서열에 의해 코딩되는 번역 시스템.
  6. 제1항에 있어서, 상기 제1 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈을 포함하고, 관심 단백질을 코딩하는 핵산을 추가로 포함하는 번역 시스템.
  7. 제6항에 있어서, 제2 O-RS 및 제2 O-tRNA를 추가로 포함하고, 여기서 제 2 O-RS는 제2 O-tRNA를 제1 비천연 아미노산과 상이한 제2 비천연 아미노산으로 우선적으로 아미노아실화하고, 제2 O-tRNA는 제1 O-tRNA에 의해 인식되는 셀렉터 코돈과 상이한 셀렉터 코돈을 인식하는 번역 시스템.
  8. 제1항에 있어서, 상기 제1 비천연 아미노산, 상기 제1 O-RS 및 상기 제1 O-tRNA를 포함한 숙주 세포를 포함하는 번역 시스템.
  9. 제8항에 있어서, 상기 숙주 세포는 진정세균 세포인 번역 시스템.
  10. 제9항에 있어서, 상기 진정세균 세포는 E. 콜라이(E. coli) 세포인 번역 시스템.
  11. 제8항에 있어서, 상기 숙주 세포는 상기 제1 O-RS를 코딩하는 폴리뉴클레오티드를 포함하는 번역 시스템.
  12. 제11항에 있어서, 상기 폴리뉴클레오티드는 서열 번호 5, 7 또는 9에 제시된 뉴클레오티드 서열을 포함하는 번역 시스템.
  13. 제8항에 있어서, 상기 숙주 세포는 상기 제1 O-tRNA를 코딩하는 폴리뉴클레오티드를 포함하는 번역 시스템.
  14. 번역 시스템에서 선택된 위치에 비천연 아미노산을 포함하는 단백질을 생성시키는 방법으로서,
    (a) (i) 페닐셀레노시스테인 제1 비천연 아미노산;
    (ii) 제1 오르소고날 아미노아실-tRNA 합성효소(O-RS);
    (iii) 제1 오르소고날 tRNA(O-tRNA)(여기서, 상기 제1 O-RS는 상기 제1 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화함); 및
    (iv) 상기 단백질을 코딩하는 핵산(여기서, 핵산은 상기 제1 O-tRNA에 의해 인식되는 하나 이상의 셀렉터 코돈을 포함함)
    을 포함하는 번역 시스템을 제공하는 단계; 및
    (b) 상기 셀렉터 코돈에 대한 반응으로 상기 단백질의 번역 과정 중에 상기 단백질 내 상기 선택된 위치에 비천연 아미노산을 도입함으로써, 선택된 위치에 상기 비천연 아미노산을 포함하는 상기 단백질을 생성시키는 단계
    를 포함하는 방법.
  15. 제14항에 있어서, 상기 제1 O-RS는, 상기 O-tRNA, 상기 페닐셀레노시스테인, 및 서열 번호 4, 6 또는 8의 아미노산 서열을 포함하는 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상의 효율로, 상기 제1 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화하는 방법.
  16. 제14항에 있어서, 상기 번역 시스템은 상기 O-RS를 코딩하는 폴리뉴클레오티드를 포함하는 방법.
  17. 제14항에 있어서, 상기 번역 시스템의 제공은 서열 번호 4, 6, 8에 제시된 아미노산 서열 및 이의 보존적 변이체로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 O-RS를 제공하는 것을 포함하는 방법.
  18. 제14항에 있어서, 상기 제1 오르소고날 아미노아실-tRNA 합성효소의 제공은 부위-지정 돌연변이유발에 의해 야생형 아미노아실-tRNA 합성효소의 아미노산 결합 포켓을 돌연변이화하고, 상기 O-tRNA를 상기 비천연 아미노산으로 우선적으로 아미노아실화하는 생성된 O-RS를 선택함으로써, 상기 제1 오르소고날 아미노아실-tRNA 합성효소를 제공하는 것을 포함하는 방법.
  19. 제18항에 있어서, 상기 선택 단계는 상기 부위-지정 돌연변이유발 후에 생성 된 복수개의 돌연변이체 아미노아실-tRNA 합성효소 분자를 포함하는 풀(pool)로부터 상기 O-RS에 대해 양성 또한 음성 선택을 수행하는 것을 포함하는 방법.
  20. 제14항에 있어서, 상기 번역 시스템의 제공은 상기 O-tRNA를 코딩하는 폴리뉴클레오티드를 제공하는 것을 포함하는 방법.
  21. 제14항에 있어서, 상기 번역 시스템의 제공은 엠버 억제자 tRNA인 O-tRNA를 제공하는 것을 포함하는 방법.
  22. 제14항에 있어서, 상기 번역 시스템의 제공은 상기 O-tRNA를 코딩하거나 이를 포함하는 핵산을 제공하는 것을 포함하고, 여기서, 상기 핵산은 서열 번호 1에 제시된 폴리뉴클레오티드 서열을 포함하는 방법.
  23. 제14항에 있어서, 상기 번역 시스템의 제공은 상기 O-RS를 코딩하는 핵산을 제공하는 것을 포함하고, 여기서, 상기 핵산은 서열 번호 5, 7 또는 9에 제시된 폴리뉴클레오티드 서열을 포함하는 방법.
  24. 제14항에 있어서, 상기 번역 시스템의 제공은 엠버 셀렉터 코돈을 포함하는 핵산을 제공하는 것을 포함하는 방법.
  25. 제14항에 있어서, 추가로 상기 단백질은 상기 제1 비천연 아미노산과 상이한 제2 비천연 아미노산을 포함하고, 상기 번역 시스템은 제2 O-RS 및 제2 O-tRNA를 추가로 포함하며, 제2 O-RS는 제2 O-tRNA를 제1 비천연 아미노산과 상이한 제2 비천연 아미노산으로 우선적으로 아미노아실화하고, 제2 O-tRNA는 제1 O-tRNA에 의해 인식되는 셀렉터 코돈과 상이한 핵산 내 셀렉터 코돈을 인식하는 방법.
  26. 제14항에 있어서, 상기 번역 시스템의 제공은 숙주 세포를 제공하는 것을 포함하고, 여기서, 상기 숙주 세포는 상기 제1 비천연 아미노산, 상기 제1 O-RS, 상기 제1 O-tRNA 및 상기 핵산을 포함하며, 상기 도입 단계는 상기 숙주 세포를 배양하는 것을 포함하는 방법.
  27. 제26항에 있어서, 상기 숙주 세포는 진정세균 숙주 세포인 방법.
  28. 제27항에 있어서, 상기 진정세균 숙주 세포는 E. 콜라이 숙주 세포인 방법.
  29. 제26항에 있어서, 상기 숙주 세포는 상기 O-RS를 코딩하는 핵산을 포함하는 방법.
  30. 제29항에 있어서, 상기 O-RS를 코딩하는 상기 핵산은 서열 번호 5, 7 또는 9에 제시된 뉴클레오티드 서열을 포함하는 방법.
  31. 제14항에 있어서, (c) 상기 단백질 내 상기 선택된 위치에 있는 상기 페닐셀레노시스테인을 반응시켜, 상기 선택된 위치에 데히드로알라닌을 포함하는 단백질을 생성시키는 단계를 추가로 포함하는 방법.
  32. 제31항에 있어서, 상기 반응이 산화 제거에 의한 것인 방법.
  33. 제31항에 있어서, 상기 반응이 상기 페닐셀레노시스테인을 과산화수소에 노출시키는 것을 포함하는 방법.
  34. 번역 시스템에서 선택된 위치에 지질 부분을 포함하는 단백질을 생성시키는 방법으로서,
    (a) (i) 페닐셀레노시스테인 비천연 아미노산;
    (ii) 오르소고날 아미노아실-tRNA 합성효소(O-RS);
    (iii) 오르소고날 tRNA(O-tRNA)(여기서, 상기 O-RS는 상기 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화함); 및
    (iv) 상기 단백질을 코딩하는 핵산(여기서, 상기 핵산은 상기 O-tRNA에 의해 인식되는 상기 선택된 위치에 있는 셀렉터 코돈을 포함함)
    을 포함하는 번역 시스템을 제공하는 단계;
    (b) 상기 셀렉터 코돈에 대한 반응으로 상기 단백질의 번역 과정 중에 상기 단백질 내 상기 선택된 위치에 페닐셀레노시스테인을 도입하는 단계;
    (c) 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인을 반응시켜, 선택된 위치에 데히드로알라닌을 포함하는 단백질을 생성시키는 단계; 및
    (d) 상기 단백질 내 선택된 위치에 있는 상기 데히드로알라닌을 지질 부분과 반응시켜, 단백질 내 선택된 위치에 지질화된 아미노산 부분을 포함하는 단백질을 생성시키는 단계
    를 포함하는 방법.
  35. 제34항에 있어서, 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인의 상기 반응은 산화 제거에 의한 것인 방법.
  36. 제34항에 있어서, 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인의 반응은 상기 페닐셀레노시스테인을 과산화수소에 노출시키는 것을 포함하는 방법.
  37. 제34항에 있어서, 상기 지질 부분은 티오팔미트산, 파르네실머캅탄 및 1-헥사데칸티올로 이루어진 군으로부터 선택되는 방법.
  38. 제34항에 있어서, 상기 지질화된 아미노산 부분은 팔미토일시스테인, 파르네실시스테인 및 S-헥사데실시스테인으로 이루어진 군으로부터 선택되는 방법.
  39. 제34항에 있어서, 상기 단백질 내 선택된 위치에 있는 상기 데히드로알라닌의 상기 반응은 마이클 부가(Michael Addition) 반응에 의한 것인 방법.
  40. 번역 시스템에서 선택된 위치에 데히드로알라닌 비천연 아미노산을 포함하는 단백질을 생성시키는 방법으로서,
    (a) (i) 페닐셀레노시스테인 비천연 아미노산;
    (ii) 오르소고날 아미노아실-tRNA 합성효소(O-RS);
    (iii) 오르소고날 tRNA(O-tRNA)(여기서, 상기 O-RS는 상기 O-tRNA를 상기 페닐셀레노시스테인으로 우선적으로 아미노아실화함); 및
    (iv) 상기 단백질을 코딩하는 핵산(여기서, 상기 핵산은 상기 O-tRNA에 의해 인식되는 상기 선택된 위치에 셀렉터 코돈을 포함함)
    을 포함하는 번역 시스템을 제공하는 단계;
    (b) 상기 셀렉터 코돈에 대한 반응으로 상기 단백질의 번역 과정 중에 상기 단백질 내 상기 선택된 위치에 상기 페닐셀레노시스테인 비천연 아미노산을 도입하는 단계; 및
    (c) 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인을 반응시킴으로써, 선택된 위치에 상기 데히드로알라닌 비천연 아미노산을 포함하는 상기 단백질을 생성시키는 단계
    를 포함하는 방법.
  41. 제40항에 있어서, 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인의 상기 반응은 산화 제거에 의한 것인 방법.
  42. 제40항에 있어서, 상기 단백질 내 선택된 위치에 있는 상기 페닐셀레노시스테인의 상기 반응은 상기 페닐셀레노시스테인을 과산화수소에 노출시키는 것을 포함하는 방법.
  43. 서열 번호 4, 6, 8에 제시된 아미노산 서열 및 이의 보존적 변이체로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩티드를 포함하는 조성물.
  44. 제43항에 있어서, 상기 보존적 변이체 폴리펩티드는, 상기 O-tRNA, 상기 비천연 아미노산, 및 서열 번호 4, 6 또는 8의 아미노산 서열을 포함하는 아미노아실-tRNA 합성효소를 포함하는 번역 시스템에 대해 관찰되는 효율의 50% 이상의 효율로, 동족체 오르소고날 tRNA(O-tRNA)를 비천연 아미노산으로 아미노아실화하는 조성물.
  45. 제43항에 있어서, 폴리펩티드를 포함한 세포를 포함하는 조성물.
  46. 제43항의 폴리펩티드를 코딩하는 폴리뉴클레오티드.
  47. 제46항에 있어서, 서열 번호 5, 7 또는 9의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드.
  48. 제46항의 폴리뉴클레오티드를 포함하는 벡터.
  49. 제46항의 폴리뉴클레오티드를 포함하는 발현 벡터.
  50. 제46항의 폴리뉴클레오티드를 포함한 벡터를 포함하는 세포.
  51. 서열 번호 5, 7 또는 9에 제시된 뉴클레오티드 서열을 포함한 폴리뉴클레오티드를 포함하는 조성물.
KR1020087024575A 2006-03-16 2007-03-13 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현 KR20080113226A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US78327206P 2006-03-16 2006-03-16
US60/783,272 2006-03-16
US86145606P 2006-11-28 2006-11-28
US60/861,456 2006-11-28

Publications (1)

Publication Number Publication Date
KR20080113226A true KR20080113226A (ko) 2008-12-29

Family

ID=38522926

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087024575A KR20080113226A (ko) 2006-03-16 2007-03-13 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현

Country Status (12)

Country Link
US (3) US7790847B2 (ko)
EP (1) EP1994165B1 (ko)
JP (1) JP5249194B2 (ko)
KR (1) KR20080113226A (ko)
CN (1) CN101405401B (ko)
AU (1) AU2007227592B2 (ko)
BR (1) BRPI0709603A2 (ko)
CA (1) CA2638772A1 (ko)
IL (1) IL193722A0 (ko)
MX (1) MX2008011669A (ko)
RU (1) RU2464315C2 (ko)
WO (1) WO2007109035A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150064209A (ko) * 2012-10-12 2015-06-10 서트로 바이오파마, 인크. 개선된 발현을 위해 박테리아 추출물 중 선택 단백질의 단백질분해 불활성화

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005502322A (ja) * 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
DE60329700D1 (en) * 2002-10-16 2009-11-26 Scripps Research Inst Glycoproteinsynthese
CN103289960B (zh) 2003-04-17 2017-04-26 斯克利普斯研究院 扩展真核生物遗传密码
CA2531146A1 (en) 2003-07-07 2005-03-03 The Scripps Research Institute Compositions of orthogonal lysyl-trna and aminoacyl-trna synthetase pairs and uses thereof
EP2380982B1 (en) * 2004-10-27 2014-07-16 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
EP1991680B1 (en) 2006-03-09 2013-08-21 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US7790847B2 (en) 2006-03-16 2010-09-07 The Scripps Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
KR20090024706A (ko) * 2006-05-23 2009-03-09 더 스크립스 리서치 인스티튜트 유전자적으로 코딩된 형광 쿠마린 아미노산
PT2052083E (pt) * 2006-09-21 2014-04-10 Scripps Research Inst Expressão geneticamente programada de proteínas seletivamente sulfatadas em eubactérias
AU2007333010A1 (en) 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
CN102203257B (zh) * 2007-10-25 2014-01-08 斯克利普斯研究院 3-氨基酪氨酸遗传掺入还原酶
WO2009059056A2 (en) * 2007-11-02 2009-05-07 The Scripps Research Institute A genetically encoded boronate amino acid
BRPI0819092A2 (pt) 2007-11-02 2014-10-14 Scripps Research Inst Evolução direcionada usando proteínas que compreendem aminoácidos não naturais.
KR20100105846A (ko) 2007-12-11 2010-09-30 더 스크립스 리서치 인스티튜트 메틸영양요구성 효모 피키아 파스토리스에서의 생체 내 비천연 아미노산 발현
US8592199B2 (en) 2007-12-28 2013-11-26 David H. Ardell Genetic encryption
EP2238242B9 (en) 2008-01-03 2015-06-10 BASF Enzymes LLC Transferases and oxidoreductases, nucleic acids encoding them and methods for making and using them
BRPI0906388A2 (pt) * 2008-02-08 2015-07-07 Scripps Research Inst Quebra de tolerância imunológica com um aminoácido não natural geneticamente codificado
CN102307905B (zh) 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
US8658394B2 (en) * 2011-02-02 2014-02-25 Waterstone Pharmaceuticals Methods, cells and systems for incorporating non-canonical amino acids into proteins
CN103215235B (zh) * 2012-01-18 2014-11-05 中国科学院生物物理研究所 3-咪唑基酪氨酸翻译系统及其应用
CN103571804B (zh) * 2012-08-10 2015-08-12 中国科学院生物物理研究所 3-吡唑基酪氨酸翻译系统及其应用
CN103820410B (zh) * 2012-11-16 2016-03-30 中国科学院生物物理研究所 3-甲硫酪氨酸翻译系统及其应用
CN104004723B (zh) * 2013-02-22 2016-08-17 中国科学院生物物理研究所 3,5-二氟代酪氨酸翻译系统及其应用
CN106047846B (zh) * 2013-03-22 2020-02-04 中国科学院生物物理研究所 8-羟基喹啉丙氨酸翻译系统及其应用
JP6822839B2 (ja) * 2013-09-13 2021-01-27 ザ・スクリップス・リサーチ・インスティテュート 修飾された治療剤、及びその組成物
CN106456589B (zh) 2013-12-18 2020-07-07 斯克利普斯研究所 修饰的治疗剂、订合的肽脂质缀合物及其组合物
CN115919769A (zh) * 2016-05-16 2023-04-07 德克萨斯大学系统董事会 用于作为纳米粒递送tRNA的组合物及其使用方法
CN114644581A (zh) * 2021-01-04 2022-06-21 北京惠大生物科技有限公司 含芳基硫酚或芳基硒酚经修饰的氨基酸、重组蛋白及其生物合成方法及应用

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100372119B1 (ko) * 1992-07-13 2003-06-28 유카리언, 인코포레이티드 지질화된단백질을경혈관적및세포내로전달하는방법
JP2005502322A (ja) 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
DE60329700D1 (en) * 2002-10-16 2009-11-26 Scripps Research Inst Glycoproteinsynthese
PT1578949E (pt) 2002-10-16 2009-07-14 Scripps Research Inst Incorporação específica do local de cetoaminoácidos em proteínas
JP4486893B2 (ja) 2002-12-22 2010-06-23 ザ スクリップス リサーチ インスティテュート タンパク質アレイ
CN103289960B (zh) 2003-04-17 2017-04-26 斯克利普斯研究院 扩展真核生物遗传密码
WO2005003294A2 (en) * 2003-06-18 2005-01-13 The Scripps Research Institute Unnatural reactive amino acid genetic code additions
CA2531146A1 (en) 2003-07-07 2005-03-03 The Scripps Research Institute Compositions of orthogonal lysyl-trna and aminoacyl-trna synthetase pairs and uses thereof
US20060160175A1 (en) 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
WO2005038002A2 (en) 2003-10-14 2005-04-28 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
MXPA06006868A (es) * 2003-12-18 2007-03-21 Scripps Research Inst Incorporacion selectiva de 5-hiroxitriptofano en proteinas de celulas de mamiferos.
US20050287639A1 (en) * 2004-05-17 2005-12-29 California Institute Of Technology Methods of incorporating amino acid analogs into proteins
EP1774018A2 (en) 2004-05-25 2007-04-18 The Scripps Research Institute Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination
WO2006034410A2 (en) * 2004-09-21 2006-03-30 The Scripps Resarch Institute Adding photoregulated amino acids to the genetic code
ES2666693T3 (es) * 2004-09-21 2018-05-07 The Scripps Research Institute Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias
EP1794312A4 (en) * 2004-09-22 2009-08-12 Scripps Research Inst LOCAL LABELING OF PROTEINS FOR NMR STUDIES
US7378263B2 (en) * 2004-10-20 2008-05-27 The Scripps Research Institute In vivo site-specific incorporation of N-acetyl-galactosamine amino acids in eubacteria
EP2380982B1 (en) 2004-10-27 2014-07-16 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
KR20080069993A (ko) 2005-10-12 2008-07-29 더 스크립스 리서치 인스티튜트 파지-디스플레이된 폴리펩티드의 선별적인 번역후 변형
EP1991680B1 (en) 2006-03-09 2013-08-21 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US7790847B2 (en) 2006-03-16 2010-09-07 The Scripps Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150064209A (ko) * 2012-10-12 2015-06-10 서트로 바이오파마, 인크. 개선된 발현을 위해 박테리아 추출물 중 선택 단백질의 단백질분해 불활성화
US10450353B2 (en) 2012-10-12 2019-10-22 Sutro Biopharma, Inc. Proteolytic inactivation of select proteins in bacterial extracts for improved expression
US11261219B2 (en) 2012-10-12 2022-03-01 Sutro Biopharma, Inc. Proteolytic inactivation of select proteins in bacterial extracts for improved expression

Also Published As

Publication number Publication date
US8394605B2 (en) 2013-03-12
EP1994165B1 (en) 2014-11-05
US20070238152A1 (en) 2007-10-11
IL193722A0 (en) 2011-08-01
AU2007227592A1 (en) 2007-09-27
AU2007227592B2 (en) 2011-11-24
EP1994165A2 (en) 2008-11-26
US8217145B2 (en) 2012-07-10
EP1994165A4 (en) 2012-11-07
BRPI0709603A2 (pt) 2011-07-19
RU2008135114A (ru) 2010-04-27
CA2638772A1 (en) 2007-09-27
JP5249194B2 (ja) 2013-07-31
MX2008011669A (es) 2008-09-22
WO2007109035A3 (en) 2008-10-16
US7790847B2 (en) 2010-09-07
US20120282668A1 (en) 2012-11-08
US20090209000A1 (en) 2009-08-20
RU2464315C2 (ru) 2012-10-20
JP2009529877A (ja) 2009-08-27
CN101405401B (zh) 2013-03-27
WO2007109035A2 (en) 2007-09-27
CN101405401A (zh) 2009-04-08

Similar Documents

Publication Publication Date Title
US8394605B2 (en) Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
JP5192150B2 (ja) 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用
US8114654B2 (en) Site-specific incorporation of redox active amino acids into proteins
US8357512B2 (en) Systems for the expression of orthogonal translation components in eubacterial host cells
US7824893B2 (en) In vivo incorporation of alkynyl amino acids into proteins in eubacteria
KR20090094812A (ko) 포유동물 세포에서 비천연 아미노산의 단백질 내로의 유전적 도입
KR20090074765A (ko) 진정세균 내 선택적으로 황산화된 단백질의 유전적으로 프로그램된 발현
KR20090024706A (ko) 유전자적으로 코딩된 형광 쿠마린 아미노산

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application