KR20220080136A - 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법 - Google Patents

비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20220080136A
KR20220080136A KR1020227015123A KR20227015123A KR20220080136A KR 20220080136 A KR20220080136 A KR 20220080136A KR 1020227015123 A KR1020227015123 A KR 1020227015123A KR 20227015123 A KR20227015123 A KR 20227015123A KR 20220080136 A KR20220080136 A KR 20220080136A
Authority
KR
South Korea
Prior art keywords
natural
amino
cell
acid
phenylalanine
Prior art date
Application number
KR1020227015123A
Other languages
English (en)
Inventor
플로이드 이. 롬스버그
에밀 씨. 피셔
코지 하시모토
애런 더블유. 펠드먼
비비안 티. 디엔
요크 장
Original Assignee
더 스크립스 리서치 인스티튜트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 스크립스 리서치 인스티튜트 filed Critical 더 스크립스 리서치 인스티튜트
Publication of KR20220080136A publication Critical patent/KR20220080136A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/22Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a Strep-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01026Pyrrolysine-tRNAPyl ligase (6.1.1.26)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

비천연 아미노산을 비천연 폴리펩티드 내로 혼입시키는 세포를 위한 조성물, 방법 및 키트가 본원에 개시된다. 또한, 세포에 의해 합성된 비천연 폴리펩티드의 활성 및 수율을 증가시키기 위한 조성물, 방법 및 키트가 본원에 개시된다.

Description

비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법
<관련 출원에 대한 상호 참조>
본 출원은 2019년 10월 10일에 출원된 미국 가출원 번호 62/913,664, 및 2020년 3월 12일에 출원된 미국 가출원 번호 62/988,882 (이들 각각은 그 전문이 본원에 참조로 포함됨)에 대한 우선권을 주장한다.
<서열 목록>
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2010년 10월 6일에 생성된 상기 ASCII 카피는 "36271-809_601_SL.txt"로 명명되고, 21 킬로바이트 크기이다.
<연방 정부 지원 연구에 관한 진술>
본 발명은 미국 국립 보건원에 의해 수여된 승인 번호 GM118178 하의 정부 지원으로 이루어졌다. 정부는 본 발명에 특정 권리를 갖는다.
<참조에 의한 포함>
본 명세서에서 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 참조로 포함되는 것으로 구체적으로 및 개별적으로 나타낸 것과 동일한 정도로 본원에 참조로 포함된다. 참조로 포함된 간행물 및 특허 또는 특허 출원이 명세서에 포함된 개시내용과 모순되는 경우, 본 명세서는 임의의 이러한 모순되는 자료를 대체하고/거나 우선하도록 의도된다.
천연 유전자 코드는 유전자 알파벳의 4개의 문자로 가능한 64개의 코돈으로 이루어진다. 3개의 코돈이 정지 코돈으로 사용되며, 동족 아미노 아실 tRNA 신테타제 (본원에서 간단히 tRNA 신테타제로도 지칭됨)에 의해 20개의 단백질생성 아미노산 중 하나로 충전된 전달 RNA (tRNA)에 의해 인식되는 61개의 센스 코돈이 남는다. 정규 아미노산은 살아있는 유기체의 현저한 다양성을 가능하게 하였지만, 이들이 제공하지 않는 많은 화학적 관능기 및 연관된 반응성이 존재한다. 비천연 또는 비-정규 아미노산 (ncAA)을 포함하도록 유전자 코드를 확장시키는 능력은 목적하는 기능 또는 활성을 갖는 단백질을 제공할 가능성이 있고, 단백질의 많은 공지된 신생 용도, 예컨대 치료 개발을 극적으로 용이하게 한다. 비천연 아미노산을 함유하는 비천연 단백질 또는 비천연 폴리펩티드를 합성하는 현재의 방법은 제한적이다. 특히, 대부분의 방법은 단일 비천연 아미노산 또는 비천연 아미노산의 한 종의 몇몇 카피의 비천연 폴리펩티드 내로의 도입만을 가능하게 한다. 또한, 현재 이용가능한 방법에 의해 합성된 비천연 폴리펩티드는 종종 감소된 효소적 활성, 용해도 또는 수율을 보유한다.
이들 한계를 해결하기 위한 하나의 대안적 해결책은 세포-무함유 또는 시험관내 발현 시스템으로 비천연 폴리펩티드를 합성하는 것이다. 그러나, 이러한 발현 시스템은 비천연 폴리펩티드의 산화환원 특성 및 합성된 비천연 폴리펩티드의 다른 번역후 변형이 완전히 실현되는 번역후 변형 환경을 제공하기에 불충분하다. 따라서, 비천연 아미노산을 함유하는 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법에 대한 필요가 남아있다.
비천연 폴리펩티드 또는 비천연 단백질의 생체내 합성을 위한 조성물, 방법, 세포 (비-조작된 및 조작된 것 둘 다), 반합성 유기체 (SSO), 시약, 유전 물질, 플라스미드 및 키트가 본원에 기재되며, 여기서 각각의 비천연 폴리펩티드 또는 비천연 단백질은 세포에 의해 디코딩되는 2개 이상의 비천연 아미노산을 포함한다.
적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하는 단계; 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 2개의 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자를 제공하는 단계; 적어도 1개의 비천연 DNA 분자를 전사시켜 각각 적어도 1개의 비천연 안티코돈을 포함하는 적어도 2개의 전달 RNA (tRNA) 분자를 제공하고, 여기서 상응하는 DNA 내의 적어도 2개의 비천연 염기 쌍은 mRNA 분자의 비천연 코돈이 각각의 tRNA 분자의 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계; 및 적어도 2개의 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 각각의 비천연 안티코돈은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계를 포함하는, 비천연 폴리펩티드를 합성하는 생체내 방법이 본원에 기재된다. 일부 실시양태에서, 적어도 2개의 비천연 염기 쌍은 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, 또는 dNaM-dTAT1로부터 선택되는 염기 쌍을 포함한다.
일부 실시양태에서, 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하고, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계; 적어도 1개의 비천연 DNA 분자를 전사시켜 mRNA를 제공하는 단계; 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 제1 및 제2 tRNA 분자를 제공하는 단계; 및 적어도 제1 및 제2 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 적어도 제1 및 제2 비천연 안티코돈 각각은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계를 포함하는, 비천연 폴리펩티드를 합성하는 방법이 제공된다.
일부 실시양태에서, 방법은, 적어도 2개의 비천연 코돈 각각이 코돈의 제1 위치, 제2 위치 또는 제3 위치에 위치한 제1 비천연 뉴클레오티드를 포함하고, 임의로 여기서 제1 비천연 뉴클레오티드가 코돈의 제2 위치 또는 제3 위치에 위치하는 것을 포함한다. 일부 경우에, 방법은, 적어도 2개의 비천연 코돈이 각각 핵산 서열 NNX 또는 NXN을 포함하고, 비천연 안티코돈이 핵산 서열 XNN, YNN, NXN, 또는 NYN을 포함하여, NNX-XNN, NNX-YNN, 또는 NXN-NYN을 포함하는 비천연 코돈-안티코돈 쌍을 형성하고, 여기서 N은 임의의 천연 뉴클레오티드이고, X는 제1 비천연 뉴클레오티드이고, Y는 제1 비천연 뉴클레오티드와 상이한 제2 비천연 뉴클레오티드이며, X-Y는 DNA에서 비천연 염기 쌍 (UBP)을 형성하는 것을 포함한다.
일부 실시양태에서, mRNA의 코돈 서열과 tRNA의 안티코돈 서열 사이에 UBP가 형성되어, mRNA의 비천연 폴리펩티드로의 번역을 용이하게 한다. 코돈-안티코돈 UBP는, 일부 경우에, mRNA의 5'에서 3'으로 판독되는 3개의 인접 핵산을 포함하는 코돈 서열 (예를 들어, UUX), 및 tRNA의 5'에서 3'으로 판독되는 3개의 인접 핵산을 포함하는 안티코돈 서열 (예를 들어, YAA 또는 XAA)을 포함한다. 일부 실시양태에서, mRNA 코돈이 UUX인 경우, tRNA 안티코돈은 YAA 또는 XAA이다. 일부 실시양태에서, mRNA 코돈이 UGX인 경우, tRNA 안티코돈은 YCA 또는 XCA이다. 일부 실시양태에서, mRNA 코돈이 CGX인 경우, tRNA 안티코돈은 YCG 또는 XCG이다. 일부 실시양태에서, mRNA 코돈이 AGX인 경우, tRNA 안티코돈은 YCU 또는 XCU이다. 일부 실시양태에서, mRNA 코돈이 GAX인 경우, tRNA 안티코돈은 YUC 또는 XUC이다. 일부 실시양태에서, mRNA 코돈이 CAX인 경우, tRNA 안티코돈은 YUG 또는 XUG이다. 일부 실시양태에서, mRNA 코돈이 GXU인 경우, tRNA 안티코돈은 AYC이다. 일부 실시양태에서, mRNA 코돈이 CXU인 경우, tRNA 안티코돈은 AYG이다. 일부 실시양태에서, mRNA 코돈이 GXG인 경우, tRNA 안티코돈은 CYC이다. 일부 실시양태에서, mRNA 코돈이 AXG인 경우, tRNA 안티코돈은 CYU이다. 일부 실시양태에서, mRNA 코돈이 GXC인 경우, tRNA 안티코돈은 GYC이다. 일부 실시양태에서, mRNA 코돈이 AXC인 경우, tRNA 안티코돈은 GYU이다. 일부 실시양태에서, mRNA 코돈이 GXA인 경우, tRNA 안티코돈은 UYC이다. 일부 실시양태에서, mRNA 코돈이 CXC인 경우, tRNA 안티코돈은 GYG이다. 일부 실시양태에서, mRNA 코돈이 UXC인 경우, tRNA 안티코돈은 GYA이다. 일부 실시양태에서, mRNA 코돈이 AUX인 경우, tRNA 안티코돈은 YAU 또는 XAU이다. 일부 실시양태에서, mRNA 코돈이 CUX인 경우, tRNA 안티코돈은 XAG 또는 YAG이다. 일부 실시양태에서, mRNA 코돈이 UUX인 경우, tRNA 안티코돈은 XAA 또는 YAA이다. 일부 실시양태에서, mRNA 코돈이 GUX인 경우, tRNA 안티코돈은 XAC 또는 YAC이다. 일부 실시양태에서, mRNA 코돈이 UAX인 경우, tRNA 안티코돈은 XUA 또는 YUA이다. 일부 실시양태에서, mRNA 코돈이 GGX인 경우, tRNA 안티코돈은 XCC 또는 YCC이다.
일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 본원에 기재된 비천연 염기 (예를 들어, d5SICS, dNaM, dTPT3, dMTMO, dCNMO, dTAT1)를 포함하는 메신저 RNA (mRNA)로 전사된다. 예시적인 mRNA 코돈은 TTX, TGX, CGX, AGX, GAX, CAX, GXT, CXT, GXG, AXG, GXC, AXC, GXA, CXC, TXC, ATX, CTX, TTX, GTX, TAX, 또는 GGX (여기서, X는 2' 데옥시리보실 모이어티에 부착된 비천연 염기임)를 포함하는 3개의 인접한 데옥시리보뉴클레오티드 (NNN)를 포함하는 비천연 DNA의 예시적인 영역에 의해 코딩된다. 예시적인 비천연 DNA의 전사로부터 생성된 예시적인 mRNA 코돈은 각각 UUX, UGX, CGX, AGX, GAX, CAX, GXU, CXU, GXG, AXG, GXC, AXC, GXA, CXC, UXC, AUX, CUX, UUX, GUX, UAX, 또는 GGX (여기서, X는 리보실 모이어티에 부착된 비천연 염기임)를 포함하는 3개의 인접한 리보뉴클레오티드 (NNN)를 포함한다. 일부 실시양태에서, 비천연 염기는 코돈 서열의 제1 위치 (X-N-N)에 있다. 일부 실시양태에서, 비천연 염기는 코돈 서열의 제2 (또는 중간) 위치 (N-X-N)에 있다. 일부 실시양태에서, 비천연 염기는 코돈 서열의 제3 (마지막) 위치 (N-N-X)에 있다.
일부 실시양태에서, 방법은 적어도 1개의 G를 포함하는 코돈 및 적어도 1개의 C를 포함하는 안티코돈을 포함한다. 일부 경우에, 방법은 X 및 Y를 포함하며, 여기서 X 및 Y는 독립적으로 (i) 2-티오우라실, 2'-데옥시우리딘, 4-티오-우라실, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실 또는 디히드로우라실; (ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온) 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온); (iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌 또는 6-아자-아데닌; (iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및 (v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘 또는 2-피리돈으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, X 및 Y는 독립적으로
Figure pct00001
로 이루어진 군으로부터 선택된다.
일부 경우에, X는
Figure pct00002
이다. 일부 실시양태에서, Y는
Figure pct00003
이다.
일부 실시양태에서, 본원에 기재된 방법은 비천연 코돈-안티코돈 쌍 NNX-XNN을 포함하며, 여기서 NNX-XNN은 UUX-XAA, UGX-XCA, CGX-XCG, AGX-XCU, GAX-XUC, CAX-XUG, AUX-XAU, CUX-XAG, GUX-XAC, UAX-XUA 및 GGX-XCC로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 본원에 기재된 방법은 비천연 코돈-안티코돈 쌍 NNX-YNN을 포함하며, 여기서 NNX-YNN은 UUX-YAA, UGX-YCA, CGX-YCG, AGX-YCU, GAX-YUC, CAX-YUG, AUX-YAU, CUX-YAG, GUX-YAC, UAX-YUA 및 GGX-YCC로 이루어진 군으로부터 선택된다. 일부 경우에, 본원에 기재된 방법은 비천연 코돈-안티코돈 쌍 NXN-NYN을 포함하며, 여기서 NXN-NYN은 GXU-AYC, CXU-AYG, GXG-CYC, AXG-CYU, GXC-GYC, AXC-GYU, GXA-UYC, CXC-GYG, 및 UXC-GYA로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 본원에 기재된 방법은 각각 상이한 비천연 안티코돈을 포함하는 적어도 2개의 비천연 tRNA 분자를 포함한다. 일부 경우에, 적어도 2개의 비천연 tRNA 분자는 메타노사르시나 속으로부터의 피롤리실 tRNA 및 메타노칼도코쿠스 잔나쉬이로부터의 티로실 tRNA, 또는 그의 유도체를 포함한다. 일부 실시양태에서, 방법은 아미노-아실 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함한다. 일부 경우에, tRNA 신테타제는 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 본원에 기재된 바와 같은 방법은 적어도 2개의 상이한 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함한다. 일부 경우에, 적어도 2개의 상이한 tRNA 신테타제는 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)를 포함한다.
일부 실시양태에서, 비천연 폴리펩티드의 생체내 합성 방법이 본원에 기재된다. 일부 실시양태에서, 비천연 폴리펩티드는 2, 3개 또는 그 초과의 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드는 적어도 2개의 동일한 비천연 아미노산을 포함한다. 일부 실시양태에서, 비천연 폴리펩티드는 적어도 2개의 상이한 비천연 아미노산을 포함한다. 일부 경우에, 비천연 아미노산은 다음을 포함한다:
리신 유사체; 방향족 측쇄; 아지도 기; 알킨 기; 또는 알데히드 또는 케톤 기. 일부 경우에, 비천연 아미노산은 방향족 측쇄를 포함하지 않는다. 일부 실시양태에서, 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로부터 선택된다.
일부 실시양태에서, 본원에 기재된 바와 같은 비천연 폴리펩티드의 생체내 합성 방법은 플라스미드 형태의 적어도 1개의 비천연 DNA 분자를 포함한다. 일부 경우에, 적어도 1개의 비천연 DNA 분자는 세포의 게놈 내로 통합된다. 일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 비천연 폴리펩티드를 코딩한다. 일부 실시양태에서, 본원에 기재된 방법은 세포 유기체에서 비천연 DNA 분자의 생체내 복제 및 전사, 및 전사된 mRNA 분자의 생체내 번역을 포함한다. 일부 실시양태에서, 세포 유기체는 미생물이다. 일부 실시양태에서, 세포 유기체는 원핵생물이다. 일부 실시양태에서, 세포 유기체는 박테리아이다. 일부 경우에, 세포 유기체는 그람-양성 박테리아이다. 일부 실시양태에서, 세포 유기체는 그람-음성 박테리아이다. 일부 경우에, 세포 유기체는 에스케리키아 콜라이이다. 일부 실시양태에서, 세포 유기체는 뉴클레오시드 트리포스페이트 수송체를 포함한다. 일부 경우에, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2의 아미노산 서열을 포함한다. 일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2의 말단절단된 아미노산 서열을 포함한다. 일부 대안에서, PtNTT2의 말단절단된 아미노산 서열은 서열식별번호: 1에 의해 코딩된 PtNTT2에 대해 적어도 80% 동일하다. 일부 실시양태에서, 세포 유기체는 적어도 1개의 비천연 DNA 분자를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 적어도 1개의 플라스미드를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 세포의 게놈 내로 통합된다. 일부 경우에, 적어도 1개의 비천연 DNA 분자는 비천연 폴리펩티드를 코딩한다. 일부 경우에, 본 개시내용에 기재된 방법은 비천연 폴리펩티드를 무세포 시스템으로 합성하는 것을 포함하는 시험관내 방법일 수 있다.
일부 실시양태에서, 비천연 폴리펩티드가 비천연 당 모이어티를 포함하는 것인, 비천연 폴리펩티드의 생체내 합성 방법이 본원에 기재된다. 일부 실시양태에서, 비천연 염기 쌍은 비천연 당 모이어티를 포함하는 적어도 1개의 비천연 뉴클레오티드를 포함한다. 일부 실시양태에서, 비천연 당 모이어티는 OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F; O-알킬, S-알킬, N-알킬; O-알케닐, S-알케닐, N-알케닐; O-알키닐, S-알키닐, N-알키닐; O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10일 수 있음), 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2 (여기서, n 및 m은 1 내지 약 10임); 및/또는 5' 위치에서의 변형: 5'-비닐, 5'-메틸 (R 또는 S); 4' 위치에서의 변형: 4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 적어도 2개의 상이한 비천연 코돈-안티코돈 쌍 및 각각 상응하는 비천연 tRNA에 공유 연결된 적어도 2개의 상이한 비천연 아미노산을 포함하며, 여기서 각각의 비천연 코돈-안티코돈 쌍은 비천연 메신저 RNA (mRNA)로부터의 비천연 코돈 및 비천연 전달 리보핵산 (tRNA)으로부터의 비천연 안티코돈을 포함하고, 상기 비천연 코돈은 제1 비천연 뉴클레오티드를 포함하고, 상기 비천연 안티코돈은 제2 비천연 뉴클레오티드를 포함하는 것인, 비천연 폴리펩티드의 생체내 합성을 위한 세포가 본원에 기재된다. 일부 경우에, 세포는 적어도 4개의 비천연 염기 쌍 (UBP)을 포함하는 적어도 1개의 비천연 DNA 분자를 추가로 포함한다. 일부 실시양태에서, 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 DNA 분자를 포함하며, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 비천연 폴리펩티드를 코딩하고 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인, 비천연 폴리펩티드의 생체내 합성을 위한 세포가 본원에 기재된다. 일부 실시양태에서, 세포는 mRNA 분자 및 적어도 제1 및 제2 tRNA 분자를 추가로 포함한다. 세포의 일부 실시양태에서, 적어도 제1 및 제2 tRNA 분자는 비천연 아미노산에 공유 연결된다. 일부 실시양태에서, 세포는 비천연 폴리펩티드를 추가로 포함한다.
일부 실시양태에서, 제1 비천연 뉴클레오티드는 비천연 코돈의 제2 또는 제3 위치에 위치하고, 비천연 안티코돈의 제2 비천연 뉴클레오티드와 상보적으로 염기 쌍형성된다. 일부 경우에, 제1 비천연 뉴클레오티드 및 제2 비천연 뉴클레오티드는
Figure pct00004
로 이루어진 군으로부터 독립적으로 선택되는 제1 및 제2 염기를 포함하고, 임의로 여기서 제2 염기는 제1 염기와 상이하다. 일부 실시양태에서, 세포는 적어도 4개의 비천연 염기 쌍 (UBP)을 포함하는 적어도 1개의 비천연 DNA 분자를 추가로 포함한다. 일부 경우에, 적어도 4개의 비천연 염기 쌍은 dCNMO/dTPT3, dNaM/dTPT3, dCNMO/dTAT1, 또는 dNaM/dTAT1로 이루어진 군으로부터 독립적으로 선택된다. 일부 경우에, 적어도 1개의 비천연 DNA 분자는 적어도 1개의 플라스미드를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 세포의 게놈 내로 통합된다. 일부 실시양태에서, 적어도 1개의 비천연 DNA 분자는 비천연 폴리펩티드를 코딩한다. 일부 실시양태에서, 본원에 기재된 바와 같은 세포는 뉴클레오시드 트리포스페이트 수송체를 발현한다. 일부 대안에서, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2의 아미노산 서열을 포함한다. 일부 경우에, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2의 말단절단된 아미노산 서열을 포함하고, 임의로 여기서 PtNTT2의 말단절단된 아미노산 서열은 서열식별번호: 1에 의해 코딩되는 PtNTT2에 대해 적어도 80% 동일하다. 일부 실시양태에서, 세포는 적어도 2개의 tRNA 신테타제를 발현한다. 일부 실시양태에서, 적어도 2개의 tRNA 신테타제는 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)이다. 일부 실시양태에서, 세포는 비천연 당 모이어티를 포함하는 비천연 뉴클레오티드를 포함한다. 일부 경우에, 비천연 당 모이어티는 2' 위치에서의 변형: OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F; O-알킬, S-알킬, N-알킬; O-알케닐, S-알케닐, N-알케닐; O-알키닐, S-알키닐, N-알키닐; O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임); 및/또는 5' 위치에서의 변형: 5'-비닐, 5'-메틸 (R 또는 S); 4' 위치에서의 변형: 4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 세포는 전사 동안 RNA 폴리머라제에 의해 인식되는 적어도 1개의 비천연 뉴클레오티드 염기를 포함한다. 일부 실시양태에서, 본원에 기재된 바와 같은 세포는 적어도 2개의 비천연 아미노산을 포함하는 적어도 1개의 비천연 폴리펩티드를 번역한다. 일부 경우에, 적어도 2개의 비천연 아미노산은 독립적으로 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로 이루어진 군으로부터 선택된다. 일부 경우에, 본원에 기재된 바와 같은 세포는 단리된 세포이다. 일부 대안에서, 본원에 기재된 세포는 원핵생물이다. 일부 경우에, 본원에 기재된 세포는 세포주를 포함한다.
본 개시내용의 다양한 측면이 첨부된 청구범위에 구체적으로 제시된다. 본 개시내용의 특색 및 이점의 보다 양호한 이해는 본 개시내용의 원리가 이용되는 예시적 실시양태를 제시하고 있는 하기 상세한 설명 및 첨부된 도면을 참조하여 얻어질 것이다:
도 1은 비천연 염기 쌍 (UBP)을 사용하여 비-정규 아미노산 (ncAA)을 비천연 폴리펩티드 또는 비천연 단백질 내로 부위-특이적으로 혼입시키기 위해 비천연 X-Y 염기 쌍을 사용하는 작업흐름을 도시한다. 비천연 폴리펩티드 또는 비천연 단백질 내로의 3개의 ncAA의 혼입은 단지 예로서 제시되고; 임의의 수의 ncAA가 혼입될 수 있다.
도 2는 예시적인 비천연 뉴클레오티드 염기 쌍 (UBP)을 도시한다.
도 3은 데옥시리보 X 유사체를 도시한다. 데옥시리보스 및 포스페이트는 명확성을 위해 생략되었다.
도 4a-b는 리보뉴클레오티드 유사체를 도시한다. 도 4a는 명확성을 위해 리보스 및 포스페이트가 생략된 리보뉴클레오티드 X 유사체의 도시이다. 도 4b는 명확성을 위해 리보스 및 포스페이트가 생략된 리보뉴클레오티드 Y 유사체의 도시이다.
도 5a-g는 예시적인 비천연 아미노산을 도시한다. 도 5a는 문헌 [Young et al., "Beyond the canonical 20 amino acids: expanding the genetic lexicon," J. of Biological Chemistry 285(15): 11039-11044 (2010)]의 도 2로부터 채택된다. 도 5b는 예시적인 비천연 아미노산 리신 유도체이다. 도 5c는 예시적인 비천연 아미노산 페닐알라닌 유도체이다. 도 5d-5g는 예시적인 비천연 아미노산을 도시한다. 이들 비천연 아미노산 (UAA)은 유전적으로 단백질에 코딩되어 있다 (도 5d - UAA #1-42; 도 5e - UAA # 43-89; 도 5f - UAA # 90-128; 도 5g - UAA # 129-167). 도 5d-5g는 문헌 [Dumas et al., Chemical Science 2015, 6, 50-69]의 표 1로부터 채택된다.
도 6a-d는 비천연 코돈 및 안티코돈을 사용한 비-클론 SSO에서의 단백질 생산을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 6a는 dNaM-dTPT3 UBP의 화학 구조이다. 도 6b는 ncAA인 AzK, PrK, 및 pAzF의 화학 구조이다. 도 6c는 sfGFP151(NNN) 및 엠. 마제이 tRNAPyl(NNN) (여기서, NNN은 임의의 명시된 코돈 또는 안티코돈을 지칭함)를 발현시키는데 사용된 유전자 카세트의 개략도이다. 도 6d는 배지 내 AzK의 존재 및 부재 둘 다에서 명시된 코돈 및 안티코돈을 사용한 단백질 발현의 종점 (즉, aTc의 첨가 후 t = 180분)에서의 비-클론 SSO 배양물로부터의 정규화된 형광 (a.u., 임의 단위)을 도시한다. 각각의 반복 배양물은 UBP 보유 플라스미드로 형질전환된 적격 SSO 출발 세포의 상이한 배치로부터 유래한다 (n = 3, 생물학적 반복물). 평균 및 개별 데이터 포인트를 도시한다. SSO 배양물로부터의, TAMRA-PEG4-DBCO를 사용한 SPAAC에 적용된, 정제된 sfGFP의 하나의 대표적인 크로핑된 웨스턴 블롯을 각각의 코돈 및 안티코돈 위에 도시한다 (α-GFP 채널 단독). 도 6d 삽도는 SPAAC에 의해 유도된 정량화된 상대적 단백질 변위의 평균에 대한 (도 6d로부터의) AzK의 존재 하의 평균 종점 형광의 산점도이다 (n = 3, 생물학적 반복물). 추가의 분석을 위해 선택된 7개의 상위 코돈을 동그라미로 표시한다.
도 7a-b는 클론 SSO에서의 코돈 직교성의 단백질 생산 및 분석을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 7a는 AzK의 존재 및 부재 둘 다에서 7개의 상위 코돈 및 안티코돈 (좌측) 뿐만 아니라 4개의 다른 선택된 코돈 (우측)에 대한 단백질 발현의 종점 (즉, aTc의 첨가 후 t = 180분)에서의 클론 SSO로부터의 정규화된 형광을 도시한다. 각각의 반복 배양물을 개별 SSO 콜로니로부터 번식시켰다 (좌측: n = 3, 우측: n = [5, 4, 3, 3]; 생물학적 반복물). 개별 데이터 포인트를 갖는 평균을 도시한다. SSO 배양물로부터의, TAMRA-PEG4-DBCO를 사용한 SPAAC에 적용된, 정제된 sfGFP의 하나의 대표적인 크로핑된 웨스턴 블롯을 도시한다 (α-GFP 채널 단독). 도 7b는 AXC, GXT, 및 AGX 코돈 및 GYT, AYC, 및 XCT 안티코돈에 대한 발현 종점에서의 클론 SSO 배양물로부터의 정규화된 형광을 도시한다. 배지 내 AzK의 존재 및 부재 둘 다, 뿐만 아니라 배지 내 리보뉴클레오시드 트리포스페이트 NaMTP 및 TPT3TP의 부재의 모든 쌍별 조합을 검사하였다. 각각의 배양물을 단일 콜로니로부터 번식시키고, 평균 ± 표준 편차를 나타낸다 (흑색 텍스트; n = 3; 생물학적 반복물).
도 8a-f는 2개의 비천연 코돈의 동시 디코딩을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 8a는 sfGFP 190,200 (GXT,AXC), 엠. 마제이 tRNAPyl(AYC), 및 엠. 잔나쉬이 tRNA p AzF(GYT)를 함유하는 유전자 카세트의 개략도이다. 도 8b-c, 나타낸 ncAA의 존재 하에 sfGFP 발현 동안 정규화된 형광의 시간-경과 플롯. IPTG를 t = -60분에 첨가하고, aTc를 t = 0에 첨가하였다. 각각의 반복 발현을 개별 SSO 콜로니로부터 번식된 배양물에서 수행하였다 (n = 3, 생물학적 반복물). 평균 및 개별 데이터 포인트를 도시한다. 도 8b는 도 8a의 카세트의 클론 SSO 발현, 뿐만 아니라 적절한 tRNA와 함께 단일 코돈만을 함유하는 카세트의 발현을 나타내는 대조군을 도시한다. 도 8c는 또한 도시된 sfGFP 190,200 (TAA,TAG), 엠. 마제이 tRNAPyl(TTA), 및 엠. 잔나쉬이 tRNA p AzF(CTA)를 함유하는 카세트, 뿐만 아니라 적절한 억제 tRNA와 함께 단일 정지-코돈을 함유하는 대조군 카세트의 클론 발현을 도시한다. 도 8d는 SPAAC에 의한 TAMRA-PEG4-DBCO에 대한 접합의 존재 및 부재 하의 도 8b-c의 SSO로부터의 정제된 sfGFP의 α-GFP 및 TAMRA 형광 스캔의 슈도-컬러 웨스턴 블롯을 도시한다. 동일한 블롯 (UBP 구축물 및 정지 코돈 억제자)으로부터 영상을 크로핑하지만, 전기영동 이동의 비교를 용이하게 하기 위해 비변위 밴드가 정렬되도록 위치시킨다. 도 8e는 PrK 및 pAzF의 첨가와 함께 도 8b-c로부터의 이중 코돈/tRNA 카세트의 클론 발현 동안 정규화된 형광의 시간-경과 플롯을 도시한다. 평균 및 개별 데이터 포인트를 도시한다 (n = 3, 생물학적 반복물). 도 8f는 SPAAC에 의한 TAMRA-PEG4-DBCO에 대한 접합 및 CuAAC에 의한 TAMRA-PEG4-아지드에 대한 접합의 존재 및 부재 하의 도 8e의 SSO로부터의 정제된 sfGFP의 α-GFP 및 TAMRA 형광 스캔의 슈도-컬러 웨스턴 블롯을 도시한다.
도 9a-c는 3개의 비천연 코돈의 동시 디코딩을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 9a는 sfGFP 151,190,200 (AXC,GXT,AGX), 엠. 마제이 tRNAPyl(XCT), 엠. 잔나쉬이 tRNA p AzF(GYT), 및 이. 콜라이 tRNASer(AYC)을 함유하는 유전자 카세트의 개략도이다. 도 9b는 AzK 및/또는 pAzF의 부재 또는 존재 하에 sfGFP 발현 동안 정규화된 형광의 시간-경과 플롯이다. IPTG를 t = -60분에 첨가하고, aTc를 t = 0에 첨가하였다. 각각의 반복 발현을 개별 SSO 콜로니로부터 번식된 배양물에서 수행하였다 (n = 3, 생물학적 반복물). 평균 및 개별 데이터 포인트를 도시한다. 도 9c는 도 9b의 SSO로부터 정제된 무손상 sfGFP의 HRMS 분석으로부터의 대표적인 디컨볼루션된 질량 스펙트럼이다. 피크 표지는 분자량 뿐만 아니라 다른 관련 종에 대한 각각의 피크의 정량화를 나타낸다. 표준 단일-문자 아미노산 코드가 사용된다. 평균 ± 표준 편차가 이들 종 각각에 대해 제시된다 (n = 3).
도 10은 비-클론 SSO에서 비천연 코돈의 초기 스크리닝을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 코돈의 제1, 제2 또는 제3 위치에 UBP를 보유하는 선택된 코돈/안티코돈 쌍에 대한 단백질 발현의 종점 (즉, aTc가 보충된 후 t = 180분)에서의 SSO 세포로부터 정규화된 형광의 쌍형성 스트립 차트. +/-는 배지에 20 mM AzK의 첨가를 나타낸다. 각각의 반복물은 적격 SSO 출발 세포의 상이한 배치로부터 유래된다 (n = 3, 생물학적 반복물).
도 11a-b는 비-클론 SSO 발현에 대한 웨스턴 블롯 및 형광 스캔을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 11a, SPAAC에 의한 TAMRA-PEG4-DBCO에 접합된 도 6d의 배양물로부터의 정제된 sfGFP의 α-GFP 및 TAMRA 형광 스캔의 슈도-컬러 웨스턴 블롯. +/- 부호는 SPAAC가 수행되었는지 여부를 나타낸다. 3회의 시험을 수행하였다 (1, 2, 3으로 나타냄; 생물학적 반복물). 각 세트 (NXN/NYN 및 NNX/XNN)의 3회의 시험을 병행하여 처리하였다. 도 11b, 명시된 코돈/안티코돈 쌍에 대한 웨스턴 블롯 (도 11a)에서의 상대적 변위 (즉, 변위 밴드의 신호를 변위 밴드와 비변위 밴드 둘 다의 총 신호로 나눈 것)의 정량화. +/- 부호는 SPAAC가 수행되었는지 여부를 나타낸다. 평균 ± 표준 편차 뿐만 아니라 개별 데이터 포인트를 도시한다 (n = 3).
도 12a-b는 클론 SSO 발현에 대한 웨스턴 블롯 및 형광 스캔을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 도 12a, SPAAC에 의한 TAMRA-PEG4-DBCO에 접합된 도 7a의 배양물로부터의 정제된 sfGFP의 α-GFP 및 TAMRA 형광 스캔의 슈도-컬러 웨스턴 블롯. 표시된 (크로핑된) 면적은 32 kDa 내지 25 kDa 표준 단백질 마커 사이에서 이동하였다. 도 12b, 명시된 코돈에 대한 웨스턴 블롯 (도 12a)에서의 상대적 변위의 정량화. 평균 ± 표준 편차 뿐만 아니라 개별 데이터 포인트를 도시한다 (CXC의 n = 5 및 GXG의 n = 4를 제외한 n = 3).
도 13은 TPT3TP의 부재 하에서의 클론 SSO 발현을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 상위 4개의 자기-쌍형성 코돈/안티코돈에 대해 단백질 발현의 종점 (즉, aTc를 보충한 후 t = 180분)에서 클론 SSO로부터의 정규화된 형광. 각각의 반복 발현을 도 7a에서 수행된 바와 같이 개별 콜로니로부터 번식된 배양물에서 수행하였다 (n = 3, 생물학적 반복물). 형광 및 정량화된 웨스턴 블롯 단백질 변위 (상대적 변위; 겔은 도시하지 않음) 둘 다에 대한 평균 ± 표준 편차, 뿐만 아니라 형광에 대한 개별 데이터 포인트를 도시한다.
도 14는 이중 코돈 발현에 대한 대조군을 도시한다. 비천연 코돈 및 비천연 안티코돈은 그의 DNA 코딩 서열의 관점에서 기재된다. 배지 내 나타낸 ncAA의 존재 또는 부재 하에 명시된 유전자형의 sfGFP 발현 동안 정규화된 형광의 시간-경과 플롯. IPTG를 t = -60분에 첨가하고, aTc를 t = 0에 첨가하였다. 각각의 반복 발현을 개별 콜로니로부터 번식된 배양물에서 수행하였다 (n = 3, 생물학적 반복물). 평균 및 개별 데이터 포인트를 도시한다.
도 15a-b는 이중 코돈 발현으로부터의 단백질의 HRMS 분석을 도시한다. 도 8b에 도시된 바와 같이, 배지 내 AzK 및 pAzF와 함께 sfGFP151,190,200(GXT,AXC), tRNAPyl(AYC), 및 tRNA p AzF(GYT)를 발현하는 SSO로부터 정제된 무손상 sfGFP의 HRMS 분석 (n = 3, 생물학적 반복물). 표준 단일-문자 아미노산 코드가 사용된다. 도 15a는 관련 피크 및 서로에 대한 그의 상대 존재비의 주석과 함께 디컨볼루션된 스펙트럼을 도시한다. 도 15b는 피크 할당 및 해석을 도시한다.
도 16a-b는 삼중 코돈 발현으로부터의 단백질의 HRMS 분석을 도시한다. 도 9b에 도시된 바와 같이, 배지 내 AzK 및 pAzF와 함께 sfGFP151,190,200(AXC,GXT,AGX), tRNAPyl(XCT), tRNA p AzF(GYT), 및 tRNASer(AYC)을 발현하는 SSO로부터 정제된 무손상 sfGFP의 HRMS 분석 (n = 3, 생물학적 반복물). 표준 단일-문자 아미노산 코드가 사용된다. 도 16a는 관련 피크 및 서로에 대한 그의 상대 존재비의 주석과 함께 디컨볼루션된 스펙트럼을 도시한다. 도 16b는 피크 할당 및 해석을 도시한다.
특정 용어
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 청구된 대상이 속하는 기술분야의 통상의 기술자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 상기 일반적 설명 및 하기 상세한 설명은 단지 예시적이고 설명적이며, 청구된 임의의 대상을 제한하지 않는 것으로 이해되어야 한다. 본 출원에서 단수의 사용은 달리 구체적으로 언급되지 않는 한 복수를 포함한다. 명세서 및 첨부된 청구범위에서 사용된 단수 형태 ("a," "an" 및 "the")는 문맥상 달리 명백하게 지시되지 않는 한 복수의 지시대상을 포함한다는 것을 주목해야 한다. 본 출원에서 "또는"의 사용은 달리 언급되지 않는 한 "및/또는"을 의미한다. 또한, 용어 "포함하는" 뿐만 아니라 다른 형태, 예컨대 "포함하다", "포함한다" 및 "포함된"의 사용은 제한적이지 않다.
본원에 사용된 범위 및 양은 "약" 특정 값 또는 범위로 표현될 수 있다. 약은 또한 정확한 양을 포함한다. 따라서, "약 5 μL"는 "약 5 μL" 및 또한 "5 μL"를 의미한다. 일반적으로, 용어 "약"은 실험 오차 내에 있을 것으로 예상되는 양을 포함한다.
합성 방법과 관련하여 본원에 사용된 어구, 예컨대 "제공하는데 적합한 조건 하에" 또는 "수득하기에 충분한 조건 하에" 등은 실험자가 달라지는 통상의 기술범위 내에서 반응 생성물의 유용한 양 또는 수율을 제공하는 반응 조건, 예컨대 시간, 온도, 용매, 반응물 농도 등을 지칭한다. 목적 반응 생성물이 단리되거나 또는 달리 추가로 사용될 수 있는 한, 목적 반응 생성물이 유일한 반응 생성물이거나 또는 출발 물질이 완전히 소모될 필요는 없다.
"화학적으로 실현가능한"은 것은 유기 구조물의 일반적으로 이해되는 규칙에 위배되지 않는 결합 배열 또는 화합물을 의미하고; 예를 들어 특정 상황에서 자연에 존재하지 않을 5가 탄소 원자를 함유할 청구범위의 정의 내의 구조는 청구 범위 내에 있지 않는 것으로 이해될 것이다. 본원에 개시된 구조는 그의 모든 실시양태에서 단지 "화학적으로 실현가능한" 구조만을 포함하는 것으로 의도되고, 예를 들어 가변 원자 또는 기로 제시된 구조에서 화학적으로 실현가능하지 않은 임의의 언급된 구조는 본원에 개시되거나 청구되는 것으로 의도되지 않는다.
본원에 사용된 용어 화학 구조의 "유사체"는 모 구조로부터 합성적으로 용이하게 유도될 수 없을지라도 모 구조와의 실질적 유사성을 보존하고 있는 화학 구조를 지칭한다. 일부 실시양태에서, 뉴클레오티드 유사체는 비천연 뉴클레오티드이다. 일부 실시양태에서, 뉴클레오시드 유사체는 비천연 뉴클레오시드이다. 모 화학 구조로부터 합성적으로 용이하게 유도되는 관련 화학 구조는 "유도체"로 지칭된다.
따라서, 본원에 사용된 용어 폴리뉴클레오티드는 관련 기술분야에 널리 공지된 DNA, RNA, DNA- 또는 RNA-유사 중합체, 예컨대 펩티드 핵산 (PNA), 잠금 핵산 (LNA), 포스포로티오에이트, 비천연 염기 등을 지칭한다. 폴리뉴클레오티드는 자동화 합성기에서, 예를 들어 포스포로아미다이트 화학 또는 합성기 사용에 적합화된 다른 화학적 접근법을 사용하여 합성될 수 있다.
DNA는 cDNA 및 게놈 DNA를 포함하나 이에 제한되지는 않는다. DNA는 공유 또는 비-공유 수단에 의해 RNA 및 펩티드를 포함하나 이에 제한되지는 않는 또 다른 생체분자에 부착될 수 있다. RNA는 코딩 RNA, 예를 들어 메신저 RNA (mRNA)를 포함한다. 일부 실시양태에서, RNA는 rRNA, RNAi, snoRNA, 마이크로RNA, siRNA, snRNA, exRNA, piRNA, 긴 ncRNA, 또는 그의 임의의 조합 또는 하이브리드이다. 일부 경우에, RNA는 리보자임의 성분이다. DNA 및 RNA는 선형, 원형, 슈퍼코일형, 단일-가닥 및 이중-가닥을 포함하나 이에 제한되지는 않는 임의의 형태일 수 있다.
펩티드 핵산 (PNA)은 펩티드-유사 백본이 DNA 또는 RNA의 당-포스페이트 백본을 대체하는 합성 DNA/RNA 유사체이다. PNA 올리고머는 상보적 DNA에의 결합에 있어서 보다 높은 결합 강도 및 보다 큰 특이성을 나타내며, PNA/DNA 염기 미스매치는 DNA/DNA 듀플렉스에서의 유사한 미스매치보다 더 불안정하다. 이 결합 강도 및 특이성은 또한 PNA/RNA 듀플렉스에도 적용된다. PNA는 뉴클레아제 또는 프로테아제에 의해 쉽게 인식되지 않아서 이들을 효소적 분해에 저항성이 되게 한다. PNA는 또한 넓은 pH 범위에 걸쳐 안정하다. 또한, 문헌 [Nielsen PE, Egholm M, Berg RH, Buchardt O (December 1991). "Sequence-selective recognition of DNA by strand displacement with a thymine-substituted polyamide", Science 254 (5037): 1497-500. doi:10.1126/science.1962210. PMID 1962210; and, Egholm M, Buchardt O, Christensen L, Behrens C, Freier SM, Driver DA, Berg RH, Kim SK, Norden B, and Nielsen PE (1993), "PNA Hybridizes to Complementary Oligonucleotides Obeying the Watson-Crick Hydrogen Bonding Rules". Nature 365 (6446): 566-8. doi:10.1038/365566a0. PMID 7692304]을 참조한다.
잠금 핵산 (LNA)은 변형된 RNA 뉴클레오티드이며, 여기서 LNA 뉴클레오티드의 리보스 모이어티는 2' 산소 및 4' 탄소를 연결하는 추가의 가교로 변형된다. 가교는 A-형 듀플렉스에서 종종 발견되는 3'-엔도 (노스) 입체형태로 리보스를 "잠근다". LNA 뉴클레오티드는 원할 때마다 올리고뉴클레오티드 내의 DNA 또는 RNA 잔기와 혼합될 수 있다. 이러한 올리고머는 화학적으로 합성될 수 있고, 상업적으로 입수가능하다. 잠금 리보스 입체형태는 염기 스태킹 및 백본 사전-조직화를 증진시킨다. 예를 들어, 문헌 [Kaur, H; Arora, A; Wengel, J; Maiti, S (2006), "Thermodynamic, Counterion, and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes", Biochemistry 45 (23): 7347-55. doi:10.1021/bi060307w. PMID 16752924; Owczarzy R.; You Y., Groth C.L., Tataurov A.V. (2011), "Stability and mismatch discrimination of locked nucleic acid-DNA duplexes.", Biochem. 50 (43): 9352-9367. doi:10.1021/bi200904e. PMC 3201676. PMID 21928795; Alexei A. Koshkin; Sanjay K. Singh, Poul Nielsen, Vivek K. Rajwanshi, Ravindra Kumar, Michael Meldgaard, Carl Erik Olsen, Jesper Wengel (1998), "LNA (Locked Nucleic Acids): Synthesis of the adenine, cytosine, guanine, 5-methylcytosine, thymine and uracil bicyclonucleoside monomers, oligomerisation, and unprecedented nucleic acid recognition", Tetrahedron 54 (14): 3607-30. doi:10.1016/S0040-4020(98)00094-5; and, Satoshi Obika; Daishu Nanbu, Yoshiyuki Hari, Ken-ichiro Morio, Yasuko In, Toshimasa Ishida, Takeshi Imanishi (1997), "Synthesis of 2′-O,4′-C-methyleneuridine and -cytidine. Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering", Tetrahedron Lett. 38 (50): 8735-8. doi:10.1016/S0040-4039(97)10322-7]을 참조한다.
분자 비콘 또는 분자 비콘 프로브는 균질 용액에서 특정 핵산 서열의 존재를 검출할 수 있는 올리고뉴클레오티드 혼성화 프로브이다. 분자 비콘은 내부적으로 켄칭된 형광단을 갖는 헤어핀 형상의 분자이며, 그의 형광은 표적 핵산 서열에 결합할 때 복원된다. 예를 들어, 문헌 [Tyagi S, Kramer FR (1996), "Molecular beacons: probes that fluoresce upon hybridization", Nat Biotechnol. 14 (3): 303-8. PMID 9630890; Tapp I, Malmberg L, Rennel E, Wik M, Syvanen AC (2000 Apr), "Homogeneous scoring of single-nucleotide polymorphisms: comparison of the 5'-nuclease TaqMan assay and Molecular Beacon probes", Biotechniques 28 (4): 732-8. PMID 10769752; and, Akimitsu Okamoto (2011), "ECHO probes: a concept of fluorescence control for practical nucleic acid sensing", Chem. Soc. Rev. 40: 5815-5828]을 참조한다.
일부 실시양태에서, 핵염기는 일반적으로 뉴클레오시드의 헤테로시클릭 염기 부분이다. 핵염기는 자연 발생일 수 있고, 변형될 수 있고, 천연 염기와 유사성을 갖지 않을 수 있고, 예를 들어 유기 합성에 의해 합성될 수 있다. 특정 실시양태에서, 핵염기는 수소 결합을 사용하거나 사용하지 않고 또 다른 핵산의 염기와 상호작용할 수 있는 임의의 원자 또는 원자단을 포함한다. 특정 실시양태에서, 비천연 핵염기는 천연 핵염기로부터 유래되지 않는다. 비천연 핵염기는 반드시 염기성 특성을 보유하지는 않지만, 단순성을 위해 핵염기로 지칭된다는 것을 주목해야 한다. 일부 실시양태에서, 핵염기를 지칭할 때, "(d)"는 핵염기가 데옥시리보스 또는 리보스에 부착될 수 있음을 나타낸다.
일부 실시양태에서, 뉴클레오시드는 핵염기 모이어티 및 당 모이어티를 포함하는 화합물이다. 뉴클레오시드는 자연 발생 뉴클레오시드 (DNA 및 RNA에서 발견되는 바와 같음), 무염기성 뉴클레오시드, 변형된 뉴클레오시드, 및 모방 염기 및/또는 당 기를 갖는 뉴클레오시드를 포함하나 이에 제한되지는 않는다. 뉴클레오시드는 임의의 다양한 치환기를 포함하는 뉴클레오시드를 포함한다. 뉴클레오시드는 핵산 염기와 당의 환원기 사이의 글리코시드 연결을 통해 형성된 글리코시드 화합물일 수 있다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 비천연 mRNA 코돈 및 비천연 tRNA 안티코돈은 그의 DNA 코딩 서열의 관점에서 작성될 수 있다. 예를 들어, 비천연 tRNA 안티코돈은 GYU 또는 GYT로 기재될 수 있다.
본원에 사용된 섹션 표제는 단지 조직화 목적을 위한 것이며, 기재된 대상을 제한하는 것으로 해석되어서는 안된다.
비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법
확장된 유전자 알파벳을 갖는 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법이 본원에 개시된다. 일부 경우에, 본원에 기재된 바와 같은 조성물 및 방법은 비천연 폴리펩티드를 코딩하는 비천연 핵산 분자를 포함하며, 여기서 비천연 폴리펩티드는 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드는 적어도 2개의 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드는 적어도 3개의 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드는 2개의 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드는 3개의 비천연 아미노산을 포함한다. 일부 경우에, 비천연 폴리펩티드 내로 혼입된 적어도 2개의 비천연 아미노산은 동일하거나 상이한 비천연 아미노산일 수 있다. 일부 경우에, 비천연 아미노산은 부위-특이적 방식으로 비천연 폴리펩티드 내로 혼입된다. 일부 경우에, 비천연 폴리펩티드는 비천연 단백질이다.
일부 경우에, 본원에 기재된 바와 같은 조성물 및 방법은 반합성 유기체 (SSO)를 포함한다. 일부 경우에, 방법은 적어도 1개의 비천연 염기 쌍 (UBP)을 적어도 1개의 비천연 핵산 분자 내로 혼입시키는 것을 포함한다. 일부 실시양태에서, 방법은 1개의 UBP를 적어도 1개의 비천연 핵산 분자 내로 혼입시키는 것을 포함한다. 일부 실시양태에서, 방법은 2개의 UBP를 적어도 1개의 비천연 핵산 분자 내로 혼입시키는 것을 포함한다. 일부 실시양태에서, 방법은 3개의 UBP를 적어도 1개의 비천연 핵산 분자 내로 혼입시키는 것을 포함한다. UBP 염기 쌍은 2개의 비천연 뉴클레오시드의 비천연 핵염기 사이의 쌍형성에 의해 형성된다. 일부 실시양태에서, 비천연 핵산 분자는 비천연 DNA 분자이다.
일부 실시양태에서, 적어도 1개의 비천연 핵산 분자는 1개의 분자 (예를 들어, 플라스미드 또는 염색체)이거나 또는 이를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 핵산 분자는 2개의 분자 (예를 들어, 2개의 플라스미드, 2개의 염색체, 또는 1개의 염색체 및 1개의 플라스미드)이거나 또는 이를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 핵산 분자는 3개의 분자 (예를 들어, 3개의 플라스미드, 2개의 플라스미드 및 1개의 염색체, 1개의 플라스미드 및 2개의 염색체, 또는 3개의 염색체)이거나 또는 이를 포함한다. 염색체의 예는 UBP가 통합된 게놈 염색체 및 UBP를 포함하는 인공 염색체 (예를 들어, 박테리아 인공 염색체)를 포함한다. 일부 실시양태에서, 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 DNA 분자가 사용되고, 적어도 1개의 비천연 DNA 분자가 2개 이상의 분자인 경우, 적어도 4개의 비천연 염기 쌍은 임의의 실현가능한 방식으로 (예를 들어, 제1 분자에 1개 및 제2 분자에 3개, 제1 분자에 2개 및 제2 분자에 2개 등) 2개 이상의 분자 사이에 분포될 수 있다.
일부 경우에, 임의로 UBP를 포함하는 적어도 1개의 비천연 핵산 분자는 전사되어 적어도 1개의 비천연 뉴클레오티드를 보유하는 적어도 1개의 비천연 코돈을 포함하는 메신저 RNA 분자를 제공한다. 일부 실시양태에서, 전사는 DNA 분자의 일부에 상보적인 1개 이상의 RNA 분자를 생성하는 것을 지칭한다. 일부 경우에, 비천연 뉴클레오티드는 비천연 코돈의 제1, 제2 또는 제3 코돈 위치, 예를 들어 제2 또는 제3 코돈 위치를 점유한다. 일부 경우에, 2개의 비천연 뉴클레오티드는 비천연 코돈의 제1 및 제2, 제1 및 제3, 제2 및 제3, 또는 제1 및 제3 코돈 위치를 점유한다. 일부 경우에, 3개의 비천연 뉴클레오티드는 비천연 코돈의 모든 3개의 코돈 위치를 점유한다. 일부 경우에, 비천연 뉴클레오티드를 보유하는 mRNA는 적어도 2개의 비천연 코돈을 포함한다 (일부 실시양태에서, 표현 "적어도 2개의 비천연 코돈"은 "적어도 제1 및 제2 비천연 코돈"과 상호교환가능함). 일부 경우에, 비천연 뉴클레오티드를 보유하는 mRNA는 2개의 비천연 코돈을 포함한다. 일부 경우에, 비천연 뉴클레오티드를 보유하는 mRNA는 3개의 비천연 코돈을 포함한다.
일부 실시양태에서, 임의로 UBP를 포함하는 비천연 핵산 분자는 전사되어 적어도 1개의 tRNA 분자를 제공하고, 여기서 tRNA 분자는 적어도 1개의 비천연 뉴클레오티드를 보유하는 비천연 안티코돈을 포함한다. 일부 경우에, 비천연 뉴클레오티드는 비천연 안티코돈의 제1, 제2 또는 제3 안티코돈 위치를 점유한다. 일부 경우에, 2개의 비천연 뉴클레오티드는 비천연 안티코돈의 제1 및 제2, 제1 및 제3, 제2 및 제3, 또는 제1 및 제3 안티코돈 위치를 점유한다. 일부 경우에, 3개의 비천연 뉴클레오티드는 비천연 안티코돈의 모든 3개의 안티코돈 위치를 점유한다. 일부 경우에, 임의로 UBP를 포함하는 비천연 핵산 분자는 전사되어 적어도 2개의 비천연 안티코돈을 포함하는 적어도 2개의 tRNA를 제공한다. 경우에 따라, 적어도 2개의 비천연 안티코돈은 동일하거나 상이할 수 있다. 일부 경우에, 임의로 UBP를 포함하는 비천연 핵산 분자는 전사되어 동일하거나 상이할 수 있는 비천연 안티코돈을 포함하는 2개의 tRNA를 제공한다. 일부 경우에, 임의로 UBP를 포함하는 비천연 핵산 분자는 전사되어 동일하거나 상이할 수 있는 3개의 비천연 안티코돈을 포함하는 3개의 tRNA를 제공한다.
일부 실시양태에서, mRNA에 의해 코딩되는 적어도 1개의 비천연 코돈은 tRNA의 적어도 비천연 안티코돈에 상보적이어서 비천연 코돈-안티코돈 쌍을 형성할 수 있다. 일부 경우에, 본원에 기재된 조성물 및 방법은 1, 2, 3개 또는 그 초과의 비천연 코돈-안티코돈 쌍을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다. 일부 경우에, 본원에 기재된 조성물 및 방법은 2개의 비천연 코돈-안티코돈 쌍을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다. 일부 경우에, 본원에 기재된 조성물 및 방법은 3개의 비천연 코돈-안티코돈 쌍을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다.
일부 경우에, 본원에 기재된 조성물 및 방법은 1, 2, 3개 또는 그 초과의 비천연 코돈-안티코돈 쌍을 사용하여 1, 2, 3개 또는 그 초과의 비천연 아미노산을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다. 일부 경우에, 본원에 기재된 조성물 및 방법은 2개의 비천연 코돈-안티코돈 쌍을 사용하여 2개의 비천연 아미노산을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다. 일부 경우에, 본원에 기재된 조성물 및 방법은 3개의 비천연 코돈-안티코돈 쌍을 사용하여 3개의 비천연 아미노산을 갖는 비천연 폴리펩티드를 합성하는 것을 포함한다.
일부 경우에, 비천연 코돈은 핵산 서열 XNN, NXN, NNX, XXN, XNX, NXX, 또는 XXX를 포함하고, 비천연 안티코돈은 핵산 서열 XNN, YNN, NXN, NYN, NNX, NNY, NXX, NYY, XNX, YNY, XXN, YYN, 또는 YYY를 포함하여 비천연 코돈-안티코돈 쌍을 형성한다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 NNX-XNN, NNX-YNN, 또는 NXN-NYN으로 구성되고, 여기서 N은 임의의 천연 뉴클레오티드이고, X는 제1 비천연 뉴클레오티드이고, Y는 제2 비천연 뉴클레오티드이다. 일부 실시양태에서, 임의의 천연 뉴클레오티드는 표준 염기, 예컨대 아데닌, 티민, 우라실, 구아닌 또는 시토신을 갖는 뉴클레오티드, 및 자연 발생 변형된 염기, 예컨대 슈도우리딘, 5-메틸시토신 등을 갖는 뉴클레오티드를 포함한다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 코돈에 적어도 하나의 G 및 안티코돈에 적어도 하나의 C를 포함한다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 코돈에 적어도 하나의 G 또는 C 및 안티코돈에 적어도 하나의 상보적 C 또는 G를 포함한다. X 및 Y는 각각 독립적으로 (i) 2-티오우라실, 2'-데옥시우리딘, 4-티오-우라실, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온), 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌, 6-아자-아데닌, 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 6-아자-구아닌, 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘 또는 2-피리돈으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, X 및 Y는 독립적으로
Figure pct00005
로 이루어진 군으로부터 선택된다.
일부 경우에, 비천연 코돈-안티코돈 쌍은 NNX-XNN을 포함하고, 여기서 NNX-XNN은 AAX-XUU, AUX-XAU, ACX-XGU, AGX-XCU, UAX-XUA, UUX-XAA, UCX-XGA, UGX-XCA, CAX-XUG, CUX-XAG, CCX-XGG, CGX-XCG, GAX-XUC, GUX-XAC, GCX-XGC, 및 GGX-XCC로 이루어진 군으로부터 선택된다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 NNX-YNN을 포함하고, 여기서 NNX-YNN은 AAX-YUU, AUX-YAU, ACX-YGU, AGX-YCU, UAX-YUA, UUX-YAA, UCX-YGA, UGX-YCA, CAX-YUG, CUX-YAG, CCX-YGG, CGX-YCG, GAX-YUC, GUX-YAC, GCX-YGC, 및 GGX-YCC로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 NXN-NXN을 포함하고, 여기서 NXN-NXN은 AXA-UXU, AXU-AXU, AXC-GXU, AXG-CXU, UXA-UXA, UXU-AXA, UXC-GXA, UXG-CXA, CXA-UXG, CXU-AXG, CXC-GXG, CXG-CXG, GXA-UXC, GXU-AXC, GXC-GXC, 및 GXG-CXC로 이루어진 군으로부터 선택된다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 NXN-NYN을 포함하고, 여기서 NXN-NYN은 AXA-UYU, AXU-AYU, AXC-GYU, AXG-CYU, UXA-UYA, UXU-AYA, UXC-GYA, UXG-CYA, CXA-UYG, CXU-AYG, CXC-GYG, CXG-CYG, GXA-UYC, GXU-AYC, GXC-GYC, 및 GXG-CYC로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 XNN-NNX를 포함하고, 여기서 XNN-NNX는 XAA-UUX, XAU-AUX, XAC-AGX, XAG-CUX, XUA-UAX, XUU-AAX, XUC-GAX, XUG-CAX, XCA-UGX, XCU-AGX, XCC-GGX, XCG-CGX, XGA-UCX, XGU-ACX, XGC-GCX, 및 XGG-CCX로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 XNN-NNY를 포함하고, 여기서 XNN-NNY는 XAA-UUY, XAU-AUY, XAC-AGY, XAG-CUY, XUA-UAY, XUU-AAY, XUC-GAY, XUG-CAY, XCA-UGY, XCU-AGY, XCC-GGY, XCG-CGY, XGA-UCY, XGU-ACY, XGC-GCY, 및 XGG-CCY로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 XXN-NXX를 포함하고, 여기서 XXN-NXX는 XXA-UXX, XXU-AXX, XXC-GXX, 및 XXG-CXX로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 XXN-NYY를 포함하고, 여기서 XXN-NYY는 XXA-UYY, XXU-AYY, XXC-GYY, 및 XXG-CYY로 이루어진 군으로부터 선택된다. 일부 대안에서, 비천연 코돈-안티코돈 쌍은 XNX-XNX를 포함하고, 여기서 XNX-XNX는 XAX-XUX, XUX-XAX, XCX-XGX, 및 XGX-XCX로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 코돈-안티코돈 쌍은 XNX-YNY를 포함하고, 여기서 XNX-YNY는 XAX-YUY, XUX-YAY, XCX-YGY, 및 XGX-YCY로 이루어진 군으로부터 선택된다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 NXX-XXN을 포함하고, 여기서 NXX-XXN은 AXX-XXU, UXX-XXA, CXX-XXG, 및 GXX-XXC로 이루어진 군으로부터 선택된다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 NXX-YYN을 포함하고, 여기서 NXX-YYN은 AXX-YYU, UXX-YYA, CXX-YYG, 및 GXX-YYC로 이루어진 군으로부터 선택된다. 일부 경우에, 비천연 코돈-안티코돈 쌍은 XXX-XXX 또는 XXX-YYY를 포함한다.
확장된 유전자 알파벳을 갖는 비천연 폴리펩티드 (도 2)를 생산하는 방법의 예시적인 작업흐름(100) (도 1)에서, 단백질(102) 및 tRNA(103)를 코딩하는 각각 상보적인 비천연 핵염기 (X, Y)를 포함하는 DNA(101)이 전사되어(104), tRNA(106) 및 mRNA(107)를 생성한다. X는 제1 비천연 뉴클레오티드이고, Y는 제2 비천연 뉴클레오티드이다. tRNA를 비천연 아미노산(105)으로 충전한 후, mRNA(107)는 번역되어(108) 1개 이상의 비천연 아미노산(109)을 포함하는 단백질(110)을 생성한다. 본원에 기재된 방법 및 조성물은 일부 경우에 높은 정확도 및 수율로 비천연 아미노산의 부위-특이적 혼입을 가능하게 한다. 또한, 확장된 유전자 알파벳을 포함하는 반합성 유기체, 및 적어도 1개의 비천연 아미노산 잔기를 포함하는 것들을 포함한 단백질 생성물을 생산하기 위해 반합성 유기체를 사용하는 방법이 본원에 기재된다.
비천연 핵염기의 선택은 본원에 기재된 방법에서 하나 이상의 단계의 최적화를 가능하게 한다. 예를 들어, 핵염기는 고효율 복제, 전사 및/또는 번역을 위해 선택된다. 일부 경우에, 하나 초과의 비천연 핵염기 쌍이 본원에 기재된 방법에 이용된다. 예를 들어, 데옥시리보 모이어티를 포함하는 제1 세트의 핵염기 (예컨대, 제1 염기 쌍을 형성하도록 구성된 제1 핵염기 및 제2 핵염기)가 DNA 복제에 사용되고, 제2 세트의 핵염기 (예컨대, 제3 핵염기 및 제4 핵염기, 여기서 제3 및 제4 핵염기는 제2 염기 쌍을 형성하도록 구성된 리보스에 부착됨)가 전사/번역에 사용된다. 제1 세트의 핵염기와 제2 세트의 핵염기 사이의 상보적 쌍형성은 일부 경우에 제1 세트로부터의 핵염기를 포함하는 DNA 주형으로부터 tRNA 또는 단백질을 생성하는 유전자의 전사를 가능하게 한다. 제2 세트의 핵염기 사이의 상보적 쌍형성 (제2 염기 쌍)은 일부 경우에 비천연 핵산을 포함하는 tRNA와 및 mRNA를 매칭시킴으로써 번역을 허용한다. 일부 경우에, 제1 세트 내 핵염기는 데옥시리보스 모이어티에 부착된다. 일부 경우에, 제1 세트 내 핵염기는 리보스 모이어티에 부착된다. 일부 경우에, 두 세트의 핵염기는 고유하다. 일부 경우에, 적어도 1종의 핵염기는 두 세트에서 동일하다. 일부 경우에, 제1 핵염기 및 제3 핵염기는 동일하다. 일부 실시양태에서, 제1 염기 쌍 및 제2 염기 쌍은 동일하지 않다. 일부 경우에, 제1 염기 쌍, 제2 염기 쌍 및 제3 염기 쌍은 동일하지 않다.
일부 실시양태에서, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 폴리펩티드 또는 비천연 단백질의 수율은 다른 방법에 의해 합성된 동일한 비천연 폴리펩티드 또는 비천연 단백질의 수율에 비해 더 높다. 일부 경우에, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 폴리펩티드 또는 비천연 단백질의 수율은 다른 방법에 의해 합성된 동일한 비천연 폴리펩티드 또는 비천연 단백질의 수율보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50% 더 높다. 다른 방법의 예는 앰버 코돈 억제를 이용하는 방법을 포함한다.
일부 경우에, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 폴리펩티드 또는 비천연 단백질의 용해도는 다른 방법에 의해 합성된 동일한 비천연 폴리펩티드 또는 비천연 단백질의 용해도에 비해 더 높다. 일부 경우에, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 폴리펩티드 또는 비천연 단백질의 용해도는 다른 방법에 의해 합성된 동일한 비천연 폴리펩티드 또는 비천연 단백질보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50% 더 높다. 일부 경우에, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 단백질의 생물학적 활성은 다른 방법에 의해 합성된 동일한 비천연 단백질의 생물학적 활성에 비해 더 높다. 일부 경우에, 본원에 개시된 바와 같은 조성물 및 방법에 의해 합성된 비천연 단백질의 생물학적 활성은 다른 방법에 의해 합성된 동일한 비천연 단백질의 생물학적 활성보다 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50% 더 높다.
일부 실시양태에서, 본원에 기재된 바와 같은 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법은 반합성 유기체 (SSO)를 이용하거나 포함한다. 일부 실시양태에서, SSO는 비천연 폴리펩티드의 합성 동안 클론 확장된다. 일부 경우에, SSO는 비천연 폴리펩티드의 합성 동안 클론 확장되지 않는다. 일부 경우에, SSO는 비천연 폴리펩티드의 합성 동안 세포 주기의 임의의 단계에서 정지될 수 있다. 일부 실시양태에서, 본원에 기재된 바와 같은 조성물 및 방법은 시험관내에서 비천연 폴리펩티드를 합성할 수 있다. 일부 경우에, 본원에 기재된 바와 같은 조성물 및 방법은 비천연 폴리펩티드를 합성하기 위한 무세포 시스템을 포함할 수 있다.
핵산 분자
일부 실시양태에서, 핵산 (예를 들어, 본원에서 관심 핵산 분자로도 지칭됨)은 임의의 공급원 또는 조성물로부터의 것, 예컨대 DNA, cDNA, gDNA (게놈 DNA), RNA, siRNA (짧은 억제 RNA), RNAi, tRNA, mRNA 또는 rRNA (리보솜 RNA)이고, 예를 들어 임의의 형태 (예를 들어, 선형, 원형, 슈퍼코일, 단일-가닥, 이중-가닥 등)이다. 일부 실시양태에서, 핵산은 뉴클레오티드, 뉴클레오시드 또는 폴리뉴클레오티드를 포함한다. 일부 경우에, 핵산은 천연 및 비천연 핵산을 포함한다. 일부 경우에, 핵산은 또한 비천연 핵산, 예컨대 DNA 또는 RNA 유사체 (예를 들어, 염기 유사체, 당 유사체 및/또는 비천연 백본 등을 함유함)를 포함한다. 용어 "핵산"은 폴리뉴클레오티드 쇄의 특정 길이를 지칭하거나 추론하지 않고, 따라서 폴리뉴클레오티드 및 올리고뉴클레오티드가 또한 정의에 포함되는 것으로 이해된다. 예시적인 천연 뉴클레오티드는 비제한적으로 ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP, GMP, dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP 및 dGMP를 포함한다. 예시적인 천연 데옥시리보뉴클레오티드는 dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP 및 dGMP를 포함한다. 예시적인 천연 리보뉴클레오티드는 ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP 및 GMP를 포함한다. 천연 RNA의 경우, 우라실 염기는 우리딘이다. 핵산은 때때로 숙주 세포에서 복제 또는 복제될 수 있는 벡터, 플라스미드, 파지미드, 자율 복제 서열 (ARS), 동원체, 인공 염색체, 효모 인공 염색체 (예를 들어, YAC) 또는 기타 핵산이다. 일부 경우에, 비천연 핵산은 핵산 유사체이다. 추가의 경우, 비천연 핵산은 세포외 공급원으로부터의 것이다. 다른 경우, 비천연 핵산은 본원에 제공된 유기체, 예를 들어 유전자 변형 유기체의 세포내 공간에 이용가능하다. 일부 실시양태에서, 비천연 뉴클레오티드는 천연 뉴클레오티드가 아니다. 일부 실시양태에서, 천연 염기를 포함하지 않는 뉴클레오티드는 비천연 핵염기를 포함한다.
비천연 핵산
뉴클레오티드 유사체 또는 비천연 뉴클레오티드는 염기, 당 또는 포스페이트 모이어티에 대한 일부 유형의 변형을 함유하는 뉴클레오티드를 포함한다. 일부 실시양태에서, 변형은 화학적 변형을 포함한다. 일부 경우에, 변형은 3'OH 또는 5'OH 기, 백본, 당 성분 또는 뉴클레오티드 염기에서 발생한다. 변형은 일부 경우에 비-자연 발생 링커 분자 및/또는 가닥간 또는 가닥내 교차 결합을 임의로 포함한다. 한 측면에서, 변형된 핵산은 3'OH 또는 5'OH 기, 백본, 당 성분 또는 뉴클레오티드 염기 중 하나 이상의 변형, 및/또는 비-자연 발생 링커 분자의 부가를 포함한다. 한 측면에서, 변형된 백본은 포스포디에스테르 백본 이외의 백본을 포함한다. 한 측면에서, 변형된 당은 데옥시리보스 이외의 당 (변형된 DNA에서) 또는 리보스 이외의 당 (변형된 RNA)을 포함한다. 한 측면에서, 변형된 염기는 아데닌, 구아닌, 시토신 또는 티민 이외의 염기 (변형된 DNA에서), 또는 아데닌, 구아닌, 시토신 또는 우라실 이외의 염기 (변형된 RNA에서)를 포함한다.
일부 실시양태에서, 핵산은 적어도 1종의 변형된 염기를 포함한다. 일부 경우에, 핵산은 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20종 또는 그 초과의 변형된 염기를 포함한다. 일부 경우에, 염기 모이어티에 대한 변형은 A, C, G, 및 T/U, 뿐만 아니라 다양한 퓨린 또는 피리미딘 염기의 천연 및 합성 변형을 포함한다. 일부 실시양태에서, 변형은 아데닌, 구아닌 시토신 또는 티민의 변형된 형태 (변형된 DNA에서), 또는 아데닌, 구아닌 시토신 또는 우라실의 변형된 형태 (변형된 RNA)에 대한 것이다.
비천연 핵산의 변형된 염기는 우라실-5-일, 하이포크산틴-9-일 (I), 2-아미노아데닌-9-일, 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함하나 이에 제한되지는 않는다. 특정 비천연 핵산, 예컨대 5-치환된 피리미딘, 6-아자피리미딘 및 N-2 치환된 퓨린, N-6 치환된 퓨린, O-6 치환된 퓨린, 2-아미노프로필아데닌, 5-프로피닐우라실, 5-프로피닐시토신, 5-메틸시토신, 듀플렉스 형성의 안정성을 증가시키는 것들, 범용 핵산, 소수성 핵산, 혼재성 핵산, 크기-확장 핵산, 플루오린화 핵산, 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 퓨린, 예컨대 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신, 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 6-메틸, 아데닌 및 구아닌의 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실, 5-할로시토신, 5-프로피닐 (-C≡C-CH3) 우라실, 5-프로피닐 시토신, 피리미딘 핵산의 다른 알키닐 유도체, 6-아조 우라실, 6-아조 시토신, 6-아조 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸, 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌, 7-메틸아데닌, 2-F-아데닌, 2-아미노-아데닌, 8-아자구아닌, 8-아자아데닌, 7-데아자구아닌, 7-데아자아데닌, 3-데아자구아닌, 3-데아자아데닌, 트리시클릭 피리미딘, 페녹사진 시티딘([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), G-클램프, 페녹사진 시티딘 (예를 들어, 9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온), 퓨린 또는 피리미딘 염기가 다른 헤테로사이클로 대체된 것들, 7-데아자-아데닌, 7-데아자구아노신, 2-아미노피리딘, 2-피리돈, 아자시토신, 5-브로모시토신, 브로모우라실, 5-클로로시토신, 염소화 시토신, 시클로시토신, 시토신 아라비노시드, 5-플루오로시토신, 플루오로피리미딘, 플루오로우라실, 5,6-디히드로시토신, 5-아이오도시토신, 히드록시우레아, 아이오도우라실, 5-니트로시토신, 5-브로모우라실, 5-클로로우라실, 5-플루오로우라실 및 5-아이오도우라실, 2-아미노-아데닌, 6-티오-구아닌, 2-티오-티민, 4-티오-티민, 5-프로피닐-우라실, 4-티오-우라실, N4-에틸시토신, 7-데아자구아닌, 7-데아자-8-아자구아닌, 5-히드록시시토신, 2'-데옥시우리딘, 2-아미노-2'-데옥시아데노신, 및 미국 특허 번호 3,687,808; 4,845,205; 4,910,300; 4,948,882; 5,093,232; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,594,121; 5,596,091; 5,614,617; 5,645,985; 5,681,941; 5,750,692; 5,763,588; 5,830,653 및 6,005,096; WO 99/62923; 문헌 [Kandimalla et al., (2001) Bioorg. Med. Chem. 9:807-813]; [The Concise Encyclopedia of Polymer Science and Engineering, Kroschwitz, J.I., Ed., John Wiley & Sons, 1990, 858- 859]; [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]; 및 [Sanghvi, Chapter 15, Antisense Research and Applications, Crooke and Lebleu Eds., CRC Press, 1993, 273-288]에 기재된 것들을 포함하나 이에 제한되지는 않는다. 추가의 염기 변형은, 예를 들어 미국 특허 번호 3,687,808; 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]에서 찾아볼 수 있다. 일부 경우에, 비천연 핵산은 도 3의 핵염기를 포함한다. 일부 경우에, 비천연 핵산은 도 4a의 핵염기를 포함한다. 일부 경우에, 비천연 핵산은 도 4b의 핵염기를 포함한다.
다양한 헤테로시클릭 염기 및 다양한 당 모이어티 (및 당 유사체)를 포함하는 비천연 핵산이 관련 기술분야에서 이용가능하고, 핵산은 일부 경우에 자연 발생 핵산의 주요 5종의 염기 성분 이외의 1종 또는 여러 종의 헤테로시클릭 염기를 포함한다. 예를 들어, 헤테로시클릭 염기는 일부 경우에 우라실-5-일, 시토신-5-일, 아데닌-7-일, 아데닌-8-일, 구아닌-7-일, 구아닌-8-일, 4-아미노피롤로[2.3-d]피리미딘-5-일, 2-아미노-4-옥소피롤로[2,3-d]피리미딘-5-일, 2-아미노-4-옥소피롤로[2.3-d]피리미딘-3-일 기를 포함하며, 여기서 퓨린은 9-위치를 통해, 피리미딘은 1-위치를 통해, 피롤로피리미딘은 7-위치를 통해, 피라졸로피리미딘은 1-위치를 통해 핵산의 당 모이어티에 부착된다.
일부 실시양태에서, 비천연 핵산의 변형된 염기가 하기 도시되며, 여기서 파선 또는 R은 데옥시리보스 또는 리보스에 대한 부착 지점을 나타낸다.
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
일부 실시양태에서, 뉴클레오티드 유사체는 또한 포스페이트 모이어티에서 변형된다. 변형된 포스페이트 모이어티는 2개의 뉴클레오티드 사이의 연결에 변형을 갖는 것을 포함하나 이에 제한되지는 않고, 예를 들어 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 다른 알킬 포스포네이트, 예컨대 3'-알킬렌 포스포네이트 및 키랄 포스포네이트, 포스피네이트, 포스포르아미데이트, 예컨대 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르 및 보라노포스페이트를 함유한다. 2개의 뉴클레오티드 사이의 이들 포스페이트 또는 변형된 포스페이트 연결은 3'-5' 연결 또는 2'-5' 연결을 통하고, 연결은 역전된 극성, 예컨대 3'-5'→ 5'-3' 또는 2'-5'→5'-2'를 함유하는 것으로 이해된다. 다양한 염, 혼합 염 및 유리 산 형태가 또한 포함된다. 수많은 미국 특허는 변형된 포스페이트를 함유하는 뉴클레오티드의 제조 및 사용 방법을 교시하며, 3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 및 5,625,050을 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 비천연 핵산은 2',3'-디데옥시-2',3'-디데히드로-뉴클레오시드 (PCT/US2002/006460), 5'-치환된 DNA 및 RNA 유도체 (PCT/US2011/033961; 문헌 [Saha et al., J. Org Chem., 1995, 60, 788-789]; [Wang et al., Bioorganic & Medicinal Chemistry Letters, 1999, 9, 885-890]; 및 [Mikhailov et al., Nucleosides & Nucleotides, 1991, 10(1-3), 339-343]; [Leonid et al., 1995, 14(3-5), 901-905]; 및 [Eppacher et al., Helvetica Chimica Acta, 2004, 87, 3004-3020]; PCT/JP2000/004720; PCT/JP2003/002342; PCT/JP2004/013216; PCT/JP2005/020435; PCT/JP2006/315479; PCT/JP2006/324484; PCT/JP2009/056718; PCT/JP2010/067560), 또는 변형된 염기를 갖는 모노포스페이트로서 제조된 5'-치환된 단량체 (문헌 [Wang et al., Nucleosides Nucleotides & Nucleic Acids, 2004, 23 (1 & 2), 317-337])를 포함한다.
일부 실시양태에서, 비천연 핵산은 당 고리의 5'-위치 및 2'-위치에서의 변형 (PCT/US94/02993), 예컨대 5'-CH2-치환된 2'-O-보호된 뉴클레오시드 (문헌 [Wu et al., Helvetica Chimica Acta, 2000, 83, 1127-1143] 및 [Wu et al., Bioconjugate Chem. 1999, 10, 921-924])를 포함한다. 일부 경우에, 비천연 핵산은 올리고뉴클레오티드 내로의 혼입을 위해 제조된 아미드 연결된 뉴클레오시드 이량체를 포함하며, 여기서 이량체 내의 3' 연결된 뉴클레오시드 (5'→3')는 2'-OCH3 및 5'-(S)-CH3을 포함한다 (문헌 [(Mesmaeker et al., Synlett, 1997, 1287-1290]). 비천연 핵산은 2'-치환된 5'-CH2 (또는 O) 변형된 뉴클레오시드를 포함할 수 있다 (PCT/US92/01020). 비천연 핵산은 5'-메틸렌포스포네이트 DNA 및 RNA 단량체 및 이량체를 포함할 수 있다 (문헌 [Bohringer et al., Tet. Lett., 1993, 34, 2723-2726]; [Collingwood et al., Synlett, 1995, 7, 703-705]; 및 [Hutter et al., Helvetica Chimica Acta, 2002, 85, 2777-2806]). 비천연 핵산은 2'-치환을 갖는 5'-포스포네이트 단량체 (US2006/0074035) 및 다른 변형된 5'-포스포네이트 단량체 (WO1997/35869)를 포함할 수 있다. 비천연 핵산은 5'-변형된 메틸렌포스포네이트 단량체를 포함할 수 있다 (EP614907 및 EP629633). 비천연 핵산은 5' 및/또는 6'-위치에 히드록실 기를 포함하는 5' 또는 6'-포스포네이트 리보뉴클레오시드의 유사체를 포함할 수 있다 (문헌 [Chen et al., Phosphorus, Sulfur and Silicon, 2002, 777, 1783-1786]; [Jung et al., Bioorg. Med. Chem., 2000, 8, 2501-2509]; [Gallier et al., Eur. J. Org. Chem., 2007, 925-933]; 및 [Hampton et al., J. Med. Chem., 1976, 19(8), 1029-1033]). 비천연 핵산은 5'-포스포네이트 데옥시리보뉴클레오시드 단량체 및 5'-포스페이트 기를 갖는 이량체를 포함할 수 있다 (문헌 [Nawrot et al., Oligonucleotides, 2006, 16(1), 68-82]). 비천연 핵산은 6'-포스포네이트 기를 갖는 뉴클레오시드를 포함할 수 있고, 여기서 5' 또는/및 6'-위치는 비치환되거나, 또는 티오-tert-부틸 기 (SC(CH3)3) (및 그의 유사체); 메틸렌아미노 기 (CH2NH2) (및 그의 유사체) 또는 시아노 기 (CN) (및 그의 유사체)로 치환된다 (문헌 [Fairhurst et al., Synlett, 2001, 4, 467-472]; [Kappler et al., J. Med. Chem., 1986, 29, 1030-1038]; [Kappler et al., J. Med. Chem., 1982, 25, 1179-1184]; [Vrudhula et al., J. Med. Chem., 1987, 30, 888-894]; [Hampton et al., J. Med. Chem., 1976, 19, 1371-1377]; [Geze et al., J. Am. Chem. Soc, 1983, 105(26), 7638-7640]; 및 [Hampton et al., J. Am. Chem. Soc, 1973, 95(13), 4404-4414]).
일부 실시양태에서, 비천연 핵산은 또한 당 모이어티의 변형을 포함한다. 일부 경우에, 핵산은 당 기가 변형된 하나 이상의 뉴클레오시드를 함유한다. 이러한 당 변형된 뉴클레오시드는 증진된 뉴클레아제 안정성, 증가된 결합 친화도 또는 일부 다른 유익한 생물학적 특성을 부여할 수 있다. 특정 실시양태에서, 핵산은 화학적으로 변형된 리보푸라노스 고리 모이어티를 포함한다. 화학적으로 변형된 리보푸라노스 고리의 예는 비제한적으로 치환기 (5' 및/또는 2' 치환기 포함; 비시클릭 핵산 (BNA)을 형성하기 위한 2개의 고리 원자의 가교; 리보실 고리 산소 원자의 S, N(R), 또는 C(R1)(R2) (R = H, C1-C12 알킬 또는 보호기)로의 대체; 및 그의 조합을 포함한다. 화학적으로 변형된 당의 예는 WO2008/101157, US2005/0130923 및 WO2007/134181에서 찾아볼 수 있다.
일부 경우에, 변형된 핵산은 변형된 당 또는 당 유사체를 포함한다. 따라서, 리보스 및 데옥시리보스 이외에도, 당 모이어티는 펜토스, 데옥시펜토스, 헥소스, 데옥시헥소스, 글루코스, 아라비노스, 크실로스, 릭소스 또는 당 "유사체" 시클로펜틸 기일 수 있다. 당은 피라노실 또는 푸라노실 형태일 수 있다. 당 모이어티는 리보스, 데옥시리보스, 아라비노스 또는 2'-O-알킬리보스의 푸라노시드일 수 있고, 당은 [알파] 또는 [베타] 아노머 배위로 각각의 헤테로시클릭 염기에 부착될 수 있다. 당 변형은 2'-알콕시-RNA 유사체, 2'-아미노-RNA 유사체, 2'-플루오로-DNA 및 2'-알콕시- 또는 아미노-RNA/DNA 키메라를 포함하나 이에 제한되지는 않는다. 예를 들어, 당 변형은 2'-O-메틸-우리딘 또는 2'-O-메틸-시티딘을 포함할 수 있다. 당 변형은 2'-O-알킬-치환된 데옥시리보뉴클레오시드 및 2'-O-에틸렌글리콜 유사 리보뉴클레오시드를 포함한다. 이들 당 또는 당 유사체, 및 이러한 당 또는 유사체가 헤테로시클릭 염기 (핵산 염기)에 부착된 각각의 "뉴클레오시드"의 제조는 공지되어 있다. 당 변형이 또한 이루어지고 다른 변형과 조합될 수 있다.
당 모이어티에 대한 변형은 리보스 및 데옥시 리보스의 천연 변형 뿐만 아니라 비천연 변형을 포함한다. 당 변형은 2' 위치에서의 하기 변형을 포함하나 이에 제한되지는 않는다: OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬, 또는 C2 내지 C10 알케닐 및 알키닐일 수 있음). 2' 당 변형은 또한 -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)nONH2, 및 -O(CH2)nON[(CH2)nCH3)]2 (여기서, n 및 m은 1 내지 약 10임)를 포함하나 이에 제한되지는 않는다.
2' 위치에서의 다른 변형은 C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴, O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 유사한 특성을 갖는 다른 치환기를 포함하나 이에 제한되지는 않는다. 유사한 변형이 또한 당 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 또는 2'-5' 연결된 올리고뉴클레오티드 내의 당의 3' 위치, 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 변형된 당은 또한 가교 고리 산소에 변형, 예컨대 CH2를 함유하는 것을 포함하고, 에스. 뉴클레오티드 당 유사체는 또한 펜토푸라노실 당 대신에 당 모방체, 예컨대 시클로부틸 모이어티를 가질 수 있다. 이러한 변형된 당 구조의 제조를 교시하고, 다양한 염기 변형을 상세하게 기재하고 있는 수많은 미국 특허, 예컨대 미국 특허 번호 4,981,957; 5,118,800; 5,319,080; 5,359,044; 5,393,878; 5,446,137; 5,466,786; 5,514,785; 5,519,134; 5,567,811; 5,576,427; 5,591,722; 5,597,909; 5,610,300; 5,627,053; 5,639,873; 5,646,265; 5,658,873; 5,670,633; 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,594,121, 5,596,091; 5,614,617; 5,681,941; 및 5,700,920 (이들 각각은 그 전문이 본원에 참조로 포함됨)이 있다.
변형된 당 모이어티를 갖는 핵산의 예는 비제한적으로 5'-비닐, 5'-메틸 (R 또는 S), 4'-S, 2'-F, 2'-OCH3, 및 2'-O(CH2)2OCH3 치환기를 포함하는 핵산을 포함한다. 2' 위치에서의 치환기는 또한 알릴, 아미노, 아지도, 티오, O-알릴, O-(C1-C10 알킬), OCF3, O(CH2)2SCH3, O(CH2)2-O-N(Rm)(Rn), 및 O-CH2-C(=O)-N(Rm)(Rn)로부터 선택될 수 있고, 여기서 각각의 Rm 및 Rn은 독립적으로 H 또는 치환 또는 비치환된 C1-C10 알킬이다.
특정 실시양태에서, 본원에 기재된 핵산은 하나 이상의 비시클릭 핵산을 포함한다. 특정의 이러한 실시양태에서, 비시클릭 핵산은 4' 및 2' 리보실 고리 원자 사이에 가교를 포함한다. 특정 실시양태에서, 본원에 제공된 핵산은 하나 이상의 비시클릭 핵산을 포함하며, 여기서 가교는 4'→2' 비시클릭 핵산을 포함한다. 이러한 4'→2' 비시클릭 핵산의 예는 화학식: 4'-(CH2)-O-2' (LNA); 4'-(CH2)-S-2'; 4'-(CH2)2-O-2' (ENA); 4'-CH(CH3)-O-2' 및 4'-CH(CH2OCH3)-O-2' 및 그의 유사체 (미국 특허 번호 7,399,845 참조); 4'-C(CH3)(CH3)-O-2' 및 그의 유사체 (WO2009/006478, WO2008/150729, US2004/0171570, 미국 특허 번호 7,427,672, 문헌 [Chattopadhyaya et al., J. Org. Chem., 209, 74, 118-134] 및 WO2008/154401 참조) 중 하나를 포함하나 이에 제한되지는 않는다. 또한, 예를 들어 문헌 [Singh et al., Chem. Commun., 1998, 4, 455-456]; [Koshkin et al., Tetrahedron, 1998, 54, 3607-3630]; [Wahlestedt et al., Proc. Natl. Acad. Sci. U. S. A., 2000, 97, 5633-5638]; [Kumar et al., Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222]; [Singh et al., J. Org. Chem., 1998, 63, 10035-10039]; [Srivastava et al., J. Am. Chem. Soc., 2007, 129(26) 8362-8379]; [Elayadi et al., Curr. Opinion Invens. Drugs, 2001, 2, 558-561]; [Braasch et al., Chem. Biol, 2001, 8, 1-7]; [Oram et al., Curr. Opinion Mol. Ther., 2001, 3, 239-243]; 미국 특허 번호 4,849,513; 5,015,733; 5,118,800; 5,118,802; 7,053,207; 6,268,490; 6,770,748; 6,794,499; 7,034,133; 6,525,191; 6,670,461; 및 7,399,845; 국제 공개 번호 WO2004/106356, WO1994/14226, WO2005/021570, WO2007/090071 및 WO2007/134181; 미국 특허 공개 번호 US2004/0171570, US2007/0287831 및 US2008/0039618; 미국 가출원 번호 60/989,574, 61/026,995, 61/026,998, 61/056,564, 61/086,231, 61/097,787 및 61/099,844; 및 국제 출원 번호 PCT/US2008/064591, PCT US2008/066154, PCT US2008/068922 및 PCT/DK98/00393을 참조한다.
특정 실시양태에서, 핵산은 연결된 핵산을 포함한다. 핵산은 임의의 핵산간 연결을 사용하여 함께 연결될 수 있다. 핵산간 연결기의 2가지 주요 부류는 인 원자의 존재 또는 부재에 의해 정의된다. 대표적인 인 함유 핵산간 연결은 포스포디에스테르, 포스포트리에스테르, 메틸포스포네이트, 포스포르아미데이트 및 포스포로티오에이트 (P=S)를 포함하나 이에 제한되지는 않는다. 대표적인 비-인 함유 핵산간 연결기는 메틸렌메틸이미노 (-CH2-N(CH3)-O-CH2-), 티오디에스테르 (-O-C(O)-S-), 티오노카르바메이트 (-O-C(O)(NH)-S-); 실록산 (-O-Si(H)2-O-); 및 N,N*-디메틸히드라진 (-CH2-N(CH3)-N(CH3))을 포함하나 이에 제한되지는 않는다. 특정 실시양태에서, 키랄 원자를 갖는 핵산간 연결은 라세미 혼합물로서, 개별 거울상이성질체, 예를 들어 알킬포스포네이트 및 포스포로티오에이트로서 제조될 수 있다. 비천연 핵산은 단일 변형을 함유할 수 있다. 비천연 핵산은 모이어티 중 하나 내에 또는 상이한 모이어티 사이에 다중 변형을 함유할 수 있다.
핵산에 대한 백본 포스페이트 변형은 메틸 포스포네이트, 포스포로티오에이트, 포스포르아미데이트 (가교 또는 비-가교), 포스포트리에스테르, 포스포로디티오에이트, 포스포디티오에이트 및 보라노포스페이트를 포함하나 이에 제한되지는 않고, 임의의 조합으로 사용될 수 있다. 다른 비-포스페이트 연결이 또한 사용될 수 있다.
일부 실시양태에서, 백본 변형 (예를 들어, 메틸포스포네이트, 포스포로티오에이트, 포스포로아미데이트 및 포스포로디티오에이트 뉴클레오티드간 연결)은 변형된 핵산에 면역조정 활성을 부여하고/거나 생체내에서 그의 안정성을 증진시킬 수 있다.
일부 경우에, 인 유도체 (또는 변형된 포스페이트 기)는 당 또는 당 유사체 모이어티에 부착되고, 모노포스페이트, 디포스페이트, 트리포스페이트, 알킬포스포네이트, 포스포로티오에이트, 포스포로디티오에이트, 포스포르아미데이트 등일 수 있다. 변형된 포스페이트 연결 또는 비-포스페이트 연결을 함유하는 예시적인 폴리뉴클레오티드는 문헌 [Peyrottes et al., 1996, Nucleic Acids Res. 24: 1841-1848]; [Chaturvedi et al., 1996, Nucleic Acids Res. 24:2318-2323]; 및 [Schultz et al., (1996) Nucleic Acids Res. 24:2966-2973]; [Matteucci, 1997, "Oligonucleotide Analogs: an Overview" in Oligonucleotides as Therapeutic Agents, (Chadwick and Cardew, ed.) John Wiley and Sons, New York, NY]; [Zon, 1993, "Oligonucleoside Phosphorothioates" in Protocols for Oligonucleotides and Analogs, Synthesis and Properties, Humana Press, pp. 165-190]; [Miller et al., 1971, JACS 93:6657-6665; Jager et al., 1988, Biochem. 27:7247-7246]; [Nelson et al., 1997, JOC 62:7278-7287]; 미국 특허 번호 5,453,496; 및 문헌 [Micklefield, 2001, Curr. Med. Chem. 8: 1157-1179]에서 찾아볼 수 있다.
일부 경우에, 백본 변형은 포스포디에스테르 연결을 대안적 모이어티, 예컨대 음이온성, 중성 또는 양이온성 기로 대체하는 것을 포함한다. 이러한 변형의 예는 음이온성 뉴클레오시드간 연결; N3'→P5' 포스포르아미데이트 변형; 보라노포스페이트 DNA; 프로올리고뉴클레오티드; 중성 뉴클레오시드간 연결, 예컨대 메틸포스포네이트; 아미드 연결된 DNA; 메틸렌 (메틸이미노) 연결; 포름아세탈 및 티오포름아세탈 연결; 술포닐 기를 함유하는 백본; 모르폴리노 올리고; 펩티드 핵산 (PNA); 및 양으로 하전된 데옥시리보핵산 구아니딘 (DNG) 올리고 (문헌 [Micklefield, 2001, Current Medicinal Chemistry 8: 1157-1179])를 포함한다. 변형된 핵산은 하나 이상의 변형, 예를 들어 포스페이트 연결의 조합, 예컨대 포스포디에스테르 및 포스포로티오에이트 연결의 조합을 포함하는 키메라 또는 혼합된 백본을 포함할 수 있다.
포스페이트에 대한 치환체는, 예를 들어 단쇄 알킬 또는 시클로알킬 뉴클레오시드간 연결, 혼합된 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결을 포함한다. 이들은 모르폴리노 연결 (부분적으로 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌히드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본을 갖는 것들; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 다른 것들을 포함한다. 수많은 미국 특허가 이들 유형의 포스페이트 대체물을 제조하고 사용하는 방법을 개시하고 있으며, 미국 특허 번호 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 및 5,677,439를 포함하나 이에 제한되지는 않는다. 뉴클레오티드 치환체에서, 뉴클레오티드의 당 및 포스페이트 모이어티 둘 다는 예를 들어 아미드 유형 연결 (아미노에틸글리신) (PNA)에 의해 대체될 수 있는 것으로 또한 이해된다. 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262는 PNA 분자의 제조 및 사용 방법을 교시하며, 이들 각각은 본원에 참조로 포함된다. 또한, 문헌 [Nielsen et al., Science, 1991, 254, 1497-1500]을 참조한다. 다른 유형의 분자 (접합체)를 뉴클레오티드 또는 뉴클레오티드 유사체에 연결하여, 예를 들어 세포 흡수를 증진시키는 것이 또한 가능하다. 접합체는 뉴클레오티드 또는 뉴클레오티드 유사체에 화학적으로 연결될 수 있다. 이러한 접합체는 지질 모이어티, 예컨대 콜레스테롤 모이어티 (문헌 [Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556]), 콜산 (문헌 [Manoharan et al., Bioorg. Med. Chem. Let., 1994, 4, 1053-1060]), 티오에테르, 예를 들어 헥실-S-트리틸티올 (문헌 [Manoharan et al., Ann. KY. Acad. Sci., 1992, 660, 306-309]; [Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765-2770]), 티오콜레스테롤 (문헌 [Oberhauser et al., Nucl. Acids Res., 1992, 20, 533-538]), 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 (문헌 [Saison-Behmoaras et al., EM5OJ, 1991, 10, 1111-1118]; [Kabanov et al., FEBS Lett., 1990, 259, 327-330]; [Svinarchuk et al., Biochimie, 1993, 75, 49-54]), 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1-디-O-헥사데실-rac-글리세로-S-H-포스포네이트 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654]; [Shea et al., Nucl. Acids Res., 1990, 18, 3777-3783]), 폴리아민 또는 폴리에틸렌 글리콜 쇄 (문헌 [Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969-973]), 또는 아다만탄 아세트산 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654]), 팔미틸 모이어티 (문헌 [Mishra et al., Biochem. Biophys. Acta, 1995, 1264, 229-237]), 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티 (문헌 [Crooke et al., J. Pharmacol. Exp. Ther., 1996, 277, 923-937])를 포함하나 이에 제한되지는 않는다. 다수의 미국 특허가 이러한 접합체의 제조를 교시하고 있으며, 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941을 포함하나 이에 제한되지는 않는다.
비천연 아미노산의 단백질로의 복제, 전사, 번역 및 혼입을 위한 조성물 및 방법에 사용되는 핵염기가 본원에 기재된다. 일부 실시양태에서, 본원에 기재된 핵염기는 다음 구조를 포함한다:
Figure pct00010
, 여기서 각각의 X는 독립적으로 탄소 또는 질소이고; R2는 임의로 및 존재하는 경우, 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고; 각각의 Y는 독립적으로 황, 산소, 셀레늄 또는 2급 아민이고; 각각의 E는 독립적으로 산소, 황 또는 셀레늄이고; 파선은 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 임의로 α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기를 포함하는 모노-포스페이트, 디포스페이트 또는 트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다. 일부 실시양태에서, R2는 저급 알킬 (예를 들어, C1-C6), 수소 또는 할로겐이다. 본원에 기재된 핵염기의 일부 실시양태에서, R2는 플루오로이다. 본원에 기재된 핵염기의 일부 실시양태에서, X는 탄소이다. 본원에 기재된 핵염기의 일부 실시양태에서, E는 황이다. 본원에 기재된 핵염기의 일부 실시양태에서, Y는 황이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 구조
Figure pct00011
를 갖는다. 본원에 기재된 핵염기의 일부 실시양태에서, E는 황이고, Y는 황이다. 본원에 기재된 핵염기의 일부 실시양태에서, 파선은 리보실 또는 데옥시리보실 모이어티에 대한 결합 지점을 나타낸다. 본원에 기재된 핵염기의 일부 실시양태에서, 파선은 트리포스페이트 기에 연결된 리보실 또는 데옥시리보실 모이어티에 결합하는 지점을 나타낸다. 일부 실시양태에서, 본원에 기재된 핵염기는 핵산 중합체의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 tRNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 tRNA 내의 안티코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 mRNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 mRNA의 코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 RNA 또는 DNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 DNA 내의 코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 또 다른 상보적 핵염기와 핵염기 쌍을 형성한다.
핵산 염기 쌍형성 특성
일부 실시양태에서, 비천연 뉴클레오티드는 DNA 또는 RNA 내로의 혼입 동안 또는 후에 또 다른 비천연 뉴클레오티드와 염기 쌍 (비천연 염기 쌍; UBP)을 형성한다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 또 다른 핵산, 예를 들어 천연 또는 비천연 핵산과 염기 쌍을 형성할 수 있는 비천연 핵산이다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 또 다른 비천연 핵산과 염기 쌍 (비천연 핵산 염기 쌍 (UBP))을 형성할 수 있는 비천연 핵산이다. 예를 들어, 제1 비천연 핵산은 제2 비천연 핵산과 염기 쌍을 형성할 수 있다. 예를 들어, 핵산으로의 혼입 동안 및 후에 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 (d)5SICS의 트리포스페이트 ((d)5SICSTP) 및 (d)NaM의 트리포스페이트 ((d)NaMTP)를 포함한다. 다른 예는 (d)CNMO의 트리포스페이트 ((d)CNMOTP) 및 (d)TPT3의 트리포스페이트 ((d)TPT3TP)를 포함하나 이에 제한되지는 않는다. 이러한 비천연 뉴클레오티드는 리보스 또는 데옥시리보스 당 모이어티 ("(d)"로 표시됨)를 가질 수 있다. 예를 들어, 핵산 내로 혼입될 때 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 TAT1의 트리포스페이트 (TAT1TP) 및 NaM의 트리포스페이트 (NaMTP)를 포함한다. 일부 실시양태에서, 핵산에 혼입되는 경우에 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 dCNMO의 트리포스페이트 (dCNMOTP) 및 TAT1의 트리포스페이트 (TAT1TP)를 포함한다. 일부 실시양태에서, 핵산에 혼입될 때 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 dTPT3의 트리포스페이트 (dTPT3TP) 및 NaM의 트리포스페이트 (NaMTP)를 포함한다. 일부 실시양태에서, 비천연 핵산은 천연 핵산 (A, T, G, C)과 염기 쌍을 실질적으로 형성하지 않는다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 천연 핵산과 염기 쌍을 형성할 수 있다.
일부 실시양태에서, 안정하게 통합된 비천연 (데옥시)리보뉴클레오티드는, UBP를 형성할 수 있지만 각각의 임의의 천연 (데옥시)리보뉴클레오티드와 염기 쌍을 실질적으로 형성하지 않는 비천연 (데옥시)리보뉴클레오티드이다. 일부 실시양태에서, 안정하게 통합된 비천연 (데옥시)리보뉴클레오티드는, UBP를 형성할 수 있지만 하나 이상의 천연 핵산과 염기 쌍을 실질적으로 형성하지 않는 비천연 (데옥시)리보뉴클레오티드이다. 예를 들어, 안정하게 통합된 비천연 핵산은 A, T 및 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A, T 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C, G 및 A와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C, G 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C 및 T와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T 및 A와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 T 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A, T 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, T 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, A 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, T 및 A와 염기 쌍을 형성할 수 있다.
생체내 조건 하에 비천연 DNA 또는 RNA 염기 쌍 (UBP)을 형성할 수 있는 예시적인 비천연 뉴클레오티드는 5SICS, d5SICS, NaM, dNaM, dTPT3, dMTMO, dCNMO, TAT1 및 그의 조합을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 비천연 뉴클레오티드 염기 쌍은
Figure pct00012
을 포함하나 이에 제한되지는 않는다.
조작된 유기체
일부 실시양태에서, 본원에 개시된 방법 및 플라스미드는 조작된 유기체, 예를 들어 비천연 뉴클레오티드 또는 비천연 핵산 염기 쌍 (UBP)을 혼입 및 복제하고 또한 비천연 뉴클레오티드를 함유하는 핵산을 사용하여 적어도 1개의 비천연 아미노산 잔기를 함유하는 비천연 폴리펩티드 또는 비천연 단백질을 번역하는데 사용되는 mRNA 및 tRNA를 전사할 수 있는 유기체를 생성하는데 추가로 사용된다. 일부 경우에, 비천연 아미노산 잔기는 부위-특이적 방식으로 비천연 폴리펩티드 또는 비천연 단백질에 혼입된다. 일부 경우에, 유기체는 비-인간 반합성 유기체 (SSO)이다. 일부 경우에, 유기체는 반합성 유기체 (SSO)이다. 일부 경우에, SSO는 세포이다. 일부 경우에, 생체내 방법은 반합성 유기체 (SSO)를 포함한다. 일부 경우에, 반합성 유기체는 미생물을 포함한다. 일부 경우에, 유기체는 박테리아를 포함한다. 일부 경우에, 유기체는 그람-음성 박테리아를 포함한다. 일부 경우에, 유기체는 그람-양성 박테리아를 포함한다. 일부 경우에, 유기체는 에스케리키아 콜라이를 포함한다. 이러한 변형된 유기체는 추가의 성분, 예컨대 DNA 복구 기구, 변형된 폴리머라제, 뉴클레오티드 수송체, 또는 다른 성분을 다양하게 포함한다. 일부 경우에, SSO는 이. 콜라이 균주 YZ3을 포함한다. 일부 경우에, SSO는 이. 콜라이 균주 ML1 또는 ML2, 예컨대 문헌 [Ledbetter, et al. J. Am Chem. Soc. 2018, 140(2), 758]의 도 1 (B-D)에 기재된 균주를 포함한다. 일부 경우에, SSO는 세포주이다. 일부 경우에, 세포주는 불멸화 세포주이다. 일부 경우에, 세포주는 1차 세포를 포함한다. 일부 경우에, 세포주는 줄기 세포를 포함한다. 일부 경우에, SSO는 유사기관이다.
일부 경우에, 사용된 세포는 이종 단백질, 예를 들어 비천연 뉴클레오시드 트리포스페이트를 세포 내로 수송할 수 있는 뉴클레오시드 트리포스페이트 수송체를 코딩하는 발현 카세트, 및 임의로 비천연 뉴클레오티드를 상실한 DNA를 제거하기 위한 CRISPR/Cas9 시스템 (예를 들어, 이. 콜라이 균주 YZ3, ML1 또는 ML2)으로 유전자 형질전환된다. 일부 경우에, 세포는 비천연 핵산 흡수에 대한 증진된 활성을 추가로 포함한다. 일부 경우에, 세포는 비천연 핵산 유입에 대한 증진된 활성을 추가로 포함한다.
일부 실시양태에서, Cas9 및 적절한 가이드 RNA (sgRNA)는 별개의 플라스미드 상에 코딩된다. 일부 경우에, Cas9 및 sgRNA는 동일한 플라스미드 상에 코딩된다. 일부 경우에, Cas9, sgRNA를 코딩하는 핵산 분자, 또는 비천연 뉴클레오티드를 포함하는 핵산 분자는 하나 이상의 플라스미드 상에 위치한다. 일부 경우에, Cas9는 제1 플라스미드 상에 코딩되고, sgRNA 및 비천연 뉴클레오티드를 포함하는 핵산 분자는 제2 플라스미드 상에 코딩된다. 일부 경우에, Cas9, sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자는 동일한 플라스미드 상에 코딩된다. 일부 경우에, 핵산 분자는 2개 이상의 비천연 뉴클레오티드를 포함한다. 일부 경우에, Cas9는 숙주 유기체의 게놈 내로 혼입되고, sgRNA는 플라스미드 상에 또는 유기체의 게놈 내에 코딩된다.
일부 경우에, Cas9 및 sgRNA를 코딩하는 제1 플라스미드 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 제2 플라스미드는 조작된 미생물 내로 도입된다. 일부 경우에, Cas9를 코딩하는 제1 플라스미드, 및 sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 제2 플라스미드는 조작된 미생물 내로 도입된다. 일부 경우에, Cas9, sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 플라스미드가 조작된 미생물 내로 도입된다. 일부 경우에, 핵산 분자는 2개 이상의 비천연 뉴클레오티드를 포함한다.
일부 실시양태에서, 그의 DNA (플라스미드 또는 게놈) 내에 적어도 1개의 비천연 염기 쌍 (UBP)을 포함하는 적어도 1개의 비천연 핵산 분자가 혼입된 살아있는 세포가 생성된다. 일부 경우에, 적어도 1개의 비천연 핵산 분자는 1, 2, 3, 4개 또는 그 초과의 UBP를 포함한다. 일부 경우에, 적어도 1개의 비천연 핵산 분자는 플라스미드이다. 일부 경우에, 적어도 1개의 비천연 핵산 분자는 세포의 게놈 내로 통합된다. 일부 실시양태에서, 적어도 1개의 비천연 핵산 분자는 비천연 폴리펩티드 또는 비천연 단백질을 코딩한다. 일부 경우에, 적어도 1개의 비천연 핵산 분자는 전사되어 mRNA의 비천연 코돈 및 tRNA의 비천연 안티코돈을 제공한다. 일부 실시양태에서, 적어도 1개의 비천연 핵산 분자는 비천연 DNA 분자이다.
일부 경우에, 비천연 염기 쌍은, 비천연 상호 염기-쌍형성 뉴클레오티드가 각각의 트리포스페이트로서 뉴클레오티드 트리포스페이트 수송체의 작용에 의해 세포 내로 흡수되는 경우, 생체내 조건 하에 비천연 염기 쌍을 형성할 수 있는 한 쌍의 비천연 상호 염기-쌍형성 뉴클레오티드를 포함한다. 뉴클레오티드 트리포스페이트 수송체가 발현되고 비천연 뉴클레오티드를 세포 내로 수송하는데 이용가능하도록, 뉴클레오티드 트리포스페이트 수송체를 코딩하는 발현 카세트에 의해 세포가 유전자 형질전환될 수 있다. 세포는 원핵 또는 진핵 세포일 수 있고, 비천연 상호 염기-쌍형성 뉴클레오티드의 쌍은 그의 각각의 트리포스페이트로서 dTPT3의 트리포스페이트 (dTP3TP) 및 dNaM의 트리포스페이트 (dNaMTP) 또는 dCNMO (dCNMOTP)일 수 있다.
일부 실시양태에서, 세포는 핵산, 예를 들어 이러한 비천연 뉴클레오티드를 세포 내로 수송할 수 있는 뉴클레오티드 트리포스페이트 수송체를 코딩하는 발현 카세트로 유전자 형질전환된 세포이다. 세포는 이종 뉴클레오시드 트리포스페이트 수송체를 포함할 수 있으며, 여기서 이종 뉴클레오시드 트리포스페이트 수송체는 천연 및 비천연 뉴클레오시드 트리포스페이트를 세포 내로 수송할 수 있다.
일부 경우에, 본원에 기재된 방법은 또한 유전자 형질전환된 세포를 인산칼륨 및/또는 포스파타제 또는 뉴클레오티다제의 억제제의 존재 하에 각각의 트리포스페이트와 접촉시키는 것을 포함한다. 이러한 접촉 동안 또는 후에, 세포는 세포의 성장 및 복제에 적합한 생명-지지 배지 내에 배치될 수 있다. 세포는 비천연 뉴클레오티드의 각각의 트리포스페이트 형태가 세포의 적어도 1회의 복제 주기를 통해 세포 내의 핵산으로 혼입되도록 생명-지지 배지에서 유지될 수 있다. 각각의 트리포스페이트로서 비천연 상호 염기-쌍형성 뉴클레오티드의 쌍은 dTPT3의 트리포스페이트 (또는 dTPT3TP) 및 dCNMO 또는 dNaM의 트리포스페이트 (dCNOM 또는 dNaMTP)를 포함할 수 있고, 세포는 이. 콜라이일 수 있고, dTPT3TP 및 dNaMTP는 수송체 PtNTT2에 의해 이. 콜라이 내로 유입될 수 있고, 여기서 이. 콜라이 폴리머라제, 예컨대 Pol III 또는 Pol II는 UBP를 함유하는 DNA를 복제하기 위해 비천연 트리포스페이트를 사용할 수 있고, 이에 의해 비천연 뉴클레오티드 및/또는 비천연 염기 쌍을 세포 환경 내의 세포 핵산 내로 혼입시킬 수 있다. 추가로, 리보뉴클레오티드, 예컨대 NaMTP 및 TAT1TP, 5FMTP 및 TPT3TP는 일부 경우에 수송체 PtNTT2에 의해 이. 콜라이로 유입된다. 일부 경우에, 리보뉴클레오티드를 유입시키기 위한 PtNTT2는 말단절단된 PtNTT2이며, 여기서 말단절단된 PtNTT2는 비말단절단된 PtNTT2의 아미노산 서열에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 비말단절단된 PtNTT2 (NCBI 수탁 번호 EEC49227.1, GI:217409295)의 예는 하기 아미노산 서열 (서열식별번호: 1)을 갖는다:
Figure pct00013
3개 이상의 비천연 염기-쌍형성 뉴클레오티드의 사용을 포함하는 조성물 및 방법이 본원에 기재된다. 이러한 염기 쌍형성 뉴클레오티드는 일부 경우에 뉴클레오티드 수송체의 사용을 통해 또는 관련 기술분야에 공지된 표준 핵산 형질전환 방법 (예를 들어, 전기천공, 화학적 형질전환 또는 다른 방법)을 통해 세포에 진입한다. 일부 경우에, 염기 쌍형성 비천연 뉴클레오티드는 폴리뉴클레오티드, 예컨대 플라스미드의 일부로서 세포에 진입한다. 폴리뉴클레오티드 (RNA 또는 DNA)의 일부로서 세포에 진입하는 1개 이상의 염기 쌍형성 비천연 뉴클레오티드는 그 자체가 생체내에서 복제될 필요는 없다. 예를 들어, 제1 비천연 염기 쌍을 형성하도록 구성된 염기를 갖는 제1 비천연 데옥시리보뉴클레오티드 및 제2 비천연 데옥시리보뉴클레오티드를 포함하는 이중-가닥 DNA 플라스미드 또는 다른 핵산은 세포 내로 전기천공된다. 세포 배지는 서로 제2 비천연 염기 쌍을 형성하도록 구성된 염기를 갖는 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드로 처리되고, 여기서 제1 비천연 데옥시리보뉴클레오티드의 염기 및 제3 비천연 데옥시리보뉴클레오티드의 염기는 제2 비천연 염기 쌍을 형성하고, 제2 비천연 데옥시리보뉴클레오티드의 염기 및 제4 비천연 데옥시리보뉴클레오티드의 염기는 제3 비천연 염기 쌍을 형성한다. 일부 경우에, 원래 형질전환된 이중-가닥 DNA 플라스미드의 생체내 복제는 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드를 포함하는 후속 복제된 플라스미드를 생성한다. 대안적으로 또는 조합하여, 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드의 리보뉴클레오티드 변이체를 세포 배지에 첨가한다. 이들 리보뉴클레오티드는 일부 예에서 RNA, 예컨대 mRNA 또는 tRNA 내로 혼입된다. 일부 경우에, 제1, 제2, 제3 및 제4 데옥시뉴클레오티드는 상이한 염기를 포함한다. 일부 경우에, 제1, 제3 및 제4 데옥시뉴클레오티드는 상이한 염기를 포함한다. 일부 경우에, 제1 및 제3 데옥시뉴클레오티드는 동일한 염기를 포함한다.
본 개시내용의 방법의 실시에 의해, 관련 기술분야의 통상의 기술자는 개별 세포의 적어도 일부 내에서 유지되는 적어도 하나의 핵산 내에 적어도 하나의 비천연 뉴클레오티드 및/또는 적어도 1개의 비천연 염기 쌍 (UBP)을 갖는 살아있고 번식하는 세포의 집단을 얻을 수 있고, 여기서 적어도 하나의 핵산은 세포 내에서 안정하게 번식되고, 세포는 유기체의 성장 및 복제에 적합한 생명-지지 배지 내에서 비천연 뉴클레오티드(들)와 접촉될 때 (예를 들어, 그의 존재 하에 성장될 때) 하나 이상의 비천연 뉴클레오티드의 트리포스페이트 형태의 세포 흡수를 제공하기에 적합한 뉴클레오티드 트리포스페이트 수송체를 발현한다.
뉴클레오티드 트리포스페이트 수송체에 의한 세포 내로의 수송 후에, 비천연 염기-쌍형성 뉴클레오티드는 세포 기구, 예를 들어 세포 자신의 DNA 및/또는 RNA 폴리머라제, 이종 폴리머라제 또는 방향적 진화를 사용하여 진화된 폴리머라제에 의해 세포 내의 핵산 내로 혼입된다 (문헌 [Chen T, Romesberg FE, FEBS Lett. 2014 Jan 21;588(2):219-29]; [Betz K et al., J Am Chem Soc. 2013 Dec 11;135(49):18637-43]). 비천연 뉴클레오티드는 세포 핵산, 예컨대 게놈 DNA, 게놈 RNA, mRNA, tRNA, 구조 (RNA), 마이크로RNA, 및 자율 복제 핵산 (예를 들어, 플라스미드, 바이러스 또는 벡터) 내로 혼입될 수 있다.
일부 경우에, 유전자 조작된 세포는 핵산, 예를 들어 이종 핵산을 세포 내로 도입함으로써 생성된다. 일부 예에서, 세포 내로 도입되는 핵산은 플라스미드의 형태이다. 일부 경우에, 세포 내로 도입되는 핵산은 세포의 게놈 내로 통합된다. 본원에 기재된 임의의 세포는 숙주 세포일 수 있고, 발현 벡터를 포함할 수 있다. 한 실시양태에서, 숙주 세포는 원핵 세포이다. 또 다른 실시양태에서, 숙주 세포는 이. 콜라이이다. 일부 실시양태에서, 세포는 하나 이상의 이종 폴리뉴클레오티드를 포함한다. 핵산 시약은 다양한 기술을 사용하여 미생물 내로 도입될 수 있다. 이종 핵산을 다양한 유기체 내로 도입하는데 사용되는 방법의 비제한적 예는 형질전환, 형질감염, 형질도입, 전기천공, 초음파-매개 형질전환, 접합, 입자 충격 등을 포함한다. 일부 경우에, 담체 분자 (예를 들어, 비스-벤조이미다졸릴 화합물, 예를 들어 미국 특허 번호 5,595,899)의 첨가가 통상적인 방법에 의해 형질전환시키기 어려운 것으로 전형적으로 여겨지는 세포에서 DNA의 흡수를 증가시킬 수 있다. 통상적인 형질전환 방법은 관련 기술분야의 통상의 기술자가 쉽게 이용할 수 있고, 문헌 [Maniatis, T., E. F. Fritsch and J. Sambrook (1982) Molecular Cloning: a Laboratory Manual; Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.]에서 찾을 수 있다.
일부 경우에, 유전자 형질전환은, 이로 제한되지는 않지만 플라스미드, 바이러스 벡터, 바이러스 핵산, 파지 핵산, 파지, 코스미드 및 인공 염색체 내의 발현 카세트의 직접적인 전달을 사용하거나, 또는 세포 또는 담체 예컨대 양이온성 리포솜 내의 유전자 물질의 전달을 통해 얻어진다. 이러한 방법은 관련 기술분야에서 이용가능하고, 본원에 기재된 방법에 사용하기 위해 용이하게 적합화될 수 있다. 전달 벡터는 유전자를 세포 내로 전달하는데 사용되는 임의의 뉴클레오티드 구축물 (예를 들어, 플라스미드)일 수 있거나, 또는 유전자를 전달하는 일반적 전략의 일부로서, 예를 들어 재조합 레트로바이러스 또는 아데노바이러스의 일부로서 사용될 수 있다 (문헌 [Ram et al. Cancer Res. 53:83-88, (1993)]). 바이러스 벡터, 화학적 형질감염체 또는 물리-기계적 방법, 예컨대 전기천공 및 DNA의 직접 확산을 비롯한 형질감염을 위한 적절한 수단은, 예를 들어 문헌 [Wolff, J. A., et al., Science, 247, 1465-1468, (1990)]; 및 [Wolff, J. A. Nature, 352, 815-818, (1991)]에 기재되어 있다.
예를 들어, 뉴클레오시드 트리포스페이트 수송체 또는 폴리머라제 발현 카세트 및/또는 벡터를 코딩하는 DNA는 칼슘-매개 형질전환, 전기천공, 미세주사, 리포펙션, 입자 충격 등을 포함하나 이에 제한되지는 않는 임의의 방법에 의해 세포에 도입될 수 있다.
일부 경우에, 세포는 세포 내의 하나 이상의 핵산에 혼입된 비천연 뉴클레오시드 트리포스페이트를 포함한다. 예를 들어, 세포는 세포 내에서 유지되는 DNA 또는 RNA 내에 적어도 하나의 비천연 뉴클레오티드를 혼입시킬 수 있는 살아있는 세포일 수 있다. 세포는 또한 한 쌍의 비천연 상호 염기-쌍형성 뉴클레오티드를 포함하는 적어도 1개의 비천연 염기 쌍 (UBP)을 생체내 조건 하에 세포 내의 핵산 내로 혼입시킬 수 있고, 여기서 비천연 상호 염기-쌍형성 뉴클레오티드, 예를 들어 그의 각각의 트리포스페이트는 뉴클레오시드 트리포스페이트 수송체의 작용에 의해 세포 내로 흡수되고, 그에 대한 유전자는 유전자 형질전환에 의해 세포 내에 존재한다 (예를 들어, 도입되었다). 예를 들어, 세포 내에서 유지되는 핵산으로의 혼입시 dTPT3 및 dCNMO는, 예를 들어 dTPT3TP 및 dCNMOTP를 포함하는 생명-지지 배지에서 성장할 때 유기체의 DNA 복제 기구에 의해 안정하게 증식될 수 있는 안정한 비천연 염기 쌍을 형성할 수 있다.
일부 경우에, 세포는 비천연 뉴클레오티드를 함유하는 핵산을 복제할 수 있다. 이러한 방법은 생체내 조건 하에 하나 이상의 비천연 뉴클레오티드를 각각의 트리포스페이트로서 세포 내로 수송할 수 있는 뉴클레오시드 트리포스페이트 수송체를 코딩하는 발현 카세트로 세포를 유전자 형질전환시키는 것을 포함할 수 있다. 대안적으로, 코딩된 뉴클레오시드 트리포스페이트 수송체를 발현할 수 있는 발현 카세트로 이전에 유전자 형질전환된 세포가 사용될 수 있다. 방법은 또한 세포의 성장 및 복제에 적합한 생명-지지 배지에서 유전자 형질전환된 세포를 인산칼륨 및 적어도 하나의 비천연 뉴클레오티드 (예를 들어, 비천연 염기 쌍 (UBP)을 형성할 수 있는 2개의 상호 염기 쌍형성 뉴클레오티드)의 각각의 트리포스페이트 형태에 접촉시키거나 노출시키는 단계, 및 세포의 적어도 1회의 복제 주기를 통해 생체내 조건 하에 적어도 하나의 비천연 뉴클레오티드 (예를 들어, 비천연 염기 쌍 (UBP)을 형성할 수 있는 2개의 상호 염기 쌍형성 뉴클레오티드)의 각각의 트리포스페이트 형태의 존재 하에 생명-지지 배지에서 형질전환된 세포를 유지하는 단계를 포함할 수 있다.
일부 실시양태에서, 세포는 안정하게 혼입된 비천연 핵산을 포함한다. 일부 실시양태는 A, G, T 및 C 이외의 뉴클레오티드를 세포 내에서 유지되는 핵산 내에 안정하게 혼입시킨 세포 (예를 들어, 이. 콜라이로서)를 포함한다. 예를 들어, A, G, T 및 C 이외의 뉴클레오티드는 d5SICS, dCNMO, dNaM 및/또는 dTPT3일 수 있고, 이는 세포의 핵산 내로의 혼입 시 핵산 내에서 안정한 비천연 염기 쌍을 형성할 수 있다. 한 측면에서, 트리포스페이트 수송체에 대한 유전자로 형질전환된 유기체가 인산칼륨 및 d5SICS, dNaM, dCNMO 및/또는 dTPT3의 트리포스페이트 형태를 포함하는 생명-지지 배지에서 성장될 때, 비천연 뉴클레오티드 및 비천연 염기 쌍이 유기체의 복제 장치에 의해 안정적으로 증식될 수 있다.
일부 경우에, 세포는 확장된 유전자 알파벳을 포함한다. 세포는 안정하게 혼입된 비천연 핵산을 포함할 수 있다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 또 다른 비천연 뉴클레오티드와 쌍형성할 수 있는 비천연 뉴클레오티드를 함유하는 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 또 다른 핵산에 수소 결합된 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 염기 쌍형성된 또 다른 핵산에 수소 결합되지 않은 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 소수성 및/또는 패킹 상호작용을 통해 핵염기 또는 또 다른 비천연 뉴클레오티드와 염기 쌍을 형성하는 핵염기를 갖는 비천연 뉴클레오티드를 함유하는 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 비-수소 결합 상호작용을 통해 또 다른 핵산과 염기 쌍을 형성하는 비천연 핵산을 포함한다. 확장된 유전자 알파벳을 갖는 세포는 상동성 핵산을 카피하여 비천연 핵산을 포함하는 핵산을 형성할 수 있는 세포일 수 있다. 확장된 유전자 알파벳을 갖는 세포는 또 다른 비천연 핵산과 쌍형성된 비천연 핵산 염기 (비천연 핵산 염기 쌍 (UBP))를 포함하는 세포일 수 있다.
일부 실시양태에서, 세포는 생체내 조건 하에 도입된 비천연 뉴클레오티드로부터 비천연 DNA 염기 쌍 (UBP)을 형성한다. 일부 실시양태에서, 인산칼륨 및/또는 포스파타제 및/또는 뉴클레오티다제 활성의 억제제는 비천연 뉴클레오티드의 수송을 용이하게 할 수 있다. 방법은 이종 뉴클레오시드 트리포스페이트 수송체를 발현하는 세포의 사용을 포함한다. 이러한 세포가 하나 이상의 뉴클레오시드 트리포스페이트와 접촉되는 경우, 뉴클레오시드 트리포스페이트는 세포 내로 수송된다. 세포는 인산칼륨 및/또는 포스파타제 및 뉴클레오티다제의 억제제의 존재 하에 있을 수 있다. 비천연 뉴클레오시드 트리포스페이트는 세포의 천연 기구 (즉, 폴리머라제), 및 예를 들어, 세포의 핵산 내에 비천연 염기 쌍을 형성하는 상호 염기-쌍에 의해 세포 내의 핵산 내로 혼입될 수 있다. 일부 실시양태에서, UBP는 비천연 염기를 보유하는 DNA 및 RNA 뉴클레오티드 사이에 형성된다.
일부 실시양태에서, UBP는 비천연 트리포스페이트에 노출될 때 세포 또는 세포의 집단 내로 혼입될 수 있다. 일부 실시양태에서, UBP는 비천연 트리포스페이트에 실질적으로 일관되게 노출될 때 세포 또는 세포의 집단 내로 혼입될 수 있다.
일부 실시양태에서, 세포에서 이종 유전자, 예를 들어 뉴클레오시드 트리포스페이트 수송체 (NTT)의 발현의 유도는 이종 유전자의 발현의 유도가 없는 세포에서의 하나 이상의 비천연 트리포스페이트의 성장 및 흡수와 비교하여 보다 느린 세포 성장 및 증가된 비천연 트리포스페이트 흡수를 발생시킬 수 있다. 흡수는 예컨대 확산, 삼투를 통한 또는 수송체의 작용을 통한 세포 내로의 뉴클레오티드의 수송을 다양하게 포함한다. 일부 실시양태에서, 세포에서 이종 유전자, 예를 들어 NTT의 발현의 유도는 이종 유전자의 발현의 유도가 없는 세포의 성장 및 흡수와 비교하여 증가된 세포 성장 및 증가된 비천연 핵산 흡수를 유발할 수 있다.
일부 실시양태에서, UBP는 로그 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 비-로그 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 실질적으로 선형 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 일정 기간 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입된다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 50회 또는 그 초과의 복제 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24시간의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31일의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개월의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 50년의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다.
일부 실시양태에서, 세포는 하나 이상의 비천연 뉴클레오티드를 함유하는 mRNA를 생성하기 위해 RNA 폴리머라제를 추가로 이용한다. 일부 경우에, 세포는 하나 이상의 비천연 뉴클레오티드를 포함하는 안티코돈을 함유하는 tRNA를 생성시키기 위해 폴리머라제를 추가로 이용한다. 일부 경우에, tRNA는 비천연 아미노산으로 충전된다. 일부 경우에, tRNA의 비천연 안티코돈은 번역 동안 mRNA의 비천연 코돈과 쌍형성하여 적어도 1개의 비천연 아미노산을 함유하는 비천연 폴리펩티드 또는 비천연 단백질을 합성한다.
천연 및 비천연 아미노산
본원에 사용된 아미노산 잔기는 아미노 기 및 카르복실 기 둘 다를 함유하는 분자를 지칭할 수 있다. 적합한 아미노산은 비제한적으로, 자연 발생 아미노산의 D- 및 L-이성질체 둘 다, 뿐만 아니라 유기 합성 또는 임의의 다른 방법에 의해 제조된 비-자연 발생 아미노산을 포함한다. 본원에 사용된 용어 아미노산은 비제한적으로, α-아미노산, 천연 아미노산, 비천연 아미노산 및 아미노산 유사체를 포함한다.
용어 "α-아미노산"은 α-탄소로 지정된 탄소에 결합된 아미노 기 및 카르복실 기 둘 다를 함유하는 분자를 지칭할 수 있다. 예를 들어, 하기와 같다:
Figure pct00014
.
용어 "β-아미노산"은 아미노 기 및 카르복실 기 둘 다를 β 배위로 함유하는 분자를 지칭할 수 있다.
"자연 발생 아미노산"은 자연에서 합성된 펩티드에서 통상적으로 발견되고 1문자 약어 A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y 및 V로 공지된 20개의 아미노산 중 어느 하나를 지칭할 수 있다.
하기 표는 천연 아미노산의 특성의 요약을 나타낸다:
Figure pct00015
"소수성 아미노산"은 작은 소수성 아미노산 및 큰 소수성 아미노산을 포함한다. "작은 소수성 아미노산"은 글리신, 알라닌, 프롤린 및 그의 유사체일 수 있다. "큰 소수성 아미노산"은 발린, 류신, 이소류신, 페닐알라닌, 메티오닌, 트립토판, 및 그의 유사체일 수 있다. "극성 아미노산"은 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 티로신 및 그의 유사체일 수 있다. "하전된 아미노산"은 리신, 아르기닌, 히스티딘, 아스파르테이트, 글루타메이트, 및 그의 유사체일 수 있다.
"아미노산 유사체"는 아미노산과 구조적으로 유사하고 펩티드모방체 마크로사이클의 형성에서 아미노산을 치환할 수 있는 분자일 수 있다. 아미노산 유사체는, 비제한적으로, β-아미노산, 및 아미노 또는 카르복시 기가 유사한 반응성 기로 치환된 아미노산 (예를 들어, 1급 아민의 2급 또는 3급 아민으로의 치환, 또는 카르복시 기의 에스테르로의 치환)을 포함한다.
비-정규 아미노산 (ncAA) 또는 "비천연 아미노산"은 자연에서 합성된 펩티드에서 통상적으로 발견되고 1문자 약어 A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y 및 V로 공지된 20개의 아미노산 중 하나가 아닌 아미노산일 수 있다. 일부 경우에, 비천연 아미노산은 비-정규 아미노산의 하위세트이다.
아미노산 유사체는 β-아미노산 유사체를 포함할 수 있다. β-아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: 시클릭 β-아미노산 유사체; β-알라닌; (R)-β-페닐알라닌; (R)-1,2,3,4-테트라히드로-이소퀴놀린-3-아세트산; (R)-3-아미노-4-(1-나프틸)-부티르산; (R)-3-아미노-4-(2,4-디클로로페닐)부티르산; (R)-3-아미노-4-(2-클로로페닐)-부티르산; (R)-3-아미노-4-(2-시아노페닐)-부티르산; (R)-3-아미노-4-(2-플루오로페닐)-부티르산; (R)-3-아미노-4-(2-푸릴)-부티르산; (R)-3-아미노-4-(2-메틸페닐)-부티르산; (R)-3-아미노-4-(2-나프틸)-부티르산; (R)-3-아미노-4-(2-티에닐)-부티르산; (R)-3-아미노-4-(2-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-(3,4-디클로로페닐)부티르산; (R)-3-아미노-4-(3,4-디플루오로페닐)부티르산; (R)-3-아미노-4-(3-벤조티에닐)-부티르산; (R)-3-아미노-4-(3-클로로페닐)-부티르산; (R)-3-아미노-4-(3-시아노페닐)-부티르산; (R)-3-아미노-4-(3-플루오로페닐)-부티르산; (R)-3-아미노-4-(3-메틸페닐)-부티르산; (R)-3-아미노-4-(3-피리딜)-부티르산; (R)-3-아미노-4-(3-티에닐)-부티르산; (R)-3-아미노-4-(3-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-(4-브로모페닐)-부티르산; (R)-3-아미노-4-(4-클로로페닐)-부티르산; (R)-3-아미노-4-(4-시아노페닐)-부티르산; (R)-3-아미노-4-(4-플루오로페닐)-부티르산; (R)-3-아미노-4-(4-아이오도페닐)-부티르산; (R)-3-아미노-4-(4-메틸페닐)-부티르산; (R)-3-아미노-4-(4-니트로페닐)-부티르산; (R)-3-아미노-4-(4-피리딜)-부티르산; (R)-3-아미노-4-(4-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-펜타플루오로-페닐부티르산; (R)-3-아미노-5-헥센산; (R)-3-아미노-5-헥신산; (R)-3-아미노-5-페닐펜탄산; (R)-3-아미노-6-페닐-5-헥센산; (S)-1,2,3,4-테트라히드로-이소퀴놀린-3-아세트산; (S)-3-아미노-4-(1-나프틸)-부티르산; (S)-3-아미노-4-(2,4-디클로로페닐)부티르산; (S)-3-아미노-4-(2-클로로페닐)-부티르산; (S)-3-아미노-4-(2-시아노페닐)-부티르산; (S)-3-아미노-4-(2-플루오로페닐)-부티르산; (S)-3-아미노-4-(2-푸릴)-부티르산; (S)-3-아미노-4-(2-메틸페닐)-부티르산; (S)-3-아미노-4-(2-나프틸)-부티르산; (S)-3-아미노-4-(2-티에닐)-부티르산; (S)-3-아미노-4-(2-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-(3,4-디클로로페닐)부티르산; (S)-3-아미노-4-(3,4-디플루오로페닐)부티르산; (S)-3-아미노-4-(3-벤조티에닐)-부티르산; (S)-3-아미노-4-(3-클로로페닐)-부티르산; (S)-3-아미노-4-(3-시아노페닐)-부티르산; (S)-3-아미노-4-(3-플루오로페닐)-부티르산; (S)-3-아미노-4-(3-메틸페닐)-부티르산; (S)-3-아미노-4-(3-피리딜)-부티르산; (S)-3-아미노-4-(3-티에닐)-부티르산; (S)-3-아미노-4-(3-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-(4-브로모페닐)-부티르산; (S)-3-아미노-4-(4-클로로페닐)부티르산; (S)-3-아미노-4-(4-시아노페닐)-부티르산; (S)-3-아미노-4-(4-플루오로페닐)부티르산; (S)-3-아미노-4-(4-아이오도페닐)-부티르산; (S)-3-아미노-4-(4-메틸페닐)-부티르산; (S)-3-아미노-4-(4-니트로페닐)-부티르산; (S)-3-아미노-4-(4-피리딜)-부티르산; (S)-3-아미노-4-(4-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-펜타플루오로-페닐부티르산; (S)-3-아미노-5-헥센산; (S)-3-아미노-5-헥신산; (S)-3-아미노-5-페닐펜탄산; (S)-3-아미노-6-페닐-5-헥센산; 1,2,5,6-테트라히드로피리딘-3-카르복실산; 1,2,5,6-테트라히드로피리딘-4-카르복실산; 3-아미노-3-(2-클로로페닐)-프로피온산; 3-아미노-3-(2-티에닐)-프로피온산; 3-아미노-3-(3-브로모페닐)-프로피온산; 3-아미노-3-(4-클로로페닐)-프로피온산; 3-아미노-3-(4-메톡시페닐)-프로피온산; 3-아미노-4,4,4-트리플루오로-부티르산; 3-아미노아디프산; D-β-페닐알라닌; β-류신; L-β-호모알라닌; L-β-호모아스파르트산 γ-벤질 에스테르; L-β-호모글루탐산 δ-벤질 에스테르; L-β-호모이소류신; L-β-호모류신; L-β-호모메티오닌; L-β-호모페닐알라닌; L-β-호모프롤린; L-β-호모트립토판; L-β-호모발린; L-Nω-벤질옥시카르보닐-β-호모리신; Nω-L-β-호모아르기닌; O-벤질-L-β-호모히드록시프롤린; O-벤질-L-β-호모세린; O-벤질-L-β-호모트레오닌; O-벤질-L-β-호모티로신; γ-트리틸-L-β-호모아스파라긴; (R)-β-페닐알라닌; L-β-호모아스파르트산 γ-t-부틸 에스테르; L-β-호모글루탐산δ-t-부틸 에스테르; L-Nω-β-호모리신; Nδ-트리틸-L-β-호모글루타민; Nω-2,2,4,6,7-펜타메틸-디히드로벤조푸란-5-술포닐-L-β-호모아르기닌; O-t-부틸-L-β-호모히드록시-프롤린; O-t-부틸-L-β-호모세린; O-t-부틸-L-β-호모트레오닌; O-t-부틸-L-β-호모티로신; 2-아미노시클로펜탄 카르복실산; 및 2-아미노시클로헥산 카르복실산.
아미노산 유사체는 알라닌, 발린, 글리신 또는 류신의 유사체를 포함할 수 있다. 알라닌, 발린, 글리신 및 류신의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메톡시글리신; α-알릴-L-알라닌; α-아미노이소부티르산; α-메틸-류신; β-(1-나프틸)-D-알라닌; β-(1-나프틸)-L-알라닌; β-(2-나프틸)-D-알라닌; β-(2-나프틸)-L-알라닌; β-(2-피리딜)-D-알라닌; β-(2-피리딜)-L-알라닌; β-(2-티에닐)-D-알라닌; β-(2-티에닐)-L-알라닌; β-(3-벤조티에닐)-D-알라닌; β-(3-벤조티에닐)-L-알라닌; β-(3-피리딜)-D-알라닌; β-(3-피리딜)-L-알라닌; β-(4-피리딜)-D-알라닌; β-(4-피리딜)-L-알라닌; β-클로로-L-알라닌; β-시아노-L-알라닌; β-시클로헥실-D-알라닌; β-시클로헥실-L-알라닌; β-시클로펜텐-1-일-알라닌; β-시클로펜틸-알라닌; β-시클로프로필-L-Ala-OH.디시클로헥실암모늄 염; β-t-부틸-D-알라닌; β-t-부틸-L-알라닌; γ-아미노부티르산; L-α,β-디아미노프로피온산; 2,4-디니트로-페닐글리신; 2,5-디히드로-D-페닐글리신; 2-아미노-4,4,4-트리플루오로부티르산; 2-플루오로-페닐글리신; 3-아미노-4,4,4-트리플루오로-부티르산; 3-플루오로-발린; 4,4,4-트리플루오로-발린; 4,5-데히드로-L-leu-OH.디시클로헥실암모늄 염; 4-플루오로-D-페닐글리신; 4-플루오로-L-페닐글리신; 4-히드록시-D-페닐글리신; 5,5,5-트리플루오로-류신; 6-아미노헥산산; 시클로펜틸-D-Gly-OH.디시클로헥실암모늄 염; 시클로펜틸-Gly-OH.디시클로헥실암모늄 염; D-α,β-디아미노프로피온산; D-α-아미노부티르산; D-α-t-부틸글리신; D-(2-티에닐)글리신; D-(3-티에닐)글리신; D-2-아미노카프로산; D-2-인다닐글리신; D-알릴글리신-디시클로헥실암모늄 염; D-시클로헥실글리신; D-노르발린; D-페닐글리신; β-아미노부티르산; β-아미노이소부티르산; (2-브로모페닐)글리신; (2-메톡시페닐)글리신; (2-메틸페닐)글리신; (2-티아졸릴)글리신; (2-티에닐)글리신; 2-아미노-3-(디메틸아미노)-프로피온산; L-α,β-디아미노프로피온산; L-α-아미노부티르산; L-α-t-부틸글리신; L-(3-티에닐)글리신; L-2-아미노-3-(디메틸아미노)-프로피온산; L-2-아미노카프로산 디시클로헥실-암모늄 염; L-2-인다닐글리신; L-알릴글리신 디시클로헥실 암모늄 염; L-시클로헥실글리신; L-페닐글리신; L-프로파르길글리신; L-노르발린; N-α-아미노메틸-L-알라닌; D-α,γ-디아미노부티르산; L-α,γ-디아미노부티르산; β-시클로프로필-L-알라닌; (N-β-(2,4-디니트로페닐))-L-α,β-디아미노프로피온산; (N-β-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-D-α,β-디아미노프로피온산; (N-β-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-L-α,β-디아미노프로피온산; (N-β-4-메틸트리틸)-L-α,β-디아미노프로피온산; (N-β-알릴옥시카르보닐)-L-α,β-디아미노프로피온산; (N-γ-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-D-α,γ-디아미노부티르산; (N-γ-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-L-α,γ-디아미노부티르산; (N-γ-4-메틸트리틸)-D-α,γ-디아미노부티르산; (N-γ-4-메틸트리틸)-L-α,γ-디아미노부티르산; (N-γ-알릴옥시카르보닐)-L-α,γ-디아미노부티르산; D-α,γ-디아미노부티르산; 4,5-데히드로-L-류신; 시클로펜틸-D-Gly-OH; 시클로펜틸-Gly-OH; D-알릴글리신; D-호모시클로헥실알라닌; L-1-피레닐알라닌; L-2-아미노카프로산; L-알릴글리신; L-호모시클로헥실알라닌; 및 N-(2-히드록시-4-메톡시-Bzl)-Gly-OH.
아미노산 유사체는 아르기닌 또는 리신의 유사체를 포함할 수 있다. 아르기닌 및 리신의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: 시트룰린; L-2-아미노-3-구아니디노프로피온산; L-2-아미노-3-우레이도프로피온산; L-시트룰린; Lys(Me)2-OH; Lys(N3)-OH; Nδ-벤질옥시카르보닐-L-오르니틴; Nω-니트로-D-아르기닌; Nω-니트로-L-아르기닌; α-메틸-오르니틴; 2,6-디아미노헵탄디오산; L-오르니틴; (Nδ-1-(4,4-디메틸-2,6-디옥소-시클로헥스-1-일리덴)에틸)-D-오르니틴; (Nδ-1-(4,4-디메틸-2,6-디옥소-시클로헥스-1-일리덴)에틸)-L-오르니틴; (Nδ-4-메틸트리틸)-D-오르니틴; (Nδ-4-메틸트리틸)-L-오르니틴; D-오르니틴; L-오르니틴; Arg(Me)(Pbf)-OH; Arg(Me)2-OH (비대칭); Arg(Me)2-OH (대칭); Lys(ivDde)-OH; Lys(Me)2-OH.HCl; Lys(Me3)-OH 클로라이드; Nω-니트로-D-아르기닌; 및 Nω-니트로-L-아르기닌.
아미노산 유사체는 아스파르트산 또는 글루탐산의 유사체를 포함할 수 있다. 아스파르트산 및 글루탐산의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메틸-D-아스파르트산; α-메틸-글루탐산; α-메틸-L-아스파르트산; γ-메틸렌-글루탐산; (N-γ-에틸)-L-글루타민; [N-α-(4-아미노벤조일)]-L-글루탐산; 2,6-디아미노피멜산; L-α-아미노수베르산; D-2-아미노아디프산; D-α-아미노수베르산; α-아미노피멜산; 이미노디아세트산; L-2-아미노아디프산; 트레오-β-메틸-아스파르트산; γ-카르복시-D-글루탐산γ,γ-디-t-부틸 에스테르; γ-카르복시-L-글루탐산 γ,γ-디-t-부틸 에스테르; Glu(OAll)-OH; L-Asu(OtBu)-OH; 및 피로글루탐산.
아미노산 유사체는 시스테인 및 메티오닌의 유사체를 포함할 수 있다. 시스테인 및 메티오닌의 아미노산 유사체의 예는 Cys(파르네실)-OH, Cys(파르네실)-OMe, α-메틸-메티오닌, Cys(2-히드록시에틸)-OH, Cys(3-아미노프로필)-OH, 2-아미노-4-(에틸티오)부티르산, 부티오닌, 부티오닌술폭시민, 에티오닌, 메티오닌 메틸술포늄 클로라이드, 셀레노메티오닌, 시스테인산, [2-(4-피리딜)에틸]-DL-페니실라민, [2-(4-피리딜)에틸]-L-시스테인, 4-메톡시벤질-D-페니실라민, 4-메톡시벤질-L-페니실라민, 4-메틸벤질-D-페니실라민, 4-메틸벤질-L-페니실라민, 벤질-D-시스테인, 벤질-L-시스테인, 벤질-DL-호모시스테인, 카르바모일-L-시스테인, 카르복시에틸-L-시스테인, 카르복시메틸-L-시스테인, 디페닐메틸-L-시스테인, 에틸-L-시스테인, 메틸-L-시스테인, t-부틸-D-시스테인, 트리틸-L-호모시스테인, 트리틸-D-페니실라민, 시스타티오닌, 호모시스틴, L-호모시스틴, (2-아미노에틸)-L-시스테인, 셀레노-L-시스틴, 시스타티오닌, Cys(StBu)-OH, 및 아세트아미도메틸-D-페니실라민을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 페닐알라닌 및 티로신의 유사체를 포함할 수 있다. 페닐알라닌 및 티로신의 아미노산 유사체의 예는 β-메틸-페닐알라닌, β-히드록시페닐알라닌, α-메틸-3-메톡시-DL-페닐알라닌, α-메틸-D-페닐알라닌, α-메틸-L-페닐알라닌, 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산, 2,4-디클로로-페닐알라닌, 2-(트리플루오로메틸)-D-페닐알라닌, 2-(트리플루오로메틸)-L-페닐알라닌, 2-브로모-D-페닐알라닌, 2-브로모-L-페닐알라닌, 2-클로로-D-페닐알라닌, 2-클로로-L-페닐알라닌, 2-시아노-D-페닐알라닌, 2-시아노-L-페닐알라닌, 2-플루오로-D-페닐알라닌, 2-플루오로-L-페닐알라닌, 2-메틸-D-페닐알라닌, 2-메틸-L-페닐알라닌, 2-니트로-D-페닐알라닌, 2-니트로-L-페닐알라닌, 2,4,5-트리히드록시-페닐알라닌, 3,4,5-트리플루오로-D-페닐알라닌, 3,4,5-트리플루오로-L-페닐알라닌, 3,4-디클로로-D-페닐알라닌, 3,4-디클로로-L-페닐알라닌, 3,4-디플루오로-D-페닐알라닌, 3,4-디플루오로-L-페닐알라닌, 3,4-디히드록시-L-페닐알라닌, 3,4-디메톡시-L-페닐알라닌, 3,5,3'-트리아이오도-L-티로닌, 3,5-디아이오도-D-티로신, 3,5-디아이오도-L-티로신, 3,5-디아이오도-L-티로닌, 3-(트리플루오로메틸)-D-페닐알라닌, 3-(트리플루오로메틸)-L-페닐알라닌, 3-아미노-L-티로신, 3-브로모-D-페닐알라닌, 3-브로모-L-페닐알라닌, 3-클로로-D-페닐알라닌, 3-클로로-L-페닐알라닌, 3-클로로-L-티로신, 3-시아노-D-페닐알라닌, 3-시아노-L-페닐알라닌, 3-플루오로-D-페닐알라닌, 3-플루오로-L-페닐알라닌, 3-플루오로-티로신, 3-아이오도-D-페닐알라닌, 3-아이오도-L-페닐알라닌, 3-아이오도-L-티로신, 3-메톡시-L-티로신, 3-메틸-D-페닐알라닌, 3-메틸-L-페닐알라닌, 3-니트로-D-페닐알라닌, 3-니트로-L-페닐알라닌, 3-니트로-L-티로신, 4-(트리플루오로메틸)-D-페닐알라닌, 4-(트리플루오로메틸)-L-페닐알라닌, 4-아미노-D-페닐알라닌, 4-아미노-L-페닐알라닌, 4-벤조일-D-페닐알라닌, 4-벤조일-L-페닐알라닌, 4-비스(2-클로로에틸)아미노-L-페닐알라닌, 4-브로모-D-페닐알라닌, 4-브로모-L-페닐알라닌, 4-클로로-D-페닐알라닌, 4-클로로-L-페닐알라닌, 4-시아노-D-페닐알라닌, 4-시아노-L-페닐알라닌, 4-플루오로-D-페닐알라닌, 4-플루오로-L-페닐알라닌, 4-아이오도-D-페닐알라닌, 4-아이오도-L-페닐알라닌, 호모페닐알라닌, 티록신, 3,3-디페닐알라닌, 티로닌, 에틸-티로신 및 메틸-티로신을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 프롤린의 유사체를 포함할 수 있다. 프롤린의 아미노산 유사체의 예는 3,4-데히드로-프롤린, 4-플루오로-프롤린, 시스-4-히드록시-프롤린, 티아졸리딘-2-카르복실산 및 트랜스-4-플루오로-프롤린을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 세린 및 트레오닌의 유사체를 포함할 수 있다. 세린 및 트레오닌의 아미노산 유사체의 예는 3-아미노-2-히드록시-5-메틸헥산산, 2-아미노-3-히드록시-4-메틸펜탄산, 2-아미노-3-에톡시부탄산, 2-아미노-3-메톡시부탄산, 4-아미노-3-히드록시-6-메틸헵탄산, 2-아미노-3-벤질옥시프로피온산, 2-아미노-3-벤질옥시프로피온산, 2-아미노-3-에톡시프로피온산, 4-아미노-3-히드록시부탄산 및 α-메틸세린을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 트립토판의 유사체를 포함할 수 있다. 트립토판의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메틸-트립토판; β-(3-벤조티에닐)-D-알라닌; β-(3-벤조티에닐)-L-알라닌; 1-메틸-트립토판; 4-메틸-트립토판; 5-벤질옥시-트립토판; 5-브로모-트립토판; 5-클로로-트립토판; 5-플루오로-트립토판; 5-히드록시-트립토판; 5-히드록시-L-트립토판; 5-메톡시-트립토판; 5-메톡시-L-트립토판; 5-메틸-트립토판; 6-브로모-트립토판; 6-클로로-D-트립토판; 6-클로로-트립토판; 6-플루오로-트립토판; 6-메틸-트립토판; 7-벤질옥시-트립토판; 7-브로모-트립토판; 7-메틸-트립토판; D-1,2,3,4-테트라히드로-노르하르만-3-카르복실산; 6-메톡시-1,2,3,4-테트라히드로노르하르만-1-카르복실산; 7-아자트립토판; L-1,2,3,4-테트라히드로-노르하르만-3-카르복실산; 5-메톡시-2-메틸-트립토판; 및 6-클로로-L-트립토판.
아미노산 유사체는 라세미체일 수 있다. 일부 경우에, 아미노산 유사체의 D 이성질체가 사용된다. 일부 경우에, 아미노산 유사체의 L 이성질체가 사용된다. 일부 경우에, 아미노산 유사체는 R 또는 S 배위인 키랄 중심을 포함한다. 때때로, β-아미노산 유사체의 아미노 기(들)는 보호기, 예를 들어 tert-부틸옥시카르보닐 (BOC 기), 9-플루오레닐메틸옥시카르보닐 (FMOC), 토실 등으로 치환된다. 때때로, β-아미노산 유사체의 카르복실산 관능기는 예를 들어 그의 에스테르 유도체로서 보호된다. 일부 경우에, 아미노산 유사체의 염이 사용된다.
일부 실시양태에서, 비천연 아미노산은 문헌 [Liu C.C., Schultz, P.G. Annu. Rev. Biochem. 2010, 79, 413]에 기재된 비천연 아미노산이다. 일부 실시양태에서, 비천연 아미노산은 N6(2-아지도에톡시)-카르보닐-L-리신을 포함한다.
일부 실시양태에서, 본원에 기재된 아미노산 잔기 (예를 들어, 단백질 내)는 접합 모이어티에 결합하기 전에 비천연 아미노산으로 돌연변이된다. 일부 경우에, 비천연 아미노산으로의 돌연변이는 면역계의 자기-항원 반응을 방지하거나 또는 최소화한다. 본원에 사용된 용어 "비천연 아미노산"은 단백질에서 자연적으로 발생하는 20개의 아미노산 이외의 아미노산을 지칭한다. 비천연 아미노산의 비제한적 예는 p-아세틸-L-페닐알라닌, p-아이오도-L-페닐알라닌, p-메톡시페닐알라닌, O-메틸-L-티로신, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcp-세린, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아지도-L-페닐알라닌 p-아지도-페닐알라닌, p-벤조일-L-페닐알라닌, p-보로노페닐알라닌, O-프로파르길티로신, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, 셀레노시스테인, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), 아지도-리신 (N6-아지도에톡시-카르보닐-L-리신, AzK), N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신, 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 히드록실아민, 케토 또는 아미노 치환된 아미노산 또는 그의 조합; 광활성화가능한 가교-링커를 갖는 아미노산; 스핀-표지된 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 광케이징된 및/또는 광이성질체화가능한 아미노산; 비오틴 또는 비오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중원자 치환된 아미노산; 화학적으로 절단가능한 또는 광절단가능한 아미노산; 신장된 측쇄를 갖는 아미노산; 독성 기를 함유하는 아미노산; 당 치환된 아미노산; 탄소-연결된 당-함유 아미노산; 산화환원-활성 아미노산; a-히드록시 함유 산; 아미노 티오산; α, α 이치환된 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 시클릭 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산을 포함한다.
일부 실시양태에서, 비천연 아미노산은 선택적 반응성 기, 또는 표적 단백질 또는 폴리펩티드의 부위-선택적 표지를 위한 반응성 기를 포함한다. 일부 경우에, 화학은 생물직교 반응 (예를 들어, 생체적합성 및 선택적 반응)이다. 일부 경우에, 화학은 Cu(I)-촉매된 또는 "구리-무함유" 알킨-아지드 트리아졸-형성 반응, 슈타우딩거(Staudinger) 라이게이션, 역-전자-요구 딜스-알더(Diels-Alder) (IEDDA) 반응, "광-클릭" 화학, 또는 금속-매개 공정, 예컨대 올레핀 복분해 및 스즈키-미야우라(Suzuki-Miyaura) 또는 소노가시라(Sonogashira) 교차-커플링이다. 일부 실시양태에서, 비천연 아미노산은 예를 들어 UV 조사시 가교되는 광반응성 기를 포함한다. 일부 실시양태에서, 비천연 아미노산은 광-케이징된 아미노산을 포함한다. 일부 경우에, 비천연 아미노산은 파라-치환된, 메타-치환된, 또는 오르토-치환된 아미노산 유도체이다.
일부 경우에, 비천연 아미노산은 p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, O-메틸-L-티로신, p-메톡시페닐알라닌, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcp-세린, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 또는 이소프로필-L-페닐알라닌을 포함한다.
일부 경우에, 비천연 아미노산은 3-아미노티로신, 3-니트로티로신, 3,4-디히드록시-페닐알라닌, 또는 3-아이오도티로신이다. 일부 경우에, 비천연 아미노산은 페닐셀레노시스테인이다. 일부 경우에, 비천연 아미노산은 벤조페논, 케톤, 아이오다이드, 메톡시, 아세틸, 벤조일, 또는 아지드 함유 페닐알라닌 유도체이다. 일부 경우에, 비천연 아미노산은 벤조페논, 케톤, 아이오다이드, 메톡시, 아세틸, 벤조일, 또는 아지드 함유 리신 유도체이다. 일부 경우에, 비천연 아미노산은 방향족 측쇄를 포함한다. 일부 경우에, 비천연 아미노산은 방향족 측쇄를 포함하지 않는다. 일부 경우에, 비천연 아미노산은 아지도 기를 포함한다. 일부 경우에, 비천연 아미노산은 마이클-수용자 기를 포함한다. 일부 경우에, 마이클-수용자 기는 1,2-부가 반응을 통하여 공유 결합을 형성할 수 있는 불포화 모이어티를 포함한다. 일부 경우에, 마이클-수용자 기는 전자-결핍 알켄 또는 알킨을 포함한다. 일부 경우에, 마이클-수용자 기는 알파, 베타 불포화: 케톤, 알데히드, 술폭시드, 술폰, 니트릴, 이민 또는 방향족을 포함하나 이에 제한되지는 않는다. 일부 경우에, 비천연 아미노산은 데히드로알라닌이다. 일부 경우에, 비천연 아미노산은 알데히드 또는 케톤 기를 포함한다. 일부 경우에, 비천연 아미노산은 알데히드 또는 케톤 기를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 베타, 감마 또는 델타 위치에 1개 이상의 O, N, Se 또는 S 원자를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 감마 위치에 O, N, Se 또는 S 원자를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 엡실론 N 원자가 산소 원자로 대체된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 자연 발생 번역후 변형된 리신이 아닌 리신 유도체이다.
일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제6 원자는 카르보닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제6 원자는 카르보닐 기를 포함하고, 알파 위치로부터의 제5 원자는 질소이다. 일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제7 원자는 산소 원자이다.
일부 경우에, 비천연 아미노산은 셀레늄을 포함하는 세린 유도체이다. 일부 경우에, 비천연 아미노산은 셀레노세린 (2-아미노-3-히드로셀레노프로판산)이다. 일부 경우에, 비천연 아미노산은 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산이다. 일부 경우에, 비천연 아미노산은 2-아미노-3-(페닐셀라닐)프로판산이다. 일부 경우에, 비천연 아미노산은 셀레늄을 포함하며, 여기서 셀레늄의 산화는 알켄을 포함하는 비천연 아미노산의 형성을 유발한다.
일부 경우에, 비천연 아미노산은 시클로옥티닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 트랜스시클로옥테닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 노르보르네닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 시클로프로페닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 디아지린 기를 포함한다. 일부 경우에, 비천연 아미노산은 테트라진 기를 포함한다.
일부 경우에, 비천연 아미노산은 측쇄 질소가 카르바밀화된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 측쇄 질소가 아실화된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(tert-부톡시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(tert-부톡시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-Boc-N6-메틸리신이다. 일부 경우에, 비천연 아미노산은 N6-아세틸리신이다. 일부 경우에, 비천연 아미노산은 피롤리신이다. 일부 경우에, 비천연 아미노산은 N6-트리플루오로아세틸리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(p-아이오도벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(p-니트로벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-프롤릴리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(시클로펜틸옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(시클로펜탄카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(테트라히드로푸란-2-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(3-에티닐테트라히드로푸란-2-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((프로프-2-인-1-일옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-아지도시클로펜틸옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-((2-아지도에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-니트로벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-시클로옥티닐옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(2-아미노부트-3-이노일)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-((2-아미노부트-3-이노일)옥시)헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(알릴옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(부테닐-4-옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(펜테닐-5-옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((부트-3-인-1-일옥시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-((펜트-4-인-1-일옥시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-(티아졸리딘-4-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-8-옥소노난산이다. 일부 경우에, 비천연 아미노산은 2-아미노-8-옥소옥탄산이다. 일부 경우에, 비천연 아미노산은 N6-(2-옥소아세틸)리신이다. 일부 경우에, 비천연 아미노산은 N6-(((2-아지도벤질)옥시)카르보닐)-L-리신이다. 일부 경우에, 비천연 아미노산은 N6-(((3-아지도벤질)옥시)카르보닐)-L-리신이다. 일부 경우에, 비천연 아미노산은 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신이다.
일부 경우에, 비천연 아미노산은 N6-프로피오닐리신이다. 일부 경우에, 비천연 아미노산은 N6-부티릴리신이다. 일부 경우에, 비천연 아미노산은 N6-(부트-2-에노일)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[2.2.1]헵트-5-엔-2-일옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((스피로[2.3]헥스-1-엔-5-일메톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(((4-(1-(트리플루오로메틸)시클로프로프-2-엔-1-일)벤질)옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[2.2.1]헵트-5-엔-2-일메톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 시스테이닐리신이다. 일부 경우에, 비천연 아미노산은 N6-((1-(6-니트로벤조[d][1,3]디옥솔-5-일)에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((2-(3-메틸-3H-디아지린-3-일)에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((3-(3-메틸-3H-디아지린-3-일)프로폭시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((메타 니트로벤질옥시)N6-메틸카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[6.1.0]논-4-인-9-일메톡시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-((시클로헵트-3-엔-1-일옥시)카르보닐)-L-리신이다.
일부 경우에, 비천연 아미노산은 2-아미노-3-(((벤질옥시)카르보닐)아미노)메틸)셀라닐)프로판산이다. 일부 실시양태에서, 비천연 아미노산은 재목적화 앰버, 오팔 또는 오커 정지 코돈에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입된다. 일부 실시양태에서, 비천연 아미노산은 4-염기 코돈에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입된다. 일부 실시양태에서, 비천연 아미노산은 재목적화 희귀 센스 코돈에 의해 단백질 내로 혼입된다.
일부 실시양태에서, 비천연 아미노산은 비천연 뉴클레오티드를 포함하는 비천연 코돈에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입된다.
일부 경우에, 단백질 내로의 비천연 아미노산의 혼입은 직교, 변형된 신테타제/tRNA 쌍에 의해 매개된다. 이러한 직교 쌍은 종종 a) 다른 내인성 아미노산 또는 대안적 비천연 아미노산의 비천연 tRNA 상으로의 및 b) 임의의 다른 (내인성 포함) tRNA의 충전을 최소화하면서, 비천연 tRNA를 특이적 비천연 아미노산으로 충전시킬 수 있는 천연 또는 돌연변이된 신테타제를 포함한다. 이러한 직교 쌍은 내인성 신테타제에 의해 다른 내인성 아미노산으로 충전되는 것을 피하면서 신테타제에 의해 충전될 수 있는 tRNA를 포함한다. 일부 실시양태에서, 이러한 쌍은 다양한 유기체, 예컨대 박테리아, 효모, 고세균 또는 인간 공급원으로부터 확인된다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 단일 유기체로부터의 성분을 포함한다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 2개의 상이한 유기체로부터의 성분을 포함한다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 변형 전에 상이한 아미노산의 번역을 촉진하는 성분을 포함한다. 일부 실시양태에서, 직교 신테타제는 변형된 알라닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아르기닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아스파라긴 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아스파르트산 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 시스테인 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 글루타민 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 글루탐산 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 알라닌 글리신이다. 일부 실시양태에서, 직교 신테타제는 변형된 히스티딘 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 류신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 이소류신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 리신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 메티오닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 페닐알라닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 프롤린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 세린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 트레오닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 트립토판 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 티로신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 발린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 포스포세린 신테타제이다. 일부 실시양태에서, 직교 tRNA는 변형된 알라닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아르기닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아스파라긴 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아스파르트산 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 시스테인 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 글루타민 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 글루탐산 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 알라닌 글리신이다. 일부 실시양태에서, 직교 tRNA는 변형된 히스티딘 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 류신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 이소류신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 리신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 메티오닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 페닐알라닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 프롤린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 세린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 트레오닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 트립토판 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 티로신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 발린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 포스포세린 tRNA이다.
일부 실시양태에서, 비천연 아미노산은 아미노아실 (aaRS 또는 RS)-tRNA 신테타제-tRNA 쌍에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입될 수 있다. 예시적인 aaRS-tRNA 쌍은 메타노코쿠스 잔나쉬이 (Mj-Tyr) aaRS/tRNA 쌍, 메타노코쿠스 잔나쉬이 (엠. 잔나쉬이) TyrRS 변이체 pAzFRS (MjpAzFRS), 이. 콜라이 TyrRS (Ec-Tyr)/비. 스테아로써모필루스(B. stearothermophilus) tRNACUA 쌍, 이. 콜라이 LeuRS (Ec-Leu)/비. 스테아로써모필루스 tRNACUA 쌍, 및 피롤리실-tRNA 쌍을 포함하나 이에 제한되지는 않는다. 일부 경우에, 비천연 아미노산은 Mj-TyrRS/tRNA 쌍에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입된다. Mj-TyrRS/tRNA 쌍에 의해 혼입될 수 있는 예시적인 비천연 아미노산 (UAA)은 파라-치환된 페닐알라닌 유도체, 예컨대 p-아지도-L-페닐알라닌 (pAzF), N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, N6-(((4-아지도벤질)옥시)카르보닐)-L-리신, p-아미노페닐알라닌 및 p-메토페닐알라닌; 메타-치환된 티로신 유도체, 예컨대 3-아미노티로신, 3-니트로티로신, 3,4-디히드록시페닐알라닌 및 3-아이오도티로신; 페닐셀레노시스테인; p-보로노페닐알라닌; 및 o-니트로벤질티로신을 포함하나 이에 제한되지는 않는다.
일부 경우에, 비천연 아미노산은 Ec-Tyr/tRNACUA 또는 Ec-Leu/tRNACUA 쌍에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입될 수 있다. Ec-Tyr/tRNACUA 또는 Ec-Leu/tRNACUA 쌍에 의해 혼입될 수 있는 예시적인 UAA는 벤조페논, 케톤, 아이오다이드 또는 아지드 치환기를 함유하는 페닐알라닌 유도체; O-프로파르길티로신; α-아미노카프릴산, O-메틸 티로신, O-니트로벤질 시스테인; 및 3-(나프탈렌-2-일아미노)-2-아미노-프로판산을 포함하나 이에 제한되지는 않는다.
일부 경우에, 비천연 아미노산은 피롤리실-tRNA 쌍에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입될 수 있다. 일부 경우에, PylRS는 고세균 종, 예를 들어 메탄생성 고세균으로부터 수득된다. 일부 경우에, PylRS는 메타노사르시나 바르케리, 메타노사르시나 마제이, 또는 메타노사르시나 아세티보란스(Methanosarcina acetivorans)로부터 수득될 수 있다. 일부 경우에, PylRS는 키메라 PylRS일 수 있다. 피롤리실-tRNA 쌍에 의해 혼입될 수 있는 예시적인 UAA는 아미드 및 카르바메이트 치환된 리신, 예컨대 N6-(2-아지도에톡시)-카르보닐-L-리신 (AzK), N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, N6-(((4-아지도벤질)옥시)카르보닐)-L-리신, 2-아미노-6-((R)-테트라히드로푸란-2-카르복스아미도)헥산산, N-ε-D-프롤릴-L-리신, 및 N-ε-시클로펜틸옥시카르보닐-L-리신; N-ε-아크릴로일-L-리신; N-ε-[(1-(6-니트로벤조[d][1,3]디옥솔-5-일)에톡시)카르보닐]-L-리신; 및 N-ε-(1-메틸시클로프로프-2-엔카르복스아미도)리신을 포함하나 이에 제한되지는 않는다.
일부 경우에, 본원에 기재된 바와 같은 조성물 및 방법은 적어도 2개의 tRNA 신테타제를 사용하여 적어도 2개의 비천연 아미노산을 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입시키는 것을 포함한다. 일부 경우에, 적어도 2개의 tRNA 신테타제는 동일하거나 상이할 수 있다. 경우에 따라, 적어도 2개의 비천연 아미노산은 동일하거나 상이할 수 있다. 일부 경우에, 비천연 폴리펩티드 내로 혼입되는 적어도 2개의 비천연 아미노산은 상이하다. 일부 경우에, 적어도 2개의 상이한 비천연 아미노산은 부위-특이적 방식으로 비천연 폴리펩티드 또는 비천연 단백질에 혼입될 수 있다.
일부 경우에, 비천연 아미노산은 US 9,988,619 및 US 9,938,516에 개시된 신테타제에 의해 본원에 기재된 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입될 수 있다. 이러한 신테타제에 의해 혼입될 수 있는 예시적인 UAA는 파라-메틸아지도-L-페닐알라닌, 아르알킬, 헤테로시클릴, 헤테로아르알킬 비천연 아미노산 등을 포함한다. 일부 실시양태에서, 이러한 UAA는 피리딜, 피라지닐, 피라졸릴, 트리아졸릴, 옥사졸릴, 티아졸릴, 티오페닐 또는 다른 헤테로사이클을 포함한다. 이러한 아미노산은 일부 실시양태에서 아지드, 테트라진, 또는 커플링 파트너, 예컨대 수용성 모이어티에 접합될 수 있는 다른 화학적 기를 포함한다. 일부 실시양태에서, 이러한 신테타제는 발현되어 생체내에서 UAA를 단백질 내로 혼입시키는데 사용된다. 일부 실시양태에서, 이러한 신테타제는 무세포 번역 시스템을 사용하여 UAA를 단백질 내로 혼입시키는데 사용된다.
일부 경우에, 비천연 아미노산은 자연 발생 신테타제에 의해 본원에 기재된 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입될 수 있다. 일부 실시양태에서, 비천연 아미노산은 1개 이상의 아미노산에 대해 영양요구성인 유기체에 의해 비천연 폴리펩티드 또는 비천연 단백질 내로 혼입된다. 일부 실시양태에서, 영양요구성 아미노산에 상응하는 신테타제는 상응하는 tRNA를 비천연 아미노산으로 충전시킬 수 있다. 일부 실시양태에서, 비천연 아미노산은 셀레노시스테인 또는 그의 유도체이다. 일부 실시양태에서, 비천연 아미노산은 셀레노메티오닌 또는 그의 유도체이다. 일부 실시양태에서, 비천연 아미노산은 방향족 아미노산이고, 여기서 방향족 아미노산은 아릴 할라이드, 예컨대 아이오다이드를 포함한다. 실시양태에서, 비천연 아미노산은 영양요구성 아미노산과 구조적으로 유사하다.
일부 경우에, 비천연 아미노산은 도 5a에 예시된 비천연 아미노산을 포함한다.
일부 경우에, 비천연 아미노산은 리신 또는 페닐알라닌 유도체 또는 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 리신 유도체 또는 리신 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 피롤리신 (Pyl)을 포함한다. 일부 경우에, 비천연 아미노산은 페닐알라닌 유도체 또는 페닐알라닌 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 문헌 [Wan, et al., "Pyrrolysyl-tRNA synthetase: an ordinary enzyme but an outstanding genetic code expansion tool," Biocheim Biophys Aceta 1844(6): 1059-4070 (2014)]에 기재된 비천연 아미노산이다. 일부 경우에, 비천연 아미노산은 도 5b 및 도 5c에 예시된 비천연 아미노산을 포함한다.
일부 실시양태에서, 비천연 아미노산은 도 5d - 도 5g에 예시된 비천연 아미노산을 포함한다 (문헌 [Dumas et al., Chemical Science 2015, 6, 50-69]의 표 1로부터 채택됨).
일부 실시양태에서, 본원에 기재된 단백질 내로 혼입된 비천연 아미노산은 US 9,840,493; US 9,682,934; US 2017/0260137; US 9,938,516; 또는 US 2018/0086734에 개시되어 있다. 이러한 신테타제에 의해 혼입될 수 있는 예시적인 UAA는 파라-메틸아지도-L-페닐알라닌, 아르알킬, 헤테로시클릴 및 헤테로아르알킬, 및 리신 유도체 비천연 아미노산을 포함한다. 일부 실시양태에서, 이러한 UAA는 피리딜, 피라지닐, 피라졸릴, 트리아졸릴, 옥사졸릴, 티아졸릴, 티오페닐 또는 다른 헤테로사이클을 포함한다. 일부 실시양태에서, 이러한 아미노산은 아지드, 테트라진, 또는 커플링 파트너, 예컨대 수용성 모이어티에 접합될 수 있는 다른 화학적 기를 포함한다. 일부 실시양태에서, UAA는 알킬 링커를 통해 방향족 모이어티에 부착된 아지드를 포함한다. 일부 실시양태에서, 알킬 링커는 C1-C10 링커이다. 일부 실시양태에서, UAA는 알킬 링커를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 아미노 기를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬아미노 기를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬 쇄를 통해 아미노산 측쇄의 말단 질소 (예를 들어, 리신 유도체의 N6, 또는 보다 짧은 알킬 측쇄를 포함하는 유도체의 N5, N4, 또는 N3)에 부착된 아지드를 포함한다. 일부 실시양태에서, UAA는 알킬 쇄를 통해 아미노산 측쇄의 말단 질소에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬 링커를 통해 아미드에 부착된 아지드 또는 테트라진을 포함한다. 일부 실시양태에서, UAA는 3-아미노알라닌, 세린, 리신 또는 그의 유도체의 아지드 또는 테트라진-함유 카르바메이트 또는 아미드이다. 일부 실시양태에서, 이러한 UAA는 생체내 단백질 내로 혼입된다. 일부 실시양태에서, 이러한 UAA는 무세포 시스템에서 단백질 내로 혼입된다.
세포 유형
일부 실시양태에서, 많은 유형의 세포/미생물이, 예를 들어 형질전환 또는 유전자 조작에 사용된다. 일부 실시양태에서, 세포는 원핵 또는 진핵 세포이다. 일부 경우에, 세포는 미생물, 예컨대 박테리아 세포, 진균 세포, 효모, 또는 단세포 원충이다. 다른 경우에, 세포는 진핵 세포, 예컨대 배양된 동물, 식물 또는 인간 세포이다. 추가의 경우에, 세포는 유기체, 예컨대 식물 또는 동물에 존재한다.
일부 실시양태에서, 조작된 미생물은 종종 분열 및 증식할 수 있는 단세포 유기체이다. 미생물은 다음 특색 중 하나 이상을 포함할 수 있다: 호기성, 혐기성, 사상성, 비-사상성, 일배체, 이배체, 영양요구성 및/또는 비-영양요구성. 특정 실시양태에서, 조작된 미생물은 원핵 미생물 (예를 들어, 박테리아)이고, 특정 실시양태에서, 조작된 미생물은 비-원핵 미생물이다. 일부 실시양태에서, 조작된 미생물은 진핵 미생물 (예를 들어, 효모, 진균, 아메바)이다. 일부 실시양태에서, 조작된 미생물은 진균이다. 일부 실시양태에서, 조작된 유기체는 효모이다.
임의의 적합한 효모는 숙주 미생물, 조작된 미생물, 유전자 변형된 유기체, 또는 이종 또는 변형된 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 효모는 야로위아(Yarrowia) 효모 (예를 들어, 와이. 리폴리티카(Y. lipolytica) (이전에 칸디다 리폴리티카(Candida lipolytica)로 분류됨)), 칸디다(Candida) 효모 (예를 들어, 씨. 레브카우피(C. revkaufi), 씨. 비스와나티이(C. viswanathii), 씨. 풀케리마(C. pulcherrima), 씨. 트로피칼리스(C. tropicalis), 씨. 유틸리스(C. utilis)), 로도토룰라(Rhodotorula) 효모 (예를 들어, 알. 글루티누스(R. glutinus), 알. 그라미니스(R. graminis)), 로도스포리디움(Rhodosporidium) 효모 (예를 들어, 알. 토룰로이데스(R. toruloides)), 사카로미세스(Saccharomyces) 효모 (예를 들어, 에스. 세레비지아에(S. cerevisiae), 에스. 바야누스(S. bayanus), 에스. 파스토리아누스(S. pastorianus), 에스. 칼스베르겐시스(S. carlsbergensis)), 크립토코쿠스(Cryptococcus) 효모, 트리코스포론(Trichosporon) 효모 (예를 들어, 티. 풀란스(T. pullans), 티. 쿠타네움(T. cutaneum)), 피키아(Pichia) 효모 (예를 들어, 피. 파스토리스(P. pastoris)) 및 리포미세스(Lipomyces) 효모 (예를 들어, 엘. 스타르케이이이(L. starkeyii), 엘. 리포페루스(L. lipoferus))를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 적합한 효모는 아라크니오투스(Arachniotus) 속, 아스페르길루스(Aspergillus) 속, 아우레오바시디움(Aureobasidium) 속, 아욱사르트론(Auxarthron) 속, 블라스토미세스(Blastomyces) 속, 칸디다(Candida) 속, 크리소스포룸(Chrysosporuim) 속, 크리소스포룸 데바리오미세스(Chrysosporuim Debaryomyces) 속, 콕시디오데스(Coccidiodes) 속, 크립토코쿠스(Cryptococcus) 속, 김노아스쿠스(Gymnoascus) 속, 한세눌라(Hansenula) 속, 히스토플라스마(Histoplasma) 속, 이사첸키아(Issatchenkia) 속, 클루이베로미세스(Kluyveromyces) 속, 리포미세스(Lipomyces) 속, 리사첸키아(Lssatchenkia) 속, 미크로스포룸(Microsporum) 속, 믹소트리쿰(Myxotrichum) 속, 믹소지마(Myxozyma) 속, 오이디오덴드론(Oidiodendron) 속, 파키솔렌(Pachysolen) 속, 페니실리움(Penicillium) 속, 피키아(Pichia) 속, 로도스포리디움(Rhodosporidium) 속, 로도토룰라(Rhodotorula) 속, 로도토룰라(Rhodotorula) 속, 사카로미세스(Saccharomyces) 속, 쉬조사카로미세스(Schizosaccharomyces) 속, 스코풀라리오프시스(Scopulariopsis) 속, 세페도니움(Sepedonium) 속, 트리코스포론(Trichosporon) 속, 또는 야로위아(Yarrowia) 속의 것이다. 일부 실시양태에서, 적합한 효모는 아라크니오투스 플라볼루테우스(Arachniotus flavoluteus) 종, 아스페르길루스 플라부스(Aspergillus flavus) 종, 아스페르길루스 푸미가투스(Aspergillus fumigatus) 종, 아스페르길루스 니거(Aspergillus niger) 종, 아우레오바시디움 풀루란스(Aureobasidium pullulans) 종, 아욱사르트론 탁스테리(Auxarthron thaxteri) 종, 블라스토미세스 더마티티디스(Blastomyces dermatitidis) 종, 칸디다 알비칸스(Candida albicans) 종, 칸디다 두블리니엔시스(Candida dubliniensis) 종, 칸디다 파마타(Candida famata) 종, 칸디다 글라브라타(Candida glabrata) 종, 칸디다 길리에르몬디이(Candida guilliermondii) 종, 칸디다 케피르(Candida kefyr) 종, 칸디다 크루세이(Candida krusei) 종, 칸디다 람비카(Candida lambica) 종, 칸디다 리폴리티카(Candida lipolytica) 종, 칸디다 루스티타니아에(Candida lustitaniae) 종, 칸디다 파라프실로시스(Candida parapsilosis) 종, 칸디다 풀케리마(Candida pulcherrima) 종, 칸디다 레브카우피(Candida revkaufi) 종, 칸디다 루고사(Candida rugosa) 종, 칸디다 트로피칼리스(Candida tropicalis) 종, 칸디다 유틸리스(Candida utilis) 종, 칸디다 비스와나티이(Candida viswanathii) 종, 칸디다 크세스토비이(Candida xestobii) 종, 크리소스포룸 케라티노필룸(Chrysosporuim keratinophilum) 종, 콕시디오데스 임미티스(Coccidiodes immitis) 종, 크립토코쿠스 알비두스 변종 디플루엔스(Cryptococcus albidus var. diffluens) 종, 크립토코쿠스 라우렌티이(Cryptococcus laurentii) 종, 크립토코쿠스 네오포만스(Cryptococcus neofomans) 종, 데바리오미세스 한세니이(Debaryomyces hansenii) 종, 김노아스쿠스 더그와이엔시스(Gymnoascus dugwayensis) 종, 한세눌라 아노말라(Hansenula anomala) 종, 히스토플라스마 캅술라툼(Histoplasma capsulatum) 종, 이사첸키아 옥시덴탈리스(Issatchenkia occidentalis) 종, 이스타켄키아 오리엔탈리스(Isstachenkia orientalis) 종, 클루이베로미세스 락티스(Kluyveromyces lactis) 종, 클루이베로미세스 마르시아누스(Kluyveromyces marxianus) 종, 클루이베로미세스 써모톨레란스(Kluyveromyces thermotolerans) 종, 클루이베로미세스 왈티이(Kluyveromyces waltii) 종, 리포미세스 리포페루스(Lipomyces lipoferus) 종, 리포미세스 스타르케이이이(Lipomyces starkeyii) 종, 미크로스포룸 깁세움(Microsporum gypseum) 종, 믹소트리쿰 데플렉숨(Myxotrichum deflexum) 종, 오이디오덴드론 에키눌라툼(Oidiodendron echinulatum) 종, 파키솔렌 탄노필리스(Pachysolen tannophilis) 종, 페니실리움 노타툼(Penicillium notatum) 종, 피키아 아노말라(Pichia anomala) 종, 피키아 파스토리스(Pichia pastoris) 종, 피키아 스티피티스(Pichia stipitis) 종, 로도스포리디움 토룰로이데스(Rhodosporidium toruloides) 종, 로도토룰라 글루티누스(Rhodotorula glutinus) 종, 로도토룰라 그라미니스(Rhodotorula graminis) 종, 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 종, 사카로미세스 클루이베리(Saccharomyces kluyveri) 종, 쉬조사카로미세스 폼베(Schizosaccharomyces pombe) 종, 스코풀라리옵시스 아크레모니움(Scopulariopsis acremonium) 종, 세페도니움 크리소스페르뭄(Sepedonium chrysospermum) 종, 트리코스포론 쿠타네움(Trichosporon cutaneum) 종, 트리코스포론 풀란스(Trichosporon pullans) 종, 야로위아 리폴리티카(Yarrowia lipolytica) 종, 또는 야로위아 리폴리티카(이전에 칸디다 리폴리티카로 분류됨) 종의 것이다. 일부 실시양태에서, 효모는 ATCC20362, ATCC8862, ATCC18944, ATCC20228, ATCC76982 및 LGAM S(7)1 균주를 포함하나 이에 제한되지는 않는 와이. 리폴리티카 균주이다 (Papanikolaou S., and Aggelis G., Bioresour. Technol. 82(1):43-9 (2002)). 특정 실시양태에서, 효모는 칸디다 종 (즉, 칸디다 종) 효모이다. 임의의 적합한 칸디다 종이 지방 디카르복실산 (예를 들어, 옥탄디오산, 데칸디오산, 도데칸디오산, 테트라데칸디오산, 헥사데칸디오산, 옥타데칸디오산, 에이코산디오산)의 제조를 위해 사용되고/거나 유전자 변형될 수 있다. 일부 실시양태에서, 적합한 칸디다 종은 칸디다 알비칸스, 칸디다 두블리니엔시스, 칸디다 파마타, 칸디다 글라브라타, 칸디다 길리에르몬디이, 칸디다 케피르, 칸디다 크루세이, 칸디다 람비카, 칸디다 리폴리티카, 칸디다 루스티타니아에, 칸디다 파라프실로시스, 칸디다 풀케리마, 칸디다 레브카우피, 칸디다 루고사, 칸디다 트로피칼리스, 칸디다 유틸리스, 칸디다 비스와나티이, 칸디다 크세스토비이 및 본원에 기재된 임의의 다른 칸디다 종 효모를 포함하나 이에 제한되지는 않는다. 칸디다 종 균주의 비제한적 예는 sAA001 (ATCC20336), sAA002 (ATCC20913), sAA003 (ATCC20962), sAA496 (US2012/0077252), sAA106 (US2012/0077252), SU-2 (ura3-/ura3-), H5343 (베타 산화 차단됨; 미국 특허 번호 5648247) 균주를 포함하나 이에 제한되지는 않는다. 칸디다 종 효모로부터의 임의의 적합한 균주가 유전자 변형을 위한 모 균주로서 이용될 수 있다.
효모 속, 종 및 균주는 종종 유전적 내용과 매우 밀접하게 관련되어 있어 구별, 분류 및/또는 명명하기 어려울 수 있다. 일부 경우에 씨. 리폴리티카 및 와이. 리폴리티카의 균주는 구별, 분류 및/또는 명명하기 어려울 수 있고, 일부 경우에 동일한 유기체로 간주될 수 있다. 일부 경우에, 씨. 트로피칼리스 및 씨. 비스와나티이의 다양한 균주는 구별, 분류 및/또는 명명하기 어려울 수 있다 (예를 들어, 문헌 [Arie et al., J. Gen. Appl.Microbiol., 46, 257-262 (2000)] 참조). ATCC 뿐만 아니라 다른 상업적 또는 학술적 공급원으로부터 수득된 일부 씨. 트로피칼리스 및 씨. 비스와나티이 균주는 본원에 기재된 실시양태에 등가이고 동등하게 적합한 것으로 간주될 수 있다. 일부 실시양태에서, 씨. 트로피칼리스 및 씨. 비스와나티이의 일부 모 균주는 단지 명칭이 상이한 것으로 간주된다.
임의의 적합한 진균은 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 진균의 비제한적 예는 아스페르길루스 진균 (예를 들어, 에이. 파라시티쿠스(A. parasiticus), 에이. 니둘란스(A. nidulans)), 트라우스토키트리움(Thraustochytrium) 진균, 쉬조키트리움(Schizochytrium) 진균 및 리조푸스(Rhizopus) 진균 (예를 들어, 알. 아리주스(R. arrhizus), 알. 오리자에(R. oryzae), 알. 니그리칸스(R. nigricans))을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 진균은 균주 ATCC24690을 포함하나 이에 제한되지는 않는 에이. 파라시티쿠스 균주이고, 특정 실시양태에서, 진균은 균주 ATCC38163을 포함하나 이에 제한되지는 않는 에이. 니둘란스 균주이다.
임의의 적합한 원핵생물은 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 그람 음성 또는 그람 양성 박테리아가 선택될 수 있다. 박테리아의 예는 바실루스(Bacillus) 박테리아 (예를 들어, 비. 서브틸리스(B. subtilis), 비. 메가테리움(B. megaterium)), 아시네토박터(Acinetobacter) 박테리아, 노르카르디아(Norcardia) 박테리아, 크산토박터(Xanthobacter) 박테리아, 에스케리키아(Escherichia) 박테리아 (예를 들어, 이. 콜라이 (예를 들어, 균주 DH10B, Stbl2, DH5-알파, DB3, DB3.1), DB4, DB5, JDP682 및 ccdA-over (예를 들어, 미국 출원 번호 09/518,188))), 스트렙토미세스(Streptomyces) 박테리아, 에르위니아(Erwinia) 박테리아, 클레브시엘라(Klebsiella) 박테리아, 세라티아(Serratia) 박테리아 (예를 들어, 에스. 마르세산스(S. marcessans)), 슈도모나스(Pseudomonas) 박테리아 (예를 들어, 피. 아에루기노사(P. aeruginosa)), 살모넬라(Salmonella) 박테리아 (예를 들어, 에스. 티피무리움(S. typhimurium), 에스. 티피(S. typhi)), 메가스파에라(Megasphaera) 박테리아 (예를 들어, 메가스파에라 엘스데니이(Megasphaera elsdenii))를 포함하나 이에 제한되지는 않는다. 박테리아는 또한 광합성 박테리아 (예를 들어, 녹색 비-황 박테리아 (예를 들어, 코로플렉수스(Choroflexus) 박테리아 (예를 들어, 씨. 아우란티아쿠스(C. aurantiacus)), 클로로네마(Chloronema) 박테리아 (예를 들어, 씨. 기가테움(C. gigateum))), 녹색 황 박테리아 (예를 들어, 클로로비움(Chlorobium) 박테리아 (예를 들어, 씨. 리미콜라(C. limicola)), 펠로딕티온(Pelodictyon) 박테리아 (예를 들어, 피. 루테올룸(P. luteolum)), 자주색 황 박테리아 (예를 들어, 크로마티움(Chromatium) 박테리아 (예를 들어, 씨. 오케니이(C. okenii))), 및 자주색 비-황 박테리아 (예를 들어, 로도스피릴룸(Rhodospirillum) 박테리아 (예를 들어, 알. 루브룸(R. rubrum)), 로도박터(Rhodobacter) 박테리아 (예를 들어, 알. 스파에로이데스(R. sphaeroides), 알. 캅술라투스(R. capsulatus)), 및 로도미크로비움(Rhodomicrobium) 박테리아 (예를 들어, 알. 바넬리이(R. vanellii)))를 포함하나 이에 제한되지는 않는다.
비-미생물 유기체로부터의 세포는 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 이용될 수 있다. 이러한 세포의 예는 곤충 세포 (예를 들어, 드로소필라(Drosophila) (예를 들어, 디. 멜라노가스터(D. melanogaster)), 스포도프테라(Spodoptera) (예를 들어, 에스. 프루기페르다(S. frugiperda) Sf9 또는 Sf21 세포) 및 트리코플루사(Trichoplusa) (예를 들어, 하이-파이브(High-Five) 세포); 선충류 세포 (예를 들어, 씨. 엘레간스(C. elegans) 세포); 조류 세포; 양서류 세포 (예를 들어, 크세노푸스 라에비스(Xenopus laevis) 세포); 파충류 세포; 포유동물 세포 (예를 들어, NIH3T3, 293, CHO, COS, VERO, C127, BHK, Per-C6, 보웨스(Bowes) 흑색종 및 HeLa 세포); 및 식물 세포 (예를 들어, 아라비돕시스 탈리아나(Arabidopsis thaliana), 니코타니아 타바쿰(Nicotania tabacum), 쿠페아 아시니폴리아(Cuphea acinifolia), 쿠페아 아에퀴페탈라(Cuphea aequipetala), 쿠페아 안구스티폴리아(Cuphea angustifolia), 쿠페아 아펜디쿨라타(Cuphea appendiculata), 쿠페아 아비게라(Cuphea avigera), 쿠페아 아비게라 변종 풀케리마(Cuphea avigera var. pulcherrima), 쿠페아 악실리플로라(Cuphea axilliflora), 쿠페아 바히엔시스(Cuphea bahiensis), 쿠페아 바일로니스(Cuphea baillonis), 쿠페아 브라키포다(Cuphea brachypoda), 쿠페아 부스타만타(Cuphea bustamanta), 쿠페아 칼카라타(Cuphea calcarata), 쿠페아 칼로필라(Cuphea calophylla), 쿠페아 칼로필라 아종 메소스테몬(Cuphea calophylla subsp. mesostemon), 쿠페아 카르타게넨시스(Cuphea carthagenensis), 쿠페아 시르카에오이데스(Cuphea circaeoides), 쿠페아 콘페르티플로라(Cuphea confertiflora), 쿠페아 코르다타(Cuphea cordata), 쿠페아 크라시플로라(Cuphea crassiflora), 쿠페아 시아네아(Cuphea cyanea), 쿠페아 데칸드라(Cuphea decandra), 쿠페아 덴티쿨라타(Cuphea denticulata), 쿠페아 디스페르마(Cuphea disperma), 쿠페아 에필로비이폴리아(Cuphea epilobiifolia), 쿠페아 에리코이데스(Cuphea ericoides), 쿠페아 플라바(Cuphea flava), 쿠페아 플라비세툴라(Cuphea flavisetula), 쿠페아 푸크시이폴리아(Cuphea fuchsiifolia), 쿠페아 가우메리(Cuphea gaumeri), 쿠페아 글루티노사(Cuphea glutinosa), 쿠페아 헤테로필라(Cuphea heterophylla), 쿠페아 후케리아나(Cuphea hookeriana), 쿠페아 히소피폴리아(Cuphea hyssopifolia) (멕시칸-히더(Mexican-heather)), 쿠페아 히소포이데스(Cuphea hyssopoides), 쿠페아 이그네아(Cuphea ignea), 쿠페아 인그라타(Cuphea ingrata), 쿠페아 조룰렌시스(Cuphea jorullensis), 쿠페아 란세올라타(Cuphea lanceolata), 쿠페아 리나리오이데스(Cuphea linarioides), 쿠페아 라베아(Cuphea llavea), 쿠페아 로포스토마(Cuphea lophostoma), 쿠페아 루테아(Cuphea lutea), 쿠페아 루테센스(Cuphea lutescens), 쿠페아 멜라늄(Cuphea melanium), 쿠페아 멜빌라(Cuphea melvilla), 쿠페아 미크란타(Cuphea micrantha), 쿠페아 미크로페탈라(Cuphea micropetala), 쿠페아 미물로이데스(Cuphea mimuloides), 쿠페아 니티둘라(Cuphea nitidula), 쿠페아 팔루스트리스(Cuphea palustris), 쿠페아 파르손시아(Cuphea parsonsia), 쿠페아 파스쿠오룸(Cuphea pascuorum), 쿠페아 파우시페탈라(Cuphea paucipetala), 쿠페아 프로쿰벤스(Cuphea procumbens), 쿠페아 슈도실렌(Cuphea pseudosilene), 쿠페아 슈도바시니움(Cuphea pseudovaccinium), 쿠페아 풀크라(Cuphea pulchra), 쿠페아 라세모사(Cuphea racemosa), 쿠페아 레펜스(Cuphea repens), 쿠페아 살리시폴리아(Cuphea salicifolia), 쿠페아 살바도렌시스(Cuphea salvadorensis), 쿠페아 스쿠만니이(Cuphea schumannii), 쿠페아 세실리플로라(Cuphea sessiliflora), 쿠페아 세실리폴리아(Cuphea sessilifolia), 쿠페아 세토사(Cuphea setosa), 쿠페아 스펙타빌리스(Cuphea spectabilis), 쿠페아 스페르마코세(Cuphea spermacoce), 쿠페아 스플렌디다(Cuphea splendida), 쿠페아 스플렌디다 변종 비리디플라바(Cuphea splendida var. viridiflava), 쿠페아 스트리굴로사(Cuphea strigulosa), 쿠페아 수불리게라(Cuphea subuligera), 쿠페아 텔레안드라(Cuphea teleandra), 쿠페아 티모이데스(Cuphea thymoides), 쿠페아 톨루카나(Cuphea tolucana), 쿠페아 우렌스(Cuphea urens), 쿠페아 우트리쿨로사(Cuphea utriculosa), 쿠페아 비스코시시마(Cuphea viscosissima), 쿠페아 왓소니아나(Cuphea watsoniana), 쿠페아 라이티이(Cuphea wrightii), 쿠페아 란세올라타(Cuphea lanceolata))를 포함하나 이에 제한되지는 않는다.
이종 폴리뉴클레오티드에 대한 숙주 유기체 또는 공급원으로서 사용되는 미생물 또는 세포는 상업적으로 입수가능하다. 본원에 기재된 미생물 및 세포, 및 다른 적합한 미생물 및 세포는, 예를 들어 인비트로젠 코포레이션(Invitrogen Corporation) (캘리포니아주 칼스배드), 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (버지니아주 마나사스) 및 애그리컬쳐럴 리서치 컬쳐 콜렉션(Agricultural Research Culture Collection) (NRRL; 일리노이주 피오리아)으로부터 입수가능하다. 숙주 미생물 및 조작된 미생물은 임의의 적합한 형태로 제공될 수 있다. 예를 들어, 이러한 미생물은 1차 배양물일 수 있거나 또는 1회 이상 계대배양 (예를 들어, 희석 및 배양)되었을 수 있는 액체 배양물 또는 고체 배양물 (예를 들어, 한천-기반 배지)로 제공될 수 있다. 미생물은 또한 동결 형태 또는 건조 형태 (예를 들어, 동결건조됨)로 제공될 수 있다. 미생물은 임의의 적합한 농도로 제공될 수 있다.
폴리머라제
폴리머라제의 특히 유용한 기능은 주형으로서 기존 핵산을 사용하여 핵산 가닥의 중합을 촉매하는 것이다. 유용한 다른 기능은 본원의 다른 곳에 기재되어 있다. 유용한 폴리머라제의 예는 DNA 폴리머라제 및 RNA 폴리머라제를 포함한다.
폴리머라제 비천연 핵산의 특이성, 진행성, 또는 다른 특색을 개선시키는 능력은, 예를 들어 증폭, 서열분석, 표지, 검출, 클로닝, 및 많은 다른 것을 포함한 비천연 핵산 혼입이 바람직한 다양한 상황에서 매우 바람직할 것이다.
일부 경우에, 본원에 개시된 것은, 예를 들어 DNA 증폭 동안 비천연 핵산을 성장하는 주형 카피 내로 혼입시키는 폴리머라제를 포함한다. 일부 실시양태에서, 폴리머라제는 폴리머라제의 활성 부위가 변형되어 활성 부위로의 비천연 핵산의 입체 진입 억제를 감소시키도록 변형될 수 있다. 일부 실시양태에서, 폴리머라제는 비천연 핵산의 1개 이상의 비천연 특색과의 상보성을 제공하도록 변형될 수 있다. 이러한 폴리머라제는 세포 내로 UBP를 안정하게 혼입시키기 위해 세포에서 발현되거나 조작될 수 있다. 따라서, 본 개시내용은 이종 또는 재조합 폴리머라제를 포함하는 조성물 및 그의 사용 방법을 포함한다.
폴리머라제는 단백질 조작과 관련된 방법을 사용하여 변형될 수 있다. 예를 들어, 결정 구조에 기초하여 분자 모델링을 수행하여 표적 활성을 변형시키기 위한 돌연변이가 이루어질 수 있는 폴리머라제의 위치를 확인할 수 있다. 대체에 대한 표적으로서 확인된 잔기는 문헌 [Bordo, et al. J Mol Biol 217: 721-729 (1991) and Hayes, et al. Proc Natl Acad Sci, USA 99: 15926- 15931 (2002)]에 기재된 바와 같은 에너지 최소화 모델링, 상동성 모델링 및/또는 보존적 아미노산 치환을 사용하여 선택된 잔기로 대체될 수 있다.
예를 들어, 생물학적 시스템으로부터 단리된 단백질-기반 효소 및 그의 기능적 변이체를 포함한 임의의 다양한 폴리머라제가 본원에 제시된 방법 또는 조성물에 사용될 수 있다. 특정한 폴리머라제, 예컨대 하기 예시된 것에 대한 언급은 달리 나타내지 않는 한 그의 기능적 변이체를 포함하는 것으로 이해될 것이다. 일부 실시양태에서, 폴리머라제는 야생형 폴리머라제이다. 일부 실시양태에서, 폴리머라제는 변형된 또는 돌연변이체 폴리머라제이다.
활성 부위 영역 내로의 비천연 핵산의 진입을 개선시키고 활성 부위 영역 내에서 비천연 뉴클레오티드와 조정하는 특색이 있는 폴리머라제가 또한 사용될 수 있다. 일부 실시양태에서, 변형된 폴리머라제는 변형된 뉴클레오티드 결합 부위를 갖는다.
일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 특이성을 가지며, 이는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 당을 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 변형된 당이 없는 천연 핵산 및/또는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 염기를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 변형된 염기가 없는 천연 핵산 및/또는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 트리포스페이트를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 트리포스페이트를 포함하는 핵산 및/또는 트리포스페이트가 없는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 예를 들어, 변형된 또는 야생형 폴리머라제는 트리포스페이트를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 디포스페이트 또는 모노포스페이트를 갖거나 또는 포스페이트를 갖지 않거나 또는 그의 조합을 갖는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%일 수 있다.
일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대해 완화된 특이성을 갖는다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 당을 포함하는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 염기를 포함하는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다.
엑소뉴클레아제 활성의 부재는 야생형 특징 또는 변이체 또는 조작된 폴리머라제에 의해 부여된 특징일 수 있다. 예를 들어, 엑소 마이너스(exo minus) 클레나우(Klenow) 단편은 3' → 5' 교정 엑소뉴클레아제 활성이 결여된 클레나우 단편의 돌연변이된 버전이다.
본 개시내용의 방법은 내인성 3 → 5' 엑소뉴클레아제 교정 활성이 결여되거나 또는 3 → 5' 엑소뉴클레아제 교정 활성이 예를 들어 돌연변이를 통해 불능화된 임의의 DNA 폴리머라제의 기질 범위를 확장시키는데 사용될 수 있다. DNA 폴리머라제의 예는 polA, polB (예를 들어, 문헌 [Parrel & Loeb, Nature Struc Biol 2001] 참조), polC, polD, polY, polX 및 리버스 트랜스크립타제 (RT)를 포함하지만, 바람직하게는 진행성 고충실도 폴리머라제이다 (PCT/GB2004/004643). 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성을 갖는다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 갖고, 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다.
일부 실시양태에서, 변형된 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성 및 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다.
일부 실시양태에서, 폴리머라제는 핵산으로부터의 그의 해리율에 따라 특징화된다. 일부 실시양태에서, 폴리머라제는 1개 이상의 천연 및 비천연 핵산에 대해 비교적 낮은 해리율을 갖는다. 일부 실시양태에서, 폴리머라제는 1개 이상의 천연 및 비천연 핵산에 대해 비교적 높은 해리율을 갖는다. 해리율은 본원에 제시된 방법에서 반응 속도를 맞추기 위해 조정될 수 있는 폴리머라제의 활성이다.
일부 실시양태에서, 폴리머라제는 특정한 천연 및/또는 비천연 핵산 또는 천연 및/또는 비천연 핵산의 수집물과 함께 사용되는 경우에 그의 충실도에 따라 특징화된다. 충실도는 일반적으로 핵산 주형의 카피를 제조할 때 폴리머라제가 성장하는 핵산 쇄 내로 올바른 핵산을 혼입시키는 정확도를 지칭한다. DNA 폴리머라제 충실도는 폴리머라제-가닥-주형 핵산 2원 복합체 내의 동일한 부위에서 가닥 합성에 대해 경쟁하기 위해 천연 및 비천연 핵산이 예를 들어 동일한 농도로 존재할 때 올바른 천연 및 비천연 핵산 혼입 대 부정확한 천연 및 비천연 핵산 혼입의 비로서 측정될 수 있다. DNA 폴리머라제 충실도는 천연 및 비천연 핵산에 대한 (kcat/Km) 및 부정확한 천연 및 비천연 핵산에 대한 (kcat/Km)의 비로서 계산될 수 있고; 여기서 kcat및 Km은 정상 상태 효소 동역학에서의 미카엘리스-멘텐(Michaelis-Menten) 파라미터이다 (문헌 [Fersht, A. R. (1985) Enzyme Structure and Mechanism, 2nd ed., p 350, W. H. Freeman & Co., New York.], 본원에 참조로 포함됨). 일부 실시양태에서, 폴리머라제는 교정 활성의 존재 또는 부재 하에 적어도 약 100, 1000, 10,000, 100,000, 또는 1x106의 충실도 값을 갖는다.
일부 실시양태에서, 천연 공급원 또는 그의 변이체로부터의 폴리머라제는 특정한 구조를 갖는 비천연 핵산의 혼입을 검출하는 검정을 사용하여 스크리닝된다. 한 예에서, 폴리머라제는 비천연 핵산 또는 UBP; 예를 들어, d5SICSTP, dCNMOTP, dTPT3TP, dNaMTP, dCNMOTP-dTPT3TP, 또는 d5SICSTP-dNaMTP UBP를 혼입시키는 능력에 대해 스크리닝될 수 있다. 야생형 폴리머라제에 비해 비천연 핵산에 대해 변형된 특성을 나타내는 폴리머라제, 예를 들어 이종 폴리머라제가 사용될 수 있다. 예를 들어, 변형된 특성은 예를 들어 Km, kcat, Vmax, 비천연 핵산 (또는 자연 발생 뉴클레오티드)의 존재 하의 폴리머라제 진행도, 비천연 핵산의 존재 하의 폴리머라제에 의한 평균 주형 판독-길이, 비천연 핵산에 대한 폴리머라제의 특이성, 비천연 핵산의 결합 속도, 생성물 (피로포스페이트, 트리포스페이트 등) 방출 속도, 분지화 속도, 또는 그의 임의의 조합일 수 있다. 한 실시양태에서, 변형된 특성은 비천연 핵산에 대해 감소된 Km 및/또는 비천연 핵산에 대해 증가된 kcat/Km 또는 Vmax/Km이다. 유사하게, 폴리머라제는 임의로 야생형 폴리머라제와 비교하여 증가된 비천연 핵산의 결합 속도, 증가된 생성물 방출 속도, 및/또는 감소된 분지화 속도를 갖는다.
동시에, 폴리머라제는 천연 핵산, 예를 들어 A, C, G 및 T를 성장하는 핵산 카피 내로 혼입시킬 수 있다. 예를 들어, 폴리머라제는 임의로 상응하는 야생형 폴리머라제보다 적어도 약 5% (예를 들어, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높은 천연 핵산에 대한 특이적 활성, 및 천연 핵산의 존재 하의 야생형 폴리머라제보다 적어도 5% (예를 들어, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높은 주형의 존재 하의 천연 핵산과의 진행도를 나타낸다. 임의로, 폴리머라제는 야생형 폴리머라제보다 적어도 약 5% (예를 들어, 약 5%, 10%, 25%, 50%, 75% 또는 100% 또는 그 초과) 만큼 높은 자연 발생 뉴클레오티드에 대한 kcat/Km 또는 Vmax/Km을 나타낸다.
특정한 구조의 비천연 핵산을 혼입시키는 능력을 가질 수 있는 본원에 사용된 폴리머라제는 또한 방향적 진화 접근법을 사용하여 생산될 수 있다. 핵산 합성 검정은 임의의 다양한 비천연 핵산에 대한 특이성을 갖는 폴리머라제 변이체를 스크리닝하는데 사용될 수 있다. 예를 들어, 폴리머라제 변이체는 DNA 주형에서 비천연 뉴클레오티드 반대편에 비천연 뉴클레오시드 트리포스페이트; 예를 들어, dCNMO 반대편에 dTPT3TP, dTPT3 반대편에 dCNMOTP, dTPT3 반대편에 NaMTP, 또는 dCNMO 또는 dNaM 반대편에 TAT1TP를 혼입시키는 능력에 대해 스크리닝될 수 있다. 일부 실시양태에서, 이러한 검정은, 예를 들어 재조합 폴리머라제 변이체를 사용하는 시험관내 검정이다. 일부 실시양태에서, 이러한 검정은 예를 들어 세포에서 폴리머라제 변이체를 발현시키는 생체내 검정이다. 이러한 방향적 진화 기술은 본원에 제시된 임의의 비천연 핵산에 대한 활성에 대해 임의의 적합한 폴리머라제의 변이체를 스크리닝하는데 사용될 수 있다. 일부 경우에, 본원에 사용된 폴리머라제는 비천연 리보뉴클레오티드를 핵산, 예컨대 RNA 내로 혼입시키는 능력을 갖는다. 예를 들어, NaM 또는 TAT1 리보뉴클레오티드는 본원에 기재된 폴리머라제를 사용하여 핵산 내로 혼입된다.
기재된 조성물의 변형된 폴리머라제는 임의로 변형된 및/또는 재조합 Φ29-유형 DNA 폴리머라제일 수 있다. 임의로, 폴리머라제는 변형된 및/또는 재조합 Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722, 또는 L17 폴리머라제일 수 있다.
기재된 조성물의 변형된 폴리머라제는 임의로 변형된 및/또는 재조합 원핵 DNA 폴리머라제, 예를 들어 DNA 폴리머라제 II (Pol II), DNA 폴리머라제 III (Pol III), DNA 폴리머라제 IV (Pol IV), DNA 폴리머라제 V (Pol V)일 수 있다. 일부 실시양태에서, 변형된 폴리머라제는 비-지시적 손상된 뉴클레오티드에 걸쳐 DNA 합성을 매개하는 폴리머라제를 포함한다. 일부 실시양태에서, Pol I, Pol II (polB), Pol IV (dinB) 및/또는 Pol V (umuCD)를 코딩하는 유전자는 조작된 세포 또는 SSO에서 구성적으로 발현되거나 또는 과다발현된다. 일부 실시양태에서, Pol II의 발현 또는 과다발현의 증가는 조작된 세포 또는 SSO에서의 비천연 염기 쌍 (UBP)의 증가된 보유에 기여한다.
본 개시내용에 일반적으로 유용한 핵산 폴리머라제는 DNA 폴리머라제, RNA 폴리머라제, 리버스 트랜스크립타제, 및 그의 돌연변이체 또는 변경된 형태를 포함한다. DNA 폴리머라제 및 그의 특성은 특히 문헌 [DNA Replication 2nd edition, Kornberg and Baker, W. H. Freeman, New York, N. Y. (1991)]에 상세히 기재되어 있다. 본 개시내용에 유용한 공지된 통상적인 DNA 폴리머라제는 피로코쿠스 푸리오수스(Pyrococcus furiosus) (Pfu) DNA 폴리머라제 (Lundberg et al., 1991, Gene, 108:1, Stratagene), 피로코쿠스 와에세이(Pyrococcus woesei) (Pwo) DNA 폴리머라제 (Hinnisdaels et al., 1996, Biotechniques, 20:186-8, Boehringer Mannheim), 써무스 써모필루스(Thermus thermophilus) (Tth) DNA 폴리머라제 (Myers and Gelfand 1991, Biochemistry 30:7661), 바실루스 스테아로써모필루스(Bacillus stearothermophilus) DNA 폴리머라제 (Stenesh and McGowan, 1977, Biochim Biophys Acta 475:32), 써모코쿠스 리토랄리스(Thermococcus litoralis) (TIi) DNA 폴리머라제 (벤트(Vent)™ DNA 폴리머라제로도 지칭됨, 문헌 [Cariello et al., 1991, Polynucleotides Res, 19: 4193, New England Biolabs]), 9°Nm™ DNA 폴리머라제 (뉴 잉글랜드 바이오랩스(New England Biolabs)), 스토펠(Stoffel) 단편, 써모 시쿼나제(Thermo Sequenase)® (아머샴 파마시아 바이오테크 유케이(Amersham Pharmacia Biotech UK)), 써미네이터(Therminator)™ (뉴 잉글랜드 바이오랩스), 써모토가 마리티마(Thermotoga maritima) (Tma) DNA 폴리머라제 (Diaz and Sabino, 1998 Braz J Med. Res, 31 :1239), 써무스 아쿠아티쿠스(Thermus aquaticus) (Taq) DNA 폴리머라제 (Chien et al., 1976, J. Bacteoriol, 127: 1550), DNA 폴리머라제, 피로코쿠스 코다카라엔시스(Pyrococcus kodakaraensis) KOD DNA 폴리머라제 (Takagi et al., 1997, Appl. Environ. Microbiol. 63:4504)], JDF-3 DNA 폴리머라제 (써모코쿠스 종 JDF-3 유래, 특허 출원 WO 0132887), 피로코쿠스 GB-D (PGB-D) DNA 폴리머라제 (딥 벤트(Deep Vent)™ DNA 폴리머라제로도 지칭됨, 문헌 [Juncosa-Ginesta et al., 1994, Biotechniques, 16:820, New England Biolabs]), 울트마(UlTma) DNA 폴리머라제 (써모필레 써모토가 마리티마(thermophile Thermotoga maritima) 유래; 문헌 [Diaz and Sabino, 1998 Braz J. Med. Res, 31 :1239; PE Applied Biosystems]), Tgo DNA 폴리머라제 (써모코쿠스 고르고나리우스(thermococcus gorgonarius), 로슈 몰레큘라 바이오케미칼스(Roche Molecular Biochemicals)), 이. 콜라이 DNA 폴리머라제 I (Lecomte and Doubleday, 1983, Polynucleotides Res. 11 :7505), T7 DNA 폴리머라제 (Nordstrom et al., 1981, J Biol. Chem. 256:3112), 및 고세균 DP1I/DP2 DNA 폴리머라제 II (Cann et al., 1998, Proc. Natl. Acad. Sci. USA 95:14250])를 포함한다. 중온성 폴리머라제 및 고온성 폴리머라제 둘 다가 고려된다. 고온성 DNA 폴리머라제는 써모시쿼나제®, 9°Nm™, 써미네이터™, Taq, Tne, Tma, Pfu, TfI, Tth, TIi, 스토펠 단편, 벤트™ 및 딥 벤트™ DNA 폴리머라제, KOD DNA 폴리머라제, Tgo, JDF-3, 및 그의 돌연변이체, 변이체 및 유도체를 포함하나 이에 제한되지는 않는다. 3' 엑소뉴클레아제-결핍 돌연변이체인 폴리머라제가 또한 고려된다. 본 개시내용에 유용한 리버스 트랜스크립타제는 HIV, HTLV-I, HTLV-II, FeLV, FIV, SIV, AMV, MMTV, MoMuLV 및 다른 레트로바이러스로부터의 리버스 트랜스크립타제를 포함하나 이에 제한되지는 않는다 (문헌 [Levin, Cell 88:5-8 (1997); Verma, Biochim Biophys Acta. 473:1-38 (1977); Wu et al., CRC Crit Rev Biochem. 3:289-347 (1975)] 참조). 폴리머라제의 추가의 예는 9°N™ DNA 폴리머라제, Taq DNA 폴리머라제, 퓨전(Phusion)® DNA 폴리머라제, Pfu DNA 폴리머라제, RB69 DNA 폴리머라제, KOD DNA 폴리머라제, 및 벤트(Vent)® DNA 폴리머라제를 포함하나 이에 제한되지는 않는다 (Gardner et al. (2004) "Comparative Kinetics of Nucleotide Analog Incorporation by Vent DNA Polymerase" J. Biol. Chem., 279(12), 11834-11842; Gardner and Jack "Determinants of nucleotide sugar recognition in an archaeon DNA polymerase" Nucleic Acids Research, 27(12) 2545-2553). 비-고온성 유기체로부터 단리된 폴리머라제는 열 불활성화가능할 수 있다. 예는 파지로부터의 DNA 폴리머라제이다. 임의의 다양한 공급원으로부터의 폴리머라제는 고온 조건에 대한 그의 내성을 증가 또는 감소시키도록 변형될 수 있는 것으로 이해될 것이다. 일부 실시양태에서, 폴리머라제는 고온성일 수 있다. 일부 실시양태에서, 고온성 폴리머라제는 열 불활성화가능할 수 있다. 고온성 폴리머라제는 전형적으로 고온 조건 또는 열순환 조건, 예컨대 폴리머라제 연쇄 반응 (PCR) 기술에 사용되는 조건에 유용하다.
일부 실시양태에서, 폴리머라제는 Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722, L17, 써모시쿼나제®, 9°Nm™, 써미네이터™ DNA 폴리머라제, Tne, Tma, TfI, Tth, TIi, 스토펠 단편, 벤트™ 및 딥 벤트™ DNA 폴리머라제, KOD DNA 폴리머라제, Tgo, JDF-3, Pfu, Taq, T7 DNA 폴리머라제, T7 RNA 폴리머라제, PGB-D, 울트마 DNA 폴리머라제, 이. 콜라이 DNA 폴리머라제 I, 이. 콜라이 DNA 폴리머라제 III, 고세균 DP1I/DP2 DNA 폴리머라제 II, 9°N™ DNA 폴리머라제, Taq DNA 폴리머라제, 퓨전® DNA 폴리머라제, Pfu DNA 폴리머라제, SP6 RNA 폴리머라제, RB69 DNA 폴리머라제, 조류 골수모구증 바이러스 (AMV) 리버스 트랜스크립타제, 몰로니 뮤린 백혈병 바이러스 (MMLV) 리버스 트랜스크립타제, 슈퍼스크립트(SuperScript)® II 리버스 트랜스크립타제, 및 슈퍼스크립트® III 리버스 트랜스크립타제를 포함한다.
일부 실시양태에서, 폴리머라제는 DNA 폴리머라제 I (또는 클레노우 단편), 벤트 폴리머라제, 퓨전® DNA 폴리머라제, KOD DNA 폴리머라제, Taq 폴리머라제, T7 DNA 폴리머라제, T7 RNA 폴리머라제, 써미네이터™ DNA 폴리머라제, POLB 폴리머라제, SP6 RNA 폴리머라제, 이. 콜라이 DNA 폴리머라제 I, 이. 콜라이 DNA 폴리머라제 III, 조류 골수모세포증 바이러스 (AMV) 리버스 트랜스크립타제, 몰로니 뮤린 백혈병 바이러스 (MMLV) 리버스 트랜스크립타제, 슈퍼스크립트® II 리버스 트랜스크립타제, 또는 슈퍼스크립트® III 리버스 트랜스크립타제이다.
뉴클레오티드 수송체
뉴클레오티드 수송체 (NT)는 세포막 및 소포를 가로지르는 뉴클레오티드 기질의 전달을 용이하게 하는 막 수송 단백질의 군이다. 일부 실시양태에서, 2가지 유형의 NT, 즉 집중성 뉴클레오시드 수송체 및 평형화 뉴클레오시드 수송체가 존재한다. 일부 경우에, NT는 또한 유기 음이온 수송체 (OAT) 및 유기 양이온 수송체 (OCT)를 포함한다. 일부 경우에, 뉴클레오티드 수송체는 뉴클레오시드 트리포스페이트 수송체 (NTT)이다.
일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체 (NTT)는 박테리아, 식물 또는 조류로부터의 것이다. 일부 실시양태에서, 뉴클레오티드 뉴클레오시드 트리포스페이트 수송체는 TpNTT1, TpNTT2, TpNTT3, TpNTT4, TpNTT5, TpNTT6, TpNTT7, TpNTT8 (티. 슈도나나(T. pseudonana)), PtNTT1, PtNTT2, PtNTT3, PtNTT4, PtNTT5, PtNTT6 (피. 트리코르누툼(P. tricornutum)), GsNTT (갈디에리아 술푸라리아(Galdieria sulphuraria)), AtNTT1, AtNTT2 (아라비돕시스 탈리아나), CtNTT1, CtNTT2 (클라미디아 트라코마티스(Chlamydia trachomatis)), PamNTT1, PamNTT2 (프로토클라미디아 아메보필라(Protochlamydia amoebophila)), CcNTT (카에디박터 카리오필루스(Caedibacter caryophilus)), 또는 RpNTT1 (리케치아 프로와제키이(Rickettsia prowazekii))이다. 일부 실시양태에서, NTT는 CNT1, CNT2, CNT3, ENT1, ENT2, OAT1, OAT3 또는 OCT1이다. 일부 경우에, NTT는 PtNTT1, PtNTT2, PtNTT3, PtNTT4, PtNTT5 또는 PtNTT6이다.
일부 실시양태에서, NTT는 비천연 핵산을 유기체, 예를 들어 세포 내로 유입시킨다. 일부 실시양태에서, NTT는 NTT의 뉴클레오티드 결합 부위가 변형되어 뉴클레오티드 결합 부위로의 비천연 핵산의 입체 진입 억제를 감소시키도록 변형될 수 있다. 일부 실시양태에서, NTT는 비천연 핵산의 1개 이상의 천연 또는 비천연 특색과의 증가된 상호작용을 제공하도록 변형될 수 있다. 이러한 NTT는 세포 내로 UBP를 안정하게 유입시키기 위해 세포에서 발현되거나 조작될 수 있다. 따라서, 본 개시내용은 이종 또는 재조합 NTT를 포함하는 조성물 및 그의 사용 방법을 포함한다.
NTT는 단백질 조작과 관련된 방법을 사용하여 변형될 수 있다. 예를 들어, 분자 모델링은 표적 활성 또는 결합 부위를 변형시키기 위해 돌연변이가 이루어질 수 있는 NTT의 위치를 확인하기 위해 결정 구조에 기초하여 수행될 수 있다. 대체에 대한 표적으로서 확인된 잔기는 문헌 [Bordo, et al. J Mol Biol 217: 721-729 (1991) 및 Hayes, et al. Proc Natl Acad Sci, USA 99:15926- 15931 (2002)]에 기재된 바와 같은 에너지 최소화 모델링, 상동성 모델링 및/또는 보존적 아미노산 치환을 사용하여 선택된 잔기로 대체될 수 있다.
예를 들어, 생물계로부터 단리된 단백질-기반 효소 및 그의 기능적 변이체를 포함한 임의의 다양한 NTT가 본원에 제시된 방법 또는 조성물에 사용될 수 있다. 특정한 NTT, 예컨대 하기 예시된 것에 대한 언급은 달리 나타내지 않는 한 그의 기능적 변이체를 포함하는 것으로 이해될 것이다. 일부 실시양태에서, NTT는 야생형 NTT이다. 일부 실시양태에서, NTT는 변형된 또는 돌연변이체 NTT이다.
일부 실시양태에서, 본원에 사용된 변형된 또는 돌연변이된 NTT는 N-말단에서, C-말단에서, 또는 N 및 C-말단 둘 다에서 말단절단된 NTT이다. 일부 실시양태에서, 말단절단된 NTT는 말단절단되지 않은 NTT에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85% 또는 적어도 90% 동일하다. 일부 경우에, 본원에 사용된 NTT는 PtNTT1, PtNTT2, PtNTT3, PtNTT4, PtNTT5 또는 PtNTT6이다. 일부 경우에, 본원에 사용된 PtNTT는 N-말단에서, C-말단에서, 또는 N 및 C-말단 둘 다에서 말단절단된다. 일부 실시양태에서, 말단절단된 PtNTT는 비말단절단된 PtNTT에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85% 또는 적어도 90% 동일하다. 일부 경우에, 본원에 사용된 NTT는 말단절단된 PtNTT2이며, 여기서 말단절단된 PtNTT2는 비말단절단된 PtNTT2의 아미노산 서열에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 비말단절단된 PtNTT2 (NCBI 수탁 번호 EEC49227.1, GI:217409295)의 예는 서열식별번호: 1의 아미노산 서열을 갖는다.
비천연 핵산의 세포 내로의 진입을 개선시키고 뉴클레오티드 결합 영역 내의 비천연 뉴클레오티드와 조화시키기 위한 특색이 있는 NTT가 또한 사용될 수 있다. 일부 실시양태에서, 변형된 NTT는 변형된 뉴클레오티드 결합 부위를 갖는다. 일부 실시양태에서, 변형된 또는 야생형 NTT는 비천연 핵산에 대해 완화된 특이성을 갖는다. 예를 들어, NTT는 임의로 비천연 뉴클레오티드에 대한 특이적 유입 활성을 나타내며, 이는 상응하는 야생형 NTT보다 적어도 약 0.1% (예를 들어, 약 0.1%, 0.2%, 0.5%, 0.8%, 1%, 1.1%, 1.2%, 1.5%, 1.8%, 2%, 3%, 4%, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높다. 임의로, NTT는 야생형 NTT보다 적어도 약 0.1% (예를 들어, 약 0.1%, 0.2%, 0.5%, 0.8%, 1%, 1.1%, 1.2%, 1.5%, 1.8%, 2%, 3%, 4%, 5%, 10%, 25%, 50%, 75% 또는 100% 또는 그 초과) 만큼 높은 비천연 뉴클레오티드에 대한 kcat/Km 또는 Vmax/Km을 나타낸다.
NTT는 트리포스페이트에 대한 그의 친화도 (즉, Km) 및/또는 유입 속도 (즉, Vmax)에 따라 특징화될 수 있다. 일부 실시양태에서, NTT는 1개 이상의 천연 및 비천연 트리포스페이트에 대해 비교적 Km 또는 Vmax를 갖는다. 일부 실시양태에서 NTT는 1개 이상의 천연 및 비천연 트리포스페이트에 대해 비교적 높은 Km 또는 Vmax를 갖는다.
천연 공급원으로부터의 NTT 또는 그의 변이체는 트리포스페이트의 양을 검출하는 검정을 사용하여 (트리포스페이트가 적합하게 표지된 경우에 질량 분광측정법 또는 방사능을 사용하여) 스크리닝될 수 있다. 한 예에서, NTT는 비천연 트리포스페이트; 예를 들어, dTPT3TP, dCNMOTP, d5SICSTP, dNaMTP, NaMTP, 및/또는 TPT1TP를 유입시키는 능력에 대해 스크리닝될 수 있다. 야생형 NTT와 비교하여 비천연 핵산에 대해 변형된 특성을 나타내는 NTT, 예를 들어 이종 NTT가 사용될 수 있다. 예를 들어, 변형된 특성은 예를 들어 트리포스페이트 유입에 대한 Km, kcat, Vmax일 수 있다. 한 실시양태에서, 변형된 특성은 비천연 트리포스페이트의 경우 감소된 Km 및/또는 비천연 트리포스페이트의 경우 증가된 kcat/Km 또는 Vmax/Km이다. 유사하게, NTT는 임의로 야생형 NTT와 비교하여 증가된 비천연 트리포스페이트의 결합 속도, 증가된 세포내 방출 속도, 및/또는 증가된 세포 유입 속도를 갖는다.
동시에, NTT는 천연 트리포스페이트, 예를 들어 dATP, dCTP, dGTP, dTTP, ATP, CTP, GTP 및/또는 TTP를 세포 내로 유입시킬 수 있다. 일부 경우에, NTT는 임의로 복제 및 전사를 뒷받침할 수 있는 천연 핵산에 대한 특이적 유입 활성을 나타낸다. 일부 실시양태에서, NTT는 임의로 복제 및 전사를 뒷받침할 수 있는 천연 핵산에 대한 kcat/Km 또는 Vmax/Km를 나타낸다.
특정한 구조의 비천연 트리포스페이트를 유입시키는 능력을 가질 수 있는 본원에 사용된 NTT는 또한 방향적 진화 접근법을 사용하여 생산될 수 있다. 핵산 합성 검정은 임의의 다양한 비천연 트리포스페이트에 대한 특이성을 갖는 NTT 변이체를 스크리닝하는데 사용될 수 있다. 예를 들어, NTT 변이체는 비천연 트리포스페이트; 예를 들어, d5SICSTP, dNaMTP, dCNMOTP, dTPT3TP, NaMTP, 및/또는 TPT1TP를 유입시키는 능력에 대해 스크리닝될 수 있다. 일부 실시양태에서, 이러한 검정은, 예를 들어 재조합 NTT 변이체를 사용하는 시험관내 검정이다. 일부 실시양태에서, 이러한 검정은 예를 들어 세포에서 NTT 변이체를 발현하는 생체내 검정이다. 이러한 기술은 본원에 제시된 임의의 비천연 트리포스페이트에 대한 활성에 대해 임의의 적합한 NTT의 변이체를 스크리닝하는데 사용될 수 있다.
핵산 시약 & 도구
본원에 기재된 방법, 세포 또는 조작된 미생물에 사용하기 위한 뉴클레오티드 및/또는 핵산 시약 (또는 폴리뉴클레오티드)은 비천연 뉴클레오티드를 갖거나 갖지 않는 1개 이상의 ORF를 포함한다. ORF는 임의의 적합한 공급원, 때때로 게놈 DNA, mRNA, 역전사된 RNA 또는 상보적 DNA (cDNA) 또는 상기 중 하나 이상을 포함하는 핵산 라이브러리로부터의 것일 수 있고, 관심 핵산 서열, 관심 단백질 또는 관심 활성을 함유하는 임의의 유기체 종으로부터의 것이다. ORF가 수득될 수 있는 유기체의 비제한적 예는, 예를 들어 박테리아, 효모, 진균, 인간, 곤충, 선충류, 소, 말, 개, 고양이, 래트 또는 마우스를 포함한다. 일부 실시양태에서, 본원에 기재된 뉴클레오티드 및/또는 핵산 시약 또는 다른 시약은 단리 또는 정제된다. 공개된 시험관내 방법을 통해 비천연 뉴클레오티드를 포함하는 ORF가 생성될 수 있다. 일부 경우에, 뉴클레오티드 또는 핵산 시약은 비천연 핵염기를 포함한다.
핵산 시약은 때때로 ORF와 함께 번역되고 아미노산 태그를 코딩하는 ORF에 인접한 뉴클레오티드 서열을 포함한다. 태그-코딩 뉴클레오티드 서열은 핵산 시약 중 ORF의 3' 및/또는 5'에 위치함으로써, ORF에 의해 코딩된 단백질 또는 펩티드의 C-말단 또는 N-말단에 태그를 코딩한다. 시험관내 전사 및/또는 번역을 무효화하지 않는 임의의 태그가 이용될 수 있고, 관련 기술분야의 통상의 기술자에 의해 적절하게 선택될 수 있다. 태그는 배양 또는 발효 배지로부터 목적하는 ORF 생성물의 단리 및/또는 정제를 용이하게 할 수 있다. 일부 경우에, 핵산 시약의 라이브러리가 본원에 기재된 방법 및 조성물과 함께 사용된다. 예를 들어, 적어도 100, 1000, 2000, 5000, 10,000, 또는 50,000개 초과의 고유한 폴리뉴클레오티드의 라이브러리가 라이브러리에 존재하며, 여기서 각각의 폴리뉴클레오티드는 적어도 1종의 비천연 핵염기를 포함한다.
비천연 뉴클레오티드를 갖거나 갖지 않는 핵산 또는 핵산 시약은 종종 핵산의 의도된 용도에 따라 선택되는 특정 요소, 예를 들어 조절 요소를 포함할 수 있다. 하기 요소 중 임의의 것이 핵산 시약에 포함되거나 그로부터 배제될 수 있다. 핵산 시약은, 예를 들어 하기 뉴클레오티드 요소 중 하나 이상 또는 모두를 포함할 수 있다: 1개 이상의 프로모터 요소, 1개 이상의 5' 비번역 영역 (5'UTR), 표적 뉴클레오티드 서열이 삽입될 수 있는 1개 이상의 영역 ("삽입 요소"), 1개 이상의 표적 뉴클레오티드 서열, 1개 이상의 3' 비번역 영역 (3'UTR), 및 1개 이상의 선택 요소. 핵산 시약에는 1개 이상의 상기 요소가 제공될 수 있고, 다른 요소는 핵산이 목적하는 유기체 내로 도입되기 전에 핵산 내로 삽입될 수 있다. 일부 실시양태에서, 제공된 핵산 시약은 프로모터, 5'UTR, 임의적인 3'UTR, 및 표적 뉴클레오티드 서열이 뉴클레오티드 산 시약 내로 삽입되는 (즉, 클로닝되는) 삽입 요소(들)를 포함한다. 특정 실시양태에서, 제공된 핵산 시약은 프로모터, 삽입 요소(들) 및 임의적인 3'UTR을 포함하고, 5'UTR/표적 뉴클레오티드 서열은 임의적인 3'UTR과 함께 삽입된다. 요소는 선택된 발현 시스템에서의 발현 (예를 들어, 선택된 유기체에서의 발현, 또는 예를 들어 무세포 시스템에서의 발현)에 적합한 임의의 순서로 배열될 수 있고, 일부 실시양태에서 핵산 시약은 5'에서 3' 방향으로 하기 요소를 포함한다: (1) 프로모터 요소, 5'UTR, 및 삽입 요소(들); (2) 프로모터 요소, 5'UTR, 및 표적 뉴클레오티드 서열; (3) 프로모터 요소, 5'UTR, 삽입 요소(들) 및 3'UTR; 및 (4) 프로모터 요소, 5'UTR, 표적 뉴클레오티드 서열 및 3'UTR. 일부 실시양태에서, UTR은 완전히 천연이거나 또는 비천연 뉴클레오티드를 함유하는 ORF의 전사 또는 번역을 변경 또는 증가시키도록 최적화될 수 있다.
핵산 시약, 예를 들어 발현 카세트 및/또는 발현 벡터는 프로모터, 인핸서, 번역 개시 서열, 전사 종결 서열 및 다른 요소를 포함한 다양한 조절 요소를 포함할 수 있다. "프로모터"는 일반적으로 전사 개시 부위에 관하여 비교적 고정된 위치에 있을 때 기능하는 DNA의 서열 또는 서열들이다. 예를 들어, 프로모터는 뉴클레오티드 트리포스페이트 수송체 핵산 절편의 상류에 있을 수 있다. "프로모터"는 RNA 폴리머라제 및 전사 인자의 기본 상호작용에 필요한 코어 요소를 함유하고, 상류 요소 및 반응 요소를 함유할 수 있다. "인핸서"는 일반적으로 전사 개시 부위로부터 고정되지 않은 거리에서 기능하고 전사 단위에 대해 5' 또는 3"일 수 있는 DNA의 서열을 지칭한다. 또한, 인핸서는 코딩 서열 그 자체의 내부뿐만 아니라 인트론 내부에서도 존재할 수 있다. 이들은 통상적으로 길이가 10 내지 300이고, 시스로 기능한다. 인핸서는 인근 프로모터로부터의 전사를 증가시키는 기능을 한다. 인핸서는 프로모터와 같이 종종 전사의 조절을 매개하는 반응 요소도 함유한다. 인핸서는 종종 발현의 조절을 결정하며, 완전히 천연이거나 또는 비천연 뉴클레오티드를 함유하는 ORF를 포함한 ORF 발현을 변경 또는 최적화하는데 사용될 수 있다.
상기 언급된 바와 같이, 핵산 시약은 또한 1개 이상의 5'UTR, 및 1개 이상의 3'UTR을 포함할 수 있다. 예를 들어, 진핵 숙주 세포 (예를 들어, 효모, 진균, 곤충, 식물, 동물, 인간 또는 유핵 세포) 및 원핵 숙주 세포 (예를 들어, 바이러스, 박테리아)에 사용되는 발현 벡터는 mRNA 발현에 영향을 미칠 수 있는 전사의 종결을 신호하는 서열을 함유할 수 있다. 이들 영역은 조직 인자 단백질을 코딩하는 mRNA의 비번역 부분에서 폴리아데닐화 절편으로서 전사될 수 있다. 3" 비번역 영역은 또한 전사 종결 부위를 포함한다. 일부 바람직한 실시양태에서, 전사 단위는 폴리아데닐화 영역을 포함한다. 이 영역의 한 가지 이점은 전사된 단위가 mRNA와 같이 프로세싱되고 수송될 가능성을 증가시킨다는 것이다. 발현 구축물에서 폴리아데닐화 신호의 확인 및 사용은 잘 확립되어 있다. 일부 바람직한 실시양태에서, 상동성 폴리아데닐화 신호가 트랜스진 구축물에 사용될 수 있다.
5'UTR은 그것이 기원하는 뉴클레오티드 서열에 내인성인 1개 이상의 요소를 포함할 수 있고, 때때로 1개 이상의 외인성 요소를 포함한다. 5'UTR은 예를 들어 임의의 적합한 유기체 (예를 들어, 바이러스, 박테리아, 효모, 진균, 식물, 곤충 또는 포유동물)로부터의, 임의의 적합한 핵산, 예컨대 게놈 DNA, 플라스미드 DNA, RNA 또는 mRNA로부터 기원할 수 있다. 관련 기술분야의 통상의 기술자는 선택된 발현 시스템 (예를 들어, 선택된 유기체에서의 발현, 또는 예를 들어 무세포 시스템에서의 발현)에 기초하여 5'UTR에 대한 적절한 요소를 선택할 수 있다. 5'UTR은 때때로 관련 기술분야의 통상의 기술자에게 공지된 하기 요소 중 1개 이상을 포함한다: 인핸서 서열 (예를 들어, 전사 또는 번역), 전사 개시 부위, 전사 인자 결합 부위, 번역 조절 부위, 번역 개시 부위, 번역 인자 결합 부위, 보조 단백질 결합 부위, 피드백 조절 작용제 결합 부위, 프리브노우(Pribnow) 박스, TATA 박스, -35 요소, E-박스 (헬릭스-루프-헬릭스 결합 요소), 리보솜 결합 부위, 레플리콘, 내부 리보솜 진입 부위 (IRES), 사일렌서 요소 등. 일부 실시양태에서, 프로모터 요소는 적절한 조건부 조절에 필요한 모든 5'UTR 요소가 프로모터 요소 단편 내에 또는 프로모터 요소 단편의 기능적 하위서열 내에 함유되도록 단리될 수 있다.
핵산 시약 내의 5'UTR은 번역 인핸서 뉴클레오티드 서열을 포함할 수 있다. 번역 인핸서 뉴클레오티드 서열은 종종 핵산 시약에서 프로모터와 표적 뉴클레오티드 서열 사이에 위치한다. 번역 인핸서 서열은 종종 리보솜에 결합하고, 때때로 18S rRNA-결합 리보뉴클레오티드 서열 (즉, 40S 리보솜 결합 서열)이고, 때때로 내부 리보솜 진입 서열 (IRES)이다. IRES는 일반적으로 다수의 특이적 분자간 상호작용을 통해 40S 리보솜 서브유닛과 접촉하는 정확하게 배치된 RNA 3차 구조를 갖는 RNA 스캐폴드를 형성한다. 리보솜 인핸서 서열의 예는 공지되어 있고, 관련 기술분야의 통상의 기술자에 의해 확인될 수 있다 (예를 들어, 문헌 [Mignone et al., Nucleic Acids Research 33: D141-D146 (2005); Paulous et al., Nucleic Acids Research 31: 722-733 (2003); Akbergenov et al., Nucleic Acids Research 32: 239-247 (2004); Mignone et al., Genome Biology 3(3): reviews0004.1-0001.10 (2002); Gallie, Nucleic Acids Research 30: 3401-3411 (2002); Shaloiko et al., DOI: 10.1002/bit.20267; 및 Gallie et al., Nucleic Acids Research 15: 3257-3273 (1987)]).
번역 인핸서 서열은 때때로 진핵 서열, 예컨대 코작(Kozak) 컨센서스 서열 또는 다른 서열 (예를 들어, 히드로이드 폴립 서열, 진뱅크(GenBank) 수탁 번호 U07128)이다. 번역 인핸서 서열은 때때로 원핵 서열, 예컨대 샤인-달가노(Shine-Dalgarno) 컨센서스 서열이다. 특정 실시양태에서, 번역 인핸서 서열은 바이러스 뉴클레오티드 서열이다. 번역 인핸서 서열은 때때로 예를 들어 식물 바이러스, 예컨대 담배 모자이크 바이러스 (TMV), 알팔파 모자이크 바이러스 (AMV); 담배 식각 바이러스 (ETV); 감자 바이러스 Y (PVY); 순무 모자이크 (포티) 바이러스 및 완두 종자 매개 모자이크 바이러스의 5'UTR로부터의 것이다. 특정 실시양태에서, TMV로부터의 약 67개 염기 길이의 오메가 서열이 번역 인핸서 서열 (예를 들어, 구아노신 뉴클레오티드가 없고, 25개 뉴클레오티드 길이의 폴리 (CAA) 중심 영역을 포함함)로서 핵산 시약에 포함된다.
3'UTR은 그것이 기원하는 뉴클레오티드 서열에 내인성인 1개 이상의 요소를 포함할 수 있고, 때때로 1개 이상의 외인성 요소를 포함한다. 3'UTR은 임의의 적합한 핵산, 예컨대 게놈 DNA, 플라스미드 DNA, RNA 또는 mRNA로부터, 예를 들어 임의의 적합한 유기체 (예를 들어, 바이러스, 박테리아, 효모, 진균, 식물, 곤충 또는 포유동물)로부터 기원할 수 있다. 관련 기술분야의 통상의 기술자는 선택된 발현 시스템 (예를 들어, 선택된 유기체에서의 발현)에 기초하여 3'UTR에 대한 적절한 요소를 선택할 수 있다. 3'UTR은 때때로 관련 기술분야의 통상의 기술자에게 공지된 하기 요소 중 1개 이상을 포함한다: 전사 조절 부위, 전사 개시 부위, 전사 종결 부위, 전사 인자 결합 부위, 번역 조절 부위, 번역 종결 부위, 번역 개시 부위, 번역 인자 결합 부위, 리보솜 결합 부위, 레플리콘, 인핸서 요소, 사일렌서 요소 및 폴리아데노신 테일. 3'UTR은 때때로 폴리아데노신 테일을 포함하고, 때로는 이를 포함하지 않으며, 폴리아데노신 테일이 존재하는 경우에, 1개 이상의 아데노신 모이어티가 부가 또는 그로부터 결실될 수 있다 (예를 들어, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 35, 약 40, 약 45 또는 약 50개의 아데노신 모이어티가 부가 또는 제거될 수 있음).
일부 실시양태에서, 5'UTR 및/또는 3'UTR의 변형은 프로모터의 활성을 변경 (예를 들어, 증가, 부가, 감소 또는 실질적으로 제거)하기 위해 사용된다. 프로모터 활성의 변경은 다시 변형된 5' 또는 3'UTR을 포함하는 작동가능하게 연결된 프로모터 요소로부터의 관심 뉴클레오티드 서열(들)의 전사에서의 변화에 의해 펩티드, 폴리펩티드 또는 단백질의 활성 (예를 들어, 효소 활성)을 변경시킬 수 있다. 예를 들어, 특정 실시양태에서, 신규 활성 (예를 들어, 숙주 유기체에서 정상적으로 발견되지 않는 활성)을 부가할 수 있거나 또는 관심 뉴클레오티드 서열 (예를 들어, 관심 상동 또는 이종 뉴클레오티드 서열)에 작동가능하게 연결된 상동 또는 이종 프로모터로부터의 전사를 증가시킴으로써 기존 활성의 발현을 증가시킬 수 있는 변형된 5' 또는 3'UTR을 포함하는 핵산 시약이 발현되도록 유전자 변형에 의해 미생물이 조작될 수 있다. 일부 실시양태에서, 미생물은 특정 실시양태에서 관심 뉴클레오티드 서열에 작동가능하게 연결된 상동성 또는 이종성 프로모터로부터의 전사를 감소시키거나 또는 실질적으로 제거함으로써 활성의 발현을 감소시킬 수 있는 변형된 5' 또는 3'UTR을 포함하는 핵산 시약을 발현하도록 유전자 변형에 의해 조작될 수 있다.
발현 카세트 또는 발현 벡터로부터의 뉴클레오티드 트리포스페이트 수송체의 발현은 원핵 세포 또는 진핵 세포에서 발현할 수 있는 임의의 프로모터에 의해 제어될 수 있다. 프로모터 요소는 전형적으로 DNA 합성 및/또는 RNA 합성에 요구된다. 프로모터 요소는 종종 유전자에 상응하는 RNA의 합성을 위한 출발 부위를 제공함으로써 특정한 유전자의 전사를 용이하게 할 수 있는 DNA의 영역을 포함한다. 일부 실시양태에서, 프로모터는 일반적으로 이들이 조절하는 유전자 근처에 위치하고, 유전자의 상류 (예를 들어, 유전자의 5')에 위치하고, 유전자의 센스 가닥과 동일한 DNA 가닥 상에 존재한다. 일부 실시양태에서, 프로모터 요소는 유전자 또는 유기체로부터 단리되고, 폴리뉴클레오티드 서열과 기능적으로 연결되어 삽입되어 변경된 및/또는 조절된 발현을 허용할 수 있다. 핵산의 발현에 사용되는 비천연 프로모터 (예를 들어, 주어진 핵산 서열과 정상적으로 회합되지 않는 프로모터)는 종종 이종 프로모터로 지칭된다. 특정 실시양태에서, 이종 프로모터 및/또는 5'UTR은 본원에 기재된 바와 같은 목적하는 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드와 기능적으로 연결되어 삽입될 수 있다. 프로모터와 관련하여 본원에 사용된 용어 "작동가능하게 연결된" 및 "와 기능적으로 연결된"은 코딩 서열과 프로모터 요소 사이의 관계를 지칭한다. 프로모터는 전사를 통한 코딩 서열로부터의 발현이 프로모터 요소에 의해 조절되거나 제어되는 경우에 코딩 서열과 작동가능하게 연결되거나 기능적으로 연결된 것이다. 용어 "작동가능하게 연결된" 및 "기능적으로 연결된"은 프로모터 요소에 대해 본원에서 상호교환가능하게 이용된다.
프로모터는 종종 RNA 폴리머라제와 상호작용한다. 폴리머라제는 기존의 핵산 시약을 사용하여 핵산의 합성을 촉매하는 효소이다. 주형이 DNA 주형인 경우, RNA 분자는 단백질이 합성되기 전에 전사된다. 본 발명의 방법에 사용하기에 적합한 폴리머라제 활성을 갖는 효소는 단백질을 합성하기 위해 선택된 주형을 사용하여 선택된 시스템에서 활성인 임의의 폴리머라제를 포함한다. 일부 실시양태에서, 본원에서 프로모터 요소로도 지칭되는 프로모터 (예를 들어, 이종 프로모터)는 뉴클레오티드 서열 또는 오픈 리딩 프레임 (ORF)에 작동가능하게 연결될 수 있다. 프로모터 요소로부터의 전사는 프로모터에 작동가능하게 연결된 뉴클레오티드 서열 또는 ORF 서열에 대응하는 RNA의 합성을 촉매할 수 있으며, 이는 다시 목적하는 펩티드, 폴리펩티드 또는 단백질의 합성을 유도한다.
프로모터 요소는 때때로 조절 제어에 대한 반응성을 나타낸다. 프로모터 요소는 또한 때때로 선택적 작용제에 의해 조절될 수 있다. 즉, 프로모터 요소로부터의 전사는 때때로 환경, 영양 또는 내부 조건 또는 신호의 변화에 반응하여 켜지거나, 꺼지거나, 상향조절되거나 또는 하향조절될 수 있다 (예를 들어, 열 유도성 프로모터, 광 조절 프로모터, 피드백 조절 프로모터, 호르몬 영향 프로모터, 조직 특이적 프로모터, 산소 및 pH 영향 프로모터, 선택적 작용제 (예를 들어, 카나마이신)에 반응성인 프로모터 등). 환경, 영양 또는 내부 신호에 의해 영향을 받는 프로모터는 프로모터에서 또는 그 근처에 결합하고 특정 조건 하에 표적 서열의 발현을 증가 또는 감소시키는 신호 (직접 또는 간접)에 의해 빈번하게 영향을 받는다. 본원에 개시된 모든 방법에서와 같이, 천연 또는 변형된 프로모터의 포함은 완전 천연 ORF (예를 들어 NTT 또는 aaRS) 또는 비천연 뉴클레오티드를 함유하는 ORF (예를 들어 mRNA 또는 tRNA)의 발현을 변경 또는 최적화하는데 사용될 수 있다.
본원에 기재된 실시양태에서 사용되는 프로모터 요소로부터의 전사에 영향을 미치는 선택적 작용제 또는 조절제의 비제한적 예는 비제한적으로 (1) 다른 독성 화합물에 대한 내성을 제공하는 생성물 (예를 들어, 항생제)을 코딩하는 핵산 절편; (2) 다른 수용자 세포에서 결여된 생성물 (예를 들어, 필수 생성물, tRNA 유전자, 영양요구성 마커)을 코딩하는 핵산 절편; (3) 유전자 산물의 활성을 억제하는 생성물을 코딩하는 핵산 절편; (4) 용이하게 확인될 수 있는 생성물 (예를 들어, 표현형 마커, 예컨대 항생제 (예를 들어, β-락타마제), β-갈락토시다제, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP), 및 세포 표면 단백질)을 코딩하는 핵산 절편; (5) 달리 세포 생존 및/또는 기능에 유해한 생성물에 결합하는 핵산 절편; (6) 달리 상기 번호 1-5에 기재된 임의의 핵산 절편의 활성을 억제하는 핵산 절편 (예를 들어, 안티센스 올리고뉴클레오티드); (7) 기질을 변형시키는 생성물 (예를 들어, 제한 엔도뉴클레아제)에 결합하는 핵산 절편; (8) 원하는 분자 (예를 들어, 특이적 단백질 결합 부위)를 단리 또는 확인하는데 사용될 수 있는 핵산 절편; (9) 달리 비-기능적일 수 있는 (예를 들어, 분자의 하위집단의 PCR 증폭을 위한) 특정 뉴클레오티드 서열을 코딩하는 핵산 절편; (10) 부재시, 특정 화합물에 대한 내성 또는 감수성을 직접적으로 또는 간접적으로 부여하는 핵산 절편; (11) 수용자 세포에서 독성이거나 또는 상대적으로 비-독성인 화합물을 독성 화합물로 전환시키는 생성물 (예를 들어, 단순 포진 티미딘 키나제, 시토신 데아미나제)을 코딩하는 핵산 절편; (12) 핵산 분자의 복제, 분할 또는 유전성을 억제하는 핵산 절편 (상기 핵산 분자는 상기 핵산 절편을 함유함); (13) 조건부 복제 기능, 예를 들어 특정 숙주 또는 숙주 세포 균주에서의 또는 특정 환경 조건 (예를 들어, 온도, 영양 조건 등) 하에서의 복제를 코딩하는 핵산 절편; 및/또는 (14) 비천연 뉴클레오티드를 포함하는 1개 이상의 mRNA 또는 tRNA를 코딩하는 핵산을 포함한다. 일부 실시양태에서, 조절제 또는 선택적 작용제는 유기체가 적용되는 기존 성장 조건 (예를 들어, 액체 배양물에서의 성장, 발효기에서의 성장, 고체 영양 플레이트 상에서의 성장 등)을 변화시키기 위해 첨가될 수 있다.
일부 실시양태에서, 프로모터 요소의 조절은 펩티드, 폴리펩티드 또는 단백질의 활성 (예를 들어, 효소 활성)을 변경 (예를 들어, 증가, 부가, 감소 또는 실질적으로 제거)하기 위해 사용될 수 있다. 예를 들어, 미생물은 특정 실시양태에서, 신규 활성 (예를 들어, 숙주 유기체에서 정상적으로 발견되지 않는 활성)을 부가할 수 있거나 또는 관심 뉴클레오티드 서열 (예를 들어, 관심 상동 또는 이종 뉴클레오티드 서열)에 작동가능하게 연결된 상동 또는 이종 프로모터로부터의 전사를 증가시킴으로써 기존 활성의 발현을 증가시킬 수 있는 핵산 시약을 발현하도록 유전자 변형에 의해 조작될 수 있다. 일부 실시양태에서, 미생물은 특정 실시양태에서 유전자 변형에 의해 조작되어 관심 뉴클레오티드 서열에 작동가능하게 연결된 상동성 또는 이종성 프로모터로부터의 전사를 감소시키거나 또는 실질적으로 제거함으로써 활성의 발현을 감소시킬 수 있는 핵산 시약을 발현시킬 수 있다.
이종 단백질, 예를 들어 뉴클레오티드 트리포스페이트 수송체를 코딩하는 핵산은 임의의 적합한 발현 시스템 내로 삽입되거나 그와 함께 사용될 수 있다. 일부 실시양태에서, 핵산 시약은 때때로 숙주 유기체의 염색체 내로 안정하게 통합되거나, 또는 핵산 시약은 특정 실시양태에서 숙주 염색체의 일부의 결실일 수 있다 (예를 들어, 유전자 변형된 유기체, 여기서 숙주 게놈의 변경은 유전자 변형을 보유하는 목적하는 유기체를 선택적으로 또는 우선적으로 유지하는 능력을 부여함). 이러한 핵산 시약 (예를 들어, 변경된 게놈이 유기체에 선택가능한 형질을 부여하는 핵산 또는 유전자 변형 유기체)은 목적하는 단백질 또는 핵산 분자의 생산을 가이드하는 그의 능력에 대해 선택될 수 있다. 원하는 경우에, 핵산 시약은 코돈이 (i) 천연 서열에 명시된 것과 상이한 tRNA를 사용하는 동일한 아미노산, 또는 (ii) 비통상적 또는 비천연 아미노산 (검출가능하게 표지된 아미노산 포함)을 비롯하여, 보통의 것과 상이한 아미노산을 코딩하도록 변경될 수 있다.
재조합 발현은 벡터, 예컨대 플라스미드의 일부일 수 있는 발현 카세트를 사용하여 유용하게 달성된다. 벡터는 뉴클레오티드 트리포스페이트 수송체를 코딩하는 핵산에 작동가능하게 연결된 프로모터를 포함할 수 있다. 벡터는 또한 본원에 기재된 바와 같은 전사 및 번역에 필요한 다른 요소를 포함할 수 있다. 발현 카세트, 발현 벡터, 및 카세트 또는 벡터 내의 서열은 비천연 뉴클레오티드가 접촉되는 세포에 대해 이종성일 수 있다. 예를 들어, 뉴클레오티드 트리포스페이트 수송체 서열은 세포에 대해 이종성일 수 있다.
뉴클레오티드 트리포스페이트 수송체의 운반, 코딩 및/또는 발현에 적합한 다양한 원핵 및 진핵 발현 벡터가 생산될 수 있다. 이러한 발현 벡터는, 예를 들어 pET, pET3d, pCR2.1, pBAD, pUC 및 효모 벡터를 포함한다. 벡터는 예를 들어 다양한 생체내 및 시험관내 상황에서 사용될 수 있다. 사용될 수 있는 원핵 프로모터의 비제한적 예는 SP6, T7, T5, tac, bla, trp, gal, lac 또는 말토스 프로모터를 포함한다. 사용될 수 있는 진핵 프로모터의 비제한적 예는 구성적 프로모터, 예를 들어 바이러스 프로모터, 예컨대 CMV, SV40 및 RSV 프로모터, 뿐만 아니라 조절성 프로모터, 예를 들어 유도성 또는 억제성 프로모터, 예컨대 tet 프로모터, hsp70 프로모터, 및 CRE에 의해 조절되는 합성 프로모터를 포함한다. 박테리아 발현을 위한 벡터는 pGEX-5X-3을 포함하고, 진핵생물 발현을 위한 벡터는 pCIneo-CMV를 포함한다. 사용될 수 있는 바이러스 벡터는 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 포진 바이러스, 백시니아 바이러스, 소아마비 바이러스, AIDS 바이러스, 뉴런 영양 바이러스, 신드비스 및 다른 바이러스와 관련된 것을 포함한다. 벡터로서 사용하기에 적합하게 하는 이들 바이러스의 특성을 공유하는 임의의 바이러스 패밀리가 또한 유용하다. 사용될 수 있는 레트로바이러스 벡터는 문헌 [Verma, American Society for Microbiology, pp. 229-232, Washington, (1985)]에 기재된 것을 포함한다. 예를 들어, 이러한 레트로바이러스 벡터는 뮤린 말로니 백혈병 바이러스 (MMLV), 및 바람직한 특성을 발현하는 다른 레트로바이러스를 포함할 수 있다. 전형적으로, 바이러스 벡터는 비구조적 초기 유전자, 구조적 후기 유전자, RNA 폴리머라제 III 전사체, 복제 및 캡시드화에 필요한 역전된 말단 반복부, 및 바이러스 게놈의 전사 및 복제를 제어하는 프로모터를 함유한다. 벡터로서 조작되는 경우에, 바이러스는 전형적으로 초기 유전자 중 1개 이상이 제거되고, 유전자 또는 유전자/프로모터 카세트가 제거된 바이러스 핵산 대신에 바이러스 게놈 내로 삽입된다.
클로닝
관련 기술분야에 공지된 임의의 편리한 클로닝 전략을 이용하여 요소, 예컨대 ORF를 핵산 시약 내로 혼입시킬 수 있다. (1) 1개 이상의 기존의 제한 효소 부위에서 주형을 절단하고 관심 요소를 라이게이션하는 방법 및 (2) 1개 이상의 적합한 제한 효소 부위를 포함하는 올리고뉴클레오티드 프라이머를 혼성화시키고 폴리머라제 연쇄 반응에 의해 증폭시킴으로써 제한 효소 부위를 주형에 부가하는 방법 (본원에 보다 상세히 기재됨)과 같은 공지된 방법이 요소를 삽입 요소와 독립적으로 주형 내로 삽입하는데 이용될 수 있다. 다른 클로닝 전략은 예를 들어 핵산 시약 내에 존재하거나 그에 삽입된 1개 이상의 삽입 부위, 예컨대 PCR을 위한 올리고뉴클레오티드 프라이머 혼성화 부위, 및 본원에 기재된 다른 것을 이용한다. 일부 실시양태에서, 클로닝 전략은 유전자 조작, 예컨대 재조합 (예를 들어, 본원에 추가로 기재된 바와 같이, 변형시킬 유기체의 게놈 내로의 핵산 시약과 관심 핵산 서열의 재조합)과 조합될 수 있다. 일부 실시양태에서, 클로닝된 ORF(들)는 미생물을 1개 이상의 관심 ORF로 조작함으로써 변형된 또는 야생형 뉴클레오티드 트리포스페이트 수송체 및/또는 폴리머라제를 (직접적으로 또는 간접적으로) 생산할 수 있으며 이 미생물은 뉴클레오티드 트리포스페이트 수송체 활성 또는 폴리머라제 활성의 변경된 활성을 포함한다.
핵산은 핵산을 1개 이상의 특이적 절단제와 접촉시킴으로써 특이적으로 절단될 수 있다. 특이적 절단제는 종종 특정한 부위에서 특정한 뉴클레오티드 서열에 따라 특이적으로 절단할 것이다. 효소 특이적 절단제의 예는 비제한적으로 엔도뉴클레아제 (예를 들어, DNase (예를 들어, DNase I, II); RNase (예를 들어, RNase E, F, H, P); 클리바제(Cleavase)™ 효소; Taq DNA 폴리머라제; 이. 콜라이 DNA 폴리머라제 I 및 진핵 구조-특이적 엔도뉴클레아제; 뮤린 FEN-1 엔도뉴클레아제; 유형 I, II 또는 III 제한 엔도뉴클레아제, 예컨대 Acc I, Afl III, Alu I, Alw44 I, Apa I, Asn I, Ava I, Ava II, BamH I, Ban II, Bcl I, Bgl I, Bgl II, Bln I, BsaI, Bsm I, BsmBI, BssH II, BstE II, Cfo I, CIa I, Dde I, Dpn I, Dra I, EcIX I, EcoR I, EcoR I, EcoR II, EcoR V, Hae II, Hae II, Hind II, Hind III, Hpa I, Hpa II, Kpn I, Ksp I, Mlu I, MIuN I, Msp I, Nci I, Nco I, Nde I, Nde II, Nhe I, Not I, Nru I, Nsi I, Pst I, Pvu I, Pvu II, Rsa I, Sac I, Sal I, Sau3A I, Sca I, ScrF I, Sfi I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, Taq I, Xba I, Xho I); 글리코실라제 (예를 들어, 우라실-DNA 글리코실라제 (UDG), 3-메틸아데닌 DNA 글리코실라제, 3-메틸아데닌 DNA 글리코실라제 II, 피리미딘 수화물-DNA 글리코실라제, FaPy-DNA 글리코실라제, 티민 미스매치-DNA 글리코실라제, 하이포크산틴-DNA 글리코실라제, 5-히드록시메틸우라실 DNA 글리코실라제 (HmUDG), 5-히드록시메틸시토신 DNA 글리코실라제, 또는 1,N6-에테노-아데닌 DNA 글리코실라제); 엑소뉴클레아제 (예를 들어, 엑소뉴클레아제 III); 리보자임, 및 DNA자임을 포함한다. 샘플 핵산을 화학적 작용제로 처리하거나, 또는 변형된 뉴클레오티드를 사용하여 합성할 수 있고, 변형된 핵산을 절단할 수 있다. 비제한적 예에서, 샘플 핵산은 (i) 알킬 퓨린 DNA-글리코실라제에 의해 인식되고 절단되는 N3-메틸아데닌 및 N3-메틸구아닌을 포함한 여러 알킬화 염기를 생성하는 알킬화제, 예컨대 메틸니트로소우레아; (ii) DNA 내 시토신 잔기의 탈아미노화를 유발하여 우라실 N-글리코실라제에 의해 절단될 수 있는 우라실 잔기를 형성하는 중아황산나트륨; 및 (iii) 포름아미도피리미딘 DNA N-글리코실라제에 의해 절단될 수 있는, 구아닌을 그의 산화된 형태, 8-히드록시구아닌으로 전환시키는 화학적 작용제로 처리될 수 있다. 화학적 절단 프로세스의 예는 비제한적으로 알킬화 (예를 들어, 포스포로티오에이트-변형된 핵산의 알킬화); P3'-N5'-포스포로아미데이트-함유 핵산의 산 불안정성의 절단; 및 핵산의 사산화오스뮴 및 피페리딘 처리를 포함한다.
일부 실시양태에서, 핵산 시약은 1개 이상의 레콤비나제 삽입 부위를 포함한다. 레콤비나제 삽입 부위는 재조합 단백질에 의한 통합/재조합 반응에 참여하는 핵산 분자 상의 인식 서열이다. 예를 들어, Cre 레콤비나제에 대한 재조합 부위는 8개 염기 쌍 코어 서열에 플랭킹된 2개의 13개 염기 쌍 역전 반복부 (레콤비나제 결합 부위로서 작용함)로 구성된 34개 염기 쌍 서열인 loxP이다 (예를 들어, 문헌 [Sauer, Curr. Opin. Biotech. 5:521-527 (1994)]). 재조합 부위의 다른 예는 attB, attP, attL, 및 attR 서열, 및 재조합 단백질 λ Int 및 보조 단백질 통합 숙주 인자 (IHF), FIS 및 엑시시나제 (Xis)에 의해 인식되는 그의 돌연변이체, 단편, 변이체 및 유도체를 포함한다 (예를 들어, 미국 특허 번호 5,888,732; 6,143,557; 6,171,861; 6,270,969; 6,277,608; 및 6,720,140; 미국 특허 출원 번호 09/517,466 및 09/732,914; 미국 특허 공개 번호 US2002/0007051; 및 문헌 [Landy, Curr. Opin. Biotech. 3:699-707 (1993)]).
레콤비나제 클로닝 핵산의 예는 게이트웨이(Gateway)® 시스템 (인비트로젠(Invitrogen), 캘리포니아주)이며, 이는 생체내 또는 시험관내에서 목적하는 핵산 분자를 클로닝하기 위한 적어도 하나의 재조합 부위를 포함한다. 일부 실시양태에서, 시스템은 종종 박테리오파지 람다 시스템 (예를 들어, att1 및 att2)을 기반으로 하여 적어도 2개의 상이한 부위-특이적 재조합 부위를 함유하고 야생형 (att0) 부위로부터 돌연변이된 벡터를 이용한다. 각각의 돌연변이된 부위는 동일한 유형의 그의 동족 파트너 att 부위 (즉, 그의 결합 파트너 재조합 부위) (예를 들어 attB1과 attP1, 또는 attL1과 attR1)에 대해 고유한 특이성을 갖고, 다른 돌연변이체 유형의 재조합 부위 또는 야생형 att0 부위와 교차-반응하지 않을 것이다. 상이한 부위 특이성은 목적하는 분자의 방향성 클로닝 또는 연결을 허용하여 클로닝된 분자의 목적하는 배향을 제공한다. 재조합 부위에 의해 플랭킹된 핵산 단편을 클로닝하고, 때때로 목표 벡터로 지칭되는 수용자 플라스미드 분자 상의 att 부위에 의해 플랭킹된 선택 마커 (예를 들어, ccdB)를 대체함으로써 게이트웨이® 시스템을 사용하여 서브클로닝한다. 이어서, ccdB 감수성 숙주 균주의 형질전환 및 수용자 분자 상의 마커에 대한 양성 선택에 의해 목적하는 클론을 선택한다. 음성 선택 (예를 들어, 독성 유전자의 사용)을 위한 유사한 전략이 다른 유기체, 예컨대 포유동물 및 곤충에서의 티미딘 키나제 (TK)에서 사용될 수 있다.
핵산 시약은 때때로 1개 이상의 복제 기점 (ORI) 요소를 함유한다. 일부 실시양태에서, 주형은 2개 이상의 ORI를 포함하며, 여기서 하나는 하나의 유기체 (예를 들어, 박테리아)에서 효율적으로 기능하고 또 다른 것은 또 다른 유기체 (예를 들어, 진핵생물, 예컨대 효모)에서 효율적으로 기능한다. 일부 실시양태에서, ORI는 하나의 종 (예를 들어, 에스. 세레비지아에)에서 효율적으로 기능할 수 있고, 또 다른 ORI는 상이한 종 (예를 들어, 에스. 폼베)에서 효율적으로 기능할 수 있다. 핵산 시약은 또한 때때로 1개 이상의 전사 조절 부위를 포함한다.
핵산 시약, 예를 들어 발현 카세트 또는 벡터는 마커 생성물을 코딩하는 핵산 서열을 포함할 수 있다. 마커 생성물은 유전자가 세포에 전달되었고 일단 전달되면 발현되고 있는지를 결정하기 위해 사용된다. 마커 유전자의 예는 β-갈락토시다제 및 녹색 형광 단백질을 코딩하는 이. 콜라이 lacZ 유전자를 포함한다. 일부 실시양태에서, 마커는 선택 마커일 수 있다. 이러한 선택 마커가 숙주 세포 내로 성공적으로 전달된 경우, 형질전환된 숙주 세포는 선택 압력 하에 놓여도 생존할 수 있다. 선택적 요법의 2개의 널리 사용되는 별개의 카테고리가 존재한다. 제1 카테고리는 세포의 대사 및 보충된 배지와 관계없이 성장하는 능력이 결여된 돌연변이 세포주의 사용에 기초한다. 제2 카테고리는 임의의 세포 유형에서 사용되는 선택 체계를 지칭하고 돌연변이체 세포주의 사용을 필요로 하지 않는 우성 선택이다. 이들 체계는 전형적으로 숙주 세포의 성장을 정지시키는 약물을 사용한다. 신규 유전자를 갖는 이러한 세포는 약물 내성을 전달하는 단백질을 발현할 것이고, 선택에서 생존할 것이다. 이러한 우성 선택의 예는 약물 네오마이신 (Southern et al., J. Molec. Appl. Genet. 1: 327 (1982)), 미코페놀산 (Mulligan et al., Science 209: 1422 (1980)) 또는 히그로마이신 (Sugden, et al., Mol. Cell. Biol. 5: 410-413 (1985))을 사용한다.
핵산 시약은 1개 이상의 선택 요소 (예를 들어, 선택적으로 조절될 수 있는 프로모터 요소의 활성화가 아닌, 핵산 시약의 존재의 선택을 위한 요소)를 포함할 수 있다. 선택 요소는 종종 핵산 시약이 세포에 포함되는지 여부를 결정하기 위해 공지된 방법을 사용하여 이용된다. 일부 실시양태에서, 핵산 시약은 2개 이상의 선택 요소를 포함하며, 여기서 하나는 하나의 유기체에서 효율적으로 기능하고, 다른 것은 또 다른 유기체에서 효율적으로 기능한다. 선택 요소의 예는 하기를 포함하나 이에 제한되지는 않는다: (1) 다른 독성 화합물에 대한 내성을 제공하는 생성물 (예를 들어, 항생제)을 코딩하는 핵산 절편; (2) 다른 수용자 세포에서 결여된 생성물 (예를 들어, 필수 생성물, tRNA 유전자, 영양요구성 마커)을 코딩하는 핵산 절편; (3) 유전자 산물의 활성을 억제하는 생성물을 코딩하는 핵산 절편; (4) 용이하게 확인될 수 있는 생성물 (예를 들어, 표현형 마커, 예컨대 항생제 (예를 들어, β-락타마제), β-갈락토시다제, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP), 및 세포 표면 단백질)을 코딩하는 핵산 절편; (5) 달리 세포 생존 및/또는 기능에 유해한 생성물에 결합하는 핵산 절편; (6) 달리 상기 번호 1-5에 기재된 임의의 핵산 절편의 활성을 억제하는 핵산 절편 (예를 들어, 안티센스 올리고뉴클레오티드); (7) 기질을 변형시키는 생성물 (예를 들어, 제한 엔도뉴클레아제)에 결합하는 핵산 절편; (8) 원하는 분자 (예를 들어, 특이적 단백질 결합 부위)를 단리 또는 확인하는데 사용될 수 있는 핵산 절편; (9) 달리 비-기능적일 수 있는 (예를 들어, 분자의 하위집단의 PCR 증폭을 위한) 특정 뉴클레오티드 서열을 코딩하는 핵산 절편; (10) 부재시, 특정 화합물에 대한 내성 또는 감수성을 직접적으로 또는 간접적으로 부여하는 핵산 절편; (11) 수용자 세포에서 독성이거나 또는 상대적으로 비-독성인 화합물을 독성 화합물로 전환시키는 생성물 (예를 들어, 단순 포진 티미딘 키나제, 시토신 데아미나제)을 코딩하는 핵산 절편; (12) 핵산 분자의 복제, 분할 또는 유전성을 억제하는 핵산 절편 (상기 핵산 분자는 상기 핵산 절편을 함유함); 및/또는 (13) 조건부 복제 기능, 예를 들어 특정 숙주 또는 숙주 세포 균주에서의 또는 특정 환경 조건 (예를 들어, 온도, 영양 조건 등) 하에서의 복제를 코딩하는 핵산 절편.
핵산 시약은 생체내 전사 및/또는 번역에 유용한 임의의 형태일 수 있다. 핵산은 때때로 플라스미드, 예컨대 슈퍼코일드 플라스미드이고, 때때로 효모 인공 염색체 (예를 들어, YAC)이고, 때때로 선형 핵산 (예를 들어, PCR 또는 제한 소화에 의해 생산된 선형 핵산)이고, 때때로 단일-가닥이고, 때때로 이중-가닥이다. 핵산 시약은 때때로 증폭 과정, 예컨대 폴리머라제 연쇄 반응 (PCR) 프로세스 또는 전사-매개 증폭 프로세스 (TMA)에 의해 제조된다. TMA에서, 2종의 효소가 등온 반응에 사용되어 발광에 의해 검출된 증폭 생성물을 생성한다 (예를 들어, 문헌 [Biochemistry 1996 Jun 25;35(25):8429-38]). 표준 PCR 프로세스는 공지되어 있고 (예를 들어, 미국 특허 번호 4,683,202; 4,683,195; 4,965,188; 및 5,656,493), 일반적으로 사이클로 수행된다. 각각의 사이클은 하이브리드 핵산이 해리되는 열 변성; 프라이머 올리고뉴클레오티드가 혼성화하는 냉각; 및 폴리머라제 (즉, Taq 폴리머라제)에 의한 올리고뉴클레오티드의 연장을 포함한다. PCR 순환 프로세스의 예는 샘플을 95℃에서 5분 동안 처리하고; 95℃에서 1분, 59℃에서 1분 10초, 및 72℃에서 1분 30초의 45회 사이클을 반복하고; 이어서 샘플을 72℃에서 5분 동안 처리하는 것이다. 다수의 주기는 흔히 상업적으로 입수가능한 써멀 사이클러를 사용하여 수행된다. PCR 증폭 생성물은 때때로 보다 낮은 온도 (예를 들어, 4℃)에서 일정 시간 동안 저장되고, 때때로 분석 전에 동결된다 (예를 들어, -20℃).
상기 기재된 것과 유사한 클로닝 전략을 사용하여 비천연 뉴클레오티드를 함유하는 DNA를 생산할 수 있다. 예를 들어, 목적하는 위치에 비천연 뉴클레오티드를 함유하는 올리고뉴클레오티드는 표준 고체-상 합성을 사용하여 합성되고, HPLC에 의해 정제된다. 이어서, 클로닝 부위, 예컨대 BsaI 부위를 사용하는 클로닝 방법 (예컨대, 골든 게이트 어셈블리(Golden Gate Assembly))을 사용하여 필요한 서열 콘텍스트 (즉, UTR 및 코딩 서열)를 함유하는 플라스미드 내로 올리고뉴클레오티드를 삽입한다 (그러나, 상기 논의된 다른 것이 사용될 수 있음).
키트 및 제조품
특정 실시양태에서, 본원에 기재된 1개 이상의 방법과 함께 사용하기 위한 키트 및 제조품이 본원에 개시된다. 이러한 키트는 1개 이상의 용기 예컨대 바이알, 튜브 등을 수용하기 위해 구획화된 운반체, 포장, 또는 용기 (각각의 용기(들)는 본원에 기재된 방법에 사용될 개별 요소 중 하나를 포함함)를 포함한다. 적합한 용기는 예를 들어 병, 바이알, 시린지 및 시험 튜브를 포함한다. 한 실시양태에서, 용기는 다양한 재료, 예컨대 유리 또는 플라스틱으로부터 형성된다.
일부 실시양태에서, 키트는 키트의 내용물을 수용하기에 적합한 포장 재료를 포함한다. 일부 경우에, 포장 재료는 바람직하게는 멸균, 오염물-무함유 환경을 제공하기 위해 널리 공지된 방법에 의해 구축된다. 본원에 사용된 포장 재료는, 예를 들어 핵산 서열분석 시스템과 함께 사용하기 위해 판매되는 상업용 키트에 통상적으로 이용되는 것을 포함할 수 있다. 예시적인 포장 재료는 비제한적으로, 본원에 제시된 구성요소를 고정된 한계 내에서 유지할 수 있는 유리, 플라스틱, 종이, 호일 등을 포함한다.
포장 재료는 성분에 대한 특정한 용도를 나타내는 라벨을 포함할 수 있다. 라벨에 의해 지시되는 키트의 용도는 키트에 존재하는 성분들의 특정 조합에 적절한 것으로 본원에 제시된 방법 중 하나 이상일 수 있다. 예를 들어, 표지는 키트가 폴리뉴클레오티드를 합성하는 방법 또는 핵산의 서열을 결정하는 방법에 유용하다는 것을 나타낼 수 있다.
포장된 시약 또는 성분의 사용에 대한 지침서가 또한 키트에 포함될 수 있다. 지침서는 전형적으로 반응 파라미터, 예컨대 혼합될 키트 성분 및 샘플의 상대량, 시약/샘플 혼합물을 위한 유지 기간, 온도, 완충제 조건 등을 기재하는 유형의 표현을 포함할 것이다.
특정 반응에 필요한 모든 성분이 특정 키트에 존재할 필요는 없다는 것이 이해될 것이다. 오히려 1개 이상의 추가의 성분이 다른 공급원으로부터 제공될 수 있다. 키트와 함께 제공된 지침서는 제공될 추가의 성분(들) 및 이들이 수득될 수 있는 곳을 확인할 수 있다.
일부 실시양태에서, 예를 들어 유전자 조작된 세포를 제조하기 위한 본 개시내용에 의해 제공된 방법을 사용하여 비천연 핵산을 세포 핵산 내로 안정하게 혼입시키는데 유용한 키트가 제공된다. 한 실시양태에서, 본원에 기재된 키트는 유전자 조작된 세포 및 1개 이상의 비천연 핵산을 포함한다.
추가의 실시양태에서, 본원에 기재된 키트는 세포, 및 세포 내로의 도입을 위한 이종 유전자를 함유하는 핵산 분자를 제공함으로써, 유전자 조작된 세포, 예컨대 본 단락에서 상기 기재된 임의의 실시양태의 핵산을 포함하는 발현 벡터를 제공한다.
넘버링된 실시양태. 본 개시내용은 하기 비제한적 넘버링된 실시양태를 포함한다:
실시양태 1. a. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하는 단계;
b. 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 2개의 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자를 제공하는 단계;
c. 적어도 1개의 비천연 DNA 분자를 전사시켜 각각 적어도 1개의 비천연 안티코돈을 포함하는 적어도 2개의 전달 RNA (tRNA) 분자를 제공하고, 여기서 상응하는 DNA 내의 적어도 2개의 비천연 염기 쌍은 mRNA 분자의 비천연 코돈이 각각의 tRNA 분자의 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계; 및
d. 적어도 2개의 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 각각의 비천연 안티코돈은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계
를 포함하는, 비천연 폴리펩티드를 합성하는 방법.
실시양태 1.1. a. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하는 단계;
b. 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 2개의 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자를 제공하는 단계;
c. 적어도 1개의 비천연 DNA 분자를 전사시켜 각각 적어도 1개의 비천연 안티코돈을 포함하는 적어도 2개의 전달 RNA (tRNA) 분자를 제공하고, 여기서 상응하는 DNA 내의 적어도 2개의 비천연 염기 쌍은 mRNA 분자의 비천연 코돈 중 1개가 tRNA 분자 중 하나의 비천연 안티코돈에 상보적이고 1개 이상의 다른 비천연 코돈 중 적어도 1개가 다른 tRNA 분자 중 적어도 1개의 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계; 및
d. 적어도 2개의 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 각각의 비천연 안티코돈은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계
를 포함하는, 비천연 폴리펩티드를 합성하는 방법.
실시양태 2. a. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하고, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계;
b. 적어도 1개의 비천연 DNA 분자를 전사시켜 mRNA를 제공하는 단계;
c. 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 제1 및 제2 tRNA 분자를 제공하는 단계; 및
d. 적어도 제1 및 제2 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 적어도 제1 및 제2 비천연 안티코돈 각각은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계
를 포함하는, 비천연 폴리펩티드를 합성하는 방법.
실시양태 3. 실시양태 1, 1.1, 또는 2에 있어서, 적어도 2개의 비천연 코돈 각각이 코돈의 제1 위치, 제2 위치 또는 제3 위치에 위치하는 제1 비천연 뉴클레오티드를 포함하고, 임의로 제1 비천연 뉴클레오티드가 코돈의 제2 위치 또는 제3 위치에 위치하는 것인 방법.
실시양태 4. 상기 실시양태 중 어느 하나에 있어서, 적어도 2개의 비천연 코돈 각각이 핵산 서열 NNX 또는 NXN을 포함하고, 비천연 안티코돈이 핵산 서열 XNN, YNN, NXN, 또는 NYN을 포함하여, NNX-XNN, NNX-YNN, 또는 NXN-NYN을 포함하는 비천연 코돈-안티코돈 쌍을 형성하며, 여기서 N은 임의의 천연 뉴클레오티드이고, X는 제1 비천연 뉴클레오티드이고, Y는 제1 비천연 뉴클레오티드와 상이한 제2 비천연 뉴클레오티드이며, X-Y 또는 X-X는 DNA에서 비천연 염기 쌍을 형성하는 것인 방법.
실시양태 4.1. 상기 실시양태 중 어느 하나에 있어서, 적어도 2개의 비천연 코돈 각각이 핵산 서열 XNN, NXN, NNX를 포함하고, 비천연 안티코돈이 핵산 서열 NNX, NNY, NXN, NYN, NNX, 또는 NNY를 포함하여, XNN-NNX, XNN-NNY, NXN-NXN, NXN-NYN, NNX-XNN, 또는 NNX-YNN을 포함하는 비천연 코돈-안티코돈 쌍을 형성하며, 여기서 N은 임의의 천연 뉴클레오티드이고, X는 제1 비천연 뉴클레오티드이고, Y는 제1 비천연 뉴클레오티드와 상이한 제2 비천연 뉴클레오티드이며, X-X 또는 X-Y는 DNA에서 비천연 염기 쌍을 형성하는 것인 방법.
실시양태 5. 실시양태 4에 있어서, 코돈이 적어도 1개의 G 또는 C를 포함하고, 안티코돈이 적어도 1개의 상보적 C 또는 G를 포함하는 것인 방법.
실시양태 6. 실시양태 4 또는 5에 있어서, X 및 Y가 독립적으로
(i) 2-티오우라실, 2'-데옥시우리딘, 4-티오-우라실, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 또는 디히드로우라실;
(ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온) 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온);
(iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌 또는 6-아자-아데닌;
(iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및
(v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘 또는 2-피리돈
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 7. 실시양태 4 또는 5에 있어서, 각각의 X 및 Y를 구성하는 염기가 독립적으로
Figure pct00016
로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 8. 실시양태 7에 있어서, 각각의 X를 구성하는 염기가
Figure pct00017
인 방법.
실시양태 9. 실시양태 7 또는 8에 있어서, 각각의 Y를 구성하는 염기가
Figure pct00018
인 방법.
실시양태 10. 실시양태 4-9 중 어느 하나에 있어서, NNX-XNN이 UUX-XAA, UGX-XCA, CGX-XCG, AGX-XCU, GAX-XUC, CAX-XUG, AUX-XAU, CUX-XAG, GUX-XAC, UAX-XUA 및 GGX-XCC로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 11. 실시양태 4-9 중 어느 하나에 있어서, NNX-YNN이 UUX-YAA, UGX-YCA, CGX-YCG, AGX-YCU, GAX-YUC, CAX-YUG, AUX-YAU, CUX-YAG, GUX-YAC, UAX-YUA, 및 GGX-YCC로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 12. 실시양태 4-9 중 어느 하나에 있어서, NXN-NYN이 GXU-AYC, CXU-AYG, GXG-CYC, AXG-CYU, GXC-GYC, AXC-GYU, GXA-UYC, CXC-GYG, 및 UXC-GYA로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 13. 실시양태 12에 있어서, NXN-NYN이 AXG-CYU, GXC-GYC, AXC-GYU, GXA-UYC, CXC-GYG, 및 UXC-GYA로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 13.1. 실시양태 4.1-9 중 어느 하나에 있어서, XNN-NNY가 XUU-AAY, XUG-CAY, XCG-CGY, XAG-CUY, XGA-UCY, XCA-UGY, XAU-AUY, XCU-AGY, XGU-ACY, XUA-UAY, XUC-GAY, XCC-GGY, XAA-UUY, XAC-GUY, XGC-GCY, XGG-CCY 및 XGG-CCY로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 13.2. 실시양태 4.1-9 중 어느 하나에 있어서, XNN-NNX가 XUU-AAX, XUG-CAX, XCG-CGX, XAG-CUX, XGA-UCX, XCA-UGX, XAU-AUX, XCU-AGX, XGU-ACX, XUA-UAX, XUC-GAX, XCC-GGX, XAA-UUX, XAC-GUX, XGC-GCX, XGG-CCX, 및 XGG-CCX로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 14. 상기 실시양태 중 어느 하나에 있어서, 적어도 2개의 비천연 tRNA 분자 각각이 상이한 비천연 안티코돈을 포함하는 것인 방법.
실시양태 15. 실시양태 14에 있어서, 적어도 2개의 비천연 tRNA 분자가 메타노사르시나 속으로부터의 피롤리실 tRNA 및 메타노칼도코쿠스 잔나쉬이로부터의 티로실 tRNA, 또는 그의 유도체를 포함하는 것인 방법.
실시양태 16. 실시양태 13, 14, 또는 15 중 어느 하나에 있어서, 아미노-아실 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함하는 방법.
실시양태 17. 실시양태 16에 있어서, 아미노 아실 tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 18. 실시양태 14 또는 15에 있어서, 적어도 2개의 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함하는 방법.
실시양태 19. 실시양태 18에 있어서, 적어도 2개의 tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)를 포함하는 것인 방법.
실시양태 20. 실시양태 1-19 중 어느 하나에 있어서, 비천연 폴리펩티드가 2, 3개 또는 그 초과의 비천연 아미노산을 포함하는 것인 방법.
실시양태 21. 실시양태 1-20 중 어느 하나에 있어서, 비천연 폴리펩티드가 적어도 2개의 동일한 비천연 아미노산을 포함하는 것인 방법.
실시양태 22. 실시양태 1-20 중 어느 하나에 있어서, 비천연 폴리펩티드가 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 방법.
실시양태 23. 실시양태 1-22 중 어느 하나에 있어서, 비천연 아미노산이
리신 유사체;
방향족 측쇄;
아지도 기;
알킨 기; 또는
알데히드 또는 케톤 기
를 포함하는 것인 방법.
실시양태 24. 실시양태 1-22 중 어느 하나에 있어서, 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 방법.
실시양태 25. 실시양태 1-22 중 어느 하나에 있어서, 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로부터 선택되는 것인 방법.
실시양태 26. 상기 실시양태 중 어느 하나에 있어서, 적어도 1개의 비천연 DNA 분자가 플라스미드 형태인 방법.
실시양태 27. 실시양태 1-26 중 어느 하나에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합되는 것인 방법.
실시양태 28. 실시양태 26 또는 27에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 방법.
실시양태 29. 상기 실시양태 중 어느 하나에 있어서, 세포 유기체에서 비천연 DNA 분자의 생체내 복제 및 전사, 및 전사된 mRNA 분자의 생체내 번역을 포함하는 방법.
실시양태 30. 실시양태 29에 있어서, 세포 유기체가 미생물인 방법.
실시양태 31. 실시양태 30에 있어서, 세포 유기체가 원핵생물인 방법.
실시양태 32. 실시양태 31에 있어서, 세포 유기체가 박테리아인 방법.
실시양태 33. 실시양태 32에 있어서, 세포 유기체가 그람-양성 박테리아인 방법.
실시양태 34. 실시양태 32에 있어서, 세포 유기체가 그람-음성 박테리아인 방법.
실시양태 35. 실시양태 34에 있어서, 세포 유기체가 에스케리키아 콜라이인 방법.
실시양태 36. 상기 실시양태 중 어느 하나에 있어서, 적어도 2개의 비천연 염기 쌍이 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, 또는 dNaM-dTAT1로부터 선택되는 염기 쌍을 포함하는 것인 방법.
실시양태 37. 실시양태 29-36 중 어느 하나에 있어서, 세포 유기체가 뉴클레오시드 트리포스페이트 수송체를 포함하는 것인 방법.
실시양태 38. 실시양태 37에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 아미노산 서열을 포함하는 것인 방법.
실시양태 39. 실시양태 38에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 말단절단된 아미노산 서열을 포함하는 것인 방법.
실시양태 40. 실시양태 39에 있어서, PtNTT2의 말단절단된 아미노산 서열이 서열식별번호: 1에 의해 코딩된 PtNTT2에 대해 적어도 80% 동일한 것인 방법.
실시양태 41. 실시양태 29-40 중 어느 하나에 있어서, 세포 유기체가 적어도 1개의 비천연 DNA 분자를 포함하는 것인 방법.
실시양태 42. 실시양태 41에 있어서, 적어도 1개의 비천연 DNA 분자가 적어도 1개의 플라스미드를 포함하는 것인 방법.
실시양태 43. 실시양태 42에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합되는 것인 방법.
실시양태 44. 실시양태 42 또는 43에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 방법.
실시양태 45. 실시양태 1-26 중 어느 하나에 있어서, 비천연 폴리펩티드를 무세포 시스템으로 합성하는 것을 포함하는 시험관내 방법인 방법.
실시양태 46. 상기 실시양태 중 어느 하나에 있어서, 비천연 염기 쌍이 비천연 당 모이어티를 포함하는 적어도 1개의 비천연 뉴클레오티드를 포함하는 것인 방법.
실시양태 47. 실시양태 46에 있어서, 비천연 당 모이어티가
OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F;
O-알킬, S-알킬, N-알킬;
O-알케닐, S-알케닐, N-알케닐;
O-알키닐, S-알키닐, N-알키닐;
O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10, 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임);
및/또는 5' 위치에서의 변형:
5'-비닐, 5'-메틸 (R 또는 S);
4' 위치에서의 변형:
4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및
그의 임의의 조합
으로 이루어진 군으로부터 선택되는 모이어티를 포함하는 것인 방법.
실시양태 48. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 DNA 분자를 포함하는 세포이며, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 비천연 폴리펩티드를 코딩하고 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 세포.
실시양태 49. 실시양태 48에 있어서, mRNA 분자 및 적어도 제1 및 제2 tRNA 분자를 추가로 포함하는 세포.
실시양태 50. 실시양태 49에 있어서, 적어도 제1 및 제2 tRNA 분자가 비천연 아미노산에 공유 연결된 것인 세포.
실시양태 51. 실시양태 50에 있어서, 비천연 폴리펩티드를 추가로 포함하는 세포.
실시양태 52.
a. 각각의 비천연 코돈-안티코돈 쌍이 비천연 메신저 RNA (mRNA)로부터의 비천연 코돈 및 비천연 전달 리보핵산 (tRNA)으로부터의 비천연 안티코돈을 포함하고, 상기 비천연 코돈이 제1 비천연 뉴클레오티드를 포함하고, 상기 비천연 안티코돈이 제2 비천연 뉴클레오티드를 포함하는 것인 적어도 2개의 상이한 비천연 코돈-안티코돈 쌍; 및
b. 상응하는 비천연 tRNA에 각각 공유 연결된 적어도 2개의 상이한 비천연 아미노산
을 포함하는 세포.
실시양태 53. 실시양태 52에 있어서, 적어도 4개의 비천연 염기 쌍 (UBP)을 포함하는 적어도 1개의 비천연 DNA 분자를 추가로 포함하는 세포.
실시양태 54. 실시양태 48-53 중 어느 하나에 있어서, 제1 비천연 뉴클레오티드가 비천연 코돈의 제2 또는 제3 위치에 위치하는 것인 세포.
실시양태 54.1. 실시양태 48-53 중 어느 하나에 있어서, 제1 비천연 뉴클레오티드가 비천연 코돈의 제1, 제2 또는 제3 위치에 위치하는 것인 세포.
실시양태 55. 실시양태 54 또는 54.1에 있어서, 제1 비천연 뉴클레오티드가 비천연 안티코돈의 제2 비천연 뉴클레오티드와 상보적으로 염기 쌍형성되는 것인 세포.
실시양태 56. 실시양태 48-55 중 어느 하나에 있어서, 제1 비천연 뉴클레오티드 및 제2 비천연 뉴클레오티드가
Figure pct00019
로 이루어진 군으로부터 독립적으로 선택되는 제1 및 제2 염기를 각각 포함하고, 여기서 제2 염기는 제1 염기와 상이한 것인 세포.
실시양태 57. 실시양태 48 또는 50-56 중 어느 하나에 있어서, 적어도 4개의 비천연 염기 쌍이 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, 또는 dNaM-dTAT1로 이루어진 군으로부터 독립적으로 선택되는 것인 세포.
실시양태 58. 실시양태 48 또는 50-57 중 어느 하나에 있어서, 적어도 1개의 비천연 DNA 분자가 적어도 1개의 플라스미드를 포함하는 것인 세포.
실시양태 59. 실시양태 48 또는 50-58 중 어느 하나에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합되는 것인 세포.
실시양태 60. 실시양태 50-59 중 어느 하나에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 세포.
실시양태 61. 실시양태 48-60 중 어느 하나에 있어서, 뉴클레오시드 트리포스페이트 수송체를 발현하는 세포.
실시양태 62. 실시양태 61에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 아미노산 서열을 포함하는 것인 세포.
실시양태 63. 실시양태 62에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 말단절단된 아미노산 서열을 포함하는 것인 방법.
실시양태 64. 실시양태 63에 있어서, PtNTT2의 말단절단된 아미노산 서열이 서열식별번호: 1에 의해 코딩된 PtNTT2에 대해 적어도 80% 동일한 것인 방법.
실시양태 65. 실시양태 48 내지 64 중 어느 하나에 있어서, 적어도 2개의 tRNA 신테타제를 발현하는 세포.
실시양태 66. 실시양태 65에 있어서, 적어도 2개의 tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)인 세포.
실시양태 67. 실시양태 48 내지 66 중 어느 하나에 있어서, 비천연 당 모이어티를 포함하는 비천연 뉴클레오티드를 포함하는 세포.
실시양태 68. 실시양태 67에 있어서, 비천연 당 모이어티가
2' 위치에서의 변형:
OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F;
O-알킬, S-알킬, N-알킬;
O-알케닐, S-알케닐, N-알케닐;
O-알키닐, S-알키닐, N-알키닐;
O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10, 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임);
및/또는 5' 위치에서의 변형:
5'-비닐, 5'-메틸 (R 또는 S);
4' 위치에서의 변형:
4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및
그의 임의의 조합
으로 이루어진 군으로부터 선택되는 것인 세포.
실시양태 69. 실시양태 48 내지 68 중 어느 하나에 있어서, 적어도 1개의 비천연 뉴클레오티드 염기가 전사 동안 RNA 폴리머라제에 의해 인식되는 것인 세포.
실시양태 70. 실시양태 48 내지 69 중 어느 하나에 있어서, 적어도 2개의 비천연 아미노산을 포함하는 적어도 1개의 비천연 폴리펩티드를 번역하는 세포.
실시양태 71. 실시양태 48 내지 70 중 어느 하나에 있어서, 적어도 2개의 비천연 아미노산이 독립적으로 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로 이루어진 군으로부터 선택되는 것인 세포.
실시양태 72. 실시양태 48 내지 71 중 어느 하나에 있어서, 단리된 세포.
실시양태 73. 실시양태 48 내지 72 중 어느 하나에 있어서, 원핵생물인 세포.
실시양태 74. 실시양태 48 내지 73 중 어느 하나의 세포를 포함하는 세포주.
<실시예>
실시예 1. 초기 코돈 스크린
녹색 형광 단백질 및 변이체, 예컨대 sfGFP는 특히 위치 Y151에서 ncAA 혼입의 연구를 위한 모델 시스템으로서 사용되었으며, 이는 다양한 천연 및 ncAA 치환을 용인하는 것으로 밝혀졌다. 2개의 dNaM-dTPT3 UBP를 함유하는 플라스미드를 구축하였고, 하나는 sfGFP의 코돈 151 내에 위치하고, 다른 하나는 엠. 마제이 tRNAPyl의 안티코돈을 코딩하도록 위치하였으며 (도 6c), 이는 PylRS에 의해 ncAA N6-((2-아지도에톡시)-카르보닐)-L-리신 (AzK) (도 6b)으로 선택적으로 충전되었다. 플라스미드를 구축하여 2개의 제1 위치 비천연 코돈 (XTC 및 XTG; X는 dNaM을 지칭함), 2개의 제2 위치 비천연 코돈 (AXC 및 GXA), 및 2개의 비천연 제3 위치 코돈 (AGX 및 CAX)을 포함하는 6개의 코돈, 뿐만 아니라 반대 가닥 콘텍스트 코돈 (YTC, YTG, AYC, GYA, AGY, 및 CAY; Y는 dTPT3을 지칭함)의 디코딩을 검사하였다.
SSO의 클론 집단은 아마도 시험관내 구축 동안 오조립된 플라스미드의 제거로 인해 보다 많은 양의 순수한 비천연 단백질을 생산하여 초기 코돈 스크린을 용이하게 할 수 있지만, 먼저 세포의 비-클론 집단으로 단백질 발현을 조사하고, 형질전환 직후에 단백질 생산을 검정하였다. 플라스미드를 사용하여 키메라 피롤리실-tRNA 신테타제 (chPylRSIPYE)를 코딩하는 보조 플라스미드를 보유하는 이. 콜라이 ML2 (BL21(DE3) lacZYA:PtNTT2(66-575) ΔrecA polB++)를 형질전환시키고, dNaMTP 및 dTPT3TP가 보충된 선택 배지에서 초기 정지기로의 성장 후에 세포를 신선한 배지로 옮겼다. 중간-지수기로의 성장 후, 배양물을 NaMTP, TPT3TP, 및 AzK로 보충하고, 이소프로필-β-D-티오갈락토시드 (IPTG)를 첨가하여 T7 RNA 폴리머라제 (T7 RNAP), chPylRSIPYE, 및 tRNAPyl의 발현을 유도하였다. 추가의 성장 1시간 후, 안히드로테트라시클린 (aTc)을 첨가하여 sfGFP의 발현을 유도하고, 이를 형광에 의해 모니터링하였다.
제1 위치 코돈은 이종쌍형성 또는 자기-쌍형성 안티코돈 (예를 들어, XTG의 경우, 각각 tRNAPyl(CAY) 또는 (tRNA)Pyl(CAX))으로 디코딩을 시도하였는지 여부에 관계없이 AzK의 부재 또는 존재 하에 유의한 형광을 나타내지 않았다 (도 10). 제2 위치에 dNaM을 갖는 코돈은 AzK의 부재 하에 거의 형광을 나타내지 않았지만, 이종쌍형성 안티코돈 tRNAPyl(GYT) 또는 (tRNA)Pyl(TYC)로 재코딩된 tRNAPyl로 디코딩되는 경우에는 그의 존재 하에 유의한 형광을 나타냈고, 자기-쌍형성 안티코돈 tRNAPyl(GXT) 또는 (tRNA)Pyl(TXC)로는 그렇지 않았다. 제2 위치에 dTPT3을 갖는 경우, 디코딩이 이종쌍형성 또는 자기-쌍형성 tRNA를 사용하여 시도되었는지 여부에 관계없이 첨가된 AzK의 존재 또는 부재 하에 형광이 관찰되지 않았다. 제3 위치 코돈 CAX 및 CAY는 AzK의 부재 하에 높은 형광을 나타냈고, 놀랍게도 디코딩이 이종쌍형성 또는 자가-쌍형성 tRNAPyl로 시도되었는지의 여부에 관계없이 AzK의 첨가에 의해 형광이 덜 나타났다. 이러한 결과는 상응하는 제3 위치 비천연 tRNA가 리보솜에 비생산적으로 결합하여 천연 tRNA에 의한 비천연 코돈 번역-초과를 차단한다는 것을 시사한다. AzK의 부재 하에, AGX 및 AGY는 거의 형광을 나타내지 않았고, tRNAPyl(XCT)를 갖는 AGX는 AzK의 첨가로 형광의 증가를 나타냈다.
제1 위치 코돈이 유망한 것으로 보이지 않았으므로, 제2 위치 코돈의 보다 포괄적인 스크린을 수행하였다. 초기 분석은 코돈 내 NaM 및 안티코돈 내 TPT3만을 사용한 잠재적 디코딩을 나타냈기 때문에, NXN 코돈 및 동족 tRNAPyl(NYN)을 검사하였다. 16개의 가능한 코돈 중에서, CXA, CXG, 및 TXG는 상응하는 서열 콘텍스트가 SSO의 DNA에 불량하게 보유되기 때문에 제외하였다. 이전의 결과와 일치하게, AzK의 부재 하에 코돈 AXC 및 GXC의 사용은 형광을 거의 내지 전혀 생성하지 않은 반면에, AzK의 존재 하에서는 유의한 형광을 생성하였다 (도 6d). 유사하게, GXT, CXC, TXC, GXG, GXA, CXT, 및 AXG 코돈의 사용시, AzK의 첨가는 AzK가 제공되지 않은 경우에 비해 형광의 유의한 증가를 유발하였다. 나머지 4개의 코돈, AXA, AXT, TXA, 및 TXT는 AzK가 첨가되었는지 여부에 관계없이 거의 형광을 생성하지 않았고, 이는 적어도 하나의 G-C 쌍에 대한 엄격한 요건을 나타낸다.
비천연 단백질 생산을 스크리닝하기 위해, sfGFP를 C-말단 StrepII 친화성 태그를 통해 정제하고, 4개의 PEG 단위에 의해 로다민 염료 (TAMRA)에 연결된 디벤조시클로옥틴 (DBCO) (DBCO-PEG4-TAMRA)을 사용하는 변형-촉진된 아지드-알킨 고리화첨가 (SPAAC) 반응에 적용하였다. 이전에 나타난 바와 같이, 성공적인 접합은 ncAA를 함유하는 단백질을 검출가능한 형광단으로 태그부착할 뿐만 아니라 전기영동 이동에서 검출가능한 변위를 생성하여, 생산된 총 단백질에 비해 AzK를 함유하는 단백질의 정량화 (즉, ncAA 혼입의 충실도; 도 6d)를 가능하게 한다. 이전의 결과와 일치하게, 코돈 GXC 및 AXC의 사용은 AzK 잔기를 갖는 유의한 양의 sfGFP를 생산하였다. 놀랍게도, 7개의 추가의 비천연 코돈인 GXT, CXC, TXC, GXG, GXA, CXT, 및 AXG 또한 유의한 수준의 비천연 단백질을 생성하였다 (도 6d, 도 11).
마지막으로, 제3 위치 코돈의 보다 포괄적인 스크린을 수행하였다. 초기 스크린에서 단지 AGX만이 이어서 유일하게 자기-쌍형성 tRNAPyl(XCT)에 의해 디코딩된 것으로 나타났으므로, 동족 자기-쌍형성 tRNAPyl(XNN)과 함께 코돈의 제3 위치에 dNaM을 갖는 코돈을 추가로 검사하였다 (도 6c). NCX 코돈은 상기 언급된 바와 같이 SSO의 DNA에 잘 보유되지 않는 NCXA의 서열 콘텍스트를 생성하기 때문에 제외되었다. 초기 분석과 일치하게, AzK의 부재 하에 이들 코돈은 일반적으로 제2 위치 코돈에서 관찰된 것보다 더 많은 형광을 유발하였지만, AzK의 존재 하에서는 형광의 가변적 증가가 관찰되었다 (도 6d). 그럼에도 불구하고, 상기 기재된 바와 같이 단백질을 단리하고 분석하였을 때, CGX, ATX, CAX, AGX, GAX, TGX, CTX, TTX, GTX, 또는 TAX의 사용은 모두 유의한 수준의 비천연 단백질 생산을 유발하였다 (도 6d, 도 11). 코돈 GGX는 다중 변위된 종을 생성하였고, 이는 tRNAPyl(XCC)가 하나 이상의 천연 코돈을 디코딩한다는 것을 시사한다. 코돈 AAX를 사용한 경우에는 비천연 단백질이 검출되지 않았다.
실시예 2. 클론 SSO에서의 코돈 특징화
상기 기재된 코돈 스크린에서 확인된 가장 유망한 코돈/안티코돈 쌍을 선택하기 위해, AzK의 존재 하에 관찰된 형광 및 단리된 단백질에서 유도된 이동성 변위 (도 6d, 삽도)를 비교하였다. 이 분석에 기초하여, 7개의 비천연 코돈/안티코돈 쌍인 GXC/GYC, GXT/AYC, AXC/GYT, AGX/XCT, CGX/XCG, TTX/XAA, TGX/XCA를 추가 특징화를 위해 선택하였다. 이들 코돈/안티코돈 쌍을 클론 SSO에서 검사하였고, 이는 오조립된 플라스미드 또는 시험관내 구축 동안 UBP를 상실한 플라스미드로 형질전환된 세포를 제거한다. 형질전환체를 dNaMTP 및 dTPT3TP를 함유한 고체 성장 배지 상에 스트리킹하고, 개별 콜로니를 선택하고, 플라스미드 완전성 및 높은 UBP 보유를 확인함으로써 클론 SSO를 수득하였다. 고 보유 클론을 재성장시키고, 상기 기재된 바와 같이 단백질을 생산하도록 유도하였다. 두드러지게, 관찰된 형광은 7개의 코돈/안티코돈 쌍 각각이 앰버 억제 대조군과 유리하게 비교되는 수준으로 단백질을 생산한다는 것을 나타내고, 또한 겔 변위 검정은 실질적으로 모든 sfGFP가 ncAA를 함유한다는 것을 입증한다 (도 7a, 도 12). 코돈/안티코돈 AGX/XCT, CGX/XCG, TTX/XAA, 및 TGX/XCA를 사용한 디코딩은 발현 배지 내 NaMTP에만 의존하였고, 첨가된 TPT3TP의 존재 및 부재 둘 다에서 유사한 AzK 함량을 갖는 sfGFP를 생산하였다 (도 13).
상기 분석된 7개의 비천연 코돈/안티코돈 쌍은 리보솜에서 효율적인 디코딩을 명백하게 매개하였지만; 예비 비-클론 스크린으로부터의 다른 코돈도 클론 SSO에서 분석시 효율적인 디코딩을 나타내는 것이 가능하였다. 따라서, 4개의 추가의 코돈/안티코돈 쌍 TXC/GYA, GXG/CYC, CXC/GYG, 및 AXT/AYT를 갖는 클론 SSO에서의 비천연 단백질 생산을 조사하였다. 높은 UBP 보유에도 불구하고 (표 1), AXT는 AzK의 존재 또는 부재 하에 형광 신호를 나타내지 않았으며, 이는 제2 위치 코돈과 함께 G-C 쌍에 대한 요건을 추가로 지지한다. AzK의 첨가시 TXC, CXC, 및 GXG에 대한 형광은 AzK의 부재 하에서는 다소 더 높았지만 초기에 특징화된 7개의 코돈의 것과 대등하였다 (도 7a). SPAAC 겔 변위 분석은, CXC가 비-클론 SSO를 이용한 예비 스크린에서 관찰된 것보다 클론 SSO에서 상당히 더 많이 변위된 단백질을 명백하게 유발하였고, TXC 및 GXG도 또한 예비 스크린으로부터의 데이터의 비교적 더 큰 오차가 정량적 비교를 불가능하게 하였지만 마찬가지일 가능성이 있는 것으로 밝혀내었다 (도 7b). 데이터는 일부 코돈에 대해 스크린에서의 준최적 성능이 적어도 부분적으로 시험관내 플라스미드 구축에서의 서열-의존성 차이로부터 초래되었음을 시사하였다. 그럼에도 불구하고, 결과는 2개의 추가의 고충실도 코돈 TXC 및 CXC를 확인하였고, 보다 실행가능한 코돈이 아직 확인될 수 있음을 시사하였다.
비천연 코돈/안티코돈 쌍의 직교성을 평가하기 시작하기 위해, AXC/GYT, GXT/AYC, 및 AGX/XCT를 선택하고, 비천연 코돈 및 안티코돈의 모든 쌍별 조합을 사용하여 클론 SSO에서 단백질 생산에 대해 검사하였다. AzK의 첨가시, 각각의 비천연 코돈이 동족 비천연 안티코돈과 쌍형성된 경우에는 유의한 형광이 관찰되었고, 비-동족 비천연 안티코돈과 쌍형성된 경우에는 배경에 비해 실질적으로 어떠한 증가도 관찰되지 않았다 (도 7b). 따라서, AXC/GYT, GXT/AYC, 및 AGX/XCT는 직교성이었고, SSO에서 동시에 사용될 수 있었다.
실시예 3. 2개의 비천연 코돈의 동시 디코딩.
다중 코돈의 동시 디코딩을 조사하기 위해, 먼저 위치 190 및 200에서 천연 sfGFP 코돈이 각각 GXT 및 AXC로 대체된 플라스미드 (sfGFP 190,200 (GXT,AXC))를 구축하였다. 또한, 플라스미드는 tRNAPyl(AYC) 및 엠. 잔나쉬이 tRNA p AzF 둘 다를 코딩하였으며, 후자는 엠. 잔나쉬이 TyrRS(MjTyrRS)에 의해 p-아지도-L-페닐알라닌 (pAzF; 도 6b)으로 선택적으로 충전되고, 그의 안티코돈은 AXC를 인식하도록 재코딩되었다 (tRNA p AzF(GYT); 도 8a). chPylRSIPYE 및 MjpAzFRS 둘 다를 코딩하는 보조 플라스미드를 보유하는 이. 콜라이 ML2를 UBP-함유 플라스미드로 형질전환시키고, 상기 기재된 바와 같이 클론 SSO를 수득하고, 성장시키고, 유도하여 sfGFP를 생산하였다. AzK 및 pAzF 둘 다 제공시, 단일 코돈 구축물을 사용한 발현과 동일한 시간척도 내에서 증가된 세포 형광이 관찰되었다 (도 8b, 도 14). sfGFP 190,200 (GXT,AXC)로부터의 발현을 갖는 형광의 수준은 sfGFP 190 (GXT) 또는 sfGFP 200 (AXC)에서 관찰된 것의 다소 절반 미만인 반면에, 상응하는 억제 tRNA로 디코딩된 앰버,오커 대조군 (sfGFP 190,200 (TAA,TAG))에서 관찰된 것보다 유의하게 더 컸다 (도 8c, 도 14). 두 경우 모두에서, SPAAC 겔 변위에 의해 분석시, 비변위 밴드는 명백하지 않았고, 주요 밴드의 이동성은 단일 ncAA의 혼입에 대해 관찰된 것에 비해 추가로 지연되었고, 이는 실제로 2개의 ncAA가 혼입되었음을 시사한다 (도 8d). pAzF 및 AzK 둘 다가 혼입되었음을 확인하기 위해, 정제된 단백질을 정량적 무손상 단백질 질량 분광측정법 (HRMS ESI-TOF)을 사용하여 분석하였다. 겔 변위 검정과 일치하게, 이 분석은 단리된 단백질의 91 ± 1.1%가 pAzF 및 AzK 둘 다를 함유한 반면에, 1.7 ± 0.4%는 단일 pAzF 및 7.5 ± 0.78%는 단일 AzK를 함유한다는 것을 밝혀내었다 (도 15). 둘 다의 경우, 확인된 불순물의 질량은 dX → dT 돌연변이와 일치하는 아미노산 치환에 상응하며, 이는 ncAA 혼입 충실도의 손실의 대부분이 복제 동안 dNaM 또는 dTPT3의 손실로부터 초래되고, 전사 또는 번역 중 오류로 인한 것이 아님을 시사한다. UBP의 보유는 스트렙타비딘-비오틴 변위 검정에 기초하였다. 보유는 tRNA p AzF 및 tRNASer (어떠한 정규화도 수행될 수 없음)을 제외하고는, ssDNA 주형 대조군의 상대적 변위에 대해 정규화된 상대적 변위 (즉, 변위 밴드의 신호를 변위 밴드 및 비변위 밴드의 총 신호로 나눈 것)을 포함하였다. 평균 ± 표준 편차를 나타냈다 (표 1).
표 1. 기록된 SSO에서의 염기 쌍 (BP) 보유
Figure pct00020
Figure pct00021
SSO는 16 ± 3.2 μg·ml-1의 정제된 단백질을 생산한 반면에, 앰버,오커 억제 대조군은 6.8 ± 1.1 μg·ml-1을 생산하였다. 그러나, SSO 배양물은 앰버,오커 대조군 세포보다 더 낮은 밀도로 성장하였고, OD600에 대해 정규화하였을 때, SSO는 13 ± 1.6 μg·ml-1의 정제된 단백질을 생산한 반면에, 앰버,오커 억제는 2.8 ± 0.28 μg·ml-1을 생산하였음을 주목하였고, 이는 SSO가 OD600당 4.5배 초과의 단백질을 생산하였음을 입증한다. 모든 수율은 친화도 정제 동안 과량의 스트렙-택틴 XT 비드를 사용한 sfGFP 포획에 의해 측정되었다. 수율은 t = 발현 180분에서 최종 OD600에 대해 정규화되었다. 평균 ± 표준 편차를 나타냈다 (표 2). 따라서, SSO는 2개의 ncAA를 갖는 비천연 단백질을 효율적으로 생산한다.
표 2. sfGFP 발현의 단백질 수율
Figure pct00022
상이한 관능기를 갖는 ncAA를 갖는 단백질의 발현을 특징화하기 위해, sfGFP 190,200 (GXT,AXC)를 상기 기재된 바와 같이 SSO에서 발현시켰지만, 성장 배지에 AzK 대신에 chPylRSIPYE에 의해 또한 인식되는 N6-(프로파르길옥시)-카르보닐-L-리신 (PrK, 도 6b)을 보충하였다. SSO 또는 앰버,오커 대조군의 경우 발현에 대한 실질적인 영향이 형광에 의해 관찰되지 않았다 (도 8e). 각 경우, TAMRA-PEG4-DBCO를 사용한 SPAAC, 및 이어서 TAMRA-PEG4-아지드를 사용한 구리-촉매된 알킨-아지드 고리화첨가 (CuAAC)에 의한 PrK 및 pAzF 둘 다의 정확한 혼입이 둘 다 전기영동 이동성의 관찰가능한 변위를 유도하여 검증되었다. SSO 뿐만 아니라 앰버,오커 대조군에 의해 생산된 단백질은 예상된 겔 변위 및 TAMRA 신호를 나타낸다 (도 8f).
실시예 4. 3개의 비천연 코돈의 동시 디코딩
3개의 직교성 비천연 코돈의 동시 디코딩을 조사하기 위해, 안티코돈 인식 없이 내인성 SerRS에 의해 충전되고 비천연 코돈을 디코딩하는 것으로 이전에 보고된 내인성 세린 tRNASer, 이. 콜라이 SerT를 사용하였다. chPylRSIPYE 및 MjpAzFRS를 코딩하는 보조 플라스미드를 보유한 이. 콜라이 ML2를 sfGFP 151,190,200 (AXC,GXT,AGX) 뿐만 아니라 tRNAPyl(XCT), tRNA p AzF(GYT), 및 tRNASer(AYC)를 발현하는 플라스미드로 형질전환시키고 (도 9a), 상기 기재된 바와 같이 클론 SSO를 제조하고, 성장시키고, 유도하여 단백질을 생산하였다. AzK 및 pAzF가 배지에 첨가되면, 유의한 형광이 관찰되었고, 이는 2개의 코돈의 동시 디코딩에 대해 상기 얻어진 결과와 유사하였다 (도 9b, 도 14). 이들 세포는 12.1 ± 1.9 μg ml-1 (7.8 ± 1.1 μg ml-1 OD-1)의 단리된 단백질을 생산하였고, 이는 2개의 비천연 코돈의 디코딩으로 단리된 양보다 단지 약간 더 적었다 (표 2). pAzF, AzK, 및 Ser이 모두 혼입되었음을 확인하기 위해, 정제된 단백질을 정량적 무손상 단백질 질량 분광측정법 (HRMS ESI-TOF)을 통해 분석하였고, 단리된 단백질의 96 ± 0.63%가 pAzF, AzK, 및 Ser을 함유한 반면에, 주요 불순물은 AzK 및 Ser만을 함유하는 sfGFP (3.5 ± 0.63%)임이 밝혀졌다. Ser 혼입이 없는 단백질은 거의 검출불가능한 반면에 (0.20 ± 0.087%), pAzF 및 Ser만을 함유하는 단백질에 상응하는 질량은 검출될 수 없었다 (도 9c, 도 16). 추가로, Ser, AzK 또는 pAzF의 다중 삽입에 상응하는 임의의 불순물은 검출되지 않았다.
실시예 5. 비천연 폴리펩티드의 생체내 발현 방법
물질
사용된 올리고뉴클레오티드 및 플라스미드의 완전한 목록은 표 3에 있다. 천연 ssDNA 올리고뉴클레오티드 및 gBlock은 IDT (캘리포니아주 샌디에고)로부터 구입하였다. 진와이즈(Genewiz) (캘리포니아주 샌디에고)는 서열분석을 수행하였다. DNA의 모든 정제는 자이모 리서치(Zymo Research) 실리카 칼럼 키트를 사용하여 수행하였다. 모든 클로닝 효소 및 폴리머라제는 뉴 잉글랜드 바이오랩스 (매사추세츠주 입스위치)로부터 구입하였다. 모든 생체접합 시약은 클릭 케미스트리 툴즈(Click Chemistry Tools) (애리조나주 스코츠데일)로부터 구입하였다. 본 연구에 사용된 모든 비천연 뉴클레오시드 트리포스페이트 및 뉴클레오시드 포스포르아미다이트는 상업적 공급원으로부터 입수하였다. 문헌에 기재된 바와 같이 합성된 sfGFP 200 (AGX)를 제외한 모든 ssDNA dNaM 주형을 또한 상업적 공급원으로부터 수득하였다.
표 3. PCR 및 스트렙타비딘-비오틴 변위 검정에 사용된 단일-가닥 DNA 올리고뉴클레오티드
Figure pct00023
Figure pct00024
Figure pct00025
성장 조건
모든 박테리아 실험을 인산칼륨 (50 mM pH 7)이 보충된 300 μl 2xYT (피셔 사이언티픽) 배지에서 수행하였다. 성장은 37℃에서 200 r.p.m.에서 진탕시키면서 편평-바닥 48-웰 플레이트 (셀스타(CELLSTAR), 그라이너 바이오-원(Greiner Bio-One))에서 수행하였다 (인포스 HT 미니트론). 항생제를 (달리 나타내지 않는 한) 다음 농도로 사용하였다: 클로람페니콜 (5 μg/ml), 카르베니실린 (100 μg/ml) 및 제오신 (50 μg/ml). 비천연 뉴클레오시드 트리포스페이트를 (달리 나타내지 않는 한) 다음 농도로 사용하였다: dNaMTP (150 μM), dTPT3TP (10 μM), NaMTP (250 μM), TPT3TP (30 μM). UBP 배지는 dNaMTP 및 dTPT3TP를 함유하는 상기 2xYT 배지로 규정된다.
플라스미드 구축
큰 삽입 (>100 bp), MjpAzFRS, tRNA 또는 항생제 내성 카세트의 삽입을 PCR 앰플리콘 또는 gBlock의 깁슨 어셈블리에 의해 수행하였다. 앰플리콘을 RT에서 밤새 DpnI로 처리한 후, 50℃에서 1.5시간 동안 어셈블리하였다. 결실 또는 작은 삽입 (<50 bp; 예를 들어 코돈 또는 안티코돈 돌연변이유발, 제한 부위의 제거, 또는 골든 게이트 목표 부위의 도입)은 전체 플라스미드를 증폭시키도록 설계된 PCR 프라이머 오버행 내로 목적하는 변화를 도입함으로써 구축하였다. PCR 전에 T4 PNK를 사용하여 프라이머를 인산화하고, 생성된 PCR 앰플리콘을 RT에서 밤새 DpnI로 처리하고, T4 DNA 리가제를 사용하여 재순환시켰다. 초기 어셈블리/라이게이션 후에, 플라스미드를 전기적격 XL-10 골드 세포 내로 형질전환시키고, 선택적 LB 레녹스 한천 (BP 디프코) 상에서 성장시켰다. 플라스미드를 개별 콜로니로부터 단리하고, 사용 전에 생어 서열분석으로 검증하였다. 본 연구에 사용된 모든 플라스미드는 표 4에서 찾아볼 수 있다. 모든 sfGFP 리딩 프레임은 PT7-tetO에 의해 제어되고, 모든 tRNA는 ori(p15A) bleoR을 함유한 PT7-lacO 백본 pSYN에 의해 제어되었다. 백본 pGEX는 ori(pBR322) ampR을 함유한다. 골든 게이트 목표 부위 (dest)는 인식 서열 BsaI-KpnI-BsaI로 구성되었다.
표 4. 실시예에서 사용된 플라스미드
Figure pct00026
Figure pct00027
UBP 올리고의 PCR
UBP-함유 서열을 갖는 이중-가닥 DNA 삽입물은 주형으로서 화학적으로 합성된 dNaM (목록 B)-함유 ssDNA 올리고뉴클레오티드를 사용하여 프라이머 (목록 A)와 함께 PCR (원택(OneTaq) 표준 완충제 1x, 0.025 유닛/μl 원택, 0.2 mM dNTP, 0.1 mM dTPT3TP, 0.1 mM dNaMTP, 1.2 mM MgSO4, 1x SYBR 그린, 1.0 μM 프라이머, ~20 pM 주형; 사이클링: 96℃ 0:30분, 96℃ 0:30분, 54℃ 0:30분, 68℃ 4:00분, 형광 판독, 단계 2 <24회 진행)하여 수득하였다. 위치 sfGFP 190 및 sfGFP 200 에 대한 삽입물을 상기와 동일한 조건을 사용하지만 둘 다 1 nM의 주형을 사용하여 중첩 연장에 의해 합하였다. 증폭을 모니터링하고, SYBR 그린 트레이스가 정체할 때 반응물을 얼음 상에 두었다. 생성물을 천연 PAGE (6% 아크릴아미드:비스아크릴아미드 29:1; 1x TBE 중 SYBR 골드 염색)를 통해 분석하여 단일 앰플리콘을 검증하고, 스핀-칼럼 (자이모 리서치) 상에서 정제하고, 큐비트(Qubit) dsDNA HS (써모피셔)를 사용하여 정량화하였다.
SSO 발현 벡터의 골든 게이트 어셈블리
UBP-함유 삽입물을 골든 게이트 어셈블리 (컷스마트(Cutsmart) 완충제 1x, 1 mM ATP, 6.67 유닛/μl T4 DNA 리가제, 0.67 유닛/μl BsaI-HFv2, 20 ng/μl 진입 벡터 DNA; 사이클링: 37℃ 10:00분, 37℃ 5:00분, 16℃ 5:00분, 22℃ 2:00분, 단계 2로부터 반복 39회, 37℃ 20:00분, 55℃ 15:00분, 80℃ 30:00분)를 통해 pSYN 진입 벡터 프레임워크 (표 4) 내에 각 삽입물 대 진입 벡터의 3:1 몰비로 혼입시켰다. BsaI-HF를 도 6에서의 실험에 사용하였다. 잔류 선형 DNA 및 소화되지 않은 진입 벡터를 먼저 KpnI-HF (0.33 단위/μl, 37℃에서 1시간), 및 이어서 T5 엑소뉴클레아제 (0.17 단위/μl, 37℃에서 30분)로 소화시켰다. 생성물을 스핀-칼럼 상에서 정제하고, 큐비트 dsDNA HS (써모피셔)를 사용하여 정량화하였다.
적격 스타터 세포의 제조
균주 ML2 (BL21(DE3) lacZYA::PtNTT2(66-575) ΔrecA polB++)를 보조 pGEX 플라스미드 (표 4)로 형질전환시키고, 클로람페니콜 및 카르베니실린을 함유하는 LB 레녹스 한천 상에 플레이팅하였다. 이전에 기재된 바와 같이 (문헌 [Zhang et al. 2017]), 단일 콜로니를 선별하고, 방사성 [α-32P]dATP의 흡수에 의해 PtNTT2 활성을 검증하였다. UBP 복제 및 번역을 위한 적격 세포를 OD600 0.25-0.30까지 37℃ 250 r.p.m.에서 배플형 배양 플라스크 내 2xYT 배지 중에서 성장시킴으로써 제조하였다. 배양물을 사전-냉각된 50 mL 팔콘 튜브로 옮기고, 빙수조에서 2분 동안 부드럽게 진탕하였다. 세포를 원심분리 (10분, 3200 r.p.m)에 의해 펠릿화하고, 차가운 멸균수 중에서 세척하고, 펠릿화하고, 다시 세척한 후, 최종적으로 펠릿화하고, 10 mL 배양물당 50 μl 10% 글리세롤 중에 현탁시켰다. 세포를 즉시 사용하거나 또는 추후 사용을 위해 -80℃에서 동결시켰다.
비-클론 집단 실험
새로 제조된 적격 세포를 ~0.4 ng 골든 게이트 어셈블리 생성물로 전기천공하고 (2.5 kV), 인산칼륨 (50 mM pH 7)이 보충된 950 μl 2xYT 중에 즉시 현탁시키고, 이 중 10 μl를 제오신 없이 1.25X dNaMTP 및 dTPT3TP를 함유한 40 μl의 UBP 배지로 희석하였다. 37℃에서 1시간 동안 세포를 회수한 후, 15 μl 세포를 제오신을 함유한 285 μl UBP 배지 중에 현탁시키고, 48-웰 플레이트에서 진탕하면서 37℃에서 성장시켰다. 배양물을 정지기에 도달하기 전 OD600 ~1에서 얼음으로 옮기고, 단백질 발현을 위해 밤새 저장하였다.
클론 SSO 실험
적격 세포를 골든 게이트 어셈블리 생성물 (1-20 ng)로 전기천공하고, 비-클론 집단 실험에서와 같이 회수하였다. 클로람페니콜, 카르베니실린, 제오신, dNaMTP 및 dTPT3TP를 함유한 한천 액적 (250 μl 2xYT 2% 한천 50 mM 인산칼륨) 상에 10 μl 회수 배양물 (및 그의 희석물)을 확산시킴으로써 플레이팅을 수행하였다. 직경이 대략 0.5 mm인 콜로니를 선별하고, 플레이트 상에서 성장 (12-20시간; 37℃) 후에 UBP 배지 (300 μl) 내로 현탁시켰다. 각각의 배양물을 정지기에 도달하기 전 OD ~1에서 얼음 상의 사전-냉각된 튜브로 옮기고, 단백질 발현을 위해 밤새 저장하였다. 각각의 배양물을 1) 스트렙타비딘 비오틴 변위 검정 (하기 기재된 바와 같음)을 이용하여 UBP 보유에 대해서 및 2) 배양물을, 발현을 위한 성분 (리보뉴클레오시드 트리포스페이트, ncAA, IPTG, 및 안히드로테트라시클린)을 이미 함유한 배지와 1:4로 혼합함으로써 정성적 sfGFP 발현에 대해서 사전스크리닝하였다. 콜로니는 37℃에서 2시간 또는 RT에서 밤새 인큐베이션한 후에 적절한 ncAA를 첨가하였을 때 임의의 형광 신호를 생성하지 않으면 폐기하였다. 추가로, sfGFP 내에 <80% UBP 보유를 갖는 콜로니를 폐기하였다. 3개 초과의 콜로니가 이들 기준을 충족시키면, 물질 비용을 제한하기 위해 가장 높은 UBP 보유를 갖는 3개만을 선택하였다. 도 7a에서 파선의 우측에 대한 데이터는 약간 변형된 방법을 통해 수득하였다. 상기 기재된 바와 같이 콜로니를 사전스크리닝하는 것 대신 다수의 콜로니 상에서 발현을 수행하였지만, 단백질 분석은 발현 동안 유망한 형광을 나타낸 배양물에 대해서만 수행하였다. 발현 동안 10 mM AzK를 사용하였다. 추가로, 완충제 W2를 단백질 정제 동안 완충제 W 대신에 사용하였다.
사전클로닝된 SSO 발현 벡터
도 7b, 도 8, 및 도 9의 실험에서, 콜로니 사전스크리닝을 용이하게 하기 위해 형질전환을 위한 출발 플라스미드의 역할을 하도록 사전스크리닝된 콜로니로부터의 플라스미드를 단리하였다 (자이모 리서치 미니프렙). 플라스미드를 적절한 ncAA(들)를 사용하여 sfGFP 발현으로부터의 정성적 형광에 대해 사전스크리닝하였다 (상기 기재된 바와 같음). 대신 도 7b의 데이터에 대한 콜로니를 AzK의 존재 하에 rNaMTP 및 rTPT3TP의 존재 및 부재 하에 사전스크리닝하여 각각 암색 및 형광 신호를 정성적으로 생성하였다. 모든 사전클로닝된 플라스미드를 sfGFP 내 UBP 보유 (>80%)에 대해 사전스크리닝하였다. 또한, 이들 플라스미드를 비천연 뉴클레오시드 트리포스페이트 없이 표준 원택 프로토콜 (뉴 잉글랜드 바이오랩스)을 사용하여 PCR 증폭시켜 dX → dN 돌연변이를 시행하고, 앰플리콘을 생어 서열분석하여 플라스미드 내 천연 서열의 완전성을 검증하였다. 침묵 돌연변이는 단백질 코딩 서열에서 허용되었다.
UBP 단백질 발현
배양물을 UBP 배지 중에서 OD600 0.10-0.15로 리프레시하고, 리보뉴클레오티드 트리포스페이트를 5 mM pAzF, 20 mM AzK, 또는 10 mM PrK에서 ncAA와 함께 250 μM NaMTP 및 30 μM TPT3TP에 첨가할 때 OD 0.5-0.8까지 37℃ 진탕하였다. 단지 10 mM AzK만이 이중/삼중 코돈 실험 또는 그의 대조군에서 사용되었다 (도 8, 도 9). 추가 인큐베이션 20분 후, IPTG (1 mM)를 첨가함으로써 사전유도를 개시하고, 배양물을 추가로 1시간 동안 인큐베이션하였다. 최종적으로, 안히드로테트라시클린 (100 ng/μl)을 첨가함으로써 tetO의 탈억제에 의해 sfGFP 발현을 유도하였다. OD600 및 GFP 형광을 퍼킨 엘머 엔비전 2103 멀티라벨 판독기 (OD: 590/20 nm 필터; sfGFP: ex. 485/14 nm, em. 535/25 nm)를 사용하여 모니터링하였다 (30분 마다). 발현 3시간 후, 배양물을 펠릿화하고, 추후 분석을 위해 -80℃에서 저장하였다.
UBP 보유에 대한 스트렙타비딘-비오틴 변위 검정
플라스미드 DNA 내의 UBP 보유를 비천연 뉴클레오시드 트리포스페이트 d5SICSTP 및 비오티닐화 dNaM 유사체 dMMO2BioTP를 사용한 PCR 증폭에 의해 측정하였다. SSO로부터의 플라스미드를 표준 미니프렙을 통해 단리하여, SSO 발현 플라스미드 (pSYN) 및 보조 플라스미드 (pGEX)의 혼합물을 생성하였다. 총 2 ng의 플라스미드 혼합물을 15 μl PCR 반응 (원택 표준 완충제 1x, 0.018 유닛/μl 원택, 0.007 유닛/μl 딥벤트, 0.4 mM dNTP, 0.1 mM d5SICSTP, 0.1 mM dMMO2BioTP, 2.2 mM MgSO4, 1X SYBR 그린, 1.0 μM 프라이머; 사이클링: 96℃ 2:00분, 96℃ 0:30분, 50℃ 0:10분, 68℃ 4:00분, 형광 판독, 68℃ 0:10분, 단계 2 <24회 진행)에서 주형으로 사용하였다. SYBR 그린 I 트레이스가 정체기까지 증폭을 나타내므로 개별 샘플을 각 주기의 마지막 단계 중에 제거하였다. 생성된 비오티닐화 앰플리콘을 1.5-2.0 μl 조 PCR 반응물당 10 μg 스트렙타비딘 (프로메가)으로 보충하였다. 스트렙타비딘 결합 분획을 6% 천연-PAGE에 의한 변위로서 가시화하고, 변위 및 비변위 밴드 둘 다를 이미지스튜디오라이트(ImageStudioLite) 또는 피지(Fiji)에 의해 정량화하여 변위의 상대적 미가공 백분율을 산출하였다. 미가공 변위를, 화학적으로 합성된 올리고뉴클레오티드를 사용한 PCR 반응물의 주형화에 의해 생성된 대조군 변위로 정규화함으로써, 전체 UBP 보유를 평가하였다. tRNA p AzF 또는 tRNASer에 대해서는 정규화가 가능하지 않았는데, 이는 충실한 증폭이 골든 게이트 삽입물 외부에서 어닐링하는 프라이머로만 가능하였고, 따라서 상응하는 대조군 올리고뉴클레오티드에 어닐링하지 않았기 때문이다.
단백질 정제
단백질 발현 실험으로부터의 세포 펠릿 (200 μl)을 버그부스터(BugBuster) (100 μl; EMD 밀리포어; 15분; RT; 220 r.p.m.)를 사용하여 용해시켰다. 이어서, 세포 용해물을 완충제 W (50 mM HEPES pH 8, 150 mM NaCl, 1 mM EDTA)에서 500 μl의 최종 부피에서 사용된 친화성 비드의 부피를 뺀 값으로 희석하였다. 자기 스트렙-택틴 XT 비드 (매그스트렙 "유형3" XT 비드의 5% (v/v) 현탁액, IBA 라이프사이언시스)를 상용 정제를 위해 20 μl 및 총 발현 산출량의 추정을 위해 100 μl로 사용하였다. 단백질을 비드에 결합시킨 후 (30분; 4℃; 부드럽게 회전), 비드를 끌어내고, 완충제 W (2x500 μl)로 세척하였다. HRMS 분석을 위한 단백질 정제에서, 완충제 W2를 대신 사용하였다 (50 mM HEPES pH 8, 1 mM EDTA). 최종적으로, 단백질을 25 μl 완충제 BXT (50 mM HEPES pH 8, 150 mM NaCl, 1 mM EDTA, 50 mM d-비오틴)를 사용하여 10분 동안 실온에서 간헐적으로 볼텍싱하면서 용리시켰다. 단백질을 HRMS 분석을 위해 완충제 BXT2 (50 mM HEPES pH 8, 1 mM EDTA, 50 mM d-비오틴)로 용리시켰다. 큐빗 단백질 검정 키트 (써모피셔)를 정량화에 사용하였다.
TAMRA 접합된 sfGFP의 웨스턴 블롯팅
33 ng/μl의 순수한 단백질을 0.1 mM TAMRA-PEG4-DBCO (클릭 케미스트리 툴즈)와 함께 RT에서 밤새 암실에서 인큐베이션함으로써 SPAAC를 수행하였다. 반응물을 SDS-PAGE 로딩 염료 (250 mM 트리스-HCl pH 6, 30% 글리세롤, 5% βME, 0.02% 브로모페놀 블루)와 2:1로 혼합하고, 95℃에서 5분 동안 변성시켰다. SDS-PAGE 겔은 위치 sfGFP151을 분석할 때 5% 아크릴아미드 적층 겔 및 15% 아크릴아미드 분해 겔이었고, sfGFP190,200을 분석할 때 17%였다 (분해 겔: 15% 또는 17% 아크릴아미드:비스아크릴아미드 29:1, 0.1% (w/v) APS, 0.04% TEMED, 0.375 M 트리스-HCl pH 8.8, 0.1% (w/v) SDS; 적층: 5% 아크릴아미드:비스아크릴아미드 29:1, 0.1% (w/v) APS, 0.1% TEMED, 0.125 M 트리스-HCl pH 6.8, 0.1% (w/v) SDS). 전기영동을 40 V에서 15분 동안 수행한 후, 15% 겔에 대해 120 V에서 ~5시간 및 17% 겔에 대해 ~6.5시간 동안 실행하였다. 구동 완충제 (25 mM 트리스 염기, 200 mM 글리신, 0.1% (w/v) SDS)를 2시간마다 교체하였다. 생성된 겔을 저온 전달 완충제 (20% (v/v) MeOH, 50 mM 트리스 염기, 400 mM 글리신, 0.0373% (w/v) SDS) 중 습식 전달을 사용하여 90 V에서 1시간 동안 PVDF (EMD 밀리포어 0.45 μm PVDF-FL) 상에 블롯팅하였다. 막을 PBS-T (PBS pH 7.4, 0.01% (v/v) 트윈-20) 중 5% 탈지유 용액을 사용하여 4℃에서 밤새 완만하게 교반하면서 차단하였다. 1차 항체 (토끼 α-Nterm-GFP 시그마 알드리치 #G1544)를 PBS-T (1:3,000) 중에서 1시간 동안 적용하였다 (RT; 완만한 교반). 블롯을 PBS-T (5분)에서 세척한 후, 2차 항체 (염소 α-토끼-알렉사 플루오르 647-접합된 항체, 써모피셔 #A32733)를 PBS-T (1:20,000) 중에서 45분 동안 적용하였다 (RT; 완만한 교반). 블롯을 PBS-T로 세척한 후 (3x5분), 타이푼(Typhoon) 9410 레이저 스캐너 (타이푼 스캐너 컨트롤 v5 지이 헬스케어 라이프 사이언시스)를 사용하여 50-100 μm 해상도로 영상화하고, 먼저 알렉사플루오르 647 (Ex. 633 nm; Em. 670/30 nm; PMT 500 V) 및 이어서 TAMRA (Ex. 532 nm; Em. 580/30 nm; PMT 400 V)에 대해 스캐닝하였다.
PrK-pAzF 표지된 단백질의 이중 생체접합
1 mL의 배양물로부터의 세포 펠릿을 버그부스터 (100 μl; EMD 밀리포어; 실온에서 15분; 220 r.p.m.)를 사용하여 용해시켰다. 용해물을 완충제 W (600 μl)에서 희석하고, 매그스트렙 비드를 첨가하고 (200 μl), 결합되도록 하였다 (30분; 4℃; 완만한 회전). 비드를 자석을 사용하여 끌어내고, 차가운 완충제 W (2x1000 μl)로 세척한 후, 완충제 W (200 μl) 중에 현탁시켰다. SPAAC를 TAMRA-PEG4-DBCO (0.5 mM)과 함께 이 현탁액의 절반을 사용하여 12-16시간 수행하였다 (RT; 부드럽게 회전). 비드를 EDTA-무함유 완충제 W (2x 500 μl; HEPES 50 mM pH 7.4, 150 mM NaCl)로 세척한 후, EDTA-무함유 완충제 W (100 ul) 중에 현탁시켰다. CuAAC를 아지도-PEG4-TAMRA (0.2 mM) 뿐만 아니라 황산구리 (II) (0.5 mM), 트리스(벤질트리아졸릴메틸)아민 (2 mM; THPTA), 및 아스코르브산나트륨 (15 mM)과 함께 이 현탁액의 절반을 사용하여 수행하였다 (1.5시간; RT; 부드럽게 회전). 비드를 완충제 W (2x500 μl)로 세척한 후, 완충제 BXT를 사용하여 용리를 수행하였다 (10분; RT; 간헐적으로 볼텍싱).
무손상 단백질 고해상도 질량 분광측정법
정제된 단백질 (5 ug)을 상기 기재된 바와 같이 14,000 x g (3x10분 및 이어서 1x18분)에서 10K 아미콘 울트라 원심분리 필터 (EMD 밀리포어)를 통한 4 사이클의 원심분리에 의해 HPLC 등급 물 (4x500 μl) 내로 탈염시켰다. 단백질을 회수한 후, 6 μl 단백질을 워터스 G2-XS TOF에 연결된 워터스 I-클래스 LC에 주입하였다. 유동 조건은 0.4 mL/분의 50:50 물:아세토니트릴 + 0.1% 포름산이었다. ESI+에 의해 이온화를 수행하고, m/z 500-2000에 대한 데이터를 수집하였다. 질량 피크의 주요 부분에 걸쳐 스펙트럼 조합을 수행하고, 합한 스펙트럼을 워터스 MaxEnt1을 사용하여 디컨볼루션하였다. 분석은 자동화 피크 통합 및 수동 피크 확인에 의해 수행하였다 (도 15, 도 16). 충실도는 기술적 불순물 (예를 들어, 염 부가물, 아르기닌 산화)을 고려하지 않고 생성물 또는 불순물인 것으로 확인된 모든 질량의 적분 대비 예상 질량의 적분으로서 계산되었다.
본 개시내용의 바람직한 실시양태가 본원에 제시되고 기재되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본 개시내용으로부터 벗어나지 않으면서 다수의 변형, 변화 및 치환이 관련 기술분야의 통상의 기술자에게 이제 떠오를 것이다. 본원에 기재된 본 개시내용의 실시양태에 대한 다양한 대안이 본 개시내용을 실시하는데 사용될 수 있는 것으로 이해되어야 한다. 하기 청구범위는 본 개시내용의 범주를 규정하고, 이들 청구범위의 범주 내의 방법 및 구조 및 그의 등가물이 그에 의해 포괄되는 것으로 의도된다.
SEQUENCE LISTING <110> THE SCRIPPS RESEARCH INSTITUTE <120> COMPOSITIONS AND METHODS FOR IN VIVO SYNTHESIS OF UNNATURAL POLYPEPTIDES <130> 36271-809.601 <140> <141> <150> 62/988,882 <151> 2020-03-12 <150> 62/913,664 <151> 2019-10-10 <160> 28 <170> PatentIn version 3.5 <210> 1 <211> 575 <212> PRT <213> Phaeodactylum tricornutum <400> 1 Met Arg Pro Tyr Pro Thr Ile Ala Leu Ile Ser Val Phe Leu Ser Ala 1 5 10 15 Ala Thr Arg Ile Ser Ala Thr Ser Ser His Gln Ala Ser Ala Leu Pro 20 25 30 Val Lys Lys Gly Thr His Val Pro Asp Ser Pro Lys Leu Ser Lys Leu 35 40 45 Tyr Ile Met Ala Lys Thr Lys Ser Val Ser Ser Ser Phe Asp Pro Pro 50 55 60 Arg Gly Gly Ser Thr Val Ala Pro Thr Thr Pro Leu Ala Thr Gly Gly 65 70 75 80 Ala Leu Arg Lys Val Arg Gln Ala Val Phe Pro Ile Tyr Gly Asn Gln 85 90 95 Glu Val Thr Lys Phe Leu Leu Ile Gly Ser Ile Lys Phe Phe Ile Ile 100 105 110 Leu Ala Leu Thr Leu Thr Arg Asp Thr Lys Asp Thr Leu Ile Val Thr 115 120 125 Gln Cys Gly Ala Glu Ala Ile Ala Phe Leu Lys Ile Tyr Gly Val Leu 130 135 140 Pro Ala Ala Thr Ala Phe Ile Ala Leu Tyr Ser Lys Met Ser Asn Ala 145 150 155 160 Met Gly Lys Lys Met Leu Phe Tyr Ser Thr Cys Ile Pro Phe Phe Thr 165 170 175 Phe Phe Gly Leu Phe Asp Val Phe Ile Tyr Pro Asn Ala Glu Arg Leu 180 185 190 His Pro Ser Leu Glu Ala Val Gln Ala Ile Leu Pro Gly Gly Ala Ala 195 200 205 Ser Gly Gly Met Ala Val Leu Ala Lys Ile Ala Thr His Trp Thr Ser 210 215 220 Ala Leu Phe Tyr Val Met Ala Glu Ile Tyr Ser Ser Val Ser Val Gly 225 230 235 240 Leu Leu Phe Trp Gln Phe Ala Asn Asp Val Val Asn Val Asp Gln Ala 245 250 255 Lys Arg Phe Tyr Pro Leu Phe Ala Gln Met Ser Gly Leu Ala Pro Val 260 265 270 Leu Ala Gly Gln Tyr Val Val Arg Phe Ala Ser Lys Ala Val Asn Phe 275 280 285 Glu Ala Ser Met His Arg Leu Thr Ala Ala Val Thr Phe Ala Gly Ile 290 295 300 Met Ile Cys Ile Phe Tyr Gln Leu Ser Ser Ser Tyr Val Glu Arg Thr 305 310 315 320 Glu Ser Ala Lys Pro Ala Ala Asp Asn Glu Gln Ser Ile Lys Pro Lys 325 330 335 Lys Lys Lys Pro Lys Met Ser Met Val Glu Ser Gly Lys Phe Leu Ala 340 345 350 Ser Ser Gln Tyr Leu Arg Leu Ile Ala Met Leu Val Leu Gly Tyr Gly 355 360 365 Leu Ser Ile Asn Phe Thr Glu Ile Met Trp Lys Ser Leu Val Lys Lys 370 375 380 Gln Tyr Pro Asp Pro Leu Asp Tyr Gln Arg Phe Met Gly Asn Phe Ser 385 390 395 400 Ser Ala Val Gly Leu Ser Thr Cys Ile Val Ile Phe Phe Gly Val His 405 410 415 Val Ile Arg Leu Leu Gly Trp Lys Val Gly Ala Leu Ala Thr Pro Gly 420 425 430 Ile Met Ala Ile Leu Ala Leu Pro Phe Phe Ala Cys Ile Leu Leu Gly 435 440 445 Leu Asp Ser Pro Ala Arg Leu Glu Ile Ala Val Ile Phe Gly Thr Ile 450 455 460 Gln Ser Leu Leu Ser Lys Thr Ser Lys Tyr Ala Leu Phe Asp Pro Thr 465 470 475 480 Thr Gln Met Ala Tyr Ile Pro Leu Asp Asp Glu Ser Lys Val Lys Gly 485 490 495 Lys Ala Ala Ile Asp Val Leu Gly Ser Arg Ile Gly Lys Ser Gly Gly 500 505 510 Ser Leu Ile Gln Gln Gly Leu Val Phe Val Phe Gly Asn Ile Ile Asn 515 520 525 Ala Ala Pro Val Val Gly Val Val Tyr Tyr Ser Val Leu Val Ala Trp 530 535 540 Met Ser Ala Ala Gly Arg Leu Ser Gly Leu Phe Gln Ala Gln Thr Glu 545 550 555 560 Met Asp Lys Ala Asp Lys Met Glu Ala Lys Thr Asn Lys Glu Lys 565 570 575 <210> 2 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 2 atgggtctca cacaaactcg agtacaactt taactcacac 40 <210> 3 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 3 atgggtctcg attccattct tttgtttgtc tgc 33 <210> 4 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 4 cataatggtc tcgctgctgc ccgataacca c 31 <210> 5 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 5 tgatattggt ctcggtcttt cgataaaaca ctctgagtag ag 42 <210> 6 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 6 atgggtctcg aaacctgatc atgtagatcg aacgg 35 <210> 7 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 atgggtctca tctaacccgg ctgaacgg 28 <210> 8 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 atgggtctcc ggtagttcag cagggcagaa cg 32 <210> 9 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 atgggtctcg gaggggattt gaacccctgc catg 34 <210> 10 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 atattcggtc tcgtcagcag aatacgccga ttgg 34 <210> 11 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 acgcgttggt ctcggttatc gggcagcagc acc 33 <210> 12 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 attggtctcg gccgagcggt tgaaggcac 29 <210> 13 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 attggtctct ctggaaccct ttcgggtcg 29 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 ctcgagtaca actttaactc acac 24 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 gattccattc ttttgtttgt ctgc 24 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 gctgctgccc gataaccac 19 <210> 17 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 ggtctttcga taaaacactc tgagtagag 29 <210> 18 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 gaaacctgat catgtagatc gaacgg 26 <210> 19 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 atctaacccg gctgaacgg 19 <210> 20 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 ccgctgccac taggaagctt atg 23 <210> 21 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 cctctagaaa atcattccgg aagtgtg 27 <210> 22 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (30)..(30) <223> An unnatural nucleotide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 22 ctctggaacc ctttcgggtc gccggtttgn tagaccggtg ccttcaaccg ctcggc 56 <210> 23 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (31)..(33) <223> a, c, t, or g <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 23 ctcgagtaca actttaactc acacaatgta nnnatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 24 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (23)..(23) <223> An unnatural nucleotide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 24 cagcagaata cgccgattgg cgntggcccg gtgctgctgc ccgataacc 49 <210> 25 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (21)..(21) <223> An unnatural nucleotide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 25 gctgctgccc gataaccaca ncctctctac tcagagtgtt ttatcgaaag acc 53 <210> 26 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (19)..(19) <223> An unnatural nucleotide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 26 gctgcccgat aaccacagnt tgtctactca gagtgtttta tcg 43 <210> 27 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(27) <223> a, c, t, or g <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 27 gaatctaacc cggctgaacg gattnnnagt ccgttcgatc tacatgatca gg 52 <210> 28 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (27)..(27) <223> An unnatural nucleotide <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 28 gatttgaacc cctgccatgc ggattancag tccgccgttc tgccctgctg aa 52

Claims (70)

  1. a. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 데옥시리보핵산 (DNA) 분자를 제공하고, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 단계;
    b. 적어도 1개의 비천연 DNA 분자를 전사시켜 mRNA를 제공하는 단계;
    c. 적어도 1개의 비천연 DNA 분자를 전사시켜 적어도 제1 및 제2 tRNA 분자를 제공하는 단계; 및
    d. 적어도 제1 및 제2 비천연 tRNA 분자를 이용하여 비천연 mRNA 분자를 번역함으로써 비천연 폴리펩티드를 합성하고, 여기서 적어도 제1 및 제2 비천연 안티코돈 각각은 비천연 아미노산의 비천연 폴리펩티드 내로의 부위-특이적 혼입을 지시하는 것인 단계
    를 포함하는, 비천연 폴리펩티드를 합성하는 방법.
  2. 제1항에 있어서, 적어도 2개의 비천연 코돈 각각이 코돈의 제1 위치, 제2 위치 또는 제3 위치에 위치하는 제1 비천연 뉴클레오티드를 포함하고, 임의로 제1 비천연 뉴클레오티드가 코돈의 제2 위치 또는 제3 위치에 위치하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 적어도 2개의 비천연 코돈 각각이 핵산 서열 NNX 또는 NXN을 포함하고, 비천연 안티코돈이 핵산 서열 XNN, YNN, NXN, 또는 NYN을 포함하여, NNX-XNN, NNX-YNN, 또는 NXN-NYN을 포함하는 비천연 코돈-안티코돈 쌍을 형성하며, 여기서 N은 임의의 천연 뉴클레오티드이고, X는 제1 비천연 뉴클레오티드이고, Y는 제1 비천연 뉴클레오티드와 상이한 제2 비천연 뉴클레오티드이며, X-Y는 DNA에서 비천연 염기 쌍을 형성하는 것인 방법.
  4. 제3항에 있어서, 코돈이 적어도 1개의 G 또는 C를 포함하고, 안티코돈이 적어도 1개의 상보적 C 또는 G를 포함하는 것인 방법.
  5. 제3항 또는 제4항에 있어서, X 및 Y가 독립적으로
    (i) 2-티오우라실, 2'-데옥시우리딘, 4-티오-우라실, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 또는 디히드로우라실;
    (ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온) 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온);
    (iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌 또는 6-아자-아데닌;
    (iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및
    (v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘 또는 2-피리돈
    으로 이루어진 군으로부터 선택되는 것인 방법.
  6. 제4항 또는 제5항에 있어서, 각각의 X 및 Y를 구성하는 염기가 독립적으로
    Figure pct00028
    로 이루어진 군으로부터 선택되는 것인 방법.
  7. 제6항에 있어서, 각각의 X를 구성하는 염기가
    Figure pct00029
    인 방법.
  8. 제6항 또는 제7항에 있어서, 각각의 Y를 구성하는 염기가
    Figure pct00030
    인 방법.
  9. 제3항 내지 제8항 중 어느 한 항에 있어서, NNX-XNN이 UUX-XAA, UGX-XCA, CGX-XCG, AGX-XCU, GAX-XUC, CAX-XUG, AUX-XAU, CUX-XAG, GUX-XAC, UAX-XUA 및 GGX-XCC로 이루어진 군으로부터 선택되는 것인 방법.
  10. 제3항 내지 제8항 중 어느 한 항에 있어서, NNX-YNN이 UUX-YAA, UGX-YCA, CGX-YCG, AGX-YCU, GAX-YUC, CAX-YUG, AUX-YAU, CUX-YAG, GUX-YAC, UAX-YUA, 및 GGX-YCC로 이루어진 군으로부터 선택되는 것인 방법.
  11. 제3항 내지 제8항 중 어느 한 항에 있어서, NXN-NYN이 GXU-AYC, CXU-AYG, GXG-CYC, AXG-CYU, GXC-GYC, AXC-GYU, GXA-UYC, CXC-GYG 및 UXC-GYA로 이루어진 군으로부터 선택되는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 적어도 2개의 비천연 tRNA 분자 각각이 상이한 비천연 안티코돈을 포함하는 것인 방법.
  13. 제12항에 있어서, 적어도 2개의 비천연 tRNA 분자가 메타노사르시나(Methanosarcina) 속으로부터의 피롤리실 tRNA 및 메타노칼도코쿠스 잔나쉬이(Methanocaldococcus jannaschii)로부터의 티로실 tRNA, 또는 그의 유도체를 포함하는 것인 방법.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서, 아미노-아실 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함하는 방법.
  15. 제14항에 있어서, tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)로 이루어진 군으로부터 선택되는 것인 방법.
  16. 제12항 또는 제13항에 있어서, 적어도 2개의 상이한 tRNA 신테타제에 의해 적어도 2개의 비천연 tRNA 분자를 충전하는 것을 포함하는 방법.
  17. 제16항에 있어서, 적어도 2개의 상이한 tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)를 포함하는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 비천연 폴리펩티드가 2, 3개 또는 그 초과의 비천연 아미노산을 포함하는 것인 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 비천연 폴리펩티드가 적어도 2개의 동일한 비천연 아미노산을 포함하는 것인 방법.
  20. 제1항 내지 제18항 중 어느 한 항에 있어서, 비천연 폴리펩티드가 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 비천연 아미노산이
    리신 유사체;
    방향족 측쇄;
    아지도 기;
    알킨 기; 또는
    알데히드 또는 케톤 기
    를 포함하는 것인 방법.
  22. 제1항 내지 제20항 중 어느 한 항에 있어서, 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 방법.
  23. 제1항 내지 제20항 중 어느 한 항에 있어서, 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신, 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로부터 선택되는 것인 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 적어도 1개의 비천연 DNA 분자가 플라스미드 형태인 방법.
  25. 제1항 내지 제23항 중 어느 한 항에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합되는 것인 방법.
  26. 제24항 또는 제25항에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 세포 유기체에서 비천연 DNA 분자의 생체내 복제 및 전사, 및 전사된 mRNA 분자의 생체내 번역을 포함하는 방법.
  28. 제27항에 있어서, 세포 유기체가 미생물인 방법.
  29. 제28항에 있어서, 세포 유기체가 원핵생물인 방법.
  30. 제29항에 있어서, 세포 유기체가 박테리아인 방법.
  31. 제30항에 있어서, 세포 유기체가 그람-양성 박테리아인 방법.
  32. 제30항에 있어서, 세포 유기체가 그람-음성 박테리아인 방법.
  33. 제32항에 있어서, 세포 유기체가 에스케리키아 콜라이(Escherichia coli)인 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 적어도 2개의 비천연 염기 쌍이 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, 또는 dNaM-dTAT1로부터 선택되는 염기 쌍을 포함하는 것인 방법.
  35. 제27항 내지 제34항 중 어느 한 항에 있어서, 세포 유기체가 뉴클레오시드 트리포스페이트 수송체를 포함하는 것인 방법.
  36. 제35항에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 아미노산 서열을 포함하는 것인 방법.
  37. 제36항에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 말단절단된 아미노산 서열을 포함하고, 임의로 PtNTT2의 말단절단된 아미노산 서열이 서열식별번호: 1에 의해 코딩되는 PtNTT2에 대해 적어도 80% 동일한 것인 방법.
  38. 제27항 내지 제37항 중 어느 한 항에 있어서, 세포 유기체가 적어도 1개의 비천연 DNA 분자를 포함하는 것인 방법.
  39. 제38항에 있어서, 적어도 1개의 비천연 DNA 분자가 적어도 1개의 플라스미드를 포함하는 것인 방법.
  40. 제38항에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합되는 것인 방법.
  41. 제39항 또는 제40항에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 방법.
  42. 제1항 내지 제24항 중 어느 한 항에 있어서, 비천연 폴리펩티드를 무세포 시스템으로 합성하는 것을 포함하는 시험관내 방법인 방법.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 비천연 염기 쌍이 비천연 당 모이어티를 포함하는 적어도 1개의 비천연 뉴클레오티드를 포함하는 것인 방법.
  44. 제43항에 있어서, 비천연 당 모이어티가
    하기를 포함하는 2' 위치에서의 변형:
    OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, 또는 NH2F;
    O-알킬, S-알킬 또는 N-알킬;
    O-알케닐, S-알케닐, 또는 N-알케닐;
    O-알키닐, S-알키닐, 또는 N-알키닐;
    O-알킬-O-알킬, 2'-F, 2'-OCH3, 또는 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10, 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 또는 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임);
    하기를 포함하는 5' 위치에서의 변형:
    5'-비닐 또는 5'-메틸 (R 또는 S); 또는
    4' 위치에서의 변형, 4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기; 또는
    그의 임의의 조합
    으로 이루어진 군으로부터 선택되는 모이어티를 포함하는 것인 방법.
  45. 적어도 4개의 비천연 염기 쌍을 포함하는 적어도 1개의 비천연 DNA 분자를 포함하는 세포이며, 여기서 적어도 1개의 비천연 DNA 분자는 (i) 비천연 폴리펩티드를 코딩하고 적어도 제1 및 제2 비천연 코돈을 포함하는 메신저 리보핵산 (mRNA) 분자; 및 (ii) 제1 비천연 안티코돈을 포함하는 제1 전달 RNA (tRNA) 분자 및 제2 비천연 안티코돈을 포함하는 제2 tRNA 분자인, 적어도 제1 및 제2 tRNA 분자를 코딩하고, 적어도 1개의 DNA 분자 내의 적어도 4개의 비천연 염기 쌍은 mRNA 분자의 제1 및 제2 비천연 코돈이 각각 제1 및 제2 비천연 안티코돈에 상보적이도록 서열 콘텍스트 내에 있는 것인 세포.
  46. 제45항에 있어서, mRNA 분자 및 적어도 제1 및 제2 tRNA 분자를 추가로 포함하는 세포.
  47. 제46항에 있어서, 적어도 제1 및 제2 tRNA 분자가 비천연 아미노산에 공유 연결된 것인 세포.
  48. 제47항에 있어서, 비천연 폴리펩티드를 추가로 포함하는 세포.
  49. a. 각각의 비천연 코돈-안티코돈 쌍이 비천연 메신저 RNA (mRNA)로부터의 비천연 코돈 및 비천연 전달 리보핵산 (tRNA)으로부터의 비천연 안티코돈을 포함하고, 상기 비천연 코돈이 제1 비천연 뉴클레오티드를 포함하고, 상기 비천연 안티코돈이 제2 비천연 뉴클레오티드를 포함하는 것인 적어도 2개의 상이한 비천연 코돈-안티코돈 쌍; 및
    b. 상응하는 비천연 tRNA에 각각 공유 연결된 적어도 2개의 상이한 비천연 아미노산
    을 포함하는 세포.
  50. 제49항에 있어서, 적어도 4개의 비천연 염기 쌍 (UBP)을 포함하는 적어도 1개의 비천연 DNA 분자를 추가로 포함하는 세포.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 제1 비천연 뉴클레오티드가 비천연 코돈의 제2 또는 제3 위치에 위치하는 것인 세포.
  52. 제51항에 있어서, 제1 비천연 뉴클레오티드가 비천연 안티코돈의 제2 비천연 뉴클레오티드와 상보적으로 염기 쌍형성되는 것인 세포.
  53. 제45항 내지 제52항 중 어느 한 항에 있어서, 제1 비천연 뉴클레오티드 및 제2 비천연 뉴클레오티드가
    Figure pct00031
    로 이루어진 군으로부터 독립적으로 선택되는 제1 및 제2 염기를 각각 포함하고, 여기서 제2 염기는 제1 염기와 상이한 것인 세포.
  54. 제45항 및 제47항 내지 제53항 중 어느 한 항에 있어서, 적어도 4개의 비천연 염기 쌍이 dCNMO/dTPT3, dNaM/dTPT3, dCNMO/dTAT1, 또는 dNaM/dTAT1로 이루어진 군으로부터 독립적으로 선택되는 것인 세포.
  55. 제45항 및 제47항 내지 제54항 중 어느 한 항에 있어서, 적어도 1개의 비천연 DNA 분자가 적어도 1개의 플라스미드를 포함하는 것인 세포.
  56. 제45항 및 제47항 내지 제54항 중 어느 한 항에 있어서, 적어도 1개의 비천연 DNA 분자가 세포의 게놈 내로 통합된 것인 세포.
  57. 제47항 내지 제56항 중 어느 한 항에 있어서, 적어도 1개의 비천연 DNA 분자가 비천연 폴리펩티드를 코딩하는 것인 세포.
  58. 제45항 내지 제57항 중 어느 한 항에 있어서, 뉴클레오시드 트리포스페이트 수송체를 발현하는 세포.
  59. 제58항에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 아미노산 서열을 포함하는 것인 세포.
  60. 제59항에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2의 말단절단된 아미노산 서열을 포함하고, 임의로 PtNTT2의 말단절단된 아미노산 서열이 서열식별번호: 1에 의해 코딩되는 PtNTT2에 대해 적어도 80% 동일한 것인 방법.
  61. 제45항 내지 제60항 중 어느 한 항에 있어서, 적어도 2개의 tRNA 신테타제를 발현하는 세포.
  62. 제61항에 있어서, 적어도 2개의 tRNA 신테타제가 키메라 PylRS (chPylRS) 및 엠. 잔나쉬이 AzFRS (MjpAzFRS)인 세포.
  63. 제45항 내지 제62항 중 어느 한 항에 있어서, 비천연 당 모이어티를 포함하는 비천연 뉴클레오티드를 포함하는 세포.
  64. 제63항에 있어서, 비천연 당 모이어티가
    하기를 포함하는 2' 위치에서의 변형:
    OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, 또는 NH2F;
    O-알킬, S-알킬 또는 N-알킬;
    O-알케닐, S-알케닐, 또는 N-알케닐;
    O-알키닐, S-알키닐, 또는 N-알키닐;
    O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10, 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 또는 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임);
    하기를 포함하는 5' 위치에서의 변형:
    5'-비닐, 5'-메틸 (R 또는 S); 또는
    4' 위치에서의 변형, 4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기; 또는
    그의 임의의 조합
    으로 이루어진 군으로부터 선택되는 것인 세포.
  65. 제45항 내지 제64항 중 어느 한 항에 있어서, 적어도 1개의 비천연 뉴클레오티드 염기가 전사 동안 RNA 폴리머라제에 의해 인식되는 것인 세포.
  66. 제45항 내지 제65항 중 어느 한 항에 있어서, 적어도 2개의 비천연 아미노산을 포함하는 적어도 1개의 비천연 폴리펩티드를 번역하는 세포.
  67. 제45항 내지 제66항 중 어느 한 항에 있어서, 적어도 2개의 비천연 아미노산이 독립적으로 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), N6-(프로파르길옥시)-카르보닐-L-리신 (PrK), p-아지도-페닐알라닌 (pAzF), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산, 셀레노시스테인, N6-(((2-아지도벤질)옥시)카르보닐)-L-리신, N6-(((3-아지도벤질)옥시)카르보닐)-L-리신 및 N6-(((4-아지도벤질)옥시)카르보닐)-L-리신으로 이루어진 군으로부터 선택되는 것인 세포.
  68. 제45항 내지 제67항 중 어느 한 항에 있어서, 단리된 세포.
  69. 제45항 내지 제68항 중 어느 한 항에 있어서, 원핵생물인 세포.
  70. 제45항 내지 제69항 중 어느 한 항의 세포를 포함하는 세포주.
KR1020227015123A 2019-10-10 2020-10-09 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법 KR20220080136A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962913664P 2019-10-10 2019-10-10
US62/913,664 2019-10-10
US202062988882P 2020-03-12 2020-03-12
US62/988,882 2020-03-12
PCT/US2020/054947 WO2021072167A1 (en) 2019-10-10 2020-10-09 Compositions and methods for in vivo synthesis of unnatural polypeptides

Publications (1)

Publication Number Publication Date
KR20220080136A true KR20220080136A (ko) 2022-06-14

Family

ID=75436820

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227015123A KR20220080136A (ko) 2019-10-10 2020-10-09 비천연 폴리펩티드의 생체내 합성을 위한 조성물 및 방법

Country Status (12)

Country Link
US (1) US20220243244A1 (ko)
EP (1) EP4041249A4 (ko)
JP (1) JP2022552271A (ko)
KR (1) KR20220080136A (ko)
CN (1) CN114761026A (ko)
AU (1) AU2020363962A1 (ko)
BR (1) BR112022006233A2 (ko)
CA (1) CA3153855A1 (ko)
IL (1) IL291663A (ko)
MX (1) MX2022004316A (ko)
TW (1) TW202128996A (ko)
WO (1) WO2021072167A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3041854T3 (pl) 2013-08-08 2020-06-29 The Scripps Research Institute Sposób miejscowo specyficznego oznakowania enzymatycznego kwasów nukleinowych in vitro przez inkorporację niewystępujących naturalnie nukleotydów
US11761007B2 (en) 2015-12-18 2023-09-19 The Scripps Research Institute Production of unnatural nucleotides using a CRISPR/Cas9 system
SG11202000167SA (en) 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
CN114207129A (zh) * 2019-06-14 2022-03-18 斯克利普斯研究所 用于在半合成生物体中复制、转录和翻译的试剂和方法
WO2024039516A1 (en) * 2022-08-19 2024-02-22 Illumina, Inc. Third dna base pair site-specific dna detection

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1456360T3 (en) * 2001-04-19 2015-08-31 Scripps Research Inst Methods and Composition for Preparation of Orthogonal TRNA-Aminoacyl-TRNA Synthetase Pairs
US20080051317A1 (en) * 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
SG11202000167SA (en) * 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
US20200224234A1 (en) * 2017-07-11 2020-07-16 The Scripps Research Institute Incorporation of unnatural nucleotides and methods of use in vivo thereof
CN114207129A (zh) * 2019-06-14 2022-03-18 斯克利普斯研究所 用于在半合成生物体中复制、转录和翻译的试剂和方法

Also Published As

Publication number Publication date
JP2022552271A (ja) 2022-12-15
EP4041249A1 (en) 2022-08-17
EP4041249A4 (en) 2024-03-27
TW202128996A (zh) 2021-08-01
US20220243244A1 (en) 2022-08-04
CN114761026A (zh) 2022-07-15
AU2020363962A1 (en) 2022-04-14
WO2021072167A1 (en) 2021-04-15
CA3153855A1 (en) 2021-04-15
IL291663A (en) 2022-05-01
MX2022004316A (es) 2022-05-11
BR112022006233A2 (pt) 2022-06-21

Similar Documents

Publication Publication Date Title
US20240117363A1 (en) Production of unnatural nucleotides using a crispr/cas9 system
US11879145B2 (en) Reagents and methods for replication, transcription, and translation in semi-synthetic organisms
US11466279B2 (en) Import of unnatural or modified nucleoside triphosphates into cells via nucleic acid triphosphate transporters
US20220243244A1 (en) Compositions and methods for in vivo synthesis of unnatural polypeptides
JP7429642B2 (ja) 非天然塩基対組成物および使用の方法
US20220228148A1 (en) Eukaryotic semi-synthetic organisms
RU2799441C2 (ru) Композиции на основе неприродных пар оснований и способы их применения
CN112105627B (zh) 非天然碱基对组合物及使用方法