KR20220034109A - 반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법 - Google Patents

반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법 Download PDF

Info

Publication number
KR20220034109A
KR20220034109A KR1020227000922A KR20227000922A KR20220034109A KR 20220034109 A KR20220034109 A KR 20220034109A KR 1020227000922 A KR1020227000922 A KR 1020227000922A KR 20227000922 A KR20227000922 A KR 20227000922A KR 20220034109 A KR20220034109 A KR 20220034109A
Authority
KR
South Korea
Prior art keywords
natural base
base
natural
unnatural
trna
Prior art date
Application number
KR1020227000922A
Other languages
English (en)
Inventor
플로이드 이. 로메스버그
비비언 티. 디엔
애런 더블유. 펠드먼
레베카 제이. 카라디마
링쥔 리
마이클 피. 레드베터
앤 샤오저우 저우
Original Assignee
더 스크립스 리서치 인스티튜트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 스크립스 리서치 인스티튜트 filed Critical 더 스크립스 리서치 인스티튜트
Publication of KR20220034109A publication Critical patent/KR20220034109A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/24Heterocyclic radicals containing oxygen or sulfur as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)

Abstract

1개 이상의 비천연 아미노산을 포함하는 단백질 또는 폴리펩티드의 생산을 증가시키기 위한 조성물, 방법, 세포, 조작된 미생물 및 키트가 본원에 개시된다. 조작된 세포 또는 반합성 유기체에서의 비천연 아미노산을 코딩하는 비천연 핵산의 보유를 증가시키기 위한 조성물, 세포, 조작된 미생물 및 키트가 추가로 제공된다.

Description

반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법
<관련 출원에 대한 상호 참조>
본 출원은 2019년 6월 14일에 출원된 미국 가출원 번호 62/861,901 (그의 개시내용은 그 전문이 본원에 참조로 포함됨)에 대한 우선권을 주장한다.
<서열 목록>
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2020년 6월 10일에 생성된 상기 ASCII 카피는 36271-808_601_SL.txt로 명명되고, 18,162 바이트 크기이다.
<연방 정부 지원 연구에 관한 진술>
본원에 개시된 발명은 적어도 부분적으로 미국 국립 보건원 (NIH)에 의한 승인 번호 5R35 GM118178 및 GM128376 및 F31 GM128376, 및 미국 국립 과학 재단 (NSF)에 의한 NSF/DGE-1346837 하의 미국 정부 지원으로 이루어졌다. 따라서, 미국 정부는 본 발명에 특정 권리를 갖는다.
생물학적 다양성은 삶이 다양한 환경에 적응하도록 하고, 시간 경과에 따라 새로운 형태 및 기능을 진화시킨다. 상기 다양성의 근원은 20종의 천연 아미노산에 의해 제공되는 단백질 서열 내의 변이, 즉 유기체의 게놈에서 4종의 천연 DNA 뉴클레오티드에 의해 코딩되는 변이이다. 천연 아미노산에 의해 제공되는 기능적 다양성은 높을 수 있지만, 서열 공간의 방대함은 실제로 탐구될 수 있는 것을 극적으로 제한하고, 또한 일부 기능성은 전혀 이용가능하지 않다. 히드라이드 전달, 산화환원 활성 및 친전자성 결합 형성 등을 위한 자연계의 보조인자의 사용이 이들 제한을 입증한다. 또한, 치료제로서의 단백질 개발에 대한 집중이 증가함에 따라, 천연 아미노산의 물리화학적 다양성이 화학자에 의해 설계된 소분자 약물의 물리화학적 다양성과 비교하여 극적으로 제한되기 때문에 이들 제한은 문제가 된다. 원칙적으로, 목적하는 생리화학적 특성을 갖는 추가적인 비-정규 아미노산 (ncAA 또는 "비천연" 아미노산)을 포함하도록 유전자 코드를 확장시킴으로써 이러한 제한을 피하는 것이 가능할 것이다.
거의 20년 전에, 에스케리키아 콜라이(Escherichia coli)에서 ncAA를 코딩하도록 앰버 정지 코돈 (UAG)을 사용하여 유전자 코드를 확장시킴으로써 살아있는 유기체에 이용가능한 다양성을 증가시키는 방법이 창출되었다. 이는 메타노코쿠스 잔나쉬이(Methanococcus jannaschii)로부터의 tRNA-아미노산 tRNA 신테타제 (aaRS) 쌍을 사용하여 달성되었고, 여기서 tRNA는 정지 코돈을 억제하도록 재코딩되었고, aaRS는 tRNA를 ncAA로 충전하도록 진화되었다. 이러한 코돈 억제 방법은 그 이후로 다른 정지 코돈 및 심지어 4벌식 코돈(quadruplet codon), 뿐만 아니라 여러 다른 직교 tRNA-aaRS 쌍 (가장 특히 메타노사르시나 바르케리/마제이(Methanosarcina barkeri/mazei)로부터의 Pyl tRNA-신테타제 쌍)의 사용으로 확장되어, 단백질 내로 혼입될 수 있는 ncAA의 범주를 넓혔다. 이들 방법은 이미 화학 생물학 및 단백질 치료학 둘 다를 혁신시키기 시작하였다.
이들 방법은 원핵 및 진핵 세포 둘 다에서 최대 2종의 상이한 ncAA의 혼입을 가능하게 하지만, 이종성 리코딩된 tRNA는 ncAA 혼입의 효율 및 충실도를 제한하는 내인성 방출 인자 (RF), 또는 4벌식 코돈의 경우 정상 디코딩과 경쟁해야 한다. 앰버 정지 코돈을 인식하고 번역을 종결시키는 RF1과의 경쟁을 없애기 위해, 숙주 게놈 내의 다수의 또는 모든 경우의 앰버 정지 코돈의 제거 또는 RF1의 결실을 허용하는 RF2의 변형에 대한 노력이 이루어졌다. 그러나, 진핵생물은 단지 하나의 방출 인자를 갖고, 이는 변형될 수는 있지만 결실될 수 없고, 원핵생물의 경우, RF1의 결실은 다른 tRNA에 의한 앰버 정지 코돈의 보다 큰 오억제를 유발하여 ncAA 혼입의 충실도를 감소시킨다. ncAA로의 재할당을 위한 천연 코돈을 유리시키기 위해 코돈 중복을 추가로 이용하려는 노력은, 예를 들어 번역 및 단백질 폴딩 속도에 대한 그의 영향으로 인해 코돈이 정확히 중복되지는 않기 때문에 다면발현성 효과에 의해 복잡해질 수 있다. 또한, 코돈 재전유는 특히 진핵생물의 경우 대규모 게놈 조작의 과제로 인해 제한된다.
천연 코돈 재할당에 대한 대안적 접근법은 임의의 천연 기능 또는 제약이 없고 리보솜에서의 인식이 본질적으로 보다 직교성인 완전히 새로운 코돈의 생성이다. 이는 비천연 염기 쌍 (UBP)을 형성하는 제5 및 제6 뉴클레오티드를 보유하는 유기체의 생성을 통해 달성될 수 있다. 이러한 반합성 유기체 (SSO)는 UBP를 함유하는 DNA를 충실하게 복제하고, 이를 비천연 뉴클레오티드를 함유하는 mRNA 및 tRNA로 효율적으로 전사한 후, 동족 비천연 안티코돈으로 비천연 코돈을 효율적으로 디코딩할 필요가 있을 것이다. 이러한 SSO는 ncAA를 코딩하기 위한 사실상 무한한 수의 새로운 코돈을 가질 것이다.
특정 실시양태에서, 비천연 뉴클레오티드를 포함하는 핵산 분자의 증가된 생산을 위한 방법, 세포, 조작된 미생물, 플라스미드 및 키트가 본원에 기재된다.
하기 실시양태가 포함된다.
실시양태 A1은 하기 구조의 핵염기이다:
Figure pct00001
여기서:
각각의 X는 독립적으로 탄소 또는 질소이고;
R2는 X가 탄소인 경우에 존재하고, 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고;
Y는 황, 산소, 셀레늄 또는 2급 아민이고;
E는 산소, 황 또는 셀레늄이고;
여기서 파상선은 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 또는 모노-포스페이트, 디포스페이트, 트리포스페이트, α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다.
실시양태 A2는 X가 탄소인 실시양태 A1의 핵염기이다.
실시양태 A3은 E가 황인 실시양태 A1 또는 A2의 핵염기이다.
실시양태 A4는 Y가 황인 실시양태 A1 내지 A3 중 어느 하나의 핵염기이다.
실시양태 A5는 구조
Figure pct00002
를 갖는 실시양태 A1의 핵염기이다.
실시양태 A6은 상보적 염기-쌍형성 핵염기에 결합되어 비천연 염기 쌍 (UBP)을 형성하는 실시양태 A1 내지 A5 중 어느 하나의 핵염기이다.
실시양태 A7은 상보적 염기-쌍형성 핵염기가
Figure pct00003
으로부터 선택되는 것인 실시양태 A6의 핵염기이다.
실시양태 A8은 이중 가닥 올리고뉴클레오티드 듀플렉스이며, 여기서 제1 올리고뉴클레오티드 가닥은 실시양태 A1 내지 A5 중 어느 하나의 핵염기를 포함하고, 제2 상보적 올리고뉴클레오티드 가닥은 그의 상보적 염기-쌍형성 부위에 상보적 염기-쌍형성 핵염기를 포함한다.
실시양태 A9는 제1 올리고뉴클레오티드 가닥이
Figure pct00004
을 포함하고; 제2 가닥이 그의 상보적 염기-쌍형성 부위에
Figure pct00005
으로부터 선택되는 상보적 염기 쌍형성 핵염기를 포함하는 것인 실시양태 A8의 이중 가닥 올리고뉴클레오티드 듀플렉스이다.
실시양태 A10은 제2 가닥이 상보적 염기 쌍형성 핵염기
Figure pct00006
를 포함하는 것인 실시양태 A9의 이중 가닥 올리고뉴클레오티드 듀플렉스이다.
실시양태 A11은 제2 가닥이 상보적 염기 쌍형성 핵염기
Figure pct00007
를 포함하는 것인 실시양태 A9의 이중 가닥 올리고뉴클레오티드 듀플렉스이다.
실시양태 A12는 전달 RNA (tRNA)를 코딩하는 유전자 및/또는 관심 단백질을 코딩하는 유전자를 포함하는 플라스미드이고, 여기서 유전자는 실시양태 A1 내지 A5 중 어느 하나 또는 TPT3 (
Figure pct00008
) 중 적어도 1종의 핵염기 및 실시양태 A7 또는 NaM (
Figure pct00009
) 중 적어도 1종의 상보적 염기-쌍형성 핵염기를 포함하며, 여기서 상보적 염기-쌍형성 핵염기는 상보적 염기-쌍형성 부위에 있다.
실시양태 A13은 tRNA를 코딩하는 실시양태 A10의 플라스미드에 의해 코딩된 mRNA이다.
실시양태 A14는 단백질을 코딩하는 실시양태 A10의 플라스미드에 의해 코딩된 mRNA이다.
실시양태 A15는
핵염기를 포함하고, 임의로 핵염기는 안티코돈의 제1, 제2 또는 제3 위치에 존재하는 것인 안티코돈; 및
아미노아실 tRNA 신테타제에 의한 tRNA의 비천연 아미노산으로의 선택적 충전을 촉진하는 인식 요소
를 포함하는, 실시양태 A1 내지 A5 중 어느 하나의 핵염기를 포함하는 전달 RNA (tRNA)이다.
실시양태 A16은 아미노아실 tRNA 신테타제가 메타노사르시나 또는 그의 변이체 또는 메타노코쿠스 (메타노칼도코쿠스) 또는 그의 변이체로부터 유래된 것인 실시양태 A15의 tRNA이다.
실시양태 A17은 비천연 아미노산이 방향족 모이어티를 포함하는 것인 실시양태 A15의 tRNA이다.
실시양태 A18은 비천연 아미노산이 리신 또는 페닐알라닌 유도체인 실시양태 A15의 tRNA이다.
실시양태 A19는 하기 화학식을 포함하는 구조물이다:
N1 - Zx - N2
여기서:
각각의 Z는 독립적으로 리보실 또는 데옥시리보실 또는 그의 유사체에 결합된 실시양태 A1 내지 A7 중 어느 하나의 핵염기이고;
N1은 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 5' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 포스페이트 기이고;
N2는 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 3' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 히드록실 기이고;
x는 1 내지 20의 정수이다.
실시양태 A20은 구조물이 유전자를 코딩하고, 임의로 Zx가 유전자의 번역 영역에 위치하거나 또는 Zx가 유전자의 비번역 영역에 위치하는 것인 실시양태 A19의 구조물이다.
실시양태 A21은 적어도 5000개의 고유한 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 라이브러리이고, 여기서 각각의 폴리뉴클레오티드는 실시양태 A1 내지 A5 중 어느 하나의 적어도 1종의 핵염기를 포함한다.
실시양태 A22는 핵염기를 포함하는 뉴클레오시드 트리포스페이트이며, 여기서 핵염기는
Figure pct00010
으로부터 선택된다.
실시양태 A23은 핵염기가
Figure pct00011
인 실시양태 A22의 뉴클레오시드 트리포스페이트이다.
실시양태 A24는 뉴클레오시드가 리보스 또는 데옥시리보스를 포함하는 것인 실시양태 A22 또는 A23의 뉴클레오시드 트리포스페이트이다.
실시양태 A25는 구조
Figure pct00012
를 갖는 핵염기 및 구조
Figure pct00013
를 갖는 상보적 염기-쌍형성 핵염기를 포함하는 DNA이다.
실시양태 A26은 구조
Figure pct00014
를 갖는 핵염기 및 구조
Figure pct00015
를 갖는 상보적 염기-쌍형성 핵염기를 포함하는 DNA이다.
실시양태 A27은
tRNA 또는 단백질을 코딩하는 유전자를 포함하는 DNA를 리보뉴클레오시드 트리포스페이트 및 RNA 폴리머라제와 접촉시키는 것을 포함하고, 여기서 tRNA 또는 단백질을 코딩하는 유전자는, 제2 비천연 염기와 쌍을 이루어 제2 비천연 염기와의 제1 비천연 염기 쌍을 형성하는 제1 비천연 염기를 포함하고, 리보뉴클레오시드 트리포스페이트는 제1 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있는 제3 비천연 염기를 포함하며, 여기서 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인
DNA를 tRNA 또는 단백질을 코딩하는 mRNA로 전사하는 방법이다.
실시양태 A28은 리보뉴클레오시드 트리포스페이트가 제4 비천연 염기를 추가로 포함하고, 여기서 제4 비천연 염기는 제3 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있는 것인 실시양태 A27의 방법이다.
실시양태 A29는 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍이 동일하지 않은 것인 실시양태 A28의 방법이다.
실시양태 A30은 DNA를 리보뉴클레오시드 트리포스페이트 및 RNA 폴리머라제와 접촉시키기 전에, DNA를 데옥시리보뉴클레오시드 트리포스페이트 및 DNA 폴리머라제와 접촉시킴으로써 DNA를 복제하는 것을 추가로 포함하며, 여기서 리보뉴클레오시드 트리포스페이트는 제1 비천연 염기와의 제5 비천연 염기 쌍을 형성할 수 있는 제5 비천연 염기를 포함하고, 여기서 제1 비천연 염기 쌍 및 제5 비천연 염기 쌍은 동일하지 않은 것인 실시양태 A27-29 중 어느 하나의 방법이다.
실시양태 A31은 제1 비천연 염기가 TPT3을 포함하고, 제2 비천연 염기가 CNMO 또는 NaM을 포함하고, 제3 비천연 염기가 TAT1을 포함하고, 제4 비천연 염기가 NaM 또는 5FM을 포함하는 것인 실시양태 A27-A30 중 어느 하나의 방법이다.
실시양태 A32는 반합성 유기체의 사용을 포함하며, 임의로 여기서 유기체는 박테리아이고, 임의로 여기서 박테리아는 에스케리키아 콜라이인 실시양태 A27-A31 중 어느 하나의 방법이다.
실시양태 A33은 유기체가 미생물을 포함하는 것인 실시양태 A32의 방법이다.
실시양태 A34는 유기체가 박테리아를 포함하는 것인 실시양태 A32의 방법이다.
실시양태 A35는 유기체가 그람-양성 박테리아를 포함하는 것인 실시양태 A34의 방법이다.
실시양태 A36은 유기체가 그람-음성 박테리아를 포함하는 것인 실시양태 A34의 방법이다.
실시양태 A37은 유기체가 에스케리키아 콜라이를 포함하는 것인 실시양태 A27-A34 중 어느 하나의 방법이다.
실시양태 A38은 적어도 1종의 비천연 염기가
(i) 2-티오우라실, 2-티오-티민, 2'-데옥시우리딘, 4-티오-우라실, 4-티오-티민, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-티민, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 또는 디히드로우라실;
(ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온);
(iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌, 또는 6-아자-아데닌;
(iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및
(v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘, 또는 2-피리돈
으로 이루어진 군으로부터 선택되는 것인 실시양태 A27-A37 중 어느 하나의 방법이다.
실시양태 A39는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00016
을 포함하는 것인 실시양태 A27-A37 중 어느 하나의 방법이다.
실시양태 A40은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00017
으로 이루어진 군으로부터 선택되는 것인 실시양태 A27-A39 중 어느 하나의 방법이다.
실시양태 A41은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00018
으로 이루어진 군으로부터 선택되는 것인 실시양태 A40의 방법이다.
실시양태 A42는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00019
으로 이루어진 군으로부터 선택되는 것인 실시양태 A40의 방법이다.
실시양태 A43은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00020
으로 이루어진 군으로부터 선택되는 것인 실시양태 A40의 방법이다.
실시양태 A44는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00021
을 포함하는 것인 실시양태 A40의 방법이다.
실시양태 A45는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00022
을 포함하는 것인 실시양태 A40의 방법이다.
실시양태 A46은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00023
을 포함하는 것인 실시양태 A40의 방법이다.
실시양태 A47은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00024
으로 이루어진 군으로부터 선택되는 것인 실시양태 A40의 방법이다.
실시양태 A48은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00025
인 실시양태 A40의 방법이다.
실시양태 A49는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00026
을 포함하는 것인 실시양태 A40의 방법이다.
실시양태 A50은 제1 또는 제2 비천연 염기가
Figure pct00027
인 실시양태 A40의 방법이다.
실시양태 A51은 제1 또는 제2 비천연 염기가
Figure pct00028
인 실시양태 A40의 방법이다.
실시양태 A52는 제1 비천연 염기가
Figure pct00029
이고, 제2 비천연 염기가
Figure pct00030
이거나, 또는 제1 비천연 염기가
Figure pct00031
이고, 제2 비천연 염기가
Figure pct00032
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A53은 제3 또는 제4 비천연 염기가
Figure pct00033
인 실시양태 A27-A40 및 A52 중 어느 하나의 방법이다.
실시양태 A54는 제3 비천연 염기가
Figure pct00034
인 실시양태 A53의 방법이다.
실시양태 A55는 제4 비천연 염기가
Figure pct00035
인 실시양태 A54의 방법이다.
실시양태 A56은 제3 또는 제4 비천연 염기가
Figure pct00036
인 실시양태 A27-A52 중 어느 하나의 방법이다.
실시양태 A57은 제3 비천연 염기가
Figure pct00037
인 실시양태 A56의 방법이다.
실시양태 A58은 제4 비천연 염기가
Figure pct00038
인 실시양태 A56의 방법이다.
실시양태 A59는 제1 비천연 염기가
Figure pct00039
이고, 제2 비천연 염기가
Figure pct00040
이고, 제3 비천연 염기가
Figure pct00041
이고, 제4 비천연 염기가
Figure pct00042
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A60은 제1 비천연 염기가
Figure pct00043
이고, 제2 비천연 염기가
Figure pct00044
이고, 제3 비천연 염기가
Figure pct00045
이고, 제4 비천연 염기가
Figure pct00046
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A61은 제1 비천연 염기가
Figure pct00047
이고, 제2 비천연 염기가
Figure pct00048
이고, 제3 비천연 염기가
Figure pct00049
이고, 제4 비천연 염기가
Figure pct00050
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A62는 제3 비천연 염기가
Figure pct00051
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A63은 제4 비천연 염기가
Figure pct00052
인 실시양태 A27-A51 중 어느 하나의 방법이다.
실시양태 A64는 제1 비천연 염기가
Figure pct00053
이고, 제2 비천연 염기가
Figure pct00054
이고, 제3 비천연 염기가
Figure pct00055
이고, 제4 비천연 염기가
Figure pct00056
인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A65는 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 실시양태 A27-A64 중 어느 하나의 방법이다.
실시양태 A66은 제3 비천연 염기 및 제4 비천연 염기가 데옥시리보스를 포함하는 것인 실시양태 A27-A64 중 어느 하나의 방법이다.
실시양태 A67은 제1 및 제2 비천연 염기가 데옥시리보스를 포함하는 것인 실시양태 A27-A66 중 어느 하나의 방법이다.
실시양태 A68은 제1 및 제2 비천연 염기가 데옥시리보스를 포함하고, 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 실시양태 A27-A64 중 어느 하나의 방법이다.
실시양태 A69는 DNA가
Figure pct00057
으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A70은 DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A71은 DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A72는 DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A73은 DNA 주형이 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A74는 DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A75는 DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A69의 방법이다.
실시양태 A76은 DNA가
Figure pct00058
으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, mRNA 및/또는 tRNA가
Figure pct00059
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A77은 DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76에 따른 방법이다.
실시양태 A78은 DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76의 방법이다.
실시양태 A79는 DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76의 방법이다.
실시양태 A80은 DNA 주형이 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76의 방법이다.
실시양태 A81은 DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76의 방법이다.
실시양태 A82는 DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A76의 방법이다.
실시양태 A83은 mRNA 및 tRNA가
Figure pct00060
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A76-A82 중 어느 하나의 방법이다.
실시양태 A84는 mRNA 및 tRNA가
Figure pct00061
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A83의 방법이다.
실시양태 A85는 mRNA가
Figure pct00062
인 비천연 염기를 포함하는 것인 실시양태 A83의 방법이다.
실시양태 A86은 mRNA가
Figure pct00063
인 비천연 염기를 포함하는 것인 실시양태 A83의 방법이다.
실시양태 A87은 mRNA가
Figure pct00064
인 비천연 염기를 포함하는 것인 실시양태 A83의 방법이다.
실시양태 A88은 tRNA가
Figure pct00065
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A76-A87 중 어느 하나의 방법이다.
실시양태 A89는 tRNA가
Figure pct00066
인 비천연 염기를 포함하는 것인 실시양태 A88의 방법이다.
실시양태 A90은 tRNA가
Figure pct00067
인 비천연 염기를 포함하는 것인 A88의 방법이다.
실시양태 A91은 tRNA가
Figure pct00068
인 비천연 염기를 포함하는 것인 실시양태 A76-A87 중 어느 하나의 방법이다.
실시양태 A92는 제1 비천연 염기가 dCNMO를 포함하고, 제2 비천연 염기가 dTPT3을 포함하는 것인 실시양태 A27-A40 중 어느 하나의 방법이다.
실시양태 A93은 제3 비천연 염기가 NaM을 포함하고, 제2 비천연 염기가 TAT1을 포함하는 것인 실시양태 A27-40 및 A92 중 어느 하나의 방법이다.
실시양태 A94는 제1 비천연 염기 또는 제2 비천연 염기가 DNA 폴리머라제에 의해 인식되는 것인 실시양태 A27-A93 중 어느 하나의 방법이다.
실시양태 A95는 제3 비천연 염기 또는 제4 비천연 염기가 RNA 폴리머라제에 의해 인식되는 것인 실시양태 A27-A94 중 어느 하나의 방법이다.
실시양태 A96은 mRNA가 전사되고, 방법이 mRNA를 단백질로 번역하는 것을 추가로 포함하며, 여기서 단백질은 제3 비천연 염기를 포함하는 mRNA의 코돈에 상응하는 위치에 비천연 아미노산을 포함하는 것인 실시양태 A27-A95 중 어느 하나의 방법이다.
실시양태 A97은 단백질이 적어도 2개의 비천연 아미노산을 포함하는 것인 실시양태 A27-A96 중 어느 하나의 방법이다.
실시양태 A98은 단백질이 적어도 3개의 비천연 아미노산을 포함하는 것인 실시양태 A27-A96 중 어느 하나의 방법이다.
실시양태 A99는 단백질이 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 실시양태 A27-A98 중 어느 하나의 방법이다.
실시양태 A100은 단백질이 적어도 3개의 상이한 비천연 아미노산을 포함하는 것인 실시양태 A27-A98 중 어느 하나의 방법이다.
실시양태 A101은 적어도 1개의 비천연 아미노산이:
리신 유사체이거나;
방향족 측쇄를 포함하거나;
아지도 기를 포함하거나;
알킨 기를 포함하거나; 또는
알데히드 또는 케톤 기를 포함하는 것인
실시양태 A27-A100 중 어느 하나의 방법이다.
실시양태 A102는 적어도 1개의 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 실시양태 A27-A101 중 어느 하나의 방법이다.
실시양태 A103은 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산 또는 셀레노시스테인을 포함하는 것인 실시양태 A27-A102 중 어느 하나의 방법이다.
실시양태 A104는 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK) 또는 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 실시양태 A102 또는 A103의 방법이다.
실시양태 A105는 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함하는 것인 실시양태 A104의 방법이다.
실시양태 A106은 적어도 1개의 비천연 아미노산이 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 실시양태 A104의 방법이다.
실시양태 A107은 실시양태 A27-A106 중 어느 하나의 방법으로부터 생산된 mRNA이다.
실시양태 A108은 실시양태 A27-A106 중 어느 하나의 방법으로부터 생산된 tRNA이다.
실시양태 A109는 제3 비천연 염기를 포함하는 mRNA의 코돈에 상응하는 위치에 비천연 아미노산을 포함하는 실시양태 A107의 mRNA에 의해 코딩된 단백질이다.
실시양태 A110은 확장된 유전자 알파벳을 포함하는 반합성 유기체이고, 여기서 유전자 알파벳은 적어도 3종의 별개의 비천연 염기를 포함한다.
실시양태 A111은 미생물을 포함하고, 임의로 여기서 미생물은 에스케리키아 콜라이인 실시양태 A110의 반합성 유기체이다.
실시양태 A112는
Figure pct00069
로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 DNA를 포함하는 실시양태 A110 또는 A111의 반합성 유기체이다.
실시양태 A113은 DNA가 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, 여기서 비천연 염기 쌍 (UBP)은 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, d5FM-dTAT1 또는 dNaM-dTAT1인 실시양태 A110-A113 중 어느 하나의 반합성 유기체이다.
실시양태 A114는 DNA가
Figure pct00070
인 적어도 1종의 비천연 핵염기를 포함하는 것인 실시양태 A112의 반합성 유기체이다.
실시양태 A115는 이종 뉴클레오시드 트리포스페이트 수송체를 발현하는 실시양태 A110-A115 중 어느 하나의 반합성 유기체이다.
실시양태 A116은 이종 뉴클레오시드 트리포스페이트 수송체가 PtNTT2인 실시양태 A115의 반합성 유기체이다.
실시양태 A117은 이종 tRNA 신테타제를 추가로 발현하는 실시양태 A110-A116 중 어느 하나의 반합성 유기체이다.
실시양태 A118은 이종 tRNA 신테타제가 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)인 실시양태 A117의 반합성 유기체이다.
실시양태 A119는 이종 RNA 폴리머라제를 추가로 발현하는 실시양태 A110-A118 중 어느 하나의 반합성 유기체이다.
실시양태 A120은 이종 RNA 폴리머라제가 T7 RNAP인 실시양태 A119의 반합성 유기체이다.
실시양태 A121은 DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는 실시양태 A110-A120 중 어느 하나의 반합성 유기체이다.
실시양태 A122는 RecA를 발현하지 않는 실시양태 A121의 반합성 유기체이다.
실시양태 A123은 이종 mRNA를 추가로 포함하는 실시양태 A110-A122 중 어느 하나의 반합성 유기체이다.
실시양태 A124는 이종 mRNA가
Figure pct00071
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 실시양태 A123의 반합성 유기체이다.
실시양태 A125는 이종 tRNA를 추가로 포함하는 실시양태 A110-A125 중 어느 하나의 반합성 유기체이다.
실시양태 A126은 이종 tRNA가
Figure pct00072
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 실시양태 A125의 반합성 유기체이다.
실시양태 A127은
(1) 단백질을 코딩하는 유전자 (여기서, 단백질을 코딩하는 유전자의 주형 가닥은 제1 비천연 염기를 포함함) 및 (2) tRNA를 코딩하는 유전자 (여기서, tRNA를 코딩하는 유전자의 주형 가닥은 제1 비천연 염기와 염기 쌍을 형성할 수 있는 제2 비천연 염기를 포함함)를 포함하는 하나 이상의 DNA를 제공하는 단계;
단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계;
tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계
를 포함하는, DNA를 전사하는 방법이다.
실시양태 A128은 tRNA를 이용하여 mRNA로부터 단백질을 번역하는 것을 추가로 포함하며, 여기서 상기 단백질은 mRNA에서 제3 비천연 염기를 포함하는 코돈에 상응하는 위치에 비천연 아미노산을 포함하는 것인 실시양태 A127의 방법이다.
실시양태 A129는
(1) 단백질을 코딩하는 유전자 (여기서, 단백질을 코딩하는 유전자의 주형 가닥은 제1 비천연 염기를 포함함) 및 (2) tRNA를 코딩하는 유전자 (여기서, tRNA를 코딩하는 유전자의 주형 가닥은 제1 비천연 염기와 염기 쌍을 형성할 수 있는 제2 비천연 염기를 포함함)를 포함하는 DNA를 제공하는 단계; 및
DNA를 복제하여 제1 비천연 염기 대신 제1 치환 비천연 염기를 혼입시키고/거나 제2 비천연 염기 대신 제2 치환 비천연 염기를 혼입시키는 단계
를 포함하고;
단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기 및/또는 제1 치환 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계; 및/또는
tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기 및/또는 제2 치환 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계
를 임의로 추가로 포함하는, DNA를 복제하는 방법이다.
실시양태 A130은 단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기 및/또는 제1 치환 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계를 추가로 포함하는 실시양태 A129의 방법이다.
실시양태 A131은 tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기 및/또는 제2 치환 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계를 추가로 포함하는 실시양태 A129 또는 A130의 방법이다.
실시양태 A132는 반합성 유기체의 사용을 포함하는 실시양태 A127-A131 중 어느 하나의 방법이다.
실시양태 A133은 유기체가 미생물을 포함하는 것인 실시양태 A132의 방법이다.
실시양태 A134는 박테리아인 반합성 유기체의 사용을 포함하는 생체내 방법인 실시양태 A132 또는 A133의 방법이다.
실시양태 A135는 유기체가 그람-양성 박테리아를 포함하는 것인 실시양태 A134의 방법이다.
실시양태 A136은 유기체가 그람-음성 박테리아를 포함하는 것인 실시양태 A134의 방법이다.
실시양태 A137은 유기체가 에스케리키아 콜라이를 포함하는 것인 실시양태 A132-A134의 방법이다.
실시양태 A138은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00073
을 포함하는 것인 실시양태 A127-A137 중 어느 하나의 방법이다.
실시양태 A139는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00074
을 포함하는 것인 실시양태 A138의 방법이다.
실시양태 A140은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00075
을 포함하는 것인 실시양태 A138의 방법이다.
실시양태 A141은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00076
을 포함하는 것인 실시양태 A138의 방법이다.
실시양태 A142는 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00077
인 실시양태 A138의 방법이다.
실시양태 A143은 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00078
을 포함하는 것인 실시양태 A138의 방법이다.
실시양태 A144는 제1 또는 제2 비천연 염기가
Figure pct00079
인 실시양태 A138의 방법이다.
실시양태 A145는 제1 또는 제2 비천연 염기가
Figure pct00080
인 실시양태 A138의 방법이다.
실시양태 A146은 제1 비천연 염기가
Figure pct00081
이고, 제2 비천연 염기가
Figure pct00082
인 실시양태 A138의 방법이다.
실시양태 A147은 제1 비천연 염기가
Figure pct00083
이고, 제2 비천연 염기가
Figure pct00084
인 실시양태 A138의 방법이다.
실시양태 A148은 제3 또는 제4 비천연 염기가
Figure pct00085
인 실시양태 A138, A146 및 A147 중 어느 하나의 방법이다.
실시양태 A149는 제3 비천연 염기가
Figure pct00086
인 실시양태 A148의 방법이다.
실시양태 A150은 제4 비천연 염기가
Figure pct00087
인 실시양태 A148의 방법이다.
실시양태 A151은 제3 또는 제4 비천연 염기가
Figure pct00088
인 실시양태 A138, A146 및 A147 중 어느 하나의 방법이다.
실시양태 A152는 제3 비천연 염기가
Figure pct00089
인 실시양태 A151의 방법이다.
실시양태 A153은 제4 비천연 염기가
Figure pct00090
인 실시양태 A151의 방법이다.
실시양태 A154는 제1 비천연 염기가
Figure pct00091
이고, 제2 비천연 염기가
Figure pct00092
이고, 제3 비천연 염기가
Figure pct00093
이고, 제4 비천연 염기가
Figure pct00094
인 실시양태 A138 중 어느 하나의 방법이다.
실시양태 A155는 제1 비천연 염기가
Figure pct00095
이고, 제2 비천연 염기가
Figure pct00096
이고, 제3 비천연 염기가
Figure pct00097
이고, 제4 비천연 염기가
Figure pct00098
인 실시양태 A138의 방법이다.
실시양태 A156은 제1 비천연 염기가
Figure pct00099
이고, 제2 비천연 염기가
Figure pct00100
이고, 제3 비천연 염기가
Figure pct00101
이고, 제4 비천연 염기가
Figure pct00102
인 실시양태 A138의 방법이다.
실시양태 A157은 제3 비천연 염기가
Figure pct00103
인 실시양태 A138의 방법이다.
실시양태 A158은 제4 비천연 염기가
Figure pct00104
인 실시양태 A138의 방법이다.
실시양태 A159는 제1 비천연 염기가
Figure pct00105
이고, 제2 비천연 염기가
Figure pct00106
이고, 제3 비천연 염기가
Figure pct00107
이고, 제4 비천연 염기가
Figure pct00108
인 실시양태 A138의 방법이다.
실시양태 A160은 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 실시양태 A127-A159 중 어느 하나의 방법이다.
실시양태 A161은 제3 비천연 염기 및 제4 비천연 염기가 데옥시리보스를 포함하는 것인 실시양태 A127-A159 중 어느 하나의 방법이다.
실시양태 A162는 제1 및 제2 비천연 염기가 데옥시리보스를 포함하는 것인 실시양태 A127-A161 중 어느 하나의 방법이다.
실시양태 A163은 제1 및 제2 비천연 염기가 데옥시리보스를 포함하고, 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 실시양태 A127-A159 중 어느 하나의 방법이다.
실시양태 A164는 DNA 주형이
Figure pct00109
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A127-A137 중 어느 하나의 방법이다.
실시양태 A165는 DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A164의 방법이다.
실시양태 A166은 DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A164의 방법이다.
실시양태 A167은 DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A164의 방법이다.
실시양태 A168은 DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A164의 방법이다.
실시양태 A169는 DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A164의 방법이다.
실시양태 A170은 DNA 주형이
Figure pct00110
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고;
mRNA 및 tRNA가
Figure pct00111
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인
실시양태 A127-A137 중 어느 하나의 방법이다.
실시양태 A171은 DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A170에 따른 방법이다.
실시양태 A172는 DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A170의 방법이다.
실시양태 A173은 DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A170의 방법이다.
실시양태 A174는 DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A170의 방법이다.
실시양태 A175는 DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 실시양태 A170의 방법이다.
실시양태 A176은 mRNA 및 tRNA가
Figure pct00112
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A127-A175 중 어느 하나의 방법이다.
실시양태 A177은 mRNA 및 tRNA가
Figure pct00113
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A178은 mRNA가
Figure pct00114
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A179는 mRNA가
Figure pct00115
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A180은 mRNA가
Figure pct00116
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A181은 tRNA가
Figure pct00117
으로부터 선택되는 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A182는 tRNA가
Figure pct00118
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A183은 tRNA가
Figure pct00119
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A184는 tRNA가
Figure pct00120
인 비천연 염기를 포함하는 것인 실시양태 A176의 방법이다.
실시양태 A185는 제1 비천연 염기가 dCNMO를 포함하고, 제2 비천연 염기가 dTPT3을 포함하는 것인 실시양태 A127-A137 중 어느 하나의 방법이다.
실시양태 A186은 제3 비천연 염기가 NaM을 포함하고, 제2 비천연 염기가 TAT1을 포함하는 것인 실시양태 A127-A137 중 어느 하나의 방법이다.
실시양태 A187은 단백질이 적어도 2개의 비천연 아미노산을 포함하는 것인 실시양태 A127-A186 중 어느 하나의 방법이다.
실시양태 A188은 단백질이 적어도 3개의 비천연 아미노산을 포함하는 것인 실시양태 A127-A186 중 어느 하나의 방법이다.
실시양태 A189는 단백질이 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 실시양태 A127-A186 중 어느 하나의 방법이다.
실시양태 A190은 단백질이 적어도 3개의 상이한 비천연 아미노산을 포함하는 것인 실시양태 A127-A186 중 어느 하나의 방법이다.
실시양태 A191은 적어도 1개의 비천연 아미노산이
리신 유사체이거나;
방향족 측쇄를 포함하거나;
아지도 기를 포함하거나;
알킨 기를 포함하거나; 또는
알데히드 또는 케톤 기를 포함하는 것인
실시양태 A127-A190 중 어느 하나의 방법이다.
실시양태 A192는 적어도 1개의 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 실시양태 A127-A191 중 어느 하나의 방법이다.
실시양태 A193은 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK) 또는 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 실시양태 A191 또는 A192의 방법이다.
실시양태 A194는 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함하는 것인 실시양태 A193의 방법이다.
실시양태 A195는 적어도 1개의 비천연 아미노산이 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 실시양태 A193의 방법이다.
본 발명의 다양한 측면이 첨부된 청구범위에 구체적으로 제시된다. 본 발명의 특색 및 이점의 보다 양호한 이해는 본 발명의 원리가 이용되는 예시적 실시양태를 제시하고 있는 하기 상세한 설명 및 첨부된 도면을 참조하여 얻어질 것이다:
도 1a는 비천연 X-Y 염기 쌍을 사용하여 비-정규 아미노산 (ncAA)을 단백질 내로 부위-특이적으로 도입하기 위해 비천연 염기 쌍 (UBP)을 사용하는 작업흐름을 도시한다. 단백질 내로의 3개의 ncAA의 혼입은 단지 예로서 제시되고; 임의의 수의 ncAA가 혼입될 수 있다.
도 1b는 비천연 염기 쌍 (UBP)을 도시한다.
도 2는 dXTP 유사체를 도시한다. 리보스 및 포스페이트는 명확성을 위해 생략되었다.
도 3a는 다양한 dXTP를 사용하여 sfGFP 내로의 AzK의 혼입을 최적화하기 위한 sfGFP 유전자에서의 UBP 보유 (%)의 플롯을 도시한다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=3)를 나타낸다. 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다. 별표는 세포가 지시된 조건 하에 성장할 수 없었음을 나타낸다.
도 3b는 다양한 dXTP를 사용하여 sfGFP 내로의 AzK의 혼입을 최적화하기 위한 tRNAPyl 유전자에서의 UBP 보유 (%)의 플롯을 도시한다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=3)를 나타낸다. 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다. 별표는 세포가 지시된 조건 하에 성장할 수 없었음을 나타낸다.
도 3c는 다양한 dXTP를 사용하여 sfGFP 내로의 AzK의 혼입을 최적화하기 위한, AzK의 존재 또는 부재 하에 세포 성장에 대해 정규화된 상대적 sfGFP 형광 관찰치 (OD600에 따른 상대 형광 단위 (RFU))의 플롯을 도시한다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=3)를 나타낸다. 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다. 별표는 세포가 지시된 조건 하에 성장할 수 없었음을 나타낸다.
도 3d는 다양한 dXTP를 사용하여 sfGFP 내로의 AzK의 혼입을 최적화하기 위한 웨스턴 블롯에 의해 측정된 상대적 단백질 변위 (%)의 플롯을 도시한다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=3)를 나타낸다. 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다. 별표는 세포가 지시된 조건 하에 성장할 수 없었음을 나타낸다.
도 4a는 리보뉴클레오티드 XTP 유사체를 도시한다. 리보스 및 포스페이트는 명확성을 위해 생략되었다.
도 4b는 리보뉴클레오티드 YTP 유사체를 도시한다. 리보스 및 포스페이트는 명확성을 위해 생략되었다.
도 5a는 AzK를 sfGFP 내로 혼입시키기 위해 다양한 비천연 리보뉴클레오티드를 사용한 번역의 SAR 분석의 플롯을 도시하고, 여기서 y-축 상의 총 sfGFP 형광 (RFU)은 AzK의 존재 하에 XTP 유사체에 대해 관찰된 것이다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차를 나타낸다 (n=4). 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 5b는 AzK를 sfGFP 내로 혼입시키기 위해 다양한 비천연 리보뉴클레오티드를 사용한 번역의 SAR 분석의 플롯을 도시하고, 여기서 y-축 상의 단백질 변위 (%)는 XTP 유사체에 대한 웨스턴 블롯에 의해 측정된 것이다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차를 나타낸다 (n=4). 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 5c는 AzK를 sfGFP 내로 혼입시키기 위해 다양한 비천연 리보뉴클레오티드를 사용한 번역의 SAR 분석의 플롯을 도시하고, 여기서 y-축 상의 총 sfGFP 형광 (RFU)은 AzK의 존재 하에 YTP 유사체에 대해 관찰된 것이다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차를 나타낸다 (n=4). 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 5d는 AzK를 sfGFP 내로 혼입시키기 위해 다양한 비천연 리보뉴클레오티드를 사용한 번역의 SAR 분석의 플롯을 도시하고, 여기서 y-축 상의 단백질 변위 (%)는 YTP 유사체에 대한 웨스턴 블롯에 의해 측정된 것이다. 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차를 나타낸다 (n=4). 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 6a는 NaMTP 및 TAT1TP의 농도 (μM)의 함수로서 총 sfGFP 형광 (RFU)에 대한 비천연 리보뉴클레오티드 트리포스페이트 농도의 최적화의 플롯을 도시한다. 오차 막대는 각각의 값의 표준 오차 (n=3)를 나타낸다.
도 6b는 5FMTP 및 TAT1TP (μM)의 농도의 함수로서 총 sfGFP 형광 (RFU)에 대한 비천연 리보뉴클레오티드 트리포스페이트 농도의 최적화의 플롯을 도시한다. 오차 막대는 각각의 값의 표준 오차 (n=3)를 나타낸다.
도 6c는 NaMTP 및 TAT1TP (μM)의 농도의 함수로서 단백질 변위 (%)에 대한 비천연 리보뉴클레오티드 트리포스페이트 농도의 최적화의 플롯을 도시한다. 오차 막대는 각각의 값의 표준 오차 (n=3)를 나타낸다.
도 6d는 5FMTP 및 TAT1TP (μM)의 농도의 함수로서 단백질 변위 (%)에 대한 비천연 리보뉴클레오티드 트리포스페이트 농도의 최적화의 플롯을 도시한다. 오차 막대는 각각의 값의 표준 오차 (n=3)를 나타낸다.
도 7a는 다양한 비천연 염기 쌍, 코돈 위치, 및 AzK의 존재 하에 관찰된 총 sfGFP 형광 (RFU)에 대한 보다 고밀도 비천연 정보의 저장 및 검색의 플롯이다. 스트립 차트에 대해, 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=4)를 나타내고, 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 7b는 다양한 비천연 염기 쌍, 코돈 위치, 및 AzK의 존재 하에 관찰된 웨스턴 블롯에 의해 측정된 단백질 변위 (%)에 대한 보다 고밀도 비천연 정보의 저장 및 검색의 플롯이다. 스트립 차트에 대해, 각각의 막대는 평균을 나타내고, 오차 막대는 표준 오차 (n=4)를 나타내고, 개방 원은 각각의 독립 시행에 대한 데이터를 나타낸다.
도 7c는 dCNMOdTPT3/NaMTP, TAT1TP를 사용하여 생산된 삼중 표지된 단백질의 정량적 HRMS 분석의 대표적인 스펙트럼을 도시한다. 피크 표지는 무손상 단백질의 디컨볼루션된 분자량을 나타내고, 위치 149, 151 및 153에서의 아미노산 잔기를 나타내며, 각각의 피크의 정량화 (%, n=3)를 그 아래에 나타낸다.
도 8a는 예시적인 비천연 아미노산을 도시한다. 이 도면은 문헌 [Young et al., "Beyond the canonical 20 amino acids: expanding the genetic lexicon," J. of Biological Chemistry 285(15): 11039-11044 (2010)]의 도 2로부터 채택되었다.
도 8b는 예시적인 비천연 아미노산 리신 유도체를 도시한다.
도 8c는 예시적인 비천연 아미노산 페닐알라닌 유도체를 도시한다.
도 8d-8g는 예시적인 비천연 아미노산을 도시한다. 이들 비천연 아미노산 (UAA)은 유전적으로 단백질에 코딩되어 있다 (도 8d - UAA # 1-42; 도 8e - UAA # 43-89; 도 8f - UAA # 90-128; 도 8g - UAA # 129-167). 도 8d-8g는 문헌 [Dumas et al., Chemical Science 2015, 6, 50-69]의 표 1로부터 채택되었다.
특정 용어
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 청구된 대상이 속하는 기술분야의 통상의 기술자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 상기 일반적 설명 및 하기 상세한 설명은 단지 예시적이고 설명적이며, 청구된 임의의 대상을 제한하지 않는 것으로 이해되어야 한다. 본원에 참조로 포함된 임의의 자료가 본 개시내용의 명확한 내용과 모순되는 정도까지 명확한 내용이 우선한다. 본 출원에서 단수의 사용은 달리 구체적으로 언급되지 않는 한 복수를 포함한다. 명세서 및 첨부된 청구범위에서 사용된 단수 형태 ("a," "an" 및 "the")는 문맥상 달리 명백하게 지시되지 않는 한 복수의 지시대상을 포함한다는 것을 주목해야 한다. 본 출원에서 "또는"의 사용은 달리 언급되지 않는 한 "및/또는"을 의미한다. 또한, 용어 "포함하는" 뿐만 아니라 다른 형태, 예컨대 "포함하다", "포함한다" 및 "포함된"의 사용은 제한적이지 않다.
본원에 사용된 범위 및 양은 "약" 특정 값 또는 범위로 표현될 수 있다. 약은 또한 정확한 양을 포함한다. 따라서, "약 5 μL"는 "약 5 μL"를 의미하고, "5 μL"의 기재 또한 구성한다. 일반적으로, 용어 "약"은 실험 오차 내에 있을 것으로 예상되는 양을 포함한다.
합성 방법과 관련하여 본원에 사용된 어구, 예컨대 "제공하는데 적합한 조건 하에" 또는 "수득하기에 충분한 조건 하에" 등은 실험자가 달라지는 통상의 기술범위 내에서 반응 생성물의 유용한 양 또는 수율을 제공하는 반응 조건, 예컨대 시간, 온도, 용매, 반응물 농도 등을 지칭한다. 목적 반응 생성물이 단리되거나 또는 달리 추가로 사용될 수 있는 한, 목적 반응 생성물이 유일한 반응 생성물이거나 또는 출발 물질이 완전히 소모될 필요는 없다.
"화학적으로 실현가능한"은 것은 유기 구조물의 일반적으로 이해되는 규칙에 위배되지 않는 결합 배열 또는 화합물을 의미하고; 예를 들어 특정 상황에서 자연에 존재하지 않을 5가 탄소 원자를 함유할 청구범위의 정의 내의 구조는 청구 범위 내에 있지 않는 것으로 이해될 것이다. 본원에 개시된 구조는 그의 모든 실시양태에서 단지 "화학적으로 실현가능한" 구조만을 포함하는 것으로 의도되고, 예를 들어 가변 원자 또는 기로 제시된 구조에서 화학적으로 실현가능하지 않은 임의의 언급된 구조는 본원에 개시되거나 청구되는 것으로 의도되지 않는다.
본원에 사용된 용어 화학 구조의 "유사체"는 모 구조로부터 합성적으로 용이하게 유도될 수 없을지라도 모 구조와의 실질적 유사성을 보존하고 있는 화학 구조를 지칭한다. 일부 실시양태에서, 뉴클레오티드 유사체는 비천연 뉴클레오티드이다. 일부 실시양태에서, 뉴클레오시드 유사체는 비천연 뉴클레오시드이다. 모 화학 구조로부터 합성적으로 용이하게 유도되는 관련 화학 구조는 "유도체"로 지칭된다.
본원에 사용된 "염기" 또는 "핵염기"는 뉴클레오시드 또는 뉴클레오티드의 적어도 핵염기 부분을 지칭하며 (뉴클레오시드 및 뉴클레오티드는 리보 또는 데옥시리보 변이체를 포괄함), 이는 일부 경우에 뉴클레오시드 또는 뉴클레오티드의 당 부분에 대한 추가의 변형을 함유할 수 있다. 일부 경우, "염기"는 또한 전체 뉴클레오시드 또는 뉴클레오티드를 나타내는데 사용된다 (예를 들어, "염기"는 DNA 폴리머라제에 의해 DNA 내로 또는 RNA 폴리머라제에 의해 RNA 내로 혼입될 수 있음). 그러나, 용어 "염기"는 문맥상 요구되지 않는 한 반드시 전체 뉴클레오시드 또는 뉴클레오티드를 나타내는 것으로 해석되어서는 안된다. 염기 또는 핵염기의 본원에 제공된 화학 구조에서, 단지 뉴클레오시드 또는 뉴클레오티드의 염기만이 제시되며, 당 모이어티 및 임의로 임의의 포스페이트 잔기는 명확성을 위해 생략된다. 염기 또는 핵염기의 본원에 제공된 화학 구조에 사용된 파상선은 뉴클레오시드 또는 뉴클레오티드에 대한 연결을 나타내고, 여기서 뉴클레오시드 또는 뉴클레오티드의 당 부분은 추가로 변형될 수 있다. 일부 실시양태에서, 파상선은 뉴클레오시드 또는 뉴클레오티드의 당 부분, 예컨대 펜토스에 대한 염기 또는 핵염기의 부착을 나타낸다. 일부 실시양태에서, 펜토스는 리보스 또는 데옥시리보스이다.
일부 실시양태에서, 핵염기는 일반적으로 뉴클레오시드의 헤테로시클릭 염기 부분이다. 핵염기는 자연 발생일 수 있고/거나, 변형될 수 있고/거나, 천연 염기와 유사성을 갖지 않을 수 있고/거나, 예를 들어 유기 합성에 의해 합성될 수 있다. 특정 실시양태에서, 핵염기는 뉴클레오시드 또는 뉴클레오티드에서 임의의 원자 또는 원자단을 포함하며, 여기서 원자 또는 원자단은 수소 결합을 사용하거나 사용하지 않고 또 다른 핵산의 염기와 상호작용할 수 있다. 특정 실시양태에서, 비천연 핵염기는 천연 핵염기로부터 유래되지 않는다. 비천연 핵염기는 반드시 염기성 특성을 보유하지는 않지만, 단순성을 위해 핵염기로 지칭된다는 것을 주목해야 한다. 일부 실시양태에서, 핵염기를 지칭할 때, "(d)"는 핵염기가 데옥시리보스 또는 리보스에 부착될 수 있음을 나타내고, 괄호가 없는 "d"는 핵염기가 데옥시리보스에 부착되어 있음을 나타낸다.
일부 실시양태에서, 뉴클레오시드는 핵염기 모이어티 및 당 모이어티를 포함하는 화합물이다. 뉴클레오시드는 자연 발생 뉴클레오시드 (DNA 및 RNA에서 발견되는 바와 같음), 무염기성 뉴클레오시드, 변형된 뉴클레오시드, 및 모방 염기 및/또는 당 기를 갖는 뉴클레오시드를 포함하나 이에 제한되지는 않는다. 뉴클레오시드는 임의의 다양한 치환기를 포함하는 뉴클레오시드를 포함한다. 뉴클레오시드는 핵산 염기와 당의 환원기 사이의 글리코시드 연결을 통해 형성된 글리코시드 화합물일 수 있다.
본원에 사용된 "뉴클레오티드"는 뉴클레오시드 모이어티 및 포스페이트 모이어티를 포함하는 화합물을 지칭한다. 예시적인 천연 뉴클레오티드는 비제한적으로 아데노신 트리포스페이트 (ATP), 우리딘 트리포스페이트 (UTP), 시티딘 트리포스페이트 (CTP), 구아노신 트리포스페이트 (GTP), 아데노신 디포스페이트 (ADP), 우리딘 디포스페이트 (UDP), 시티딘 디포스페이트 (CDP), 구아노신 디포스페이트 (GDP), 아데노신 모노포스페이트 (AMP), 우리딘 모노포스페이트 (UMP), 시티딘 모노포스페이트 (CMP), 및 구아노신 모노포스페이트 (GMP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시시티딘 트리포스페이트 (dCTP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시아데노신 디포스페이트 (dADP), 티미딘 디포스페이트 (dTDP), 데옥시시티딘 디포스페이트 (dCDP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시시티딘 모노포스페이트 (dCMP), 및 데옥시구아노신 모노포스페이트 (dGMP)를 포함한다. 당 모이어티로서 데옥시리보스를 포함하는 예시적인 천연 데옥시리보뉴클레오티드는 dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP 및 dGMP를 포함한다. 당 모이어티로서 리보스를 포함하는 예시적인 천연 리보뉴클레오티드는 ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP 및 GMP를 포함한다.
본원에 사용된 폴리뉴클레오티드는 DNA, RNA, DNA- 또는 RNA-유사 중합체, 예컨대 펩티드 핵산 (PNA), 잠금 핵산 (LNA), 포스포로티오에이트 등을 지칭하며, 그의 예는 관련 기술분야에 널리 공지되어 있고, 비천연 염기를 함유할 수 있다. 폴리뉴클레오티드는 자동화 합성기에서, 예를 들어 포스포로아미다이트 화학 또는 합성기 사용에 적합화된 다른 화학적 접근법을 사용하여 합성될 수 있다.
DNA는 상보적 DNA (cDNA) 및 게놈 DNA (gDNA)를 포함하나 이에 제한되지는 않는다. DNA는 공유 또는 비-공유 수단에 의해 RNA 및 펩티드를 포함하나 이에 제한되지는 않는 또 다른 분자에 부착될 수 있다. RNA는 코딩 RNA, 예를 들어 메신저 RNA (mRNA)를 포함한다. RNA는 또한 비-코딩 RNA, 예를 들어 리보솜 RNA (rRNA)를 포함한다. RNA는 또한 전달 RNA (tRNA), RNA 간섭 (RNAi), 소형 핵소체 RNA (snoRNA), 마이크로RNA (miRNA), 소형 간섭 RNA (siRNA) (짧은 간섭 RNA로도 지칭됨), 소형 핵 RNA (snRNA), 세포외 RNA (exRNA), PIWI-상호작용 RNA (piRNA), 및 긴 비-코딩 RNA (긴 ncRNA)를 포함한다. 일부 실시양태에서, RNA는 rRNA, tRNA, RNAi, snoRNA, 마이크로RNA, siRNA, snRNA, exRNA, piRNA, 긴 ncRNA 또는 그의 임의의 조합 또는 하이브리드이다. 일부 경우, RNA는 리보자임의 성분이다. DNA 및 RNA는 선형, 원형, 슈퍼코일형, 단일-가닥 및 이중-가닥을 포함하나 이에 제한되지는 않는 임의의 형태일 수 있다.
펩티드 핵산 (PNA)은 펩티드-유사 백본이 DNA 또는 RNA의 당-포스페이트 백본을 대체하는 합성 DNA/RNA 유사체이다. PNA 올리고머는 상보적 DNA에의 결합에 있어서 보다 높은 결합 강도 및 보다 큰 특이성을 나타내며, PNA/DNA 염기 미스매치는 DNA/DNA 듀플렉스에서의 유사한 미스매치보다 더 불안정하다. 이 결합 강도 및 특이성은 또한 PNA/RNA 듀플렉스에도 적용된다. PNA는 뉴클레아제 또는 프로테아제에 의해 쉽게 인식되지 않아서 이들을 효소 분해에 저항성이 되게 한다. PNA는 또한 넓은 pH 범위에 걸쳐 안정하다. 또한, 문헌 [Nielsen PE, Egholm M, Berg RH, Buchardt O (December 1991). "Sequence-selective recognition of DNA by strand displacement with a thymine-substituted polyamide", Science 254 (5037): 1497-500. doi:10.1126/science.1962210. PMID 1962210]; 및 [Egholm M, Buchardt O, Christensen L, Behrens C, Freier SM, Driver DA, Berg RH, Kim SK, Norden B, and Nielsen PE (1993), "PNA Hybridizes to Complementary Oligonucleotides Obeying the Watson-Crick Hydrogen Bonding Rules". Nature 365 (6446): 566-8. doi:10.1038/365566a0. PMID 7692304]을 참조하며; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
잠금 핵산 (LNA)은 변형된 RNA 뉴클레오티드이며, 여기서 LNA 뉴클레오티드의 리보스 모이어티는 2' 산소 및 4' 탄소를 연결하는 추가의 가교로 변형된다. 가교는 A-형 듀플렉스에서 종종 발견되는 3'-엔도 (노스) 입체형태로 리보스를 "잠근다". LNA 뉴클레오티드는 원할 때마다 올리고뉴클레오티드 내의 DNA 또는 RNA 잔기와 혼합될 수 있다. 이러한 올리고머는 화학적으로 합성될 수 있고, 상업적으로 입수가능하다. 잠금 리보스 입체형태는 염기 스태킹 및 백본 사전-조직화를 증진시킨다. 예를 들어, 문헌 [Kaur, H; Arora, A; Wengel, J; Maiti, S (2006), "Thermodynamic, Counterion, and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes", Biochemistry 45 (23): 7347-55. doi:10.1021/bi060307w. PMID 16752924]; [Owczarzy R.; You Y., Groth C.L., Tataurov A.V. (2011), "Stability and mismatch discrimination of locked nucleic acid-DNA duplexes.", Biochem. 50 (43): 9352-9367. doi:10.1021/bi200904e. PMC 3201676. PMID 21928795]; [Alexei A. Koshkin; Sanjay K. Singh, Poul Nielsen, Vivek K. Rajwanshi, Ravindra Kumar, Michael Meldgaard, Carl Erik Olsen, Jesper Wengel (1998), "LNA (Locked Nucleic Acids): Synthesis of the adenine, cytosine, guanine, 5-methylcytosine, thymine and uracil bicyclonucleoside monomers, oligomerisation, and unprecedented nucleic acid recognition", Tetrahedron 54 (14): 3607-30. doi:10.1016/S0040-4020(98)00094-5]; 및 [Satoshi Obika; Daishu Nanbu, Yoshiyuki Hari, Ken-ichiro Morio, Yasuko In, Toshimasa Ishida, Takeshi Imanishi (1997), "Synthesis of 2′-O,4′-C-methyleneuridine and -cytidine. Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering", Tetrahedron Lett. 38 (50): 8735-8. doi:10.1016/S0040-4039(97)10322-7]을 참조하며; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
본원에 사용된 용어 "유전자"는 유전자 산물, 예컨대 RNA 또는 단백질의 합성을 코딩하는 폴리뉴클레오티드를 지칭한다.
분자 비콘 또는 분자 비콘 프로브는 균질 용액에서 특정 핵산 서열의 존재를 검출할 수 있는 올리고뉴클레오티드 혼성화 프로브이다. 분자 비콘은 내부적으로 켄칭된 형광단을 갖는 헤어핀 형상의 분자이며, 그의 형광은 표적 핵산 서열에 결합할 때 복원된다. 예를 들어, 문헌 [Tyagi S, Kramer FR (1996), "Molecular beacons: probes that fluoresce upon hybridization", Nat Biotechnol. 14 (3): 303-8. PMID 9630890]; [Tapp I, Malmberg L, Rennel E, Wik M, Syvanen AC (2000 Apr), "Homogeneous scoring of single-nucleotide polymorphisms: comparison of the 5'-nuclease TaqMan assay and Molecular Beacon probes", Biotechniques 28 (4): 732-8. PMID 10769752]; 및 [Akimitsu Okamoto (2011), "ECHO probes: a concept of fluorescence control for practical nucleic acid sensing", Chem. Soc. Rev. 40:5815-5828]을 참조하며; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
본원에 사용된 용어 "비천연 염기"는 A, C, G, T, U 이외의 염기, 및 다른 자연 발생 염기 (예를 들어, 5-메틸시토신, 슈도우리딘 및 이노신)를 지칭한다.
본원에 사용된 용어 "비천연 염기 쌍"은 서로 결합하고 이중-가닥 폴리뉴클레오티드 (예를 들어, 적어도 부분적으로 자기-혼성화된 분자 또는 분자의 부분적으로 또는 완전히 혼성화된 쌍일 수 있음)의 대향 가닥 상에 놓인 2개의 염기를 지칭하며, 여기서 2개의 염기 중 적어도 1개는 비천연 염기이다.
본원에 사용된 "반합성 유기체"는 비천연 성분, 예를 들어 1종 이상의 비천연 염기를 포함하는 확장된 유전자 알파벳을 포함하는 유기체이다.
본원에 사용된 섹션 표제는 단지 조직화 목적을 위한 것이며, 기재된 대상을 제한하는 것으로 해석되어서는 안된다.
비천연 염기 쌍을 포함하는 방법 및 조성물
특정 실시양태에서, 확장된 유전자 알파벳을 갖는 핵산을 생산하기 위한 시험관내 및 생체내 방법 및 조성물이 본원에 개시된다 (도 1). 일부 경우, 핵산은 비천연 단백질을 코딩하며, 여기서 비천연 단백질은 비천연 아미노산을 포함한다. 일부 경우, 본원에 기재된 생체내 방법 또는 조성물은 반합성 유기체를 이용하거나 또는 포함한다. 일부 경우, 방법은 적어도 1종의 비천연 염기 쌍 (UBP)을 하나 이상의 핵산 내로 혼입시키는 것을 포함한다. 이러한 염기 쌍은 2개의 뉴클레오시드의 핵염기 사이의 쌍형성에 의해 형성된다. 예시적인 작업 흐름에서, 단백질(102) 및 tRNA(103)를 코딩하는 DNA(101), 즉 염기 쌍을 형성할 수 있고/있거나 염기 쌍을 형성하도록 구성된 상보성인 비천연 핵염기 (X, Y)를 포함하는, tRNA 및 단백질에 대한 주형 가닥 코딩 영역이 전사되어(104), tRNA(106) 및 mRNA(107)를 생성한다. tRNA를 비천연 아미노산(105)으로 충전한 후, mRNA(107)는 번역되어(108) 1개 이상의 비천연 아미노산(109)을 포함하는 단백질(110)을 생성한다. 본원에 기재된 방법 및 조성물은 일부 경우에 높은 정확도 및 수율로 비천연 아미노산의 부위-특이적 혼입을 가능하게 한다. 또한, 확장된 유전자 알파벳을 포함하는 반합성 유기체, 및 적어도 1개의 비천연 아미노산 잔기를 포함하는 것들을 포함한 단백질 생성물을 생산하기 위해 반합성 유기체를 사용하는 방법이 본원에 기재된다.
비천연 핵염기의 선택은 본원에 기재된 방법에서 하나 이상의 단계의 최적화를 가능하게 한다. 예를 들어, 핵염기는 고효율 복제, 전사 및/또는 번역을 위해 선택된다. 일부 경우, 하나 초과의 비천연 핵염기 쌍이 본원에 기재된 방법에 이용된다. 예를 들어, 데옥시리보 모이어티를 포함하는 제1 세트의 핵염기 (예컨대, 제1 염기 쌍을 형성하도록 구성된 제1 핵염기 및 제2 핵염기)가 DNA 복제에 사용되고, 제2 세트의 핵염기 (예컨대, 제3 핵염기 및 제4 핵염기, 여기서 제3 및 제4 핵염기는 제2 염기 쌍을 형성하도록 구성된 리보스에 부착됨)가 전사/번역에 사용된다. 일부 실시양태에서, 핵염기의 제1 세트 (예컨대, 제1 염기 쌍을 형성하도록 구성된 제1 핵염기 및 제2 핵염기)는 플라스미드를 구축하는데 사용되고, 핵염기의 제2 세트 (예컨대, 제2 염기 쌍을 형성하도록 구성된 제3 핵염기 및 제4 핵염기)는 복제에 사용되고, 염기의 제3 세트 (예컨대, 제3 염기 쌍을 형성하도록 구성된 제5 및 제6 핵염기)는 전사/번역에 사용된다. 제1 세트의 핵염기와 제2 세트의 핵염기 사이의 상보적 쌍형성은 일부 경우에 제1 세트로부터의 핵염기를 포함하는 DNA 주형으로부터 tRNA 또는 단백질을 생성하는 유전자의 전사를 가능하게 한다. 제2 세트의 핵염기 사이의 상보적 쌍형성 (제2 염기 쌍)은 일부 경우에 비천연 핵산을 포함하는 tRNA와 및 mRNA를 매칭시킴으로써 번역을 허용한다. 일부 경우, 제1 세트 내 핵염기는 데옥시리보스 모이어티에 부착된다. 일부 경우, 제1 세트 내 핵염기는 리보스 모이어티에 부착된다. 일부 경우, 두 세트의 핵염기는 고유하다. 일부 경우, 적어도 1종의 핵염기는 두 세트에서 동일하다. 일부 경우, 제1 핵염기 및 제3 핵염기는 동일하다. 일부 실시양태에서, 제1 염기 쌍 및 제2 염기 쌍은 동일하지 않다. 일부 경우, 제1 염기 쌍, 제2 염기 쌍 및 제3 염기 쌍은 동일하지 않다.
한 측면에서,
제1 비천연 염기, 및 제1 비천연 염기와 상보적이고/거나, 그와 염기 쌍을 형성할 수 있고/거나, 그와 염기 쌍을 형성하도록 구성된 제2 비천연 염기를 포함하는 DNA 주형을 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기와 상보적이고/거나, 그와 염기 쌍을 형성할 수 있고/거나, 그와 제1 비천연 염기 쌍을 형성하도록 구성된 것인 단계;
상기 DNA 주형을 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기와 상보적이고/거나, 그와 염기 쌍을 형성할 수 있고/거나, 그와 제2 비천연 염기 쌍을 형성하도록 구성되고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계; 및
mRNA 및 tRNA로부터 단백질을 번역하며, 여기서 상기 단백질은 비천연 아미노산을 포함하는 것인 단계
를 포함하는, 비천연 아미노산을 포함하는 단백질을 생산하는 생체내 방법이 본원에 제공된다.
핵산 분자
일부 실시양태에서, 핵산 (예를 들어, 본원에서 관심 핵산 분자로도 지칭됨)은 임의의 공급원 또는 조성물로부터의 것, 예컨대 DNA, cDNA, gDNA (게놈 DNA), RNA, siRNA (짧은 억제 RNA), RNAi, tRNA, mRNA 또는 rRNA (리보솜 RNA)이고, 예를 들어 임의의 형태 (예를 들어, 선형, 원형, 슈퍼코일, 단일-가닥, 이중-가닥 등)이다. 일부 실시양태에서, 핵산은 뉴클레오티드, 뉴클레오시드 또는 폴리뉴클레오티드를 포함한다. 일부 경우, 핵산은 천연 및 비천연 핵산을 포함한다. 일부 경우, 핵산은 또한 비천연 핵산, 예컨대 DNA 또는 RNA 유사체 (예를 들어, 염기 유사체, 당 유사체 및/또는 비천연 백본 등을 함유함)를 포함한다. 용어 "핵산"은 폴리뉴클레오티드 쇄의 특정 길이를 지칭하거나 추론하지 않고, 따라서 폴리뉴클레오티드 및 올리고뉴클레오티드가 또한 정의에 포함되는 것으로 이해된다. 예시적인 천연 뉴클레오티드는 비제한적으로 ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP, GMP, dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP 및 dGMP를 포함한다. 예시적인 천연 데옥시리보뉴클레오티드는 dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP 및 dGMP를 포함한다. 예시적인 천연 리보뉴클레오티드는 ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP 및 GMP를 포함한다. 천연 RNA의 경우, 우라실-함유 뉴클레오시드는 우리딘이다. 핵산은 때때로 숙주 세포에서 복제 또는 복제될 수 있는 벡터, 플라스미드, 파지미드, 자율 복제 서열 (ARS), 동원체, 인공 염색체, 효모 인공 염색체 (예를 들어, YAC) 또는 기타 핵산이다. 일부 경우, 비천연 핵산은 핵산 유사체이다. 추가의 경우, 비천연 핵산은 세포외 공급원으로부터의 것이다. 다른 경우, 비천연 핵산은 본원에 제공된 유기체, 예를 들어 유전자 변형 유기체의 세포내 공간에 이용가능하다. 일부 실시양태에서, 비천연 뉴클레오티드는 천연 뉴클레오티드가 아니다. 일부 실시양태에서, 천연 염기를 포함하지 않는 뉴클레오티드는 비천연 핵염기를 포함한다.
비천연 핵산
뉴클레오티드 유사체 또는 비천연 뉴클레오티드는 염기, 당 또는 포스페이트 모이어티에 대한 일부 유형의 변형을 함유하는 뉴클레오티드를 포함한다. 용어 "변형" (및 관련된 문법적 형태, 예컨대 "변형된")은 뉴클레오티드 유사체 또는 비천연 뉴클레오티드가 천연 뉴클레오티드를 직접 변경하여 제조된다는 것을 반드시 의미하기 보다는, 뉴클레오티드 유사체 또는 비천연 뉴클레오티드가 천연 뉴클레오티드와 상이하다는 것을 의미한다. 일부 실시양태에서, 변형은 화학적 변형을 포함한다. 일부 경우, 변형은 3'OH 또는 5'OH 기, 백본, 당 성분 또는 뉴클레오티드 염기에서 발생한다. 변형은 일부 경우에 비-자연 발생 링커 분자 및/또는 가닥간 또는 가닥내 교차 결합을 임의로 포함한다. 한 측면에서, 변형된 핵산은 3'OH 또는 5'OH 기, 백본, 당 성분 또는 뉴클레오티드 염기 중 하나 이상의 변형, 및/또는 비-자연 발생 링커 분자의 부가를 포함한다. 한 측면에서, 변형된 백본은 포스포디에스테르 백본 이외의 백본을 포함한다. 한 측면에서, 변형된 당은 데옥시리보스 이외의 당 (변형된 DNA에서) 또는 리보스 이외의 당 (변형된 RNA)을 포함한다. 한 측면에서, 변형된 염기는 아데닌, 구아닌, 시토신 또는 티민 이외의 염기 (변형된 DNA에서), 또는 아데닌, 구아닌, 시토신 또는 우라실 이외의 염기 (변형된 RNA에서)를 포함한다. 일부 실시양태에서, 비천연 뉴클레오티드는 비천연 염기를 포함한다. 일부 실시양태에서, 비천연 염기는 퓨린 또는 피리미딘 (여기서, 퓨린 및 피리미딘은 엑소시클릭 치환기를 갖는 퓨린 및 피리미딘을 포괄함) 이외의 고리 또는 고리계를 갖는 염기이거나, 또는 1개 이상의 비-질소 헤테로원자를 함유하고/거나 질소를 함유하지 않는 고리 또는 고리계를 포함한다.
일부 실시양태에서, 핵산은 적어도 1종의 변형된 염기를 포함한다. 일부 경우, 핵산은 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20종 또는 그 초과의 변형된 염기를 포함한다. 일부 경우, 염기 모이어티에 대한 변형은 아데닌 (A), 시토신 (C), 구아닌 (G), 및 티민 (T)/우라실 (U), 뿐만 아니라 다양한 퓨린 또는 피리미딘 염기의 천연 및 합성 변형을 포함한다. 일부 실시양태에서, 변형은 아데닌, 구아닌 시토신 또는 티민의 변형된 형태 (변형된 DNA에서), 또는 아데닌, 구아닌 시토신 또는 우라실의 변형된 형태 (변형된 RNA)에 대한 것이다.
비천연 핵산의 변형된 염기는 우라실-5-일, 하이포크산틴-9-일 (I), 2-아미노아데닌-9-일, 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함하나 이에 제한되지는 않는다. 특정 비천연 핵산, 예컨대 5-치환된 피리미딘, 6-아자피리미딘 및 N-2 치환된 퓨린, N-6 치환된 퓨린, O-6 치환된 퓨린, 2-아미노프로필아데닌, 5-프로피닐우라실, 5-프로피닐시토신, 5-메틸시토신, 듀플렉스 형성의 안정성을 증가시키는 것들, 범용 핵산, 소수성 핵산, 혼재성 핵산, 크기-확장 핵산, 플루오린화 핵산, 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 퓨린, 예컨대 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신, 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 6-메틸, 아데닌 및 구아닌의 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실, 5-할로시토신, 5-프로피닐 (-C≡C-CH3) 우라실, 5-프로피닐 시토신, 피리미딘 핵산의 다른 알키닐 유도체, 6-아조 우라실, 6-아조 시토신, 6-아조 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸, 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌, 7-메틸아데닌, 2-F-아데닌, 2-아미노-아데닌, 8-아자구아닌, 8-아자아데닌, 7-데아자구아닌, 7-데아자아데닌, 3-데아자구아닌, 3-데아자아데닌, 트리시클릭 피리미딘, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), G-클램프, 페녹사진 시티딘 (예를 들어, 9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온), 퓨린 또는 피리미딘 염기가 다른 헤테로사이클로 대체된 것들, 7-데아자-아데닌, 7-데아자구아노신, 2-아미노피리딘, 2-피리돈, 아자시토신, 5-브로모시토신, 브로모우라실, 5-클로로시토신, 염소화 시토신, 시클로시토신, 시토신 아라비노시드, 5-플루오로시토신, 플루오로피리미딘, 플루오로우라실, 5,6-디히드로시토신, 5-아이오도시토신, 히드록시우레아, 아이오도우라실, 5-니트로시토신, 5-브로모우라실, 5-클로로우라실, 5-플루오로우라실 및 5-아이오도우라실, 2-아미노-아데닌, 6-티오-구아닌, 2-티오-티민, 4-티오-티민, 5-프로피닐-우라실, 4-티오-우라실, N4-에틸시토신, 7-데아자구아닌, 7-데아자-8-아자구아닌, 5-히드록시시토신, 2'-데옥시우리딘, 2-아미노-2'-데옥시아데노신, 및 미국 특허 번호 3,687,808; 4,845,205; 4,910,300; 4,948,882; 5,093,232; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,594,121; 5,596,091; 5,614,617; 5,645,985; 5,681,941; 5,750,692; 5,763,588; 5,830,653 및 6,005,096; WO 99/62923; 문헌 [Kandimalla et al., (2001) Bioorg. Med. Chem. 9:807-813]; [The Concise Encyclopedia of Polymer Science and Engineering, Kroschwitz, J.I., Ed., John Wiley & Sons, 1990, 858- 859]; [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]; 및 [Sanghvi, Chapter 15, Antisense Research and Applications, Crooke and Lebleu Eds., CRC Press, 1993, 273-288]에 기재된 것들을 포함하나 이에 제한되지는 않는다. 추가의 염기 변형은, 예를 들어 미국 특허 번호 3,687,808; 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]에서 찾아볼 수 있다. 일부 경우, 비천연 핵산은 도 2의 핵염기를 포함한다. 일부 경우, 비천연 핵산은 도 4a의 핵염기를 포함한다. 일부 경우, 비천연 핵산은 도 4b의 핵염기를 포함한다.
다양한 헤테로시클릭 염기 및 다양한 당 모이어티 (및 당 유사체)를 포함하는 비천연 핵산이 관련 기술분야에서 이용가능하고, 핵산은 일부 경우에 자연 발생 핵산의 주요 5종의 염기 성분 이외의 1종 또는 여러 종의 헤테로시클릭 염기를 포함한다. 예를 들어, 헤테로시클릭 염기는 일부 경우에 우라실-5-일, 시토신-5-일, 아데닌-7-일, 아데닌-8-일, 구아닌-7-일, 구아닌-8-일, 4-아미노피롤로[2.3-d]피리미딘-5-일, 2-아미노-4-옥소피롤로[2,3-d]피리미딘-5-일, 2-아미노-4-옥소피롤로[2.3-d]피리미딘-3-일 기를 포함하며, 여기서 퓨린은 9-위치를 통해, 피리미딘은 1-위치를 통해, 피롤로피리미딘은 7-위치를 통해, 피라졸로피리미딘은 1-위치를 통해 핵산의 당 모이어티에 부착된다.
일부 실시양태에서, 비천연 핵산의 변형된 염기가 하기 도시되며, 여기서 파상선은 뉴클레오시드 또는 뉴클레오티드의 당 (예를 들어, 데옥시리보스 또는 리보스)에 대한 부착 지점을 나타낸다.
Figure pct00121
Figure pct00122
Figure pct00123
Figure pct00124
일부 실시양태에서, 비천연 염기 (예컨대, 본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종)는
Figure pct00125
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 염기는
Figure pct00126
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 염기는
Figure pct00127
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 염기는
Figure pct00128
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 비천연 염기는
Figure pct00129
이다. 일부 실시양태에서, 비천연 염기는
Figure pct00130
으로부터 선택된다.
일부 실시양태에서, 비천연 염기 (예컨대, 본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 제1 또는 제2 비천연 염기)는
Figure pct00131
이다. 일부 실시양태에서, 비천연 염기 (예컨대, 본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 제1 또는 제2 비천연 염기)는
Figure pct00132
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00133
이고, 제2 비천연 염기는
Figure pct00134
이다.
일부 실시양태에서, 비천연 염기 (예컨대, 본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 제3 또는 제4 비천연 염기)는
Figure pct00135
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00136
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00137
이다. 일부 실시양태에서, 비천연 염기 (예컨대, 본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 제3 또는 제4 비천연 염기)는
Figure pct00138
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00139
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00140
이다.
일부 실시양태에서, 제1 비천연 염기는
Figure pct00141
이고, 제2 비천연 염기는
Figure pct00142
이고, 제3 비천연 염기는
Figure pct00143
이고, 제4 비천연 염기는
Figure pct00144
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00145
이고, 제2 비천연 염기는
Figure pct00146
이고, 제3 비천연 염기는
Figure pct00147
이고, 제4 비천연 염기는
Figure pct00148
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00149
이고, 제2 비천연 염기는
Figure pct00150
이고, 제3 비천연 염기는
Figure pct00151
이고, 제4 비천연 염기는
Figure pct00152
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00153
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00154
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00155
이고, 제2 비천연 염기는
Figure pct00156
이고, 제3 비천연 염기는
Figure pct00157
이고, 제4 비천연 염기는
Figure pct00158
이다.
일부 실시양태에서, 제3 비천연 염기 및 제4 비천연 염기는 리보스를 포함한다. 일부 실시양태에서, 제3 비천연 염기 및 제4 비천연 염기는 데옥시리보스를 포함한다. 일부 실시양태에서, 제1 및 제2 비천연 염기는 데옥시리보스를 포함한다. 일부 실시양태에서, 제1 및 제2 비천연 염기는 데옥시리보스를 포함하고, 제3 비천연 염기 및 제4 비천연 염기는 리보스를 포함한다.
본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 일부 실시양태에서, DNA는
Figure pct00159
으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, 여기서 각각의 당 모이어티는 독립적으로 본원에 기재된 임의의 실시양태 또는 변형이다. 일부 실시양태에서, 염기 쌍 내의 두 염기의 당 모이어티는 리보스를 포함한다. 일부 실시양태에서, 염기 쌍 내의 두 염기의 당 모이어티는 데옥시리보스를 포함한다. 일부 실시양태에서, 염기 쌍 내의 하나의 염기의 당 모이어티는 리보스를 포함하고, 염기 쌍 내의 다른 염기의 당 모이어티는 데옥시리보스를 포함한다. 일부 실시양태에서, DNA 주형은 NaM-5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 CNMO-TPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 NaM-TPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 NaM-TAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 CNMO-TAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다.
본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 일부 실시양태에서, DNA는
Figure pct00160
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다.
본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 일부 실시양태에서, DNA는
Figure pct00161
으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, 여기서 각각의 당 모이어티는 독립적으로 본원에 기재된 임의의 실시양태 또는 변형이고; mRNA 및 tRNA는
Figure pct00162
으로부터 선택되는 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 염기 쌍 내의 두 염기의 당 모이어티는 리보스를 포함한다. 일부 실시양태에서, 염기 쌍 내의 두 염기의 당 모이어티는 데옥시리보스를 포함한다. 일부 실시양태에서, 염기 쌍 내의 하나의 염기의 당 모이어티는 리보스를 포함하고, 염기 쌍 내의 다른 염기의 당 모이어티는 데옥시리보스를 포함한다. 일부 실시양태에서, DNA는 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다.
본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 일부 실시양태에서, DNA는
Figure pct00163
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고; 여기서 mRNA 및 tRNA는
Figure pct00164
으로부터 선택되는 1종 이상의 비천연 염기를 포함한다. 일부 실시양태에서, DNA는 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA는 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다.
일부 실시양태에서, mRNA 및 tRNA는
Figure pct00165
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, mRNA 및 tRNA는
Figure pct00166
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00167
인 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00168
인 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00169
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00170
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00171
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00172
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00173
인 비천연 염기를 포함한다.
본원에 기재된 비천연 아미노산을 포함하는 단백질을 생산하는 방법의 일부 실시양태에서, 제1 비천연 염기는 dCNMO를 포함하고, 제2 비천연 염기는 dTPT3을 포함한다. 일부 실시양태에서, 제3 비천연 염기는 NaM을 포함하고, 제2 비천연 염기는 TAT1을 포함한다.
또한, 적어도 1개의 비천연 아미노산을 포함하는 단백질이 본원에 제공되며, 여기서 단백질은 본원에 개시된 임의의 방법에 따라 생산된다. 일부 실시양태에서, 단백질은 적어도 1개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 1개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 2개 이상의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 2개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 3개 이상의 비천연 아미노산을 포함한다.
일부 실시양태에서, 뉴클레오티드 유사체는 또한 포스페이트 모이어티에서 변형된다. 변형된 포스페이트 모이어티는 2개의 뉴클레오티드 사이의 연결에 변형을 갖는 것을 포함하나 이에 제한되지는 않고, 예를 들어 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 다른 알킬 포스포네이트, 예컨대 3'-알킬렌 포스포네이트 및 키랄 포스포네이트, 포스피네이트, 포스포르아미데이트, 예컨대 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르 및 보라노포스페이트를 함유한다. 2개의 뉴클레오티드 사이의 이들 포스페이트 또는 변형된 포스페이트 연결은 3'-5' 연결 또는 2'-5' 연결을 통하고, 연결은 역전된 극성, 예컨대 3'-5'→ 5'-3' 또는 2'-5'→5'-2'를 함유하는 것으로 이해된다. 다양한 염, 혼합 염 및 유리 산 형태가 또한 포함된다. 수많은 미국 특허는 변형된 포스페이트를 함유하는 뉴클레오티드의 제조 및 사용 방법을 교시하며, 3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 및 5,625,050을 포함하나 이에 제한되지는 않고; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
일부 실시양태에서, 비천연 핵산은 2',3'-디데옥시-2',3'-디데히드로-뉴클레오시드 (PCT/US2002/006460), 5'-치환된 DNA 및 RNA 유도체 (PCT/US2011/033961; 문헌 [Saha et al., J. Org Chem., 1995, 60, 788-789]; [Wang et al., Bioorganic & Medicinal Chemistry Letters, 1999, 9, 885-890]; 및 [Mikhailov et al., Nucleosides & Nucleotides, 1991, 10(1-3), 339-343]; [Leonid et al., 1995, 14(3-5), 901-905]; 및 [Eppacher et al., Helvetica Chimica Acta, 2004, 87, 3004-3020]; PCT/JP2000/004720; PCT/JP2003/002342; PCT/JP2004/013216; PCT/JP2005/020435; PCT/JP2006/315479; PCT/JP2006/324484; PCT/JP2009/056718; PCT/JP2010/067560), 또는 변형된 염기를 갖는 모노포스페이트로서 제조된 5'-치환된 단량체 (문헌 [Wang et al., Nucleosides Nucleotides & Nucleic Acids, 2004, 23 (1 & 2), 317-337])를 포함하며; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
일부 실시양태에서, 비천연 핵산은 당 고리의 5'-위치 및 2'-위치에서의 변형 (PCT/US94/02993), 예컨대 5'-CH2-치환된 2'-O-보호된 뉴클레오시드 (문헌 [Wu et al., Helvetica Chimica Acta, 2000, 83, 1127-1143] 및 [Wu et al., Bioconjugate Chem. 1999, 10, 921-924])를 포함한다. 일부 경우, 비천연 핵산은 올리고뉴클레오티드 내로의 혼입을 위해 제조된 아미드 연결된 뉴클레오시드 이량체를 포함하며, 여기서 이량체 내의 3' 연결된 뉴클레오시드 (5'→3')는 2'-OCH3 및 5'-(S)-CH3을 포함한다 (문헌 [(Mesmaeker et al., Synlett, 1997, 1287-1290]). 비천연 핵산은 2'-치환된 5'-CH2 (또는 O) 변형된 뉴클레오시드를 포함할 수 있다 (PCT/US92/01020). 비천연 핵산은 5'-메틸렌포스포네이트 DNA 및 RNA 단량체 및 이량체를 포함할 수 있다 (문헌 [Bohringer et al., Tet. Lett., 1993, 34, 2723-2726]; [Collingwood et al., Synlett, 1995, 7, 703-705]; 및 [Hutter et al., Helvetica Chimica Acta, 2002, 85, 2777-2806]). 비천연 핵산은 2'-치환을 갖는 5'-포스포네이트 단량체 (US2006/0074035) 및 다른 변형된 5'-포스포네이트 단량체 (WO1997/35869)를 포함할 수 있다. 비천연 핵산은 5'-변형된 메틸렌포스포네이트 단량체를 포함할 수 있다 (EP614907 및 EP629633). 비천연 핵산은 5' 및/또는 6'-위치에 히드록실 기를 포함하는 5' 또는 6'-포스포네이트 리보뉴클레오시드의 유사체를 포함할 수 있다 (문헌 [Chen et al., Phosphorus, Sulfur and Silicon, 2002, 777, 1783-1786]; [Jung et al., Bioorg. Med. Chem., 2000, 8, 2501-2509]; [Gallier et al., Eur. J. Org. Chem., 2007, 925-933]; 및 [Hampton et al., J. Med. Chem., 1976, 19(8), 1029-1033]). 비천연 핵산은 5'-포스포네이트 데옥시리보뉴클레오시드 단량체 및 5'-포스페이트 기를 갖는 이량체를 포함할 수 있다 (문헌 [Nawrot et al., Oligonucleotides, 2006, 16(1), 68-82]). 비천연 핵산은 6'-포스포네이트 기를 갖는 뉴클레오시드를 포함할 수 있고, 여기서 5' 또는/및 6'-위치는 비치환되거나, 또는 티오-tert-부틸 기 (SC(CH3)3) (및 그의 유사체); 메틸렌아미노 기 (CH2NH2) (및 그의 유사체) 또는 시아노 기 (CN) (및 그의 유사체)로 치환된다 (문헌 [Fairhurst et al., Synlett, 2001, 4, 467-472]; [Kappler et al., J. Med. Chem., 1986, 29, 1030-1038]; [Kappler et al., J. Med. Chem., 1982, 25, 1179-1184]; [Vrudhula et al., J. Med. Chem., 1987, 30, 888-894]; [Hampton et al., J. Med. Chem., 1976, 19, 1371-1377]; [Geze et al., J. Am. Chem. Soc, 1983, 105(26), 7638-7640]; 및 [Hampton et al., J. Am. Chem. Soc, 1973, 95(13), 4404-4414]). 이 단락에 열거된 각각의 참고문헌의 개시내용은 그 전문이 본원에 참조로 포함된다.
일부 실시양태에서, 비천연 핵산은 또한 당 모이어티의 변형을 포함한다. 일부 경우, 핵산은 당 기가 변형된 하나 이상의 뉴클레오시드를 함유한다. 이러한 당 변형된 뉴클레오시드는 증진된 뉴클레아제 안정성, 증가된 결합 친화도 또는 일부 다른 유익한 생물학적 특성을 부여할 수 있다. 특정 실시양태에서, 핵산은 화학적으로 변형된 리보푸라노스 고리 모이어티를 포함한다. 화학적으로 변형된 리보푸라노스 고리의 예는 비제한적으로 치환기 (5' 및/또는 2' 치환기 포함; 비시클릭 핵산 (BNA)을 형성하기 위한 2개의 고리 원자의 가교; 리보실 고리 산소 원자의 S, N(R), 또는 C(R1)(R2) (R = H, C1-C12 알킬 또는 보호기)로의 대체; 및 그의 조합을 포함한다. 화학적으로 변형된 당의 예는 WO2008/101157, US2005/0130923 및 WO2007/134181에서 찾아볼 수 있고; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
일부 경우, 변형된 핵산은 변형된 당 또는 당 유사체를 포함한다. 따라서, 리보스 및 데옥시리보스 이외에도, 당 모이어티는 펜토스, 데옥시펜토스, 헥소스, 데옥시헥소스, 글루코스, 아라비노스, 크실로스, 릭소스 또는 당 "유사체" 시클로펜틸 기일 수 있다. 당은 피라노실 또는 푸라노실 형태일 수 있다. 당 모이어티는 리보스, 데옥시리보스, 아라비노스 또는 2'-O-알킬리보스의 푸라노시드일 수 있고, 당은 [알파] 또는 [베타] 아노머 배위로 각각의 헤테로시클릭 염기에 부착될 수 있다. 당 변형은 2'-알콕시-RNA 유사체, 2'-아미노-RNA 유사체, 2'-플루오로-DNA 및 2'-알콕시- 또는 아미노-RNA/DNA 키메라를 포함하나 이에 제한되지는 않는다. 예를 들어, 당 변형은 2'-O-메틸-우리딘 또는 2'-O-메틸-시티딘을 포함할 수 있다. 당 변형은 2'-O-알킬-치환된 데옥시리보뉴클레오시드 및 2'-O-에틸렌글리콜 유사 리보뉴클레오시드를 포함한다. 이들 당 또는 당 유사체, 및 이러한 당 또는 유사체가 헤테로시클릭 염기 (핵산 염기)에 부착된 각각의 "뉴클레오시드"의 제조는 공지되어 있다. 당 변형이 또한 이루어지고 다른 변형과 조합될 수 있다.
당 모이어티에 대한 변형은 리보스 및 데옥시 리보스의 천연 변형 뿐만 아니라 비천연 변형을 포함한다. 당 변형은 2' 위치에서의 하기 변형을 포함하나 이에 제한되지는 않는다: OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬, 또는 C2 내지 C10 알케닐 및 알키닐일 수 있음). 2' 당 변형은 또한 -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)nONH2, 및 -O(CH2)nON[(CH2)nCH3)]2 (여기서, n 및 m은 1 내지 약 10임)를 포함하나 이에 제한되지는 않는다.
2' 위치에서의 다른 변형은 C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴, O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 유사한 특성을 갖는 다른 치환기를 포함하나 이에 제한되지는 않는다. 유사한 변형이 또한 당 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 또는 2'-5' 연결된 올리고뉴클레오티드 내의 당의 3' 위치, 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 변형된 당은 또한 가교 고리 산소에 변형, 예컨대 CH2를 함유하는 것을 포함하고, 에스. 뉴클레오티드 당 유사체는 또한 펜토푸라노실 당 대신에 당 모방체, 예컨대 시클로부틸 모이어티를 가질 수 있다. 이러한 변형된 당 구조의 제조를 교시하고, 다양한 염기 변형을 상세하게 기재하고 있는 수많은 미국 특허, 예컨대 미국 특허 번호 4,981,957; 5,118,800; 5,319,080; 5,359,044; 5,393,878; 5,446,137; 5,466,786; 5,514,785; 5,519,134; 5,567,811; 5,576,427; 5,591,722; 5,597,909; 5,610,300; 5,627,053; 5,639,873; 5,646,265; 5,658,873; 5,670,633; 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,594,121, 5,596,091; 5,614,617; 5,681,941; 및 5,700,920 (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)이 있다.
변형된 당 모이어티를 갖는 핵산의 예는 비제한적으로 5'-비닐, 5'-메틸 (R 또는 S), 4'-S, 2'-F, 2'-OCH3, 및 2'-O(CH2)2OCH3 치환기를 포함하는 핵산을 포함한다. 2' 위치에서의 치환기는 또한 알릴, 아미노, 아지도, 티오, O-알릴, O-(C1-C10 알킬), OCF3, O(CH2)2SCH3, O(CH2)2-O-N(Rm)(Rn), 및 O-CH2-C(=O)-N(Rm)(Rn)로부터 선택될 수 있고, 여기서 각각의 Rm 및 Rn은 독립적으로 H 또는 치환 또는 비치환된 C1-C10 알킬이다.
특정 실시양태에서, 본원에 기재된 핵산은 하나 이상의 비시클릭 핵산을 포함한다. 특정의 이러한 실시양태에서, 비시클릭 핵산은 4' 및 2' 리보실 고리 원자 사이에 가교를 포함한다. 특정 실시양태에서, 본원에 제공된 핵산은 하나 이상의 비시클릭 핵산을 포함하며, 여기서 가교는 4'→2' 비시클릭 핵산을 포함한다. 이러한 4'→2' 비시클릭 핵산의 예는 화학식: 4'-(CH2)-O-2' (LNA); 4'-(CH2)-S-2'; 4'-(CH2)2-O-2' (ENA); 4'-CH(CH3)-O-2' 및 4'-CH(CH2OCH3)-O-2' 및 그의 유사체 (미국 특허 번호 7,399,845 참조); 4'-C(CH3)(CH3)-O-2' 및 그의 유사체 (WO2009/006478, WO2008/150729, US2004/0171570, 미국 특허 번호 7,427,672, 문헌 [Chattopadhyaya et al., J. Org. Chem., 209, 74, 118-134] 및 WO2008/154401 참조) 중 하나를 포함하나 이에 제한되지는 않는다. 또한, 예를 들어 문헌 [Singh et al., Chem. Commun., 1998, 4, 455-456]; [Koshkin et al., Tetrahedron, 1998, 54, 3607-3630]; [Wahlestedt et al., Proc. Natl. Acad. Sci. U. S. A., 2000, 97, 5633-5638]; [Kumar et al., Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222]; [Singh et al., J. Org. Chem., 1998, 63, 10035-10039]; [Srivastava et al., J. Am. Chem. Soc., 2007, 129(26) 8362-8379]; [Elayadi et al., Curr. Opinion Invens. Drugs, 2001, 2, 558-561]; [Braasch et al., Chem. Biol, 2001, 8, 1-7]; [Oram et al., Curr. Opinion Mol. Ther., 2001, 3, 239-243]; 미국 특허 번호 4,849,513; 5,015,733; 5,118,800; 5,118,802; 7,053,207; 6,268,490; 6,770,748; 6,794,499; 7,034,133; 6,525,191; 6,670,461; 및 7,399,845; 국제 공개 번호 WO2004/106356, WO1994/14226, WO2005/021570, WO2007/090071 및 WO2007/134181; 미국 특허 공개 번호 US2004/0171570, US2007/0287831 및 US2008/0039618; 미국 가출원 번호 60/989,574, 61/026,995, 61/026,998, 61/056,564, 61/086,231, 61/097,787 및 61/099,844; 및 국제 출원 번호 PCT/US2008/064591, PCT US2008/066154, PCT US2008/068922 및 PCT/DK98/00393 (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)을 참조한다.
특정 실시양태에서, 핵산은 연결된 핵산을 포함한다. 핵산은 임의의 핵산간 연결을 사용하여 함께 연결될 수 있다. 핵산간 연결기의 2가지 주요 부류는 인 원자의 존재 또는 부재에 의해 정의된다. 대표적인 인 함유 핵산간 연결은 포스포디에스테르, 포스포트리에스테르, 메틸포스포네이트, 포스포르아미데이트 및 포스포로티오에이트 (P=S)를 포함하나 이에 제한되지는 않는다. 대표적인 비-인 함유 핵산간 연결기는 메틸렌메틸이미노 (-CH2-N(CH3)-O-CH2-), 티오디에스테르 (-O-C(O)-S-), 티오노카르바메이트 (-O-C(O)(NH)-S-); 실록산 (-O-Si(H)2-O-); 및 N,N*-디메틸히드라진 (-CH2-N(CH3)-N(CH3))을 포함하나 이에 제한되지는 않는다. 특정 실시양태에서, 키랄 원자를 갖는 핵산간 연결은 라세미 혼합물로서, 또는 개별 거울상이성질체, 예를 들어 알킬포스포네이트 및 포스포로티오에이트로서 제조될 수 있다. 비천연 핵산은 단일 변형을 함유할 수 있다. 비천연 핵산은 모이어티 중 하나 내에 또는 상이한 모이어티 사이에 다중 변형을 함유할 수 있다.
핵산에 대한 백본 포스페이트 변형은 메틸 포스포네이트, 포스포로티오에이트, 포스포르아미데이트 (가교 또는 비-가교), 포스포트리에스테르, 포스포로디티오에이트, 포스포디티오에이트 및 보라노포스페이트를 포함하나 이에 제한되지는 않고, 임의의 조합으로 사용될 수 있다. 다른 비-포스페이트 연결이 또한 사용될 수 있다.
일부 실시양태에서, 백본 변형 (예를 들어, 메틸포스포네이트, 포스포로티오에이트, 포스포로아미데이트 및 포스포로디티오에이트 뉴클레오티드간 연결)은 변형된 핵산에 면역조정 활성을 부여하고/거나 생체내에서 그의 안정성을 증진시킬 수 있다.
일부 경우, 인 유도체 (또는 변형된 포스페이트 기)는 당 또는 당 유사체 모이어티에 부착되고, 모노포스페이트, 디포스페이트, 트리포스페이트, 알킬포스포네이트, 포스포로티오에이트, 포스포로디티오에이트, 포스포르아미데이트 등일 수 있다. 변형된 포스페이트 연결 또는 비-포스페이트 연결을 함유하는 예시적인 폴리뉴클레오티드는 문헌 [Peyrottes et al., 1996, Nucleic Acids Res. 24: 1841-1848]; [Chaturvedi et al., 1996, Nucleic Acids Res. 24:2318-2323]; 및 [Schultz et al., (1996) Nucleic Acids Res. 24:2966-2973]; [Matteucci, 1997, "Oligonucleotide Analogs: an Overview" in Oligonucleotides as Therapeutic Agents, (Chadwick and Cardew, ed.) John Wiley and Sons, New York, NY]; [Zon, 1993, "Oligonucleoside Phosphorothioates" in Protocols for Oligonucleotides and Analogs, Synthesis and Properties, Humana Press, pp. 165-190]; [Miller et al., 1971, JACS 93:6657-6665; Jager et al., 1988, Biochem. 27:7247-7246]; [Nelson et al., 1997, JOC 62:7278-7287]; 미국 특허 번호 5,453,496; 및 문헌 [Micklefield, 2001, Curr. Med. Chem. 8:1157-1179] (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)에서 찾아볼 수 있다.
일부 경우, 백본 변형은 포스포디에스테르 연결을 대안적 모이어티, 예컨대 음이온성, 중성 또는 양이온성 기로 대체하는 것을 포함한다. 이러한 변형의 예는 음이온성 뉴클레오시드간 연결; N3'→P5' 포스포르아미데이트 변형; 보라노포스페이트 DNA; 프로올리고뉴클레오티드; 중성 뉴클레오시드간 연결, 예컨대 메틸포스포네이트; 아미드 연결된 DNA; 메틸렌 (메틸이미노) 연결; 포름아세탈 및 티오포름아세탈 연결; 술포닐 기를 함유하는 백본; 모르폴리노 올리고; 펩티드 핵산 (PNA); 및 양으로 하전된 데옥시리보핵산 구아니딘 (DNG) 올리고 (문헌 [Micklefield, 2001, Current Medicinal Chemistry 8: 1157-1179] (그의 개시내용은 그 전문이 본원에 참조로 포함됨))를 포함한다. 변형된 핵산은 하나 이상의 변형, 예를 들어 포스페이트 연결의 조합, 예컨대 포스포디에스테르 및 포스포로티오에이트 연결의 조합을 포함하는 키메라 또는 혼합된 백본을 포함할 수 있다.
포스페이트에 대한 치환체는, 예를 들어 단쇄 알킬 또는 시클로알킬 뉴클레오시드간 연결, 혼합된 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결을 포함한다. 이들은 모르폴리노 연결 (부분적으로 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌히드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본을 갖는 것들; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 다른 것들을 포함한다. 수많은 미국 특허가 이들 유형의 포스페이트 대체물을 제조하고 사용하는 방법을 개시하고 있으며, 미국 특허 번호 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 및 5,677,439 (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)를 포함하나 이에 제한되지는 않는다. 뉴클레오티드 치환체에서, 뉴클레오티드의 당 및 포스페이트 모이어티 둘 다는 예를 들어 아미드 유형 연결 (아미노에틸글리신) (PNA)에 의해 대체될 수 있는 것으로 또한 이해된다. 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262는 PNA 분자의 제조 및 사용 방법을 교시하며, 이들 각각은 본원에 참조로 포함된다. 또한, 문헌 [Nielsen et al., Science, 1991, 254, 1497-1500]을 참조한다. 다른 유형의 분자 (접합체)를 뉴클레오티드 또는 뉴클레오티드 유사체에 연결하여, 예를 들어 세포 흡수를 증진시키는 것이 또한 가능하다. 접합체는 뉴클레오티드 또는 뉴클레오티드 유사체에 화학적으로 연결될 수 있다. 이러한 접합체는 지질 모이어티, 예컨대 콜레스테롤 모이어티 (문헌 [Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556]), 콜산 (문헌 [Manoharan et al., Bioorg. Med. Chem. Let., 1994, 4, 1053-1060]), 티오에테르, 예를 들어 헥실-S-트리틸티올 (문헌 [Manoharan et al., Ann. KY. Acad. Sci., 1992, 660, 306-309]; [Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765-2770]), 티오콜레스테롤 (문헌 [Oberhauser et al., Nucl. Acids Res., 1992, 20, 533-538]), 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 (문헌 [Saison-Behmoaras et al., EM5OJ, 1991, 10, 1111-1118]; [Kabanov et al., FEBS Lett., 1990, 259, 327-330]; [Svinarchuk et al., Biochimie, 1993, 75, 49-54]), 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1-디-O-헥사데실-rac-글리세로-S-H-포스포네이트 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654]; [Shea et al., Nucl. Acids Res., 1990, 18, 3777-3783]), 폴리아민 또는 폴리에틸렌 글리콜 쇄 (문헌 [Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969-973]), 또는 아다만탄 아세트산 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654]), 팔미틸 모이어티 (문헌 [Mishra et al., Biochem. Biophys. Acta, 1995, 1264, 229-237]), 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티 (문헌 [Crooke et al., J. Pharmacol. Exp. Ther., 1996, 277, 923-937])를 포함하나 이에 제한되지는 않으며; 상기 문헌 각각의 개시내용은 그 전문이 본원에 참조로 포함된다. 다수의 미국 특허가 이러한 접합체의 제조를 교시하고 있으며, 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941 (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)을 포함하나 이에 제한되지는 않는다.
비천연 아미노산의 단백질로의 복제, 전사, 번역 및 혼입을 위한 조성물 및 방법에 사용되는 핵염기가 본원에 기재된다. 일부 실시양태에서, 본원에 기재된 핵염기는 하기 구조를 포함한다:
Figure pct00174
, 여기서
각각의 X는 독립적으로 탄소 또는 질소이고;
R2는 X가 탄소인 경우에 존재하고, 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고;
각각의 Y는 독립적으로 황, 산소, 셀레늄 또는 2급 아민이고;
각각의 E는 독립적으로 산소, 황 또는 셀레늄이고;
파상선은 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 임의로 α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기를 포함하는 모노-포스페이트, 디포스페이트 또는 트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다.
일부 실시양태에서, R2는 저급 알킬 (예를 들어, C1-C6), 수소 또는 할로겐이다. 본원에 기재된 핵염기의 일부 실시양태에서, R2는 플루오로이다. 본원에 기재된 핵염기의 일부 실시양태에서, X는 탄소이다. 본원에 기재된 핵염기의 일부 실시양태에서, E는 황이다. 본원에 기재된 핵염기의 일부 실시양태에서, Y는 황이다.
본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 구조
Figure pct00175
를 갖는다. 일부 실시양태에서, 본원에 기재된 핵염기는 구조
Figure pct00176
를 갖는다. 본원에 기재된 핵염기의 일부 실시양태에서, E는 황이고, Y는 황이다. 일부 실시양태에서, 파상선은 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내며, 여기서 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 또는 모노-포스페이트, 디포스페이트, 트리포스페이트, α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다. 본원에 기재된 핵염기의 일부 실시양태에서, 파상선은 리보실 또는 데옥시리보실 모이어티에 대한 결합 지점을 나타낸다. 본원에 기재된 핵염기의 일부 실시양태에서, 파상선은 트리포스페이트 기에 연결된 리보실 또는 데옥시리보실 모이어티에 결합하는 지점을 나타낸다. 일부 실시양태에서, 본원에 기재된 핵염기는 핵산 중합체의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 tRNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 tRNA 내의 안티코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 mRNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 mRNA의 코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 RNA 또는 DNA의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 DNA 내의 코돈의 성분이다. 본원에 기재된 핵염기의 일부 실시양태에서, 핵염기는 또 다른 (예를 들어, 상보적) 핵염기와 핵염기 쌍을 형성하거나, 형성할 수 있거나 또는 형성하도록 구성된다.
일부 실시양태에서, 본원에 기재된 핵염기는 하기 구조를 갖는다:
Figure pct00177
여기서:
각각의 X는 독립적으로 탄소 또는 질소이고;
R2는 X가 질소인 경우에 부재하고, X가 탄소인 경우에 존재하고, 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드이고;
Y는 황, 산소, 셀레늄 또는 2급 아민이고;
E는 산소, 황 또는 셀레늄이고;
파상선은 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실, 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 모노-포스페이트, 디포스페이트, 트리포스페이트, α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다.
일부 실시양태에서, 각각의 X는 탄소이다. 일부 실시양태에서, 적어도 1개의 X는 탄소이다. 일부 실시양태에서, 1개의 X는 탄소이다. 일부 실시양태에서, 적어도 2개의 X는 탄소이다. 일부 실시양태에서, 2개의 X는 탄소이다. 일부 실시양태에서, 적어도 1개의 X는 질소이다. 일부 실시양태에서, 1개의 X는 질소이다. 일부 실시양태에서, 적어도 2개의 X는 질소이다. 일부 실시양태에서, 2개의 X는 질소이다.
일부 실시양태에서, Y는 황이다. 일부 실시양태에서, Y는 산소이다. 일부 실시양태에서, Y는 셀레늄이다. 일부 실시양태에서, Y는 2급 아민이다.
일부 실시양태에서, E는 황이다. 일부 실시양태에서, E는 산소이다. 일부 실시양태에서, E는 셀레늄이다.
일부 실시양태에서, R2는 X가 탄소인 경우에 존재한다. 일부 실시양태에서, R2는 X가 질소인 경우에 부재한다. 일부 실시양태에서, 각각의 R2는 존재하는 경우에 수소이다. 일부 실시양태에서, R2은 알킬, 예컨대 메틸, 에틸 또는 프로필이다. 일부 실시양태에서, R2는 알케닐, 예컨대 -CH2=CH2이다. 일부 실시양태에서, R2는 알키닐, 예컨대 에티닐이다. 일부 실시양태에서, R2는 메톡시이다. 일부 실시양태에서, R2는 메탄티올이다. 일부 실시양태에서, R2는 메탄셀레노이다. 일부 실시양태에서, R2는 할로겐, 예컨대 클로로, 브로모 또는 플루오로이다. 일부 실시양태에서, R2는 시아노이다. 일부 실시양태에서, R2는 아지드이다.
일부 실시양태에서, E는 황이고, Y는 황이고, 각각의 X는 독립적으로 탄소 또는 질소이다. 일부 실시양태에서, E는 황이고, Y는 황이고, 각각의 X는 탄소이다.
일부 실시양태에서, 핵염기는 구조
Figure pct00178
를 갖는다. 일부 실시양태에서, 핵염기는 구조
Figure pct00179
를 갖는다.
일부 실시양태에서, 핵염기는 구조
Figure pct00180
을 갖는다.
일부 실시양태에서, 본원에 개시된 핵염기는 상보적 염기-쌍형성 핵염기에 (예를 들어, 비공유적으로) 결합되어 비천연 염기 쌍 (UBP)을 형성하거나, 또는 핵염기와 염기 쌍형성할 수 있거나 염기 쌍형성하도록 구성된다. 일부 실시양태에서, 상보적 염기-쌍형성 핵염기는
Figure pct00181
으로부터 선택된다.
한 측면에서, 이중 가닥 올리고뉴클레오티드 듀플렉스가 본원에 제공되며, 여기서 제1 올리고뉴클레오티드 가닥이 본원에 개시된 핵염기를 포함하고, 제2 상보적 올리고뉴클레오티드 가닥이 그의 상보적 염기-쌍형성 부위에 상보적 염기-쌍형성 핵염기를 포함한다. 일부 실시양태에서, 제1 올리고뉴클레오티드 가닥은
Figure pct00182
을 포함하고; 제2 가닥은 그의 상보적 염기-쌍형성 부위에
Figure pct00183
으로 이루어진 군으로부터 선택되는 상보적 염기 쌍형성 핵염기를 포함한다.
추가 측면에서, 핵염기를 포함하는 안티코돈; 및 아미노아실 tRNA 신테타제에 의한 tRNA의 비천연 아미노산으로의 선택적 충전을 촉진하는 인식 요소를 포함하는, 본원에 기재된 핵염기를 포함하는 전달 RNA (tRNA)가 본원에 제공된다. 일부 실시양태에서, 핵염기는 tRNA의 안티코돈 영역에 위치한다. 일부 실시양태에서, 핵염기는 안티코돈의 제1 위치에 위치한다. 일부 실시양태에서, 핵염기는 안티코돈의 제2 위치에 위치한다. 일부 실시양태에서, 핵염기는 안티코돈의 제3 위치에 위치한다. 일부 실시양태에서, 아미노아실 tRNA 신테타제는 메타노사르시나 또는 그의 변이체로부터 유래된다. 일부 실시양태에서, 아미노아실 tRNA 신테타제는 메타노코쿠스 (메타노칼도코쿠스) 또는 그의 변이체로부터 유래된다. 일부 실시양태에서, 비천연 아미노산은 방향족 모이어티를 포함한다. 일부 실시양태에서, 비천연 아미노산은 리신 유도체이다. 일부 실시양태에서, 비천연 아미노산은 페닐알라닌 유도체이다.
또한, 하기 화학식을 포함하는 구조물이 본원에 제공된다:
N1 - Zx - N2
여기서:
Z는 리보실 또는 데옥시리보실 또는 그의 유사체에 결합된 본원에 기재된 바와 같은 핵염기이고;
N1은 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 5' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 포스페이트 기이고;
N2는 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 3' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 히드록실 기이고;
x는 1 내지 20의 정수이다.
일부 실시양태에서, N1은 Z의 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체의 5' 말단에 부착된 1개 이상의 뉴클레오티드 또는 그의 유사체이다. 리보실 또는 데옥시리보실 모이어티의 5' 말단에 대한 부착은 포스포디에스테르를 통할 수 있다. 일부 실시양태에서, N1은 Z의 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체의 5' 말단에 부착된 말단 포스페이트 기이다. 일부 실시양태에서, N2는 Z의 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체의 3' 말단에 부착된 1개 이상의 뉴클레오티드 또는 그의 유사체이다. 리보실 또는 데옥시리보실 모이어티의 3' 말단에 대한 부착은 포스포디에스테르를 통할 수 있다. 일부 실시양태에서, N2는 Z의 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체의 3' 말단에 부착된 말단 히드록실 기이다.
일부 실시양태에서, x는 1 내지 20의 정수이다. 일부 실시양태에서, x는 1 내지 15의 정수이다. 일부 실시양태에서, x는 1 내지 10의 정수이다. 일부 실시양태에서, x는 1 내지 5의 정수이다. 일부 실시양태에서, x는 1이다. 일부 실시양태에서, x는 2이다. 일부 실시양태에서, x는 3이다. 일부 실시양태에서, x는 4이다. 일부 실시양태에서, x는 5이다. 일부 실시양태에서, x는 6이다. 일부 실시양태에서, x는 7이다. 일부 실시양태에서, x는 8이다. 일부 실시양태에서, x는 9이다. 일부 실시양태에서, x는 10이다. 일부 실시양태에서, x는 11이다. 일부 실시양태에서, x는 12이다. 일부 실시양태에서, x는 13이다. 일부 실시양태에서, x는 14이다. 일부 실시양태에서, x는 15이다. 일부 실시양태에서, x는 16이다. 일부 실시양태에서, x는 17이다. 일부 실시양태에서, x는 18이다. 일부 실시양태에서, x는 19이다. 일부 실시양태에서, x는 20이다.
일부 실시양태에서, Z는 본원에 상술된 바와 같은 구조
Figure pct00184
를 갖는다. 일부 실시양태에서, Z는 구조
Figure pct00185
를 갖는다.
일부 실시양태에서, 화학식 N1 - Zx - N2의 구조물은 유전자에 대해 코딩한다. 일부 실시양태에서, Zx는 유전자의 번역된 영역에 위치한다. 일부 실시양태에서, Zx는 유전자의 비번역 영역에 위치한다. 일부 실시양태에서, 구조물은 5' 또는 3' 비번역 영역 (UTR)을 추가로 포함한다. 일부 실시양태에서, 구조물은 종결인자 영역을 추가로 포함한다. 일부 실시양태에서, 구조물은 프로모터 영역을 추가로 포함한다.
추가 측면에서, 적어도 5000개의 고유한 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 라이브러리가 본원에 제공되며, 여기서 각각의 폴리뉴클레오티드는 본원에 개시된 적어도 1종의 핵염기를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드 라이브러리는 적어도 하나의 유전자에 대해 코딩한다.
또 다른 측면에서, 뉴클레오시드 트리포스페이트가 본원에 제공되며, 여기서 핵염기는
Figure pct00186
으로부터 선택된다. 일부 실시양태에서, 핵염기는
Figure pct00187
이다. 일부 실시양태에서, 핵염기는
Figure pct00188
이다. 일부 실시양태에서, 핵염기는
Figure pct00189
이다. 일부 실시양태에서, 핵염기는
Figure pct00190
이다. 일부 실시양태에서, 뉴클레오시드는 리보스를 포함한다. 일부 실시양태에서, 뉴클레오시드는 데옥시리보스를 포함한다.
핵산 염기 쌍형성 특성; 예시적인 염기 쌍
일부 실시양태에서, 비천연 뉴클레오티드는 DNA 또는 RNA 내로의 혼입 동안 또는 후에 또 다른 비천연 뉴클레오티드와 염기 쌍 (비천연 염기 쌍; UBP)을 형성한다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 또 다른 핵산, 예를 들어 천연 또는 비천연 핵산과 염기 쌍을 형성할 수 있는 비천연 핵산이다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 또 다른 비천연 핵산과 염기 쌍 (비천연 핵산 염기 쌍 (UBP))을 형성할 수 있는 비천연 핵산이다. 예를 들어, 제1 비천연 핵산은 제2 비천연 핵산과 염기 쌍을 형성할 수 있다. 예를 들어, 핵산으로의 혼입 동안 및 후에 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 (d)5SICS의 트리포스페이트 ((d)5SICSTP) 및 (d)NaM의 트리포스페이트 ((d)NaMTP)를 포함한다. 다른 예는 (d)CNMO의 트리포스페이트 ((d)CNMOTP) 및 (d)TPT3의 트리포스페이트 ((d)TPT3TP)를 포함하나 이에 제한되지는 않는다. 이러한 비천연 뉴클레오티드는 리보스 또는 데옥시리보스 당 모이어티 ("(d)"로 표시됨)를 가질 수 있다. 예를 들어, 핵산 내로 혼입될 때 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 TAT1의 트리포스페이트 ((d)TAT1TP) 및 NaM의 트리포스페이트 ((d)NaMTP)를 포함한다. 일부 실시양태에서, 핵산에 혼입되는 경우에 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 dCNMO의 트리포스페이트 (dCNMOTP) 및 TAT1의 트리포스페이트 (TAT1TP)를 포함한다. 일부 실시양태에서, 핵산에 혼입될 때 염기 쌍형성할 수 있는 비천연 뉴클레오시드 트리포스페이트의 한 쌍은 dTPT3의 트리포스페이트 (dTPT3TP) 및 NaM의 트리포스페이트 (NaMTP)를 포함한다. 일부 실시양태에서, 비천연 핵산은 천연 핵산 (A, T, G, C)과 염기 쌍을 실질적으로 형성하지 않는다. 일부 실시양태에서, 안정하게 통합된 비천연 핵산은 천연 핵산과 염기 쌍을 형성할 수 있다.
일부 실시양태에서, 안정하게 통합된 비천연 (데옥시)리보뉴클레오티드는, UBP를 형성할 수 있지만 각각의 임의의 천연 (데옥시)리보뉴클레오티드와 염기 쌍을 실질적으로 형성하지 않는 비천연 (데옥시)리보뉴클레오티드이다. 일부 실시양태에서, 안정하게 통합된 비천연 (데옥시)리보뉴클레오티드는, UBP를 형성할 수 있지만 하나 이상의 천연 핵산과 염기 쌍을 실질적으로 형성하지 않는 비천연 (데옥시)리보뉴클레오티드이다. 예를 들어, 안정하게 통합된 비천연 핵산은 A, T 및 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A, T 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C, G 및 A와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C, G 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, C 및 T와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C 및 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A 및 G와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, T 및 A와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 T 및 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 G와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, A, T 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 A와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, T 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 T와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, A 및 C와 염기 쌍을 형성할 수 있다. 예를 들어, 안정하게 통합된 비천연 핵산은 C와 염기 쌍을 실질적으로 형성하지 않을 수 있지만, G, T 및 A와 염기 쌍을 형성할 수 있다.
생체내 조건 하에 비천연 DNA 또는 RNA 염기 쌍 (UBP)을 형성할 수 있는 예시적인 비천연 뉴클레오티드는 5SICS, d5SICS, NaM, dNaM, dTPT3, dMTMO, dCNMO, TAT1 및 그의 조합을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 생체내 조건 하에 비천연 DNA 또는 RNA 염기 쌍 (UBP)을 형성할 수 있는 비천연 뉴클레오티드는 5SICS, NaM, TPT3, MTMO, CNMO, TAT1 및 그의 조합을 포함하나 이에 제한되지는 않으며, 여기서 뉴클레오티드의 당 모이어티는 데옥시리보스 당이다. 일부 실시양태에서, 생체내 조건 하에 비천연 DNA 또는 RNA 염기 쌍 (UBP)을 형성할 수 있는 비천연 뉴클레오티드는 5SICS, NaM, TPT3, MTMO, CNMO, TAT1 및 그의 조합을 포함하나 이에 제한되지는 않으며, 여기서 뉴클레오티드의 당 모이어티는 리보스 당이다. 일부 실시양태에서, 생체내 조건 하에 비천연 DNA 또는 RNA 염기 쌍 (UBP)을 형성할 수 있는 비천연 뉴클레오티드는 (d)5SICS, (d)NaM, (d)TPT3, (d)MTMO, (d)CNMO, (d)TAT1 및 그의 조합을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 비천연 뉴클레오티드 염기 쌍은
Figure pct00191
을 포함하나 이에 제한되지는 않으며, 여기서 당 모이어티는 본원에 기재된 임의의 실시양태 또는 변형이다. 일부 실시양태에서, 비천연 뉴클레오티드 염기 쌍은
Figure pct00192
을 포함하나 이에 제한되지는 않는다. 임의의 이러한 실시양태에서, 비천연 염기에 부착된 데옥시리보스 중 하나 또는 둘 다는 리보스로 치환될 수 있다.
조작된 유기체
일부 실시양태에서, 본원에 개시된 방법 및 플라스미드는 조작된 유기체, 예를 들어 비천연 뉴클레오티드 또는 비천연 핵산 염기 쌍 (UBP)을 혼입하고 복제하는 유기체를 생성하는데 추가로 사용되고, 또한 비천연 아미노산 잔기를 함유하는 단백질을 번역하는데 사용되는 mRNA 및 tRNA를 전사하기 위해 비천연 뉴클레오티드를 함유하는 핵산을 사용할 수 있다. 일부 경우, 유기체는 비-인간 반합성 유기체 (SSO)이다. 일부 경우, 유기체는 반합성 유기체 (SSO)이다. 일부 경우, SSO는 세포이다. 일부 경우, 생체내 방법은 반합성 유기체 (SSO)를 포함한다. 일부 경우, 반합성 유기체는 미생물을 포함한다. 일부 경우, 유기체는 박테리아를 포함한다. 일부 경우, 유기체는 그람-음성 박테리아를 포함한다. 일부 경우, 유기체는 그람-양성 박테리아를 포함한다. 일부 경우, 유기체는 에스케리키아 콜라이 (이. 콜라이)이다. 이러한 변형된 유기체는 추가의 성분, 예컨대 DNA 복구 기구, 변형된 폴리머라제, 뉴클레오티드 수송체 또는 다른 성분을 다양하게 포함한다. 일부 경우, SSO는 이. 콜라이 균주 YZ3을 포함한다. 일부 경우, SSO는 이. 콜라이 균주 ML1 또는 ML2, 예컨대 문헌 [Ledbetter, et al. J. Am Chem. Soc. 2018, 140(2), 758] (그의 개시내용은 그 전문이 본원에 참조로 포함됨)의 도 1 (B-D)에 기재된 균주를 포함한다.
일부 경우, 사용된 세포는 이종 단백질, 예를 들어 비천연 뉴클레오시드 트리포스페이트를 세포 내로 수송할 수 있는 뉴클레오시드 트리포스페이트 수송체를 코딩하는 발현 카세트, 및 임의로 비천연 뉴클레오티드를 상실한 DNA를 제거하기 위한 CRISPR/Cas9 시스템 (예를 들어, 이. 콜라이 균주 YZ3, ML1 또는 ML2)으로 유전자 형질전환된다. 일부 경우, 세포는 비천연 핵산 흡수에 대한 증진된 활성을 추가로 포함한다. 일부 경우, 세포는 비천연 핵산 유입에 대한 증진된 활성을 추가로 포함한다.
일부 실시양태에서, Cas9 및 적절한 가이드 RNA (sgRNA)는 별개의 플라스미드 상에 코딩된다. 일부 경우, Cas9 및 sgRNA는 동일한 플라스미드 상에 코딩된다. 일부 경우, Cas9, sgRNA를 코딩하는 핵산 분자, 또는 비천연 뉴클레오티드를 포함하는 핵산 분자는 하나 이상의 플라스미드 상에 위치한다. 일부 경우, Cas9는 제1 플라스미드 상에 코딩되고, sgRNA 및 비천연 뉴클레오티드를 포함하는 핵산 분자는 제2 플라스미드 상에 코딩된다. 일부 경우, Cas9, sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자는 동일한 플라스미드 상에 코딩된다. 일부 경우, 핵산 분자는 2개 이상의 비천연 뉴클레오티드를 포함한다. 일부 경우, Cas9는 숙주 유기체의 게놈 내로 혼입되고, sgRNA는 플라스미드 상에 또는 유기체의 게놈 내에 코딩된다.
일부 경우, Cas9 및 sgRNA를 코딩하는 제1 플라스미드 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 제2 플라스미드는 조작된 미생물 내로 도입된다. 일부 경우, Cas9를 코딩하는 제1 플라스미드, 및 sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 제2 플라스미드는 조작된 미생물 내로 도입된다. 일부 경우, Cas9, sgRNA, 및 비천연 뉴클레오티드를 포함하는 핵산 분자를 코딩하는 플라스미드가 조작된 미생물 내로 도입된다. 일부 경우, 핵산 분자는 2개 이상의 비천연 뉴클레오티드를 포함한다.
일부 실시양태에서, 그의 DNA (플라스미드 또는 게놈) 내에 적어도 1개의 비천연 뉴클레오티드 및/또는 적어도 1종의 비천연 염기 쌍 (UBP)을 혼입시킨 살아있는 세포가 생성된다. 일부 경우, 비천연 염기 쌍은, 비천연 상호 염기-쌍형성 뉴클레오티드가 각각의 트리포스페이트로서 뉴클레오티드 트리포스페이트 수송체의 작용에 의해 세포 내로 흡수되는 경우, 생체내 조건 하에 비천연 염기 쌍을 형성할 수 있는 한 쌍의 비천연 상호 염기-쌍형성 뉴클레오티드를 포함한다. 일부 경우, 비천연 염기 쌍은, 비천연 상호 염기-쌍형성 뉴클레오티드가 각각의 트리포스페이트로서 뉴클레오티드 트리포스페이트 수송체의 작용에 의해 세포 내로 흡수되는 경우, 생체내 조건 하에 비천연 염기 쌍을 형성하도록 구성된 한 쌍의 비천연 상호 염기-쌍형성 뉴클레오티드를 포함한다. 뉴클레오티드 트리포스페이트 수송체가 발현되고 비천연 뉴클레오티드를 세포 내로 수송하는데 이용가능하도록, 뉴클레오티드 트리포스페이트 수송체를 코딩하는 발현 카세트에 의해 세포가 유전자 형질전환될 수 있다. 세포는 원핵 또는 진핵 세포일 수 있고, 비천연 상호 염기-쌍형성 뉴클레오티드의 쌍은 그의 각각의 트리포스페이트로서 dTPT3의 트리포스페이트 (dTP3TP) 및 dNaM의 트리포스페이트 (dNaMTP) 또는 dCNMO (dCNMOTP)일 수 있다.
일부 실시양태에서, 세포는 핵산, 예를 들어 이러한 비천연 뉴클레오티드를 세포 내로 수송할 수 있는 뉴클레오티드 트리포스페이트 수송체를 코딩하는 발현 카세트로 유전자 형질전환된 세포이다. 세포는 이종 뉴클레오시드 트리포스페이트 수송체를 포함할 수 있으며, 여기서 이종 뉴클레오시드 트리포스페이트 수송체는 천연 및 비천연 뉴클레오시드 트리포스페이트를 세포 내로 수송할 수 있다.
일부 경우, 본원에 기재된 방법은 또한 유전자 형질전환된 세포를 인산칼륨 및/또는 포스파타제 또는 뉴클레오티다제의 억제제의 존재 하에 각각의 트리포스페이트와 접촉시키는 것을 포함한다. 이러한 접촉 동안 또는 후에, 세포는 세포의 성장 및 복제에 적합한 생명-지지 배지 내에 배치될 수 있다. 세포는 비천연 뉴클레오티드의 각각의 트리포스페이트 형태가 세포의 적어도 1회의 복제 주기를 통해 세포 내의 핵산으로 혼입되도록 생명-지지 배지에서 유지될 수 있다. 각각의 트리포스페이트로서 비천연 상호 염기-쌍형성 뉴클레오티드의 쌍은 dTPT3의 트리포스페이트 (또는 dTPT3TP) 및 dCNMO 또는 dNaM의 트리포스페이트 (dCNOM 또는 dNaMTP)를 포함할 수 있고, 세포는 이. 콜라이일 수 있고, dTPT3TP 및 dNaMTP는 수송체 PtNTT2에 의해 이. 콜라이 내로 유입될 수 있고, 여기서 이. 콜라이 폴리머라제, 예컨대 Pol III 또는 Pol II는 UBP를 함유하는 DNA를 복제하기 위해 비천연 트리포스페이트를 사용할 수 있고, 이에 의해 비천연 뉴클레오티드 및/또는 비천연 염기 쌍을 세포 환경 내의 세포 핵산 내로 혼입시킬 수 있다. 추가로, 리보뉴클레오티드, 예컨대 NaMTP 및 TAT1TP, 5FMTP 및 TPT3TP는 일부 경우에 수송체 PtNTT2에 의해 이. 콜라이로 유입된다.
3개 이상의 비천연 염기-쌍형성 뉴클레오티드의 사용을 포함하는 조성물 및 방법이 본원에 기재된다. 이러한 염기 쌍형성 뉴클레오티드는 일부 경우에 뉴클레오티드 수송체의 사용을 통해 또는 관련 기술분야에 공지된 표준 핵산 형질전환 방법 (예를 들어, 전기천공, 화학적 형질전환 또는 다른 방법)을 통해 세포에 진입한다. 일부 경우, 염기 쌍형성 비천연 뉴클레오티드는 폴리뉴클레오티드, 예컨대 플라스미드의 일부로서 세포에 진입한다. 폴리뉴클레오티드 (RNA 또는 DNA)의 일부로서 세포에 진입하는 1개 이상의 염기 쌍형성 비천연 뉴클레오티드는 그 자체가 생체내에서 복제될 필요는 없다. 예를 들어, 제1 비천연 염기 쌍을 형성하도록 구성된 염기를 갖는 제1 비천연 데옥시리보뉴클레오티드 및 제2 비천연 데옥시리보뉴클레오티드를 포함하는 이중-가닥 DNA 플라스미드 또는 다른 핵산은 세포 내로 전기천공된다. 세포 배지는 서로 제2 비천연 염기 쌍을 형성하도록 구성된 염기를 갖는 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드로 처리되고, 여기서 제1 비천연 데옥시리보뉴클레오티드의 염기 및 제3 비천연 데옥시리보뉴클레오티드의 염기는 제2 비천연 염기 쌍을 형성하고, 제2 비천연 데옥시리보뉴클레오티드의 염기 및 제4 비천연 데옥시리보뉴클레오티드의 염기는 제3 비천연 염기 쌍을 형성한다. 일부 경우, 원래 형질전환된 이중-가닥 DNA 플라스미드의 생체내 복제는 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드를 포함하는 후속 복제된 플라스미드를 생성한다. 대안적으로 또는 조합하여, 제3 비천연 데옥시리보뉴클레오티드 및 제4 비천연 데옥시리보뉴클레오티드의 리보뉴클레오티드 변이체를 세포 배지에 첨가한다. 이들 리보뉴클레오티드는 일부 예에서 RNA, 예컨대 mRNA 또는 tRNA 내로 혼입된다. 일부 경우, 제1, 제2, 제3 및 제4 데옥시뉴클레오티드는 상이한 염기를 포함한다. 일부 경우, 제1, 제3 및 제4 데옥시뉴클레오티드는 상이한 염기를 포함한다. 일부 경우, 제1 및 제3 데옥시뉴클레오티드는 동일한 염기를 포함한다.
본 발명의 방법의 실시에 의해, 관련 기술분야의 통상의 기술자는 개별 세포의 적어도 일부 내에서 유지되는 적어도 하나의 핵산 내에 적어도 하나의 비천연 뉴클레오티드 및/또는 적어도 1종의 비천연 염기 쌍 (UBP)을 갖는 살아있고 번식하는 세포의 집단을 얻을 수 있고, 여기서 적어도 하나의 핵산은 세포 내에서 안정하게 번식되고, 세포는 유기체의 성장 및 복제에 적합한 생명-지지 배지 내에서 비천연 뉴클레오티드(들)와 접촉될 때 (예를 들어, 그의 존재 하에 성장될 때) 하나 이상의 비천연 뉴클레오티드의 트리포스페이트 형태의 세포 흡수를 제공하기에 적합한 뉴클레오티드 트리포스페이트 수송체를 발현한다.
뉴클레오티드 트리포스페이트 수송체에 의한 세포 내로의 수송 후에, 비천연 염기-쌍형성 뉴클레오티드는 세포 기구, 예를 들어 세포 자신의 DNA 및/또는 RNA 폴리머라제, 이종 폴리머라제 또는 방향적 진화를 사용하여 진화된 폴리머라제에 의해 세포 내의 핵산 내로 혼입된다 (문헌 [Chen T, Romesberg FE, FEBS Lett. 2014 Jan 21;588(2):219-29]; [Betz K et al., J Am Chem Soc. 2013 Dec 11;135(49):18637-43]; 각각의 개시내용은 그 전문이 본원에 참조로 포함됨). 비천연 뉴클레오티드는 세포 핵산, 예컨대 게놈 DNA, 게놈 RNA, mRNA, tRNA, 구조 (RNA), 마이크로RNA, 및 자율 복제 핵산 (예를 들어, 플라스미드, 바이러스 또는 벡터) 내로 혼입될 수 있다.
일부 경우, 유전자 조작된 세포는 핵산, 예를 들어 이종 핵산을 세포 내로 도입함으로써 생성된다. 본원에 기재된 임의의 세포는 숙주 세포일 수 있고, 발현 벡터를 포함할 수 있다. 한 실시양태에서, 숙주 세포는 원핵 세포이다. 또 다른 실시양태에서, 숙주 세포는 이. 콜라이이다. 일부 실시양태에서, 세포는 하나 이상의 이종 폴리뉴클레오티드를 포함한다. 핵산 시약은 다양한 기술을 사용하여 미생물 내로 도입될 수 있다. 이종 핵산을 다양한 유기체 내로 도입하는데 사용되는 방법의 비제한적 예는 형질전환, 형질감염, 형질도입, 전기천공, 초음파-매개 형질전환, 접합, 입자 충격 등을 포함한다. 일부 경우, 담체 분자 (예를 들어, 비스-벤조이미다졸릴 화합물, 예를 들어 미국 특허 번호 5,595,899)의 첨가가 통상적인 방법에 의해 형질전환시키기 어려운 것으로 전형적으로 여겨지는 세포에서 DNA의 흡수를 증가시킬 수 있다. 통상적인 형질전환 방법은 관련 기술분야의 통상의 기술자가 쉽게 이용할 수 있고, 문헌 [Maniatis, T., E. F. Fritsch and J. Sambrook (1982) Molecular Cloning: a Laboratory Manual; Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.]에서 찾을 수 있으며, 그의 개시내용은 그 전문이 본원에 참조로 포함된다.
일부 경우, 유전자 형질전환은, 이로 제한되지는 않지만 플라스미드, 바이러스 벡터, 바이러스 핵산, 파지 핵산, 파지, 코스미드 및 인공 염색체 내의 발현 카세트의 직접적인 전달을 사용하거나, 또는 세포 또는 담체 예컨대 양이온성 리포솜 내의 유전자 물질의 전달을 통해 얻어진다. 이러한 방법은 관련 기술분야에서 이용가능하고, 본원에 기재된 방법에 사용하기 위해 용이하게 적합화될 수 있다. 전달 벡터는 유전자를 세포 내로 전달하는데 사용되는 임의의 뉴클레오티드 구축물 (예를 들어, 플라스미드)일 수 있거나, 또는 유전자를 전달하는 일반적 전략의 일부로서, 예를 들어 재조합 레트로바이러스 또는 아데노바이러스의 일부로서 사용될 수 있다 (문헌 [Ram et al. Cancer Res. 53:83-88, (1993)]). 바이러스 벡터, 화학적 형질감염체 또는 물리-기계적 방법, 예컨대 전기천공 및 DNA의 직접 확산을 비롯한 형질감염을 위한 적절한 수단은, 예를 들어 문헌 [Wolff, J. A., et al., Science, 247, 1465-1468, (1990)]; 및 [Wolff, J. A. Nature, 352, 815-818, (1991)]에 기재되어 있으며, 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
예를 들어, 뉴클레오시드 트리포스페이트 수송체 또는 폴리머라제 발현 카세트 및/또는 벡터를 코딩하는 DNA는 칼슘-매개 형질전환, 전기천공, 미세주사, 리포펙션, 입자 충격 등을 포함하나 이에 제한되지는 않는 임의의 방법에 의해 세포에 도입될 수 있다.
일부 경우, 세포는 세포 내의 하나 이상의 핵산에 혼입된 비천연 뉴클레오시드 트리포스페이트를 포함한다. 예를 들어, 세포는 세포 내에서 유지되는 DNA 또는 RNA 내에 적어도 하나의 비천연 뉴클레오티드를 혼입시킬 수 있는 살아있는 세포일 수 있다. 세포는 또한 한 쌍의 비천연 상호 염기-쌍형성 뉴클레오티드를 포함하는 적어도 1종의 비천연 염기 쌍 (UBP)을 생체내 조건 하에 세포 내의 핵산 내로 혼입시킬 수 있고, 여기서 비천연 상호 염기-쌍형성 뉴클레오티드, 예를 들어 그의 각각의 트리포스페이트는 뉴클레오시드 트리포스페이트 수송체의 작용에 의해 세포 내로 흡수되고, 그에 대한 유전자는 유전자 형질전환에 의해 세포 내에 존재한다 (예를 들어, 도입되었다). 예를 들어, 세포 내에서 유지되는 핵산으로의 혼입시 dTPT3 및 dCNMO는, 예를 들어 dTPT3TP 및 dCNMOTP를 포함하는 생명-지지 배지에서 성장할 때 유기체의 DNA 복제 기구에 의해 안정하게 증식될 수 있는 안정한 비천연 염기 쌍을 형성할 수 있다.
일부 경우, 세포는 비천연 뉴클레오티드를 함유하는 핵산을 복제할 수 있다. 이러한 방법은 생체내 조건 하에 하나 이상의 비천연 뉴클레오티드를 각각의 트리포스페이트로서 세포 내로 수송할 수 있는 뉴클레오시드 트리포스페이트 수송체를 코딩하는 발현 카세트로 세포를 유전자 형질전환시키는 것을 포함할 수 있다. 대안적으로, 코딩된 뉴클레오시드 트리포스페이트 수송체를 발현할 수 있는 발현 카세트로 이전에 유전자 형질전환된 세포가 사용될 수 있다. 방법은 또한 세포의 성장 및 복제에 적합한 생명-지지 배지에서 유전자 형질전환된 세포를 인산칼륨 및 적어도 하나의 비천연 뉴클레오티드 (예를 들어, 비천연 염기 쌍 (UBP)을 형성할 수 있는 2개의 상호 염기 쌍 형성 뉴클레오티드)의 각각의 트리포스페이트 형태에 접촉시키거나 노출시키는 단계, 및 세포의 적어도 1회의 복제 주기를 통해 생체내 조건 하에 적어도 하나의 비천연 뉴클레오티드 (예를 들어, 비천연 염기 쌍 (UBP)을 형성할 수 있는 2개의 상호 염기 쌍 형성 뉴클레오티드)의 각각의 트리포스페이트 형태의 존재 하에 생명-지지 배지에서 형질전환된 세포를 유지하는 단계를 포함할 수 있다. 방법은 또한 세포의 성장 및 복제에 적합한 생명-지지 배지에서 유전자 형질전환된 세포를 인산칼륨 및 적어도 하나의 비천연 뉴클레오티드의 각각의 트리포스페이트 형태 (예를 들어, 비천연 염기 쌍 (UBP)을 형성하도록 구성된 2개의 상호 염기-쌍형성 뉴클레오티드)에 접촉시키거나 노출시키는 단계, 및 세포의 적어도 1회의 복제 주기를 통해 생체내 조건 하에 적어도 하나의 비천연 뉴클레오티드 (예를 들어, 비천연 염기 쌍 (UBP)을 형성하도록 구성된 2개의 상호 염기-쌍형성 뉴클레오티드)의 각각의 트리포스페이트 형태의 존재 하에 생명-지지 배지에서 형질전환된 세포를 유지하는 단계를 포함할 수 있다.
일부 실시양태에서, 세포는 안정하게 혼입된 비천연 핵산을 포함한다. 일부 실시양태는 A, G, T 및 C 이외의 뉴클레오티드를 세포 내에서 유지되는 핵산 내에 안정하게 혼입시킨 세포 (예를 들어, 이. 콜라이)를 포함한다. 예를 들어, A, G, T 및 C 이외의 뉴클레오티드는 d5SICS, dCNMO, dNaM 및/또는 dTPT3일 수 있고, 이는 세포의 핵산 내로의 혼입 시 핵산 내에서 안정한 비천연 염기 쌍을 형성할 수 있다. 한 측면에서, 트리포스페이트 수송체에 대한 유전자로 형질전환된 유기체가 인산칼륨 및 d5SICS, dNaM, dCNMO 및/또는 dTPT3의 트리포스페이트 형태를 포함하는 생명-지지 배지에서 성장될 때, 비천연 뉴클레오티드 및 비천연 염기 쌍이 유기체의 복제 장치에 의해 안정적으로 증식될 수 있다.
일부 경우, 세포는 확장된 유전자 알파벳을 포함한다. 세포는 안정하게 혼입된 비천연 핵산을 포함할 수 있다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 또 다른 비천연 뉴클레오티드와 쌍형성할 수 있는 비천연 뉴클레오티드를 함유하는 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 또 다른 핵산에 수소 결합된 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 염기 쌍형성된 또 다른 핵산에 수소 결합되지 않은 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 소수성 및/또는 패킹 상호작용을 통해 핵염기 또는 또 다른 비천연 뉴클레오티드와 염기 쌍을 형성하는 핵염기를 갖는 비천연 뉴클레오티드를 함유하는 비천연 핵산을 포함한다. 일부 실시양태에서, 확장된 유전자 알파벳을 갖는 세포는 비-수소 결합 상호작용을 통해 또 다른 핵산과 염기 쌍을 형성하는 비천연 핵산을 포함한다. 확장된 유전자 알파벳을 갖는 세포는 상동성 핵산을 카피하여 비천연 핵산을 포함하는 핵산을 형성할 수 있는 세포일 수 있다. 확장된 유전자 알파벳을 갖는 세포는 또 다른 비천연 핵산과 쌍형성된 비천연 핵산 염기 (비천연 핵산 염기 쌍 (UBP))를 포함하는 세포일 수 있다.
일부 실시양태에서, 세포는 생체내 조건 하에 도입된 비천연 뉴클레오티드로부터 비천연 DNA 염기 쌍 (UBP)을 형성한다. 일부 실시양태에서, 인산칼륨 및/또는 포스파타제 및/또는 뉴클레오티다제 활성의 억제제는 비천연 뉴클레오티드의 수송을 용이하게 할 수 있다. 방법은 이종 뉴클레오시드 트리포스페이트 수송체를 발현하는 세포의 사용을 포함한다. 이러한 세포가 하나 이상의 뉴클레오시드 트리포스페이트와 접촉되는 경우, 뉴클레오시드 트리포스페이트는 세포 내로 수송된다. 세포는 인산칼륨 및/또는 포스파타제 및 뉴클레오티다제의 억제제의 존재 하에 있을 수 있다. 비천연 뉴클레오시드 트리포스페이트는 세포의 천연 기구 (즉, 폴리머라제), 및 예를 들어, 세포의 핵산 내에 비천연 염기 쌍을 형성하는 상호 염기-쌍에 의해 세포 내의 핵산 내로 혼입될 수 있다. 일부 실시양태에서, UBP는 비천연 염기를 보유하는 DNA 및 RNA 뉴클레오티드 사이에 형성된다.
일부 실시양태에서, UBP는 비천연 트리포스페이트에 노출될 때 세포 또는 세포의 집단 내로 혼입될 수 있다. 일부 실시양태에서, UBP는 비천연 트리포스페이트에 실질적으로 일관되게 노출될 때 세포 또는 세포의 집단 내로 혼입될 수 있다.
일부 실시양태에서, 세포에서 이종 유전자, 예를 들어 뉴클레오시드 트리포스페이트 수송체 (NTT)의 발현의 유도는 이종 유전자의 발현의 유도가 없는 세포에서의 하나 이상의 비천연 트리포스페이트의 성장 및 흡수와 비교하여 보다 느린 세포 성장 및 증가된 비천연 트리포스페이트 흡수를 발생시킬 수 있다. 흡수는 예컨대 확산, 삼투를 통한 또는 수송체의 작용을 통한 세포 내로의 뉴클레오티드의 수송을 다양하게 포함한다. 일부 실시양태에서, 세포에서 이종 유전자, 예를 들어 NTT의 발현의 유도는 이종 유전자의 발현의 유도가 없는 세포의 성장 및 흡수와 비교하여 증가된 세포 성장 및 증가된 비천연 핵산 흡수를 유발할 수 있다.
일부 실시양태에서, UBP는 로그 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 비-로그 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 실질적으로 선형 성장기 동안 혼입된다. 일부 실시양태에서, UBP는 일정 기간 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입된다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 50회 또는 그 초과의 복제 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24시간의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31일의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개월의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다. 예를 들어, UBP는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 50년의 성장 동안 성장 후의 세포 또는 세포의 집단 내로 안정하게 혼입될 수 있다.
일부 실시양태에서, 본원에 개시된 반합성 유기체는
Figure pct00193
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 DNA를 포함한다. 일부 실시양태에서, 비천연 염기 중 적어도 1종을 포함하는 반합성 유기체의 DNA는 비천연 염기 쌍 (UBP)을 형성한다. 일부 실시양태에서, 비천연 염기 쌍 (UBP)은 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1 또는 dNaM-dTAT1이다. 일부 실시양태에서, DNA는
Figure pct00194
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00195
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00196
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00197
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00198
으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00199
으로부터 선택되는 적어도 2종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는 2개의 가닥을 포함하며, 제1 가닥은
Figure pct00200
인 적어도 1종의 핵염기를 포함하고, 제2 가닥은
Figure pct00201
인 적어도 1종의 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00202
인 적어도 1종의 비천연 핵염기를 포함한다.
일부 실시양태에서, 세포는 하나 이상의 비천연 뉴클레오티드를 함유하는 mRNA를 생성하기 위해 RNA 폴리머라제를 추가로 이용한다. 일부 실시양태에서, RNA 폴리머라제는 이종 RNA 폴리머라제이다. 일부 경우, 세포는 하나 이상의 비천연 뉴클레오티드를 포함하는 안티코돈을 함유하는 tRNA를 생성시키기 위해 폴리머라제를 추가로 이용한다. 일부 실시양태에서, tRNA는 이종 tRNA이다. 일부 경우, tRNA는 비천연 아미노산으로 충전된다. 일부 경우, tRNA의 비천연 안티코돈은 번역 동안 mRNA의 비천연 코돈과 쌍형성하여 비천연 아미노산을 함유하는 단백질을 합성한다.
일부 실시양태에서, 본원에 개시된 반합성 유기체는 이종 뉴클레오시드 트리포스페이트 수송체를 발현한다. 일부 실시양태에서, 이종 뉴클레오시드 트리포스페이트 수송체는 PtNTT2이다. 일부 실시양태에서, 반합성 유기체는 이종 tRNA 신테타제를 추가로 발현한다. 일부 실시양태에서, 이종 tRNA 신테타제는 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)이다. 일부 실시양태에서, 반합성 유기체는 뉴클레오시드 트리포스페이트 수송체 PtNTT2를 발현하고, tRNA 신테타제 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)를 추가로 발현한다. 일부 실시양태에서, 반합성 유기체는 이종 RNA 폴리머라제를 추가로 발현한다. 일부 실시양태에서, 이종 RNA 폴리머라제는 T7 RNAP이다. 일부 실시양태에서, 반합성 유기체는 DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는다. 일부 실시양태에서, 반합성 유기체는 이. 콜라이이고, 유기체는 RecA를 발현하지 않는다.
일부 실시양태에서, 반합성 유기체는 이종 mRNA를 추가로 포함한다. 일부 실시양태에서, 이종 mRNA는
Figure pct00203
으로부터 선택되는 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 mRNA는
Figure pct00204
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 mRNA는
Figure pct00205
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 mRNA는
Figure pct00206
인 적어도 1종의 비천연 염기를 포함한다.
일부 실시양태에서, 반합성 유기체는 이종 tRNA를 추가로 포함한다. 일부 실시양태에서, 이종 tRNA는
Figure pct00207
으로부터 선택되는 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 tRNA는
Figure pct00208
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 tRNA는
Figure pct00209
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 이종 tRNA는
Figure pct00210
인 적어도 1종의 비천연 염기를 포함한다.
일부 실시양태에서, 본원에 개시된 반합성 유기체는 이종 mRNA 및 이종 tRNA를 추가로 포함한다. 일부 실시양태에서, 반합성 유기체는 (a) 이종 뉴클레오시드 트리포스페이트 수송체, (b) 이종 mRNA, (c) 이종 tRNA, (d) 이종 tRNA 신테타제, 및 (e) 이종 RNA 폴리머라제를 추가로 포함하며, 여기서 유기체는 DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는다. 일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2이고, tRNA 신테타제는 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)이고, RNA 폴리머라제는 T7 RNAP이다. 일부 실시양태에서, 반합성 유기체는 이. 콜라이이고, 유기체는 RecA를 발현하지 않는다. 일부 실시양태에서, 반합성 유기체는 하나 이상의 DNA 폴리머라제를 과다발현한다. 일부 실시양태에서, 유기체는 DNA Pol II를 과다발현한다.
천연 및 비천연 아미노산
본원에 사용된 아미노산 잔기는 아미노 기 및 카르복실 기 둘 다를 함유하는 분자를 지칭할 수 있다. 적합한 아미노산은 비제한적으로, 자연 발생 아미노산의 D- 및 L-이성질체 둘 다, 뿐만 아니라 유기 합성 또는 임의의 다른 방법에 의해 제조된 비-자연 발생 아미노산을 포함한다. 본원에 사용된 용어 아미노산은 비제한적으로, α-아미노산, β-아미노산, 자연 발생 아미노산, 비-정규 아미노산, 비천연 아미노산 및 아미노산 유사체를 포함한다.
용어 "α-아미노산"은 α-탄소로 지정된 탄소에 결합된 아미노 기 및 카르복실 기 둘 다를 함유하는 분자를 지칭할 수 있다. 예를 들어, 하기와 같다:
Figure pct00211
.
용어 "β-아미노산"은 아미노 기 및 카르복실 기 둘 다를 β 배위로 함유하는 분자를 지칭할 수 있다.
"자연 발생 아미노산"은 자연에서 합성된 펩티드에서 통상적으로 발견되고 1문자 약어 A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y 및 V로 공지된 20개의 아미노산 중 어느 하나를 지칭할 수 있다.
하기 표는 자연 발생 아미노산의 특성의 요약을 나타낸다:
Figure pct00212
"소수성 아미노산"은 작은 소수성 아미노산 및 큰 소수성 아미노산을 포함한다. "작은 소수성 아미노산"은 글리신, 알라닌, 프롤린 및 그의 유사체일 수 있다. "큰 소수성 아미노산"은 발린, 류신, 이소류신, 페닐알라닌, 메티오닌, 트립토판, 및 그의 유사체일 수 있다. "극성 아미노산"은 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 티로신 및 그의 유사체일 수 있다. "하전된 아미노산"은 리신, 아르기닌, 히스티딘, 아스파르테이트, 글루타메이트, 및 그의 유사체일 수 있다.
"아미노산 유사체"는 아미노산과 구조적으로 유사하고 펩티드모방체 마크로사이클의 형성에서 아미노산을 치환할 수 있는 분자일 수 있다. 아미노산 유사체는, 비제한적으로, β-아미노산, 및 아미노 또는 카르복시 기가 유사한 반응성 기로 치환된 아미노산 (예를 들어, 1급 아민의 2급 또는 3급 아민으로의 치환, 또는 카르복시 기의 에스테르로의 치환)을 포함한다.
"비-정규 아미노산 (ncAA)" 또는 "비천연 아미노산" 또는 "비천연 아미노산"은 자연에서 합성된 펩티드에서 통상적으로 발견되고 1문자 약어 A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y 및 V로 공지된 20개의 아미노산 중 하나가 아닌 아미노산일 수 있다. 일부 경우에, 비천연 아미노산은 비-정규 아미노산의 하위세트이다.
아미노산 유사체는 β-아미노산 유사체를 포함할 수 있다. β-아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: 시클릭 β-아미노산 유사체; β-알라닌; (R)-β-페닐알라닌; (R)-1,2,3,4-테트라히드로-이소퀴놀린-3-아세트산; (R)-3-아미노-4-(1-나프틸)-부티르산; (R)-3-아미노-4-(2,4-디클로로페닐)부티르산; (R)-3-아미노-4-(2-클로로페닐)-부티르산; (R)-3-아미노-4-(2-시아노페닐)-부티르산; (R)-3-아미노-4-(2-플루오로페닐)-부티르산; (R)-3-아미노-4-(2-푸릴)-부티르산; (R)-3-아미노-4-(2-메틸페닐)-부티르산; (R)-3-아미노-4-(2-나프틸)-부티르산; (R)-3-아미노-4-(2-티에닐)-부티르산; (R)-3-아미노-4-(2-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-(3,4-디클로로페닐)부티르산; (R)-3-아미노-4-(3,4-디플루오로페닐)부티르산; (R)-3-아미노-4-(3-벤조티에닐)-부티르산; (R)-3-아미노-4-(3-클로로페닐)-부티르산; (R)-3-아미노-4-(3-시아노페닐)-부티르산; (R)-3-아미노-4-(3-플루오로페닐)-부티르산; (R)-3-아미노-4-(3-메틸페닐)-부티르산; (R)-3-아미노-4-(3-피리딜)-부티르산; (R)-3-아미노-4-(3-티에닐)-부티르산; (R)-3-아미노-4-(3-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-(4-브로모페닐)-부티르산; (R)-3-아미노-4-(4-클로로페닐)-부티르산; (R)-3-아미노-4-(4-시아노페닐)-부티르산; (R)-3-아미노-4-(4-플루오로페닐)-부티르산; (R)-3-아미노-4-(4-아이오도페닐)-부티르산; (R)-3-아미노-4-(4-메틸페닐)-부티르산; (R)-3-아미노-4-(4-니트로페닐)-부티르산; (R)-3-아미노-4-(4-피리딜)-부티르산; (R)-3-아미노-4-(4-트리플루오로메틸페닐)-부티르산; (R)-3-아미노-4-펜타플루오로-페닐부티르산; (R)-3-아미노-5-헥센산; (R)-3-아미노-5-헥신산; (R)-3-아미노-5-페닐펜탄산; (R)-3-아미노-6-페닐-5-헥센산; (S)-1,2,3,4-테트라히드로-이소퀴놀린-3-아세트산; (S)-3-아미노-4-(1-나프틸)-부티르산; (S)-3-아미노-4-(2,4-디클로로페닐)부티르산; (S)-3-아미노-4-(2-클로로페닐)-부티르산; (S)-3-아미노-4-(2-시아노페닐)-부티르산; (S)-3-아미노-4-(2-플루오로페닐)-부티르산; (S)-3-아미노-4-(2-푸릴)-부티르산; (S)-3-아미노-4-(2-메틸페닐)-부티르산; (S)-3-아미노-4-(2-나프틸)-부티르산; (S)-3-아미노-4-(2-티에닐)-부티르산; (S)-3-아미노-4-(2-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-(3,4-디클로로페닐)부티르산; (S)-3-아미노-4-(3,4-디플루오로페닐)부티르산; (S)-3-아미노-4-(3-벤조티에닐)-부티르산; (S)-3-아미노-4-(3-클로로페닐)-부티르산; (S)-3-아미노-4-(3-시아노페닐)-부티르산; (S)-3-아미노-4-(3-플루오로페닐)-부티르산; (S)-3-아미노-4-(3-메틸페닐)-부티르산; (S)-3-아미노-4-(3-피리딜)-부티르산; (S)-3-아미노-4-(3-티에닐)-부티르산; (S)-3-아미노-4-(3-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-(4-브로모페닐)-부티르산; (S)-3-아미노-4-(4-클로로페닐)부티르산; (S)-3-아미노-4-(4-시아노페닐)-부티르산; (S)-3-아미노-4-(4-플루오로페닐)부티르산; (S)-3-아미노-4-(4-아이오도페닐)-부티르산; (S)-3-아미노-4-(4-메틸페닐)-부티르산; (S)-3-아미노-4-(4-니트로페닐)-부티르산; (S)-3-아미노-4-(4-피리딜)-부티르산; (S)-3-아미노-4-(4-트리플루오로메틸페닐)-부티르산; (S)-3-아미노-4-펜타플루오로-페닐부티르산; (S)-3-아미노-5-헥센산; (S)-3-아미노-5-헥신산; (S)-3-아미노-5-페닐펜탄산; (S)-3-아미노-6-페닐-5-헥센산; 1,2,5,6-테트라히드로피리딘-3-카르복실산; 1,2,5,6-테트라히드로피리딘-4-카르복실산; 3-아미노-3-(2-클로로페닐)-프로피온산; 3-아미노-3-(2-티에닐)-프로피온산; 3-아미노-3-(3-브로모페닐)-프로피온산; 3-아미노-3-(4-클로로페닐)-프로피온산; 3-아미노-3-(4-메톡시페닐)-프로피온산; 3-아미노-4,4,4-트리플루오로-부티르산; 3-아미노아디프산; D-β-페닐알라닌; β-류신; L-β-호모알라닌; L-β-호모아스파르트산 γ-벤질 에스테르; L-β-호모글루탐산 δ-벤질 에스테르; L-β-호모이소류신; L-β-호모류신; L-β-호모메티오닌; L-β-호모페닐알라닌; L-β-호모프롤린; L-β-호모트립토판; L-β-호모발린; L-Nω-벤질옥시카르보닐-β-호모리신; Nω-L-β-호모아르기닌; O-벤질-L-β-호모히드록시프롤린; O-벤질-L-β-호모세린; O-벤질-L-β-호모트레오닌; O-벤질-L-β-호모티로신; γ-트리틸-L-β-호모아스파라긴; (R)-β-페닐알라닌; L-β-호모아스파르트산 γ-t-부틸 에스테르; L-β-호모글루탐산δ-t-부틸 에스테르; L-Nω-β-호모리신; Nδ-트리틸-L-β-호모글루타민; Nω-2,2,4,6,7-펜타메틸-디히드로벤조푸란-5-술포닐-L-β-호모아르기닌; O-t-부틸-L-β-호모히드록시-프롤린; O-t-부틸-L-β-호모세린; O-t-부틸-L-β-호모트레오닌; O-t-부틸-L-β-호모티로신; 2-아미노시클로펜탄 카르복실산; 및 2-아미노시클로헥산 카르복실산.
아미노산 유사체는 알라닌, 발린, 글리신 또는 류신의 유사체를 포함할 수 있다. 알라닌, 발린, 글리신 및 류신의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메톡시글리신; α-알릴-L-알라닌; α-아미노이소부티르산; α-메틸-류신; β-(1-나프틸)-D-알라닌; β-(1-나프틸)-L-알라닌; β-(2-나프틸)-D-알라닌; β-(2-나프틸)-L-알라닌; β-(2-피리딜)-D-알라닌; β-(2-피리딜)-L-알라닌; β-(2-티에닐)-D-알라닌; β-(2-티에닐)-L-알라닌; β-(3-벤조티에닐)-D-알라닌; β-(3-벤조티에닐)-L-알라닌; β-(3-피리딜)-D-알라닌; β-(3-피리딜)-L-알라닌; β-(4-피리딜)-D-알라닌; β-(4-피리딜)-L-알라닌; β-클로로-L-알라닌; β-시아노-L-알라닌; β-시클로헥실-D-알라닌; β-시클로헥실-L-알라닌; β-시클로펜텐-1-일-알라닌; β-시클로펜틸-알라닌; β-시클로프로필-L-Ala-OH.디시클로헥실암모늄 염; β-t-부틸-D-알라닌; β-t-부틸-L-알라닌; γ-아미노부티르산; L-α,β-디아미노프로피온산; 2,4-디니트로-페닐글리신; 2,5-디히드로-D-페닐글리신; 2-아미노-4,4,4-트리플루오로부티르산; 2-플루오로-페닐글리신; 3-아미노-4,4,4-트리플루오로-부티르산; 3-플루오로-발린; 4,4,4-트리플루오로-발린; 4,5-데히드로-L-leu-OH.디시클로헥실암모늄 염; 4-플루오로-D-페닐글리신; 4-플루오로-L-페닐글리신; 4-히드록시-D-페닐글리신; 5,5,5-트리플루오로-류신; 6-아미노헥산산; 시클로펜틸-D-Gly-OH.디시클로헥실암모늄 염; 시클로펜틸-Gly-OH.디시클로헥실암모늄 염; D-α,β-디아미노프로피온산; D-α-아미노부티르산; D-α-t-부틸글리신; D-(2-티에닐)글리신; D-(3-티에닐)글리신; D-2-아미노카프로산; D-2-인다닐글리신; D-알릴글리신-디시클로헥실암모늄 염; D-시클로헥실글리신; D-노르발린; D-페닐글리신; β-아미노부티르산; β-아미노이소부티르산; (2-브로모페닐)글리신; (2-메톡시페닐)글리신; (2-메틸페닐)글리신; (2-티아졸릴)글리신; (2-티에닐)글리신; 2-아미노-3-(디메틸아미노)-프로피온산; L-α,β-디아미노프로피온산; L-α-아미노부티르산; L-α-t-부틸글리신; L-(3-티에닐)글리신; L-2-아미노-3-(디메틸아미노)-프로피온산; L-2-아미노카프로산 디시클로헥실-암모늄 염; L-2-인다닐글리신; L-알릴글리신 디시클로헥실 암모늄 염; L-시클로헥실글리신; L-페닐글리신; L-프로파르길글리신; L-노르발린; N-α-아미노메틸-L-알라닌; D-α,γ-디아미노부티르산; L-α,γ-디아미노부티르산; β-시클로프로필-L-알라닌; (N-β-(2,4-디니트로페닐))-L-α,β-디아미노프로피온산; (N-β-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-D-α,β-디아미노프로피온산; (N-β-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-L-α,β-디아미노프로피온산; (N-β-4-메틸트리틸)-L-α,β-디아미노프로피온산; (N-β-알릴옥시카르보닐)-L-α,β-디아미노프로피온산; (N-γ-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-D-α,γ-디아미노부티르산; (N-γ-1-(4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴)에틸)-L-α,γ-디아미노부티르산; (N-γ-4-메틸트리틸)-D-α,γ-디아미노부티르산; (N-γ-4-메틸트리틸)-L-α,γ-디아미노부티르산; (N-γ-알릴옥시카르보닐)-L-α,γ-디아미노부티르산; D-α,γ-디아미노부티르산; 4,5-데히드로-L-류신; 시클로펜틸-D-Gly-OH; 시클로펜틸-Gly-OH; D-알릴글리신; D-호모시클로헥실알라닌; L-1-피레닐알라닌; L-2-아미노카프로산; L-알릴글리신; L-호모시클로헥실알라닌; 및 N-(2-히드록시-4-메톡시-Bzl)-Gly-OH.
아미노산 유사체는 아르기닌 또는 리신의 유사체를 포함할 수 있다. 아르기닌 및 리신의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: 시트룰린; L-2-아미노-3-구아니디노프로피온산; L-2-아미노-3-우레이도프로피온산; L-시트룰린; Lys(Me)2-OH; Lys(N3)-OH; Nδ-벤질옥시카르보닐-L-오르니틴; Nω-니트로-D-아르기닌; Nω-니트로-L-아르기닌; α-메틸-오르니틴; 2,6-디아미노헵탄디오산; L-오르니틴; (Nδ-1-(4,4-디메틸-2,6-디옥소-시클로헥스-1-일리덴)에틸)-D-오르니틴; (Nδ-1-(4,4-디메틸-2,6-디옥소-시클로헥스-1-일리덴)에틸)-L-오르니틴; (Nδ-4-메틸트리틸)-D-오르니틴; (Nδ-4-메틸트리틸)-L-오르니틴; D-오르니틴; L-오르니틴; Arg(Me)(Pbf)-OH; Arg(Me)2-OH (비대칭); Arg(Me)2-OH (대칭); Lys(ivDde)-OH; Lys(Me)2-OH.HCl; Lys(Me3)-OH 클로라이드; Nω-니트로-D-아르기닌; 및 Nω-니트로-L-아르기닌.
아미노산 유사체는 아스파르트산 또는 글루탐산의 유사체를 포함할 수 있다. 아스파르트산 및 글루탐산의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메틸-D-아스파르트산; α-메틸-글루탐산; α-메틸-L-아스파르트산; γ-메틸렌-글루탐산; (N-γ-에틸)-L-글루타민; [N-α-(4-아미노벤조일)]-L-글루탐산; 2,6-디아미노피멜산; L-α-아미노수베르산; D-2-아미노아디프산; D-α-아미노수베르산; α-아미노피멜산; 이미노디아세트산; L-2-아미노아디프산; 트레오-β-메틸-아스파르트산; γ-카르복시-D-글루탐산γ,γ-디-t-부틸 에스테르; γ-카르복시-L-글루탐산 γ,γ-디-t-부틸 에스테르; Glu(OAll)-OH; L-Asu(OtBu)-OH; 및 피로글루탐산.
아미노산 유사체는 시스테인 및 메티오닌의 유사체를 포함할 수 있다. 시스테인 및 메티오닌의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: Cys(파르네실)-OH, Cys(파르네실)-OMe, α-메틸-메티오닌, Cys(2-히드록시에틸)-OH, Cys(3-아미노프로필)-OH, 2-아미노-4-(에틸티오)부티르산, 부티오닌, 부티오닌술폭시민, 에티오닌, 메티오닌 메틸술포늄 클로라이드, 셀레노메티오닌, 시스테인산, [2-(4-피리딜)에틸]-DL-페니실라민, [2-(4-피리딜)에틸]-L-시스테인, 4-메톡시벤질-D-페니실라민, 4-메톡시벤질-L-페니실라민, 4-메틸벤질-D-페니실라민, 4-메틸벤질-L-페니실라민, 벤질-D-시스테인, 벤질-L-시스테인, 벤질-DL-호모시스테인, 카르바모일-L-시스테인, 카르복시에틸-L-시스테인, 카르복시메틸-L-시스테인, 디페닐메틸-L-시스테인, 에틸-L-시스테인, 메틸-L-시스테인, t-부틸-D-시스테인, 트리틸-L-호모시스테인, 트리틸-D-페니실라민, 시스타티오닌, 호모시스틴, L-호모시스틴, (2-아미노에틸)-L-시스테인, 셀레노-L-시스틴, 시스타티오닌, Cys(StBu)-OH, 및 아세트아미도메틸-D-페니실라민.
아미노산 유사체는 페닐알라닌 및 티로신의 유사체를 포함할 수 있다. 페닐알라닌 및 티로신의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: β-메틸-페닐알라닌, β-히드록시페닐알라닌, α-메틸-3-메톡시-DL-페닐알라닌, α-메틸-D-페닐알라닌, α-메틸-L-페닐알라닌, 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산, 2,4-디클로로-페닐알라닌, 2-(트리플루오로메틸)-D-페닐알라닌, 2-(트리플루오로메틸)-L-페닐알라닌, 2-브로모-D-페닐알라닌, 2-브로모-L-페닐알라닌, 2-클로로-D-페닐알라닌, 2-클로로-L-페닐알라닌, 2-시아노-D-페닐알라닌, 2-시아노-L-페닐알라닌, 2-플루오로-D-페닐알라닌, 2-플루오로-L-페닐알라닌, 2-메틸-D-페닐알라닌, 2-메틸-L-페닐알라닌, 2-니트로-D-페닐알라닌, 2-니트로-L-페닐알라닌, 2,4,5-트리히드록시-페닐알라닌, 3,4,5-트리플루오로-D-페닐알라닌, 3,4,5-트리플루오로-L-페닐알라닌, 3,4-디클로로-D-페닐알라닌, 3,4-디클로로-L-페닐알라닌, 3,4-디플루오로-D-페닐알라닌, 3,4-디플루오로-L-페닐알라닌, 3,4-디히드록시-L-페닐알라닌, 3,4-디메톡시-L-페닐알라닌, 3,5,3'-트리아이오도-L-티로닌, 3,5-디아이오도-D-티로신, 3,5-디아이오도-L-티로신, 3,5-디아이오도-L-티로닌, 3-(트리플루오로메틸)-D-페닐알라닌, 3-(트리플루오로메틸)-L-페닐알라닌, 3-아미노-L-티로신, 3-브로모-D-페닐알라닌, 3-브로모-L-페닐알라닌, 3-클로로-D-페닐알라닌, 3-클로로-L-페닐알라닌, 3-클로로-L-티로신, 3-시아노-D-페닐알라닌, 3-시아노-L-페닐알라닌, 3-플루오로-D-페닐알라닌, 3-플루오로-L-페닐알라닌, 3-플루오로-티로신, 3-아이오도-D-페닐알라닌, 3-아이오도-L-페닐알라닌, 3-아이오도-L-티로신, 3-메톡시-L-티로신, 3-메틸-D-페닐알라닌, 3-메틸-L-페닐알라닌, 3-니트로-D-페닐알라닌, 3-니트로-L-페닐알라닌, 3-니트로-L-티로신, 4-(트리플루오로메틸)-D-페닐알라닌, 4-(트리플루오로메틸)-L-페닐알라닌, 4-아미노-D-페닐알라닌, 4-아미노-L-페닐알라닌, 4-벤조일-D-페닐알라닌, 4-벤조일-L-페닐알라닌, 4-비스(2-클로로에틸)아미노-L-페닐알라닌, 4-브로모-D-페닐알라닌, 4-브로모-L-페닐알라닌, 4-클로로-D-페닐알라닌, 4-클로로-L-페닐알라닌, 4-시아노-D-페닐알라닌, 4-시아노-L-페닐알라닌, 4-플루오로-D-페닐알라닌, 4-플루오로-L-페닐알라닌, 4-아이오도-D-페닐알라닌, 4-아이오도-L-페닐알라닌, 호모페닐알라닌, 티록신, 3,3-디페닐알라닌, 티로닌, 에틸-티로신 및 메틸-티로신.
아미노산 유사체는 프롤린의 유사체를 포함할 수 있다. 프롤린의 아미노산 유사체의 예는 3,4-데히드로-프롤린, 4-플루오로-프롤린, 시스-4-히드록시-프롤린, 티아졸리딘-2-카르복실산 및 트랜스-4-플루오로-프롤린을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 세린 및 트레오닌의 유사체를 포함할 수 있다. 세린 및 트레오닌의 아미노산 유사체의 예는 3-아미노-2-히드록시-5-메틸헥산산, 2-아미노-3-히드록시-4-메틸펜탄산, 2-아미노-3-에톡시부탄산, 2-아미노-3-메톡시부탄산, 4-아미노-3-히드록시-6-메틸헵탄산, 2-아미노-3-벤질옥시프로피온산, 2-아미노-3-벤질옥시프로피온산, 2-아미노-3-에톡시프로피온산, 4-아미노-3-히드록시부탄산 및 α-메틸세린을 포함하나 이에 제한되지는 않는다.
아미노산 유사체는 트립토판의 유사체를 포함할 수 있다. 트립토판의 아미노산 유사체의 예는 하기를 포함하나 이에 제한되지는 않는다: α-메틸-트립토판; β-(3-벤조티에닐)-D-알라닌; β-(3-벤조티에닐)-L-알라닌; 1-메틸-트립토판; 4-메틸-트립토판; 5-벤질옥시-트립토판; 5-브로모-트립토판; 5-클로로-트립토판; 5-플루오로-트립토판; 5-히드록시-트립토판; 5-히드록시-L-트립토판; 5-메톡시-트립토판; 5-메톡시-L-트립토판; 5-메틸-트립토판; 6-브로모-트립토판; 6-클로로-D-트립토판; 6-클로로-트립토판; 6-플루오로-트립토판; 6-메틸-트립토판; 7-벤질옥시-트립토판; 7-브로모-트립토판; 7-메틸-트립토판; D-1,2,3,4-테트라히드로-노르하르만-3-카르복실산; 6-메톡시-1,2,3,4-테트라히드로노르하르만-1-카르복실산; 7-아자트립토판; L-1,2,3,4-테트라히드로-노르하르만-3-카르복실산; 5-메톡시-2-메틸-트립토판; 및 6-클로로-L-트립토판.
아미노산 유사체는 라세미체일 수 있다. 일부 경우에, 아미노산 유사체의 D 이성질체가 사용된다. 일부 경우에, 아미노산 유사체의 L 이성질체가 사용된다. 일부 경우에, 아미노산 유사체는 R 또는 S 배위인 키랄 중심을 포함한다. 때때로, β-아미노산 유사체의 아미노 기(들)는 보호기, 예를 들어 tert-부틸옥시카르보닐 (BOC 기), 9-플루오레닐메틸옥시카르보닐 (FMOC), 토실 등으로 치환된다. 때때로, β-아미노산 유사체의 카르복실산 관능기는 예를 들어 그의 에스테르 유도체로서 보호된다. 일부 경우에, 아미노산 유사체의 염이 사용된다.
일부 실시양태에서, 비천연 아미노산은 문헌 [Liu C.C., Schultz, P.G. Annu. Rev. Biochem. 2010, 79, 413]에 기재된 비천연 아미노산이고, 그의 개시내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, 비천연 아미노산은 N6(2-아지도에톡시)-카르보닐-L-리신을 포함한다.
일부 실시양태에서, 본원에 기재된 아미노산 잔기 (예를 들어, 단백질 내)는 접합 모이어티에 결합하기 전에 비천연 아미노산으로 돌연변이된다. 일부 경우에, 비천연 아미노산으로의 돌연변이는 면역계의 자기-항원 반응을 방지하거나 또는 최소화한다. 본원에 사용된 용어 "비천연 아미노산"은 단백질에서 자연적으로 발생하는 20개의 아미노산 이외의 아미노산을 지칭한다. 비천연 아미노산의 비제한적 예는 p-아세틸-L-페닐알라닌, p-아이오도-L-페닐알라닌, p-메톡시페닐알라닌, O-메틸-L-티로신, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcp-세린, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-보로노페닐알라닌, O-프로파르길티로신, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, 셀레노시스테인, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 아지도-리신 (N6-아지도에톡시-카르보닐-L-리신, AzK), 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 히드록실아민, 케토 또는 아미노 치환된 아미노산 또는 그의 조합; 광활성화가능한 가교-링커를 갖는 아미노산; 스핀-표지된 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 광케이징된 및/또는 광이성질체화가능한 아미노산; 비오틴 또는 비오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중원자 치환된 아미노산; 화학적으로 절단가능한 또는 광절단가능한 아미노산; 신장된 측쇄를 갖는 아미노산; 독성 기를 함유하는 아미노산; 당 치환된 아미노산; 탄소-연결된 당-함유 아미노산; 산화환원-활성 아미노산; a-히드록시 함유 산; 아미노 티오산; α, α 이치환된 아미노산; β-아미노산; 프롤린 또는 히스티딘 이외의 시클릭 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산을 포함한다.
일부 실시양태에서, 비천연 아미노산은 선택적 반응성 기, 또는 표적 단백질 또는 폴리펩티드의 부위-선택적 표지를 위한 반응성 기를 포함한다. 일부 경우에, 화학은 생물직교 반응 (예를 들어, 생체적합성 및 선택적 반응)이다. 일부 경우에, 화학은 Cu(I)-촉매된 또는 "구리-무함유" 알킨-아지드 트리아졸-형성 반응, 슈타우딩거(Staudinger) 라이게이션, 역-전자-요구 딜스-알더(Diels-Alder) (IEDDA) 반응, "광-클릭" 화학, 또는 금속-매개 공정, 예컨대 올레핀 복분해 및 스즈키-미야우라(Suzuki-Miyaura) 또는 소노가시라(Sonogashira) 교차-커플링이다. 일부 실시양태에서, 비천연 아미노산은 예를 들어 UV 조사시 가교되는 광반응성 기를 포함한다. 일부 실시양태에서, 비천연 아미노산은 광-케이징된 아미노산을 포함한다. 일부 경우에, 비천연 아미노산은 파라-치환된, 메타-치환된, 또는 오르토-치환된 아미노산 유도체이다.
일부 경우에, 비천연 아미노산은 p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, O-메틸-L-티로신, p-메톡시페닐알라닌, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcp-세린, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 또는 이소프로필-L-페닐알라닌을 포함한다.
일부 경우에, 비천연 아미노산은 3-아미노티로신, 3-니트로티로신, 3,4-디히드록시-페닐알라닌, 또는 3-아이오도티로신이다. 일부 경우에, 비천연 아미노산은 페닐셀레노시스테인이다. 일부 경우에, 비천연 아미노산은 벤조페논, 케톤, 아이오다이드, 메톡시, 아세틸, 벤조일, 또는 아지드 함유 페닐알라닌 유도체이다. 일부 경우에, 비천연 아미노산은 벤조페논, 케톤, 아이오다이드, 메톡시, 아세틸, 벤조일, 또는 아지드 함유 리신 유도체이다. 일부 경우에, 비천연 아미노산은 방향족 측쇄를 포함한다. 일부 경우에, 비천연 아미노산은 방향족 측쇄를 포함하지 않는다. 일부 경우에, 비천연 아미노산은 아지도 기를 포함한다. 일부 경우에, 비천연 아미노산은 마이클-수용자 기를 포함한다. 일부 경우에, 마이클-수용자 기는 1,2-부가 반응을 통하여 공유 결합을 형성할 수 있는 불포화 잔기를 포함한다. 일부 경우에, 마이클-수용자 기는 전자-결핍 알켄 또는 알킨을 포함한다. 일부 경우에, 마이클-수용자 기는 알파, 베타 불포화: 케톤, 알데히드, 술폭시드, 술폰, 니트릴, 이민 또는 방향족을 포함하나 이에 제한되지는 않는다. 일부 경우에, 비천연 아미노산은 데히드로알라닌이다. 일부 경우에, 비천연 아미노산은 알데히드 또는 케톤 기를 포함한다. 일부 경우에, 비천연 아미노산은 알데히드 또는 케톤 기를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 베타, 감마 또는 델타 위치에 1개 이상의 O, N, Se 또는 S 원자를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 감마 위치에 O, N, Se 또는 S 원자를 포함하는 리신 유도체이다. 일부 경우에, 비천연 아미노산은 엡실론 N 원자가 산소 원자로 대체된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 자연 발생 번역후 변형된 리신이 아닌 리신 유도체이다.
일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제6 원자는 카르보닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제6 원자는 카르보닐 기를 포함하고, 알파 위치로부터의 제5 원자는 질소이다. 일부 경우에, 비천연 아미노산은 측쇄를 포함하는 아미노산이며, 여기서 알파 위치로부터의 제7 원자는 산소 원자이다.
일부 경우에, 비천연 아미노산은 셀레늄을 포함하는 세린 유도체이다. 일부 경우에, 비천연 아미노산은 셀레노세린 (2-아미노-3-히드로셀레노프로판산)이다. 일부 경우에, 비천연 아미노산은 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산이다. 일부 경우에, 비천연 아미노산은 2-아미노-3-(페닐셀라닐)프로판산이다. 일부 경우에, 비천연 아미노산은 셀레늄을 포함하며, 여기서 셀레늄의 산화는 알켄을 포함하는 비천연 아미노산의 형성을 유발한다.
일부 경우에, 비천연 아미노산은 시클로옥티닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 트랜스시클로옥테닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 노르보르네닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 시클로프로페닐 기를 포함한다. 일부 경우에, 비천연 아미노산은 디아지린 기를 포함한다. 일부 경우에, 비천연 아미노산은 테트라진 기를 포함한다.
일부 경우에, 비천연 아미노산은 측쇄 질소가 카르바밀화된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 측쇄 질소가 아실화된 리신 유도체이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(tert-부톡시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(tert-부톡시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-Boc-N6-메틸리신이다. 일부 경우에, 비천연 아미노산은 N6-아세틸리신이다. 일부 경우에, 비천연 아미노산은 피롤리신이다. 일부 경우에, 비천연 아미노산은 N6-트리플루오로아세틸리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(p-아이오도벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(p-니트로벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-프롤릴리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(시클로펜틸옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(시클로펜탄카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(테트라히드로푸란-2-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(3-에티닐테트라히드로푸란-2-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((프로프-2-인-1-일옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-아지도시클로펜틸옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-((2-아지도에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-니트로벤질옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-{[(2-시클로옥티닐옥시)카르보닐]아미노}헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(2-아미노부트-3-이노일)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-6-((2-아미노부트-3-이노일)옥시)헥산산이다. 일부 경우에, 비천연 아미노산은 N6-(알릴옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(부테닐-4-옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(펜테닐-5-옥시카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((부트-3-인-1-일옥시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-((펜트-4-인-1-일옥시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-(티아졸리딘-4-카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 2-아미노-8-옥소노난산이다. 일부 경우에, 비천연 아미노산은 2-아미노-8-옥소옥탄산이다. 일부 경우에, 비천연 아미노산은 N6-(2-옥소아세틸)리신이다.
일부 경우에, 비천연 아미노산은 N6-프로피오닐리신이다. 일부 경우에, 비천연 아미노산은 N6-부티릴리신이다. 일부 경우에, 비천연 아미노산은 N6-(부트-2-에노일)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[2.2.1]헵트-5-엔-2-일옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((스피로[2.3]헥스-1-엔-5-일메톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-(((4-(1-(트리플루오로메틸)시클로프로프-2-엔-1-일)벤질)옥시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[2.2.1]헵트-5-엔-2-일메톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 시스테이닐리신이다. 일부 경우에, 비천연 아미노산은 N6-((1-(6-니트로벤조[d][1,3]디옥솔-5-일)에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((2-(3-메틸-3H-디아지린-3-일)에톡시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((3-(3-메틸-3H-디아지린-3-일)프로폭시)카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((메타 니트로벤질옥시)N6-메틸카르보닐)리신이다. 일부 경우에, 비천연 아미노산은 N6-((비시클로[6.1.0]논-4-인-9-일메톡시)카르보닐)-리신이다. 일부 경우에, 비천연 아미노산은 N6-((시클로헵트-3-엔-1-일옥시)카르보닐)-L-리신이다.
일부 경우에, 비천연 아미노산은 2-아미노-3-(((벤질옥시)카르보닐)아미노)메틸)셀라닐)프로판산이다. 일부 실시양태에서, 비천연 아미노산은 재목적화 앰버, 오팔 또는 오커 정지 코돈에 의해 단백질 내로 혼입된다. 일부 실시양태에서, 비천연 아미노산은 4-염기 코돈에 의해 단백질 내로 혼입된다. 일부 실시양태에서, 비천연 아미노산은 재목적화 희귀 센스 코돈에 의해 단백질 내로 혼입된다.
일부 실시양태에서, 비천연 아미노산은 비천연 뉴클레오티드를 포함하는 비천연 코돈에 의해 단백질 내로 혼입된다.
일부 실시양태에서, 단백질은 적어도 2개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 적어도 3개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 적어도 2개의 상이한 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 적어도 3개의 상이한 비천연 아미노산을 포함한다. 적어도 1개의 비천연 아미노산은 리신 유사체이거나; 방향족 측쇄를 포함하거나; 아지도 기를 포함하거나; 알킨 기를 포함하거나; 또는 알데히드 또는 케톤 기를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 방향족 측쇄를 포함하지 않는다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK) 또는 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함한다.
일부 경우에, 단백질 내로의 비천연 아미노산의 혼입은 직교, 변형된 신테타제/tRNA 쌍에 의해 매개된다. 이러한 직교 쌍은 종종 a) 다른 내인성 아미노산 또는 대안적 비천연 아미노산의 비천연 tRNA 상으로의 및 b) 임의의 다른 (내인성 포함) tRNA의 충전을 최소화하면서, 비천연 tRNA를 특이적 비천연 아미노산으로 충전시킬 수 있는 천연 또는 돌연변이된 신테타제를 포함한다. 이러한 직교 쌍은 내인성 신테타제에 의해 다른 내인성 아미노산으로 충전되는 것을 피하면서 신테타제에 의해 충전될 수 있는 tRNA를 포함한다. 일부 실시양태에서, 이러한 쌍은 다양한 유기체, 예컨대 박테리아, 효모, 고세균 또는 인간 공급원으로부터 확인된다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 단일 유기체로부터의 성분을 포함한다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 2개의 상이한 유기체로부터의 성분을 포함한다. 일부 실시양태에서, 직교 신테타제/tRNA 쌍은 변형 전에 상이한 아미노산의 번역을 촉진하는 성분을 포함한다. 일부 실시양태에서, 직교 신테타제는 변형된 알라닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아르기닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아스파라긴 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 아스파르트산 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 시스테인 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 글루타민 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 글루탐산 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 알라닌 글리신이다. 일부 실시양태에서, 직교 신테타제는 변형된 히스티딘 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 류신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 이소류신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 리신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 메티오닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 페닐알라닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 프롤린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 세린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 트레오닌 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 트립토판 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 티로신 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 발린 신테타제이다. 일부 실시양태에서, 직교 신테타제는 변형된 포스포세린 신테타제이다. 일부 실시양태에서, 직교 tRNA는 변형된 알라닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아르기닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아스파라긴 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 아스파르트산 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 시스테인 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 글루타민 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 글루탐산 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 알라닌 글리신이다. 일부 실시양태에서, 직교 tRNA는 변형된 히스티딘 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 류신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 이소류신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 리신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 메티오닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 페닐알라닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 프롤린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 세린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 트레오닌 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 트립토판 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 티로신 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 발린 tRNA이다. 일부 실시양태에서, 직교 tRNA는 변형된 포스포세린 tRNA이다. 임의의 이들 실시양태에서, tRNA는 이종 tRNA일 수 있다.
일부 실시양태에서, 비천연 아미노산은 아미노아실 (aaRS 또는 RS)-tRNA 신테타제-tRNA 쌍에 의해 단백질 내로 혼입된다. 예시적인 aaRS-tRNA 쌍은 메타노코쿠스 잔나쉬이 (Mj-Tyr) aaRS/tRNA 쌍, 이. 콜라이 TyrRS (Ec-Tyr)/비. 스테아로써모필루스(B. stearothermophilus) tRNACUA 쌍, 이. 콜라이 LeuRS (Ec-Leu)/비. 스테아로써모필루스 tRNACUA 쌍, 및 피롤리실-tRNA 쌍을 포함하나 이에 제한되지는 않는다. 일부 경우에, 비천연 아미노산은 Mj-TyrRS/tRNA 쌍에 의해 단백질 내로 혼입된다. Mj-TyrRS/tRNA 쌍에 의해 혼입될 수 있는 예시적인 비천연 아미노산 (UAA)은 파라-치환된 페닐알라닌 유도체, 예컨대 p-아미노페닐알라닌 및 p-메톡시페닐알라닌; 메타-치환된 티로신 유도체, 예컨대 3-아미노티로신, 3-니트로티로신, 3,4-디히드록시페닐알라닌 및 3-아이오도티로신; 페닐셀레노시스테인; p-보로노페닐알라닌; 및 o-니트로벤질티로신을 포함하나 이에 제한되지는 않는다.
일부 경우에, 비천연 아미노산은 Ec-Tyr/tRNACUA 또는 Ec-Leu/tRNACUA 쌍에 의해 단백질 내로 혼입된다. Ec-Tyr/tRNACUA 또는 Ec-Leu/tRNACUA 쌍에 의해 혼입될 수 있는 예시적인 UAA는 벤조페논, 케톤, 아이오다이드 또는 아지드 치환기를 함유하는 페닐알라닌 유도체; O-프로파르길티로신; α-아미노카프릴산, O-메틸 티로신, O-니트로벤질 시스테인; 및 3-(나프탈렌-2-일아미노)-2-아미노-프로판산을 포함하나 이에 제한되지는 않는다.
일부 경우에, 비천연 아미노산은 피롤리실-tRNA 쌍에 의해 단백질 내로 혼입된다. 일부 경우에, PylRS는 고세균 종, 예를 들어 메탄생성 고세균으로부터 수득된다. 일부 경우에, PylRS는 메타노사르시나 바르케리, 메타노사르시나 마제이, 또는 메타노사르시나 아세티보란스(Methanosarcina acetivorans)로부터 수득된다. 피롤리실-tRNA 쌍에 의해 혼입될 수 있는 예시적인 UAA는 아미드 및 카르바메이트 치환된 리신, 예컨대 2-아미노-6-((R)-테트라히드로푸란-2-카르복스아미도)헥산산, N-ε-D-프롤릴-L-리신, 및 N-ε-시클로펜틸옥시카르보닐-L-리신; N-ε-아크릴로일-L-리신; N-ε-[(1-(6-니트로벤조[d][1,3]디옥솔-5-일)에톡시)카르보닐]-L-리신; 및 N-ε-(1-메틸시클로프로프-2-엔카르복스아미도)리신을 포함하나 이에 제한되지는 않는다.
일부 경우에, 비천연 아미노산은 US 9,988,619 및 US 9,938,516 (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)에 개시된 신테타제에 의해 본원에 기재된 단백질 내로 혼입된다. 이러한 신테타제에 의해 혼입될 수 있는 예시적인 UAA는 파라-메틸아지도-L-페닐알라닌, 아르알킬, 헤테로시클릴, 헤테로아르알킬 비천연 아미노산 등을 포함한다. 일부 실시양태에서, 이러한 UAA는 피리딜, 피라지닐, 피라졸릴, 트리아졸릴, 옥사졸릴, 티아졸릴, 티오페닐 또는 다른 헤테로사이클을 포함한다. 이러한 아미노산은 일부 실시양태에서 아지드, 테트라진, 또는 커플링 파트너, 예컨대 수용성 모이어티에 접합될 수 있는 다른 화학적 기를 포함한다. 일부 실시양태에서, 이러한 신테타제는 발현되어 생체내에서 UAA를 단백질 내로 혼입시키는데 사용된다. 일부 실시양태에서, 이러한 신테타제는 무세포 번역 시스템을 사용하여 UAA를 단백질 내로 혼입시키는데 사용된다.
일부 경우에, 비천연 아미노산은 자연 발생 신테타제에 의해 본원에 기재된 단백질 내로 혼입된다. 일부 실시양태에서, 비천연 아미노산은 1개 이상의 아미노산에 대해 영양요구성인 유기체에 의해 단백질 내로 혼입된다. 일부 실시양태에서, 영양요구성 아미노산에 상응하는 신테타제는 상응하는 tRNA를 비천연 아미노산으로 충전시킬 수 있다. 일부 실시양태에서, 비천연 아미노산은 셀레노시스테인 또는 그의 유도체이다. 일부 실시양태에서, 비천연 아미노산은 셀레노메티오닌 또는 그의 유도체이다. 일부 실시양태에서, 비천연 아미노산은 방향족 아미노산이고, 여기서 방향족 아미노산은 아릴 할라이드, 예컨대 아이오다이드를 포함한다. 실시양태에서, 비천연 아미노산은 영양요구성 아미노산과 구조적으로 유사하다.
일부 경우에, 비천연 아미노산은 도 8a에 예시된 비천연 아미노산을 포함한다.
일부 경우에, 비천연 아미노산은 리신 또는 페닐알라닌 유도체 또는 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 리신 유도체 또는 리신 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 피롤리신 (Pyl)을 포함한다. 일부 경우에, 비천연 아미노산은 페닐알라닌 유도체 또는 페닐알라닌 유사체를 포함한다. 일부 경우에, 비천연 아미노산은 문헌 [Wan, et al., "Pyrrolysyl-tRNA synthetase: an ordinary enzyme but an outstanding genetic code expansion tool," Biocheim Biophys Aceta 1844(6): 1059-4070 (2014)]에 기재된 비천연 아미노산이다. 일부 경우에, 비천연 아미노산은 도 8b 및 도 8c에 예시된 비천연 아미노산을 포함한다.
일부 실시양태에서, 비천연 아미노산은 도 8d - 도 8g에 예시된 비천연 아미노산을 포함한다 (문헌 [Dumas et al., Chemical Science 2015, 6, 50-69]의 표 1로부터 채택됨).
일부 실시양태에서, 본원에 기재된 단백질 내로 혼입된 비천연 아미노산은 US 9,840,493; US 9,682,934; US 2017/0260137; US 9,938,516; 또는 US 2018/0086734에 개시되어 있으며; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함된다. 이러한 신테타제에 의해 혼입될 수 있는 예시적인 UAA는 파라-메틸아지도-L-페닐알라닌, 아르알킬, 헤테로시클릴 및 헤테로아르알킬, 및 리신 유도체 비천연 아미노산을 포함한다. 일부 실시양태에서, 이러한 UAA는 피리딜, 피라지닐, 피라졸릴, 트리아졸릴, 옥사졸릴, 티아졸릴, 티오페닐 또는 다른 헤테로사이클을 포함한다. 일부 실시양태에서, 이러한 아미노산은 아지드, 테트라진, 또는 커플링 파트너, 예컨대 수용성 모이어티에 접합될 수 있는 다른 화학적 기를 포함한다. 일부 실시양태에서, UAA는 알킬 링커를 통해 방향족 모이어티에 부착된 아지드를 포함한다. 일부 실시양태에서, 알킬 링커는 C1-C10 링커이다. 일부 실시양태에서, UAA는 알킬 링커를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 아미노 기를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬아미노 기를 통해 방향족 모이어티에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬 쇄를 통해 아미노산 측쇄의 말단 질소 (예를 들어, 리신 유도체의 N6, 또는 보다 짧은 알킬 측쇄를 포함하는 유도체의 N5, N4, 또는 N3)에 부착된 아지드를 포함한다. 일부 실시양태에서, UAA는 알킬 쇄를 통해 아미노산 측쇄의 말단 질소에 부착된 테트라진을 포함한다. 일부 실시양태에서, UAA는 알킬 링커를 통해 아미드에 부착된 아지드 또는 테트라진을 포함한다. 일부 실시양태에서, UAA는 3-아미노알라닌, 세린, 리신 또는 그의 유도체의 아지드 또는 테트라진-함유 카르바메이트 또는 아미드이다. 일부 실시양태에서, 이러한 UAA는 생체내 단백질 내로 혼입된다. 일부 실시양태에서, 이러한 UAA는 무세포 시스템에서 단백질 내로 혼입된다.
세포 유형
일부 실시양태에서, 많은 유형의 세포/미생물이, 예를 들어 형질전환 또는 유전자 조작에 사용된다. 일부 실시양태에서, 세포는 원핵 또는 진핵 세포이다. 일부 실시양태에서, 원핵 세포는 박테리아 세포이다. 일부 실시양태에서, 진핵 세포는 진균 세포 또는 단세포 원충이다. 일부 실시양태에서, 세포는 효모 세포이다. 다른 경우에, 진핵 세포는 배양된 동물, 식물 또는 인간 세포이다. 추가의 경우에, 진핵 세포는 유기체, 예컨대 식물, 다세포 진균 또는 동물에 존재한다.
일부 실시양태에서, 조작된 미생물은 종종 분열 및 증식할 수 있는 단세포 유기체이다. 본원에 사용된 "조작된 미생물"은 유전 물질이 유전 공학 기술 (즉, 재조합 DNA 기술)을 사용하여 변경된 미생물이다. 미생물은 하기 특색 중 하나 이상을 포함할 수 있다: 호기성, 혐기성, 사상성, 비-사상성, 일배체, 이배체, 영양요구성 및/또는 비-영양요구성. 특정 실시양태에서, 조작된 미생물은 원핵 미생물 (예를 들어, 박테리아)이고, 특정 실시양태에서, 조작된 미생물은 비-원핵 미생물, 예컨대 진핵 미생물이다. 일부 실시양태에서, 조작된 미생물은 진핵 미생물 (예를 들어, 효모, 다른 진균, 아메바)이다. 일부 실시양태에서, 조작된 미생물은 진균이다. 일부 실시양태에서, 조작된 유기체는 효모이다.
임의의 적합한 효모는 숙주 미생물, 조작된 미생물, 유전자 변형된 유기체, 또는 이종 또는 변형된 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 효모는 야로위아(Yarrowia) 효모 (예를 들어, 와이. 리폴리티카(Y. lipolytica) (이전에 칸디다 리폴리티카(Candida lipolytica)로 분류됨)), 칸디다(Candida) 효모 (예를 들어, 씨. 레브카우피(C. revkaufi), 씨. 비스와나티이(C. viswanathii), 씨. 풀케리마(C. pulcherrima), 씨. 트로피칼리스(C. tropicalis), 씨. 유틸리스(C. utilis)), 로도토룰라(Rhodotorula) 효모 (예를 들어, 알. 글루티누스(R. glutinus), 알. 그라미니스(R. graminis)), 로도스포리디움(Rhodosporidium) 효모 (예를 들어, 알. 토룰로이데스(R. toruloides)), 사카로미세스(Saccharomyces) 효모 (예를 들어, 에스. 세레비지아에(S. cerevisiae), 에스. 바야누스(S. bayanus), 에스. 파스토리아누스(S. pastorianus), 에스. 칼스베르겐시스(S. carlsbergensis)), 크립토코쿠스(Cryptococcus) 효모, 트리코스포론(Trichosporon) 효모 (예를 들어, 티. 풀란스(T. pullans), 티. 쿠타네움(T. cutaneum)), 피키아(Pichia) 효모 (예를 들어, 피. 파스토리스(P. pastoris), 케이. 파피이(K. phaffii)) 및 리포미세스(Lipomyces) 효모 (예를 들어, 엘. 스타르케이이이(L. starkeyii), 엘. 리포페루스(L. lipoferus))를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 적합한 효모는 아라크니오투스(Arachniotus) 속, 아스페르길루스(Aspergillus) 속, 아우레오바시디움(Aureobasidium) 속, 아욱사르트론(Auxarthron) 속, 블라스토미세스(Blastomyces) 속, 칸디다(Candida) 속, 크리소스포룸(Chrysosporuim) 속, 크리소스포리움(Chrysosporium) 속, 데바리오미세스(Debaryomyces) 속, 콕시디오데스(Coccidiodes) 속, 크립토코쿠스(Cryptococcus) 속, 김노아스쿠스(Gymnoascus) 속, 한세눌라(Hansenula) 속, 히스토플라스마(Histoplasma) 속, 이사첸키아(Issatchenkia) 속, 클루이베로미세스(Kluyveromyces) 속, 리포미세스(Lipomyces) 속, 리사첸키아(Lssatchenkia) 속, 미크로스포룸(Microsporum) 속, 믹소트리쿰(Myxotrichum) 속, 믹소지마(Myxozyma) 속, 오이디오덴드론(Oidiodendron) 속, 파키솔렌(Pachysolen) 속, 페니실리움(Penicillium) 속, 피키아(Pichia) 속, 로도스포리디움(Rhodosporidium) 속, 로도토룰라(Rhodotorula) 속, 로도토룰라(Rhodotorula) 속, 사카로미세스(Saccharomyces) 속, 쉬조사카로미세스(Schizosaccharomyces) 속, 스코풀라리오프시스(Scopulariopsis) 속, 세페도니움(Sepedonium) 속, 트리코스포론(Trichosporon) 속, 또는 야로위아(Yarrowia) 속의 것이다. 일부 실시양태에서, 적합한 효모는 아라크니오투스 플라볼루테우스(Arachniotus flavoluteus) 종, 아스페르길루스 플라부스(Aspergillus flavus) 종, 아스페르길루스 푸미가투스(Aspergillus fumigatus) 종, 아스페르길루스 니거(Aspergillus niger) 종, 아우레오바시디움 풀루란스(Aureobasidium pullulans) 종, 아욱사르트론 탁스테리(Auxarthron thaxteri) 종, 블라스토미세스 더마티티디스(Blastomyces dermatitidis) 종, 칸디다 알비칸스(Candida albicans) 종, 칸디다 두블리니엔시스(Candida dubliniensis) 종, 칸디다 파마타(Candida famata) 종, 칸디다 글라브라타(Candida glabrata) 종, 칸디다 길리에르몬디이(Candida guilliermondii) 종, 칸디다 케피르(Candida kefyr) 종, 칸디다 크루세이(Candida krusei) 종, 칸디다 람비카(Candida lambica) 종, 칸디다 리폴리티카(Candida lipolytica) 종, 칸디다 루스티타니아에(Candida lustitaniae) 종, 칸디다 파라프실로시스(Candida parapsilosis) 종, 칸디다 풀케리마(Candida pulcherrima) 종, 칸디다 레브카우피(Candida revkaufi) 종, 칸디다 루고사(Candida rugosa) 종, 칸디다 트로피칼리스(Candida tropicalis) 종, 칸디다 유틸리스(Candida utilis) 종, 칸디다 비스와나티이(Candida viswanathii) 종, 칸디다 크세스토비이(Candida xestobii) 종, 크리소스포룸 케라티노필룸(Chrysosporuim keratinophilum) 종, 콕시디오데스 임미티스(Coccidiodes immitis) 종, 크립토코쿠스 알비두스 변종 디플루엔스(Cryptococcus albidus var. diffluens) 종, 크립토코쿠스 라우렌티이(Cryptococcus laurentii) 종, 크립토코쿠스 네오포만스(Cryptococcus neofomans) 종, 데바리오미세스 한세니이(Debaryomyces hansenii) 종, 김노아스쿠스 더그와이엔시스(Gymnoascus dugwayensis) 종, 한세눌라 아노말라(Hansenula anomala) 종, 히스토플라스마 캅술라툼(Histoplasma capsulatum) 종, 이사첸키아 옥시덴탈리스(Issatchenkia occidentalis) 종, 이스타켄키아 오리엔탈리스(Isstachenkia orientalis) 종, 클루이베로미세스 락티스(Kluyveromyces lactis) 종, 클루이베로미세스 마르시아누스(Kluyveromyces marxianus) 종, 클루이베로미세스 써모톨레란스(Kluyveromyces thermotolerans) 종, 클루이베로미세스 왈티이(Kluyveromyces waltii) 종, 리포미세스 리포페루스(Lipomyces lipoferus) 종, 리포미세스 스타르케이이이(Lipomyces starkeyii) 종, 미크로스포룸 깁세움(Microsporum gypseum) 종, 믹소트리쿰 데플렉숨(Myxotrichum deflexum) 종, 오이디오덴드론 에키눌라툼(Oidiodendron echinulatum) 종, 파키솔렌 탄노필리스(Pachysolen tannophilis) 종, 페니실리움 노타툼(Penicillium notatum) 종, 피키아 아노말라(Pichia anomala) 종, 피키아 파스토리스(Pichia pastoris) 종, 피키아 스티피티스(Pichia stipitis) 종, 로도스포리디움 토룰로이데스(Rhodosporidium toruloides) 종, 로도토룰라 글루티누스(Rhodotorula glutinus) 종, 로도토룰라 그라미니스(Rhodotorula graminis) 종, 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 종, 사카로미세스 클루이베리(Saccharomyces kluyveri) 종, 쉬조사카로미세스 폼베(Schizosaccharomyces pombe) 종, 스코풀라리옵시스 아크레모니움(Scopulariopsis acremonium) 종, 세페도니움 크리소스페르뭄(Sepedonium chrysospermum) 종, 트리코스포론 쿠타네움(Trichosporon cutaneum) 종, 트리코스포론 풀란스(Trichosporon pullans) 종, 야로위아 리폴리티카(Yarrowia lipolytica) 종, 또는 야로위아 리폴리티카(이전에 칸디다 리폴리티카로 분류됨) 종의 것이다. 일부 실시양태에서, 효모는 ATCC20362, ATCC8862, ATCC18944, ATCC20228, ATCC76982 및 LGAM S(7)1 균주를 포함하나 이에 제한되지는 않는 와이. 리폴리티카 균주이다 (Papanikolaou S., and Aggelis G., Bioresour. Technol. 82(1):43-9 (2002)). 특정 실시양태에서, 효모는 칸디다 종 (즉, 칸디다 종) 효모이다. 임의의 적합한 칸디다 종이 지방 디카르복실산 (예를 들어, 옥탄디오산, 데칸디오산, 도데칸디오산, 테트라데칸디오산, 헥사데칸디오산, 옥타데칸디오산, 에이코산디오산)의 제조를 위해 사용되고/거나 유전자 변형될 수 있다. 일부 실시양태에서, 적합한 칸디다 종은 칸디다 알비칸스, 칸디다 두블리니엔시스, 칸디다 파마타, 칸디다 글라브라타, 칸디다 길리에르몬디이, 칸디다 케피르, 칸디다 크루세이, 칸디다 람비카, 칸디다 리폴리티카, 칸디다 루스티타니아에, 칸디다 파라프실로시스, 칸디다 풀케리마, 칸디다 레브카우피, 칸디다 루고사, 칸디다 트로피칼리스, 칸디다 유틸리스, 칸디다 비스와나티이, 칸디다 크세스토비이 및 본원에 기재된 임의의 다른 칸디다 종 효모를 포함하나 이에 제한되지는 않는다. 칸디다 종 균주의 비제한적 예는 sAA001 (ATCC20336), sAA002 (ATCC20913), sAA003 (ATCC20962), sAA496 (US2012/0077252), sAA106 (US2012/0077252), SU-2 (ura3-/ura3-), H5343 (베타 산화 차단됨; 미국 특허 번호 5648247) 균주를 포함하나 이에 제한되지는 않는다. 칸디다 종 효모로부터의 임의의 적합한 균주가 유전자 변형을 위한 모 균주로서 이용될 수 있다.
효모 속, 종 및 균주는 종종 유전적 내용과 매우 밀접하게 관련되어 있어 구별, 분류 및/또는 명명하기 어려울 수 있다. 일부 경우에 씨. 리폴리티카 및 와이. 리폴리티카의 균주는 구별, 분류 및/또는 명명하기 어려울 수 있고, 일부 경우에 동일한 유기체로 간주될 수 있다. 일부 경우에, 씨. 트로피칼리스 및 씨. 비스와나티이의 다양한 균주는 구별, 분류 및/또는 명명하기 어려울 수 있다 (예를 들어, 문헌 [Arie et al., J. Gen. Appl.Microbiol., 46, 257-262 (2000)] 참조). ATCC 뿐만 아니라 다른 상업적 또는 학술적 공급원으로부터 수득된 일부 씨. 트로피칼리스 및 씨. 비스와나티이 균주는 본원에 기재된 실시양태에 등가이고 동등하게 적합한 것으로 간주될 수 있다. 일부 실시양태에서, 씨. 트로피칼리스 및 씨. 비스와나티이의 일부 모 균주는 단지 명칭이 상이한 것으로 간주된다.
임의의 적합한 진균은 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 진균의 비제한적 예는 아스페르길루스 진균 (예를 들어, 에이. 파라시티쿠스(A. parasiticus), 에이. 니둘란스(A. nidulans)), 트라우스토키트리움(Thraustochytrium) 진균, 쉬조키트리움(Schizochytrium) 진균 및 리조푸스(Rhizopus) 진균 (예를 들어, 알. 아리주스(R. arrhizus), 알. 오리자에(R. oryzae), 알. 니그리칸스(R. nigricans))을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 진균은 균주 ATCC24690을 포함하나 이에 제한되지는 않는 에이. 파라시티쿠스 균주이고, 특정 실시양태에서, 진균은 균주 ATCC38163을 포함하나 이에 제한되지는 않는 에이. 니둘란스 균주이다.
임의의 적합한 원핵생물은 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 선택될 수 있다. 그람 음성 또는 그람 양성 박테리아가 선택될 수 있다. 박테리아의 예는 바실루스(Bacillus) 박테리아 (예를 들어, 비. 서브틸리스(B. subtilis), 비. 메가테리움(B. megaterium)), 아시네토박터(Acinetobacter) 박테리아, 노르카르디아(Norcardia) 박테리아, 크산토박터(Xanthobacter) 박테리아, 에스케리키아(Escherichia) 박테리아 (예를 들어, 이. 콜라이 (예를 들어, 균주 DH10B, Stbl2, DH5-알파, DB3, DB3.1), DB4, DB5, JDP682 및 ccdA-over (예를 들어, 미국 출원 번호 09/518,188))), 스트렙토미세스(Streptomyces) 박테리아, 에르위니아(Erwinia) 박테리아, 클레브시엘라(Klebsiella) 박테리아, 세라티아(Serratia) 박테리아 (예를 들어, 에스. 마르세산스(S. marcessans)), 슈도모나스(Pseudomonas) 박테리아 (예를 들어, 피. 아에루기노사(P. aeruginosa)), 살모넬라(Salmonella) 박테리아 (예를 들어, 에스. 티피무리움(S. typhimurium), 에스. 티피(S. typhi)), 메가스파에라(Megasphaera) 박테리아 (예를 들어, 메가스파에라 엘스데니이(Megasphaera elsdenii))를 포함하나 이에 제한되지는 않는다. 박테리아는 또한 광합성 박테리아 (예를 들어, 녹색 비-황 박테리아 (예를 들어, 코로플렉수스(Choroflexus) 박테리아 (예를 들어, 씨. 아우란티아쿠스(C. aurantiacus)), 클로로네마(Chloronema) 박테리아 (예를 들어, 씨. 기가테움(C. gigateum))), 녹색 황 박테리아 (예를 들어, 클로로비움(Chlorobium) 박테리아 (예를 들어, 씨. 리미콜라(C. limicola)), 펠로딕티온(Pelodictyon) 박테리아 (예를 들어, 피. 루테올룸(P. luteolum)), 자주색 황 박테리아 (예를 들어, 크로마티움(Chromatium) 박테리아 (예를 들어, 씨. 오케니이(C. okenii))), 및 자주색 비-황 박테리아 (예를 들어, 로도스피릴룸(Rhodospirillum) 박테리아 (예를 들어, 알. 루브룸(R. rubrum)), 로도박터(Rhodobacter) 박테리아 (예를 들어, 알. 스파에로이데스(R. sphaeroides), 알. 캅술라투스(R. capsulatus)), 및 로도미크로비움(Rhodomicrobium) 박테리아 (예를 들어, 알. 바넬리이(R. vanellii)))를 포함하나 이에 제한되지는 않는다.
비-미생물 유기체로부터의 세포는 숙주 미생물, 조작된 미생물 또는 이종 폴리뉴클레오티드에 대한 공급원으로서 이용될 수 있다. 이러한 세포의 예는 곤충 세포 (예를 들어, 드로소필라(Drosophila) (예를 들어, 디. 멜라노가스터(D. melanogaster)), 스포도프테라(Spodoptera) (예를 들어, 에스. 프루기페르다(S. frugiperda) Sf9 또는 Sf21 세포) 및 트리코플루사(Trichoplusa) (예를 들어, 하이-파이브(High-Five) 세포); 선충류 세포 (예를 들어, 씨. 엘레간스(C. elegans) 세포); 조류 세포; 양서류 세포 (예를 들어, 크세노푸스 라에비스(Xenopus laevis) 세포); 파충류 세포; 포유동물 세포 (예를 들어, NIH3T3, 293, CHO, COS, VERO, C127, BHK, Per-C6, 보웨스(Bowes) 흑색종 및 HeLa 세포); 및 식물 세포 (예를 들어, 아라비돕시스 탈리아나(Arabidopsis thaliana), 니코타니아 타바쿰(Nicotania tabacum), 쿠페아 아시니폴리아(Cuphea acinifolia), 쿠페아 아에퀴페탈라(Cuphea aequipetala), 쿠페아 안구스티폴리아(Cuphea angustifolia), 쿠페아 아펜디쿨라타(Cuphea appendiculata), 쿠페아 아비게라(Cuphea avigera), 쿠페아 아비게라 변종 풀케리마(Cuphea avigera var. pulcherrima), 쿠페아 악실리플로라(Cuphea axilliflora), 쿠페아 바히엔시스(Cuphea bahiensis), 쿠페아 바일로니스(Cuphea baillonis), 쿠페아 브라키포다(Cuphea brachypoda), 쿠페아 부스타만타(Cuphea bustamanta), 쿠페아 칼카라타(Cuphea calcarata), 쿠페아 칼로필라(Cuphea calophylla), 쿠페아 칼로필라 아종 메소스테몬(Cuphea calophylla subsp. mesostemon), 쿠페아 카르타게넨시스(Cuphea carthagenensis), 쿠페아 시르카에오이데스(Cuphea circaeoides), 쿠페아 콘페르티플로라(Cuphea confertiflora), 쿠페아 코르다타(Cuphea cordata), 쿠페아 크라시플로라(Cuphea crassiflora), 쿠페아 시아네아(Cuphea cyanea), 쿠페아 데칸드라(Cuphea decandra), 쿠페아 덴티쿨라타(Cuphea denticulata), 쿠페아 디스페르마(Cuphea disperma), 쿠페아 에필로비이폴리아(Cuphea epilobiifolia), 쿠페아 에리코이데스(Cuphea ericoides), 쿠페아 플라바(Cuphea flava), 쿠페아 플라비세툴라(Cuphea flavisetula), 쿠페아 푸크시이폴리아(Cuphea fuchsiifolia), 쿠페아 가우메리(Cuphea gaumeri), 쿠페아 글루티노사(Cuphea glutinosa), 쿠페아 헤테로필라(Cuphea heterophylla), 쿠페아 후케리아나(Cuphea hookeriana), 쿠페아 히소피폴리아(Cuphea hyssopifolia) (멕시칸-히더(Mexican-heather)), 쿠페아 히소포이데스(Cuphea hyssopoides), 쿠페아 이그네아(Cuphea ignea), 쿠페아 인그라타(Cuphea ingrata), 쿠페아 조룰렌시스(Cuphea jorullensis), 쿠페아 란세올라타(Cuphea lanceolata), 쿠페아 리나리오이데스(Cuphea linarioides), 쿠페아 라베아(Cuphea llavea), 쿠페아 로포스토마(Cuphea lophostoma), 쿠페아 루테아(Cuphea lutea), 쿠페아 루테센스(Cuphea lutescens), 쿠페아 멜라늄(Cuphea melanium), 쿠페아 멜빌라(Cuphea melvilla), 쿠페아 미크란타(Cuphea micrantha), 쿠페아 미크로페탈라(Cuphea micropetala), 쿠페아 미물로이데스(Cuphea mimuloides), 쿠페아 니티둘라(Cuphea nitidula), 쿠페아 팔루스트리스(Cuphea palustris), 쿠페아 파르손시아(Cuphea parsonsia), 쿠페아 파스쿠오룸(Cuphea pascuorum), 쿠페아 파우시페탈라(Cuphea paucipetala), 쿠페아 프로쿰벤스(Cuphea procumbens), 쿠페아 슈도실렌(Cuphea pseudosilene), 쿠페아 슈도바시니움(Cuphea pseudovaccinium), 쿠페아 풀크라(Cuphea pulchra), 쿠페아 라세모사(Cuphea racemosa), 쿠페아 레펜스(Cuphea repens), 쿠페아 살리시폴리아(Cuphea salicifolia), 쿠페아 살바도렌시스(Cuphea salvadorensis), 쿠페아 스쿠만니이(Cuphea schumannii), 쿠페아 세실리플로라(Cuphea sessiliflora), 쿠페아 세실리폴리아(Cuphea sessilifolia), 쿠페아 세토사(Cuphea setosa), 쿠페아 스펙타빌리스(Cuphea spectabilis), 쿠페아 스페르마코세(Cuphea spermacoce), 쿠페아 스플렌디다(Cuphea splendida), 쿠페아 스플렌디다 변종 비리디플라바(Cuphea splendida var. viridiflava), 쿠페아 스트리굴로사(Cuphea strigulosa), 쿠페아 수불리게라(Cuphea subuligera), 쿠페아 텔레안드라(Cuphea teleandra), 쿠페아 티모이데스(Cuphea thymoides), 쿠페아 톨루카나(Cuphea tolucana), 쿠페아 우렌스(Cuphea urens), 쿠페아 우트리쿨로사(Cuphea utriculosa), 쿠페아 비스코시시마(Cuphea viscosissima), 쿠페아 왓소니아나(Cuphea watsoniana), 쿠페아 라이티이(Cuphea wrightii), 쿠페아 란세올라타(Cuphea lanceolata))를 포함하나 이에 제한되지는 않는다 .
이종 폴리뉴클레오티드에 대한 숙주 유기체 또는 공급원으로서 사용되는 미생물 또는 세포는 상업적으로 입수가능하다. 본원에 기재된 미생물 및 세포, 및 다른 적합한 미생물 및 세포는, 예를 들어 인비트로젠 코포레이션(Invitrogen Corporation) (캘리포니아주 칼스배드), 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (버지니아주 마나사스) 및 애그리컬쳐럴 리서치 컬쳐 콜렉션(Agricultural Research Culture Collection) (NRRL; 일리노이주 피오리아)으로부터 입수가능하다. 숙주 미생물 및 조작된 미생물은 임의의 적합한 형태로 제공될 수 있다. 예를 들어, 이러한 미생물은 1차 배양물일 수 있거나 또는 1회 이상 계대배양 (예를 들어, 희석 및 배양)되었을 수 있는 액체 배양물 또는 고체 배양물 (예를 들어, 한천-기반 배지)로 제공될 수 있다. 미생물은 또한 동결 형태 또는 건조 형태 (예를 들어, 동결건조됨)로 제공될 수 있다. 미생물은 임의의 적합한 농도로 제공될 수 있다.
폴리머라제
폴리머라제의 특히 유용한 기능은 주형으로서 기존 핵산을 사용하여 핵산 가닥의 중합을 촉매하는 것이다. 유용한 다른 기능은 본원의 다른 곳에 기재되어 있다. 유용한 폴리머라제의 예는 DNA 폴리머라제 및 RNA 폴리머라제를 포함한다.
폴리머라제 비천연 핵산의 특이성, 진행성, 또는 다른 특색을 개선시키는 능력은, 예를 들어 증폭, 서열분석, 표지, 검출, 클로닝, 및 많은 다른 것을 포함한 비천연 핵산 혼입이 바람직한 다양한 상황에서 매우 바람직할 것이다.
일부 경우에, 본원에 개시된 것은, 예를 들어 DNA 증폭 동안 비천연 핵산을 성장하는 주형 카피 내로 혼입시키는 폴리머라제를 포함한다. 일부 실시양태에서, 폴리머라제는 폴리머라제의 활성 부위가 변형되어 활성 부위로의 비천연 핵산의 입체 진입 억제를 감소시키도록 변형될 수 있다. 일부 실시양태에서, 폴리머라제는 비천연 핵산의 1개 이상의 비천연 특색과의 상보성을 제공하도록 변형될 수 있다. 이러한 폴리머라제는 세포 내로 UBP를 안정하게 혼입시키기 위해 세포에서 발현되거나 조작될 수 있다. 따라서, 본 발명은 이종 또는 재조합 폴리머라제를 포함하는 조성물 및 그의 사용 방법을 포함한다.
폴리머라제는 단백질 조작과 관련된 방법을 사용하여 변형될 수 있다. 예를 들어, 결정 구조에 기초하여 분자 모델링을 수행하여 표적 활성을 변형시키기 위한 돌연변이가 이루어질 수 있는 폴리머라제의 위치를 확인할 수 있다. 대체에 대한 표적으로서 확인된 잔기는 문헌 [Bordo, et al. J Mol Biol 217: 721-729 (1991) and Hayes, et al. Proc Natl Acad Sci, USA 99: 15926- 15931 (2002)] (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)에 기재된 바와 같은 에너지 최소화 모델링, 상동성 모델링 및/또는 보존적 아미노산 치환을 사용하여 선택된 잔기로 대체될 수 있다.
예를 들어, 생물학적 시스템으로부터 단리된 단백질-기반 효소 및 그의 기능적 변이체를 포함한 임의의 다양한 폴리머라제가 본원에 제시된 방법 또는 조성물에 사용될 수 있다. 특정한 폴리머라제, 예컨대 하기 예시된 것에 대한 언급은 달리 나타내지 않는 한 그의 기능적 변이체를 포함하는 것으로 이해될 것이다. 일부 실시양태에서, 폴리머라제는 야생형 폴리머라제이다. 일부 실시양태에서, 폴리머라제는 변형된 또는 돌연변이체 폴리머라제이다. 일부 실시양태에서, 폴리머라제는 이종 폴리머라제일 수 있다.
활성 부위 영역 내로의 비천연 핵산의 진입을 개선시키고 활성 부위 영역 내에서 비천연 뉴클레오티드와 조정하는 특색이 있는 폴리머라제가 또한 사용될 수 있다. 일부 실시양태에서, 변형된 폴리머라제는 변형된 뉴클레오티드 결합 부위를 갖는다.
일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 특이성을 가지며, 이는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 당을 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 변형된 당이 없는 천연 핵산 및/또는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 염기를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 변형된 염기가 없는 천연 핵산 및/또는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 트리포스페이트를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 트리포스페이트를 포함하는 핵산 및/또는 트리포스페이트가 없는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 예를 들어, 변형된 또는 야생형 폴리머라제는 트리포스페이트를 포함하는 비천연 핵산에 대한 특이성을 가지며, 이는 디포스페이트 또는 모노포스페이트를 갖거나 또는 포스페이트를 갖지 않거나 또는 그의 조합을 갖는 비천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 또는 99.99%일 수 있다.
일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대해 완화된 특이성을 갖는다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 당을 포함하는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 변형된 염기를 포함하는 비천연 핵산에 대한 특이성 및 천연 핵산에 대한 특이성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 특이성의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다.
엑소뉴클레아제 활성의 부재는 야생형 특징 또는 변이체 또는 조작된 폴리머라제에 의해 부여된 특징일 수 있다. 예를 들어, 엑소 마이너스(exo minus) 클레나우(Klenow) 단편은 3' → 5' 교정 엑소뉴클레아제 활성이 결여된 클레나우 단편의 돌연변이된 버전이다.
본 발명의 방법은 내인성 3 → 5' 엑소뉴클레아제 교정 활성이 결여되거나 또는 3 → 5' 엑소뉴클레아제 교정 활성이 예를 들어 돌연변이를 통해 불능화된 임의의 DNA 폴리머라제의 기질 범위를 확장시키는데 사용될 수 있다. DNA 폴리머라제의 예는 polA, polB (예를 들어, 문헌 [Parrel & Loeb, Nature Struc Biol 2001] 참조), polC, polD, polY, polX 및 리버스 트랜스크립타제 (RT)를 포함하지만, 바람직하게는 진행성 고충실도 폴리머라제이다 (PCT/GB2004/004643). 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성을 갖는다. 일부 실시양태에서, 변형된 또는 야생형 폴리머라제는 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 갖고, 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성이 실질적으로 결여되어 있다.
일부 실시양태에서, 변형된 폴리머라제는 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5%, 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 비천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성 및 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다. 일부 실시양태에서, 변형된 폴리머라제는 천연 핵산에 대한 3' → 5' 교정 엑소뉴클레아제 활성을 가지며, 이는 천연 핵산에 대한 야생형 폴리머라제의 교정 엑소뉴클레아제 활성의 적어도 약 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99.5% 또는 99.99%이다.
일부 실시양태에서, 폴리머라제는 핵산으로부터의 그의 해리율에 따라 특징화된다. 일부 실시양태에서, 폴리머라제는 1개 이상의 천연 및 비천연 핵산에 대해 비교적 낮은 해리율을 갖는다. 일부 실시양태에서, 폴리머라제는 1개 이상의 천연 및 비천연 핵산에 대해 비교적 높은 해리율을 갖는다. 해리율은 본원에 제시된 방법에서 반응 속도를 맞추기 위해 조정될 수 있는 폴리머라제의 활성이다.
일부 실시양태에서, 폴리머라제는 특정한 천연 및/또는 비천연 핵산 또는 천연 및/또는 비천연 핵산의 수집물과 함께 사용되는 경우에 그의 충실도에 따라 특징화된다. 충실도는 일반적으로 핵산 주형의 카피를 제조할 때 폴리머라제가 성장하는 핵산 쇄 내로 올바른 핵산을 혼입시키는 정확도를 지칭한다. DNA 폴리머라제 충실도는 폴리머라제-가닥-주형 핵산 2원 복합체 내의 동일한 부위에서 가닥 합성에 대해 경쟁하기 위해 천연 및 비천연 핵산이 예를 들어 동일한 농도로 존재할 때 올바른 천연 및 비천연 핵산 혼입 대 부정확한 천연 및 비천연 핵산 혼입의 비로서 측정될 수 있다. DNA 폴리머라제 충실도는 천연 및 비천연 핵산에 대한 (kcat/Km) 및 부정확한 천연 및 비천연 핵산에 대한 (kcat/Km)의 비로서 계산될 수 있고; 여기서 kcat및 Km은 정상 상태 효소 동역학에서의 미카엘리스-멘텐(Michaelis-Menten) 파라미터이다 (문헌 [Fersht, A. R. (1985) Enzyme Structure and Mechanism, 2nd ed., p 350, W. H. Freeman & Co., New York.], 본원에 참조로 포함됨). 일부 실시양태에서, 폴리머라제는 교정 활성의 존재 또는 부재 하에 적어도 약 100, 1000, 10,000, 100,000, 또는 1x106의 충실도 값을 갖는다.
일부 실시양태에서, 천연 공급원 또는 그의 변이체로부터의 폴리머라제는 특정한 구조를 갖는 비천연 핵산의 혼입을 검출하는 검정을 사용하여 스크리닝된다. 한 예에서, 폴리머라제는 비천연 핵산 또는 UBP; 예를 들어, d5SICSTP, dCNMOTP, dTPT3TP, dNaMTP, dCNMOTP-dTPT3TP, 또는 d5SICSTP-dNaMTP UBP를 혼입시키는 능력에 대해 스크리닝될 수 있다. 야생형 폴리머라제에 비해 비천연 핵산에 대해 변형된 특성을 나타내는 폴리머라제, 예를 들어 이종 폴리머라제가 사용될 수 있다. 예를 들어, 변형된 특성은 예를 들어 Km, kcat, Vmax, 비천연 핵산 (또는 자연 발생 뉴클레오티드)의 존재 하의 폴리머라제 진행도, 비천연 핵산의 존재 하의 폴리머라제에 의한 평균 주형 판독-길이, 비천연 핵산에 대한 폴리머라제의 특이성, 비천연 핵산의 결합 속도, 생성물 (피로포스페이트, 트리포스페이트 등) 방출 속도, 분지화 속도, 또는 그의 임의의 조합일 수 있다. 한 실시양태에서, 변형된 특성은 비천연 핵산에 대해 감소된 Km 및/또는 비천연 핵산에 대해 증가된 kcat/Km 또는 Vmax/Km이다. 유사하게, 폴리머라제는 임의로 야생형 폴리머라제와 비교하여 증가된 비천연 핵산의 결합 속도, 증가된 생성물 방출 속도, 및/또는 감소된 분지화 속도를 갖는다.
동시에, 폴리머라제는 천연 핵산, 예를 들어 A, C, G 및 T를 성장하는 핵산 카피 내로 혼입시킬 수 있다. 예를 들어, 폴리머라제는 임의로 상응하는 야생형 폴리머라제보다 적어도 약 5% (예를 들어, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높은 천연 핵산에 대한 특이적 활성, 및 천연 핵산의 존재 하의 야생형 폴리머라제보다 적어도 5% (예를 들어, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높은 주형의 존재 하의 천연 핵산과의 진행도를 나타낸다. 임의로, 폴리머라제는 야생형 폴리머라제보다 적어도 약 5% (예를 들어, 약 5%, 10%, 25%, 50%, 75% 또는 100% 또는 그 초과) 만큼 높은 자연 발생 뉴클레오티드에 대한 kcat/Km 또는 Vmax/Km을 나타낸다.
특정한 구조의 비천연 핵산을 혼입시키는 능력을 가질 수 있는 본원에 사용된 폴리머라제는 또한 방향적 진화 접근법을 사용하여 생산될 수 있다. 핵산 합성 검정은 임의의 다양한 비천연 핵산에 대한 특이성을 갖는 폴리머라제 변이체를 스크리닝하는데 사용될 수 있다. 예를 들어, 폴리머라제 변이체는 DNA 주형에서 비천연 뉴클레오티드 반대편에 비천연 뉴클레오시드 트리포스페이트; 예를 들어, dCNMO 반대편에 dTPT3TP, dTPT3 반대편에 dCNMOTP, dTPT3 반대편에 NaMTP, 또는 dCNMO 또는 dNaM 반대편에 TAT1TP를 혼입시키는 능력에 대해 스크리닝될 수 있다. 일부 실시양태에서, 이러한 검정은, 예를 들어 재조합 폴리머라제 변이체를 사용하는 시험관내 검정이다. 일부 실시양태에서, 이러한 검정은 예를 들어 세포에서 폴리머라제 변이체를 발현시키는 생체내 검정이다. 이러한 방향적 진화 기술은 본원에 제시된 임의의 비천연 핵산에 대한 활성에 대해 임의의 적합한 폴리머라제의 변이체를 스크리닝하는데 사용될 수 있다. 일부 경우에, 본원에 사용된 폴리머라제는 비천연 리보뉴클레오티드를 핵산, 예컨대 RNA 내로 혼입시키는 능력을 갖는다. 예를 들어, NaM 또는 TAT1 리보뉴클레오티드는 본원에 기재된 폴리머라제를 사용하여 핵산 내로 혼입된다.
기재된 조성물의 변형된 폴리머라제는 임의로 변형된 및/또는 재조합 Φ29-유형 DNA 폴리머라제일 수 있다. 임의로, 폴리머라제는 변형된 및/또는 재조합 Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722, 또는 L17 폴리머라제일 수 있다.
기재된 조성물의 변형된 폴리머라제는 임의로 변형된 및/또는 재조합 원핵 DNA 폴리머라제, 예를 들어 DNA 폴리머라제 II (Pol II), DNA 폴리머라제 III (Pol III), DNA 폴리머라제 IV (Pol IV), DNA 폴리머라제 V (Pol V)일 수 있다. 일부 실시양태에서, 변형된 폴리머라제는 비-지시적 손상된 뉴클레오티드에 걸쳐 DNA 합성을 매개하는 폴리머라제를 포함한다. 일부 실시양태에서, Pol I, Pol II (polB), Pol IV (dinB) 및/또는 Pol V (umuCD)를 코딩하는 유전자는 조작된 세포 또는 SSO에서 구성적으로 발현되거나 또는 과다발현된다. 일부 실시양태에서, Pol II의 발현 또는 과다발현의 증가는 조작된 세포 또는 SSO에서의 비천연 염기 쌍 (UBP)의 증가된 보유에 기여한다.
본 발명에 일반적으로 유용한 핵산 폴리머라제는 DNA 폴리머라제, RNA 폴리머라제, 리버스 트랜스크립타제, 및 그의 돌연변이체 또는 변경된 형태를 포함한다. DNA 폴리머라제 및 그의 특성은 특히 문헌 [DNA Replication 2nd edition, Kornberg and Baker, W. H. Freeman, New York, N. Y. (1991)]에 상세히 기재되어 있다. 본 발명에 유용한 공지된 통상적인 DNA 폴리머라제는 피로코쿠스 푸리오수스(Pyrococcus furiosus) (Pfu) DNA 폴리머라제 (Lundberg et al., 1991, Gene, 108:1, Stratagene), 피로코쿠스 와에세이(Pyrococcus woesei) (Pwo) DNA 폴리머라제 (Hinnisdaels et al., 1996, Biotechniques, 20:186-8, Boehringer Mannheim), 써무스 써모필루스(Thermus thermophilus) (Tth) DNA 폴리머라제 (Myers and Gelfand 1991, Biochemistry 30:7661), 바실루스 스테아로써모필루스(Bacillus stearothermophilus) DNA 폴리머라제 (Stenesh and McGowan, 1977, Biochim Biophys Acta 475:32), 써모코쿠스 리토랄리스(Thermococcus litoralis) (TIi) DNA 폴리머라제 (벤트(Vent)™ DNA 폴리머라제로도 지칭됨, 문헌 [Cariello et al., 1991, Polynucleotides Res, 19: 4193, New England Biolabs]), 9°Nm™ DNA 폴리머라제 (뉴 잉글랜드 바이오랩스(New England Biolabs)), 스토펠(Stoffel) 단편, 써모 시쿼나제(Thermo Sequenase)® (아머샴 파마시아 바이오테크 유케이(Amersham Pharmacia Biotech UK)), 써미네이터(Therminator)™ (뉴 잉글랜드 바이오랩스), 써모토가 마리티마(Thermotoga maritima) (Tma) DNA 폴리머라제 (Diaz and Sabino, 1998 Braz J Med. Res, 31 :1239), 써무스 아쿠아티쿠스(Thermus aquaticus) (Taq) DNA 폴리머라제 (Chien et al., 1976, J. Bacteoriol, 127: 1550), DNA 폴리머라제, 피로코쿠스 코다카라엔시스(Pyrococcus kodakaraensis) KOD DNA 폴리머라제 (Takagi et al., 1997, Appl. Environ. Microbiol. 63:4504)], JDF-3DNA 폴리머라제 (써모코쿠스 종 JDF-3 유래, 특허 출원 WO 0132887), 피로코쿠스 GB-D (PGB-D) DNA 폴리머라제 (딥 벤트(Deep Vent)™ DNA 폴리머라제로도 지칭됨, 문헌 [Juncosa-Ginesta et al., 1994, Biotechniques, 16:820, New England Biolabs]), 울트마(UlTma) DNA 폴리머라제 (써모필레 써모토가 마리티마(thermophile Thermotoga maritima) 유래; 문헌 [Diaz and Sabino, 1998 Braz J. Med. Res, 31 :1239; PE Applied Biosystems]), Tgo DNA 폴리머라제 (써모코쿠스 고르고나리우스(thermococcus gorgonarius), 로슈 몰레큘라 바이오케미칼스(Roche Molecular Biochemicals)), 이. 콜라이 DNA 폴리머라제 I (Lecomte and Doubleday, 1983, Polynucleotides Res. 11 :7505), T7 DNA 폴리머라제 (Nordstrom et al., 1981, J Biol. Chem. 256:3112), 및 고세균 DP1I/DP2 DNA 폴리머라제 II (Cann et al., 1998, Proc. Natl. Acad. Sci. USA 95:14250])를 포함한다. 중온성 폴리머라제 및 고온성 폴리머라제 둘 다가 고려된다. 고온성 DNA 폴리머라제는 써모시쿼나제®, 9°Nm™, 써미네이터™, Taq, Tne, Tma, Pfu, TfI, Tth, TIi, 스토펠 단편, 벤트™ 및 딥 벤트™ DNA 폴리머라제, KOD DNA 폴리머라제, Tgo, JDF-3, 및 그의 돌연변이체, 변이체 및 유도체를 포함하나 이에 제한되지는 않는다. 3' 엑소뉴클레아제-결핍 돌연변이체인 폴리머라제가 또한 고려된다. 본 발명에 유용한 리버스 트랜스크립타제는 HIV, HTLV-I, HTLV-II, FeLV, FIV, SIV, AMV, MMTV, MoMuLV 및 다른 레트로바이러스로부터의 리버스 트랜스크립타제를 포함하나 이에 제한되지는 않는다 (문헌 [Levin, Cell 88:5-8 (1997); Verma, Biochim Biophys Acta. 473:1-38 (1977); Wu et al., CRC Crit Rev Biochem. 3:289-347 (1975)] 참조). 폴리머라제의 추가의 예는 9°N DNA 폴리머라제, Taq DNA 폴리머라제, 퓨전(Phusion)® DNA 폴리머라제, Pfu DNA 폴리머라제, RB69 DNA 폴리머라제, KOD DNA 폴리머라제, 및 벤트R(VentR)® DNA 폴리머라제를 포함하나 이에 제한되지는 않는다 (Gardner et al. (2004) "Comparative Kinetics of Nucleotide Analog Incorporation by Vent DNA Polymerase" J. Biol. Chem., 279(12), 11834-11842; Gardner and Jack "Determinants of nucleotide sugar recognition in an archaeon DNA polymerase" Nucleic Acids Research, 27(12) 2545-2553). 비-고온성 유기체로부터 단리된 폴리머라제는 열 불활성화가능할 수 있다. 예는 파지로부터의 DNA 폴리머라제이다. 임의의 다양한 공급원으로부터의 폴리머라제는 고온 조건에 대한 그의 내성을 증가 또는 감소시키도록 변형될 수 있는 것으로 이해될 것이다. 일부 실시양태에서, 폴리머라제는 고온성일 수 있다. 일부 실시양태에서, 고온성 폴리머라제는 열 불활성화가능할 수 있다. 고온성 폴리머라제는 전형적으로 고온 조건 또는 열순환 조건, 예컨대 폴리머라제 연쇄 반응 (PCR) 기술에 사용되는 조건에 유용하다.
일부 실시양태에서, 폴리머라제는 Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722, L17, 써모시쿼나제®, 9°Nm™, 써미네이터™ DNA 폴리머라제, Tne, Tma, TfI, Tth, TIi, 스토펠 단편, 벤트™ 및 딥 벤트™ DNA 폴리머라제, KOD DNA 폴리머라제, Tgo, JDF-3, Pfu, Taq, T7 DNA 폴리머라제, T7 RNA 폴리머라제, PGB-D, 울트마 DNA 폴리머라제, 이. 콜라이 DNA 폴리머라제 I, 이. 콜라이 DNA 폴리머라제 III, 고세균 DP1I/DP2 DNA 폴리머라제 II, 9°N DNA 폴리머라제, Taq DNA 폴리머라제, 퓨전® DNA 폴리머라제, Pfu DNA 폴리머라제, SP6 RNA 폴리머라제, RB69 DNA 폴리머라제, 조류 골수모구증 바이러스 (AMV) 리버스 트랜스크립타제, 몰로니 뮤린 백혈병 바이러스 (MMLV) 리버스 트랜스크립타제, 슈퍼스크립트(SuperScript)® II 리버스 트랜스크립타제, 또는 슈퍼스크립트® III 리버스 트랜스크립타제를 포함한다.
일부 실시양태에서, 폴리머라제는 DNA 폴리머라제 I (또는 클레노우 단편), 벤트 폴리머라제, 퓨전® DNA 폴리머라제, KOD DNA 폴리머라제, Taq 폴리머라제, T7 DNA 폴리머라제, T7 RNA 폴리머라제, 써미네이터™ DNA 폴리머라제, POLB 폴리머라제, SP6 RNA 폴리머라제, 이. 콜라이 DNA 폴리머라제 I, 이. 콜라이 DNA 폴리머라제 III, 조류 골수모세포증 바이러스 (AMV) 리버스 트랜스크립타제, 몰로니 뮤린 백혈병 바이러스 (MMLV) 리버스 트랜스크립타제, 슈퍼스크립트® II 리버스 트랜스크립타제, 또는 슈퍼스크립트® III 리버스 트랜스크립타제이다.
뉴클레오티드 수송체
뉴클레오티드 수송체 (NT)는 세포막 및 소포를 가로지르는 뉴클레오티드 기질의 전달을 용이하게 하는 막 수송 단백질의 군이다. 일부 실시양태에서, 2가지 유형의 NT, 즉 집중성 뉴클레오시드 수송체 및 평형화 뉴클레오시드 수송체가 존재한다. 일부 경우에, NT는 또한 유기 음이온 수송체 (OAT) 및 유기 양이온 수송체 (OCT)를 포함한다. 일부 경우에, 뉴클레오티드 수송체는 뉴클레오시드 트리포스페이트 수송체 (NTT)이다.
일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체 (NTT)는 박테리아, 식물 또는 조류로부터의 것이다. 일부 실시양태에서, 뉴클레오티드 뉴클레오시드 트리포스페이트 수송체는 TpNTT1, TpNTT2, TpNTT3, TpNTT4, TpNTT5, TpNTT6, TpNTT7, TpNTT8 (티. 슈도나나(T. pseudonana)), PtNTT1, PtNTT2, PtNTT3, PtNTT4, PtNTT5, PtNTT6 (피. 트리코르누툼(P. tricornutum)), GsNTT (갈디에리아 술푸라리아(Galdieria sulphuraria)), AtNTT1, AtNTT2 (아라비돕시스 탈리아나), CtNTT1, CtNTT2 (클라미디아 트라코마티스(Chlamydia trachomatis)), PamNTT1, PamNTT2 (프로토클라미디아 아메보필라(Protochlamydia amoebophila)), CcNTT (카에디박터 카리오필루스(Caedibacter caryophilus)), 또는 RpNTT1 (리케치아 프로와제키이(Rickettsia prowazekii))이다.
일부 실시양태에서, NTT는 CNT1, CNT2, CNT3, ENT1, ENT2, OAT1, OAT3 또는 OCT1이다.
일부 실시양태에서, NTT는 비천연 핵산을 유기체, 예를 들어 세포 내로 유입시킨다. 일부 실시양태에서, NTT는 NTT의 뉴클레오티드 결합 부위가 변형되어 뉴클레오티드 결합 부위로의 비천연 핵산의 입체 진입 억제를 감소시키도록 변형될 수 있다. 일부 실시양태에서, NTT는 비천연 핵산의 1개 이상의 천연 또는 비천연 특색과의 증가된 상호작용을 제공하도록 변형될 수 있다. 이러한 NTT는 세포 내로 UBP를 안정하게 유입시키기 위해 세포에서 발현되거나 조작될 수 있다. 따라서, 본 발명은 이종 또는 재조합 NTT를 포함하는 조성물 및 그의 사용 방법을 포함한다.
NTT는 단백질 조작과 관련된 방법을 사용하여 변형될 수 있다. 예를 들어, 분자 모델링은 표적 활성 또는 결합 부위를 변형시키기 위해 돌연변이가 이루어질 수 있는 NTT의 위치를 확인하기 위해 결정 구조에 기초하여 수행될 수 있다. 대체에 대한 표적으로서 확인된 잔기는 문헌 [Bordo, et al. J Mol Biol 217: 721-729 (1991) 및 Hayes, et al. Proc Natl Acad Sci, USA 99:15926- 15931 (2002)] (이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)에 기재된 바와 같은 에너지 최소화 모델링, 상동성 모델링 및/또는 보존적 아미노산 치환을 사용하여 선택된 잔기로 대체될 수 있다.
예를 들어, 생물계로부터 단리된 단백질-기반 효소 및 그의 기능적 변이체를 포함한 임의의 다양한 NTT가 본원에 제시된 방법 또는 조성물에 사용될 수 있다. 특정한 NTT, 예컨대 하기 예시된 것에 대한 언급은 달리 나타내지 않는 한 그의 기능적 변이체를 포함하는 것으로 이해될 것이다. 일부 실시양태에서, NTT는 야생형 NTT이다. 일부 실시양태에서, NTT는 변형된 또는 돌연변이체 NTT이다.
비천연 핵산의 세포 내로의 진입을 개선시키고 뉴클레오티드 결합 영역 내의 비천연 뉴클레오티드와 조화시키기 위한 특색이 있는 NTT가 또한 사용될 수 있다. 일부 실시양태에서, 변형된 NTT는 변형된 뉴클레오티드 결합 부위를 갖는다. 일부 실시양태에서, 변형된 또는 야생형 NTT는 비천연 핵산에 대해 완화된 특이성을 갖는다. 예를 들어, NTT는 임의로 비천연 뉴클레오티드에 대한 특이적 유입 활성을 나타내며, 이는 상응하는 야생형 NTT보다 적어도 약 0.1% (예를 들어, 약 0.1%, 0.2%, 0.5%, 0.8%, 1%, 1.1%, 1.2%, 1.5%, 1.8%, 2%, 3%, 4%, 5%, 10%, 25%, 50%, 75%, 100% 또는 그 초과) 만큼 높다. 임의로, NTT는 야생형 NTT보다 적어도 약 0.1% (예를 들어, 약 0.1%, 0.2%, 0.5%, 0.8%, 1%, 1.1%, 1.2%, 1.5%, 1.8%, 2%, 3%, 4%, 5%, 10%, 25%, 50%, 75% 또는 100% 또는 그 초과) 만큼 높은 비천연 뉴클레오티드에 대한 kcat/Km 또는 Vmax/Km을 나타낸다.
NTT는 트리포스페이트에 대한 그의 친화도 (즉, Km) 및/또는 유입 속도 (즉, Vmax)에 따라 특징화될 수 있다. 일부 실시양태에서, NTT는 1개 이상의 천연 및 비천연 트리포스페이트에 대해 비교적 Km 또는 Vmax를 갖는다. 일부 실시양태에서 NTT는 1개 이상의 천연 및 비천연 트리포스페이트에 대해 비교적 높은 Km 또는 Vmax를 갖는다.
천연 공급원으로부터의 NTT 또는 그의 변이체는 트리포스페이트의 양을 검출하는 검정을 사용하여 (트리포스페이트가 적합하게 표지된 경우에 질량 분광측정법 또는 방사능을 사용하여) 스크리닝될 수 있다. 한 예에서, NTT는 비천연 트리포스페이트; 예를 들어, dTPT3TP, dCNMOTP, d5SICSTP, dNaMTP, NaMTP, 및/또는 TPT1TP를 유입시키는 능력에 대해 스크리닝될 수 있다. 야생형 NTT와 비교하여 비천연 핵산에 대해 변형된 특성을 나타내는 NTT, 예를 들어 이종 NTT가 사용될 수 있다. 예를 들어, 변형된 특성은 예를 들어 트리포스페이트 유입에 대한 Km, kcat, Vmax일 수 있다. 한 실시양태에서, 변형된 특성은 비천연 트리포스페이트의 경우 감소된 Km 및/또는 비천연 트리포스페이트의 경우 증가된 kcat/Km 또는 Vmax/Km이다. 유사하게, NTT는 임의로 야생형 NTT와 비교하여 증가된 비천연 트리포스페이트의 결합 속도, 증가된 세포내 방출 속도, 및/또는 증가된 세포 유입 속도를 갖는다.
동시에, NTT는 천연 트리포스페이트, 예를 들어 dATP, dCTP, dGTP, dTTP, ATP, CTP, GTP 및/또는 TTP를 세포 내로 유입시킬 수 있다. 일부 경우에, NTT는 임의로 복제 및 전사를 뒷받침할 수 있는 천연 핵산에 대한 특이적 유입 활성을 나타낸다. 일부 실시양태에서, NTT는 임의로 복제 및 전사를 뒷받침할 수 있는 천연 핵산에 대한 kcat/Km 또는 Vmax/Km를 나타낸다.
특정한 구조의 비천연 트리포스페이트를 유입시키는 능력을 가질 수 있는 본원에 사용된 NTT는 또한 방향적 진화 접근법을 사용하여 생산될 수 있다. 핵산 합성 검정은 임의의 다양한 비천연 트리포스페이트에 대한 특이성을 갖는 NTT 변이체를 스크리닝하는데 사용될 수 있다. 예를 들어, NTT 변이체는 비천연 트리포스페이트; 예를 들어, d5SICSTP, dNaMTP, dCNMOTP, dTPT3TP, NaMTP, 및/또는 TPT1TP를 유입시키는 능력에 대해 스크리닝될 수 있다. 일부 실시양태에서, 이러한 검정은, 예를 들어 재조합 NTT 변이체를 사용하는 시험관내 검정이다. 일부 실시양태에서, 이러한 검정은 예를 들어 세포에서 NTT 변이체를 발현하는 생체내 검정이다. 이러한 기술은 본원에 제시된 임의의 비천연 트리포스페이트에 대한 활성에 대해 임의의 적합한 NTT의 변이체를 스크리닝하는데 사용될 수 있다.
핵산 시약 & 도구
본원에 기재된 방법, 세포 또는 조작된 미생물에 사용하기 위한 뉴클레오티드 및/또는 핵산 시약 (또는 폴리뉴클레오티드)은 비천연 뉴클레오티드를 갖거나 갖지 않는 1개 이상의 ORF를 포함한다. ORF는 임의의 적합한 공급원, 때때로 게놈 DNA, mRNA, 역전사된 RNA 또는 상보적 DNA (cDNA) 또는 상기 중 하나 이상을 포함하는 핵산 라이브러리로부터의 것일 수 있고, 관심 핵산 서열, 관심 단백질 또는 관심 활성을 함유하는 임의의 유기체 종으로부터의 것이다. ORF가 수득될 수 있는 유기체의 비제한적 예는, 예를 들어 박테리아, 효모, 진균, 인간, 곤충, 선충류, 소, 말, 개, 고양이, 래트 또는 마우스를 포함한다. 일부 실시양태에서, 본원에 기재된 뉴클레오티드 및/또는 핵산 시약 또는 다른 시약은 단리 또는 정제된다. 공개된 시험관내 방법을 통해 비천연 뉴클레오티드를 포함하는 ORF가 생성될 수 있다. 일부 경우에, 뉴클레오티드 또는 핵산 시약은 비천연 핵염기를 포함한다.
핵산 시약은 때때로 ORF와 함께 번역되고 아미노산 태그를 코딩하는 ORF에 인접한 뉴클레오티드 서열을 포함한다. 태그-코딩 뉴클레오티드 서열은 핵산 시약 중 ORF의 3' 및/또는 5'에 위치함으로써, ORF에 의해 코딩된 단백질 또는 펩티드의 C-말단 또는 N-말단에 태그를 코딩한다. 시험관내 전사 및/또는 번역을 무효화하지 않는 임의의 태그가 이용될 수 있고, 관련 기술분야의 통상의 기술자에 의해 적절하게 선택될 수 있다. 태그는 배양 또는 발효 배지로부터 목적하는 ORF 생성물의 단리 및/또는 정제를 용이하게 할 수 있다. 일부 경우에, 핵산 시약의 라이브러리가 본원에 기재된 방법 및 조성물과 함께 사용된다. 예를 들어, 적어도 100, 1000, 2000, 5000, 10,000, 또는 50,000개 초과의 고유한 폴리뉴클레오티드의 라이브러리가 라이브러리에 존재하며, 여기서 각각의 폴리뉴클레오티드는 적어도 1종의 비천연 핵염기를 포함한다.
비천연 뉴클레오티드를 갖거나 갖지 않는 핵산 또는 핵산 시약은 종종 핵산의 의도된 용도에 따라 선택되는 특정 요소, 예를 들어 조절 요소를 포함할 수 있다. 하기 요소 중 임의의 것이 핵산 시약에 포함되거나 그로부터 배제될 수 있다. 핵산 시약은, 예를 들어 하기 뉴클레오티드 요소 중 하나 이상 또는 모두를 포함할 수 있다: 1개 이상의 프로모터 요소, 1개 이상의 5' 비번역 영역 (5'UTR), 표적 뉴클레오티드 서열이 삽입될 수 있는 1개 이상의 영역 ("삽입 요소"), 1개 이상의 표적 뉴클레오티드 서열, 1개 이상의 3' 비번역 영역 (3'UTR), 및 1개 이상의 선택 요소. 핵산 시약에는 1개 이상의 상기 요소가 제공될 수 있고, 다른 요소는 핵산이 목적하는 유기체 내로 도입되기 전에 핵산 내로 삽입될 수 있다. 일부 실시양태에서, 제공된 핵산 시약은 프로모터, 5'UTR, 임의적인 3'UTR, 및 표적 뉴클레오티드 서열이 뉴클레오티드 산 시약 내로 삽입되는 (즉, 클로닝되는) 삽입 요소(들)를 포함한다. 특정 실시양태에서, 제공된 핵산 시약은 프로모터, 삽입 요소(들) 및 임의적인 3'UTR을 포함하고, 5'UTR/표적 뉴클레오티드 서열은 임의적인 3'UTR과 함께 삽입된다. 요소는 선택된 발현 시스템에서의 발현 (예를 들어, 선택된 유기체에서의 발현, 또는 예를 들어 무세포 시스템에서의 발현)에 적합한 임의의 순서로 배열될 수 있고, 일부 실시양태에서 핵산 시약은 5'에서 3' 방향으로 하기 요소를 포함한다: (1) 프로모터 요소, 5'UTR, 및 삽입 요소(들); (2) 프로모터 요소, 5'UTR, 및 표적 뉴클레오티드 서열; (3) 프로모터 요소, 5'UTR, 삽입 요소(들) 및 3'UTR; 및 (4) 프로모터 요소, 5'UTR, 표적 뉴클레오티드 서열 및 3'UTR. 일부 실시양태에서, UTR은 완전히 천연이거나 또는 비천연 뉴클레오티드를 함유하는 ORF의 전사 또는 번역을 변경 또는 증가시키도록 최적화될 수 있다.
핵산 시약, 예를 들어 발현 카세트 및/또는 발현 벡터는 프로모터, 인핸서, 번역 개시 서열, 전사 종결 서열 및 다른 요소를 포함한 다양한 조절 요소를 포함할 수 있다. "프로모터"는 일반적으로 전사 개시 부위에 관하여 비교적 고정된 위치에 있을 때 기능하는 DNA의 서열 또는 서열들이다. 예를 들어, 프로모터는 뉴클레오티드 트리포스페이트 수송체 핵산 절편의 상류에 있을 수 있다. "프로모터"는 RNA 폴리머라제 및 전사 인자의 기본 상호작용에 필요한 코어 요소를 함유하고, 상류 요소 및 반응 요소를 함유할 수 있다. "인핸서"는 일반적으로 전사 개시 부위로부터 고정되지 않은 거리에서 기능하고 전사 단위에 대해 5' 또는 3"일 수 있는 DNA의 서열을 지칭한다. 또한, 인핸서는 코딩 서열 그 자체의 내부뿐만 아니라 인트론 내부에서도 존재할 수 있다. 이들은 통상적으로 길이가 10 내지 300이고, 시스로 기능한다. 인핸서는 인근 프로모터로부터의 전사를 증가시키는 기능을 한다. 인핸서는 프로모터와 같이 종종 전사의 조절을 매개하는 반응 요소도 함유한다. 인핸서는 종종 발현의 조절을 결정하며, 완전히 천연이거나 또는 비천연 뉴클레오티드를 함유하는 ORF를 포함한 ORF 발현을 변경 또는 최적화하는데 사용될 수 있다.
상기 언급된 바와 같이, 핵산 시약은 또한 1개 이상의 5'UTR, 및 1개 이상의 3'UTR을 포함할 수 있다. 예를 들어, 진핵 숙주 세포 (예를 들어, 효모, 진균, 곤충, 식물, 동물, 인간 또는 유핵 세포) 및 원핵 숙주 세포 (예를 들어, 바이러스, 박테리아)에 사용되는 발현 벡터는 mRNA 발현에 영향을 미칠 수 있는 전사의 종결을 신호하는 서열을 함유할 수 있다. 이들 영역은 조직 인자 단백질을 코딩하는 mRNA의 비번역 부분에서 폴리아데닐화 절편으로서 전사될 수 있다. 3" 비번역 영역은 또한 전사 종결 부위를 포함한다. 일부 바람직한 실시양태에서, 전사 단위는 폴리아데닐화 영역을 포함한다. 이 영역의 한 가지 이점은 전사된 단위가 mRNA와 같이 프로세싱되고 수송될 가능성을 증가시킨다는 것이다. 발현 구축물에서 폴리아데닐화 신호의 확인 및 사용은 잘 확립되어 있다. 일부 바람직한 실시양태에서, 상동성 폴리아데닐화 신호가 트랜스진 구축물에 사용될 수 있다.
5'UTR은 그것이 기원하는 뉴클레오티드 서열에 내인성인 1개 이상의 요소를 포함할 수 있고, 때때로 1개 이상의 외인성 요소를 포함한다. 5'UTR은 예를 들어 임의의 적합한 유기체 (예를 들어, 바이러스, 박테리아, 효모, 진균, 식물, 곤충 또는 포유동물)로부터의, 임의의 적합한 핵산, 예컨대 게놈 DNA, 플라스미드 DNA, RNA 또는 mRNA로부터 기원할 수 있다. 관련 기술분야의 통상의 기술자는 선택된 발현 시스템 (예를 들어, 선택된 유기체에서의 발현, 또는 예를 들어 무세포 시스템에서의 발현)에 기초하여 5'UTR에 대한 적절한 요소를 선택할 수 있다. 5'UTR은 때때로 관련 기술분야의 통상의 기술자에게 공지된 하기 요소 중 1개 이상을 포함한다: 인핸서 서열 (예를 들어, 전사 또는 번역), 전사 개시 부위, 전사 인자 결합 부위, 번역 조절 부위, 번역 개시 부위, 번역 인자 결합 부위, 보조 단백질 결합 부위, 피드백 조절 작용제 결합 부위, 프리브노우(Pribnow) 박스, TATA 박스, -35 요소, E-박스 (헬릭스-루프-헬릭스 결합 요소), 리보솜 결합 부위, 레플리콘, 내부 리보솜 진입 부위 (IRES), 사일렌서 요소 등. 일부 실시양태에서, 프로모터 요소는 적절한 조건부 조절에 필요한 모든 5'UTR 요소가 프로모터 요소 단편 내에 또는 프로모터 요소 단편의 기능적 하위서열 내에 함유되도록 단리될 수 있다.
핵산 시약 내의 5'UTR은 번역 인핸서 뉴클레오티드 서열을 포함할 수 있다. 번역 인핸서 뉴클레오티드 서열은 종종 핵산 시약에서 프로모터와 표적 뉴클레오티드 서열 사이에 위치한다. 번역 인핸서 서열은 종종 리보솜에 결합하고, 때때로 18S rRNA-결합 리보뉴클레오티드 서열 (즉, 40S 리보솜 결합 서열)이고, 때때로 내부 리보솜 진입 서열 (IRES)이다. IRES는 일반적으로 다수의 특이적 분자간 상호작용을 통해 40S 리보솜 서브유닛과 접촉하는 정확하게 배치된 RNA 3차 구조를 갖는 RNA 스캐폴드를 형성한다. 리보솜 인핸서 서열의 예는 공지되어 있고, 관련 기술분야의 통상의 기술자에 의해 확인될 수 있다 (예를 들어, 문헌 [Mignone et al., Nucleic Acids Research 33: D141-D146 (2005); Paulous et al., Nucleic Acids Research 31: 722-733 (2003); Akbergenov et al., Nucleic Acids Research 32: 239-247 (2004); Mignone et al., Genome Biology 3(3): reviews0004.1-0001.10 (2002); Gallie, Nucleic Acids Research 30: 3401-3411 (2002); Shaloiko et al., DOI: 10.1002/bit.20267; 및 Gallie et al., Nucleic Acids Research 15: 3257-3273 (1987)]; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨).
번역 인핸서 서열은 때때로 진핵 서열, 예컨대 코작(Kozak) 컨센서스 서열 또는 다른 서열 (예를 들어, 히드로이드 폴립 서열, 진뱅크(GenBank) 수탁 번호 U07128)이다. 번역 인핸서 서열은 때때로 원핵 서열, 예컨대 샤인-달가노(Shine-Dalgarno) 컨센서스 서열이다. 특정 실시양태에서, 번역 인핸서 서열은 바이러스 뉴클레오티드 서열이다. 번역 인핸서 서열은 때때로 예를 들어 식물 바이러스, 예컨대 담배 모자이크 바이러스 (TMV), 알팔파 모자이크 바이러스 (AMV); 담배 식각 바이러스 (ETV); 감자 바이러스 Y (PVY); 순무 모자이크 (포티) 바이러스 및 완두 종자 매개 모자이크 바이러스의 5'UTR로부터의 것이다. 특정 실시양태에서, TMV로부터의 약 67개 염기 길이의 오메가 서열이 번역 인핸서 서열 (예를 들어, 구아노신 뉴클레오티드가 없고, 25개 뉴클레오티드 길이의 폴리 (CAA) 중심 영역을 포함함)로서 핵산 시약에 포함된다.
3'UTR은 그것이 기원하는 뉴클레오티드 서열에 내인성인 1개 이상의 요소를 포함할 수 있고, 때때로 1개 이상의 외인성 요소를 포함한다. 3'UTR은 임의의 적합한 핵산, 예컨대 게놈 DNA, 플라스미드 DNA, RNA 또는 mRNA로부터, 예를 들어 임의의 적합한 유기체 (예를 들어, 바이러스, 박테리아, 효모, 진균, 식물, 곤충 또는 포유동물)로부터 기원할 수 있다. 관련 기술분야의 통상의 기술자는 선택된 발현 시스템 (예를 들어, 선택된 유기체에서의 발현)에 기초하여 3'UTR에 대한 적절한 요소를 선택할 수 있다. 3'UTR은 때때로 관련 기술분야의 통상의 기술자에게 공지된 하기 요소 중 1개 이상을 포함한다: 전사 조절 부위, 전사 개시 부위, 전사 종결 부위, 전사 인자 결합 부위, 번역 조절 부위, 번역 종결 부위, 번역 개시 부위, 번역 인자 결합 부위, 리보솜 결합 부위, 레플리콘, 인핸서 요소, 사일렌서 요소 및 폴리아데노신 테일. 3'UTR은 종종 폴리아데노신 테일을 포함하고, 때로는 이를 포함하지 않으며, 폴리아데노신 테일이 존재하는 경우에, 1개 이상의 아데노신 모이어티가 부가 또는 그로부터 결실될 수 있다 (예를 들어, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 35, 약 40, 약 45 또는 약 50개의 아데노신 모이어티가 부가 또는 제거될 수 있음).
일부 실시양태에서, 5'UTR 및/또는 3'UTR의 변형은 프로모터의 활성을 변경 (예를 들어, 증가, 부가, 감소 또는 실질적으로 제거)하기 위해 사용된다. 프로모터 활성의 변경은 다시 변형된 5' 또는 3'UTR을 포함하는 작동가능하게 연결된 프로모터 요소로부터의 관심 뉴클레오티드 서열(들)의 전사에서의 변화에 의해 펩티드, 폴리펩티드 또는 단백질의 활성 (예를 들어, 효소 활성)을 변경시킬 수 있다. 예를 들어, 특정 실시양태에서, 신규 활성 (예를 들어, 숙주 유기체에서 정상적으로 발견되지 않는 활성)을 부가할 수 있거나 또는 관심 뉴클레오티드 서열 (예를 들어, 관심 상동 또는 이종 뉴클레오티드 서열)에 작동가능하게 연결된 상동 또는 이종 프로모터로부터의 전사를 증가시킴으로써 기존 활성의 발현을 증가시킬 수 있는 변형된 5' 또는 3'UTR을 포함하는 핵산 시약이 발현되도록 유전자 변형에 의해 미생물이 조작될 수 있다. 일부 실시양태에서, 미생물은 특정 실시양태에서 관심 뉴클레오티드 서열에 작동가능하게 연결된 상동성 또는 이종성 프로모터로부터의 전사를 감소시키거나 또는 실질적으로 제거함으로써 활성의 발현을 감소시킬 수 있는 변형된 5' 또는 3'UTR을 포함하는 핵산 시약을 발현하도록 유전자 변형에 의해 조작될 수 있다.
발현 카세트 또는 발현 벡터로부터의 뉴클레오티드 트리포스페이트 수송체의 발현은 원핵 세포 또는 진핵 세포에서 발현할 수 있는 임의의 프로모터에 의해 제어될 수 있다. 프로모터 요소는 전형적으로 DNA 합성 및/또는 RNA 합성에 요구된다. 프로모터 요소는 종종 유전자에 상응하는 RNA의 합성을 위한 출발 부위를 제공함으로써 특정한 유전자의 전사를 용이하게 할 수 있는 DNA의 영역을 포함한다. 일부 실시양태에서, 프로모터는 일반적으로 이들이 조절하는 유전자 근처에 위치하고, 유전자의 상류 (예를 들어, 유전자의 5')에 위치하고, 유전자의 센스 가닥과 동일한 DNA 가닥 상에 존재한다. 일부 실시양태에서, 프로모터 요소는 유전자 또는 유기체로부터 단리되고, 폴리뉴클레오티드 서열과 기능적으로 연결되어 삽입되어 변경된 및/또는 조절된 발현을 허용할 수 있다. 핵산의 발현에 사용되는 비천연 프로모터 (예를 들어, 주어진 핵산 서열과 정상적으로 회합되지 않는 프로모터)는 종종 이종 프로모터로 지칭된다. 특정 실시양태에서, 이종 프로모터 및/또는 5'UTR은 본원에 기재된 바와 같은 목적하는 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드와 기능적으로 연결되어 삽입될 수 있다. 프로모터와 관련하여 본원에 사용된 용어 "작동가능하게 연결된" 및 "와 기능적으로 연결된"은 코딩 서열과 프로모터 요소 사이의 관계를 지칭한다. 프로모터는 전사를 통한 코딩 서열로부터의 발현이 프로모터 요소에 의해 조절되거나 제어되는 경우에 코딩 서열과 작동가능하게 연결되거나 기능적으로 연결된 것이다. 용어 "작동가능하게 연결된" 및 "기능적으로 연결된"은 프로모터 요소에 대해 본원에서 상호교환가능하게 이용된다.
프로모터는 종종 RNA 폴리머라제와 상호작용한다. 폴리머라제는 기존의 핵산 시약을 사용하여 핵산의 합성을 촉매하는 효소이다. 주형이 DNA 주형인 경우, RNA 분자는 단백질이 합성되기 전에 전사된다. 본 발명의 방법에 사용하기에 적합한 폴리머라제 활성을 갖는 효소는 단백질을 합성하기 위해 선택된 주형을 사용하여 선택된 시스템에서 활성인 임의의 폴리머라제를 포함한다. 일부 실시양태에서, 본원에서 프로모터 요소로도 지칭되는 프로모터 (예를 들어, 이종 프로모터)는 뉴클레오티드 서열 또는 오픈 리딩 프레임 (ORF)에 작동가능하게 연결될 수 있다. 프로모터 요소로부터의 전사는 프로모터에 작동가능하게 연결된 뉴클레오티드 서열 또는 ORF 서열에 대응하는 RNA의 합성을 촉매할 수 있으며, 이는 다시 목적하는 펩티드, 폴리펩티드 또는 단백질의 합성을 유도한다.
프로모터 요소는 때때로 조절 제어에 대한 반응성을 나타낸다. 프로모터 요소는 또한 때때로 선택적 작용제에 의해 조절될 수 있다. 즉, 프로모터 요소로부터의 전사는 때때로 환경, 영양 또는 내부 조건 또는 신호의 변화에 반응하여 켜지거나, 꺼지거나, 상향조절되거나 또는 하향조절될 수 있다 (예를 들어, 열 유도성 프로모터, 광 조절 프로모터, 피드백 조절 프로모터, 호르몬 영향 프로모터, 조직 특이적 프로모터, 산소 및 pH 영향 프로모터, 선택적 작용제 (예를 들어, 카나마이신)에 반응성인 프로모터 등). 환경, 영양 또는 내부 신호에 의해 영향을 받는 프로모터는 프로모터에서 또는 그 근처에 결합하고 특정 조건 하에 표적 서열의 발현을 증가 또는 감소시키는 신호 (직접 또는 간접)에 의해 빈번하게 영향을 받는다. 본원에 개시된 모든 방법에서와 같이, 천연 또는 변형된 프로모터의 포함은 완전 천연 ORF (예를 들어 NTT 또는 aaRS) 또는 비천연 뉴클레오티드를 함유하는 ORF (예를 들어 mRNA 또는 tRNA)의 발현을 변경 또는 최적화하는데 사용될 수 있다.
본원에 기재된 실시양태에서 사용되는 프로모터 요소로부터의 전사에 영향을 미치는 선택적 작용제 또는 조절제의 비제한적 예는 비제한적으로 하기를 포함한다: (1) 다른 독성 화합물에 대한 내성을 제공하는 생성물 (예를 들어, 항생제)을 코딩하는 핵산 절편; (2) 다른 수용자 세포에서 결여된 생성물 (예를 들어, 필수 생성물, tRNA 유전자, 영양요구성 마커)을 코딩하는 핵산 절편; (3) 유전자 산물의 활성을 억제하는 생성물을 코딩하는 핵산 절편; (4) 용이하게 확인될 수 있는 생성물 (예를 들어, 표현형 마커, 예컨대 항생제 (예를 들어, β-락타마제), β-갈락토시다제, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP), 및 세포 표면 단백질)을 코딩하는 핵산 절편; (5) 달리 세포 생존 및/또는 기능에 유해한 생성물에 결합하는 핵산 절편; (6) 달리 상기 번호 1-5에 기재된 임의의 핵산 절편의 활성을 억제하는 핵산 절편 (예를 들어, 안티센스 올리고뉴클레오티드); (7) 기질을 변형시키는 생성물 (예를 들어, 제한 엔도뉴클레아제)에 결합하는 핵산 절편; (8) 원하는 분자 (예를 들어, 특이적 단백질 결합 부위)를 단리 또는 확인하는데 사용될 수 있는 핵산 절편; (9) 달리 비-기능적일 수 있는 (예를 들어, 분자의 하위집단의 PCR 증폭을 위한) 특정 뉴클레오티드 서열을 코딩하는 핵산 절편; (10) 부재시, 특정 화합물에 대한 내성 또는 감수성을 직접적으로 또는 간접적으로 부여하는 핵산 절편; (11) 수용자 세포에서 독성이거나 또는 상대적으로 비-독성인 화합물을 독성 화합물로 전환시키는 생성물 (예를 들어, 단순 포진 티미딘 키나제, 시토신 데아미나제)을 코딩하는 핵산 절편; (12) 핵산 분자의 복제, 분할 또는 유전성을 억제하는 핵산 절편 (상기 핵산 분자는 상기 핵산 절편을 함유함); (13) 조건부 복제 기능, 예를 들어 특정 숙주 또는 숙주 세포 균주에서의 또는 특정 환경 조건 (예를 들어, 온도, 영양 조건 등) 하에서의 복제를 코딩하는 핵산 절편; 및/또는 (14) 비천연 뉴클레오티드를 포함하는 1개 이상의 mRNA 또는 tRNA를 코딩하는 핵산. 일부 실시양태에서, 조절제 또는 선택적 작용제는 유기체가 적용되는 기존 성장 조건 (예를 들어, 액체 배양물에서의 성장, 발효기에서의 성장, 고체 영양 플레이트 상에서의 성장 등)을 변화시키기 위해 첨가될 수 있다.
일부 실시양태에서, 프로모터 요소의 조절은 펩티드, 폴리펩티드 또는 단백질의 활성 (예를 들어, 효소 활성)을 변경 (예를 들어, 증가, 부가, 감소 또는 실질적으로 제거)하기 위해 사용될 수 있다. 예를 들어, 미생물은 특정 실시양태에서, 신규 활성 (예를 들어, 숙주 유기체에서 정상적으로 발견되지 않는 활성)을 부가할 수 있거나 또는 관심 뉴클레오티드 서열 (예를 들어, 관심 상동 또는 이종 뉴클레오티드 서열)에 작동가능하게 연결된 상동 또는 이종 프로모터로부터의 전사를 증가시킴으로써 기존 활성의 발현을 증가시킬 수 있는 핵산 시약을 발현하도록 유전자 변형에 의해 조작될 수 있다. 일부 실시양태에서, 미생물은 특정 실시양태에서 유전자 변형에 의해 조작되어 관심 뉴클레오티드 서열에 작동가능하게 연결된 상동성 또는 이종성 프로모터로부터의 전사를 감소시키거나 또는 실질적으로 제거함으로써 활성의 발현을 감소시킬 수 있는 핵산 시약을 발현시킬 수 있다.
이종 단백질, 예를 들어 뉴클레오티드 트리포스페이트 수송체를 코딩하는 핵산은 임의의 적합한 발현 시스템 내로 삽입되거나 그와 함께 사용될 수 있다. 일부 실시양태에서, 핵산 시약은 때때로 숙주 유기체의 염색체 내로 안정하게 통합되거나, 또는 핵산 시약은 특정 실시양태에서 숙주 염색체의 일부의 결실일 수 있다 (예를 들어, 유전자 변형된 유기체, 여기서 숙주 게놈의 변경은 유전자 변형을 보유하는 목적하는 유기체를 선택적으로 또는 우선적으로 유지하는 능력을 부여함). 이러한 핵산 시약 (예를 들어, 변경된 게놈이 유기체에 선택가능한 형질을 부여하는 핵산 또는 유전자 변형 유기체)은 목적하는 단백질 또는 핵산 분자의 생산을 가이드하는 그의 능력에 대해 선택될 수 있다. 원하는 경우에, 핵산 시약은 코돈이 (i) 천연 서열에 명시된 것과 상이한 tRNA를 사용하는 동일한 아미노산, 또는 (ii) 비통상적 또는 비천연 아미노산 (검출가능하게 표지된 아미노산 포함)을 비롯하여, 보통의 것과 상이한 아미노산을 코딩하도록 변경될 수 있다.
재조합 발현은 벡터, 예컨대 플라스미드의 일부일 수 있는 발현 카세트를 사용하여 유용하게 달성된다. 벡터는 뉴클레오티드 트리포스페이트 수송체를 코딩하는 핵산에 작동가능하게 연결된 프로모터를 포함할 수 있다. 벡터는 또한 본원에 기재된 바와 같은 전사 및 번역에 필요한 다른 요소를 포함할 수 있다. 발현 카세트, 발현 벡터, 및 카세트 또는 벡터 내의 서열은 비천연 뉴클레오티드가 접촉되는 세포에 대해 이종성일 수 있다. 예를 들어, 뉴클레오티드 트리포스페이트 수송체 서열은 세포에 대해 이종성일 수 있다.
뉴클레오티드 트리포스페이트 수송체의 운반, 코딩 및/또는 발현에 적합한 다양한 원핵 및 진핵 발현 벡터가 생산될 수 있다. 이러한 발현 벡터는, 예를 들어 pET, pET3d, pCR2.1, pBAD, pUC 및 효모 벡터를 포함한다. 벡터는 예를 들어 다양한 생체내 및 시험관내 상황에서 사용될 수 있다. 사용될 수 있는 원핵 프로모터의 비제한적 예는 SP6, T7, T5, tac, bla, trp, gal, lac 또는 말토스 프로모터를 포함한다. 사용될 수 있는 진핵 프로모터의 비제한적 예는 구성적 프로모터, 예를 들어 바이러스 프로모터, 예컨대 CMV, SV40 및 RSV 프로모터, 뿐만 아니라 조절성 프로모터, 예를 들어 유도성 또는 억제성 프로모터, 예컨대 tet 프로모터, hsp70 프로모터, 및 CRE에 의해 조절되는 합성 프로모터를 포함한다. 박테리아 발현을 위한 벡터는 pGEX-5X-3을 포함하고, 진핵생물 발현을 위한 벡터는 pCIneo-CMV를 포함한다. 사용될 수 있는 바이러스 벡터는 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 포진 바이러스, 백시니아 바이러스, 소아마비 바이러스, AIDS 바이러스, 뉴런 영양 바이러스, 신드비스 및 다른 바이러스와 관련된 것을 포함한다. 벡터로서 사용하기에 적합하게 하는 이들 바이러스의 특성을 공유하는 임의의 바이러스 패밀리가 또한 유용하다. 사용될 수 있는 레트로바이러스 벡터는 문헌 [Verma, American Society for Microbiology, pp. 229-232, Washington, (1985)]에 기재된 것을 포함한다. 예를 들어, 이러한 레트로바이러스 벡터는 뮤린 말로니 백혈병 바이러스 (MMLV), 및 바람직한 특성을 발현하는 다른 레트로바이러스를 포함할 수 있다. 전형적으로, 바이러스 벡터는 비구조적 초기 유전자, 구조적 후기 유전자, RNA 폴리머라제 III 전사체, 복제 및 캡시드화에 필요한 역전된 말단 반복부, 및 바이러스 게놈의 전사 및 복제를 제어하는 프로모터를 함유한다. 벡터로서 조작되는 경우에, 바이러스는 전형적으로 초기 유전자 중 1개 이상이 제거되고, 유전자 또는 유전자/프로모터 카세트가 제거된 바이러스 핵산 대신에 바이러스 게놈 내로 삽입된다.
클로닝
관련 기술분야에 공지된 임의의 편리한 클로닝 전략을 이용하여 요소, 예컨대 ORF를 핵산 시약 내로 혼입시킬 수 있다. (1) 1개 이상의 기존의 제한 효소 부위에서 주형을 절단하고 관심 요소를 라이게이션하는 방법 및 (2) 1개 이상의 적합한 제한 효소 부위를 포함하는 올리고뉴클레오티드 프라이머를 혼성화시키고 폴리머라제 연쇄 반응에 의해 증폭시킴으로써 제한 효소 부위를 주형에 부가하는 방법 (본원에 보다 상세히 기재됨)과 같은 공지된 방법이 요소를 삽입 요소와 독립적으로 주형 내로 삽입하는데 이용될 수 있다. 다른 클로닝 전략은 예를 들어 핵산 시약 내에 존재하거나 그에 삽입된 1개 이상의 삽입 부위, 예컨대 PCR을 위한 올리고뉴클레오티드 프라이머 혼성화 부위, 및 본원에 기재된 다른 것을 이용한다. 일부 실시양태에서, 클로닝 전략은 유전자 조작, 예컨대 재조합 (예를 들어, 본원에 추가로 기재된 바와 같이, 변형시킬 유기체의 게놈 내로의 핵산 시약과 관심 핵산 서열의 재조합)과 조합될 수 있다. 일부 실시양태에서, 클로닝된 ORF(들)는 미생물을 1개 이상의 관심 ORF로 조작함으로써 변형된 또는 야생형 뉴클레오티드 트리포스페이트 수송체 및/또는 폴리머라제를 (직접적으로 또는 간접적으로) 생산할 수 있으며 이 미생물은 뉴클레오티드 트리포스페이트 수송체 활성 또는 폴리머라제 활성의 변경된 활성을 포함한다.
핵산은 핵산을 1개 이상의 특이적 절단제와 접촉시킴으로써 특이적으로 절단될 수 있다. 특이적 절단제는 종종 특정한 부위에서 특정한 뉴클레오티드 서열에 따라 특이적으로 절단할 것이다. 효소 특이적 절단제의 예는 비제한적으로 엔도뉴클레아제 (예를 들어, DNase (예를 들어, DNase I, II); RNase (예를 들어, RNase E, F, H, P); 클리바제(Cleavase)™ 효소; Taq DNA 폴리머라제; 이. 콜라이 DNA 폴리머라제 I 및 진핵 구조-특이적 엔도뉴클레아제; 뮤린 FEN-1 엔도뉴클레아제; 유형 I, II 또는 III 제한 엔도뉴클레아제, 예컨대 Acc I, Afl III, Alu I, Alw44 I, Apa I, Asn I, Ava I, Ava II, BamH I, Ban II, Bcl I, Bgl I, Bgl II, Bln I, BsaI, Bsm I, BsmBI, BssH II, BstE II, Cfo I, CIa I, Dde I, Dpn I, Dra I, EcIX I, EcoR I, EcoR I, EcoR II, EcoR V, Hae II, Hae II, Hind II, Hind III, Hpa I, Hpa II, Kpn I, Ksp I, Mlu I, MIuN I, Msp I, Nci I, Nco I, Nde I, Nde II, Nhe I, Not I, Nru I, Nsi I, Pst I, Pvu I, Pvu II, Rsa I, Sac I, Sal I, Sau3A I, Sca I, ScrF I, Sfi I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, Taq I, Xba I, Xho I); 글리코실라제 (예를 들어, 우라실-DNA 글리코실라제 (UDG), 3-메틸아데닌 DNA 글리코실라제, 3-메틸아데닌 DNA 글리코실라제 II, 피리미딘 수화물-DNA 글리코실라제, FaPy-DNA 글리코실라제, 티민 미스매치-DNA 글리코실라제, 하이포크산틴-DNA 글리코실라제, 5-히드록시메틸우라실 DNA 글리코실라제 (HmUDG), 5-히드록시메틸시토신 DNA 글리코실라제, 또는 1,N6-에테노-아데닌 DNA 글리코실라제); 엑소뉴클레아제 (예를 들어, 엑소뉴클레아제 III); 리보자임; 및 DNA자임을 포함한다. 샘플 핵산을 화학적 작용제로 처리하거나, 또는 변형된 뉴클레오티드를 사용하여 합성할 수 있고, 변형된 핵산을 절단할 수 있다. 비제한적 예에서, 샘플 핵산은 (i) 알킬 퓨린 DNA-글리코실라제에 의해 인식되고 절단되는 N3-메틸아데닌 및 N3-메틸구아닌을 포함한 여러 알킬화 염기를 생성하는 알킬화제, 예컨대 메틸니트로소우레아; (ii) DNA 내 시토신 잔기의 탈아미노화를 유발하여 우라실 N-글리코실라제에 의해 절단될 수 있는 우라실 잔기를 형성하는 중아황산나트륨; 및 (iii) 포름아미도피리미딘 DNA N-글리코실라제에 의해 절단될 수 있는, 구아닌을 그의 산화된 형태, 8-히드록시구아닌으로 전환시키는 화학적 작용제로 처리될 수 있다. 화학적 절단 프로세스의 예는 비제한적으로 알킬화 (예를 들어, 포스포로티오에이트-변형된 핵산의 알킬화); P3'-N5'-포스포로아미데이트-함유 핵산의 산 불안정성의 절단; 및 핵산의 사산화오스뮴 및 피페리딘 처리를 포함한다.
일부 실시양태에서, 핵산 시약은 1개 이상의 레콤비나제 삽입 부위를 포함한다. 레콤비나제 삽입 부위는 재조합 단백질에 의한 통합/재조합 반응에 참여하는 핵산 분자 상의 인식 서열이다. 예를 들어, Cre 레콤비나제에 대한 재조합 부위는 8개 염기 쌍 코어 서열에 플랭킹된 2개의 13개 염기 쌍 역전 반복부 (레콤비나제 결합 부위로서 작용함)로 구성된 34개 염기 쌍 서열인 loxP이다 (예를 들어, 문헌 [Sauer, Curr. Opin. Biotech. 5:521-527 (1994)]). 재조합 부위의 다른 예는 attB, attP, attL, 및 attR 서열, 및 재조합 단백질 λ Int 및 보조 단백질 통합 숙주 인자 (IHF), FIS 및 엑시시나제 (Xis)에 의해 인식되는 그의 돌연변이체, 단편, 변이체 및 유도체를 포함한다 (예를 들어, 미국 특허 번호 5,888,732; 6,143,557; 6,171,861; 6,270,969; 6,277,608; 및 6,720,140; 미국 특허 출원 번호 09/517,466 및 09/732,914; 미국 특허 공개 번호 US2002/0007051; 및 문헌 [Landy, Curr. Opin. Biotech. 3:699-707 (1993)]; 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨).
레콤비나제 클로닝 핵산의 예는 게이트웨이(Gateway)® 시스템 (인비트로젠(Invitrogen), 캘리포니아주)이며, 이는 생체내 또는 시험관내에서 목적하는 핵산 분자를 클로닝하기 위한 적어도 하나의 재조합 부위를 포함한다. 일부 실시양태에서, 시스템은 종종 박테리오파지 람다 시스템 (예를 들어, att1 및 att2)을 기반으로 하여 적어도 2개의 상이한 부위-특이적 재조합 부위를 함유하고 야생형 (att0) 부위로부터 돌연변이된 벡터를 이용한다. 각각의 돌연변이된 부위는 동일한 유형의 그의 동족 파트너 att 부위 (즉, 그의 결합 파트너 재조합 부위) (예를 들어 attB1과 attP1, 또는 attL1과 attR1)에 대해 고유한 특이성을 갖고, 다른 돌연변이체 유형의 재조합 부위 또는 야생형 att0 부위와 교차-반응하지 않을 것이다. 상이한 부위 특이성은 목적하는 분자의 방향성 클로닝 또는 연결을 허용하여 클로닝된 분자의 목적하는 배향을 제공한다. 재조합 부위에 의해 플랭킹된 핵산 단편을 클로닝하고, 때때로 목표 벡터로 지칭되는 수용자 플라스미드 분자 상의 att 부위에 의해 플랭킹된 선택 마커 (예를 들어, ccdB)를 대체함으로써 게이트웨이® 시스템을 사용하여 서브클로닝한다. 이어서, ccdB 감수성 숙주 균주의 형질전환 및 수용자 분자 상의 마커에 대한 양성 선택에 의해 목적하는 클론을 선택한다. 음성 선택 (예를 들어, 독성 유전자의 사용)을 위한 유사한 전략이 다른 유기체, 예컨대 포유동물 및 곤충에서의 티미딘 키나제 (TK)에서 사용될 수 있다.
핵산 시약은 때때로 1개 이상의 복제 기점 (ORI) 요소를 함유한다. 일부 실시양태에서, 주형은 2개 이상의 ORI를 포함하며, 여기서 하나는 하나의 유기체 (예를 들어, 박테리아)에서 효율적으로 기능하고 또 다른 것은 또 다른 유기체 (예를 들어, 진핵생물, 예컨대 효모)에서 효율적으로 기능한다. 일부 실시양태에서, ORI는 하나의 종 (예를 들어, 에스. 세레비지아에)에서 효율적으로 기능할 수 있고, 또 다른 ORI는 상이한 종 (예를 들어, 에스. 폼베)에서 효율적으로 기능할 수 있다. 핵산 시약은 또한 때때로 1개 이상의 전사 조절 부위를 포함한다.
핵산 시약, 예를 들어 발현 카세트 또는 벡터는 마커 생성물을 코딩하는 핵산 서열을 포함할 수 있다. 마커 생성물은 유전자가 세포에 전달되었고 일단 전달되면 발현되고 있는지를 결정하기 위해 사용된다. 마커 유전자의 예는 β-갈락토시다제 및 녹색 형광 단백질을 코딩하는 이. 콜라이 lacZ 유전자를 포함한다. 일부 실시양태에서, 마커는 선택 마커일 수 있다. 이러한 선택 마커가 숙주 세포 내로 성공적으로 전달된 경우, 형질전환된 숙주 세포는 선택 압력 하에 놓여도 생존할 수 있다. 선택적 요법의 2개의 널리 사용되는 별개의 카테고리가 존재한다. 제1 카테고리는 세포의 대사 및 보충된 배지와 무관하게 성장하는 능력이 결여된 돌연변이 세포주의 사용에 기초한다. 제2 카테고리는 임의의 세포 유형에서 사용되는 선택 체계를 지칭하고 돌연변이체 세포주의 사용을 필요로 하지 않는 우성 선택이다. 이들 체계는 전형적으로 숙주 세포의 성장을 정지시키는 약물을 사용한다. 신규 유전자를 갖는 이러한 세포는 약물 내성을 전달하는 단백질을 발현할 것이고, 선택에서 생존할 것이다. 이러한 우성 선택의 예는 약물 네오마이신 (Southern et al., J. Molec. Appl. Genet. 1: 327 (1982)), 미코페놀산 (Mulligan et al., Science 209: 1422 (1980)) 또는 히그로마이신 (Sugden, et al., Mol. Cell. Biol. 5: 410-413 (1985); 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨)을 사용한다.
핵산 시약은 1개 이상의 선택 요소 (예를 들어, 선택적으로 조절될 수 있는 프로모터 요소의 활성화가 아닌, 핵산 시약의 존재의 선택을 위한 요소)를 포함할 수 있다. 선택 요소는 종종 핵산 시약이 세포에 포함되는지 여부를 결정하기 위해 공지된 방법을 사용하여 이용된다. 일부 실시양태에서, 핵산 시약은 2개 이상의 선택 요소를 포함하며, 여기서 하나는 하나의 유기체에서 효율적으로 기능하고, 또 다른 것은 또 다른 유기체에서 효율적으로 기능한다. 선택 요소의 예는 하기를 포함하나 이에 제한되지는 않는다: (1) 다른 독성 화합물에 대한 내성을 제공하는 생성물 (예를 들어, 항생제)을 코딩하는 핵산 절편; (2) 다른 수용자 세포에서 결여된 생성물 (예를 들어, 필수 생성물, tRNA 유전자, 영양요구성 마커)을 코딩하는 핵산 절편; (3) 유전자 산물의 활성을 억제하는 생성물을 코딩하는 핵산 절편; (4) 용이하게 확인될 수 있는 생성물 (예를 들어, 표현형 마커, 예컨대 항생제 (예를 들어, β-락타마제), β-갈락토시다제, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP), 및 세포 표면 단백질)을 코딩하는 핵산 절편; (5) 달리 세포 생존 및/또는 기능에 유해한 생성물에 결합하는 핵산 절편; (6) 달리 상기 번호 1-5에 기재된 임의의 핵산 절편의 활성을 억제하는 핵산 절편 (예를 들어, 안티센스 올리고뉴클레오티드); (7) 기질을 변형시키는 생성물 (예를 들어, 제한 엔도뉴클레아제)에 결합하는 핵산 절편; (8) 원하는 분자 (예를 들어, 특이적 단백질 결합 부위)를 단리 또는 확인하는데 사용될 수 있는 핵산 절편; (9) 달리 비-기능적일 수 있는 (예를 들어, 분자의 하위집단의 PCR 증폭을 위한) 특정 뉴클레오티드 서열을 코딩하는 핵산 절편; (10) 부재시, 특정 화합물에 대한 내성 또는 감수성을 직접적으로 또는 간접적으로 부여하는 핵산 절편; (11) 수용자 세포에서 독성이거나 또는 상대적으로 비-독성인 화합물을 독성 화합물로 전환시키는 생성물 (예를 들어, 단순 포진 티미딘 키나제, 시토신 데아미나제)을 코딩하는 핵산 절편; (12) 핵산 분자의 복제, 분할 또는 유전성을 억제하는 핵산 절편 (상기 핵산 분자는 상기 핵산 절편을 함유함); 및/또는 (13) 조건부 복제 기능, 예를 들어 특정 숙주 또는 숙주 세포 균주에서의 또는 특정 환경 조건 (예를 들어, 온도, 영양 조건 등) 하에서의 복제를 코딩하는 핵산 절편.
핵산 시약은 생체내 전사 및/또는 번역에 유용한 임의의 형태일 수 있다. 핵산은 때때로 플라스미드, 예컨대 슈퍼코일드 플라스미드이고, 때때로 효모 인공 염색체 (예를 들어, YAC)이고, 때때로 선형 핵산 (예를 들어, PCR 또는 제한 소화에 의해 생산된 선형 핵산)이고, 때때로 단일-가닥이고, 때때로 이중-가닥이다. 핵산 시약은 때때로 증폭 과정, 예컨대 폴리머라제 연쇄 반응 (PCR) 프로세스 또는 전사-매개 증폭 프로세스 (TMA)에 의해 제조된다. TMA에서, 2종의 효소가 등온 반응에 사용되어 발광에 의해 검출된 증폭 생성물을 생성한다 (예를 들어, 문헌 [Biochemistry 1996 Jun 25;35(25):8429-38]). 표준 PCR 프로세스는 공지되어 있고 (예를 들어, 미국 특허 번호 4,683,202; 4,683,195; 4,965,188; 및 5,656,493), 일반적으로 사이클로 수행된다. 각각의 사이클은 하이브리드 핵산이 해리되는 열 변성; 프라이머 올리고뉴클레오티드가 혼성화하는 냉각; 및 폴리머라제 (즉, Taq 폴리머라제)에 의한 올리고뉴클레오티드의 연장을 포함한다. PCR 순환 프로세스의 예는 샘플을 95℃에서 5분 동안 처리하고; 95℃에서 1분, 59℃에서 1분 10초, 및 72℃에서 1분 30초의 45회 사이클을 반복하고; 이어서 샘플을 72℃에서 5분 동안 처리하는 것이다. 다수의 주기는 흔히 상업적으로 입수가능한 써멀 사이클러를 사용하여 수행된다. PCR 증폭 생성물은 때때로 보다 낮은 온도 (예를 들어, 4℃)에서 일정 시간 동안 저장되고, 때때로 분석 전에 동결된다 (예를 들어, -20℃).
상기 기재된 것과 유사한 클로닝 전략을 사용하여 비천연 뉴클레오티드를 함유하는 DNA를 생산할 수 있다. 예를 들어, 목적하는 위치에 비천연 뉴클레오티드를 함유하는 올리고뉴클레오티드는 표준 고체-상 합성을 사용하여 합성되고, HPLC에 의해 정제된다. 이어서, 클로닝 부위, 예컨대 BsaI 부위를 사용하는 클로닝 방법 (예컨대, 골든 게이트 어셈블리(Golden Gate Assembly))을 사용하여 필요한 서열 콘텍스트 (즉, UTR 및 코딩 서열)를 함유하는 플라스미드 내로 올리고뉴클레오티드를 삽입한다 (그러나, 상기 논의된 다른 것이 사용될 수 있음).
키트/제조품
특정 실시양태에서, 본원에 기재된 1개 이상의 방법과 함께 사용하기 위한 키트 및 제조품이 본원에 개시된다. 이러한 키트는 1개 이상의 용기 예컨대 바이알, 튜브 등을 수용하기 위해 구획화된 운반체, 포장, 또는 용기 (각각의 용기(들)는 본원에 기재된 방법에 사용될 개별 요소 중 하나를 포함함)를 포함한다. 적합한 용기는 예를 들어 병, 바이알, 시린지 및 시험 튜브를 포함한다. 한 실시양태에서, 용기는 다양한 재료, 예컨대 유리 또는 플라스틱으로부터 형성된다.
일부 실시양태에서, 키트는 키트의 내용물을 수용하기에 적합한 포장 재료를 포함한다. 일부 경우에, 포장 재료는 바람직하게는 멸균, 오염물-무함유 환경을 제공하기 위해 널리 공지된 방법에 의해 구축된다. 본원에 사용된 포장 재료는, 예를 들어 핵산 서열분석 시스템과 함께 사용하기 위해 판매되는 상업용 키트에 통상적으로 이용되는 것을 포함할 수 있다. 예시적인 포장 재료는 비제한적으로, 본원에 제시된 구성요소를 고정된 한계 내에서 유지할 수 있는 유리, 플라스틱, 종이, 호일 등을 포함한다.
포장 재료는 성분에 대한 특정한 용도를 나타내는 라벨을 포함할 수 있다. 라벨에 의해 지시되는 키트의 용도는 키트에 존재하는 성분들의 특정 조합에 적절한 것으로 본원에 제시된 방법 중 하나 이상일 수 있다. 예를 들어, 표지는 키트가 폴리뉴클레오티드를 합성하는 방법 또는 핵산의 서열을 결정하는 방법에 유용하다는 것을 나타낼 수 있다.
포장된 시약 또는 성분의 사용에 대한 지침서가 또한 키트에 포함될 수 있다. 지침서는 전형적으로 반응 파라미터, 예컨대 혼합될 키트 성분 및 샘플의 상대량, 시약/샘플 혼합물을 위한 유지 기간, 온도, 완충제 조건 등을 기재하는 유형의 표현을 포함할 것이다.
특정 반응에 필요한 모든 성분이 특정 키트에 존재할 필요는 없다는 것이 이해될 것이다. 오히려 1개 이상의 추가의 성분이 다른 공급원으로부터 제공될 수 있다. 키트와 함께 제공된 지침서는 제공될 추가의 성분(들) 및 이들이 수득될 수 있는 곳을 확인할 수 있다.
일부 실시양태에서, 예를 들어 유전자 조작된 세포를 제조하기 위한 본 발명에 의해 제공된 방법을 사용하여 비천연 핵산을 세포 핵산 내로 안정하게 혼입시키는데 유용한 키트가 제공된다. 한 실시양태에서, 본원에 기재된 키트는 유전자 조작된 세포 및 1개 이상의 비천연 핵산을 포함한다. 또 다른 실시양태에서, 본원에 기재된 키트는 서열식별번호: 1-2로부터 선택된 서열을 포함하는 단리 및 정제된 플라스미드를 포함한다. 추가 실시양태에서, 본원에 기재된 키트는 서열식별번호: 3-20으로부터 선택된 서열을 포함하는 프라이머를 포함한다.
추가의 실시양태에서, 본원에 기재된 키트는 세포, 및 세포 내로의 도입을 위한 이종 유전자를 함유하는 핵산 분자를 제공함으로써, 유전자 조작된 세포, 예컨대 본 단락에서 상기 기재된 임의의 실시양태의 핵산을 포함하는 발현 벡터를 제공한다.
예시적 실시양태
본 개시내용은 하기 실시양태에 의해 추가로 설명된다. 각각의 실시양태의 특색은 적절하고 실시가능한 경우에 임의의 다른 실시양태와 조합가능하다.
실시양태 1. 제1 비천연 염기 및 상보적 제2 비천연 염기를 포함하는 DNA 주형을 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기와 제1 비천연 염기 쌍을 형성하도록 구성된 것인 단계;
DNA 주형을 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기와 제2 비천연 염기 쌍을 형성하도록 구성되고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계; 및
mRNA 및 tRNA로부터 단백질을 번역하고, 여기서 상기 단백질은 비천연 아미노산을 포함하는 것인 단계
를 포함하는, 비천연 아미노산을 포함하는 단백질을 생체내 생산하는 방법.
실시양태 2. 실시양태 1에 있어서, 생체내 방법이 반합성 유기체의 사용을 포함하는 것인 방법.
실시양태 3. 실시양태 2에 있어서, 유기체가 미생물을 포함하는 것인 방법.
실시양태 4. 실시양태 3에 있어서, 유기체가 박테리아를 포함하는 것인 방법.
실시양태 5. 실시양태 4에 있어서, 유기체가 그람-양성 박테리아를 포함하는 것인 방법.
실시양태 6. 실시양태 4에 있어서, 유기체가 그람-음성 박테리아를 포함하는 것인 방법.
실시양태 7. 실시양태 2-4 중 어느 하나에 있어서, 유기체가 에스케리키아 콜라이를 포함하는 것인 방법.
실시양태 8. 실시양태 1-7 중 어느 하나에 있어서, 적어도 1종의 비천연 염기가
(i) 2-티오우라실, 2-티오-티민, 2'-데옥시우리딘, 4-티오-우라실, 4-티오-티민, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-티민, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 또는 디히드로우라실;
(ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온);
(iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌, 또는 6-아자-아데닌;
(iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및
(v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘, 또는 2-피리돈
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 9. 실시양태 1-7 중 어느 하나에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00213
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 10. 실시양태 1-7 중 어느 하나에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00214
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 11. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00215
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 12. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00216
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 13. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00217
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 14. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00218
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 15. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00219
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 16. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00220
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 17. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00221
으로 이루어진 군으로부터 선택되는 것인 방법.
실시양태 18. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00222
인 방법.
실시양태 19. 실시양태 9에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
Figure pct00223
으로부터 선택되는 것인 방법.
실시양태 20. 실시양태 9에 있어서, 제1 또는 제2 비천연 염기가
Figure pct00224
인 방법.
실시양태 21. 실시양태 9에 있어서, 제1 또는 제2 비천연 염기가
Figure pct00225
인 방법.
실시양태 22. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00226
이고, 제2 비천연 염기가
Figure pct00227
인 방법.
실시양태 23. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00228
이고, 제2 비천연 염기가
Figure pct00229
인 방법.
실시양태 24. 실시양태 9에 있어서, 제3 또는 제4 비천연 염기가
Figure pct00230
인 방법.
실시양태 25. 실시양태 9에 있어서, 제3 비천연 염기가
Figure pct00231
인 방법.
실시양태 26. 실시양태 9에 있어서, 제4 비천연 염기가
Figure pct00232
인 방법.
실시양태 27. 실시양태 9에 있어서, 제3 또는 제4 비천연 염기가
Figure pct00233
인 방법.
실시양태 28. 실시양태 9에 있어서, 제3 비천연 염기가
Figure pct00234
인 방법.
실시양태 29. 실시양태 9에 있어서, 제4 비천연 염기가
Figure pct00235
인 방법.
실시양태 30. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00236
이고, 제2 비천연 염기가
Figure pct00237
이고, 제3 비천연 염기가
Figure pct00238
이고, 제4 비천연 염기가
Figure pct00239
인 방법.
실시양태 31. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00240
이고, 제2 비천연 염기가
Figure pct00241
이고, 제3 비천연 염기가
Figure pct00242
이고, 제4 비천연 염기가
Figure pct00243
인 방법.
실시양태 32. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00244
이고, 제2 비천연 염기가
Figure pct00245
이고, 제3 비천연 염기가
Figure pct00246
이고, 제4 비천연 염기가
Figure pct00247
인 방법.
실시양태 33. 실시양태 9에 있어서, 제3 비천연 염기가
Figure pct00248
인 방법.
실시양태 34. 실시양태 9에 있어서, 제4 비천연 염기가
Figure pct00249
인 방법.
실시양태 35. 실시양태 9에 있어서, 제1 비천연 염기가
Figure pct00250
이고, 제2 비천연 염기가
Figure pct00251
이고, 제3 비천연 염기가
Figure pct00252
이고, 제4 비천연 염기가
Figure pct00253
인 방법.
실시양태 36. 실시양태 9 내지 35 중 어느 하나에 있어서, 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 방법.
실시양태 37. 실시양태 9 내지 35 중 어느 하나에 있어서, 제3 비천연 염기 및 제4 비천연 염기가 데옥시리보스를 포함하는 것인 방법.
실시양태 38. 실시양태 9 내지 35 중 어느 하나에 있어서, 제1 및 제2 비천연 염기가 데옥시리보스를 포함하는 것인 방법.
실시양태 39. 실시양태 9 내지 35 중 어느 하나에 있어서, 제1 및 제2 비천연 염기가 데옥시리보스를 포함하고, 제3 비천연 염기 및 제4 비천연 염기가 리보스를 포함하는 것인 방법.
실시양태 40. 실시양태 9에 있어서, DNA 주형이
Figure pct00254
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 41. 실시양태 40에 있어서, DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 42. 실시양태 40에 있어서, DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 43. 실시양태 40에 있어서, DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 44. 실시양태 40에 있어서, DNA 주형이 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 45. 실시양태 40에 있어서, DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 46. 실시양태 40에 있어서, DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 47. 실시양태 1에 있어서, DNA 주형이
Figure pct00255
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고;
mRNA 및 tRNA가
Figure pct00256
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 방법.
실시양태 48. 실시양태 47에 있어서, DNA 주형이 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 49. 실시양태 47에 있어서, DNA 주형이 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 50. 실시양태 47에 있어서, DNA 주형이 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 51. 실시양태 47에 있어서, DNA 주형이 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 52. 실시양태 47에 있어서, DNA 주형이 dNaM-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 53. 실시양태 47에 있어서, DNA 주형이 dCNMO-dTAT1인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
실시양태 54. 실시양태 47 내지 53 중 어느 하나에 있어서, mRNA 및 tRNA가
Figure pct00257
으로부터 선택되는 비천연 염기를 포함하는 것인 방법.
실시양태 55. 실시양태 54에 있어서, mRNA 및 tRNA가
Figure pct00258
으로부터 선택되는 비천연 염기를 포함하는 것인 방법.
실시양태 56. 실시양태 54에 있어서, mRNA가
Figure pct00259
인 비천연 염기를 포함하는 것인 방법.
실시양태 57. 실시양태 54에 있어서, mRNA가
Figure pct00260
인 비천연 염기를 포함하는 것인 방법.
실시양태 58. 실시양태 54에 있어서, mRNA가
Figure pct00261
인 비천연 염기를 포함하는 것인 방법.
실시양태 59. 실시양태 54에 있어서, tRNA가
Figure pct00262
으로부터 선택되는 비천연 염기를 포함하는 것인 방법.
실시양태 60. 실시양태 54에 있어서, tRNA가
Figure pct00263
인 비천연 염기를 포함하는 것인 방법.
실시양태 61. 실시양태 54에 있어서, tRNA가
Figure pct00264
인 비천연 염기를 포함하는 것인 방법.
실시양태 62. 실시양태 54에 있어서, tRNA가
Figure pct00265
인 비천연 염기를 포함하는 것인 방법.
실시양태 63. 실시양태 1-7 중 어느 하나에 있어서, 제1 비천연 염기가 dCNMO를 포함하고, 제2 비천연 염기가 dTPT3을 포함하는 것인 방법.
실시양태 64. 실시양태 1-7 또는 41 중 어느 하나에 있어서, 제3 비천연 염기가 NaM을 포함하고, 제2 비천연 염기가 TAT1을 포함하는 것인 방법.
실시양태 65. 실시양태 1-64 중 어느 하나에 있어서, 제1 비천연 염기 또는 제2 비천연 염기가 DNA 폴리머라제에 의해 인식되는 것인 방법.
실시양태 66. 실시양태 1-65 중 어느 하나에 있어서, 제3 비천연 염기 또는 제4 비천연 염기가 RNA 폴리머라제에 의해 인식되는 것인 방법.
실시양태 67. 실시양태 1-66 중 어느 하나에 있어서, 단백질이 적어도 2개의 비천연 아미노산을 포함하는 것인 방법.
실시양태 68. 실시양태 1-66 중 어느 하나에 있어서, 단백질이 적어도 3개의 비천연 아미노산을 포함하는 것인 방법.
실시양태 69. 실시양태 1-66 중 어느 하나에 있어서, 단백질이 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 방법.
실시양태 70. 실시양태 1-66 중 어느 하나에 있어서, 단백질이 적어도 3개의 상이한 비천연 아미노산을 포함하는 것인 방법.
실시양태 71. 실시양태 1-70 중 어느 하나에 있어서, 적어도 1개의 비천연 아미노산이
리신 유사체이거나;
방향족 측쇄를 포함하거나;
아지도 기를 포함하거나;
알킨 기를 포함하거나; 또는
알데히드 또는 케톤 기를 포함하는 것인
방법.
실시양태 72. 실시양태 1-70 중 어느 하나에 있어서, 적어도 1개의 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 방법.
실시양태 73. 실시양태 1-70 중 어느 하나에 있어서, 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산 또는 셀레노시스테인을 포함하는 것인 방법.
실시양태 74. 실시양태 73에 있어서, 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK) 및 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 방법.
실시양태 75. 실시양태 72에 있어서, 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함하는 것인 방법.
실시양태 76. 실시양태 72에 있어서, 적어도 1개의 비천연 아미노산이 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 방법.
실시양태 77. 확장된 유전자 알파벳을 포함하는 반합성 유기체이고, 여기서 유전자 알파벳은 적어도 2종의 고유한 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 78. 실시양태 77에 있어서, 미생물을 포함하는 반합성 유기체.
실시양태 79. 실시양태 77-78 중 어느 하나에 있어서, 박테리아를 포함하는 반합성 유기체.
실시양태 80. 실시양태 79에 있어서, 그람-양성 박테리아를 포함하는 반합성 유기체.
실시양태 81. 실시양태 79에 있어서, 그람-양성 박테리아를 포함하는 반합성 유기체.
실시양태 82. 실시양태 77-79 중 어느 하나에 있어서, 에스케리키아 콜라이를 포함하는 반합성 유기체.
실시양태 83. 실시양태 77-82 중 어느 하나에 있어서, 비천연 염기 중 적어도 1종이 2-아미노아데닌-9-일, 2-아미노아데닌, 2-F-아데닌, 2-티오우라실, 2-티오-티민, 2-티오시토신, 아데닌 및 구아닌의 2-프로필 및 알킬 유도체, 2-아미노-아데닌, 2-아미노-프로필-아데닌, 2-아미노피리딘, 2-피리돈, 2'-데옥시우리딘, 2-아미노-2'-데옥시아데노신 3-데아자구아닌, 3-데아자아데닌, 4-티오-우라실, 4-티오-티민, 우라실-5-일, 하이포크산틴-9-일 (I), 5-메틸-시토신, 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 5-브로모, 및 5-트리플루오로메틸 우라실 및 시토신; 5-할로우라실, 5-할로시토신, 5-프로피닐-우라실, 5-프로피닐 시토신, 5-우라실, 5-치환된, 5-할로, 5-치환된 피리미딘, 5-히드록시시토신, 5-브로모시토신, 5-브로모우라실, 5-클로로시토신, 염소화 시토신, 시클로시토신, 시토신 아라비노시드, 5-플루오로시토신, 플루오로피리미딘, 플루오로우라실, 5,6-디히드로시토신, 5-아이오도시토신, 히드록시우레아, 아이오도우라실, 5-니트로시토신, 5-브로모우라실, 5-클로로우라실, 5-플루오로우라실, 및 5-아이오도우라실, 아데닌 및 구아닌의 6-알킬 유도체, 6-아자피리미딘, 6-아조-우라실, 6-아조시토신, 아자시토신, 6-아조-티민, 6-티오-구아닌, 7-메틸구아닌, 7-메틸아데닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-아데닌, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 및 8-히드록실 치환된 아데닌 및 구아닌; N4-에틸시토신, N-2 치환된 퓨린, N-6 치환된 퓨린, O-6 치환된 퓨린, 듀플렉스 형성의 안정성을 증가시키는 것들, 범용 핵산, 소수성 핵산, 혼재성 핵산, 크기-확장 핵산, 플루오린화 핵산, 트리시클릭 피리미딘, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), G-클램프, 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온), 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-아이오도우라실, 하이포크산틴, 크산틴, 4-아세틸시토신, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 베타-D-갈락토실퀘오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5옥시아세트산, 와이부톡소신, 슈도우라실, 퀘오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥소아세트산 메틸에스테르, 우라실-5-옥소아세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 및 2,6-디아미노퓨린, 및 퓨린 또는 피리미딘 염기가 헤테로사이클로 대체된 것들로 이루어진 군으로부터 선택되는 것인 반합성 유기체.
실시양태 84. 실시양태 77-82 중 어느 하나에 있어서,
Figure pct00266
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 DNA를 포함하는 반합성 유기체.
실시양태 85. 실시양태 77 내지 84 중 어느 하나에 있어서, 비천연 염기 중 적어도 1종을 포함하는 DNA가 비천연 염기 쌍 (UBP)을 형성하는 것인 반합성 유기체.
실시양태 86. 실시양태 85에 있어서, 비천연 염기 쌍 (UBP)이 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1 또는 dNaM-dTAT1인 반합성 유기체.
실시양태 87. 실시양태 84에 있어서, DNA가
Figure pct00267
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 88. 실시양태 87에 있어서, DNA가
Figure pct00268
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 89. 실시양태 88에 있어서, DNA가
Figure pct00269
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 90. 실시양태 88에 있어서, DNA가
Figure pct00270
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 91. 실시양태 88에 있어서, DNA가
Figure pct00271
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 92. 실시양태 88에 있어서, DNA가
Figure pct00272
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 93. 실시양태 88에 있어서, DNA가
Figure pct00273
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 94. 실시양태 88에 있어서, DNA가
Figure pct00274
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 95. 실시양태 88에 있어서, DNA가
Figure pct00275
으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 96. 실시양태 88에 있어서, DNA가
Figure pct00276
으로부터 선택되는 적어도 2종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 97. 실시양태 88에 있어서, DNA가 2개의 가닥을 포함하고, 제1 가닥은
Figure pct00277
인 적어도 1종의 핵염기를 포함하고, 제2 가닥은
Figure pct00278
인 적어도 1종의 핵염기를 포함하는 것인 반합성 유기체.
실시양태 98. 실시양태 88에 있어서, DNA가
Figure pct00279
인 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
실시양태 99. 실시양태 77 내지 98 중 어느 하나에 있어서, 뉴클레오시드 트리포스페이트 수송체를 발현하는 반합성 유기체.
실시양태 100. 실시양태 99에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2인 반합성 유기체.
실시양태 101. 실시양태 77 내지 100 중 어느 하나에 있어서, tRNA 신테타제를 추가로 발현하는 반합성 유기체.
실시양태 102. 실시양태 101에 있어서, tRNA 신테타제가 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)인 반합성 유기체.
실시양태 103. 실시양태 99에 있어서, 뉴클레오시드 트리포스페이트 수송체 PtNTT2를 발현하고, tRNA 신테타제 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)를 추가로 발현하는 반합성 유기체.
실시양태 104. 실시양태 77 내지 103 중 어느 하나에 있어서, RNA 폴리머라제를 추가로 발현하는 반합성 유기체.
실시양태 105. 실시양태 104에 있어서, RNA 폴리머라제가 T7 RNAP인 반합성 유기체.
실시양태 106. 실시양태 77 내지 105 중 어느 하나에 있어서, DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는 반합성 유기체.
실시양태 107. 실시양태 77 내지 105 중 어느 하나에 있어서, 유기체가 이. 콜라이이고, 유기체가 RecA를 발현하지 않는 것인 반합성 유기체.
실시양태 108. 실시양태 77 내지 107 중 어느 하나에 있어서, mRNA를 추가로 포함하는 반합성 유기체.
실시양태 109. 실시양태 108에 있어서, mRNA가
Figure pct00280
으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 110. 실시양태 108에 있어서, mRNA가
Figure pct00281
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 111. 실시양태 108에 있어서, mRNA가
Figure pct00282
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 112. 실시양태 108에 있어서, mRNA가
Figure pct00283
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 113. 실시양태 77 내지 112 중 어느 하나에 있어서, tRNA를 추가로 포함하는 반합성 유기체.
실시양태 114. 실시양태 113에 있어서, tRNA가
Figure pct00284
으로부터 선택되는 1개 이상의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 115. 실시양태 113에 있어서, tRNA가
Figure pct00285
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 116. 실시양태 113에 있어서, tRNA가
Figure pct00286
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 117. 실시양태 113에 있어서, tRNA가
Figure pct00287
인 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
실시양태 118. 실시양태 77 내지 107 중 어느 하나에 있어서, mRNA 및 tRNA를 추가로 포함하는 반합성 유기체.
실시양태 119. 실시양태 77 내지 98 중 어느 하나에 있어서, (a) 뉴클레오시드 트리포스페이트 수송체, (b) mRNA, (c) tRNA, (d) tRNA 신테타제, 및 (e) RNA 폴리머라제를 추가로 포함하고, DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는 반합성 유기체.
실시양태 120. 실시양태 119에 있어서, 뉴클레오시드 트리포스페이트 수송체가 PtNTT2이고, tRNA 신테타제가 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)이고, RNA 폴리머라제가 T7 RNAP인 반합성 유기체.
실시양태 121. 실시양태 119에 있어서, 유기체가 이. 콜라이이고, 유기체가 RecA를 발현하지 않는 것인 반합성 유기체.
실시양태 122. 실시양태 118 또는 119에 있어서, 하나 이상의 DNA 폴리머라제를 과다발현하는 반합성 유기체.
실시양태 123. 실시양태 122에 있어서, DNA Pol II를 과다발현하는 반합성 유기체.
실시양태 124. 실시양태 77 내지 123 중 어느 하나에 있어서, 적어도 1종의 비천연 염기가 비천연 당 모이어티를 추가로 포함하는 것인 반합성 유기체.
실시양태 125. 실시양태 124에 있어서, 비천연 당 모이어티가
2' 위치에서의 변형:
OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F;
O-알킬, S-알킬, N-알킬;
O-알케닐, S-알케닐, N-알케닐;
O-알키닐, S-알키닐, N-알키닐;
O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임);
및/또는 5' 위치에서의 변형:
5'-비닐, 5'-메틸 (R 또는 S);
4' 위치에서의 변형:
4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 그의 임의의 조합
으로 이루어진 군으로부터 선택되는 것인 반합성 유기체.
실시양태 126. 실시양태 77-125 중 어느 하나에 있어서, 적어도 1종의 비천연 염기가 DNA 폴리머라제에 의해 인식되는 것인 반합성 유기체.
실시양태 127. 실시양태 73-126 중 어느 하나에 있어서, 적어도 1종의 비천연 염기가 RNA 폴리머라제에 의해 인식되는 것인 반합성 유기체.
실시양태 128. 하기 구조의 핵염기 유사체를 포함하는 조성물:
Figure pct00288
여기서,
각각의 X는 독립적으로 탄소 또는 질소이고;
R2는 임의적이고, 존재하는 경우에 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고;
각각의 Y는 독립적으로 황, 산소, 셀레늄 또는 2급 아민이고;
E는 독립적으로 산소, 황 또는 셀레늄이고;
파상선은 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 임의로α-티오트리포스페이트, β-티오트리포스페이트 또는γ-티오트리포스페이트 기를 포함하는 모노-포스페이트, 디포스페이트 또는 트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다.
실시양태 129. 실시양태 128에 있어서, 리보실 또는 데옥시리보실 모이어티가 그의 5'-히드록실에 결합된 트리포스페이트 또는α-티오트리포스페이트 기를 보유하는 것인 화합물.
실시양태 130. 실시양태 128 또는 129에 있어서, 리보실 또는 데옥시리보실 모이어티가 각각 RNA 또는 DNA 올리고뉴클레오티드 쇄 내로 혼입되거나, 또는 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체가 폴리뉴클레오티드 내로 혼입되는 것인 화합물.
실시양태 131. 실시양태 128 내지 130 중 어느 하나에 있어서, X가 탄소인 화합물.
실시양태 132. 실시양태 128 내지 131 중 어느 하나에 있어서, E가 황인 화합물.
실시양태 133. 실시양태 128 내지 132 중 어느 하나에 있어서, Y가 황인 화합물.
실시양태 134. 실시양태 128에 있어서, 핵염기가 구조
Figure pct00289
를 포함하는 것인 화합물.
실시양태 135. 실시양태 128 내지 134 중 어느 하나에 있어서, 핵염기가 상보적 염기-쌍형성 핵염기에 결합하여 비천연 염기 쌍 (UBP)을 형성하는 것인 화합물.
실시양태 136. 실시양태 135에 있어서, 상보적 염기-쌍형성 핵염기가
Figure pct00290
으로부터 선택되는 것인 화합물.
실시양태 137. 제1 올리고뉴클레오티드 가닥이 실시양태 128 내지 134 중 어느 하나의 화합물을 포함하고, 제2 상보적 올리고뉴클레오티드 가닥이 그의 상보적 염기-쌍형성 부위에 상보적 염기-쌍형성 핵염기를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
실시양태 138. 실시양태 137에 있어서, 제1 올리고뉴클레오티드 가닥이
Figure pct00291
을 포함하고; 제2 가닥이 그의 상보적 염기-쌍형성 부위에
Figure pct00292
으로 이루어진 군으로부터 선택되는 상보적 염기 쌍형성 핵염기를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
실시양태 139.
핵염기 유사체를 포함하는 안티코돈; 및
아미노아실 tRNA 신테타제에 의한 tRNA의 비천연 아미노산으로의 선택적 충전을 촉진하는 인식 요소
를 포함하는, 실시양태 128 내지 136 중 어느 하나의 핵염기 유사체를 포함하는 전달 RNA (tRNA).
실시양태 140. 실시양태 139에 있어서, 핵염기 유사체가 tRNA의 안티코돈 영역 내에 위치하는 것인 tRNA.
실시양태 141. 실시양태 140에 있어서, 핵염기 유사체가 안티코돈의 제1 위치에 위치하는 것인 tRNA.
실시양태 142. 실시양태 140에 있어서, 핵염기 유사체가 안티코돈의 제2 위치에 위치하는 것인 tRNA.
실시양태 143. 실시양태 140에 있어서, 핵염기 유사체가 안티코돈의 제3 위치에 위치하는 것인 tRNA.
실시양태 144. 실시양태 139에 있어서, 아미노아실 tRNA 신테타제가 호열균(thermophile)으로부터 유래되는 것인 tRNA.
실시양태 145. 실시양태 139에 있어서, 아미노아실 tRNA 신테타제가 메타노사르시나 또는 그의 변이체로부터 유래되는 것인 tRNA.
실시양태 146. 실시양태 139에 있어서, 아미노아실 tRNA 신테타제가 메타노코쿠스 (메타노칼도코쿠스) 또는 그의 변이체로부터 유래되는 것인 tRNA.
실시양태 147. 실시양태 139에 있어서, 비천연 아미노산이 방향족 모이어티를 포함하는 것인 tRNA.
실시양태 148. 실시양태 139에 있어서, 비천연 아미노산이 리신 유도체인 tRNA.
실시양태 149. 실시양태 139에 있어서, 비천연 아미노산이 페닐알라닌 유도체인 tRNA.
실시양태 150. 실시양태 139에 있어서, 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산 및 셀레노시스테인으로 이루어진 군으로부터 선택되는 것인 tRNA.
실시양태 151. 하기 화학식을 포함하는 구조물:
N1 - Zx - N2
여기서, N1은 뉴클레오티드 또는 그의 유사체, 또는 말단 포스페이트 기이고; N2는 뉴클레오티드 또는 그의 유사체, 또는 말단 히드록실 기이고; Z는 실시양태 128-136 중 어느 하나의 화합물이고, x는 1 내지 20의 정수이다.
실시양태 152. 실시양태 151에 있어서, 유전자에 대해 코딩하는 구조물.
실시양태 153. 실시양태 151에 있어서, Zx가 유전자의 번역 영역에 위치하는 것인 구조물.
실시양태 154. 실시양태 151에 있어서, Zx가 유전자의 비번역 영역에 위치하는 것인 구조물.
실시양태 155. 실시양태 151에 있어서, 5' 또는 3' 비번역 영역 (UTR)을 추가로 포함하는 구조물.
실시양태 156. 실시양태 151에 있어서, 종결인자 영역을 추가로 포함하는 구조물.
실시양태 157. 실시양태 151에 있어서, 프로모터 영역을 추가로 포함하는 구조물.
실시양태 158. 적어도 5000개의 고유한 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 라이브러리이고, 여기서 각각의 폴리뉴클레오티드는 실시양태 128 내지 136 중 어느 하나의 적어도 1종의 화합물을 포함하는 것인 폴리뉴클레오티드 라이브러리.
실시양태 159. 실시양태 158에 있어서, 적어도 1종의 유전자에 대해 코딩하는 폴리뉴클레오티드 라이브러리.
실시양태 160. 뉴클레오시드 트리포스페이트이며, 여기서 핵염기는
Figure pct00293
으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
실시양태 161. 실시양태 160에 있어서, 뉴클레오시드가 리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 162. 실시양태 160에 있어서, 뉴클레오시드가 데옥시리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 163. 실시양태 160 내지 162 중 어느 하나에 있어서, 핵염기가
Figure pct00294
으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
실시양태 164. 실시양태 163에 있어서, 핵염기가
Figure pct00295
으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
실시양태 165. 실시양태 163에 있어서, 핵염기가
Figure pct00296
으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
실시양태 166. 실시양태 163에 있어서, 핵염기가
Figure pct00297
으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
실시양태 167. 실시양태 165에 있어서, 핵염기가
Figure pct00298
인 뉴클레오시드 트리포스페이트.
실시양태 168. 실시양태 167에 있어서, 뉴클레오시드가 리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 169. 실시양태 167에 있어서, 뉴클레오시드가 데옥시리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 170. 실시양태 165에 있어서, 핵염기가
Figure pct00299
인 뉴클레오시드 트리포스페이트.
실시양태 171. 실시양태 170에 있어서, 뉴클레오시드가 리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 172. 실시양태 170에 있어서, 뉴클레오시드가 데옥시리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 173. 실시양태 165에 있어서, 핵염기가
Figure pct00300
인 뉴클레오시드 트리포스페이트.
실시양태 174. 실시양태 173에 있어서, 뉴클레오시드가 리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
실시양태 175. 실시양태 173에 있어서, 뉴클레오시드가 데옥시리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
제1 비천연 염기 및 상보적인 제2 비천연 염기를 포함하는 DNA 주형을 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기와 제1 비천연 염기 쌍을 형성하도록 구성된 것인 단계; DNA 주형을 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기와 제2 비천연 염기 쌍을 형성하도록 구성되고, 여기서 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계; 및 mRNA 및 tRNA로부터 단백질을 번역하고, 여기서 상기 단백질은 비천연 아미노산을 포함하는 것인 단계를 포함하는, 비천연 아미노산을 포함하는 단백질을 생산하는 생체내 방법이 본원에 기재된다. 일부 실시양태에서, 생체내 방법은 반합성 유기체의 사용을 포함한다. 일부 실시양태에서, 유기체는 미생물을 포함한다. 일부 실시양태에서, 유기체는 박테리아를 포함한다. 일부 실시양태에서, 유기체는 그람-양성 박테리아를 포함한다. 일부 실시양태에서, 유기체는 그람-음성 박테리아를 포함한다. 일부 실시양태에서, 유기체는 에스케리키아 콜라이를 포함한다. 일부 실시양태에서, 적어도 1종의 비천연 염기는 (i) 2-티오우라실, 2-티오-티민, 2'-데옥시우리딘, 4-티오-우라실, 4-티오-티민, 우라실-5-일, 하이포크산틴-9-일 (I), 5-할로우라실; 5-프로피닐-우라실, 6-아조-티민, 6-아조-우라실, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 슈도우라실, 우라실-5-옥사세트산 메틸에스테르, 우라실-5-옥사세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, 5-메틸-2-티오우라실, 4-티오우라실, 5-메틸우라실, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 우라실-5-옥시아세트산, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 또는 디히드로우라실; (ii) 5-히드록시메틸 시토신, 5-트리플루오로메틸 시토신, 5-할로시토신, 5-프로피닐 시토신, 5-히드록시시토신, 시클로시토신, 시토신 아라비노시드, 5,6-디히드로시토신, 5-니트로시토신, 6-아조 시토신, 아자시토신, N4-에틸시토신, 3-메틸시토신, 5-메틸시토신, 4-아세틸시토신, 2-티오시토신, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 또는 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온); (iii) 2-아미노아데닌, 2-프로필 아데닌, 2-아미노-아데닌, 2-F-아데닌, 2-아미노-프로필-아데닌, 2-아미노-2'-데옥시아데노신, 3-데아자아데닌, 7-메틸아데닌, 7-데아자-아데닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 아데닌, N6-이소펜테닐아데닌, 2-메틸아데닌, 2,6-디아미노퓨린, 2-메틸티오-N6-이소펜테닐아데닌, 또는 6-아자-아데닌;
(iv) 2-메틸구아닌, 구아닌의 2-프로필 및 알킬 유도체, 3-데아자구아닌, 6-티오-구아닌, 7-메틸구아닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬 및 8-히드록실 치환된 구아닌, 1-메틸구아닌, 2,2-디메틸구아닌, 7-메틸구아닌, 또는 6-아자-구아닌; 및 (v) 하이포크산틴, 크산틴, 1-메틸이노신, 퀘오신, 베타-D-갈락토실퀘오신, 이노신, 베타-D-만노실퀘오신, 와이부톡소신, 히드록시우레아, (acp3)w, 2-아미노피리딘 또는 2-피리돈으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00301
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00302
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00303
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00304
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00305
으로 이루어진 군으로부터 선택된다. 뉴클레오시드 또는 뉴클레오티드의 염기만이 제시되며, 당 모이어티 및 임의로 임의의 포스페이트(들) 잔기는 명확성을 위해 생략된다. 여기서 및 전반에 걸쳐, 파상선은 뉴클레오티드의 당 부분이 추가로 변형될 수 있는 데옥시- 또는 리보뉴클레오시드 또는 뉴클레오티드에 대한 연결을 나타낸다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00306
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00307
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00308
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00309
으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00310
이다. 일부 실시양태에서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종은
Figure pct00311
으로부터 선택된다. 일부 실시양태에서, 제1 또는 제2 비천연 염기는
Figure pct00312
이다. 일부 실시양태에서, 제1 또는 제2 비천연 염기는
Figure pct00313
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00314
이고, 제2 비천연 염기는
Figure pct00315
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00316
이고, 제2 비천연 염기는
Figure pct00317
이다. 일부 실시양태에서, 제3 또는 제4 비천연 염기는
Figure pct00318
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00319
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00320
이다. 일부 실시양태에서, 제3 또는 제4 비천연 염기는
Figure pct00321
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00322
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00323
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00324
이고, 제2 비천연 염기는
Figure pct00325
이고, 제3 비천연 염기는
Figure pct00326
이고, 제4 비천연 염기는
Figure pct00327
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00328
이고, 제2 비천연 염기는
Figure pct00329
이고, 제3 비천연 염기는
Figure pct00330
이고, 제4 비천연 염기는
Figure pct00331
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00332
이고, 제2 비천연 염기는
Figure pct00333
이고, 제3 비천연 염기는
Figure pct00334
이고, 제4 비천연 염기는
Figure pct00335
이다. 일부 실시양태에서, 제3 비천연 염기는
Figure pct00336
이다. 일부 실시양태에서, 제4 비천연 염기는
Figure pct00337
이다. 일부 실시양태에서, 제1 비천연 염기는
Figure pct00338
이고, 제2 비천연 염기는
Figure pct00339
이고, 제3 비천연 염기는
Figure pct00340
이고, 제4 비천연 염기는
Figure pct00341
이다. 일부 실시양태에서, 제3 비천연 염기 및 제4 비천연 염기는 리보스를 포함한다. 일부 실시양태에서, 제3 비천연 염기 및 제4 비천연 염기는 데옥시리보스를 포함한다. 일부 실시양태에서, 제1 및 제2 비천연 염기는 데옥시리보스를 포함한다. 일부 실시양태에서, 제1 및 제2 비천연 염기는 데옥시리보스를 포함하고, 제3 비천연 염기 및 제4 비천연 염기는 리보스를 포함한다. 일부 실시양태에서, DNA 주형은
Figure pct00342
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은
Figure pct00343
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고; mRNA 및 tRNA는
Figure pct00344
으로부터 선택되는 비천연 염기를 갖는 적어도 1종의 비천연 리보뉴클레오티드를 포함한다. 일부 실시양태에서, DNA 주형은 dNaM-d5SICS인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dCNMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dNaM-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, DNA 주형은 dPTMO-dTPT3인 적어도 1종의 비천연 염기 쌍 (UBP)을 포함한다. 일부 실시양태에서, mRNA 및 tRNA는
Figure pct00345
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, mRNA 및 tRNA는
Figure pct00346
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00347
인 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00348
인 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00349
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00350
으로부터 선택되는 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00351
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00352
인 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00353
인 비천연 염기를 포함한다. 일부 실시양태에서, 제1 비천연 염기는 dCNMO를 포함하고, 제2 비천연 염기는 dTPT3을 포함한다. 일부 실시양태에서, 제3 비천연 염기는 NaM을 포함하고, 제2 비천연 염기는 TAT1을 포함한다. 일부 실시양태에서, 제1 비천연 염기 또는 제2 비천연 염기는 DNA 폴리머라제에 의해 인식된다. 일부 실시양태에서, 제3 비천연 염기 또는 제4 비천연 염기는 RNA 폴리머라제에 의해 인식된다. 일부 실시양태에서, 단백질은 적어도 2개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 단백질은 적어도 3개의 비천연 아미노산을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 리신 유사체이거나; 방향족 측쇄를 포함하거나; 아지도 기를 포함하거나; 알킨 기를 포함하거나; 또는 알데히드 또는 케톤 기를 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 방향족 측쇄를 포함하지 않는다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산 또는 셀레노시스테인을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK) 및 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함한다. 일부 실시양태에서, 적어도 1개의 비천연 아미노산은 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함한다.
적어도 3종의 고유한 비천연 염기를 포함하는 확장된 유전자 알파벳을 포함하는 반합성 유기체가 본원에 기재된다. 일부 실시양태에서, 유기체는 미생물을 포함한다. 일부 실시양태에서, 유기체는 박테리아를 포함한다. 일부 실시양태에서, 유기체는 그람-양성 박테리아를 포함한다. 일부 실시양태에서, 유기체는 그람-양성 박테리아를 포함한다. 일부 실시양태에서, 유기체는 에스케리키아 콜라이를 포함한다. 일부 실시양태에서, 비천연 염기 중 적어도 1종은 2-아미노아데닌-9-일, 2-아미노아데닌, 2-F-아데닌, 2-티오우라실, 2-티오-티민, 2-티오시토신, 아데닌 및 구아닌의 2-프로필 및 알킬 유도체, 2-아미노-아데닌, 2-아미노-프로필-아데닌, 2-아미노피리딘, 2-피리돈, 2'-데옥시우리딘, 2-아미노-2'-데옥시아데노신 3-데아자구아닌, 3-데아자아데닌, 4-티오-우라실, 4-티오-티민, 우라실-5-일, 하이포크산틴-9-일 (I), 5-메틸-시토신, 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 5-브로모, 및 5-트리플루오로메틸 우라실 및 시토신; 5-할로우라실, 5-할로시토신, 5-프로피닐-우라실, 5-프로피닐 시토신, 5-우라실, 5-치환된, 5-할로, 5-치환된 피리미딘, 5-히드록시시토신, 5-브로모시토신, 5-브로모우라실, 5-클로로시토신, 염소화 시토신, 시클로시토신, 시토신 아라비노시드, 5-플루오로시토신, 플루오로피리미딘, 플루오로우라실, 5,6-디히드로시토신, 5-아이오도시토신, 히드록시우레아, 아이오도우라실, 5-니트로시토신, 5-브로모우라실, 5-클로로우라실, 5-플루오로우라실, 및 5-아이오도우라실, 아데닌 및 구아닌의 6-알킬 유도체, 6-아자피리미딘, 6-아조-우라실, 6-아조시토신, 아자시토신, 6-아조-티민, 6-티오-구아닌, 7-메틸구아닌, 7-메틸아데닌, 7-데아자구아닌, 7-데아자구아노신, 7-데아자-아데닌, 7-데아자-8-아자구아닌, 8-아자구아닌, 8-아자아데닌, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 및 8-히드록실 치환된 아데닌 및 구아닌; N4-에틸시토신, N-2 치환된 퓨린, N-6 치환된 퓨린, O-6 치환된 퓨린, 듀플렉스 형성의 안정성을 증가시키는 것들, 범용 핵산, 소수성 핵산, 혼재성 핵산, 크기-확장 핵산, 플루오린화 핵산, 트리시클릭 피리미딘, 페녹사진 시티딘 ([5,4-b][1,4]벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도[5,4-b][1,4]벤조티아진-2(3H)-온), G-클램프, 페녹사진 시티딘 (9-(2-아미노에톡시)-H-피리미도[5,4-b][1,4]벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도[4,5-b]인돌-2-온), 피리도인돌 시티딘 (H-피리도[3',2':4,5]피롤로[2,3-d]피리미딘-2-온), 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-아이오도우라실, 하이포크산틴, 크산틴, 4-아세틸시토신, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 베타-D-갈락토실퀘오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5옥시아세트산, 와이부톡소신, 슈도우라실, 퀘오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥소아세트산 메틸에스테르, 우라실-5-옥소아세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 및 2,6-디아미노퓨린, 및 퓨린 또는 피리미딘 염기가 헤테로사이클로 대체된 것들로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 유기체는
Figure pct00354
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 DNA를 포함한다. 일부 실시양태에서, 비천연 염기 중 적어도 1종을 포함하는 DNA는 비천연 염기 쌍 (UBP)을 형성한다. 일부 실시양태에서, 비천연 염기 쌍 (UBP)은 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1 또는 dNaM-dTAT1이다. 일부 실시양태에서, DNA는
Figure pct00355
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00356
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00357
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00358
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00359
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00360
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00361
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00362
으로 이루어진 군으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00363
으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00364
으로부터 선택되는 적어도 2종의 비천연 핵염기를 포함한다. 일부 실시양태에서, DNA는 2개의 가닥을 포함하고, 제1 가닥은
Figure pct00365
인 적어도 1종의 핵염기를 포함하고, 제2 가닥은
Figure pct00366
인 적어도 1종의 핵염기를 포함한다. 일부 실시양태에서, DNA는
Figure pct00367
인 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, 유기체는 뉴클레오시드 트리포스페이트 수송체를 발현한다. 일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2이다. 일부 실시양태에서, 유기체는 tRNA 신테타제를 추가로 발현한다. 일부 실시양태에서, tRNA 신테타제는 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)이다. 일부 실시양태에서, 유기체는 뉴클레오시드 트리포스페이트 수송체 PtNTT2를 발현하고, tRNA 신테타제 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)를 추가로 발현한다. 일부 실시양태에서, 유기체는 RNA 폴리머라제를 추가로 발현한다. 일부 실시양태에서, RNA 폴리머라제는 T7 RNAP이다. 일부 실시양태에서, 유기체는 DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는다. 일부 실시양태에서, 유기체는 이. 콜라이이고, 유기체는 RecA를 발현하지 않는다. 일부 실시양태에서, 유기체는 DNA 폴리머라제를 과다발현한다. 일부 실시양태에서, 유기체는 DNA 폴리머라제 II를 과다발현한다. 일부 실시양태에서, 반합성 유기체는 mRNA를 추가로 포함한다. 일부 실시양태에서, mRNA는
Figure pct00368
으로부터 선택되는 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00369
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00370
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, mRNA는
Figure pct00371
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 반합성 유기체는 tRNA를 추가로 포함한다. 일부 실시양태에서, tRNA는
Figure pct00372
으로부터 선택되는 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00373
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00374
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, tRNA는
Figure pct00375
인 적어도 1종의 비천연 염기를 포함한다. 일부 실시양태에서, 반합성 유기체는 mRNA 및/또는 tRNA를 추가로 포함한다. 일부 실시양태에서, 유기체는 (a) 뉴클레오시드 트리포스페이트 수송체, (b) mRNA, (c) tRNA, (d) tRNA 신테타제, 및 (e) RNA 폴리머라제를 추가로 포함하고, 여기서 유기체는 DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는다. 일부 실시양태에서, 뉴클레오시드 트리포스페이트 수송체는 PtNTT2이고, tRNA 신테타제는 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)이고, RNA 폴리머라제는 T7 RNAP이다. 일부 실시양태에서, 유기체는 이. 콜라이이고, 유기체는 RecA를 발현하지 않는다. 일부 실시양태에서, 유기체는 하나 이상의 DNA 폴리머라제를 과다발현한다. 일부 실시양태에서, 유기체는 하나의 DNA Pol II를 과다발현한다. 일부 실시양태에서, 적어도 1종의 비천연 염기는 비천연 당 모이어티를 추가로 포함한다. 일부 실시양태에서, 비천연 당 모이어티는 2' 위치에서의 변형: OH, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2F; O-알킬, S-알킬, N-알킬; O-알케닐, S-알케닐, N-알케닐; O-알키닐, S-알키닐, N-알키닐; O-알킬-O-알킬, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1-C10 알킬, C2-C10 알케닐, C2-C10 알키닐, -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-NH2, 및 -O(CH2)nON[(CH2)nCH3)]2일 수 있고, 여기서 n 및 m은 1 내지 약 10임); 및/또는 5' 위치에서의 변형: 5'-비닐, 5'-메틸 (R 또는 S); 4' 위치에서의 변형: 4'-S, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단기, 리포터 기, 삽입제, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약역학적 특성을 개선시키기 위한 기, 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 적어도 1종의 비천연 염기는 DNA 폴리머라제에 의해 인식된다. 일부 실시양태에서, 적어도 1종의 비천연 염기는 RNA 폴리머라제에 의해 인식된다.
다음 구조의 핵염기 유사체를 포함하는 조성물이 본원에 기재된다:
Figure pct00376
, 여기서 각각의 X는 독립적으로 탄소 또는 질소이고; R2는 임의적이고, 존재하는 경우에 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고; 각각의 Y는 독립적으로 황, 산소, 셀레늄 또는 2급 아민이고; 각각의 E는 독립적으로 산소, 황 또는 셀레늄이고; 파상선은 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, α-티오트리포스페이트, β-티오트리포스페이트, 또는γ-티오트리포스페이트 기를 임의로 포함하는 모노-포스페이트, 디포스페이트 또는 트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함된다. 일부 실시양태에서, 리보실 또는 데옥시리보실 모이어티는 그의 5'-히드록실에 결합된 트리포스페이트 또는 α-티오트리포스페이트 기를 보유한다. 일부 실시양태에서, 리보실 또는 데옥시리보실 모이어티는 각각 RNA 또는 DNA 올리고뉴클레오티드 쇄에 혼입되거나, 또는 리보실 또는 데옥시리보실 모이어티 또는 그의 유사체는 RNA 또는 DNA 유사체에 혼입된다. 일부 실시양태에서, X는 탄소이다. 일부 실시양태에서, E는 황이다. 일부 실시양태에서, Y는 황이다. 일부 실시양태에서, 핵염기는 구조
Figure pct00377
를 포함한다. 일부 실시양태에서, 핵염기는 구조
Figure pct00378
를 포함한다. 일부 실시양태에서, 핵염기는 상보적 핵염기와 쌍형성하여 비천연 염기 쌍 (UBP)을 형성한다. 일부 실시양태에서, 상보적 염기-쌍형성 핵염기는
Figure pct00379
으로부터 선택된다.
제1 올리고뉴클레오티드 가닥이 본원에 기재된 화합물을 포함하고, 제2 상보적 올리고뉴클레오티드 가닥이 그의 상보적 염기-쌍형성 부위에 상보적 염기-쌍형성 핵염기를 포함하는 이중 가닥 올리고뉴클레오티드 듀플렉스가 본원에 기재된다. 일부 실시양태에서, 제1 올리고뉴클레오티드 가닥은
Figure pct00380
을 포함하고; 제2 가닥은 그의 상보적 염기-쌍형성 부위에
Figure pct00381
으로 이루어진 군으로부터 선택되는 상보적 염기 쌍형성 핵염기를 포함한다.
리보핵염기 유사체를 포함하는 안티코돈; 및 아미노아실 tRNA 신테타제에 의한 tRNA의 비천연 아미노산으로의 선택적 충전을 촉진하는 인식 요소를 포함하는, 본원에 기재된 리보핵염기 유사체를 포함하는 전달 RNA (tRNA)가 본원에 기재된다. tRNA의 일부 실시양태에서, 핵염기 유사체는 tRNA의 안티코돈 영역에 위치한다. tRNA의 일부 실시양태에서, 핵염기 유사체는 안티코돈의 제1 위치에 위치한다. tRNA의 일부 실시양태에서, 핵염기 유사체는 안티코돈의 제2 위치에 위치한다. tRNA의 일부 실시양태에서, 핵염기 유사체는 안티코돈의 제3 위치에 위치한다. tRNA의 일부 실시양태에서, 아미노아실 tRNA 신테타제는 호열균으로부터 유래된다. tRNA의 일부 실시양태에서, 아미노아실 tRNA 신테타제는 메타노사르시나 또는 그의 변이체로부터 유래된다. tRNA의 일부 실시양태에서, 아미노아실 tRNA 신테타제는 메타노코쿠스 (메타노칼도코쿠스) 또는 그의 변이체로부터 유래된다. tRNA의 일부 실시양태에서, 비천연 아미노산은 방향족 모이어티를 포함한다. tRNA의 일부 실시양태에서, 비천연 아미노산은 리신 유도체이다. tRNA의 일부 실시양태에서, 비천연 아미노산은 페닐알라닌 유도체이다. tRNA의 일부 실시양태에서, 비천연 아미노산은 N6-아지도에톡시-카르보닐-L-리신 (AzK), N6-프로파르길에톡시-카르보닐-L-리신 (PraK), BCN-L-리신, 노르보르넨 리신, TCO-리신, 메틸테트라진 리신, 알릴옥시카르보닐리신, 2-아미노-8-옥소노난산, 2-아미노-8-옥소옥탄산, p-아세틸-L-페닐알라닌, p-아지도메틸-L-페닐알라닌 (pAMF), p-아이오도-L-페닐알라닌, m-아세틸페닐알라닌, 2-아미노-8-옥소노난산, p-프로파르길옥시페닐알라닌, p-프로파르길-페닐알라닌, 3-메틸-페닐알라닌, L-도파, 플루오린화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, O-알릴티로신, O-메틸-L-티로신, O-4-알릴-L-티로신, 4-프로필-L-티로신, 포스포노티로신, 트리-O-아세틸-GlcNAcp-세린, L-포스포세린, 포스포노세린, L-3-(2-나프틸)알라닌, 2-아미노-3-((2-((3-(벤질옥시)-3-옥소프로필)아미노)에틸)셀라닐)프로판산, 2-아미노-3-(페닐셀라닐)프로판산 및 셀레노시스테인으로 이루어진 군으로부터 선택된다.
화학식 N1 - Zx - N2를 포함하는 구조물이 본원에 기재되며, 여기서 N1은 뉴클레오티드 또는 그의 유사체, 또는 말단 포스페이트 기이고; 여기서 N2는 뉴클레오티드 또는 그의 유사체, 또는 말단 히드록실 기이고; 여기서 Z는 본원에 기재된 화합물이고, 여기서 x는 1 내지 20의 정수이다. 일부 실시양태에서, 구조물은 유전자에 대해 코딩한다. 일부 실시양태에서, Zx는 유전자의 코딩 영역에 위치한다. 일부 실시양태에서, Zx는 코돈에 위치한다. 일부 실시양태에서, 구조물은 5' 또는 3' 비번역 영역 (UTR)을 추가로 포함한다. 일부 실시양태에서, 구조물은 종결인자 영역을 추가로 포함한다. 일부 실시양태에서, 구조물은 프로모터 영역을 추가로 포함한다.
적어도 5000개의 고유한 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 라이브러리가 본원에 기재되며, 여기서 각각의 폴리뉴클레오티드는 본원에 기재된 적어도 1종의 비천연 핵염기를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드 라이브러리는 적어도 하나의 유전자에 대해 코딩한다.
뉴클레오시드 트리포스페이트가 본원에 기재되며, 여기서 핵염기는
Figure pct00382
으로부터 선택된다. 일부 실시양태에서, 뉴클레오시드는 리보스를 포함한다. 일부 실시양태에서, 뉴클레오시드는 데옥시리보스를 포함한다. 일부 실시양태에서, 핵염기는
Figure pct00383
으로부터 선택된다. 일부 실시양태에서, 핵염기는
Figure pct00384
으로부터 선택된다. 일부 실시양태에서, 핵염기는
Figure pct00385
으로부터 선택된다. 일부 실시양태에서, 핵염기는
Figure pct00386
으로부터 선택된다. 일부 실시양태에서, 핵염기는
Figure pct00387
이다. 일부 실시양태에서, 뉴클레오시드는 리보스를 포함한다. 일부 실시양태에서, 뉴클레오시드는 데옥시리보스를 포함한다. 일부 실시양태에서, 핵염기는
Figure pct00388
이다. 일부 실시양태에서, 뉴클레오시드는 리보스를 포함한다. 일부 실시양태에서, 뉴클레오시드는 데옥시리보스를 포함한다. 일부 실시양태에서, 핵염기는
Figure pct00389
이다. 일부 실시양태에서, 뉴클레오시드는 리보스를 포함한다. 일부 실시양태에서, 뉴클레오시드는 데옥시리보스를 포함한다.
<실시예>
이들 실시예는 단지 예시적 목적을 위해 제공되며, 본원에 제공된 청구범위의 범주를 제한하지 않는다.
실시예 1A: 복제 및 전사 주형화의 개관.
서열 AXC (여기서 및 전반에 걸쳐 X는 (d)NaM 또는 (d)NaM 유사체를 지칭함)가 sfGFP mRNA의 코돈 151을 주형화하도록 위치시키고 (sfGFP151(AXC)) 서열 GYT (여기서 및 전반에 걸쳐 Y는 (d)TPT3 또는 (d)TPT3 유사체를 지칭함)가 엠. 마제이 Pyl tRNA의 안티코돈을 주형화하도록 위치시켜 (tRNAPyl(GYT)) 2개의 dNaM-dTPT3 UBP를 갖는 플라스미드를 구축하였고, 이는 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)에 의해 ncAA N6-(2-아지도에톡시)-카르보닐-L-리신 (AzK)으로 선택적으로 충전된다. 이들 플라스미드를 사용하여, 뉴클레오시드 트리포스페이트 수송체 PtNTT2 (균주 YZ38)를 발현하고 Mb PylRS를 코딩하는 플라스미드를 보유하는 이. 콜라이를 형질전환시켰다. 형질전환 후, 콜로니를 선택하여, dTPT3TP (10 μM) 및 다양한 농도 (150 μM, 10 μM, 또는 5 μM)로 첨가된 7종의 상이한 dXTP (도 2) 중 1종이 보충된 액체 배지에서 OD600 ~ 1.0까지 성장시켰다. 이어서, 세포를 동일한 비천연 데옥시리보뉴클레오티드 뿐만 아니라 NaMTP (250 μM), TPT3TP (30 μM), 및 AzK (10 mM)를 함유하는 신선한 발현 배지 내로 희석하였다. 간단히 인큐베이션한 후, 이소프로필-β-d-티오갈락토시드 (IPTG, 1 mM)를 첨가하여 T7 RNAP 및 tRNAPyl(GYT) 발현을 유도하였다. 추가의 1시간 인큐베이션 후에, 안히드로테트라시클린 (aTc, 100 ng/mL)을 첨가하여 sfGFP151 (AXC)의 발현을 개시시켰다.
PCR 생성물의 분석. 2.5시간 후에, 플라스미드를 단리한 다음, d5SICSTP 및 dNaMTP7의 비오티닐화된 유사체를 사용하여 관심 유전자를 독립적으로 PCR 증폭시켰다. 생성된 PCR 생성물을 스트렙타비딘을 사용한 겔 이동성 변위 검정을 통해 분석하여, 유지된 UBP를 총 증폭된 생성물의 퍼센트 변위로서 정량화하였다 (이하 스트렙타비딘 겔 변위 검정으로 지칭됨) (도 3a 및 도 3b). 검사된 최고 dXTP 농도 (150 μM)에서, sfGFP151(AXC) 유전자에서의 보유는 각각의 dXTP 유사체에 대해 유사하였으며, dNaMTP의 경우 99%로부터 dMTMOTP의 경우 92%까지 다양하였다. tRNAPyl(GYT) 유전자 내에서의 보유는 dMTMOTP의 경우 82%로부터 dMMO2TP의 경우 74%까지의 범위로 약간 더 낮았다. 10 μM의 각각의 dXTP의 첨가로, sfGFP151(AXC) 유전자에서의 보유는 d5FMTP의 경우 96%로부터 dNaMTP의 경우 73%까지의 범위였다. tRNAPyl(GYT) 유전자의 경우, 보유는 다시 일반적으로 d5FMTP 및 dPTMOTP의 경우 82%로부터 dNaMTP의 경우 71%까지의 범위로 약간 더 낮았다. 최저 농도 (5 μM)에서, 보유는 sfGFP151(AXC) 유전자에서 d5FMTP의 경우 94%로부터 dMTMOTP의 경우 64%까지의 범위였고, tRNAPyl(GYT) 유전자에서 d5FMTP의 경우 83%로부터 dMTMOTP의 경우 71%까지의 범위였다. 일반적으로, 최고 농도에서, 모든 dXTP는 sfGFP 유전자 내에 UBP를 거의 정량적으로 보유하면서 수행하였다. 그러나, 보다 낮은 농도에서 dCNMO-dTPT3, d5FM-dTPT3, 및 dPTMO-dTPT3은 유의하게 더 높게 보유된 상태로 복제되었다. tRNA 유전자에서의 보유는 dXTP 농도에 유의하게 덜 의존적이었다.
리포터 단백질 생산의 분석. 생산된 단백질의 양을 특징화하기 위해, 세포 성장에 대해 정규화된 벌크 배양물 형광을 단백질 발현의 유도 2.5시간 후에 측정하였다 (도 3c). AzK의 부재 하에, 형광은 일반적으로 낮았고, 예외적으로 dPTMOTP 및 dMTMOTP는 보다 낮은 농도에서 약간 더 높게 나타났다. AzK를 배지에 첨가한 경우, 각각의 dXTP와 함께 150 또는 10 μM에서 성장시킨 세포는 일반적으로 유의한, 유사한 수준의 형광을 나타내었으며, 예외적으로 dNaMTP는 150 μM에서보다 10 μM에서 유의하게 더 낮은 형광을 나타내었다. 최저 농도 (5 μM)에서, AzK의 첨가는 dMTMOTP에 의해 관찰되는 보다 낮은 형광을 발생시킨 반면, dCNMOTP, d5FMTP, dClMOTP, dMMO2TP, 또는 dPTMOTP에 의해서는 동일하게 유지되었다. 세포 성장은 단지 5 μM dNaMTP가 제공된 경우에는 관찰되지 않았다. 고농도에서는 유사하지만, 보다 낮은 농도에서 각각의 dXTP 유사체의 사용은 dNaMTP의 사용보다 더 큰 AzK-의존적 형광의 증가를 발생시킨다. 특히, dCNMOTP, d5FMTP, 및 dClMOTP는 가장 큰 AzK-의존적 형광의 증가를 나타내었다.
리포터 단백질 충실도의 분석. 비천연 단백질 생산의 충실도를 직접 평가하기 위해, 단백질 발현의 유도 2.5시간 후에 세포를 수거하고, 생산된 sfGFP를 정제하여, 4개의 PEG 유닛에 의해 TAMRA 염료에 연결된 디벤조시클로옥틴 (DBCO)과의 변형-촉진된 아지드-알킨 고리화첨가 반응에 적용하였다. ncAA를 함유하는 단백질을 검출가능한 형광단으로 태그부착하는 것에 더하여, 접합은 전기영동 이동에서 변위를 생성하여, 생산된 총 단백질의 백분율로서 AzK를 함유하는 단백질의 정량화를 가능하게 한다 (즉, ncAA 혼입의 충실도; 도 3d). dNaM과 같이, 최고 농도 (150 μM)에서의 각각의 dXTP의 사용은 정제된 단백질의 실질적으로 완전한 변위를 발생시켰으며, 이는 ncAA의 높은 충실도 혼입을 반영한다. 10 μM의 dXTP의 존재 하에 성장시킨 경우에, ncAA 혼입의 충실도는 dCNMOTP, d5FMTP, dClMOTP, dMMO2TP, dPTMOTP, 및 dMTMOTP의 경우에 높게 유지되었지만, dNaMTP의 경우에는 가파르게 하락하였다. 마지막으로, 5 μM dXTP의 농도에서, ncAA 혼입의 충실도는 dCNMOTP, d5FMTP, dClMOTP, dMMO2TP, 및 dPTMOTP에 대해 10 μM에서 관찰된 것과 유사하게 유지되었지만, dMTMOTP의 경우에는 하락하였다 (다시, 생존율로 인해, dNaMTP에 의한 충실도는 이 농도에서 측정할 수 없음).
결과. 가장 많은 양의 순수한 비천연 단백질을 특히 보다 낮은 농도에서 생산한 비천연 염기는 dCNMOTP 및 d5FMTP이다. 그러나, d5FMTP에 비해, dCNMOTP의 사용은 복제하기 더 어려운 서열에서 더 높은 UBP 보유를 발생시키는 것으로 이전에 밝혀졌다. dCNMO-dTPT3 UBP는 증가된 정보의 저장 및 검색에 적격이다. 이전에 보고된 SSO는 UBP dNaM-dTPT3, dPTMO-dTPT3, 또는 dMTMO-dTPT3으로 정보를 저장하고, NaMTP 및 TPT3TP를 사용하여 그러한 정보를 검색하였다. SSO의 최적화를 탐구하기 위해, UBP의 보유, sfGFP mRNA 및 tRNAPyl로의 전사, 및 리보솜에서의 디코딩을 이전 및 새로이 보고된 데옥시- 및 리보뉴클레오티드 트리포스페이트 유사체의 수집물을 사용하여 검사하였다. 7종의 상이한 dX-dTPT3 UBP로 정보를 저장하는 능력을 검사하였다. 각각의 경우에, UBP의 가닥 콘텍스트는 동일하였고, dTPT3 및 dX는 각각 sfGFP 및 tRNAPyl 유전자의 상응하는 안티센스 (주형) 가닥에 위치하였다. 고농도의 각각의 dXTP가 제공되면, 각각의 dX-dTPT3 UBP는 mRNA 유전자에서 높은 수준으로 유지되며, 변동은 dMTMOTP의 경우 92% 및 dCNMOTP, dPTMOTP, 및 dNaMTP의 경우 96% 내지 99% 사이이다. tRNA 유전자에서의 보유는 74% 내지 82%로 다양하게 다소 감소되었다. dXTP의 농도가 감소함에 따라, 보유는 tRNA 유전자에서 대략 일정하게 유지되었지만, mRNA 유전자에서는 dXTP 특이적 방식으로 감소하였고, dMTMOTP의 경우 64%까지 감소하였지만, dCNMOTP 및 d5FMTP의 경우에는 ~94%로 비교적 높게 유지되었다. 이론에 얽매이지는 않지만, tRNA 및 mRNA 유전자에서의 보유에 대한 상이한 농도 의존성은 아마도, 뉴클레오티드 삽입이 mRNA에서 속도 제한적이도록 하고 연속 연장이 tRNA 유전자에서 속도 제한적이도록 하는 서열 콘텍스트 효과로 인한 것일 수 있다. 예외가 dNaMTP에 의해 관찰되었고, 10 μM에서 보유는 73%까지 감소되었고, dNaMTP가 5 μM로 제공된 경우에 세포는 생존하지 못했다. 또한, dCNMOTP 및 d5FMTP에 의하면, 보유는 심지어 검사된 최저 농도에서도 mRNA에서 높게 (~93%) 유지되었다. 이론에 얽매이지는 않지만, tRNA 유전자에서의 보유의 상실은 보다 적은 비천연 단백질 생산을 발생시킬 수 있고, 아마도 더 크게 문제가 되는 것으로, "근동족" 천연 tRNA에 의한 비천연 코돈의 디코딩을 위한 증가된 경쟁으로 인해 ncAA 혼입의 충실도를 감소시킬 수 있다. 그러나, ncAA 혼입의 충실도는 mRNA 유전자에서의 보유와 상호연관되었다 (데이터는 제시되지 않음). 따라서, 데이터는 각각의 dX가 비천연 단백질 생산의 충실도를 제한하지 않기에 충분한 효율 및 충실도로 tRNA의 전사를 주형화한다는 것을 입증한다. 이들 결과에 기초하여, d5FM-dTPT3 및 dCNMO-dTPT3은 증가된 정보 저장이 가능한 UBP이며, dNaM-dTPT3에 비해 그의 유용성은 주로 보다 낮은 비천연 트리포스페이트 농도에서의 그의 보다 높은 보유 및 단백질 생산으로부터 유래한다.
실시예 1B: 복제 및 전사 주형화를 위한 상세한 절차.
플라스미드의 골든 게이트 어셈블리. 소화되면 sfGFP 번역을 위한 적절한 목표 플라스미드 p[sfGFP(gg)151 tRNAPyl(gg)] GG 목표 플라스미드 (서열은 하기에 제시된 바와 같음 (서열식별번호: 2))와 상용성인 오버행을 도입하는 말단 BsaI 인식 부위를 생성하기 위해 dTPT3TP 및 dNaMTP, 및 프라이머 P1-2 (O3 또는 O7-12를 증폭시키는 경우) 및 P3-4 (O6을 증폭시키는 경우) (프라이머 서열에 대해서는 표 S1 참조)를 사용하여, 수동으로 합성하거나 (올리고뉴클레오티드 합성 참조) 또는 신토르스(Synthorx)로부터 제공받은 비천연-함유 올리고뉴클레오티드 O3 및 O6-12 (올리고 서열에 대해서는 표 S4 참조)의 PCR에 의해 UBP (및 필요한 경우에, sfGFP 또는 tRNAPyl을 코딩하는 유전자)를 함유하는 삽입물을 생성하였다. PCR 증폭을 PTC-200 펠티에 써멀 사이클러(Peltier Thermal Cycler) (엠제이 리서치(MJ Research))에서 수행하였다. 주형 올리고뉴클레오티드 (50 μL 반응물당 0.025 ng)를 하기 시약 농도를 사용하여 PCR-증폭시켰다: OneTaq 표준 반응 완충제 (1x, 뉴 잉글랜드 바이오랩스(New England BioLabs)), dNTP (0.2 mM), dTPT3TP (0.1 mM), dNaMTP (0.1 mM), MgSO4 (1.2 mM), 프라이머 (각각 1 μM), 및 OneTaq 폴리머라제 (1.25 U). 천연 올리고뉴클레오티드를 비천연 트리포스페이트의 부재 하에 증폭시켰다. 이들을 하기 열순환 조건 하에 증폭시켰다 (시간은 mm:ss로 표시됨): [94℃ 0:30 | 20x (94℃ 0:30 | 54℃ 0:30 | 68℃ 4:00)]. 스핀-칼럼 (DNA 클린 앤드 컨센트레이터-5(DNA Clean and Concentrator-5); 지모 리서치(Zymo Research))에 의해 남은 용액을 정제한 다음, 인피니트 M200 프로(Infinite M200 Pro) 멀티모드 마이크로플레이트 판독기 (테칸(Tecan))를 사용하여 280 nm에서의 흡수에 의해 정량화하였다.
표 S1. 본 연구에 사용된 올리고뉴클레오티드 및 프라이머의 서열, 여기서 X는 dNaM을 나타내고, Y는 dTPT3을 나타낸다.
Figure pct00390
Figure pct00391
올리고뉴클레오티드 합성. 엑스페디트 8909(Expedite 8909) 유전자 합성기, 1,000 Å의 세공 크기를 갖는 숙시닐 연결된 LCAA-CPG (장쇄 알킬 아민-제어된 세공 유리) 칼럼, 및 dABz, dCBz, dGiBu 및 dT DNA 포스포르아미다이트의 혼입을 위한 표준 프로토콜을 사용하여, 변형된 올리고뉴클레오티드를 0.2 μmol 규모로 합성하였다. 단량체 dNaM의 혼입을 위해 하기 수동-커플링 조건을 사용하였다 (15분; CH3CN 중 테트라졸; >95%). 변형된 포스포르아미다이트를 50-배 몰 과량 및 무수 CH3CN 중 0.05 M 농도로 사용하였다. 고체 지지체로부터의 절단 및 보호기의 제거는 ~30% 수성 암모니아 (55℃, 16시간)를 사용하여 달성하였다. DMT-온 조 올리고뉴클레오티드의 정제는 하이퍼실 골드(Hypersil Gold) C18 칼럼 (5 μm, 4.6 x 150 mm)이 장착된 반퀴쉬(Vanquish) UHPLC 시스템을 사용하여, 25분에 걸쳐 0 - 50% B (완충제 A = 0.05 M TEAA, pH 7; 완충제 B = CH3CN 중 25% H2O; 유량 = 1.0 mL/분)를 사용하여 수행하였다. 적절한 분획을 풀링하고, 증발 건조시킨 다음, 탈트리틸화 (80% 수성 AcOH) 및 침전 (NaOAc/NaClO4/아세톤, 3시간 동안 -80℃)시켰다. 분석 모드로 작동하는 이온-쌍 역상 HPLC에 의해 순도를 확인하였다 (>90%).
플라스미드를 하기 조건 하에 80 μL 반응 부피에서 어셈블리시켰다: 목표 플라스미드 (1 μg), PCR 삽입물(들) (4:1 삽입물 : 플라스미드 몰비), T4 DNA 리가제 (532 U), BsaI-HF (53.4 U), 및 ATP (1 mM)를 컷스마트(CutSmart) 완충제 (1x, 뉴 잉글랜드 바이오랩스) 중에서 합하고, 하기 조건 하에 열순환시켰다 (시간은 mm:ss로 표시됨): [37℃ 20:00 | 40x (37℃ 5:00 | 16℃ 10:00 | 22℃ 5:00) | 37℃ 20:00 | 50℃ 15:00 | 70℃ 30:00].
골든 게이트 반응 후, T5 엑소뉴클레아제 (13.3 U) 및 BsaI-HF (26.6 U)를 첨가하고, 반응물을 37℃에서 1시간 동안 인큐베이션하여 나머지 DNA 단편 및 비혼입된 목표 플라스미드를 소화시켰다. 어셈블리된 플라스미드를 지모-스핀 I(Zymo-Spin I) 칼럼 상에서 정제하고, 큐비트(Qubit) dsDNA HS 검정 키트 (써모 피셔 사이언티픽(Thermo Fisher Scientific))를 사용하여 정량화하였다.
pGEX-MbPylRS TetR에 의한 YZ3/ML2의 형질전환. SSO 균주 YZ3 또는 ML2의 밤샘 배양물을 50 mM 인산칼륨 및 5 μg/mL 클로람페니콜이 보충된 2xYT (본원에서, 이 섹션에서 "배지"로 지칭됨)에서 성장시킨 다음, 동일한 배지에서 다시 OD600 0.03으로 희석하고, OD600 0.4 내지 0.6까지 성장시켰다. 이어서 배양물을 빙수 상에서 5분 동안 진탕시키면서 냉각시킨 다음, 3,200xg에서 10분 동안 원심분리하여 펠릿화하였다. 이어서 세포를 재현탁시키고, 빙냉 ddH2O로 2회 세척한 다음, 빙냉 ddH2O 중에 OD600 50 - 60으로 재현탁시켰다. 전기적격 세포 (50 μL) 및 2 ng의 pGEX-MbPylRS TetR 플라스미드 (서열식별번호: 1)를 사전-냉각시킨 전기천공 큐벳 (0.2-cm-gap)으로 옮긴 다음, 제조업체의 권장사항 (전압 25 kV, 커패시터 2.5 μF, 저항기 200 Ω)에 따라 전기천공하고 (진 펄스 II(Gene Pulser II); 바이오-라드(Bio-Rad)), 이어서 950 μL의 배지로 즉시 희석하였다. 이어서, 이러한 전기천공 반응의 분취물 (40 μL)을 배지로 200 μL의 최종 부피까지 5-배 희석한 다음, 37℃에서 1시간 동안 회수되도록 하였다. 회수물의 2-배 희석물을 50 mM 인산칼륨, 5 μg/mL 클로람페니콜, 100 μg/mL 카르베니실린, 및 2% w/v 한천이 보충된 고체 2xYT 배지 상에 플레이팅한 다음, 37℃에서 밤새 성장하도록 하였다. 단일 콜로니를 골라내어, 100 μg/mL 카르베니실린이 보충된 액체 배지의 배양물에 접종한 다음, 글리세롤 (25% v/v) 중에서 -80℃에서 저장하였다.
dXTP의 생체내 번역 스크린. pGEX-MbPylRS TetR 플라스미드를 보유하는 SSO 균주 YZ3의 밤샘 배양물을 50 mM 인산칼륨, 5 μg/mL 클로람페니콜 및 100 μg/mL 카르베니실린이 보충된 2xYT (본원에서, 이 섹션에서 "배지"로 지칭됨)에서 성장시킨 다음, 동일한 배지에서 다시 OD600 0.03으로 희석하고, OD600 0.4 내지 0.6까지 성장시켰다. 이어서 배양물을 빙수 상에서 15분 동안 진탕시키면서 냉각시킨 다음, 3,200xg에서 10분 동안 원심분리하여 펠릿화하였다. 이어서 세포를 재현탁시키고, 빙냉 ddH2O로 2회 세척한 다음, 빙냉 ddH2O 중에 OD600 55 - 65로 재현탁시켰다. 전기적격 세포 (50 μL), 및 sfGFP 및 tRNAPyl 유전자 내에 UBP를 갖는 골든 게이트 어셈블리된 플라스미드 1 ng (플라스미드의 골든 게이트 어셈블리 참조)을 사전-냉각시킨 전기천공 큐벳 (0.2-cm-gap)으로 옮긴 다음, 제조업체의 권장사항 (전압 25 kV, 커패시터 2.5 μF, 저항기 200 Ω)에 따라 전기천공하고 (진 펄스 II; 바이오-라드), 이어서 950 μL의 배지로 즉시 희석하였다. 이어서, 형질전환의 분취물 (40 μL)을 dNaMTP (150 μM) 및 dTPT3TP (10 μM)로 보충된 배지에서 200 μL의 최종 부피까지 5-배 희석한 다음, 37℃에서 1시간 진탕시키는 동안 회수되도록 하였다. 회수물의 2-배 희석물을 제오신 (50 μg/mL), dNaMTP (150 μM), dTPT3TP (10 μM), 및 한천 (2% w/v)이 보충된 고체 배지 상에 플레이팅한 다음, 37℃에서 밤새 성장시켰다. 단일 콜로니를 골라내어, 50 μg/mL 제오신이 보충된 배지 (300 μL) (본원에서, 이후에 이 섹션에서 "성장 배지"로 지칭됨)에서 성장시키고, dNaMTP (150 μM) 및 dTPT3TP (10 μM)를 제공하였다. 배양물을 세포 성장에 대해 모니터링한 다음 (590/20 nm 필터를 갖는 엔비전 2103 멀티라벨 플레이트 판독기), OD600 ~ 1.0에서 수집하였다. 분취물 (50 μL)을 ZR 플라스미드 정제용 키트 (지모 리서치)를 사용하여 플라스미드 단리에 적용하였다. 이어서 단리된 플라스미드를 하기 기재된 스트렙타비딘 겔 변위 검정 (프라이머 P3-4 및 P5-6 사용, 표 S1)에 적용하여 UBP 보유를 결정하였다. 이어서, UBP 보유가 탁월한 콜로니를 글리세롤 (25% v/v) 중에서 -80℃에서 저장하였다.
글리세롤 스톡의 10-배 희석물을 dNaMTP (150 μM), dTPT3TP (10 μM), 및 2% w/v 한천이 보충된 고체 성장 배지 상에 재플레이팅한 다음, 37℃에서 밤새 성장시켰다. 단일 콜로니를 골라내어, 상응하는 dXTP (다양한 농도) 및 dTPT3TP (10 μM)가 보충된 성장 배지 (300 μL)에서 성장시킨 다음, 세포 성장에 대해 모니터링하고, OD600 ~ 1.0에서 수집하였다. 모든 샘플이 수집되면, 샘플을 얼음 상에 밤새 두었다. 이어서, 샘플을 OD600 ~ 0.1로, 300 μL의 최종 부피로 재희석하였고, 상응하는 dXTP (다양한 농도) 및 dTPT3TP (10 μM)를 제공하였다. 사용되지 않은 나머지 배양물을 펠릿화하고, UBP 보유를 결정하기 위해 ZR 플라스미드 정제용 키트 (지모 리서치)를 사용한 후속 플라스미드 단리를 위해 -80℃에서 저장하였다. 배양물이 OD600 ~ 0.4-0.6에 도달하면, NaMTP (250 μM) 및 TPT3TP (30 μM), 및 AzK (10 mM) (또는 AzK의 부재 하에 성장된 배양물의 경우 ddH2O)를 제공하였다. 광분해를 방지하기 위해 AzK의 첨가 후에 샘플을 차광하였다. 이어서, 이들 샘플을 37℃에서 20분 동안 성장시킨 후, 1 mM IPTG를 첨가하고, 37℃에서 추가로 1시간 동안 성장시켜 T7 RNAP, 및 tRNAPyl 및 PylRS의 전사를 유도하였다. 이 시점으로부터, 세포를 성장 및 형광에 대해 모니터링하였다. 이어서, sfGFP의 발현을 안히드로테트라시클린 (100 ng/mL)으로 유도하였다. 37℃에서 추가로 2.5시간 성장시킨 후, 세포를 수집하고 (UBP 보유를 결정하기 위한 플라스미드 단리를 위해 50 μL, sfGFP의 친화도 정제를 위해 230 μL), 냉각시킨 다음, 펠릿화하고, UBP 보유 및 단백질 정제의 평가 전에 -80℃에서 저장하였다.
XTP/YTP의 생체내 번역 스크린. pGEX-MbPylRS TetR 플라스미드를 보유하는 SSO 균주 ML2의 밤샘 배양물을 50 mM 인산칼륨, 5 μg/mL 클로람페니콜 및 100 μg/mL 카르베니실린이 보충된 2xYT (본원에서, 이 섹션에서 "배지"로 지칭됨)에서 성장시킨 다음, 동일한 배지에서 다시 OD600 0.03으로 희석하고, OD600 0.4 내지 0.6까지 성장시켰다. 이어서 배양물을 빙수 상에서 15분 동안 진탕시키면서 냉각시킨 다음, 3,200xg에서 10분 동안 원심분리하여 펠릿화하였다. 이어서 세포를 재현탁시키고, 빙냉 ddH2O로 2회 세척한 다음, 빙냉 ddH2O 중에 OD600 55 - 65로 재현탁시켰다. 전기적격 세포 (50 μL), 및 sfGFP 및 tRNAPyl 유전자 내에 UBP를 갖는 골든 게이트 어셈블리된 플라스미드 1 ng (플라스미드의 골든 게이트 어셈블리 참조)을 사전-냉각시킨 전기천공 큐벳 (0.2-cm-gap)으로 옮긴 다음, 제조업체의 권장사항 (전압 25 kV, 커패시터 2.5 μF, 저항기 200 Ω)에 따라 전기천공하고 (진 펄스 II; 바이오-라드), 이어서 950 μL의 배지로 즉시 희석하였다. 이어서, 형질전환의 분취물 (40 μL)을 dCNMOTP (25 μM) 및 dTPT3TP (10 μM)로 보충된 배지에서 200 μL의 최종 부피까지 5-배 희석한 다음, 37℃에서 1시간 진탕시키는 동안 회수되도록 하였다. 회수물의 2-배 희석물을 제오신 (50 μg/mL), dCNMOTP (10 μM), dTPT3TP (10 μM), 및 한천 (2% w/v)이 보충된 고체 배지 상에 플레이팅한 다음, 37℃에서 18시간 동안 성장시켰다. 단일 콜로니를 골라내어, 50 μg/mL 제오신이 보충되고 dCNMOTP (25 μM) 및 dTPT3TP (10 μM)가 제공된 배지 (300 μL) (본원에서, 이후에 이 섹션에서 "성장 배지"로 지칭됨)에서 성장시켰다. 배양물을 세포 성장에 대해 모니터링한 다음 (590/20 nm 필터를 갖는 엔비전 2103 멀티라벨 플레이트 판독기), OD600 ~ 1.0에서 수집하였다. 분취물 (50 μL)을 ZR 플라스미드 정제용 키트 (지모 리서치)를 사용하여 플라스미드 단리에 적용하였다. 이어서 단리된 플라스미드를 하기 기재된 스트렙타비딘 겔 변위 검정 (프라이머 P3-4 및 P5-6 사용, 표 S1)에 적용하여 UBP 보유를 결정하였다.
이어서, UBP 보유가 탁월한 콜로니를 성장 배지에서 OD600 ~ 0.01로 희석하고, OD600 ~ 0.4-0.6까지 성장시켰다. 이어서, 이 배양물을 다중 300 μL 배양물로 나누고, XTP 유사체의 스크리닝을 위해, 각각에 상응하는 XTP (25 μM 또는 250 μM) 또는 "-XTP" 샘플의 경우 ddH2O, TPT3TP (30 μM), 및 AzK (10 mM)를 제공하였다. YTP 유사체의 스크리닝을 위해, 각각의 300 μL 배양물에 상응하는 YTP (25 μM 또는 250 μM) 또는 "-YTP" 샘플의 경우 ddH2O, NaMTP (250 μM), 및 AzK (10 mM)를 제공하였다. 광분해를 방지하기 위해 AzK의 첨가 후에 샘플을 차광하였다. 이어서, 이들 샘플을 37℃에서 20분 동안 성장시킨 후, 1 mM IPTG를 첨가하고, 37℃에서 추가로 1시간 동안 성장시켜 T7 RNAP, 및 tRNAPyl 및 PylRS의 전사를 유도하였다. 이 시점으로부터, 세포를 성장 및 형광에 대해 모니터링하였다. 이어서, sfGFP의 발현을 안히드로테트라시클린 (100 ng/mL)으로 유도하였다. 37℃에서 추가로 3시간 성장시킨 후, 세포를 수집하고 (sfGFP의 친화도 정제를 위해 230 μL), 냉각시킨 다음, 펠릿화하고, 단백질 정제 전에 -80℃에서 저장하였다.
표 S2. 리보뉴클레오티드 스크리닝에 대해 기재된 조건 하에 3시간의 단백질 유도 후, 각각의 비천연 리보뉴클레오티드에 대해 관찰된 OD600 값으로, 제공된 트리포스페이트의 고농도를 저농도와 비교한 것에 의하면 독성이 명백하다.
Figure pct00392
스트렙타비딘 겔 변위 검정. CFX 연결 실시간 PCR 검출 시스템 (바이오-라드)에서 PCR 증폭을 수행하였다. 플라스미드 미니프렙, 또는 골든 게이트 어셈블리된 플라스미드 (0.5 μL 내지 2 μL, 0.5 ng/μL 내지 5 ng/μL), 또는 dNaM-함유 올리고뉴클레오티드 (0.025 ng)를 하기 조건 하에 15 μL의 총 반응 부피로 PCR 증폭시켰다: OneTaq 표준 반응 완충제 (1x, 뉴 잉글랜드 바이오랩스), dNTP (400 μM), SYBR 그린 I (1x, 라이프 테크놀로지스(Life Technologies)), MgSO4 (2.2 mM), 프라이머 P3-4 또는 P5-6 (각각 1 μM, 프라이머 서열에 대해서는 표 S4 참조), d5SICSTP (65 μM), dMMO2BIOTP (65 μM; 구조는 하기에 제시되며, 명확성을 위해 당 및 포스페이트는 생략됨), OneTaq DNA 폴리머라제 (0.27 U, 뉴 잉글랜드 바이오랩스), 딥벤트(DeepVent) DNA 폴리머라제 (0.105 U, 뉴 잉글랜드 바이오랩스).
Figure pct00393
번역 실험으로부터 단리된 플라스미드를 하기 열순환 조건을 사용하여 증폭시켰다 (시간은 mm:ss로 표시됨): [96℃ 5:00 | 20 x (95℃ 00:15 | 54℃ 00:15 | 68℃ 4:00]. 그 후, 스트렙타비딘 (2.5 μL, 2 μg/μL; 프로메가(Promega))을 각각의 반응물 (1 μL)과 혼합하고, 실온에서 5분 동안 인큐베이션하였다. 스트렙타비딘의 존재 하의 샘플 (3.5 μL) 및 부재 하의 샘플 (1 μL)을 각각 로딩 완충제와 혼합하고, 6% (wt/vol) 폴리아크릴아미드 (29:1 아크릴아미드:비스-아크릴아미드) 트리스/보레이트/EDTA (TBE) 겔 상에서 120 V에서 ~ 30분 동안 분리시켰다. 이어서, 겔을 1x SYBR 골드 염료 (써모 피셔)로 염색하고, 520DF30 필터 (바이오-라드)가 장착된 몰레큘라 이미저 겔 독 XR+ (바이오-라드)를 사용하여 영상화하였다. 이어서, 투입 플라스미드 (출발 형질전환에 사용된 플라스미드)에 대해 수득된 것 대비 각각의 레인에서 변위 밴드 대 비변위 밴드의 비를 비교함으로써 UBP 보유를 결정할 수 있었다. 본 검정은 이전에 정량적인 것으로 입증되었다.
스트렙타비딘 겔 변위 검정은 다양한 인자, 예컨대 미니-프렙 순도에 민감하고, UBP 보유의 검출을 위한 UBP-함유 플라스미드의 합리적인 증폭을 수득하기 위해, 때때로 보다 높은 플라스미드 농도로, 다수회 반복될 수 있다. 플라스미드 농도가 너무 낮은 경우에, UBP 보유는 스트렙타비딘 겔 변위 검정에 따라 더 낮게 나타나며, 더 많은 미니-프렙 플라스미드를 사용하여 반복하였다.
표 S3. 보다 높은 밀도의 비천연 유전자 정보의 검색과 관련된 구축물을 보유하는 세포로부터 추출된 플라스미드에 대한 스트렙타비딘 겔 변위 데이터 (퍼센트 UBP 보유)
Figure pct00394
sfGFP의 친화도 정제. 번역 실험으로부터 수집된 세포 펠릿을 버그부스터(BugBuster) (100 μL 1x, 이엠디 밀리포어(EMD Millipore)) 중에 재현탁시키고, 실온에서 15분 동안 진탕시켰다. 이어서, 세포 용해물을 완충제 W (380 μL; 50 mM HEPES pH 8, 150mM NaCl, 1 mM EDTA)로 희석하고, 완충제 W 중에서 평형화된 자기 스트렙-탁틴(Strep-Tactin) 비드 (20 μL, 마그스트렙(MagStrep) '유형3' XT 비드의 5% (v/v) 현탁액, 아이비에이 라이프사이언시스(IBA Lifesciences))를 첨가하였다. 혼합물을 4℃에서 30분 동안 부드럽게 뒤집었다. 이어서, 비드를 자기 랙으로 끌어내리고, 완충제 W (2 x 500 μL)로 세척한 다음, 25 μL BXT 완충제 (100 mM 트리스-HCl pH 8, 50 mM D-비오틴)를 첨가하고, 현탁액을 때때로 혼합하면서 실온에서 10분 동안 인큐베이션되도록 하였다. 비드를 다시 끌어내려 용리액을 수집하였다. 정제된 단백질을 큐비트 단백질 검정 키트 (써모 피셔 사이언티픽)를 사용하여 정량화하였다.
TAMRA의 구리-무함유 클릭 접합. 정제된 단백질 (300 ng)을 TAMRA-DBCO (0.1 mM, 클릭 케미스트리 툴즈(Click Chemistry Tools); 제품 #A131)와 혼합하고, 최종 반응 부피 6 μL까지 물을 첨가하고, 실온에서 밤새 인큐베이션하고, 차광하였다. 접합 후에, TAMRA의 광표백을 최소화하기 위해 샘플, 겔, 및 블롯의 광 노출을 최소화하기 위한 조치를 취하였다.
sfGFP의 웨스턴 블롯팅. TAMRA-DBCO에 접합된 정제된 단백질 (300 ng)을 로딩 완충제/염료 (250 mM 트리스-HCl, 30% (v/v) 글리세롤, 2% (w/v) SDS, pH 6.8)와 혼합한 다음 (2:1 v:v), 95℃에서 5분 동안 가열하였다. 단백질 래더 (색상 사전염색된 단백질 표준물, 넓은 범위, 뉴 잉글랜드 바이오랩스) 및 각각의 클릭 반응의 부분 (~ 60 ng 단백질)을 SDS-PAGE 겔 (스태킹 겔: 5% (w/v) 아크릴아미드:비스-아크릴아미드 29:1 (피셔(Fisher)), 0.125 M 트리스-HCl 및 0.1% SDS, pH 6.8 (프로토겔 스태킹 완충제, 내셔널 다이아그노스틱스(National Diagnostics)); 분해 겔: 15% (w/v) 아크릴아미드:비스-아크릴아미드 29:1 (피셔), 0.375 M 트리스-HCl 및 0.1% SDS, pH 8.8 (프로토겔 분해 완충제, 내셔널 다이아그노스틱스))에 로딩한 다음, SDS-PAGE 완충제 (25 mM 트리스-염기, 200 mM 글리신, 0.1% (w/v) SDS) 중에서 50 V에서 15분 동안, 이어서 120 V에서 추가로 ~ 4.5시간 동안 전개시켰다. 이어서, 샘플을 적절한 완충제 (20% (v/v) MeOH, 50mM 트리스-염기, 400 mM 글리신, 0.0373% (w/v) SDS) 중에서 반-건조 전달에 의해 저형광 PVDF (0.2 μM, 바이오-라드)로 옮기고, 15V에서 ~ 30-45분 동안 전개시켰다. 이어서, 막을 차단 용액 (37℃에서 1시간 동안 가용화시킨, PBS-T (PBS pH 7.4, 0.01% (v/v) 트윈-20) 중의 5% (w/v) 탈지유 (카네이션(Carnation))) 중에서 4℃에서 밤새 요동시켰다. 이어서, 막을 PBS-T로 2x 헹군 다음, 토끼 항-GFP 항체 (PBS-T 중 1:3000, 제품 #G1544, 로트 046M4871V, 시그마알드리치) 중에서 실온에서 1시간 동안 진탕시켰다. 이어서, 막을 PBS-T로 5분 동안 세척한 다음, 염소 항-토끼 알렉사 플루오르 647-접합된 항체 (PBS-T 중 1:20,000, 제품 #A32733, 로트 #SD250298, 써모 피셔 사이언티픽) 중에서 실온에서 45분 동안 진탕시켰다.
이어서, 막을 PBS-T로 세척하고 (3 x 5분), 하기 선호도로 설정한 평대 레이저 스캐너 (타이푼(Typhoon) 9410, 지이 아머샴 바이오사이언시스(GE Amersham Biosciences))로 영상화하였다: 50 μM 해상도, TAMRA의 경우 400 V PMT에 의한 532 nm 레이저 여기 및 580/30 nm 방출 필터, 및 알렉사플루오르 647의 경우 500 V PMT에 의한 633 nm 레이저 여기 및 670/30 nm 방출 필터.
AzK의 혼입을 평가하기 위해, SDS-PAGE에 의해 겔 변위를 생성하도록 정제된 단백질을 DBCO-TAMRA에 접합시켰다. 상이한 밴드 크기는 천연 sfGFP 및 sfGFP 접합된 TAMRA에 상응한다. 이어서, 이들 밴드를 이미지 스튜디오 라이트(Image Studio Lite) 5.2.5 소프트웨어 (리-코르 바이오사이언시스(LI-COR Biosciences))를 사용하여 밴드의 밀도측정 정량화에 의해 정량화하여, 변위 (접합) 밴드 대 변위 (접합) sfGFP 밴드 및 비변위 (천연) sfGFP 밴드 둘 다에 의해 생성된 총 신호의 비를 생성하였다. 이는 ncAA AzK가 혼입된 샘플에서의 퍼센트 단백질 변위 또는 sfGFP의 퍼센트로서 해석될 수 있다.
무손상 단백질의 정량적 고해상도 질량 분광측정법. 샘플 제조 및 데이터 획득. 정제된 단백질 (4 μg)을 450 μL 질량 분광 등급 물로 희석하고, 탈염을 위해 원심분리 필터 장치 (아미콘 울트라-0.5 - 밀리포어(Millipore))에 적용하였다. 장치를 14,000 x g에서 10분 동안 원심분리하고, 생성된 농축된 용액을 질량 분광 등급 물로 다시 500 μL의 총 부피로 희석하였다. 이 과정을 총 4회의 원심분리 동안 반복하였고, 최종 회전은 18분 동안 지속되었다. 최종 회전 후, 필터 장치를 새로운 마이크로원심분리 튜브로 바꾸고, 1,000 x g에서 2분 동안 원심분리하여 샘플을 회수하였다. 이어서, 탈염된 단백질을 워터스 G2-XS TOF에 연결된 워터스 I-클래스 LC 내로 주입하였다 (6 μL, ~250ng). 유동 조건은 0.4 mL/분, 50:50 물:아세토니트릴 플러스 0.1% 포름산이었다. ESI+에 의해 이온화를 수행하고, m/z 500 내지 m/z 2000에서 데이터를 수집하였다. 피크의 주요 부분에 걸쳐 스펙트럼 조합을 수행하고, 조합된 스펙트럼을 워터스 MaxEnt1을 사용하여 디컨볼루션하였다.
정량화 확인. sfGFP의 151 위치가 티로신 잔기 또는 AzK 잔기를 함유하는 것인, 인증 단백질 샘플을 상기 기재된 바와 동일한 플라스미드 제조 및 단백질 발현 조건을 사용하되, 각각 sfGFP151 (TAC) 및 sfGFP151 (TAG)를 사용하고, 비천연 트리포스페이트의 보충 없이 제조하였다. 이들 인증 단백질을 사용하여, Y151 및 AzK151 sfGFP의 혼합물을 100:0 내지 0:100의 범위의 AzK 대 Y에 걸쳐 규정된 비로 제조하였다. 이어서 이들 혼합물을 상기 기재된 바와 같이 제조하고 HRMS에 의해 정량화하였다. 관찰된 데이터는 샘플의 전체 범위 전반에 걸쳐 매우 선형이었고, 예상된 비와 정확하게 매칭되어, 이 방법이 고도로 정량적임을 확인시켜주었다.
리보뉴클레오시드 트리포스페이트의 독성 검사. ML2의 밤샘 배양물을 50 mM 인산칼륨 및 클로람페니콜 (5 μg/mL)이 보충된 2xYT 배지에서 성장시켰고, 이는 이 섹션 전반에 걸쳐 "배지"로 지칭된다. 이 배양물을 OD600 0.01로 다시 희석하여 다중 300 μL 배양물로 분할하였고, 각각을 트리포스페이트 대조군 없이 다양한 농도의 TPT3TP, TAT1TP, NaMTP, 또는 5FMTP로 보충하였다. 이어서, 배양물을 230 rpm에서 진탕시키면서 37℃에서 인큐베이션하였다. 이어서, 세포를 총 8시간 동안 매시간마다 세포 성장에 대해 모니터링하였다 (590/20 nm 필터를 갖는 엔비전 2103 멀티라벨 플레이트 판독기). 이어서, OD600을 각각의 농도에서 각각의 뉴클레오티드에 대해 시간의 함수로서 플롯팅하여 성장 속도의 차이를 가시화하였다.
실시예 2: 리보뉴클레오티드 후보의 합성 및 제1 SAR 분석.
UBP에 의해 이용가능하게 된 정보의 검색은 이전에 오직 NaMTP 및 TPT3TP만을 사용하여 연구되었다. SSO에서의 효율적인 전사 및 번역을 지배하는 SAR의 규명을 시작하기 위해, 9종의 신규 NaMTP 유사체 (도 4a) 및 4종의 신규 TPT3TP 유사체 (도 4b)를 설계하고 합성하였다. 이들 유사체는 핵염기 형상, 방향족 표면적, 및 헤테로원자 유도체화의 역할을 조사하기 위해 설계되었다. 일반적으로, XTP 유사체의 합성은 상응하는 아릴 할라이드의 리튬화에 이어, 리튬화된 종의 벤질- 또는 TBS-보호된 리보락톤에의 커플링을 통해 진행되었다. 생성된 헤미-아세탈 중간체를 삼플루오린화붕소 디에틸 에테레이트 및 트리에틸실란의 존재 하에 환원시켜 각 경우에 목적하는 보호된 뉴클레오시드를 수득하였다. 탈보호 후, 생성된 X 뉴클레오시드 유사체를 표준 루트비히 인산화 조건을 사용하여 트리포스페이트로 전환시켰다. NaMTP 및 MMO2TP를 이전에 보고된 바와 같이 합성하였다. YTP 유사체의 합성은 일반적으로 상응하는 아실 아지드의 분자내 쿠르티우스 재배열에 이어, 1-O아세틸-2,3,5-트리-O-벤조일-b-D-리보푸라노스에의 루이스-산 매개된 커플링으로 목적하는 보호된 뉴클레오시드의 순수한 β-아노머를 생성하는 것을 통해 진행된다. 피리딘의 상응하는 티오-피리돈으로의 전환 및 후속적인 벤조일 탈보호 후, 상응하는 유리 뉴클레오시드를 표준 루트비히 인산화 조건을 사용하여 트리포스페이트로 전환시켰다. 5SICSTP를 이전에 보고된 바와 같이 합성하였다.
SAR 분석을 NaMTP 및 9종의 XTP 유사체로 개시하였다. 상기 기재된 dXTP 스크린에서의 성능에 기초하여, 복잡하게 하는 인자로서 DNA 수준에서의 가변적 손실을 제거하기 위해, 비천연 정보를 dCNMO-dTPT3 UBP로 코딩하였다. 추가적으로, 뉴클레오시드 트리포스페이트 수송체 PtNTT2를 발현하지만, 또한 UBP의 보다 높은 충실도 복제를 위해 RecA를 코딩하는 유전자의 결실 (클로닝 균주에서 통상적인 바와 같음) 및 DNA Pol II의 과다발현에 의해 유전자 조작된 이. 콜라이 균주 ML2를 사용하였다. sfGFP151(AXC) 및 tRNAPyl(GYT)을 보유하는 상기 실시예 1A 및 1B에 기재된 동일한 플라스미드를 사용하였고, 스크린을 단일 비천연 리보뉴클레오티드에 집중시키기 위해, 엠. 마제이 Pyl tRNA를 30 μM TPT3TP의 존재 하에 전사시켰다. 다양한 XTP를 발현 배지 중에 고농도 (250 μM) 또는 저농도 (25 μM)로 제공한 것을 제외하고, 상기 기재된 바와 같이 세포를 성장시키고 단백질을 생산하도록 유도하였다 (도 5a-5d). 유도 3시간 후에 발현된 sfGFP를 정제하고, 상기 기재된 DBCO 매개된 겔 변위 검정을 사용하여 ncAA 함량을 분석하였다 (도 5b). 각각의 XTP를 250 μM로 사용한 것은 적어도 63%의 sfGFP 겔 변위를 발생시켰다. XTP의 부재 하에서의 관찰가능한 변위의 결여와 함께, XTP는 PtNTT2에 의해 유입되며, 리보솜에서 적어도 합리적인 효율로 전사 및 번역에 참여한다. CNMOTP 및 5F2OMeTP가 각각 잘 수행하여, 각각 92% 및 94%의 겔 변위를 발생시켰고, NaMTP, MMO2TP, 및 5FMTP가 가장 잘 수행하여, 단백질 겔 변위가 각각 98%, 97%, 및 98%였다. 유사하게 높은 수준의 단백질 순도로, 이들 3종의 XTP를 사용하여 생성된 상대 형광을 유의한 수준의 천연 sfGFP 오염물로 인한 임의의 복잡성의 부재 하에 비교하였다. 250 μM의 MMO2TP 또는 5FMTP로 성장시킨 세포는, 동일한 농도의 NaMTP로 성장시킨 세포와 비교하여, 각각 63% 및 90% 벌크 형광을 생성하였다 (도 5a).
시험된 보다 낮은 농도 (25 μM)에서, NaMTP의 사용은 보다 낮은 ncAA 혼입의 충실도를 발생시켰고, 단백질 변위는 86%로 떨어졌다. 9종의 NaMTP 유사체 중 7종이 또한 충실도의 유의한 감소를 나타내었지만, MMO2TP 및 5FMTP의 사용은 각각 94%의 단백질 변위를 생성하였다. 이들 리보뉴클레오티드와 함께 성장시킨 세포의 상대 형광을 비교하면 (이는 다시, 생성된 비천연 단백질의 유사하고 높은 충실도로 인해 가능함), 5FMTP는 이러한 보다 낮은 농도에서 MMO2TP보다 34% 더 많은 형광을 생성하였다. 일정량의 NaMTP (250 μM) 및 고농도 (250 μM) 또는 저농도 (25 μM)의 YTP 유사체를 공급하여 유사한 실험을 수행하였다. 이전의 보고와 일치하게, 보다 높은 농도의 TPT3TP의 첨가는 YTP를 제공받지 않은 대조군 샘플에 비해 유의하게 감소된 세포 성장을 발생시켰고 형광을 거의 발생시키지 않았다 (도 5c). 대조적으로, 각각의 다른 YTP 유사체는 배경을 초과하는 형광, 및 적어도 51%의 단백질 변위를 생성하였다 (도 5d). TAT1TP의 사용은 96%의 단백질 변위를 유지시키면서 임의의 다른 YTP보다 적어도 2.6-배 더 많은 형광을 발생시켰다. 이 농도에서 TAT1TP의 첨가는 어느 정도의 수준의 감소된 세포 성장을 발생시켰다 (데이터는 제시되지 않음). TPT3TP는 보다 낮은 농도로 제공될 경우 독성이 다소 낮고, 상응하게, 25 μM로 제공될 경우 세포는 유의한 양의 순수한 단백질을 생산한다. 이들 조건 하에, TPT3TP는 SICSTP, FSICSTP, 및 5SICSTP보다 각각 2-, 5-, 및 6-배 더 큰 형광을 생성하였다. 보다 높은 농도에서 TAT1TP에 의해 관찰된 독성은 보다 낮은 농도에서 거의 완전히 제거되었고 (데이터는 제시되지 않음), 그의 사용은 보다 높은 농도에서보다 더 큰 형광을 발생시켰다. 25 μM로 제공된 경우, TAT1TP는 250 μM로 제공된 경우보다 41% 더 많은 형광을 생성하였고, 흥미롭게도, TPT3TP가 25 μM로 제공된 경우보다 57% 더 많은 형광을 생성하였다. 이들 농도에서의 TAT1TP의 사용은 98% ncAA 혼입을 갖는 단백질의 생산을 발생시켰다.
합성 프로토콜.
일반적 물질 및 방법. 합성 절차의 경우, 모든 반응은 불활성 분위기 하에 오븐-건조된 유리제품에서 수행하였다. 용매를 4 Å 분자체 상에서 증류 및/또는 건조시켰다. 달리 나타내지 않는 한, 모든 다른 화학 시약을 추가 정제 없이 사용하였다. 1H, 13C, 및 31P 스펙트럼을 브루커 NMR 분광계 (AV-600, DRX-500, 또는 DPX-400) 상에서 취하였다. 질량 분광학적 데이터는 더 스크립스 리서치 인스티튜트(The Scripps Research Institute)의 코어 시설에서 수득하였다. 비천연 데옥시리보뉴클레오시드 트리포스페이트를 이전에 보고된 바와 같이 합성하였다 (문헌 [Dien, V. T. et al., J. Am. Chem. Soc. 2018, 140, 16115-16123; Lavergne, T. et al., J. Am. Chem. Soc. 2013, 135, 5408-5419; Matsuda, S. et al., J. Am. Chem. Soc. 2007, 129, 5551-5557; Seo, Y. J. et al., J. Am. Chem. Soc. 2009, 131, 3246-3252] 참조, 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨). 뉴클레오시드 트리포스페이트 dNaMTP, dTPT3TP, dCNMOTP, 및 TPT3TP는 신토르스 인크.에서 친절하게 제공하였다.
핵염기 13a의 합성. TAT1 핵염기 (화합물 13a)를 문헌 방법에 기초하여 합성하였다 (문헌 [New, J. S. et al., J. Med. Chem. 1989, 32, 1147-1156; Asagarasu, A. et al., Chem. Pharm. Bull. 2009, 57, 34-42] 참조, 이들 각각의 개시내용은 그 전문이 본원에 참조로 포함됨). 간략하게, 용매로서 피리딘 및 촉매로서 피페리딘 (2:1 피리딘 대 피페리딘, 2.75 M 최종 반응 농도)을 사용하여 13시간 동안 100℃에서 티아졸-4-카르복스알데히드 (1 당량)를 말론산과 축합시킨 다음, 1시간 동안 환류시켜 상응하는 아크릴산 중간체 (화합물 11)를 수득하였다. 이러한 산 (1 당량)을 촉매 DMF (0.2 당량)의 존재 하에 클로로포름 (1.3 M 반응 농도) 중 티오닐 클로라이드 (1.1 당량)로 염소화시켜 아실 클로라이드를 수득하였다. 추가 정제 없이, 아실 클로라이드를 아지드화나트륨 (2 당량)을 사용하여 5℃에서 1,4-디옥산 및 물의 1:1 2상 혼합물 중에서 상응하는 아지드 (화합물 12)로 전환시켰다. 조 아실 아지드를 클로로포름 중에 용해시키고, 디페닐 에테르에 0.2 M까지 적가하였다. 이어서, 생성된 혼합물을 230℃로 2시간 동안 가열하였다. 실온으로 냉각시킨 후, 헥산을 첨가하고, 세척을 위해 추가의 헥산을 사용하여 반응 혼합물을 여과하였다. 생성된 조 물질을 플래쉬 크로마토그래피에 의해 고정상으로서 실리카 겔을 사용하여 정제하여 목적 핵염기 (화합물 13a)를 수득하였다.
반응식 S1. (g) 피페리딘, 피리딘, 100℃, 12시간, 이어서 1시간 동안 환류, (h) SOCl2, DMF, CHCl3, 환류, 3시간, (i) NaN3, 1,4-디옥산, H2O, 5℃, 0.5시간, (j) 디페닐 에테르, 230℃, 1시간
Figure pct00395
핵염기 커플링 및 TBS-보호된 리보락톤 2의 탈보호. 아릴 할라이드 (1.0 당량)를 무수 THF 중에 0.1 M로 용해시키고, -78℃로 냉각시켰다. 냉각되면, n-BuLi의 용액 (1.6 당량, 헥산 중 1.6M)을 반응 플라스크에 적가하였다. 이 혼합물을 -78℃에서 30분 동안 교반한 후, 무수 THF 중 TBS-보호된 리보락톤 (화합물 2, 1.6 당량)의 용액을 ~0.8 M에서 적가하였다. 이어서, 반응물을 -78℃에서 추가로 1시간 동안 교반되도록 한 후, 염화암모늄의 포화 수용액으로 켄칭하였다. 실온으로 가온되면, 휘발성 물질을 진공 하에 제거하고, 생성된 잔류물을 에틸 아세테이트 및 물로 추출하였다. 유기부를 황산나트륨 상에서 건조시키고, 여과하고, 휘발성 물질을 다시 진공 하에 제거하였다.
잔류 용매를 고진공 하에 실온에서 1시간 동안 제거한 후, 무수 DCM 중에 0.1 M로 재용해시켰다. 용액을 -78℃로 냉각시킨 후, 트리에틸실란 (3 당량)을 적가하고, 이어서 삼플루오린화붕소 디에틸 에테레이트의 48% 용액 (3 당량)을 적가하였다. 이어서, 반응물을 -78℃에서 15-20분 동안 교반되도록 한 후, 메탄올 및 트리에틸아민의 1:1 용액으로 켄칭하였다 (반응물의 부피의 30% 부피를 첨가함). 이 혼합물을 -78℃에서 3분 동안 교반되도록 한 후, 포화 중탄산나트륨 (원래의 반응 부피의 50%)을 첨가하였다. 이어서, 혼합물을 DCM으로 2-배 희석하고, 유기 층을 분리하였다. 수성 층을 DCM으로 2회 더 추출하고, 합한 유기부를 황산나트륨 상에서 건조시키고, 여과하고, 진공 하에 농축시켰다.
임의의 잔류 용매를 실온에서 1시간 동안 고진공 하에 나머지 잔류물로부터 제거하였다. 이 때, 잔류물을 THF 중에 0.1 M로 용해시키고, 테트라부틸암모늄 플루오라이드의 용액을 첨가하였다 (3.3 당량, THF 중 1.0 M). 반응물을 1시간 동안 교반되도록 한 후, 에틸 아세테이트로 희석하고, 물로 추출하였다. 합한 유기부를 황산나트륨으로 건조시키고, 여과하고, 진공 하에 농축시켰다. 이어서, 생성된 잔류물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 이동상으로서 DCM 중 5-10% 에탄올을 사용하여 정제하였다.
핵염기 커플링 및 벤질-보호된 리보락톤 10의 탈보호. 아릴 할라이드 (1.0 당량)를 무수 THF 중에 0.1 M로 용해시키고, -78℃로 냉각시켰다. 냉각되면, n-BuLi의 용액 (1.6 당량, 헥산 중 1.6 M)을 반응 플라스크에 적가하였다. 이 혼합물을 -78℃에서 30분 동안 교반한 후, 무수 THF 중 벤질-보호된 리보락톤 (화합물 10, 1.6 당량)의 용액을 ~0.8 M에서 적가하였다. 이어서, 반응물을 -78℃에서 추가로 1시간 동안 교반되도록 한 후, 염화암모늄의 포화 수용액으로 켄칭하였다. 실온으로 가온되면, 휘발성 물질을 진공 하에 제거하고, 생성된 잔류물을 에틸 아세테이트 및 물로 추출하였다. 유기부를 황산나트륨 상에서 건조시키고, 여과하고, 휘발성 물질을 다시 진공 하에 제거하였다.
잔류 용매를 고진공 하에 실온에서 1시간 동안 제거한 후, 무수 DCM 중에 0.1 M로 재용해시켰다. 용액을 -78℃로 냉각시킨 후, 트리에틸실란 (3 당량)을 적가하고, 이어서 삼플루오린화붕소 디에틸 에테레이트의 48% 용액 (3 당량)을 적가하였다. 이어서, 반응물을 -78℃에서 15-20분 동안 교반되도록 한 후, 메탄올 및 트리에틸아민의 1:1 용액으로 켄칭하였다 (반응물의 부피의 30% 부피를 첨가함). 이 혼합물을 -78℃에서 3분 동안 교반되도록 한 후, 포화 중탄산나트륨 (원래의 반응 부피의 50%)을 첨가하였다. 이어서, 혼합물을 DCM으로 2-배 희석하고, 유기 층을 분리하였다. 수성 층을 DCM으로 2회 더 추출하고, 합한 유기부를 황산나트륨 상에서 건조시키고, 여과하고, 진공 하에 농축시켰다. 이어서, 벤질-보호된 뉴클레오시드 중간체를 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 이동상으로서 헥산 중 0에서 8-10% 에틸 아세테이트의 구배를 사용하여 정제하였다.
정제된 벤질 보호된 뉴클레오시드를 탄소 상 10% 팔라듐 (0.1 당량)과 함께 메탄올 중에 0.1 M로 희석하였다. 용액을 액체 질소로 동결시키고, 동결시키는 동안, 반응 플라스크를 수소로 3회 퍼징하고, 마지막 퍼징 후에 플라스크를 수소 풍선 하에 두었다. 이어서, 반응물이 해동되도록 하고, 수소 하에 실온에서 3시간 동안 격렬히 교반하였다. 이어서, 반응물을 에틸 아세테이트로 세척하면서 실리카 겔의 패치 상에서 여과하였다. 이어서, 휘발성 물질을 진공 하에 제거하고, 생성된 조 잔류물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 이동상으로서 DCM 중 5-10% 에탄올을 사용하여 정제하였다.
아릴 브로마이드의 시안화. 건조 마이크로웨이브 바이알에 CuCN (8 당량), Pd2(dba)3 (0.1 당량), 및 DPPF (0.1 당량)를 채우고, 아르곤으로 3회 퍼징하였다. 아릴 브로마이드 (1 당량)를 탈기된 무수 DMF 중에 0.05-0.1M로 용해시키고, 반응 플라스크로 옮겼다. 이어서, 플라스크를 아르곤 하에 밀봉하고, 155℃에서 밤새 (~16시간) 격렬히 교반하였다. 이어서, 반응물을 실온으로 냉각시키고, 에틸 아세테이트로 세척하면서 실리카 겔의 짧은 패치 상에서 여과하였다. 휘발성 물질을 진공 하에 제거하고, 생성된 조 잔류물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 이동상으로서 헥산 중 70-95% 에틸 아세테이트의 구배를 사용하여 정제하였다.
뉴클레오시드의 트리인산화에 대한 일반적 프로토콜. 불활성 기체 하에, 건조 마이크로웨이브 바이알에 양성자 스폰지 (1.3 당량) 및 자유 뉴클레오시드 (1 당량)를 채웠다. 무수 트리메틸 포스페이트 (40 당량)를 플라스크에 첨가하고, 생성된 혼합물을 염 빙조에서 -15℃로 냉각시켰다. 새로이 증류된 옥시염화인 (1.3 당량)을 냉각된 플라스크에 적가하고, 반응물을 -15℃에서 3시간 동안 교반되도록 하였다. 이 때, 트리부틸암모늄 피로포스페이트 (5 당량)를 별개의 건조 플라스크에서 무수 DMF 중에 0.5 M로 용해시키고, 반응 플라스크에 적가하고, 이어서 무수 트리부틸아민 (6 당량)을 적가하였다. 생성된 혼합물을 0℃로 천천히 가온하고, 이 온도에서 추가로 30분 동안 교반되도록 하였다. 이어서, 반응물을 수성 트리에틸암모늄 비카르보네이트 (0.5M, pH 7.5, 총 반응 부피와 1:1)의 첨가에 의해 켄칭하고, 실온에서 15분 동안 교반하였다. 이어서, 이러한 켄칭된 반응 혼합물을 음이온 교환 크로마토그래피에 의해 고정상으로서 DEAE 세파덱스 A-25 및 이동상으로서 pH 7.5에서 0-1.2M TEAB로부터의 느린 구배를 사용하여 정제하였다. 뉴클레오시드 트리포스페이트를 함유하는 분획을 합하고, 스피드백에 의해 농축시켜 건조, 목적 생성물을 수득하였다.
핵염기 커플링 및 벤조일-보호된 리보락톤 14의 탈보호. 아세토니트릴 중 핵염기 (1.0 당량) 및 N,O-비스(트리메틸실릴)아세트아미드 (1.2 당량)의 0.1 M까지의 혼합물을 아르곤 분위기 하에 실온에서 30분 동안 교반하였다. 이 때, 1-O-아세틸-2,3,5-트리-O-벤조일-β-D-리보푸라노스 (화합물 14, 1.2 당량)를 첨가하고, 생성된 반응 혼합물을 0℃로 냉각시켰다. 이어서, SnCl4 (1 당량)를 반응 혼합물에 첨가하고, 용액을 실온에서 밤새 교반하였다. 반응물을 에틸 아세테이트 및 포화 수성 NaHCO3으로 추출하고, 합한 유기 층을 무수 Na2SO4 상에서 건조시켰다. 여과 및 증발 후, 잔류물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 정제하였다.
피리돈의 티오-피리돈으로의 전환. 피리돈 (1 당량)을 건조 톨루엔과의 반복 공-증발에 의해 건조시켰다. 라웨슨 시약 (3 당량)을 아르곤 하에 첨가하고, 혼합물을 120℃에서 밤새 가열하였다. 목화 상에서 여과한 후, 여과물을 농축시키고, 조 생성물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 정제하였다.
보호된 뉴클레오시드의 플루오린화. 보호된 뉴클레오시드 (1 당량)를 MeOH- CH3CN (1:1 v/v) 중에 0.1 M로 용해시키고, 셀렉트플루오르 (1.1 당량)를 첨가하였다. 혼합물을 환류 하에 3시간 동안 가열하였다. 이어서, 휘발성 물질을 진공 하에 제거하고, 생성된 잔류물을 에틸 아세테이트 및 물로 추출하였다. 합한 유기 층을 증발시키고, 생성된 조 잔류물을 무수 톨루엔과의 3회 공-증발에 의해 건조시켰다. 잔류물을 TfOH-DCM (1:1 v/v) 중에 0.1 M로 용해시키고, 혼합물을 실온에서 1시간 동안 교반하였다. 이 때, 반응물을 진공 하에 농축시키고, 생성된 조 생성물을 실리카 겔 상에서 플래쉬 크로마토그래피에 의해 정제하였다.
화합물 특징화.
화합물 1b. (0.387 mmol, 38% 수율, 3단계). 1H NMR (600 MHz, 클로로포름-d) 7.46 (dd, J = 8.2, 0.9 Hz, 1H), 7.01 (dd, J = 8.2, 1.9 Hz, 1H), 6.87 (d, J = 1.9 Hz, 1H), 5.32 (d, J = 3.3 Hz, 1H), 4.43 (dd, J = 4.6, 3.3 Hz, 1H), 4.37 (dd, J = 8.1, 4.6 Hz, 1H), 4.05 - 4.01 (m, 1H), 3.97 (dd, J = 12.0, 3.2 Hz, 1H), 3.83 (s, 3H), 3.77 (dd, J = 11.9, 4.1 Hz, 1H). 13C NMR (151 MHz, CDCl3) 156.40, 134.51, 128.81, 124.00, 121.01, 111.03, 82.18, 78.55, 73.31, 72.25, 62.57, 55.85. HRMS (ESI-TOF+) 계산치 C12H15ClO5 [M+Na]+ 297.0500; 실측치 297.0501.
화합물 3b. (0.333 mmol, 52% 수율, 3단계). 1H NMR (600 MHz, 메탄올-d4) 7.53 (d, J = 7.4, 1.5 Hz, 1H), 7.24 (td, J = 7.8, 1.8 Hz, 1H), 6.98- 6.92 (m, 2H), 5.33 (d, J = 2.9 Hz, 1H), 4.35 - 4.28 (m, 2H), 4.03 (ddd, J = 8.2, 4.7, 2.6 Hz, 1H), 3.89 (dd, J = 13.1, 3.8 Hz, 1H), 3.84 (s, 3H), 3.70 (dd, J = 12.0, 4.7 Hz, 1H). 13C NMR (151 MHz, MeOD) 157.46, 129.07, 129.03, 127.68, 121.09, 110.69, 83.00, 79.66, 74.04, 73.61, 63.32, 55.72. HRMS (ESI-TOF+) 계산치 C12H16O5 [M+Na]+ 263.0890; 263.0888.
화합물 4b. (0.765 mmol, 62% 수율, 3단계). 1H NMR (600 MHz, 클로로포름-d) 7.23 (dd, J = 9.2, 3.1 Hz, 1H), 6.94 (td, J = 8.4, 3.2 Hz, 1H), 6.77 (dd, J = 8.9, 4.2 Hz, 1H), 5.28 (d, J = 3.3 Hz, 1H), 4.43 - 4.38 (m, 1H), 4.30 (dd, J = 8.2, 4.6 Hz, 1H), 3.99 (dt, J = 7.8, 3.6 Hz, 1H), 3.90 (dd, J = 12.0, 3.2 Hz, 1H), 3.79 (s, 3H), 3.72 (dd, J = 12.0, 4.0 Hz, 1H). 13C NMR (151 MHz, CDCl3) 158.28, 156.69, 151.87, 151.86, 127.64, 127.59, 115.09, 114.92, 114.62, 114.46, 110.95, 110.90, 81.92, 78.51, 73.10, 72.30, 62.37, 56.02. HRMS (ESI-TOF+) 계산치 C12H15FO5 [M+Na}+ 281.0796; 281.0799.
화합물 5b. (0.366 mmol, 50% 수율, 3단계). 1H NMR (600 MHz, 메탄올-d4) δ 7.95 (s, 1H), 7.43 (s, 1H), 7.32 (d, J = 5.4 Hz, 1H), 7.26 (d, J = 5.4 Hz, 1H), 5.38 (d, J = 3.0 Hz, 1H), 4.40 - 4.35 (m, 1H), 4.32 (dd, J = 8.5, 4.4 Hz, 1H), 4.06 (ddd, J = 8.2, 4.6, 2.6 Hz, 1H), 3.92 (dd, J = 12.0, 2.5 Hz, 1H), 3.90 (s, 3H), 3.71 (dd, J = 12.0, 4.7 Hz, 1H). 13C NMR (151 MHz, 메탄올-d4) δ 154.39, 139.73, 133.33, 124.79, 123.31, 122.99, 122.24, 102.01, 81.60, 78.62, 72.69, 72.23, 61.98, 54.69. HRMS (ESI-TOF+) 계산치 C14H16O5S [M+Na]+ 319.0611; 319.0612.
화합물 6b. (0.160 mmol, 51% 수율, 3단계). 1H NMR (600 MHz, 메탄올-d4) δ 7.98 (s, 1H), 7.48 (d, J = 5.4 Hz, 1H), 7.34 (s, 1H), 7.29 (d, J = 5.4 Hz, 1H), 5.39 (d, J = 3.7 Hz, 1H), 4.40 - 4.35 (m, 1H), 4.32 (dd, J = 8.5, 4.4 Hz, 1H), 4.05 (ddd, J = 8.4, 4.7, 2.6 Hz, 1H), 3.91 (dd, J = 11.9, 2.6 Hz, 1H), 3.89 (s, 3H), 3.71 (dd, J = 12.0, 4.7 Hz, 1H). 13C NMR (151 MHz, 메탄올-d4) δ 154.41, 139.63, 131.85, 126.26, 125.11, 123.24, 120.94, 102.92, 81.60, 78.66, 72.68, 72.29, 61.95. HRMS (ESI-TOF+) 계산치 C14H16O5S [M+Na]+ 319.0611; 319.0609.
화합물 7b. (1.248 mmol, 61% 수율, 3단계). 1H NMR (600 MHz, 클로로포름-d) δ 7.41 (dd, J = 8.1, 0.9 Hz, 1H), 7.17 (dd, J = 8.1, 1.8 Hz, 1H), 7.02 (d, J = 1.8 Hz, 1H), 5.32 (d, J = 3.3 Hz, 1H), 4.44 (dd, J = 4.6, 3.4 Hz, 1H), 4.38 (dd, J = 8.1, 4.6 Hz, 1H), 4.04 (dt, J = 7.7, 3.6 Hz, 1H), 3.98 (dd, J = 11.9, 3.2 Hz, 1H), 3.83 (s, 3H), 3.79 (dd, J = 11.9, 4.1 Hz, 1H). 13C NMR (151 MHz, CDCl3) δ 155.82, 128.57, 123.94, 123.44, 121.77, 113.26, 81.62, 78.00, 72.72, 71.60, 61.99, 55.28. HRMS (ESI-TOF-) 계산치 C12H15BrO5 [M+Cl]- 352.9797; 실측치 352.9799.
화합물 8a. (0.066 mmol, 화합물 6b로부터 42% 수율). 1H NMR (600 MHz, 메탄올-d4) δ 7.68 (dd, J = 7.8, 0.9 Hz, 1H), 7.34 (dd, J = 7.8, 1.5 Hz, 1H), 7.28 (d, J = 1.5 Hz, 1H), 5.32 (d, J = 3.1 Hz, 1H), 4.39 (dd, J = 4.5, 3.2 Hz, 1H), 4.30 (dd, J = 8.6, 4.5 Hz, 1H), 4.03 (ddd, J = 8.6, 4.6, 2.5 Hz, 1H), 3.93 - 3.89 (m, 4H), 3.70 (dd, J = 12.0, 4.6 Hz, 1H). 13C NMR (151 MHz, MeOD) δ 157.65, 134.76, 129.90, 125.39, 120.07, 113.77, 112.30, 83.14, 79.64, 73.80, 73.50, 63.17, 56.31, 50.87. HRMS (ESI-TOF-) 계산치 C13H15NO5 [M-H]- 264.0877; 실측치 264.0869.
화합물 9b. (0.288 mmol, 29% 수율, 3단계). 1H NMR (600 MHz, 클로로포름-d) δ 7.12 (d, J = 9.9 Hz, 1H), 6.73 (d, J = 6.1 Hz, 1H), 5.02 (d, J = 6.1 Hz, 1H), 4.17 (dd, J = 5.9, 4.8 Hz, 1H), 4.13 - 4.09 (m, 1H), 4.08 (t, J = 6.0 Hz, 1H), 3.98 (dd, J = 11.9, 3.3 Hz, 1H), 3.87 (s, 3H), 3.85, 3.81 (m, 1H), 2.29 (d, J = 2.0 Hz, 3H). 13C NMR (151 MHz, CDCl3) δ 156.19, 154.61, 151.45, 126.24, 124.08, 123.95, 113.10, 83.98, 80.69, 71.56, 62.65, 55.76, 14.22. HRMS (ESI-TOF+) 계산치 C13H17FO5 [M+Na]+ 295.0952; 295.0952.
화합물 13a (3.184 mmol, 4단계에 걸쳐 11%). 1H NMR (500 MHz, DMSO-d6) δ 11.87 (br, 1 H, N-H), 9.59 (s, 1H, Ar-H), 7.50 (d, J = 5.0 Hz, 1 H, Ar-H), 6.98 (d, J = 5.0 Hz, 1 H, Ar-H). 13C NMR (125 MHz, CDCl3) δ 161.9, 150.3, 159.2, 133.1, 124.3, 102.5. HRMS (ESI-TOF+) 계산치 C6H5N2OS+ [M+H]+ 153.0117; 실측치 153.0115.
화합물 13b. (0.530 mmol, 53% 수율). 1H NMR (500 MHz, CDCl3) δ 9.13 (s, 1 H, Ar-H), 7.36-8.16 (m, 16H, Ar-H), 6.87 (d, J = 5.0 Hz, 1 H, H-1'), 6.71 (d, J = 5.0 Hz, 1 H, Ar-H), 5.99-6.01 (m, 1 H, H-3'), 5.90-5.92 (m, 1 H, H-2'), 4.92 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'a), 4.80-4.82 (m, 1 H, H-4'), 4.72 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, CDCl3) δ 166.5. 165.7, 165.6, 160.7, 156.7, 134.1, 133.9, 130.9, 130.3, 130.2, 130.1, 130.1, 130.1, 129.8, 129.1, 129.0, 128.9, 128.8, 104.5, 89.2, 80.8, 75.3, 71.4, 64.0. HRMS (ESI-TOF+) 계산치 C32H25N2O8S [M+H]+ 597.1326; 실측치 597.1330.
화합물 13c. (0.056 mmol, 56% 수율). 1H NMR (500 MHz, CDCl3) δ 9.16 (s, 1 H, Ar-H), 7.31-8.24 (m, 17 H, Ar-H), 7.12 (d, J = 5 Hz, 1H, H-1'), 5.95-5.96 (m, 1 H, H-2' ), 5.87-5.90 (m, 1 H, H-3'), 4.99 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'a), 4.89-4.91 (m, 1H, H-4'), 4.73 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, CDCl3) δ 175.7, 166.4, 165.6, 165.3, 163.7, 151.8, 142.1, 134.2, 134.1, 134.0, 132.5, 130.5, 130.3, 130.1, 129.2, 129.2, 128.9, 128.9, 109.7, 92.2, 80.8, 75.9, 69.9, 63.0. HRMS (ESI-TOF+) 계산치 C32H25N2O7S2 [M+H]+ 613.1098; 실측치 613.1095.
화합물 13d. (0.043 mmol, 89% 수율). 1H NMR (500 MHz, DMSO-d6) δ 9.58 (s, 1 H, Ar-H), 8.68 (d, J = 10 Hz, 1 H, Ar-H), 7.45 (d, J = 10 Hz, 1 H, Ar-H), 6.81 (d, J = 2.5 Hz, 1 H, H-1'), 5.48 (d, J = 5 Hz, 1 H, -OH), 5.39-5.41 (m, 1 H, -OH), 5.18 (d, J = 5 Hz, 1 H , -OH), 4.03-4.05 (m, 2 H, H-2', H-3'), 3.98-4.00 (m, 1 H, H-4'), 3.78 (dd, J1 = 10Hz, J2 = 2.5 Hz, 1 H, H-5'a), 3.64 (dd, J1 = 10Hz, J2 = 2.5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, DMSO-d6) δ 174.2, 166.6, 152.2, 135.5, 109.4, 99.9, 95.1, 85.5, 76.6, 69.0, 60.2. HRMS (ESI-TOF+) 계산치 C11H13N2O4S2 [M+H]+ 301.0311; 실측치 301.0309.
화합물 15b. (0.931 mmol, 93% 수율). 1H NMR (500 MHz, CDCl3) δ 9.05 (d, J = 10 Hz, 1 H, H-Ar), 7.30-8.16 (m, 20 H, Ar-H), 6.72 (d, J = 5 Hz, 1 H, H-1'), 5.97-5.99 (m, 1 H, H-2'), 5.85-5.88 (m, 1 H, H-3'), 4.98 (dd, J1 = 10 Hz, J2 = 5 Hz, 1 H, H-5'a), 4.89-4.90 (m, 1 H, H-4'), 4.72 (dd, J1 = 10 Hz, J2 = 5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, CDCl3) δ 182.1, 179.6, 166.6, 165.5, 165.5, 165.2, 151.1, 143.9, 134.0, 133.9, 133.6, 130.4, 130.3, 130.2, 130.1, 129.6, 129.4, 129.1, 128.9, 128.9, 128.8, 92.8, 80.4,75.7, 69.7, 62.8. HRMS (ESI-TOF+) 계산치 C35H28NO8 [M+H]+ 590.1809; 실측치 590.1811.
화합물 15c. (0.088 mmol, 87% 수율). 1H NMR (500 MHz, CDCl3) δ 9.07 (d, J = 10 Hz, 1 H, Ar-H), 7.30-8.17 (m, 20 H, Ar-H, H-1'), 5.98-5.99 (m, 1 H, H-2'), 5.82-5.84 (m, 1 H, H-3'), 4.89-4.94 (m, 2 H, H-5'a, H-4'), 4.80 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, CDCl3) δ 184.9, 166.5, 165.6, 165.3, 134.0, 133.9, 133.3, 132.7, 130.5, 130.3, 130.2, 129.8, 129.5, 129.1, 128.9, 128.9, 128.8, 127.3, 127.1, 112.8, 92.6, 80.3, 75.9, 70.1, 63.2. HRMS (ESI-TOF+) 계산치 C35H28NO7S [M+H]+ 606.1581; 실측치 606.1579.
화합물 15d. (0.044 mmol, 92% 수율). 1H NMR (500 MHz, MeOH-d4) δ 8.33 (d, J = 10 Hz, 1 H, Ar-H), 7.52-7.80 (m, 4 H, Ar-H), 6.71 (d, J = 5 Hz, 1 H, Ar-H), 6.36 (d, J = 2.5 Hz, 1 H, H-1'), 4.22-4.26 (m, 2 H, H-2', H-3'), 4.10-4.11 (m, 1 H, H-4'), 3.94 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'a), 3.82 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H- 5'b). 13C NMR (125 MHz, MeOH-d4) δ 163.0, 137.6, 133.0, 127.5, 127.4, 127.1, 126.3, 125.6, 106.9, 90.1, 85.1, 75.5, 70.3, 61.4. HRMS (ESI-TOF+) 계산치 C14H16NO4S [M+H]+ 294.0795; 실측치 294.0799.
화합물 16a. (0.077 mmol, 71% 수율). 1H NMR (500 MHz, CDCl3) δ 7.33-8.42 (m, 20 H, Ar-H), 6.82 (d, J = 5 Hz, 1 H, H-1'), 5.94-5.97 (m, 1 H, H-2'), 5.83-5.85 (m, 1 H, H-3'), 4.87 (d, J = 10 Hz, 1 H, H-5'a), 4.74-4.79 (m, 2 H, H-4', H-5'b). 13C NMR (125 MHz, CDCl3) δ 166.6, 165.7, 165.6, 162.9, 160.8, 134.0, 134.0, 133.9, 133.5, 130.3, 130.2, 130.1, 129.7, 129.1, 129.1, 129.1, 128.9, 128.8, 128.8, 120.3, 111.1, 88.9, 87.8, 85.3, 80.6, 80.4, 74.8, 71.4, 64.1. 19F NMR (376 MHz, CDCl3) δ -145.6. HRMS (ESI-TOF+) 계산치 C35H27FNO8 [M+H]+ 608.1715; 실측치 608.1717.
화합물 16b. (0.066 mmol, 65% 수율). 1H NMR (500 MHz, CDCl3) δ 9.07 (d, J = 10 Hz,1 H, Ar-H), 7.32-8.18 (m, 20 H, Ar-H, H-1'), 5.96- 5.98 (m, 1 H, H-2'), 5.87-5.89 (m, 1 H, H-3'), 4.97 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'a), 4.89-4.91 (m, 1H, H-4'), 4.76 (dd, J1 = 15 Hz, J2 = 5 Hz, 1 H, H-5'b). 13C NMR (125 MHz, CDCl3) δ 184.3, 166.6, 165.6, 165.3, 134.7, 134.1, 134.0, 133.9, 133.9, 133.3, 133.2, 130.5, 130.3, 130.3, 129.8, 129.7, 129.3, 129.2, 128.9, 128.9, 128.9, 128.8, 128.3, 126.8, 108.4, 100.0, 92.3, 80.7, 75.8, 70.3, 63.2, 56.0. HRMS (ESI-TOF+) 계산치 C35H27FNO7S [M+H]+ 624.1487; 실측치 624.1490.
화합물 16c. (0.042 mmol, 90% 수율). 1H NMR (500 MHz, MeOH-d4) δ 9.04 (d, J = 10 Hz, 1 H, H-Ar), 8.73 (d, J = 10 Hz, 1 H, H-Ar), 7.83-7.87 (m, 2 H, Ar-H), 7.65-7.68 (m, 1 H, H-Ar), 6.96 (s, 1 H, H-1'), 4.23-4.29 (m, 2 H, H-2', H-3'), 4.18-4.4.21 (m, 1 H, H-4'), 4.11 (dd, J1 = 10 Hz, J2 = 5 Hz, H-5'a), 3.91 (dd, J1 = 10 Hz, J2 = 5 Hz, H-5'b). 13C NMR (125 MHz, MeOH-d4) δ 180.5, 150.5, 148.6, 134.2, 134.1, 133.2, 132.0, 132.0, 129.2, 126.1, 125.9, 119.6, 119.6, 115.5, 115.1, 96.2, 84.4, 76.1, 68.1, 59.4. HRMS (ESI-TOF)+ 계산치 C14H15FNO4S [M+H]+ 312.0700; 실측치 312.0702.
화합물 1c. (0.048, 24% 수율). 31P NMR (162 MHz, H2O) δ -8.79 - -10.99 (m), -21.21 - -21.58 (m), -21.77 - -23.23 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z) [M-H]- 계산치 C12H17ClO14P3-, 512.95; 실측치, 512.7.
화합물 3c. (0.031 mmol, 31% 수율). 31P NMR (162 MHz, H2O) δ -11.19 - -11.91 (m), -22.06 - -22.73 (m), -23.87 - -24.46 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z) [M-H]- 계산치 C12H18O14P3-, 479.00; 실측치, 497.4.
화합물 4c. (0.014 mmol, 14% 수율). 31P NMR (162 MHz, H2O) δ -7.31 (d), -11.47 (d), -22.79 - -23.21 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C12H17FO14P3-, 496.97; 실측치, 497.3.
화합물 5c. (0.042 mmol, 23% 수율). 31P NMR (162 MHz, D2O) δ -8.48 (d, J = 17.8 Hz), -11.21 (d, J = 20.7 Hz), -22.96 (t, J = 21.6 Hz). MS (MALD-TOF-, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C14H18O14P3S-, 534.97; 실측치, 535.4.
화합물 6c. (0.017 mmol, 21% 수율). 31P NMR (162 MHz, D2O) δ -9.25 (d, J = 21.0 Hz), -10.93 (d, J = 19.5 Hz), -22.94 (t, J = 20.5 Hz). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C14H18O14P3S-, 534.97; 실측치, 535.4.
화합물 7c. (0.009 mmol, 12% 수율). 31P NMR (162 MHz, H2O) δ -10.07 - -11.45 (m), -21.8 - -22.21 (m), -24.06 - -24.60 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z) [M-H]- 계산치 C12H17BrO14P3-, 556.91; 실측치, 556.6.
화합물 8b. (0.023 mmol, 22% 수율). 31P NMR (162 MHz, H2O) δ -9.96 - -12.34 (m), -21.91 - -22.45 (m), -22.88 - -24.4 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z) [M-H]- 계산치 C13H17NO14P3-, 503.99; 실측치, 504.3.
화합물 9c. (0.021 mmol, 21% 수율). 31P NMR (162 MHz, H2O) δ -9.77 - -10.37 (m), -10.8 - -11.17 (m), -22.0 - -22.2 (m). MS (MALDI-TOF-, 매트릭스: 9-아미노아크리딘) (m/z) [M-H]- 계산치 C13H19FO14P3-, 511.0; 실측치, 511.0.
화합물 13e. (0.007 mmol, 22% 수율). 31P NMR (400 MHz, D2O): δ -10.82-10.94 (m), -11.68-11.74 (m), -23.21-23.45 (m). MS (MALDI-TOF, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C11H14N2O13P3S2-, 538.9, 실측치, 538.3.
화합물 15e. (0.012 mmol, 35% 수율). 31P NMR (400 MHz, D2O): δ -10.74-10.84 (m), -11.55-11.67 (m), -23.17-23.42 (m). MS (MALDI-TOF, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C14H17NO13P3S-, 532.0, 실측치, 532.5.
화합물 16d. (0.009 mmol, 29% 수율). 31P NMR (400 MHz, D2O): δ -10.65-10.79 (m), -11.45-11.54 (m), -22.16-23.40 (m). MS (MALDI-TOF, 매트릭스: 9-아미노아크리딘) (m/z): [M-H]- 계산치 C14H16FNO13P3S-, 550.0, 실측치, 550.6.
반응식 S2. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00396
반응식 S3. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00397
반응식 S4. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00398
반응식 S5. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00399
반응식 S6. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00400
반응식 S7. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (c) 1.0 M TBAF, THF, 1시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간.
Figure pct00401
반응식 S8. (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간, (e) CuCN, Pd2(dba)3, DPPF, DMF, 155℃, 16시간
Figure pct00402
반응식 S9. (a) 1.6 M n-BuLi, THF, -78℃, 1시간, (b) 트리에틸실란, DCM, BF3ㆍOEt2, -78℃, 15-20분, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간, (f) H2(g), Pd/C (10%), MeOH, rt, 3시간
Figure pct00403
반응식 S10. (k) N,O-비스(트리메틸실릴)아세트아미드, SnCl4, CH3CN, RT, 밤새, (l) 라웨슨 시약, 120℃, 밤새, (m) 30% NaOMe, DCM, 0℃, 2시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간
Figure pct00404
반응식 S11. (k) N,O-비스(트리메틸실릴)아세트아미드, SnCl4, CH3CN, RT, 밤새, (l) 라웨슨 시약, 120℃, 밤새, (m) 30% NaOMe, DCM, 0℃, 2시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간
Figure pct00405
반응식 S12. (n) i. 셀렉트플루오르, MeOH/CH3CN (1:1 v/v), 환류, 3시간; ii. TfOH/DCM (1:1 v/v), 1시간, (l) 라웨슨 시약, 120℃, 밤새,(m) 30% NaOMe, DCM, 0℃, 2시간, (d) 양성자 스폰지, POCl3, Bu3N, Bu3NPPi, (MeO)3P, DMF, -15℃, 3시간
Figure pct00406
실시예 3: 비천연 단백질 생산의 최적화.
실시예 1A, 1B, 및 2는 정보의 저장을 위한 적격 UBP로서 dCNMO-dTPT3, 및 그의 검색을 위한 적격 리보뉴클레오시드 트리포스페이트로서 TAT1TP 및 NaMTP 또는 5FMTP를 확인시켜주었다. 상기 사용된 동일한 플라스미드로 형질전환되면, 10 μM dTPT3TP 및 25 μM dCNMOTP를 성장 배지에 제공하였고, 이어서 또한 모두 일련의 2-배 희석물로, TAT1TP를 100 μM 내지 12.5 μM 범위의 농도로, 및 NaMTP 또는 5FMTP를 200 μM 내지 12.5 μM 범위의 농도로 보충하였고, 1 mM AzK의 첨가 후, 세포가 sfGFP를 발현하도록 유도하였다. TAT1TP 및 NaMTP가 제공된 세포에서 관찰된 총 sfGFP 형광은 일반적으로 TAT1TP 및 5FMTP가 제공된 세포에서 관찰된 것보다 더 높았다 (도 6a 및 도 6b). 둘 다의 경우에, 형광은 NaMTP 또는 5FMTP의 보다 낮은 농도에서 더 높았다 (오염성 천연 sfGFP의 증가된 생산으로 인함, 하기 참조). 추가적으로, 세포는 일반적으로 보다 높은 농도의 TAT1TP에서 보다 높은 형광을 생성하였다. 그러나, 성장의 약간의 감소로 인해, 100 μM TAT1TP를 제공받은 세포는 50 μM TAT1TP를 제공받은 것보다 더 낮은 형광을 생성하였다. 겔 변위 검정을 통해 단백질 생산을 다시 정량화하였다 (도 6c 및 도 6d). 일반적으로, NaMTP의 농도가 200 μM 미만으로 감소함에 따라, sfGFP 내로의 AzK 혼입의 점증적으로 더 낮은 충실도가 관찰된 반면, 5FMTP의 사용 시 충실도의 이러한 감소는 단지 50 μM의 농도 미만에서만 관찰되었다. 명백하게 보다 낮은 농도의 5FMTP가 충실도를 손상시키지 않으면서 사용될 수 있다. 고농도의 5FMTP (≥ 50 μM)를 제공받은 세포는 조사된 모든 농도의 TAT1TP (100 μM, 50 μM, 25 μM, 또는 12.5 μM)에서 높은 단백질 변위를 생성하였다. 그러나, 5FMTP의 농도가 25 μM 이하인 경우, TAT1TP의 농도의 감소는 감소된 단백질 변위를 발생시켰다. NaMTP가 200 μM로 제공된 경우, 조사된 모든 농도의 TAT1TP는 높은 충실도 ncAA 혼입을 갖는 단백질의 생산을 발생시켰지만, 보다 낮은 농도의 NaMTP에 의하면, TAT1TP의 농도의 감소는 다시 감소된 단백질 변위를 발생시켰다. 모두, 이들 연구는 단백질 순도 및 수율의 조합된 최적화가 각각 200 μM 및 50 μM의 농도로 제공된 NaMTP 및 TAT1TP, 또는 둘 다 50 μM의 농도로 제공된 5FMTP 및 TAT1TP에 의해 달성된다는 것을 밝혀내었다. 단백질 생산 단독의 관점에서, NaMTP 및 TAT1TP의 사용이 최적인 반면, 5FMTP 및 TAT1TP의 사용은 순수한 ncAA-표지된 단백질의 약간 더 낮은 수율을 발생시키지만, 유의하게 더 낮은 농도의 XTP를 필요로 한다.
생체내 번역 조건의 최적화. pGEX-MbPylRS TetR 플라스미드를 보유하는 SSO 균주 ML2의 밤샘 배양물을 50 mM 인산칼륨, 5 μg/mL 클로람페니콜 및 100 μg/mL 카르베니실린이 보충된 2xYT (본원에서, 이 섹션에서 "배지"로 지칭됨)에서 성장시킨 다음, 동일한 배지에서 다시 OD600 0.03으로 희석하고, OD600 0.4-0.6까지 성장시켰다. 이어서 배양물을 빙수 상에서 15분 동안 진탕시키면서 냉각시킨 다음, 3,200xg에서 10분 동안 원심분리하여 펠릿화하였다. 이어서 세포를 재현탁시키고, 빙냉 ddH2O로 2회 세척한 다음, 빙냉 ddH2O 중에 OD600 55 - 65로 재현탁시켰다. 전기적격 세포 (50 μL), 및 sfGFP 및 tRNAPyl 유전자 내에 UBP를 갖는 골든 게이트 어셈블리된 플라스미드 ~ 1 ng (플라스미드의 골든 게이트 어셈블리 참조)을 사전-냉각시킨 전기천공 큐벳 (0.2-cm-gap)으로 옮긴 다음, 제조업체의 권장사항 (전압 25 kV, 커패시터 2.5 μF, 저항기 200 Ω)에 따라 전기천공하고 (진 펄스 II; 바이오-라드), 이어서 950 μL의 배지로 즉시 희석하였다. 이어서, 형질전환의 분취물 (40 μL)을 dCNMOTP (25 μM) 및 dTPT3TP (10 μM)로 보충된 배지에서 200 μL의 최종 부피까지 5-배 희석한 다음, 37℃에서 1시간 진탕시키는 동안 회수되도록 하였다. 회수물의 2-배 희석물을 제오신 (50 μg/mL), dCNMOTP (10 μM), dTPT3TP (10 μM), 및 한천 (2% w/v)이 보충된 고체 배지 상에 플레이팅한 다음, 37℃에서 18시간 동안 성장시켰다. 단일 콜로니를 골라내어, 50 μg/mL 제오신이 보충되고 dCNMOTP (25 μM) 및 dTPT3TP (10 μM)가 제공된 배지 (300 μL) (본원에서, 이후에 이 섹션에서 "성장 배지"로 지칭됨)에서 성장시켰다. 배양물을 세포 성장에 대해 모니터링한 다음 (590/20 nm 필터를 갖는 엔비전 2103 멀티라벨 플레이트 판독기), OD600 ~ 1.0에서 수집하였다. 분취물 (50 μL)을 ZR 플라스미드 정제용 키트 (지모 리서치)를 사용하여 플라스미드 단리에 적용하였다. 이어서 단리된 플라스미드를 하기 기재된 스트렙타비딘 겔 변위 검정 (프라이머 P3-4 및 P5-6 사용, 표 S1)에 적용하여 UBP 보유를 결정하였다.
이어서, UBP 보유가 탁월한 콜로니를 성장 배지에서 OD600 ~ 0.01로 희석하고, OD600 ~ 0.4-0.6까지 성장시켰다. 이어서, 이 배양물을 다중 300 μL 배양물로 나누고, 각각에 5FMTP,TAT1TP 또는 NaMTP,TAT1TP를 가변 농도의 각각의 XTP (12.5 μM, 25 μM, 50 μM, 100 μM, 또는 200 μM) 및 TAT1TP (12.5 μM, 25 μM, 50 μM, 또는 100 μM)로 제공하였다. AzK (10 mM)를 또한 이 시점에서 세포에 제공하였다. 광분해를 방지하기 위해 AzK의 첨가 후에 샘플을 차광하였다. 이어서, 이들 샘플을 37℃에서 20분 동안 성장시킨 후, 1 mM IPTG를 첨가하고, 37℃에서 추가로 1시간 동안 성장시켜 T7 RNAP, 및 tRNAPyl 및 PylRS의 전사를 유도하였다. 이 시점으로부터, 세포를 성장 및 형광에 대해 모니터링하였다. 이어서, sfGFP의 발현을 안히드로테트라시클린 (100 ng/mL)으로 유도하였다. 37℃에서 추가로 3시간 성장시킨 후, 세포를 수집하고 (sfGFP의 친화도 정제를 위해 230 μL), 냉각시킨 다음, 펠릿화하고, 단백질 정제 전에 -80℃에서 저장하였다.
고밀도 비천연 코돈의 생체내 번역. pGEX-MbPylRS TetR 플라스미드를 보유하는 SSO 균주 ML2의 밤샘 배양물을 50 mM 인산칼륨, 5 μg/mL 클로람페니콜 및 100 μg/mL 카르베니실린이 보충된 2xYT (본원에서, 이 섹션에서 "배지"로 지칭됨)에서 성장시킨 다음, 동일한 배지에서 다시 OD600 0.03으로 희석하고, OD600 0.4-0.6까지 성장시켰다. 이어서 배양물을 빙수 상에서 15분 동안 진탕시키면서 냉각시킨 다음, 3,200xg에서 10분 동안 원심분리하여 펠릿화하였다. 이어서 세포를 재현탁시키고, 빙냉 ddH2O로 2회 세척한 다음, 빙냉 ddH2O 중에 OD600 55 - 65로 재현탁시켰다. 전기적격 세포 (50 μL), sfGFP의 149 또는 153 코돈 위치, 3개의 확인된 코돈 위치 중 2개, 또는 모든 3개의 위치 (sfGFP149(AXC), sfGFP151(AXC), sfGFP149,151(AXC,AXC), sfGFP151,153(AXC,AXC), sfGFP149,153(AXC,AXC), 및 (sfGFP149,151,153(AXC,AXC,AXC))에서 UBP를 갖는 골든 게이트 어셈블리된 플라스미드 ~ 1 ng (플라스미드의 골든 게이트 어셈블리 참조)을 사전-냉각시킨 전기천공 큐벳 (0.2-cm-gap)으로 옮겼다. 이어서 세포를 제조업체의 권장사항 (전압 25 kV, 커패시터 2.5 μF, 저항기 200 Ω)에 따라 전기천공하고 (진 펄스 II; 바이오-라드), 이어서 950 μL의 배지로 즉시 희석하였다. 이어서, 형질전환의 분취물 (40 μL)을 dNaMTP (150 μM) 및 dTPT3TP (10 μM) (본원에서 이후에 이 섹션에서 "구 조건"으로 지칭됨) 또는 dCNMOTP (150 μM) 및 dTPT3TP (10 μM) (본원에서 이후에 이 섹션에서 "신 조건"으로 지칭됨)로 보충된 배지에서 200 μL의 최종 부피까지 5-배 희석한 다음, 37℃에서 1시간 진탕시키는 동안 회수되도록 하였다. 회수물의 2-배 희석물을 제오신 (50 μg/mL), 상응하는 비천연 트리포스페이트, 및 한천 (2% w/v)이 보충된 고체 배지 상에 플레이팅한 다음, 37℃에서 ~ 18시간 동안 성장시켰다. 단일 콜로니를 골라내어, 50 μg/mL 제오신이 보충된 배지 (300 μL) (본원에서, 이후에 이 섹션에서 "성장 배지"로 지칭됨)에서 성장시키고, 구 조건 또는 신 조건에 대해 상응하는 비천연 트리포스페이트를 제공하였다. 배양물을 세포 성장에 대해 모니터링한 다음 (590/20 nm 필터를 갖는 엔비전 2103 멀티라벨 플레이트 판독기), OD600 ~ 1.0에서 수집하였다. 수집된 세포를 얼음 상에서 밤새 냉각시켰다.
이어서, 세포를 성장 배지 중에 OD600 ~ 0.1로 재희석하고, 구 조건 또는 신 조건에 대해 상응하는 비천연 트리포스페이트를 제공한 다음, OD600 ~ 0.4-0.6까지 성장시켰다. 이어서, 구 조건에 상응하는 세포에 NaMTP (250 μM) 및 TPT3TP (30 μM)를 제공한 반면, 신 조건에 상응하는 세포에는 NaMTP (200 μM) 및 TAT1TP (50 μM)를 제공하였다. AzK (10 mM) (또는 AzK의 부재 하에 성장된 배양물의 경우 ddH2O)를 또한 이 시점에서 세포에 제공하였다. 광분해를 방지하기 위해 AzK의 첨가 후에 샘플을 차광하였다. 이어서, 이들 샘플을 37℃에서 20분 동안 성장시킨 후, 1 mM IPTG를 첨가하고, 37℃에서 추가로 1시간 동안 성장시켜 T7 RNAP, 및 tRNAPyl 및 PylRS의 전사를 유도하였다. 이 시점으로부터, 세포를 성장 및 형광에 대해 모니터링하였다. 이어서, sfGFP의 발현을 안히드로테트라시클린 (100 ng/mL)으로 유도하였다. 37℃에서 추가로 3시간 성장시킨 후, 세포를 냉각시키고, 수집하고 (UBP 보유를 결정하기 위한 플라스미드 단리를 위해 50 μL, sfGFP의 친화도 정제를 위해 230 μL), 이어서 펠릿화하고, 단백질 정제 및 UBP 보유의 평가 전에 -80℃에서 저장하였다.
결과. 고농도에서 조사된 모든 10종의 XTP는 적어도 중간 ncAA 혼입 충실도 (98% 내지 63%)로 단백질의 생산을 매개할 수 있다. 일반적으로, XTP 농도가 감소함에 따라, ncAA 혼입의 충실도가 감소하였고, 이는 비천연 mRNA가 전사되는 충실도의 감소를 나타낸다. 이는 XTP가 보류되었을 때 관찰된 유의한 형광과 일치한다.
본 실시예는 주로 소수성인 리보뉴클레오티드의 전사 및 번역에 대한 SAR을 제공하였다. XTP의 경우, NaMTP, PTMOTP, 및 MTMOTP를 고려할 때, 고리 수축 및/또는 헤테로원자 유도체화는 일부 경우에 유해하다. 그러나, 모노시클릭 핵염기 XTP의 경우, ClMOTP를 제외하고, MTMOTP 및 PTMOTP에 비해 보다 높은 충실도 단백질 생산이 관찰된다. 일부 경우에, 비천연 핵염기 사이의 또는 폴리머라제와의 특이적 상호작용은 염기 쌍형성에 유익하다. 예를 들어, 모노시클릭 핵염기의 4- 및 5-위치 둘 다에서의 치환은 일부 경우에 염기 쌍형성을 초래한다. 2OMeTP와 비교하여, 4-위치에서의 Cl 또는 Br 치환기 (ClMOTP 및 BrMOTP)는 일부 경우에 유해하고, 4-위치에서의 메틸 기 (MMO2TP)는 전체 형광을 감소시키지만, 단백질 충실도는 증가시킨다. 4-위치에서의 니트릴 치환기 (CNMOTP)는 최대량의 비천연 단백질의 생산을 발생시키고, 또한 ncAA가 혼입되는 충실도를 어느 정도 증가시킨다. 5-위치에서의 플루오로 치환기의 부가 (5F2OMeTP)는 또한 2OMeTP에 비해 단백질 생산 및 충실도 둘 다를 증가시킨다. 5-플루오로 및 4-메틸 치환기를 조합한 것 (5FMTP)은 다른 비천연 트리포스페이트에 비해 보다 낮은 농도에서 순수한 비천연 단백질의 고수율 생산을 가능하게 하기 때문에, 4- 및 5-위치에서의 치환의 효과는 일부 경우에 적어도 대략 상가적인 것으로 보인다. 그러나, 보다 높은 농도를 필요로 하지만, NaMTP는 검사된 XTP 유사체의 수율 및 순도의 균형잡힌 조합을 제공한다. 일부 경우에, XTP 유사체에 대해 유래된 SAR은 dXTP 유사체의 복제로부터 유래된 것과 뚜렷하게 상이하다. 예를 들어, dPTMOTP, dClMOTP, 및 dCNMO는 일부 경우에 dNaMTP보다 더 최적이지만, ClMOTP 및 PTMOTP는 일부 경우에 NaMTP보다 어느 정도 및 유의하게 덜 최적이다. 또한, dCNMO는 지금까지 발견된 dTPT3에 대한 가장 최적의 파트너이며, CNMOTP의 사용은 NaMTP에 비해 ncAA 혼입의 약간 감소된 충실도를 발생시키지만 그의 사용은 가장 비천연인 단백질 생산을 발생시킨다. 최고 농도에서, 조사된 모든 5종의 YTP는 tRNAPyl의 안티코돈 내로 효과적으로 혼입되었고, 적어도 중간 ncAA 혼입 충실도 (98% 내지 51%)로 단백질의 생산을 매개할 수 있었다. 이론에 얽매이지는 않지만, 보다 적은 단백질 겔 변위를 발생시키는 YTP의 경우 tRNA의 전사가 매우 비효율적이거나 또는 낮은 충실도임을 암시하는데, UBP 보유 데이터는 단백질 생산의 충실도가 비천연 tRNA의 어느 정도의 손실에 감수성이지 않음을 시사한다. TPT3TP, SICSTP, FSICSTP, 및 TAT1TP는 모두 최고 농도에서 적어도 약간 독성이었고 (데이터는 제시되지 않음), 벌크 세포 형광은 농도가 감소함에 따라 증가하였다. XTP 및 mRNA의 전사와 달리, 비천연 단백질의 충실도는 감소하지 않았으며, 이는 증가된 단백질 생산이 단순히 증가된 세포 성장의 결과임을 시사한다. 대조적으로, 5SICSTP는 최소 독성을 나타내었고 (데이터는 제시되지 않음), 비천연 단백질 생산 및 충실도 둘 다는 농도가 감소함에 따라 감소하였고, 이는 다시 아마도 유의하게 손상된 비천연 tRNA 생산으로 인한 것일 것이다. 이러한 YTP SAR을 고려하고 참조로서 SICSTP를 사용할 경우에, 7-플루오로 치환기 (FSICSTP)는 일부 경우에 유해하고, 단지 소량의 단백질만이 생산되고 낮은 충실도를 갖는다. 5-위치에서의 메틸 기의 부가 (5SICSTP)는 독성을 감소시키지만, 또한 일부 경우에 비천연 tRNA 생산을 감소시킨다. 고리 수축 및 헤테로원자 유도체화 (TPT3TP)는 일부 경우에 단백질 생산 및 충실도 둘 다를 개선시키지만, 고농도에서는 종종 다른 YTP 유사체와 비교하여 독성이다. TAT1TP의 티오아졸을 생성하기 위한 TPT3TP의 티오펜 고리의 추가의 헤테로원자 유도체화는 독성의 감소와 함께 TPT3TP보다 더 많은 비천연 단백질의 생성을 발생시킨다. 생산된 단백질의 양 및 ncAA 혼입의 충실도 둘 다를 고려하면, TAT1TP가 일부 경우에 YTP로서 사용된다.
실시예 4: 보다 높은 밀도의 비천연 정보의 저장 및 검색.
보다 높은 밀도의 UBP를 함유하는 유전자로부터 정보의 저장 및 검색을 평가하였다. 이 목적을 위해, 상기 기재된 코돈 (코돈 151)으로부터 단일 천연 코돈만큼 각각 떨어져 있는 코돈 149 또는 153을 코딩하도록 위치된 UBP를 갖는 sfGFP 유전자를 함유하는 DNA를 복제하는 SSO의 능력을 확인하였다. 따라서, 상기 기재된 바와 같이 발현 플라스미드를 구축하되, 서열 AXC가 코돈 149 또는 153을 코딩하도록 위치시켰다 (각각 sfGFP149(AXC) 또는 sfGFP153(AXC)). ML2가 형질전환되면, 세포를 본 발명자들의 이전에 보고된 시스템 (데옥시리보뉴클레오티드 dNaMTP 및 dTPT3TP 및 리보뉴클레오티드 NaMTP 및 TPT3TP, dNaM-dTPT3/NaMTP, TPT3TP로 표시됨) 또는 현재 연구에서 발견된 최적화된 시스템 (dCNMOdTPT3/NaMTP, TAT1TP)에 상응하는 비천연 뉴클레오시드 트리포스페이트의 존재 하에 성장시켰다. 이어서, UBP 보유를 상기 기재된 바와 같이 스트렙타비딘 겔 변위 검정을 사용하여 특징화하였다. sfGFP149(AXC) 및 sfGFP153(AXC) 유전자 둘 다 (≥95%) 뿐만 아니라 tRNA 유전자 (≥91%)에서의 상응하는 UBP의 높은 보유가 둘 다의 조건 하에 관찰되었다 (데이터는 제시되지 않음).
유도 3시간 후에 관찰된 총 sfGFP 형광은 둘 다의 세트의 조건 하에 AzK의 존재 하에서의 둘 다의 구축물로부터의 유의한 단백질 생산을 밝혀내었다 (도 7a).
그러나, dCNMOdTPT3/NaM,TAT1이 제공된 sfGFP149(AXC) 구축물을 발현하는 세포로부터의 형광은 dNaM-dTPT3/NaM,TPT3이 제공된 세포보다 58% 더 높았다. sfGFP153(AXC) 유전자의 경우에, dNaMdTPT3/NaMTP,TPT3TP보다 dCNMOdTPT3/NaMTP,TAT1TP에 의해 43% 더 많은 형광이 관찰되었다. 둘 다의 세트의 조건 하에서, sfGFP149(AXC)보다 sfGFP153(AXC)에 의해 대략 2-배 더 많은 형광이 관찰되었다. 단백질을 정제하고, AzK 혼입을 상기 기재된 바와 같이 분석하였다 (도 7b). dNaM-dTPT3/NaMTP,TPT3TP의 경우, sfGFP149(AXC) 및 sfGFP153(AXC)에 의해 각각 86% 및 94%의 단백질 변위가 관찰되었다. 그러나, dCNMOdTPT3/NaMTP,TAT1TP의 경우, 각 구축물로부터 생산된 단백질에 의해 96% 변위가 관찰되었다. 이들 결과는 2개의 추가의 코돈 위치가 둘 다 효율적으로 전사되고 번역되지만, 다시 이들은 새로이 확인된 dCNMO-dTPT3/NaMTP,TAT1TP 시스템에 의해 보다 잘 전사되고 번역된다는 것을 명백하게 입증한다. 검사된 위치 중 2개 또는 모든 3개에서 동시에 코딩된 비천연 코돈을 갖는 발현 플라스미드 (각각 sfGFP149,151(AXC,AXC), sfGFP151,153(AXC,AXC), sfGFP149,153(AXC,AXC), 및 sfGFP149,151,153(AXC,AXC,AXC))를 구축하였다. ML2 세포를 형질전환시키고, dNaMdTPT3/NaMTP,TPT3TP 또는 dCNMOdTPT3/NaMTP,TAT1TP의 존재 하에 성장시키고, 단백질 발현을 상기 기재된 바와 같이 유도하였다. tRNAPyl(GYT) 유전자에서의 UBP 보유는 모든 경우에 높게 유지되었지만 (≥88%) (데이터는 제시되지 않음), mRNA 유전자를 사용한 비오틴 변위 검정은 복잡하고 해석불가능한 밴드 패턴을 생성하였고, 이는 아마도, 적어도 부분적으로, 단일 PCR 생성물이 다중 스트렙타비딘에 결합된 복합체의 혼합물의 형성으로 인한 것일 것이다. 상기 기재된 바와 같이 DBCO-TAMRA에의 접합을 통해 생산된 단백질 (도 7b)을 검사하였다. 만족스럽게도, 단일 ncAA에 의해 관찰된 변위에 비해, sfGFP149,151(AXC,AXC), sfGFP151,153(AXC,AXC), 및 sfGFP149,153(AXC,AXC) 구축물로부터 발현된 단백질에 대해 유의하게 추가로 변위된 밴드가 관찰되었고, 이는 2개의 AzK 잔기를 보유하는 sfGFP에 대한 2개의 DBCO-TAMRA 분자의 접합을 나타낸다. dNaM-dTPT3/NaMTP,TPT3TP 하에 발현된 정제된 단백질을 분석할 경우, 총 sfGFP 대비 이들 이중 변위된 밴드의 정량화는 각각 sfGFP149,151(AXC,AXC), sfGFP151,153(AXC,AXC), 또는 sfGFP149,153(AXC,AXC) 구축물을 사용할 경우 각각 단백질의 80%, 87%, 및 83%가 2개의 AzK 잔기를 갖고, 각각 20%, 13%, 또는 9%가 단일 AzK를 갖는다는 것을 밝혀내었다. dCNMOdTPT3/NaMTP,TAT1TP의 경우, 각각 sfGFP149,151(AXC,AXC), sfGFP151,153(AXC,AXC), 및 sfGFP149,153(AXC,AXC)에 의해 단백질의 81%, 89%, 및 93%가 2개의 ncAA를 갖는 한편, 19%, 11%, 및 6%는 단일 ncAA를 가졌다. sfGFP149,151,153(AXC,AXC,AXC) 구축물로 형질전환된 세포는 훨씬 더 변위된 밴드를 생성하는 단백질을 발현하였고, 이는 명백하게 3개의 AzK 잔기의 혼입을 나타낸다. 총 sfGFP 대비 각각의 밴드의 정량화는 dNaM-dTPT3/NaMTP,TPT3TP의 사용이 각각 3, 2 및 1개의 ncAA를 갖는 단백질을 39%, 24% 및 33% 생성하였고, 형광 및 단백질 변위는 고도로 가변적임을 밝혀내었다 (도 7a 및 7b). 대조적으로, dCNMO-dTPT3/NaMTP,TAT1TP 시스템의 사용은 생산된 단백질의 90%가 모든 3개의 ncAA를 갖고, 나머지는 2개를 갖게 하였다.
dCNMO-dTPT3/NaMTP,TAT1TP 시스템에 의한 모든 3개의 ncAA의 성공적인 혼입을 추가로 확인하기 위해, 단리된 sfGFP를 정량적 무손상 단백질 질량 분광측정법에 의해 분석하였다. 간략하게, 정제된 단백질을 원심분리 필터 장치 (아미콘R 울트라-0.5 - 밀리포어)를 사용하여 탈염시키고, HRMS (ESI-TOF)에 의해 분석하였다. 획득한 질량 스펙트럼을 후속적으로 워터스 맥스엔트 1(Waters MaxEnt 1) 소프트웨어를 사용하여 디컨볼루션하였으며, 이는 피크 적분 시 정량적인 것으로 입증되었다 (데이터는 제시되지 않음). 겔 변위 검정과 일치하게, 이러한 분석은 단리된 단백질의 88%가 예상된 3개의 AzK 잔기를 함유하였고, 나머지 12%는 2개의 AzK 잔기 및 단일 Ile 또는 Leu 잔기를 함유한다는 것을 밝혀내었다 (도 7c).
결과. 전체적으로, SAR은 dCNMOdTPT3/NaMTP,TAT1TP 시스템이 다량의 단백질을 ncAA의 높은 충실도 혼입으로 생산한다는 것을 확인시켜주었다. dCNMOdTPT3/5FMTP,TAT1TP의 사용은 동일한 높은 충실도로 단백질을 생산하며, 이는 약간 더 적은 단백질을 생산하지만, 유의하게 더 적은 비천연 리보뉴클레오티드의 사용을 필요로 한다. dCNMO-dTPT3/NaMTP,TAT1TP 시스템의 유용성은 일부 경우에 보다 높은 밀도의 비천연 정보의 코딩 및 검색에 유용하다. 둘 다의 시스템은 2개의 ncAA를 갖는 단백질을 높은 충실도로 생산하였지만, dCNMOdTPT3/NaMTP, TAT1TP 시스템이 일반적으로 목적하는 단백질을 보다 많은 양으로 생산하였다. 또한, 3개의 ncAA를 코딩하는 경우, dNaM-dTPT3/NaMTP, TPT3TP 시스템은 유의하게 감소되고 보다 가변적인 충실도 및 수율로 3중 표지된 단백질을 생산한 반면, dCNMO-dTPT3/NaMTP,TAT1TP 시스템을 사용한 충실도 및 수율은 재현가능하게 높게 유지되었다. 이론에 얽매이지는 않지만, Ile 또는 Leu가 단일 ncAA를 대체한 오염물은 비천연 tRNA 생산으로 인해 생길 가능성이 없는데, 이는 tRNA 유전자에서의 UBP 보유가 둘 다의 시스템에 대해 높고 유사하며, 단지 작은 차이가 존재하고, 단일 ncAA-혼입 데이터는 이들이 비천연 단백질 생산의 충실도의 유의한 감소를 유발하지 않을 것임을 시사하기 때문이다. 또한, 이는 mRNA 전사로 인해 일어날 가능성이 없고, 이는 2개의 시스템에 대해 동일할 것이다 (둘 다의 경우에 dTPT3이 NaM의 mRNA 내로의 혼입을 지시함). 이론에 얽매이지는 않지만, Leu/Ile 오염물의 기원은 복제 동안 mRNA 유전자에서의 UBP의 상실일 가능성이 있으며; 이는 또한 Ile 코돈을 생성할 것으로 예상되는 가장 흔한 돌연변이 (dX에서 dT로)와 일치한다.
식별 인용에 의해 본원에 언급된 모든 간행물, 특허, 특허 출원 및 공개된 특허 출원의 개시내용은 그 전문이 본원에 참조로 포함된다.
서열
서열식별번호: 1. pGEX-MbPylRS TetR PylRS 발현 플라스미드의 서열 (5923 bp)
Figure pct00407
Figure pct00408
Figure pct00409
서열식별번호: 2. sfGFP 및 tRNAPyl 발현을 위한 p[sfGFP(gg)151; tRNAPyl(gg)] GG 목표 플라스미드의 서열 (3101 bp)
Figure pct00410
SEQUENCE LISTING <110> THE SCRIPPS RESEARCH INSTITUTE <120> REAGENTS AND METHODS FOR REPLICATION, TRANSCRIPTION, AND TRANSLATION IN SEMI-SYNTHETIC ORGANISMS <130> 36271-808.601 <140> <141> <150> 62/861,901 <151> 2019-06-14 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 5923 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1 gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt 60 gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac aattaatcat 120 cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagtattc 180 atggataaaa aaccgctgga cgttctgatc tccgctacgg gtctgtggat gagccgcacg 240 ggtacgctgc ataaaattaa acaccacgaa gtgtcacgtt cgaaaatcta tatcgaaatg 300 gcgtgcggtg atcatctggt ggttaacaat agccgttctt gtcgcaccgc gcgtgccttt 360 cgccatcaca aataccgcaa aacgtgcaaa cgttgtcgcg tgtcagatga agacattaac 420 aatttcctga cccgtagtac ggaatccaaa aactcagtga aagttcgcgt cgtgagtgct 480 ccgaaagtta aaaaagcgat gccgaaaagt gtctcccgtg ccccgaaacc gctggaaaac 540 tcagtgtcgg caaaagcttc caccaatacg agccgctctg ttccgtcgcc ggcaaaaagc 600 accccgaaca gctctgtccc ggcaagcgca ccggcaccgt ctctgacgcg tagtcagctg 660 gatcgcgtgg aagccctgct gtccccggaa gacaaaatct cactgaatat ggcaaaaccg 720 tttcgtgaac tggaaccgga actggttacc cgtcgcaaaa acgatttcca acgtctgtat 780 acgaatgatc gcgaagacta cctgggtaaa ctggaacgtg atatcaccaa atttttcgtg 840 gaccgcggct ttctggaaat caaatctccg attctgatcc cggctgaata tgttgaacgc 900 atgggtatta acaatgatac cgaactgagt aaacagattt ttcgtgtgga taaaaacctg 960 tgcctgcggc cgatgctggc accgacgctg tataattacc tgcgtaaact ggatcgcatt 1020 ctgccgggtc cgattaaaat ctttgaagtg ggcccgtgtt atcgtaaaga atcggatggc 1080 aaagaacacc tggaagaatt taccatggtt aacttctgcc aaatgggcag cggttgtacg 1140 cgcgaaaatc tggaagcgct gatcaaagaa ttcctggatt acctggaaat cgacttcgaa 1200 atcgtcggtg attcttgcat ggtgtatggc gataccctgg acatcatgca tggtgacctg 1260 gaactgagtt ccgctgttgt cggtccggtc agcctggatc gtgaatgggg cattgacaaa 1320 ccgtggatcg gcgcgggttt tggcctggaa cgcctgctga aagttatgca cggcttcaaa 1380 aacatcaaac gtgcgtctcg ctcggaatcg tattacaacg gcatctcaac caatctgtaa 1440 taatgactga cgatctgcct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg 1500 cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt 1560 cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca gtcacgtagc 1620 gatagcggag tgtataattc ttgaagacga aagggcctcg tgatacgcct atttttatag 1680 gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 1740 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 1800 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 1860 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 1920 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 1980 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 2040 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg 2100 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 2160 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 2220 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 2280 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 2340 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgc agcaatggca 2400 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 2460 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 2520 ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 2580 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 2640 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 2700 tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 2760 taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 2820 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 2880 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 2940 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 3000 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 3060 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 3120 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 3180 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 3240 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 3300 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 3360 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 3420 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 3480 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 3540 tccccgagct cttagcgcga attgtcgagg gaaatttttt ctaaatacat tcaaatatgt 3600 atccgctcat gagacaataa ccctgataaa tgcttcaata atattaaata tggctggttc 3660 tcgcagaaag aaacatatcc atgaaatccc gccccgaatt gatatgtcca gattagataa 3720 aagtaaagtg attaacagcg cattagagct gcttaatgag gtcggaatcg aaggtttaac 3780 aacccgtaaa ctcgcccaga agctaggtgt agagcagcct acattgtatt ggcatgtaaa 3840 aaataagcgg gctttgctcg acgccttagc cattgagatg ttagataggc accatactca 3900 cttttgccct ttagaagggg aaagctggca agatttttta cgtaataacg ctaaaagttt 3960 tagatgtgct ttactaagtc atcgcgatgg agcaaaagta catttaggta cacggcctac 4020 agaaaaacag tatgaaactc tcgaaaatca attagccttt ttatgccaac aaggtttttc 4080 actagagaat gcattatatg cactcagcgc tgtggggcat tttactttag gttgcgtatt 4140 ggaagatcaa gagcatcaag tcgctaaaga agaaagggaa acacctacta ctgatagtat 4200 gccgccatta ttacgacaag ctatcgaatt atttgatcac caaggtgcag agccagcctt 4260 cttattcggc cttgaattga tcatttgcgg attagaaaaa caacttaaat gtgaaagtgg 4320 gtcttaagca ctaggtctag ggcggcggat ttgtcctact caggagagcg ttcaccgaca 4380 aacaacagat aaaacgaaag gcccagtctt tcgactgagc ctttcgtttt atttgatgcc 4440 tctagcacgc gtagagctag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 4500 atgactaaca tgagaattac aacttatatc gtatggggct gacttcaggt gctacatttg 4560 aagagataaa ttgcactgaa atctagatga ttctgtggat aaccgtatta ccgcctttga 4620 gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga 4680 agcggaagag cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 4740 cataaattcc gacaccatcg aatggtgcaa aacctttcgc ggtatggcat gatagcgccc 4800 ggaagagagt caattcaggg tggtgaatgt gaaaccagta acgttatacg atgtcgcaga 4860 gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg aaccaggcca gccacgtttc 4920 tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag ctgaattaca ttcccaaccg 4980 cgtggcacaa caactggcgg gcaaacagtc gttgctgatt ggcgttgcca cctccagtct 5040 ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa tctcgcgccg atcaactggg 5100 tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc gaagcctgta aagcggcggt 5160 gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt aactatccgc tggatgacca 5220 ggatgccatt gctgtggaag ctgcctgcac taatgttccg gcgttatttc ttgatgtctc 5280 tgaccagaca cccatcaaca gtattatttt ctcccatgaa gacggtacgc gactgggcgt 5340 ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg ttagcgggcc cattaagttc 5400 tgtctcggcg cgtctgcgtc tggctggctg gcataaatat ctcactcgca atcaaattca 5460 gccgatagcg gaacgggaag gcgactggag tgccatgtcc ggttttcaac aaaccatgca 5520 aatgctgaat gagggcatcg ttcccactgc gatgctggtt gccaacgatc agatggcgct 5580 gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt ggtgcggata tctcggtagt 5640 gggatacgac gataccgaag acagctcatg ttatatcccg ccgttaacca ccatcaaaca 5700 ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg ctgcaactct ctcagggcca 5760 ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg aaaagaaaaa ccaccctggc 5820 gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 5880 acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aat 5923 <210> 2 <211> 3101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 60 ggaactatat ccggattggt taatacgact cactataggg gaattgtgag cggataacaa 120 ttcccctcta gaaaagcatt ggaaaccgag accggtaccg gtctcttaga ttcccggggt 180 ttccgccaaa ttcgaaaagc ctgctcaacg agcaggcttt tttgcatcta gcataacccc 240 ttggggcctc taaacgggtc ttgaggggtt ttttgcctga acgagcaggc ttttttgcat 300 aagcttccta gtggcagcgg ctaactaagc ggcctgctga ctttctcgcc gatcaaaagg 360 cattttgcta ttaagggatt gacgagggcg tatctgcgca gtaagatgcg ccccgcattg 420 gagacgccat ggcgtctcgg ttttagagct agaaatagca agttaaaata aggctagtcc 480 gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt ttaattcgaa aagcctgctc 540 aacgagcagg cttttttggt cgacagtagt ggcagcggct aactaagcgg cctgctgact 600 ttctcgccga tcaaaaggca ttttgctatt aagggattga cgagggcgta tctgcgcagt 660 aagatgcgcc ccgcatgaga cggcatgccg tctctagagc tagaaatagc aagttaaaat 720 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttaattcga 780 aaagcctgct caacgagcag gcttttttgg tcgacagttc ataggtgatt gcggatcccg 840 tcgttgacaa ttaatcatcg gcatagtata tcggcatagt ataatacgac aaggtgagga 900 actaaaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc gacgtcgccg 960 gagcggtcga gttctggacc gaccggctcg ggttctcccg cgacttcgtg gaggacgact 1020 tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag gaccaggtgg 1080 tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg tacgccgagt 1140 ggtcggaggt cgtgtccacg aacttccggg acgcctccgg gccggccatg accgagatcg 1200 gcgagcagcc gtgggggcgg gagttcgccc tgcgcgaccc ggccggcaac tgcgtgcact 1260 tcgtggccga ggagcaggac tgagagctcg cttggactcc tgttgataga tccagtaatg 1320 acctcagaac tccatctgga tttgttcaga acgctcggtt gccgccgggc gttttttatt 1380 ggtgagaatc caagcactag ctagtaacaa cttatatcgt atggggctga cttcaggtgc 1440 tacatttgaa gagataaatt gcactgaaat ctagtaatat tttatctgat taataagatg 1500 atcttcttga gatcgttttg gtctgcgcgt aatctcttgc tctgaaaacg aaaaaaccgc 1560 cttgcagggc ggtttttcga aggttctctg agctaccaac tctttgaacc gaggtaactg 1620 gcttggagga gcgcagtcac caaaacttgt cctttcagtt tagccttaac cggcgcatga 1680 cttcaagact aactcctcta aatcaattac cagtggctgc tgccagtggt gcttttgcat 1740 gtctttccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcggactgaa 1800 cggggggttc gtgcatacag tccagcttgg agcgaactgc ctacccggaa ctgagtgtca 1860 ggcgtggaat gagacaaacg cggccataac agcggaatga caccggtaaa ccgaaaggca 1920 ggaacaggag agcgcacgag ggagccgcca gggggaaacg cctggtatct ttatagtcct 1980 gtcgggtttc gccaccactg atttgagcgt cagatttcgt gatgcttgtc aggggggcgg 2040 agcctatgga aaaacggctt tgccgcggcc ctctcacttc cctgttaagt atcttcctgg 2100 catcttccag gaaatctccg ccccgttcgt aagccatttc cgctcgccgc agtcgaacga 2160 ccgagcgtag cgagtcagtg agcgaggaag cggaatatat cccttaatac gactcactat 2220 agggtcccta tcagtgatag agaggtctag aaataatttt gtttaacttt aagaaggaga 2280 tatacatatg tcgaaaggcg aagaactgtt tacgggagtg gtgcctatcc tggtagagct 2340 cgacggagat gtaaacggtc acaaattttc agtccgcggg gaaggcgaag gcgatgcgac 2400 caacggtaaa ttaactttga agtttatttg caccaccggc aaattaccgg tgccttggcc 2460 gacgcttgtg acgaccctga cttacggggt gcagtgtttc agtcgctacc cagatcacat 2520 gaaacgccat gacttcttca aatctgcgat gccggaaggc tatgtgcagg aacgtacaat 2580 tagctttaaa gacgacggca cgtataaaac gcgggcagag gttaaatttg agggagatac 2640 cctggtaaac cgtattgaac tgaaaggcat cgattttaaa gaagatggga acatcttggg 2700 ccacaagaga ccggtaccgg tctcggaatc aaagcaaatt tcaagatccg tcataacgtg 2760 gaggacggtt ccgtgcagct tgcagatcac tatcagcaga atacgccgat tggcgatggc 2820 ccggtgctgc tgcccgataa tcactacctc tctactcaga gtgttttatc gaaagacccg 2880 aacgagaagc gtgatcacat ggtgctgctt gaatttgtta ccgcggcagg tattacacac 2940 ggcatggatg agttgtataa gggatccgct tggagccacc cgcagttcga gaaaggtgga 3000 ggttccggag gtggatcggg aggttcggcg tggagccacc cgcagttcga aaaataaaag 3060 cttaattagc tgagcttgga ctccctgcca ccgctgagca a 3101 <210> 3 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 3 ctcgagtaca actttaactc acacaatgta tagatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 4 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 4 ctcgagtaca actttaactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 5 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (32)..(32) <223> An unnatural nucleotide <400> 5 ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 6 <211> 52 <212> DNA <213> Methanosarcina mazei <400> 6 gaatctaacc cggctgaacg gatttagagt ccgttcgatc tacatgatca gg 52 <210> 7 <211> 52 <212> DNA <213> Methanosarcina mazei <400> 7 gaatctaacc cggctgaacg gatttacagt ccgttcgatc tacatgatca gg 52 <210> 8 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (26)..(26) <223> An unnatural nucleotide <400> 8 gaatctaacc cggctgaacg gattancagt ccgttcgatc tacatgatca gg 52 <210> 9 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (26)..(26) <223> An unnatural nucleotide <400> 9 ctcgagtaca actttaactc acacancgta tacatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 10 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (38)..(38) <223> An unnatural nucleotide <400> 10 ctcgagtaca actttaactc acacaatgta tacatcancg cagacaaaca aaagaatgga 60 atc 63 <210> 11 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (26)..(26) <223> An unnatural nucleotide <220> <221> modified_base <222> (32)..(32) <223> An unnatural nucleotide <400> 11 ctcgagtaca actttaactc acacancgta ancatcacgg cagacaaaca aaagaatgga 60 atc 63 <210> 12 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (32)..(32) <223> An unnatural nucleotide <220> <221> modified_base <222> (38)..(38) <223> An unnatural nucleotide <400> 12 ctcgagtaca actttaactc acacaatgta ancatcancg cagacaaaca aaagaatgga 60 atc 63 <210> 13 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (26)..(26) <223> An unnatural nucleotide <220> <221> modified_base <222> (38)..(38) <223> An unnatural nucleotide <400> 13 ctcgagtaca actttaactc acacancgta tacatcancg cagacaaaca aaagaatgga 60 atc 63 <210> 14 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (26)..(26) <223> An unnatural nucleotide <220> <221> modified_base <222> (32)..(32) <223> An unnatural nucleotide <220> <221> modified_base <222> (38)..(38) <223> An unnatural nucleotide <400> 14 ctcgagtaca actttaactc acacancgta ancatcancg cagacaaaca aaagaatgga 60 atc 63 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 15 atgggtctca cacaaactcg agtacaactt taactcacac 40 <210> 16 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 16 atgggtctcg attccattct tttgtttgtc tgc 33 <210> 17 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 17 atgggtctcg aaacctgatc atgtagatcg aacgg 35 <210> 18 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 18 atgggtctca tctaacccgg ctgaacgg 28 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 19 ctcgagtaca actttaactc acac 24 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 20 gattccattc ttttgtttgt ctgc 24

Claims (102)

  1. 하기 구조의 핵염기이며:
    Figure pct00411

    여기서,
    각각의 X는 독립적으로 탄소 또는 질소이고;
    R2는 X가 탄소인 경우에 존재하고, 독립적으로 수소, 알킬, 알케닐, 알키닐, 메톡시, 메탄티올, 메탄셀레노, 할로겐, 시아노 또는 아지드 기이고;
    Y는 황, 산소, 셀레늄 또는 2급 아민이고;
    E는 산소, 황 또는 셀레늄이고;
    여기서 파상선은 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체에 결합하는 지점을 나타내고, 여기서 리보실, 데옥시리보실 또는 디데옥시리보실 모이어티 또는 그의 유사체는 유리 형태이거나, 또는 모노-포스페이트, 디포스페이트, 트리포스페이트, α-티오트리포스페이트, β-티오트리포스페이트 또는 γ-티오트리포스페이트 기에 연결되거나, 또는 RNA 또는 DNA에 또는 RNA 유사체 또는 DNA 유사체에 포함되는 것인
    핵염기.
  2. 제1항에 있어서, X가 탄소인 핵염기.
  3. 제1항 또는 제2항에 있어서, E가 황인 핵염기.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, Y가 황인 핵염기.
  5. 제1항에 있어서, 구조
    Figure pct00412
    를 갖는 핵염기.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상보적 염기-쌍형성 핵염기에 결합되어 비천연 염기 쌍 (UBP)을 형성하는 핵염기.
  7. 제6항에 있어서, 상보적 염기-쌍형성 핵염기가
    Figure pct00413
    으로부터 선택되는 것인 핵염기.
  8. 이중 가닥 올리고뉴클레오티드 듀플렉스이며, 여기서 제1 올리고뉴클레오티드 가닥은 제1항 내지 제5항 중 어느 한 항의 핵염기를 포함하고, 제2 상보적 올리고뉴클레오티드 가닥은 그의 상보적 염기-쌍형성 부위에 상보적 염기-쌍형성 핵염기를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
  9. 제8항에 있어서, 제1 올리고뉴클레오티드 가닥이
    Figure pct00414
    을 포함하고; 제2 가닥이 그의 상보적 염기-쌍형성 부위에
    Figure pct00415
    으로부터 선택되는 상보적 염기 쌍형성 핵염기를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
  10. 제9항에 있어서, 제2 가닥이 상보적 염기 쌍형성 핵염기
    Figure pct00416
    를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
  11. 제9항에 있어서, 제2 가닥이 상보적 염기 쌍형성 핵염기
    Figure pct00417
    를 포함하는 것인 이중 가닥 올리고뉴클레오티드 듀플렉스.
  12. 전달 RNA (tRNA)를 코딩하는 유전자 및/또는 관심 단백질을 코딩하는 유전자를 포함하는 플라스미드이며, 여기서 유전자는 제1항 내지 제5항 중 어느 한 항 또는 TPT3 (
    Figure pct00418
    ) 중 적어도 1종의 핵염기 및 제7항 또는 NaM (
    Figure pct00419
    ) 중 적어도 1종의 상보적 염기-쌍형성 핵염기를 포함하고, 여기서 상보적 염기-쌍형성 핵염기는 상보적 염기-쌍형성 부위에 있는 것인 플라스미드.
  13. tRNA를 코딩하는 제10항의 플라스미드에 의해 코딩된 mRNA.
  14. 단백질을 코딩하는 제10항의 플라스미드에 의해 코딩된 mRNA.
  15. 제1항 내지 제5항 중 어느 한 항의 핵염기를 포함하는 전달 RNA (tRNA)이며,
    핵염기를 포함하고, 임의로 핵염기는 안티코돈의 제1, 제2 또는 제3 위치에 존재하는 것인 안티코돈; 및
    아미노아실 tRNA 신테타제에 의한 tRNA의 비천연 아미노산으로의 선택적 충전을 촉진하는 인식 요소
    를 포함하는, 전달 RNA (tRNA).
  16. 제15항에 있어서, 아미노아실 tRNA 신테타제가 메타노사르시나 또는 그의 변이체 또는 메타노코쿠스 (메타노칼도코쿠스) 또는 그의 변이체로부터 유래된 것인 tRNA.
  17. 제15항에 있어서, 비천연 아미노산이 방향족 모이어티를 포함하는 것인 tRNA.
  18. 제15항에 있어서, 비천연 아미노산이 리신 또는 페닐알라닌 유도체인 tRNA.
  19. 하기 화학식을 포함하는 구조물이며:
    N1 - Zx - N2
    여기서:
    각각의 Z는 독립적으로 리보실 또는 데옥시리보실 또는 그의 유사체에 결합된 제1항 내지 제7항 중 어느 한 항의 핵염기이고;
    N1은 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 5' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 포스페이트 기이고;
    N2는 Z의 리보실 또는 데옥시리보실 또는 그의 유사체의 3' 말단에 부착된, 1개 이상의 뉴클레오티드 또는 그의 유사체 또는 말단 히드록실 기이고;
    x는 1 내지 20의 정수인
    구조물.
  20. 제19항에 있어서, 구조물이 유전자를 코딩하고, 임의로 Zx가 유전자의 번역 영역에 위치하거나 또는 Zx가 유전자의 비번역 영역에 위치하는 것인 구조물.
  21. 폴리뉴클레오티드 라이브러리이며, 여기서 라이브러리는 적어도 5000개의 고유한 폴리뉴클레오티드를 포함하고, 각각의 폴리뉴클레오티드는 제1항 내지 제5항 중 어느 한 항의 적어도 1종의 핵염기를 포함하는 것인 폴리뉴클레오티드 라이브러리.
  22. 핵염기를 포함하는 뉴클레오시드 트리포스페이트이며, 여기서 핵염기는
    Figure pct00420
    으로부터 선택되는 것인 뉴클레오시드 트리포스페이트.
  23. 제22항에 있어서, 핵염기가
    Figure pct00421
    인 뉴클레오시드 트리포스페이트.
  24. 제22항 또는 제23항에 있어서, 뉴클레오시드가 리보스 또는 데옥시리보스를 포함하는 것인 뉴클레오시드 트리포스페이트.
  25. 구조
    Figure pct00422
    를 갖는 핵염기 및 구조
    Figure pct00423
    를 갖는 상보적 염기-쌍형성 핵염기를 포함하는 DNA.
  26. 구조
    Figure pct00424
    를 갖는 핵염기 및 구조
    Figure pct00425
    를 갖는 상보적 염기-쌍형성 핵염기를 포함하는 DNA.
  27. DNA를 tRNA 또는 단백질을 코딩하는 mRNA로 전사하는 방법이며,
    tRNA 또는 단백질을 코딩하는 유전자를 포함하는 DNA를 리보뉴클레오시드 트리포스페이트 및 RNA 폴리머라제와 접촉시키는 것을 포함하고, 여기서 tRNA 또는 단백질을 코딩하는 유전자는, 제2 비천연 염기와 쌍을 이루어 제2 비천연 염기와의 제1 비천연 염기 쌍을 형성하는 제1 비천연 염기를 포함하고, 리보뉴클레오시드 트리포스페이트는 제1 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있는 제3 비천연 염기를 포함하며, 여기서 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인
    DNA를 tRNA 또는 단백질을 코딩하는 mRNA로 전사하는 방법.
  28. 제27항에 있어서, 리보뉴클레오시드 트리포스페이트가 제4 비천연 염기를 추가로 포함하고, 여기서 제4 비천연 염기는 제3 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있는 것인 방법.
  29. 제28항에 있어서, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍이 동일하지 않은 것인 방법.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서, DNA를 리보뉴클레오시드 트리포스페이트 및 RNA 폴리머라제와 접촉시키기 전에, DNA를 데옥시리보뉴클레오시드 트리포스페이트 및 DNA 폴리머라제와 접촉시킴으로써 DNA를 복제하는 것을 추가로 포함하며, 여기서 리보뉴클레오시드 트리포스페이트는 제1 비천연 염기와의 제5 비천연 염기 쌍을 형성할 수 있는 제5 비천연 염기를 포함하고, 여기서 제1 비천연 염기 쌍 및 제5 비천연 염기 쌍은 동일하지 않은 것인 방법.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서, 제1 비천연 염기가 TPT3을 포함하고, 제2 비천연 염기가 CNMO 또는 NaM을 포함하고, 제3 비천연 염기가 TAT1을 포함하고, 제4 비천연 염기가 NaM 또는 5FM을 포함하는 것인 방법.
  32. 제27항 내지 제31항 중 어느 한 항에 있어서, 반합성 유기체의 사용을 포함하며, 임의로 여기서 유기체는 박테리아이고, 임의로 여기서 박테리아는 에스케리키아 콜라이인 방법.
  33. 제27항 내지 제32항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00426
    을 포함하는 것인 방법.
  34. 제33항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00427
    을 포함하는 것인 방법.
  35. 제34항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00428
    을 포함하는 것인 방법.
  36. 제34항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00429
    을 포함하는 것인 방법.
  37. 제34항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00430
    인 방법.
  38. 제34항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00431
    을 포함하는 것인 방법.
  39. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 또는 제2 비천연 염기가
    Figure pct00432
    인 방법.
  40. 제34항 내지 제39항 중 어느 한 항에 있어서, 제1 또는 제2 비천연 염기가
    Figure pct00433
    인 방법.
  41. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00434
    이고 제2 비천연 염기가
    Figure pct00435
    이거나, 또는 제1 비천연 염기가
    Figure pct00436
    이고 제2 비천연 염기가
    Figure pct00437
    인 방법.
  42. 제34항 내지 제41항 중 어느 한 항에 있어서, 제3 또는 제4 비천연 염기가
    Figure pct00438
    인 방법.
  43. 제34항 내지 제42항 중 어느 한 항에 있어서, 제3 또는 제4 비천연 염기가
    Figure pct00439
    인 방법.
  44. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00440
    이고, 제2 비천연 염기가
    Figure pct00441
    이고, 제3 비천연 염기가
    Figure pct00442
    이고, 제4 비천연 염기가
    Figure pct00443
    인 방법.
  45. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00444
    이고, 제2 비천연 염기가
    Figure pct00445
    이고, 제3 비천연 염기가
    Figure pct00446
    이고, 제4 비천연 염기가
    Figure pct00447
    인 방법.
  46. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00448
    이고, 제2 비천연 염기가
    Figure pct00449
    이고, 제3 비천연 염기가
    Figure pct00450
    이고, 제4 비천연 염기가
    Figure pct00451
    인 방법.
  47. 제34항 내지 제43항 중 어느 한 항에 있어서, 제3 비천연 염기가
    Figure pct00452
    인 방법.
  48. 제34항 내지 제47항 중 어느 한 항에 있어서, 제4 비천연 염기가
    Figure pct00453
    인 방법.
  49. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00454
    이고, 제2 비천연 염기가
    Figure pct00455
    이고, 제3 비천연 염기가
    Figure pct00456
    이고, 제4 비천연 염기가
    Figure pct00457
    인 방법.
  50. 제34항 내지 제49항 중 어느 한 항에 있어서, DNA가
    Figure pct00458
    으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하는 것인 방법.
  51. 제34항 내지 제50항 중 어느 한 항에 있어서, DNA가
    Figure pct00459
    으로부터 선택되는 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, mRNA 및/또는 tRNA가
    Figure pct00460
    으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 방법.
  52. 제27항 내지 제51항 중 어느 한 항에 있어서, 제1 비천연 염기가 dCNMO를 포함하고, 제2 비천연 염기가 dTPT3을 포함하는 것인 방법.
  53. 제27항 내지 제52항 중 어느 한 항에 있어서, 제3 비천연 염기가 NaM을 포함하고, 제2 비천연 염기가 TAT1을 포함하는 것인 방법.
  54. 제27항 내지 제53항 중 어느 한 항에 있어서, mRNA가 전사되고, 방법이 mRNA를 단백질로 번역하는 것을 추가로 포함하며, 여기서 단백질은 제3 비천연 염기를 포함하는 mRNA의 코돈에 상응하는 위치에 비천연 아미노산을 포함하는 것인 방법.
  55. 제27항 내지 제54항 중 어느 한 항에 있어서, 단백질이 적어도 2개의 비천연 아미노산을 포함하는 것인 방법.
  56. 제27항 내지 제54항 중 어느 한 항에 있어서, 단백질이 적어도 3개의 비천연 아미노산을 포함하는 것인 방법.
  57. 제27항 내지 제54항 중 어느 한 항에 있어서, 단백질이 적어도 2개의 상이한 비천연 아미노산을 포함하는 것인 방법.
  58. 제27항 내지 제54항 중 어느 한 항에 있어서, 단백질이 적어도 3개의 상이한 비천연 아미노산을 포함하는 것인 방법.
  59. 제27항 내지 제58항 중 어느 한 항에 있어서, 적어도 1개의 비천연 아미노산이
    리신 유사체이거나;
    방향족 측쇄를 포함하거나;
    아지도 기를 포함하거나;
    알킨 기를 포함하거나; 또는
    알데히드 또는 케톤 기를 포함하는 것인
    방법.
  60. 제27항 내지 제59항 중 어느 한 항에 있어서, 적어도 1개의 비천연 아미노산이 방향족 측쇄를 포함하지 않는 것인 방법.
  61. 제59항 또는 제60항에 있어서, 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK) 또는 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 방법.
  62. 제61항에 있어서, 적어도 1개의 비천연 아미노산이 N6-아지도에톡시-카르보닐-L-리신 (AzK)을 포함하는 것인 방법.
  63. 제61항에 있어서, 적어도 1개의 비천연 아미노산이 N6-프로파르길에톡시-카르보닐-L-리신 (PraK)을 포함하는 것인 방법.
  64. 제27항 내지 제63항 중 어느 한 항의 방법으로부터 생산된 mRNA.
  65. 제27항 내지 제63항 중 어느 한 항의 방법으로부터 생산된 tRNA.
  66. 제3 비천연 염기를 포함하는 mRNA의 코돈에 상응하는 위치에 비천연 아미노산을 포함하는, 제64항의 mRNA에 의해 코딩된 단백질.
  67. 확장된 유전자 알파벳을 포함하는 반합성 유기체이며, 여기서 유전자 알파벳은 적어도 3종의 별개의 비천연 염기를 포함하는 것인 반합성 유기체.
  68. 제67항에 있어서, 미생물을 포함하고, 임의로 여기서 미생물은 에스케리키아 콜라이인 반합성 유기체.
  69. 제67항 또는 제68항에 있어서,
    Figure pct00461
    으로부터 선택되는 적어도 1종의 비천연 핵염기를 포함하는 DNA를 포함하는 반합성 유기체.
  70. 제67항 내지 제69항 중 어느 한 항에 있어서, DNA가 적어도 1종의 비천연 염기 쌍 (UBP)을 포함하고, 여기서 비천연 염기 쌍 (UBP)은 dCNMO-dTPT3, dNaM-dTPT3, dCNMO-dTAT1, d5FM-dTAT1 또는 dNaM-dTAT1인 반합성 유기체.
  71. 제67항에 있어서, DNA가
    Figure pct00462
    인 적어도 1종의 비천연 핵염기를 포함하는 것인 반합성 유기체.
  72. 제67항 내지 제71항 중 어느 한 항에 있어서, 이종 뉴클레오시드 트리포스페이트 수송체를 발현하는 반합성 유기체.
  73. 제72항에 있어서, 이종 뉴클레오시드 트리포스페이트 수송체가 PtNTT2인 반합성 유기체.
  74. 제67항 내지 제73항 중 어느 한 항에 있어서, 이종 tRNA 신테타제를 추가로 발현하는 반합성 유기체.
  75. 제74항에 있어서, 이종 tRNA 신테타제가 엠. 바르케리 피롤리실-tRNA 신테타제 (Mb PylRS)인 반합성 유기체.
  76. 제67항 내지 제75항 중 어느 한 항에 있어서, 이종 RNA 폴리머라제를 추가로 발현하는 반합성 유기체.
  77. 제76항에 있어서, 이종 RNA 폴리머라제가 T7 RNAP인 반합성 유기체.
  78. 제67항 내지 제77항 중 어느 한 항에 있어서, DNA 재조합 복구의 기능을 갖는 단백질을 발현하지 않는 반합성 유기체.
  79. 제78항에 있어서, RecA를 발현하지 않는 반합성 유기체.
  80. 제67항 내지 제79항 중 어느 한 항에 있어서, 이종 mRNA를 추가로 포함하는 반합성 유기체.
  81. 제80항에 있어서, 이종 mRNA가
    Figure pct00463
    으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
  82. 제67항 내지 제81항 중 어느 한 항에 있어서, 이종 tRNA를 추가로 포함하는 반합성 유기체.
  83. 제82항에 있어서, 이종 tRNA가
    Figure pct00464
    으로부터 선택되는 적어도 1종의 비천연 염기를 포함하는 것인 반합성 유기체.
  84. DNA를 전사하는 방법이며, 방법은
    (1) 단백질을 코딩하는 유전자 (여기서, 단백질을 코딩하는 유전자의 주형 가닥은 제1 비천연 염기를 포함함) 및 (2) tRNA를 코딩하는 유전자 (여기서, tRNA를 코딩하는 유전자의 주형 가닥은 제1 비천연 염기와 염기 쌍을 형성할 수 있는 제2 비천연 염기를 포함함)를 포함하는 하나 이상의 DNA를 제공하는 단계;
    단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계;
    tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계
    를 포함하는, DNA를 전사하는 방법.
  85. 제84항에 있어서, tRNA를 이용하여 mRNA로부터 단백질을 번역하는 것을 추가로 포함하며, 여기서 상기 단백질은 mRNA에서 제3 비천연 염기를 포함하는 코돈에 상응하는 위치에 비천연 아미노산을 포함하는 것인 방법.
  86. DNA를 복제하는 방법이며, 방법은
    (1) 단백질을 코딩하는 유전자 (여기서, 단백질을 코딩하는 유전자의 주형 가닥은 제1 비천연 염기를 포함함) 및 (2) tRNA를 코딩하는 유전자 (여기서, tRNA를 코딩하는 유전자의 주형 가닥은 제1 비천연 염기와 염기 쌍을 형성할 수 있는 제2 비천연 염기를 포함함)를 포함하는 DNA를 제공하는 단계; 및
    DNA를 복제하여 제1 비천연 염기 대신 제1 치환 비천연 염기를 혼입시키고/거나 제2 비천연 염기 대신 제2 치환 비천연 염기를 혼입시키는 단계
    를 포함하고;
    단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기 및/또는 제1 치환 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계; 및/또는
    tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기 및/또는 제2 치환 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계
    를 임의로 추가로 포함하는, DNA를 복제하는 방법.
  87. 제86항에 있어서, 단백질을 코딩하는 유전자를 전사하여 제3 비천연 염기를 mRNA 내로 혼입시키고, 여기서 제3 비천연 염기는 제1 비천연 염기 및/또는 제1 치환 비천연 염기와의 제1 비천연 염기 쌍을 형성할 수 있는 것인 단계를 추가로 포함하는 방법.
  88. 제86항 또는 제87항에 있어서, tRNA를 코딩하는 유전자를 전사하여 제4 비천연 염기를 tRNA 내로 혼입시키고, 여기서 제4 비천연 염기는 제2 비천연 염기 및/또는 제2 치환 비천연 염기와의 제2 비천연 염기 쌍을 형성할 수 있고, 제1 비천연 염기 쌍 및 제2 비천연 염기 쌍은 동일하지 않은 것인 단계를 추가로 포함하는 방법.
  89. 제84항 내지 제88항 중 어느 한 항에 있어서, 박테리아인 반합성 유기체의 사용을 포함하는 생체내 방법인 방법.
  90. 제89항에 있어서, 유기체가 에스케리키아 콜라이를 포함하는 것인 방법.
  91. 제84항 내지 제90항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00465
    을 포함하는 것인 방법.
  92. 제84항 내지 제91항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00466
    을 포함하는 것인 방법.
  93. 제84항 내지 제92항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00467
    을 포함하는 것인 방법.
  94. 제84항 내지 제93항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00468
    을 포함하는 것인 방법.
  95. 제84항 내지 제94항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00469
    인 방법.
  96. 제84항 내지 제95항 중 어느 한 항에 있어서, 제1 비천연 염기, 제2 비천연 염기, 제3 비천연 염기 또는 제4 비천연 염기 중 적어도 1종이
    Figure pct00470
    을 포함하는 것인 방법.
  97. 제84항 내지 제96항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00471
    이고, 제2 비천연 염기가
    Figure pct00472
    이고, 제3 비천연 염기가
    Figure pct00473
    이고, 제4 비천연 염기가
    Figure pct00474
    인 방법.
  98. 제84항 내지 제97항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00475
    이고, 제2 비천연 염기가
    Figure pct00476
    이고, 제3 비천연 염기가
    Figure pct00477
    이고, 제4 비천연 염기가
    Figure pct00478
    인 방법.
  99. 제84항 내지 제98항 중 어느 한 항에 있어서, 제1 비천연 염기가
    Figure pct00479
    이고, 제2 비천연 염기가
    Figure pct00480
    이고, 제3 비천연 염기가
    Figure pct00481
    이고, 제4 비천연 염기가
    Figure pct00482
    인 방법.
  100. 제84항 내지 제99항 중 어느 한 항에 있어서, 제1 비천연 염기가 dCNMO를 포함하고, 제2 비천연 염기가 dTPT3을 포함하는 것인 방법.
  101. 제84항 내지 제100항 중 어느 한 항에 있어서, 제3 비천연 염기가 NaM을 포함하고, 제2 비천연 염기가 TAT1을 포함하는 것인 방법.
  102. 제84항 내지 제101항 중 어느 한 항에 있어서, 단백질이 적어도 2개의 비천연 아미노산을 포함하는 것인 방법.
KR1020227000922A 2019-06-14 2020-06-12 반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법 KR20220034109A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962861901P 2019-06-14 2019-06-14
US62/861,901 2019-06-14
PCT/US2020/037437 WO2020252262A1 (en) 2019-06-14 2020-06-12 Reagents and methods for replication, transcription, and translation in semi-synthetic organisms

Publications (1)

Publication Number Publication Date
KR20220034109A true KR20220034109A (ko) 2022-03-17

Family

ID=73744600

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227000922A KR20220034109A (ko) 2019-06-14 2020-06-12 반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법

Country Status (12)

Country Link
US (1) US11879145B2 (ko)
EP (1) EP3983543A4 (ko)
JP (1) JP2022538784A (ko)
KR (1) KR20220034109A (ko)
CN (1) CN114207129A (ko)
AU (1) AU2020291535A1 (ko)
BR (1) BR112021025130A2 (ko)
CA (1) CA3143330A1 (ko)
IL (1) IL288941A (ko)
MX (1) MX2021015450A (ko)
TW (1) TW202113078A (ko)
WO (1) WO2020252262A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3041854T3 (pl) * 2013-08-08 2020-06-29 The Scripps Research Institute Sposób miejscowo specyficznego oznakowania enzymatycznego kwasów nukleinowych in vitro przez inkorporację niewystępujących naturalnie nukleotydów
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
US11761007B2 (en) 2015-12-18 2023-09-19 The Scripps Research Institute Production of unnatural nucleotides using a CRISPR/Cas9 system
ES2929047T3 (es) 2016-06-24 2022-11-24 Scripps Research Inst Transportador de nucleósido trifosfato novedoso y usos del mismo
SG11202000167SA (en) 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
CN111690587B (zh) * 2019-03-13 2022-10-25 上海凯赛生物技术股份有限公司 一种离心筛选具有高含油率油脂酵母菌株的方法及其应用
CN114207129A (zh) 2019-06-14 2022-03-18 斯克利普斯研究所 用于在半合成生物体中复制、转录和翻译的试剂和方法
TW202128996A (zh) * 2019-10-10 2021-08-01 美商史基普研究協會 用於活體內合成非天然多肽的組合物及方法
CN114031648A (zh) * 2021-11-08 2022-02-11 河南师范大学 一类非天然碱基三磷酸及其合成方法和应用
WO2023164676A1 (en) * 2022-02-27 2023-08-31 The Regents Of The University Of California Methods to generate novel acyl-trna species

Family Cites Families (204)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US5015733A (en) 1983-12-20 1991-05-14 California Institute Of Technology Nucleosides possessing blocked aliphatic amino groups
US5118800A (en) 1983-12-20 1992-06-02 California Institute Of Technology Oligonucleotides possessing a primary amino group in the terminal nucleotide
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US4849513A (en) 1983-12-20 1989-07-18 California Institute Of Technology Deoxyribonucleoside phosphoramidites in which an aliphatic amino group is attached to the sugar ring and their use for the preparation of oligonucleotides containing aliphatic amino groups
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
FR2567892B1 (fr) 1984-07-19 1989-02-17 Centre Nat Rech Scient Nouveaux oligonucleotides, leur procede de preparation et leurs applications comme mediateurs dans le developpement des effets des interferons
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5656493A (en) 1985-03-28 1997-08-12 The Perkin-Elmer Corporation System for automated performance of the polymerase chain reaction
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US5093232A (en) 1985-12-11 1992-03-03 Chiron Corporation Nucleic acid probes
US4910300A (en) 1985-12-11 1990-03-20 Chiron Corporation Method for making nucleic acid probes
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
AU598946B2 (en) 1987-06-24 1990-07-05 Howard Florey Institute Of Experimental Physiology And Medicine Nucleoside derivatives
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
EP0406309A4 (en) 1988-03-25 1992-08-19 The University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5591722A (en) 1989-09-15 1997-01-07 Southern Research Institute 2'-deoxy-4'-thioribonucleosides and their antiviral activity
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
WO1991006556A1 (en) 1989-10-24 1991-05-16 Gilead Sciences, Inc. 2' modified oligonucleotides
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5587470A (en) 1990-01-11 1996-12-24 Isis Pharmaceuticals, Inc. 3-deazapurines
US5646265A (en) 1990-01-11 1997-07-08 Isis Pharmceuticals, Inc. Process for the preparation of 2'-O-alkyl purine phosphoramidites
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
AU7579991A (en) 1990-02-20 1991-09-18 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
GB9009980D0 (en) 1990-05-03 1990-06-27 Amersham Int Plc Phosphoramidite derivatives,their preparation and the use thereof in the incorporation of reporter groups on synthetic oligonucleotides
DE69032425T2 (de) 1990-05-11 1998-11-26 Microprobe Corp., Bothell, Wash. Teststreifen zum Eintauchen für Nukleinsäure-Hybridisierungsassays und Verfahren zur kovalenten Immobilisierung von Oligonucleotiden
ATE154246T1 (de) 1990-07-27 1997-06-15 Isis Pharmaceuticals Inc Nuklease resistente, pyrimidin modifizierte oligonukleotide, die die gen-expression detektieren und modulieren
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
HU217036B (hu) 1990-08-03 1999-11-29 Sanofi Eljárás génexpresszió gátlására alkalmas vegyületek előállítására
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
EP0549686A4 (en) 1990-09-20 1995-01-18 Gilead Sciences Inc Modified internucleoside linkages
NZ239893A (en) 1990-09-25 1993-11-25 Hoechst Japan A method for introducing a foreign dna into a cell
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
WO1992008728A1 (en) 1990-11-08 1992-05-29 Hybridon, Inc. Incorporation of multiple reporter groups on synthetic oligonucleotides
US5672697A (en) 1991-02-08 1997-09-30 Gilead Sciences, Inc. Nucleoside 5'-methylene phosphonates
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
ES2103918T3 (es) 1991-10-17 1997-10-01 Ciba Geigy Ag Nucleosidos biciclicos, oligonucleotidos, procedimiento para su obtencion y productos intermedios.
US5594121A (en) 1991-11-07 1997-01-14 Gilead Sciences, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified purines
TW393513B (en) 1991-11-26 2000-06-11 Isis Pharmaceuticals Inc Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
DE69232816T2 (de) 1991-11-26 2003-06-18 Isis Pharmaceuticals Inc Gesteigerte bildung von triple- und doppelhelices aus oligomeren mit modifizierten pyrimidinen
US5359044A (en) 1991-12-13 1994-10-25 Isis Pharmaceuticals Cyclobutyl oligonucleotide surrogates
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
FR2687679B1 (fr) 1992-02-05 1994-10-28 Centre Nat Rech Scient Oligothionucleotides.
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
EP0577558A2 (de) 1992-07-01 1994-01-05 Ciba-Geigy Ag Carbocyclische Nukleoside mit bicyclischen Ringen, Oligonukleotide daraus, Verfahren zu deren Herstellung, deren Verwendung und Zwischenproduckte
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
AU6449394A (en) 1993-03-30 1994-10-24 Sterling Winthrop Inc. Acyclic nucleoside analogs and oligonucleotide sequences containing them
CA2159632A1 (en) 1993-03-31 1994-10-13 Ashis Kumar Saha Novel 5'-substituted nucleosides and oligomers produced therefrom
HU9501974D0 (en) 1993-03-31 1995-09-28 Sterling Winthrop Inc Oligonucleotides with amide linkages replacing phosphodiester linkages
DE4311944A1 (de) 1993-04-10 1994-10-13 Degussa Umhüllte Natriumpercarbonatpartikel, Verfahren zu deren Herstellung und sie enthaltende Wasch-, Reinigungs- und Bleichmittelzusammensetzungen
GB9311682D0 (en) 1993-06-05 1993-07-21 Ciba Geigy Ag Chemical compounds
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5446137B1 (en) 1993-12-09 1998-10-06 Behringwerke Ag Oligonucleotides containing 4'-substituted nucleotides
US5519134A (en) 1994-01-11 1996-05-21 Isis Pharmaceuticals, Inc. Pyrrolidine-containing monomers and oligomers
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5627053A (en) 1994-03-29 1997-05-06 Ribozyme Pharmaceuticals, Inc. 2'deoxy-2'-alkylnucleotide containing nucleic acid
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5597909A (en) 1994-08-25 1997-01-28 Chiron Corporation Polynucleotide reagents containing modified deoxyribose moieties, and associated methods of synthesis and use
CA2226463A1 (en) 1995-06-07 1996-12-19 Life Technologies, Inc. Recombinational cloning using engineered recombination sites
US6143557A (en) 1995-06-07 2000-11-07 Life Technologies, Inc. Recombination cloning using engineered recombination sites
US6720140B1 (en) 1995-06-07 2004-04-13 Invitrogen Corporation Recombinational cloning using engineered recombination sites
GB9606158D0 (en) 1996-03-23 1996-05-29 Ciba Geigy Ag Chemical compounds
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
US6770748B2 (en) 1997-03-07 2004-08-03 Takeshi Imanishi Bicyclonucleoside and oligonucleotide analogue
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
EP2341058A3 (en) 1997-09-12 2011-11-23 Exiqon A/S Oligonucleotide Analogues
JP4303418B2 (ja) 1997-10-24 2009-07-29 ライフ テクノロジーズ コーポレーション 組換え部位を有する核酸を使用する組換えクローニング
US6955807B1 (en) 1998-05-15 2005-10-18 Bayer Pharmaceuticals Corporation IL-2 selective agonists and antagonists
US6562798B1 (en) 1998-06-05 2003-05-13 Dynavax Technologies Corp. Immunostimulatory oligonucleotides with modified bases and methods of use thereof
PT1178999E (pt) 1999-05-04 2007-06-26 Santaris Pharma As Análogos de l-ribo-lna
US6525191B1 (en) 1999-05-11 2003-02-25 Kanda S. Ramasamy Conformationally constrained L-nucleosides
EP2223931A1 (en) 1999-07-15 2010-09-01 Japan Science and Technology Agency Novel nucleic acid base pair
EP1226255B1 (en) 1999-10-29 2006-03-29 Stratagene California Compositions and methods utilizing dna polymerases
ATE391789T1 (de) 1999-12-10 2008-04-15 Invitrogen Corp Verwendung einer vielzahl von rekombinationsstellen mit einzigartiger spezifität beim rekombinatorischen klonen
JP2004527504A (ja) 2001-03-01 2004-09-09 フアーマセツト・リミテツド 2’,3’−ジデオキシ−2’,3’−ジデヒドロヌクレオシドの合成法
US20060074035A1 (en) 2002-04-17 2006-04-06 Zhi Hong Dinucleotide inhibitors of de novo RNA polymerases for treatment or prevention of viral infections
CA2508468C (en) 2002-07-17 2011-11-15 Riken Nucleosides or nucleotides having novel unnatural bases and use thereof
WO2004041889A2 (en) 2002-11-05 2004-05-21 Isis Pharmaceuticals, Inc. Polycyclic sugar surrogate-containing oligomeric compounds and compositions for use in gene modulation
WO2004044136A2 (en) 2002-11-05 2004-05-27 Isis Pharmaceuticals, Inc. Compositions comprising alternating 2’-modified nucleosides for use in gene modulation
JP5642916B2 (ja) * 2003-04-17 2014-12-17 ザ スクリプス リサーチ インスティテュート 真核遺伝コードの拡張
WO2004106356A1 (en) 2003-05-27 2004-12-09 Syddansk Universitet Functionalized nucleotide derivatives
ATE555118T1 (de) 2003-08-28 2012-05-15 Takeshi Imanishi Neue synthetische nukleidsäuren vom typ mit quervernetzter n-o-bindung
WO2005026187A1 (ja) 2003-09-10 2005-03-24 Riken 非天然型塩基を有するヌクレオシド又はヌクレオチド及びその利用
JP5379347B2 (ja) 2003-09-18 2013-12-25 アイシス ファーマシューティカルズ, インコーポレーテッド 4’−チオヌクレオシドおよびオリゴマー化合物
AU2004288017B2 (en) 2003-11-03 2009-10-08 United Kingdom Research And Innovation Polymerase
GB2429207A (en) 2004-02-02 2007-02-21 Ambrx Inc Modified human interferon polypeptides and their uses
EP1816130A4 (en) 2004-11-08 2012-04-25 Riken NOVEL NUCLEOSIDE OR NUCLEOTIDE DERIVATIVE AND USE THEREOF
JP5649018B2 (ja) 2005-08-04 2015-01-07 タグシクス・バイオ株式会社 新規人工塩基対及びその利用
CN101365791B (zh) 2005-12-09 2012-07-25 独立行政法人理化学研究所 核酸的复制方法及新型人工碱基对
JP5342881B2 (ja) 2006-01-27 2013-11-13 アイシス ファーマシューティカルズ, インコーポレーテッド 6−修飾された二環式核酸類似体
AU2007249349B2 (en) 2006-05-11 2012-03-08 Isis Pharmaceuticals, Inc. 5'-Modified bicyclic nucleic acid analogs
US20100190837A1 (en) 2007-02-15 2010-07-29 Isis Pharmaceuticals, Inc. 5'-Substituted-2-F' Modified Nucleosides and Oligomeric Compounds Prepared Therefrom
US8278425B2 (en) 2007-05-30 2012-10-02 Isis Pharmaceuticals, Inc. N-substituted-aminomethylene bridged bicyclic nucleic acid analogs
EP2173760B2 (en) 2007-06-08 2015-11-04 Isis Pharmaceuticals, Inc. Carbocyclic bicyclic nucleic acid analogs
CN101796062B (zh) 2007-07-05 2014-07-30 Isis制药公司 6-双取代双环核酸类似物
CN101981186A (zh) 2008-03-31 2011-02-23 塔古西库斯生物株式会社 可高选择性且高效率地进行pcr扩增的新型dna
WO2011043385A1 (ja) 2009-10-06 2011-04-14 独立行政法人理化学研究所 特異な塩基対を形成する人工塩基対
WO2011139699A2 (en) 2010-04-28 2011-11-10 Isis Pharmaceuticals, Inc. 5' modified nucleosides and oligomeric compounds prepared therefrom
HUE054318T2 (hu) 2010-11-12 2021-08-30 Nektar Therapeutics IL-2 molekularész konjugátumai és polimer
HUE055284T2 (hu) 2011-02-10 2021-11-29 Roche Glycart Ag Mutáns interleukin-2 polipeptidek
BR112015004022B1 (pt) 2012-08-31 2023-04-25 Sutro Biopharma, Inc Aminoácidos modificados compreendendo um grupo azido
WO2014160025A2 (en) 2013-03-13 2014-10-02 Trustees Of Boston University Tunable control of protein degradation in synthetic and endogenous bacterial systems
PL3041854T3 (pl) 2013-08-08 2020-06-29 The Scripps Research Institute Sposób miejscowo specyficznego oznakowania enzymatycznego kwasów nukleinowych in vitro przez inkorporację niewystępujących naturalnie nukleotydów
EP3055320B1 (en) 2013-10-11 2018-10-03 Sutro Biopharma, Inc. NON-NATURAL AMINO ACID tRNA SYNTHETASES FOR PYRIDYL TETRAZINE
WO2015054658A1 (en) 2013-10-11 2015-04-16 Sutro Biopharma, Inc. Modified amino acids comprising tetrazine functional groups, methods of preparation, and methods of their use
EP3055321B1 (en) 2013-10-11 2018-10-10 Sutro Biopharma, Inc. NON-NATURAL AMINO ACID tRNA SYNTHETASES FOR PARA-METHYLAZIDO-L-PHENYLALANINE
EP3080256B1 (en) 2013-12-13 2018-06-13 Cellectis Cas9 nuclease platform for microalgae genome engineering
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
EA038321B1 (ru) 2014-11-06 2021-08-09 Е.И. Дюпон Де Немур Энд Компани Опосредуемая пептидом доставка направляемой рнк эндонуклеазы в клетки
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016115168A1 (en) 2015-01-12 2016-07-21 Synthorx, Inc. Incorporation of unnatural nucleotides and methods thereof
CN107743520A (zh) * 2015-05-06 2018-02-27 特雷里斯公司 用于甲硫氨酸的生物生产的组合物和方法
WO2017093254A1 (en) * 2015-11-30 2017-06-08 European Molecular Biology Laboratory Means and methods for preparing engineered proteins by genetic code expansion in insect cells
US11761007B2 (en) 2015-12-18 2023-09-19 The Scripps Research Institute Production of unnatural nucleotides using a CRISPR/Cas9 system
ES2929047T3 (es) 2016-06-24 2022-11-24 Scripps Research Inst Transportador de nucleósido trifosfato novedoso y usos del mismo
SG11202000167SA (en) 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
US20200224234A1 (en) 2017-07-11 2020-07-16 The Scripps Research Institute Incorporation of unnatural nucleotides and methods of use in vivo thereof
SG11202006101WA (en) 2017-12-29 2020-07-29 Scripps Research Inst Unnatural base pair compositions and methods of use
CN114207129A (zh) 2019-06-14 2022-03-18 斯克利普斯研究所 用于在半合成生物体中复制、转录和翻译的试剂和方法
AU2020357614A1 (en) 2019-09-30 2022-03-31 The Scripps Research Institute Eukaryotic semi-synthetic organisms
TW202128996A (zh) * 2019-10-10 2021-08-01 美商史基普研究協會 用於活體內合成非天然多肽的組合物及方法

Also Published As

Publication number Publication date
TW202113078A (zh) 2021-04-01
EP3983543A1 (en) 2022-04-20
CA3143330A1 (en) 2020-12-17
WO2020252262A1 (en) 2020-12-17
BR112021025130A2 (pt) 2022-03-15
US11879145B2 (en) 2024-01-23
US20200392550A1 (en) 2020-12-17
IL288941A (en) 2022-02-01
AU2020291535A1 (en) 2022-01-20
EP3983543A4 (en) 2023-05-03
CN114207129A (zh) 2022-03-18
JP2022538784A (ja) 2022-09-06
MX2021015450A (es) 2022-03-11

Similar Documents

Publication Publication Date Title
KR20220034109A (ko) 반합성 유기체의 복제, 전사 및 번역을 위한 시약 및 방법
US20240117363A1 (en) Production of unnatural nucleotides using a crispr/cas9 system
US11466279B2 (en) Import of unnatural or modified nucleoside triphosphates into cells via nucleic acid triphosphate transporters
JP7429642B2 (ja) 非天然塩基対組成物および使用の方法
US20220243244A1 (en) Compositions and methods for in vivo synthesis of unnatural polypeptides
CN107208096A (zh) 基于crispr的组合物和使用方法
KR20220075231A (ko) 진핵 반합성 유기체
TW202227100A (zh) 包含非天然核苷酸之多核苷酸之反轉錄
RU2799441C2 (ru) Композиции на основе неприродных пар оснований и способы их применения
CN112105627B (zh) 非天然碱基对组合物及使用方法
Li Structure and conformational rearrangements during splicing of the ribozyme component of group II introns
Ledda Strategies for the study of the trpX role in Streptomyces coelicolor