KR20240051994A - 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 - Google Patents

레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 Download PDF

Info

Publication number
KR20240051994A
KR20240051994A KR1020247009394A KR20247009394A KR20240051994A KR 20240051994 A KR20240051994 A KR 20240051994A KR 1020247009394 A KR1020247009394 A KR 1020247009394A KR 20247009394 A KR20247009394 A KR 20247009394A KR 20240051994 A KR20240051994 A KR 20240051994A
Authority
KR
South Korea
Prior art keywords
sequence
retrotransposase
seq
domain
protein
Prior art date
Application number
KR1020247009394A
Other languages
English (en)
Inventor
브라이언 씨 토마스
크리스토퍼 브라운
다니엘라 에스에이 골트스만
사라 라페리에르
신디 카스텔
리사 알렉산더
메리 케이틀린 치우
모라이마 테모체-디아즈
아누 토마스
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Publication of KR20240051994A publication Critical patent/KR20240051994A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/18011Details ssRNA Bacteriophages positive-sense
    • C12N2795/18111Leviviridae
    • C12N2795/18122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 개시내용은 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키기 위한 시스템 및 방법을 제공한다. 이들 시스템 및 방법은 카고 뉴클레오티드 서열을 포함하는 핵산을 포함할 수 있으며, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제 및 레트로트랜스포사제와 상호 작용하도록 구성되고, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키도록 구성된다. 시스템 및 방법은 또한 레트로트랜스포사제의 기능적 단편의 사용을 포함할 수 있다.

Description

레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법
상호 참조
본 출원은 발명의 명칭이 "카고 뉴클레오티드 서열을 전위시키기 위한 시스템 및 방법(SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES)"인 2021년 9월 8일에 출원된 미국 가출원 제63/241,943호의 이익을 주장하며, 상기 출원은 그 전체가 참조로서 본원에 통합된다.
전위 가능한(transposable) 요소는 유전자 기능 및 진화에 중요한 역할을 하는 이동성 DNA 서열이다. 전위 가능한 요소는 거의 모든 형태의 생활에서 발견되지만, 이들의 출현률은 유기체에 따라 달라지며, 대부분의 진핵생물 게놈은 전위 가능한 요소를 암호화한다(인간에서 적어도 45%).
서열 목록
본 출원은 XML 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 동 서열 목록은 그 전체가 참조로서 본원에 통합된다. 2022년 9월 7일에 생성된 상기 XML 사본의 명칭은 55921-734_601_SL.xml이며, 크기는 1,677,029 바이트이다.
전위 가능한 요소에 대한 기초 연구는 1940년대에 수행되었지만, DNA 조작 및 유전자 편집 적용에서 이들의 잠재적 유용성은 최근 몇 년 동안에만 인식되었다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT, reverse transcriptase) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 시스템은 (c) 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, 이중-가닥 DNA 서열은 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하며, 여기서 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는, 카고 서열의 5' 서열 또는 카고 서열의 3' 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다. 일부 실시예에서, 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함한다.
일부 실시예에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 RT 도메인 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 5' 서열 또는 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA, complementary DNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위해 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 DNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP, MS2 coat protein) 도메인을 포함한다
일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 핵산을 제공한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 적어도 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 대해 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기완과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.
일부 실시예에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 시스템은 (c) 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인를 포함하는, 레트로트랜스포사제; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서: (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.
일부 측면에서, 본 개시내용은 서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소(maturase) 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산을 제공하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화한다. 일부 실시예에서, ORF는 박테리아 유기체에서의 발현에 최적화되거나, 여기서 유기체는 대장균이다. 일부 실시예에서, ORF는 포유류 유기체에서의 발현에 최적화되거나, 여기서 유기체는 영장류 유기체이다. 일부 실시예에서, 영장류 유기체는 H. 사피엔스이다. 일부 실시예에서, ORF는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열에 작동 가능하게 연결된 친화성 태그를 포함하며, 여기서 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는다. 일부 실시예에서, ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인 또는 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융한된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.
일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 핵산은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 유기체는 RT 도메인의 기원과 상이하다. 일부 실시예에서, ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는 합성 올리고뉴클레오티드를 제공한다. 일부 실시예에서, 합성 올리고뉴클레오티드는 DNA 뉴클레오티드를 포함한다. 일부 실시예에서, 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 핵산은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하며, 여기서 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소를 첨가함으로써 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물에 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피를 수행하는 단계를 추가로 포함한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나의 RNA 동족체를 포함하는 시험관 내에서 전사된 mRNA를 제공한다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 카고 뉴클레오티드 서열은 조작된다. 일부 실시예에서, 카고 뉴클레오티드 서열은 이종이다. 일부 실시예에서, 카고 뉴클레오티드 서열은 유기체에 존재하는 야생형 게놈 서열의 서열을 갖지 않는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함한다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 핵산은 레트로트랜스포사제를 암호화하고, 여기서 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 여기서 유기체는 미배양 미생물이 아니다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로부터 선택되는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 897을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 N-말단에 근접한다. 일부 실시예에서, NLS는 서열번호 896을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 C-말단에 근접한다. 일부 실시예에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간이다
일부 실시예에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산을 포함하는 벡터를 제공한다. 일부 실시예에서, 벡터는 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함한다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 포함하는 세포를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 제조하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 방법을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성된 레트로트랜스포사제를 이중-가닥 데옥시리보핵산 폴리뉴클레오티드와 접촉시키는 단계를 포함하며, 여기서 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공하며, 이러한 방법은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고, 여기서 복합체는, 복합체가 표적 핵산 유전자좌에 결합할 때, 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 방법을 제공하며, 여기서 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산 또는 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 레트로트랜스포사제를 암호화하는 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.
일부 측면에서, 본 개시내용은 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 이종 레트로트랜스포사제 또는 이들의 변이체를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그가 부착된다. 일부 실시예에서, 방법은 감산(subtractive) IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
일부 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공하며, 이는 조성물을 세포에 접촉시키는 단계를 포함하며, 상기 조성물은 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성된, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고, (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고; (iii) 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.
일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포 또는 포유류 세포이다. 일부 실시예에서, 숙주 세포는 E. coli 세포이고, 여기서 E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, 스트렙 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 단백질 중 어느 하나를 암호화하는 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 본원에 기술된 단백질 중 어느 하나를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 단백질의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 뉴클레아제의 발현을 유도하는 단계는 추가 화학 제제 또는 영양소의 증가된 양을 첨가하거나, 온도 증가 또는 감소에 의한 것이다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질을 포함하는 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 엔도뉴클레아제를 단리하는 단계를 추가로 포함한다. 일부 실시예에서, 단리하는 단계는 단백질 추출물에 대해 IMAC, 이온 교환 크로마토그래피, 음이온 교환 크로마토그래피, 또는 양이온 교환 크로마토그래피를 거치게 하는 단계를 포함한다. 일부 실시예에서, 숙주 세포는 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함하는 개방 해독 프레임을 포함하는 핵산을 포함한다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 단백질에 접촉시킴으로써 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 친화성 태그는 IMAC 친화성 태그다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 단백질을 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
본 개시내용의 추가 측면 및 이점은, 본 개시의 예시적인 실시예만이 도시되고 설명되는, 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인지하게 되겠지만, 본 개시내용은 다른 실시예 및 상이한 실시예가 가능하고, 본 개시의 몇몇 세부 사항은 다양한 명백한 측면에서 본 개시를 벗어나지 않고도 변형될 수 있다. 따라서, 도면 및 본 발명을 실시하기 위한 구체적인 내용은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물, 특허, 또는 특허 출원이 참조에 의해 구체적으로 및 개별적으로 통합된 것으로 표시된 것과 동일한 정도로 참조에 의해 본원에 통합된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에 명시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시예가 제시되는 하기 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조함으로써 보다 잘 이해될 것이다.
도 1은 박테리아 레트로트랜스포존의 게놈 맥락을 도시한다. MG140-1은 Zn-핑거 DNA 결합 도메인 및 역전사 효소 도메인을 암호화하는 예측된 레트로트랜스포사제(화살표)이다. 레트로트랜스포사제의 측면에 위치하는 영역은 레트로트랜스포사제에 대한 결합 부위를 나타낼 가능성이 있는 이차 구조를 나타낸다(2차 구조 박스 및 확대된 이미지). 다른 상동체와의 유사 영역은 레트로트랜스포존이 통합된 추정 표적 부위를 나타낸다.
도 2는 MG140 계열의 MG 레트로트랜스포사제 단백질 서열의 다중 서열 정렬(MSA)을 도시한다. 도 2a는 역전사 효소 도메인의 MSA를 도시한다. 보존된 촉매 잔기 D, QG, [Y/F]ADD, 및 LG는 컨센서스 서열 상에서 강조된다. 도 2b는 Zn-핑거 및 엔도뉴클레아제 도메인의 MSA를 도시한다. Zn-핑거 모티프(CX[2-3]C), 엔도뉴클레아제 도메인의 일부 및 뉴클레아제 촉매 잔기가 컨센서스 서열 상에서 강조된다.
도 3은 MG 및 기준 레트로트랜스포사제 유전자의 계통발생 유전자 트리를 도시한다. 도 3a는 미생물 MG 레트로트랜스포사제(계통군 4 상의 흑색 분지)가 바이러스 레트로트랜스포사제(계통군 6 상의 회색 분지)보다 진핵생물과 더 밀접하게 관련됨을 도시한다. 계통군 1: 텔로머라아제 역전사 효소; 계통군 2: II족 인트론 역전사 효소; 계통군 3: 진핵생물 R1형 레트로트랜스포사제; 계통군 4: 미생물 및 진핵생물 R2 레트로트랜스포사제; 계통군 5: 진핵생물 레트로바이러스-관련 역전사 효소; 및 계통군 6: 바이러스 역전사 효소. 도 3b도 3a의 계통발생 유전자 트리의 계통군 3 및 4를 도시한다. 일부 미생물 MG 레트로트랜스포사제는 다수의 Zn-핑거 모티프(수직 직사각형), 보존된 RVT_1 역전사 효소 도메인, 및 APE/RLE 또는 기타 엔도뉴클레아제 도메인(상단 및 하단 패널)을 함유한다. 일부 미생물 MG 레트로트랜스포사제는 엔도뉴클레아제 도메인(중간 패널)이 결여되어 있다.
도 4는 다양한 효소로부터의 역전사 효소 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. RT 서열은 DNA뿐만 아니라 RNA 조립체로부터 유래하였다. 기준 RT를 분류 목적을 위해 트리에 포함시켰다.
도 5a는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147) 및 관련 RT(MG148)의 신규한 계열로부터 식별된 RT 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 5b는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147)가 RT 도메인, 엔도뉴클레아제 도메인(Endo), 및 다수의 아연-결합 리본 모티프를 함유하는 반면, 계열 MG148 RT는 엔도뉴클레아제 도메인이 결여되어 있음을 입증하는 데이터를 도시한다.
도 6a는 MG140 R2 레트로트랜스포사제가 RT 및 엔도뉴클레아제(EN) 도메인뿐만 아니라 다수의 아연-핑거를 함유하고, 기준 Danio rerio R2 레트로트랜스포사제(R2Dr)와 24% 내지 26%의 평균 아미노산 동일성(AAI)을 공유한다는 것을 입증하는 데이터를 도시한다. 도 6B는 MG140-47 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 데이터를 도시한다. 기준(GQ398061) 리보솜 RNA 오페론에 대한 MG140-47 콘티그의 정렬은 MG140-47 28S rDNA 유전자(점선 박스) 내로의 R2 요소의 통합으로 인해 기준 28S rDNA 유전자에서 큰 갭을 나타낸다.
도 7a는 MG145-45 레트로트랜스포존의 게놈 맥락을 도시한다. 효소는 RT 및 아연-핑거 도메인을 함유한다. 5' 말단에서의 부분적인 18S rDNA 유전자 히트 및 3' 말단에서의 폴리-A 꼬리는 트랜스포존의 경계를 나타낼 가능성이 있다. 도 7b는 MG140-3, MG140-8, 및 MG140-45 게놈 서열의 정렬을 도시하며, 이는 정렬의 위치 200에 대한 18S rRNA 유전자의 보존을 도시하고, R2 요소가 18S rDNA 유전자(화살표)에 통합되었음을 나타낸다.
도 8a는 RT 및 엔도뉴클레아제 도메인을 갖는 MG146-1 레트로트랜스포사제를 암호화하는 콘티그를 도시한다. 도 8b는 동원에 관여할 것으로 예측된 3개의 유전자를 암호화하는 MG140-17-R2 레트로트랜스포존을 도시한다: RNA 인식 모티프 유전자(RRM); 엔도뉴클레아제 효소; 및 RT 및 RNAse H 도메인을 갖는 역전사 효소.
도 9a는 RT의 MG148 계열의 2개의 구성원의게놈 맥락을 도시한다. RT와 연관되지 않은 예측된 유전자는 백색 화살표로 표시된다. 도 9b는 RT의 상류에 보존된 영역(서열 아래의 박스)을 나타내는 MG148 계열의 5개의 구성원의뉴클레오티드 서열 정렬을 도시한다(컨센서스 서열에 걸쳐 주석이 달린 화살표).
도 10은 qPCR(MG140)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타(Taeniopygia guttata)); 양성 대조군 2: R2Bm (봄빅스 모리(Bombyx mori)). 2개의 양성 대조군은 문서화된 R2 레트로트랜스포존이다. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 11은 qPCR(MG146, MG147, MG148)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타), 문서화된 R2 레트로트랜스포존. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 12는 차세대 시퀀싱에 의해 R2 및 R2-유사 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 배경: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타).
도 13a는 다양한 부류의 신규한 계열로부터 식별된 전장 II족 인트론 RT의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 13b는 II족 인트론의 MG 계열의 요약표를 도시한다. AAI: 기준 II족 인트론 서열에 대한 MG 계열의 평균 쌍별 아미노산 동일성.
도 14a 내지 도 14d는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-1 내지 MG153-21 및 MG153-25 내지 MG153-27의 시험관 내 활성의 스크리닝을 도시한다. 도 14a 내지 도 14c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4-MarathonRT 대조군 RT. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 결과는 2개의 독립적인 실험을 나타낸다. 도 14a 레인 번호 5-14는 신규 후보 MG153-1 내지 MG153-10에 상응한다. 도 14b 레인 번호 5-14는 신규 후보 MG153-11 내지 MG153-20에 상응한다. 도 14c 레인 번호 5-8은 신규 후보 MG153-21, MG153-25, MG153-26, 및 MG153-27에 각각 상응한다. 도 14d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 14a 내지 도 14c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 15는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-28 내지 MG153-37 및 MG153-39 내지 MG153-57의 시험관 내 활성의 스크리닝을 도시한다. 도 15a 내지 도 15c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT. 굵은 글씨체로 표시된 번호는 겔 레인에 해당한다. 도 15a 레인 번호 4-13은 신규 후보 MG153-28 내지 MG153-37에 상응한다. 도 15b 레인 번호 4-13은 신규 후보 MG153-39 내지 MG153-48에 상응한다. 도 15c 레인 번호 4-13은 신규 후보 MG153-49 내지 MG153-57에 상응한다. 도 15d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 15a 내지 도 15c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 16은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 D MG165 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 16a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 12- 신규 후보 MG165-1 내지 9. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 16b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 16a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 17은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 F MG167 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 17a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 - 신규 후보 MG167-1 내지 8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 17b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 17a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 18은 차세대 시퀀싱에 의해 MG153 계열의 GII 인트론 클래스 C RT 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 결과는 2개의 독립적인 실험으로부터 결정하였다.
도 19는 포유류 세포에서 cDNA를 합성하는 표시된 대조군 RT 및 GII 인트론 클래스 C 후보의 능력을 평가하기 위한 스크리닝을 도시한다. 도 19a는 아가로오스 겔 분석에 의한 542 bp(상단) 및 100 bp(하단) PCR 산물의 검출을 도시한다. 도 19b는 D1000 TapeStation에 의한 542 bp(상단) 및 100bp(하단) PCR 산물의 검출을 도시한다. 도 19c는 추가 후보에 대한 D1000 TapeStation에 의한 542 bp PCR 산물의 검출을 도시한다. 도 19a도 19b에 설명된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다.
도 20a는 전장 G2L4-유사 RT의 계통발생 트리를 도시한다. 기준 G2L4 서열 및 MG172 후보(점)가 강조된다. 도 20b는 기준 및 MG172 RT의 컬럼 277 내지 280이 역전사 효소 기능을 담당하는 촉매 잔기를 나타낸다는 것을 입증하는 데이터를 도시한다.
도 21a는 전장 LTR RT의 계통발생 트리를 도시한다. 기준 LTR RT 서열 및 MG151 후보(점)가 강조된다. 도 21b는 MG151-82 RT(ORF 7로 표지됨)의게놈 맥락을 도시한다. 예측된 도메인은 어두군 상자로서 도시되고, 긴 말단 반복(LTR)은 LTR 트랜스포존의 측면에 위치한 화살표로서 도시된다. 도 21c는 프로테아제, RT, RNAse H 및 인테그라아제 도메인을 보여주는 MG151-82의 3D 구조 예측을 도시한다.
도 22는 프로테아제, RT - RNAse H, 및 인테그라아제 도메인을 강조하기 위한 전장 pol 단백질 서열의 다중 서열 정렬을 도시한다. MMLV RT의 RT, RNAse H, 및 인테그라아제 도메인에 대한 촉매 잔기는 각 도메인 아래에 막대로 도시되어 있다. MMLV 기준 서열의 프로테아제 도메인은 정렬에 도시되지 않는다.
도 23은 프라이머 연장 검정에 의한 바이러스 후보 MG151-80 내지 MG151-97의 시험관 내 활성의 스크리닝을 도시한다. 도 23a의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형; 2-MMLV 대조군 RT; 3-Ty3 대조군 RT; 4 내지 9의 신규 후보 MG151-80 내지 85; 10- RT 대조군. 도 23b의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형, 2 내지 12- 신규 후보 MG151-87 내지 97, 13-MMLV 대조군 RT. 도 23c는 상이한 완충액 조건에서 Ty3 대조군 RT의 시험관 내 활성에 대한 시험을 도시한다. 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군; 2-완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP); 3- 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl2, 1 mM TCEP, 2% PEG-8000); 4-완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl2, 1 mM TCEP, 0.01% (v/v) Triton X-100); 5-완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl2, 1 mM TCEP, 10% 글리세롤). 도 23a 내지 도 23c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 24는 구조화된 RNA 주형 상에서 후보 MG151-89, MG151-92, 및 MG151-97의 시험관 내 RT 공정도 및 프라이밍 파라미터의 시험을 도시한다. 도 24a도 24b의 경우, 레인 1: 6,10, 및 16개 뉴클레오티드 올리고 마커(화살표); 레인 2: 8, 13, 및 20개 뉴클레오티드 올리고 마커; 레인 3: 43 및 55개 뉴클레오티드 올리고 마커; 레인 4 및 10: 6개 뉴클레오티드 프라이머; 레인 5 및 11: 8개 뉴클레오티드 프라이머; 레인 6 및 12: 10개 뉴클레오티드 프라이머; 레인 7 및 13: 13개 뉴클레오티드 프라이머; 레인 8 및 14: 16개 뉴클레오티드 프라이머; 레인 9 및 15: 20개 뉴클레오티드 프라이머. 도 24a 레인 4-9는 다양한 프라이머 길이를 갖는 MMLV를 함유하는 역전사 반응에 상응한다. MMLV는 구조화된 RNA 헤어핀을 통해 역전사한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-89를 함유하는 역전사 반응에 상응한다. MG151-89는 16개 및 20개의 뉴클레오티드의 프라이머 길이를 선호하며, 구조화된 RNA 헤어핀에서 역전사를 정지시키는 것으로 보인다. 도 24b 레인 4-9는 다양한 프라이머 길이를 갖는 MG151-92를 함유하는 역전사 반응에 상응한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-97을 함유하는 역전사 반응에 상응한다. MG151-92 또는 MG151-97은 이들 실험 조건 하에서 활성인 것으로 보이지 않는다.
도 25는 2407개의 레트론 RT의계통발생 분석을 도시하며, 제1 후보는 시험관 내에서 강조된 하류 특성화를 위해 선택되었다. 문헌에서 실험적으로 검증된 16개의 레트로엔 중 9개를 첨가하고 트리에서 강조하였다. 회색 별표는 후보 MG154-MG159 및 MG173 계열 구성원을 나타낸다.
도 26시험관 내에서 하류 특성화를 위해 선택된 일부 레트론-RT 후보의단백질 정렬을 도시한다. 문서화된 모든 역전사 효소에 공통인 레트론-특이적 모티프 및 촉매 XXDD 코어가 도면에 표시되어 있다.
도 27a는 MG157-1 레트론(두껍고 검은 선 상에 화살표 표지된 RT)의게놈 맥락을 도시한다. 레트론 비-암호화 RNA(ncRNA)는 점선 상자로 강조 표시되어 있다. 도 27b는 MG157-1 레트론 ncRNA의 측부 역 반복이 있음을 보여주는 삽입체를 도시한다. 도 27c는 MG157-1 레트론 ncRNA의 예측된 구조를 도시한다.
도 28a는 MG160-3 레트론-유사 단일-도메인 RT의 게놈 맥락을 도시한다. RT로부터 상류에 있는 영역(점선 상자)은 MG160 구성원에 걸쳐 보존된다. 도 28b는 MG160-3의 3D 구조 예측을 도시하며, 이는 II족 인트론 동결-EM 구조에 정렬된 RT 도메인을 나타낸다. 도 28c는 5개의 MG160 구성원의 5' UTR의 예측된 구조를 도시한다.
도 29는 프라이머 연장 검정에 의한 레트론-유사 후보 MG160-1 내지 MG160-6 및 MG160-8의 시험관 내 활성의 스크리닝을 도시한다. 도 29a 레인 번호는 다음의 샘플에 상응한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 10- 신규 후보 MG160-1 내지 MG160-6 및 MG160-8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 29b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 29a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 30시험관 내 전사에 의한 레트론 RT 후보의 세포-무함유 발현 및 레트론 ncRNA의 생성을 도시한다. 도 30a는 세포-무함유 발현 시스템에서의 레트 론 RT 단백질 생산의 확인을 도시한다. 레인은 다음에 해당한다: 1: 래더, 2: 주형 없는 대조군, 3: MG156-1(39 kDa) , 4: MG156-2(40 kDa), 5: MG157-1(38 kDa). 도 30b는 세포-무함유 발현 시스템에서의 레트론 RT 단백질 생산의확인을 도시한다. 레인은 다음에 해당한다- 1: 래더, 2: 주형 없는 대조군, 3: MG157-2(37 kDa), 4: MG157-5(43 kDa), 5: MG159-1(53 kDa), 6: Ec86(38 kDa, 양성 대조군 레트론 RT). 도 30c시험관 내 전사에 의한 레트론 ncRNA 주형의생성을 도시한다. 레인은 다음의 레트론에 상응하는 다음의 ncRNA에 상응한다- 1: MG154-1, 2: MG154-2, 3: MG155-1, 4: MG155-2, 5: MG155-3, 6: MG156-1, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86, 14: MG155-4, 15: MG173-1, 16: MG155-5.
도 31은 MG140-1 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 도메인 구조를 도시한다. R2 레트로트랜스포사제(밝은 회색 화살표)는 다수의 Zn-핑거뿐만 아니라 RT 및 엔도뉴클레아제 도메인을 함유한다. MG140-1의 측면에는 트랜스포존 경계를 정의하는 5' 및 3' UTR이 위치한다. MG140-1은 표적 부위 모티프 GGTAGC에서 G 및 T 뉴클레오티드 사이에 정확하게 통합된다.
도 32는 포스포로티오에이트 결합 변형을 함유하는 DNA 올리고를 갖는 프라이머 연장에 의한 RT 활성의 시험을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress PS-변형된 프라이머 1을 갖는 주형 없는 대조군, 2: PURExpress PS-변형된 프라이머 2를 갖는 주형 없는 대조군, 3: PURExpress PS-변형된 프라이머 3을 갖는 주형 없는 대조군, 4: 변형되지 않은 프라이머를 갖는 MMLV RT, 5: PS-변형된 프라이머 1을 갖는 MMLV RT, 6: PS-변형된 프라이머 2를 갖는 MMLV RT, 7: PS-변형된 프라이머 3을 갖는 MMLV RT, 8: 변형되지 않은 프라이머를 갖는 TGIRT-III, 9: PS-변형된 프라이머 1을 갖는 TGIRT-III, 10: PS-변형된 프라이머 2를 갖는 TGIRT-III, 11: PS-변형된 프라이머 3을 갖는 TGIRT-III, 12: 변형되지 않은 프라이머를 갖는 MG153-9, 13: PS-변형된 프라이머 1을 갖는 MG153-9, 14: PS-변형된 프라이머 2를 갖는 MG153-9, 15 PS-변형된 프라이머 3을 갖는 MG153-9. MMLV RT 및 TGIRT-III은 대조군 RT이다.
도 33은 프라이머 연장 검정에 의해 RNA 주형 상에서의 레트론 RT의 활성의 스크리닝을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress 주형 없는 대조군, 2: MMLV 대조군 RT, 3: MG154-1, 4: MG155-1, 5: MG155-2, 6: MG155-3, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86 대조군 레트론 RT, 14: Sa163 대조군 레트론 RT, 15: St85 대조군 레트론 RT. 굵은 글씨체로 표시된 레인은 시험된 기질 상에 프라이머 연장 활성을 나타내는 신규한 레트론 RT에 해당한다.
도 34는 포유류 세포에서 cDNA를 합성하는 MG153 GII 유래 RT의 능력에 대한 스크리닝을 도시한다. 542 bp cDNA 합성 PCR 산물의 검출을 Taqman qPCR로 분석하였다. TGIRT가 1의 값을 나타내는 활성 TGIRT 대조군으로 cDNA 활성을 정규화하였다. Y축은 로그 10 스케일로 도시되어 있다.
도 35는 면역블롯에 의한 MG153 GII 유래 RT의 단백질 발현을 도시한다. 도 35a 35b:후보 RT를 함유하는 플라스미드로 세포를 형질감염시키고, 면역블롯에 의해 단백질 발현을 평가하여, RT의 N 말단에 융합된 HA 펩티드를 검출하였다. 모든 레인을 총 단백질 농도로 정규화하였다. 백색 화살표는 단백질의 예상 분자 크기의 2X에서 밴드를 가리키며, 이는 단백질 이량체를 나타낸다. 도 35a 도 35b에 기술된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다. 도 35c: GII 유래 RT의 다중 서열 정렬. 나타낸 영역은 정렬의 위치 196 내지 201에 상응한다. 이량체화 모티프 CAQQQ가 강조된다.
도 36은 단백질 발현에 대해 정규화된 GII 유래 RT의 상대 활성을 도시한다. cDNA 합성은 Taqman qPCR에 의해 검출되었고, 단백질 발현은 면역블롯에 의해 검출되었다. TGIRT에 상대적인 활성을 총 단백질 농도에 따라 정규화하였다. Y축은 선형 스케일로 도시되어 있다.
서열 목록에 대한 간단한 설명
본원과 함께 출원된 서열 목록은 본 개시에 따른 방법, 조성물, 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 서열 목록 내 서열에 대한 예시적인 설명이 아래에 제시되어 있다.
MG140
서열번호 1-29 및 393-401은 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.
서열번호 374-386은 HA-His-태그된 MG140 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 761-798은 MG140 UTR의 뉴클레오티드 서열을 보여준다.
서열번호 799-894는 MG140 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
MG146
서열번호 402 및 895는 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.
서열번호 387은 HA-His-태그된 MG146 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG147
서열번호 388은 HA-His-태그된 MG147 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG148
서열번호 403-426은 MG148 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 389-392는 HA-His-태그된 MG148 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG149
서열번호 427-439는 MG149 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
MG151
서열번호 440-554는 MG151 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 356-362는 TwinStrep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 363-373은 strep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG153
서열번호 555-608은 MG153 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 30-32 및 40-50은 MG153 역전사 효소 단백질 및 MS2 외피 단백질(MCP)을 포함하는 융합 단백질의 뉴클레오티드 서열을 보여준다.
서열번호 66-119는 strep-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 120-173은 MG153 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 740-756은 MCP-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG154
서열번호 609-610은 MG154 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 308-309는 strep-태그된 MG154 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 324-325는 MG154 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 340-341은 MG154 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG155
서열번호 611-615는 MG155 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 310-312는 strep-태그된 MG155 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 326-328은 MG155 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 342-344는 MG155 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG156
서열번호 616-617은 MG156 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 313-314는 strep-태그된 MG156 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 329-330은 MG156 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 345-346은 MG156 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG157
서열번호 618-622는 MG157 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 315-319는 strep-태그된 MG157 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 331-335는 MG157 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 347-351은 MG157 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG158
서열번호 623은 MG158 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 320은 strep-태그된 MG158 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 336은 MG158 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 352는 MG158 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG159
서열번호 624-626은 MG159 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 321-323은 strep-태그된 MG159 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 337-339는 MG159 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 353-355는 MG159 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG160
서열번호 627-673은 MG160 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 174-180은 strep-태그된 MG160 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 181-187은 최적화된 MG160 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG163
서열번호 674-678은 MG163 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 188-192는 strep-태그된 MG163 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 193-197은 최적화된 MG163 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG164
서열번호 679-683은 MG164 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 198-202는 strep-태그된 MG164 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 203-207은 최적화된 MG164 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG165
서열번호 684-692는 MG165 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 208-216은 strep-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 217-225는 최적화된 MG165 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 757-759는 MCP-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG166
서열번호 693-697은 MG166 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 226-230은 strep-태그된 MG166 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 231-235는 최적화된 MG166 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG167
서열번호 698-702는 MG167 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 236-240은 strep-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 241-245는 최적화된 MG167 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 759-760은 MCP-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG168
서열번호 703-707은 MG168 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 246-250은 strep-태그된 MG168 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 251-255는 최적화된 MG168 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG169
서열번호 708-718은 MG169 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 256-266은 strep-태그된 MG169 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 267-277은 최적화된 MG169 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG170
서열번호 719-728은 MG170 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 278-287은 strep-태그된 MG170 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 288-297은 최적화된 MG170 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG172
서열번호 729-733은 MG172 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 298-302는 strep-태그된 MG172 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 303-307은 최적화된 MG172 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG173
서열번호 734-735는 MG173 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
기타 서열
서열번호 736-738은 포스포로티오에이트-변형된 프라이머의 뉴클레오티드 서열을 보여준다.
서열번호 739는 qPCR에 대한 Taqman 프로브의 뉴클레오티드 서열을 보여준다.
발명을 실시하기 위한 구체적인 내용
본 발명의 다양한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 수 있다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
달리 명시되지 않는 한, 본원에 개시된 일부 방법을 실시하는 데에는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈, 및 재조합 DNA의 기술이 사용된다. 예를 들어 Sambrook 및 Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel 등(편); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames 및 G.R. Taylor(편) (1995)), Harlow and Lane(편) (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney(편) (2010))을 참조한다(이들은 그 전체가 참조로서 본원에 통합됨).
본원에서 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 달리 명시되지 않는 한, 복수 형태도 포함하도록 의도된다. 또한, 용어 "포함하는(including, includes, having, has, with)" 또는 이의 변형된 표현이 발명을 실시하기 위한 구체적인 내용 및/또는 청구범위에 사용되는 정도까지, 이러한 용어는 용어 "포함하는(comprising)"과 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내의 것을 의미하며, 이는 값이 측정되거나 결정되는 방법, 예를 들어 측정 시스템의 한계에 부분적으로 좌우될 것이다. 예를 들어, "약"은 당 기술분야의 관행에 따라 하나 또는 둘 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조, 기능, 또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물의 세포, 원생동물 세포, 식물 유래의 세포(예를 들어, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 석송, 뿔이끼류, 우산이끼, 이끼 유래의 세포), 해조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 라인하르트티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 쌍발이모자반(Sargassum patens C. Agardh, 등), 해초(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포류, 극피동물, 선충 등) 유래의 세포. 척추동물(예를 들어, 생선, 양서류, 파충류, 새, 포유동물) 유래의 세포, 포유동물(예를 들어, 돼지, 젖소, 염소, 양, 설치류, 랫트, 마우스, 비인간 영장류, 인간 등) 유래의 세포, 등. 때로는, 세포는 천연 유기체로부터 유래되지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있고, 이는 가끔 인공 세포라 불린다).
본원에서 사용되는 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염의 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산, 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP), 및 데옥시리보뉴클레오시드 삼인산, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는, 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만, 이에 한정되지는 않는다. 뉴클레오티드는 표지되지 않거나, 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여 검출 가능하게 표지될 수 있다. 표지화는 양자점(quantum dots)으로 수행될 수도 있다. 검출 가능한 표지는, 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지, 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 사아닌, 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만 이에 한정되지는 않는다. 형광 표지된 뉴클레오티드의 특정 예는 다음을 포함할 수 있다: Perkin Elmer(Foster City, Calif)로부터 입수할 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; Amersham(Arlington Heights, Il.)으로부터 입수할 수 있는 FluoroLink 데옥시뉴클레오티드, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink 플루오르 X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; Boehringer Mannheim(Indianapolis, Ind.)으로부터 입수할 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 Molecular Probes(Eugene, Oreg.)로부터 입수할 수 있는 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP. 뉴클레오티드는 화학적 변형에 의해 표지되거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적인 예는 다음을 포함할 수 있다: 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP).
용어 "폴리뉴클레오티드", "올리고뉴클레오티드", 및 "핵산"은 일반적으로 임의의 길이를 가진 뉴클로에티드의 중합체 형태를 지칭하도록 사용 교환적으로 사용되며, 상기 뉴클레오티드는 단일 가닥, 이중 가닥, 또는 다중 가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드이거나, 이의 유사체일 수 있다. 폴리뉴클레오티드는 세포에 대해 외인성이거나 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에서 존재할 수 있다. 폴리뉴클레오티드는 유전자이거나 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 백본, 당, 또는 핵염기가 변경된 유사체)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적인 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산(xeno nucleic acid), 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단 (예를 들어, 당류에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 큐오신, 및 와이오신. 폴리뉴클레오티드의 비제한적인 예는 다음을 포함한다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌/유전자좌들, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA (tRNA), 리보솜 RNA (rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브, 및 프라이머. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다.
용어 "형질감염(transfection 또는 transfected)"은 일반적으로 비-바이러스적인 방법 또는 바이러스-기반 방법에 의해 핵산을 세포 내로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 암호화하는 유전자 서열일 수 있다. 예를 들어, Sambrook 등의 문헌[1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88(이는 본원에 참조로서 전체적으로 통합됨)]을 참조한다.
용어 "펩티드", "폴리펩티드", 및 "단백질"은 일반적으로 펩티드 결합에 의해 결합된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하도록 본원에서 상호 교환적으로 사용된다. 이 용어는 중합체의 특정 길이를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용해 생산되는지 또는 자연적으로 발생하는지를 암시하거나 구별하도록 의도되지도 않는다. 상기 용어는 자연적으로 발생하는 아미노산 중합체뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 실시예에서, 중합체는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬, 및 2차 또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함한다. 상기 용어는 예를 들어, 이황화 결합 형성, 당질화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체도 포함한다. 본원에서 사용되는 용어 "아미노산(들)"은, 변형된 아미노산 및 아미노산 유사체를 포함하되 이에 한정되지 않는, 천연 및 비-천연 아미노산을 일반적으로 지칭한다. 변형된 아미노산은, 아미노산 상에는 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 천연 아미노산 및 비-천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 모두를 포함한다.
본원에서 사용되는 바와 같이, "비-고유(non-native)"는 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 일반적으로 지칭할 수 있다. 비-고유는 친화성 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입, 또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 금속전이효소 활성, 아세틸전이효소 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내거나 이를 암호화할 수 있다. 비-고유 핵산 또는 폴리펩티드 서열은 유전자 조작에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결되어 키메라 핵산 또는 폴리펩티드를 암호화하는 키메라 핵산 또는 폴리펩티드 서열을 생성할 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는, 유전자의 전사 또는 발현을 조절하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하게 위치하거나 이와 중첩될 수 있는 조절 DNA 영역을 일반적으로 지칭한다. 프로모터는 종종 전사 인자로서 지칭되는 단백질 인자에 결합하는 특이적 DNA 서열을 함유할 수 있는데, 상기 인자는 RNA 중합효소가 DNA에 결합하는 것을 용이하게 하여 유전자 전사를 유도한다. '코어 프로모터'로도 지칭되는 '기저 프로모터(basal promoter)'는 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 모든 기본 요소를 함유하는 프로모터를 일반적으로 지칭할 수 있다. 진핵생물 기저 프로모터는 TATA-박스 또는 CAAT 박스를 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 공정 또는 전사된 mRNA가 후속하여 펩티드, 폴리펩티드, 또는 단백질로 번역되는 공정을 일반적으로 지칭한다. 전사체 및 암호화된 폴리펩티드는 "유전자 산물"로서 통칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된(operably linked, operable linkage, operatively linked)" 또는 이와 문법적으로 동등한 표현은 유전자 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 일반적으로 지칭하는데, 여기서 요소들은 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사 개시에 도움을 주는 경우, 조절 요소는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 결합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 연관을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 유전자에 작동 가능하게 연결되어 표적에서 유전자의 발현을 용이하게 하는 유전자 요소, 예를 들어 조절 요소를 일반적으로 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 일반적으로 상호 교환적으로 사용된다. 일부 실시예에서, 발현 카세트는 조절 요소와 발현을 위해 조절 요소가 작동 가능하게 연결되는 유전자(들)의 조합을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적 활성)을 보유하는 단편을 일반적으로 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인한 방식으로 발현에 영향을 미치는 이의 능력일 수 있다.
본원에서 사용되는 바와 같이, "조작된" 객체란 객체가 인간 개입에 의해 변형되었음을 일반적으로 나타낸다. 비제한적인 예에 따르면: 핵산은 이의 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이 핵산을 자연에서 연관되지 않는 핵산과 결합시키되, 결합 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 결합시킴으로써 변형될 수 있고; 조작된 핵산은 자연에서 존재하지 않는 서열을 이용해 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에서 존재하지 않는 서열과 치환함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용되는 바와 같이, "합성" 및 "인공"은, 대체적으로 자연 발생 인간 단백질과 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하도록 상호 교환적으로 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전사 활성화 도메인이다.
본원에서 사용되는 바와 같이, 용어 "전위 가능한 요소(transposable element)"는 게놈 내의 한 위치에서 다른 위치로 이동할 수 있는 DNA 서열을 지칭한다(예를 들어, 이들은 "전위(transposed)"될 수 있음). 전위 가능한 요소는 일반적으로 2개의 부류로 분할될 수 있다. 클래스 I 전위 가능한 요소, 또는 "레트로트랜스포존"은 RNA 중간체의 전사 및 번역을 통해 전위되고, 이어서 역전사를 통해 그의 새로운 위치에 재통합된다(역전사 효소에 의해 매개되는 과정). 클래스 II 전위 가능한 요소, 또는 "DNA 트랜스포존"은 트랜스포사제가 양측에 위치하는 단일-가닥 또는 이중-가닥 DNA의 복합체를 통해 전위된다. 이러한 효소 계열의 추가 특징은, 예를 들어, Nature Education 2008, 1 (1), 204; 및 Genome Biology 2018, 19 (199), 1-12에서 찾을 수 있으며, 이들 각각은 참조로서 본원에 통합된다.
본원에서 사용되는 바와 같이, 용어 "레트로트랜스포존"은 RNA 중간체를 포함하는 2-파트 "복사 및 붙여넣기" 메커니즘에 따라 기능하는 클래스 I 전위 가능한 요소를 지칭한다. "레트로트랜스포사제"는 레트로트랜스포존의 전위를 담당하는 효소를 지칭한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서의 용어 "서열 동일성" 또는 "동일성 백분율"은, 서열 비교 알고리즘을 사용해 측정했을 때, 부분적 또는 전체 비교 윈도우에 걸쳐 비교하고 최대 상응에 정렬했을 때 동일한 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열; 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열을 일반적으로 지칭한다. 폴리펩티드 서열에 대한 적절한 서열 비교 알고리즘은 예를 들어 다음을 포함한다: 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 30개 잔기를 초과하는 길이의 폴리펩티드 서열에 대해서는 조건부 조성 스코어 매트릭스 조정(conditional compositional score matrix)을 사용하는 BLASTP; 단어 길이(W) 2, 기대치(E) 1000000의 파라미터, 및 30개 잔기 미만의 서열에 대해서는 PAM30 스코어링 매트릭스(개방 갭 9, 연장 갭 1의 갭 비용 설정 - 이들은 https://blast.ncbi.nlm.nih.gov에서 이용할 수 있는 BLAST 세트 중 BLASTP에 대한 디폴트 파라미터임)를 사용하는 BLASTP; 일치 2, 불일치 -1, 및 갭 -1의 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW; 디폴트 파라미터를 사용하는 MUSCLE; retree 2 및 최대 반복 1000의 파라미터를 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 최고 또는 "최적화된" 동일성 백분율 점수를 생성하는 정렬에 의해 결정했을 때, 아미노산 잔기 또는 뉴클레오티드의 최대 상응성에 정렬된 2개 이상의 (예를 들어, 쌍 정렬의) (예를 들어, 다중 서열 정렬의) 서열을 지칭한다.
용어 "개방 해독 프레임" 또는 "ORF"는 일반적으로 단백질 또는 단백질의 일부를 암호화할 수 있는 뉴클레오티드 서열을 지칭한다. 개방 해독 프레임은 시작 코돈(예를 들어, RNA 분자의 경우 AUG 및 표준 코드의 DNA 분자 중 ATG로 표시됨)으로 시작할 수 있고, 프레임이 정지 코돈(예를 들어, RNA 분자의 경우 UAA, UGA 또는 UAG 및 표준 코드의 DNA 분자 중 TAA, TGA 또는 TAG로 표시됨)으로 끝날 때까지 코돈-트리플릿에서 판독될 수 있다.
하나 이상의 보존적 아미노산 치환을 갖는 본원에 기술된 효소 중 어느 하나의 변이체가 본 개시내용에 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않고도 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 소수성, 극성, 및 R 사슬 길이가 서로 유사한 아미노산들을 치환함으로써 달성될 수 있다. 추가적으로 또는 대안적으로, 상이한 종의 상동성 단백질의 정렬된 서열을 비교함으로써, 종들 간에 돌연변이된 아미노산 잔기(예를 들어, 암호화된 단백질의 기본 기능을 변경시키지 않은 비보존적 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기술된 레트로트랜스포사제 단백질 서열 중 어느 하나(예를 들어 본원에 기술된 MG140 계열 레트로트랜스포사제, 또는 본원에 기술된 임의의 기타 계열 레트로트랜스포사제)와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시예에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 레트로트랜스포사제의 하나 이상의 중요한 활성 부위 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 중 적어도 하나의 치환이 결여되어 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 모두의 치환이 결여되어 있다.
또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위해 하나 이상의 촉매 잔기의 치환을 갖는, 본원에 기술된 효소 중 어느 하나의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시예에서, 본원에 기술된 단백질로서의 감소된 활성 변이체는 도 2에 언급된 적어도 1개, 적어도 2개, 또는 3개의 촉매 잔기 모두의 파괴 치환을 포함한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참조 문헌을 통해 이용할 수 있다(예를 들어, Creighton의 문헌[Protein: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (1993년 12월)] 참조). 다음의 8개의 기는 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌 (A), 글리신 (G);
2) 아스파르트산 (D), 글루탐산 (E);
3) 아스파라긴 (N), 글루타민 (Q);
4) 아르기닌 (R), 리신 (K);
5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);
6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);
7) 세린 (S), 트레오닌 (T); 및
8) 시스테인 (C), 메티오닌 (M).
하나 이상의 치환, 결실, 또는 삽입을 갖는 본원에 기술된 핵산 서열 중 어느 하나의 변이체가 또한 본 개시내용에 포함된다. 일부 실시예에서, 이러한 변이체는 본원에 기술된 핵산 서열 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는다.
본원에 기술된 단백질 서열 중 일부는 선택된 더 큰 단백질(예를 들어, 레트로트랜스포사제)의 서열로부터 특정 도메인(예를 들어, 역전사 효소 또는 RT 도메인)의 결정을 포함한다. 이러한 경우, 도메인이 검증된(예를 들어, 3D 구조로) 기준 더 큰 단백질(예를 들어, 레트로트랜스포사제)과 다중 서열 정렬(MSA, multiple sequence alignment)을 사용하여, 선택된 단백질을 검증된 도메인이 있는 더 큰 단백질에 정렬시킴으로써 도메인 경계가 식별된다. 서열이 너무 다양하기 때문에 MSA가 결정적이지 않은 경우, 더 큰 단백질의 3D 구조가 결정되고 구조 도메인이 알려진 도메인과 비교되어 경계가 한정된다. 이들 경계는 도메인 경계 내에서 도메인에 대한 중요한 촉매 잔기의 존재를 보장함으로써 추가로 검증될 수 있다.
본원에서 사용되는 바와 같이, 용어 "LINE 레트로트랜스포사제"는 일반적으로 자율적인 비-LTR 레트로트랜스포존(긴 산재 요소(Long INterspersed Element))의 부류를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "R2 레트로트랜스포사제" 또는 "R4 레트로트랜스포사제"는 일반적으로 유사한 도메인 구조를 공유하지만 R2 레트로트랜스포사제에서는 부위 특이적(예를 들어, rRNA 유전자의 특정 부위에서의 통합)일 수 있는 반면, R4 레트로트랜스포존은 rRNA 유전자뿐만 아니라 반복을 함유하는 다른 비특이적 부위 모두에서 통합될 수 있다는 점에서 상이한 LINE 레트로트랜스포사제의 하위 부류를 지칭한다.
개요
독특한 기능 및 구조를 갖는 새로운 전위 가능한 요소의 발견은 데옥시리보핵산(DNA)을 추가로 파괴할 수 있는 편집 기술을 제공함으로써, 속도, 특이성, 기능, 및 사용 편이성을 개선할 수 있다. 미생물에서 전위 가능한 요소의 예측된 출현률 및 미생물 종의 얇은 다양성에 비하여, 비교적 적은 기능적으로 특성화된 전위 가능한 요소가 문헌에 존재한다. 이는 부분적으로는 많은 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 포함하는 자연 환경 적소로부터의 메타게놈 시퀀싱은 신규 문서화된 전위 가능한 요소의 수를 극적으로 증가시키고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 가능성을 제공할 수 있다.
전위 가능한 요소는 게놈 내의 위치를 변화시킬 수 있는 데옥시리보핵산 서열로서, 종종 돌연변이의 생성 또는 완화를 초래한다. 진핵생물에서, 게놈의 큰 비율, 및 세포 DNA의 질량의 큰 공유는 전위 가능한 요소에 기인한다. 전위 가능한 요소는 다른 유전자를 희생하여 자신을 전파하는 "이기적 유전자(selfish genes)"이지만, 이들은 다양한 중요한 기능을 수행하고 게놈 진화에 중요한 것으로 밝혀졌다. 그들의 메커니즘에 기초하여, 전위 가능한 요소는 클래스 I "레트로트랜스포존" 또는 클래스 II "DNA 트랜스포존"으로 분류된다.
레트로트랜스포존으로도 지칭되는 클래스 I 전위 가능한 요소는 RNA 중간체를 포함하는 2개-부분 "복사 및 붙여넣기" 메커니즘에 따라 기능한다. 먼저, 레트로트랜스포존이 전사된다. 생성된 RNA는 이어서 역전사 효소(일반적으로 레트로트랜스포존 자체에 의해 암호화됨)에 의해 DNA로 다시 전환되고, 역 전사된 레트로트랜스포존은 인테그라아제에 의해 게놈 내의 그의 새로운 위치에 통합된다. 레트로트랜스포존은 3개의 목(order)으로 추가로 분류된다. 긴 말단 반복("LTR", long terminal repeat)을 갖는 레트로트랜스포존은 역전사 효소를 암호화하고 반복 DNA의 긴 가닥이 측면에 위치한다. 긴 산재된 핵 요소("LINE", long interspersed nuclear element)를 갖는 레트로트랜스포존은 역전사 효소를 암호화하고, LTR이 결여되고, RNA 중합효소 II에 의해 전사된다. 짧은 산재된 핵 요소("SINE", short interspersed nuclear element)를 갖는 레트로트랜스포존은 RNA 중합효소 III에 의해 전사되지만, 역전사 효소가 결여되어 있으며, 대신에 다른 전위 가능한 요소(예를 들어, LINE)의 역전사 기구에 의존한다.
DNA 트랜스포존으로도 지칭되는 클래스 II 전위 가능한 요소는 RNA 중간체를 포함하지 않는 메커니즘에 따라 기능한다. 많은 DNA 트랜스포존은 트랜스포사제가 트랜스포존 측부에 위치하는 말단 역위 반복("TIR", terminal inverted repeat)에 결합하고, 트랜스포존을 공여자 영역으로부터 절단하고, 이를 게놈의 표적 영역 내로 삽입하는 "절단 및 붙여넣기" 메커니즘을 나타낸다. "헬리트론(helitron)"으로 지칭되는 다른 것들은 단일-가닥 DNA 중간체를 포함하고 HUH 엔도뉴클레아제 기능 및 5'에서 3'로의 헬리카제 활성을 갖는 것으로 이해되는 문서화되지 않은 단백질에 의해 매개되는 "롤링 서클" 메커니즘을 나타낸다. 먼저, DNA의 원형 가닥을 닉킹하여 2개의 단일 DNA 가닥을 생성한다. 단백질은 닉킹된 가닥의 5' 인산염에 부착된 상태로 유지되어, 상보성 가닥의 3' 히드록실 말단을 노출시켜 중합효소가 닉킹되지 않은 가닥을 복제할 수 있게 한다. 복제가 완료되면, 새로운 가닥은 분리되고 원래 주형 가닥과 함께 자체적으로 복제된다. 또 다른 DNA 트랜스포존인 "폴린톤(Polinton)"은 "자가 합성" 메커니즘을 거치도록 이론화된다. 전위는 라켓형 구조를 형성하는 단일-가닥 염색체외 폴린톤 요소의 인테그라아제의 절제에 의해 개시된다. 폴린톤은 DNA 중합효소 B로 복제되고, 이중 가닥 폴린톤은 인테그라아제에 의해 게놈 내에 삽입된다. 또한, IS200/IS605 계열의 것들과 같은 일부 DNA 트랜스포존은, TnpA가 공여자 유전자의 후행 가닥 주형으로부터 단일 가닥 DNA 조각(원형 "트랜스포존 조인트"로서)을 절제하고 이를 표적 유전자의 복제 포크 내로 재삽입하는 "박리 및 붙여넣기" 메커니즘을 통해 진행된다.
전위 가능 요소는 생물학적 도구로서 일부 용도를 발견하였지만, 문서화된 전위 가능 요소는 가능한 생물다양성 및 표적성의 전체 범위를 포함하지 않으며, 모든 가능한 활성을 나타내지 않을 수 있다. 여기에서, 수천 개의 게놈 단편을 전위 가능한 요소에 대한 다수의 메타게놈으로부터 채굴하였다. 전위 가능한 요소의 문서화된 다양성이 확장되었을 수 있고, 신규 시스템이 고도로 표적화되고, 콤팩트하고, 정확한 유전자 편집제로 개발되었을 수 있다.
MG 효소
일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이들 후보는 하나 이상의 신규한 하위 유형을 나타낼 수 있고, 일부 하위 패밀리가 식별되었을 수 있다. 이들 레트로트랜스포사제는 약 1,400개 미만의 아미노산 길이이다. 이들 레트로트랜스포사제는 전달을 단순화할 수 있고 치료 적용을 연장할 수 있다.
일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이러한 레트로트랜스포사제는 본원에 기술된 바와 같은 MG140일 수 있다(도 1 및 도 2 참조).
일 측면에서, 본 개시내용은 메타게놈 시퀀싱을 통해 발견된 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 메타게놈 시퀀싱은 샘플에 대해 수행된다. 일부 실시예에서, 샘플은 다양한 환경으로부터 수집될 수 있다. 이러한 환경은 인간 마이크로바이옴, 동물 마이크로바이옴, 고온을 갖는 환경, 저온을 갖는 환경일 수 있다. 이러한 환경은 침전물을 포함할 수 있다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 레트로트랜스포사제는 3' 미번역 영역(UTR)에 결합하도록 구성될 수 있다. 레트로트랜스포사제는 5' 미번역 영역(UTR)에 결합할 수 있다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
본 개시내용에 따라 레트로트랜스포사제와 함께 사용될 수 있는 NLS 서열의 예
소스 NLS 아미노산 서열 서열번호
SV40 PKKKRKV 896
뉴클레오플라스민 이분 NLS KRPAATKKAGQAKKKK 897
c-myc NLS PAAKRVKLD 898
c-myc NLS RQRRNELKRSP 899
hRNPA1 M9 NLS NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY 900
임포르틴-알파 IBB 도메인 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV 901
Myoma T 단백질 VSRKRPRP 902
Myoma T 단백질 PPKKARED 903
p53 PQPKKKPL 904
마우스 c-abl IV SALIKKKKKMAP 905
인플루엔자 바이러스 NS1 DRLRR 906
인플루엔자 바이러스 NS1 PKQKKRK 907
간염 바이러스 델타 항원 RKLKKKIKKL 908
마우스 Mx1 단백질 REKKKFLKRR 909
인간 폴리(ADP-리보오스) 중합효소 KRKGDEVDGVDEVAKKKSKK 910
스테로이드 호르몬 수용체(인간) 글루코코르티코이드 RKCLQAGMNLEARKTKK 911
일부 실시예에서, 서열은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
일 측면에서, 본 개시내용은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일 측면에서, 본 개시내용은 조작된 핵산 서열을 포함하는 핵산을 제공한다. 일부 실시예에서, 조작된 핵산 서열은 유기체에서의 발현에 최적화된다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 유기체는 미배양 유기체가 아니다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
일부 실시예에서, 유기체는 원핵생물이다. 일부 실시예에서, 유기체는 박테리아이다. 일부 실시예에서, 유기체는 진핵생물이다. 일부 실시예에서, 유기체는 진균류이다. 일부 실시예에서, 유기체는 식물이다. 일부 실시예에서, 유기체는 포유류이다. 일부 실시예에서, 유기체는 설치류이다. 일부 실시예에서, 유기체는 인간이다.
일 측면에서, 본 개시내용은 조작된 벡터를 제공한다. 일부 실시예에서, 조작된 벡터는 레트로트랜스포사제를 암호화하는 핵산 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다.
일부 실시예에서, 조작된 벡터는 본원에 기술된 핵산을 포함한다. 일부 실시예에서, 본원에 기술된 핵산은 본원에 기술된 데옥시리보핵산 폴리뉴클레오티드이다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.
일 측면에서, 본 개시내용은 본원에 기술된 벡터를 포함하는 세포를 제공한다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 제조하는 방법을 제공한다. 일부 실시예에서, 방법은 세포를 배양하는 단계를 포함한다.
일 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 절단, 마킹, 또는 변형시키는 방법을 제공한다. 방법은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 레트로트랜스포사제와 접촉시키는 단계를 포함할 수 있다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 일부 실시예에서, 복합체는 해당 복합체가 표적 핵산 유전자좌에 결합할 때, 해당 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다.
일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시예에서, 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.
일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 핵산 또는 본원에 기술된 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 프로모터를 포함한다. 일부 실시예에서, 레트로트랜스포사제를 암호화하는 개방 해독 프레임은 프로모터에 작동 가능하게 연결된다.
일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 RNA를 암호화하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함한다.
일부 실시예에서, 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.
일 측면에서, 본 개시내용은 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나, E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다.
일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다.
일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다.
일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.
일 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
일 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공한다. 일부 실시예에서, 방법은 레트로트랜스포사제를 포함하는 조성물을 세포에 접촉시키는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.
본 개시내용의 시스템은, 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 응용에 사용될 수 있다. 이러한 시스템은, 예를 들어 대상체에서 질환을 유발할 수 있는 유전적으로 물려받은 돌연변이를 처리(예를 들어 제거 또는 치환)하는 데 사용될 수 있고, 세포에서 유전자의 기능을 확실하게 하기 위해 유전자를 불활성화시키는 데 사용될 수 있고, (예를 들어, 역-전사된 바이러스 RNA를 절단하거나 질환-유발 돌연변이를 암호화하는 증폭된 DNA 서열을 절단함으로써) 질환을 유발하는 유전적 요소를 검출하기 위한 진단 도구로서 사용될 수 있고, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내 박테리아를 암호화하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 비활성화된 효소로서 사용될 수 있고, 바이러스 게놈을 표적화함으로써 바이러스를 불활성화시키거나 바이러스가 숙주 세포를 감염시킬 수 없게 하는 데 사용될 수 있고, 유전자를 추가하거나 대사 경로를 변경하여 유기체가 귀중한 소분자, 거대분자, 또는 이차 대사물을 생산하도록 이를 조작하는 데 사용될 수 있고, 진화적 선택을 위한 유전자 구동 요소를 확립하는 데 사용될 수 있고, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 섭동을 검출하는 데 사용될 수 있다.
IUPAC 규칙에 따라, 다음의 약어가 예 전체에 걸쳐 사용된다:
A = 아데닌
C = 시토신
G = 구아닌
T = 티민
R = 아데닌 또는 구아닌
Y = 시토신 또는 티민
S = 구아닌 또는 시토신
W = 아데닌 또는 티민
K = 구아닌 또는 티민
M = 아데닌 또는 시토신
B = C, G, 또는 T
D = A, G, 또는 T
H = A, C, 또는 T
V = A, C, 또는 G
예 1 - 신규 단백질에 대한 메타게놈 분석 방법
퇴적물, 토양 및 동물로부터 메타게놈 샘플을 수집하였다. 데옥시리보핵산(DNA)을 Zymobiomics DNA 미니-분취 키트로 추출하고 Illumina HiSeq® 2500 상에서 시퀀싱하였다. 재산 소유자의 동의 하에 샘플을 수집하였다. 공개 소스로부터의 추가 원시 서열 데이터는 동물 미생물, 퇴전물, 토양, 온천, 열 벤트, 해양, 피트 보그, 퍼마프로스트, 및 하수 서열을 포함하였다. 신규한 레트로트랜스포사제를 식별하기 위해 문서화된 레트로트랜스포사제 단백질 서열에 기초하여 생성된 Hidden Markov Models을 사용하여 메타게놈 서열 데이터를 검색하였다. 검색에 의해 식별된 신규한 레트로트랜스포사제 문서화된 단백질과 정렬시켜 잠재적 활성 부위를 식별하였다. 이러한 메타게놈 워크플로우는 본원에 기술된 MG140 계열을 묘사한다.
예 2 - MG140 계열의 레트로트랜스포사제의 발견
예 1의 메타게놈 분석의 데이터를 분석한 결과, 1 계열(MG140)을 포함하는 기술되지 않은 추정 레트로트랜스포사제 시스템의 새로운 클러스터가 밝혀졌다. 이들 신규한 효소 및 이들의 예시적인 서브도메인에 대한 상응하는 단백질 서열은 서열번호 1-29, 393-401, 및 799-894로 제시된다.
예 3 - 역전사된 DNA의 시험관 내 활성의 통합(예시)
인테그라아제 활성은 대장균 용해물-기반 발현 시스템(예를 들어, myTXTL, Arbor Biosciences)에서의 발현을 통해 수행될 수 있다. 시험관 내 시험에 사용되는 성분은 3개의 플라스미드이다: T7 프로모터 하에 레트로트랜스포존 유전자를 갖는 발현 플라스미드, 표적 플라스미드, 및 선별 마커 유전자(예를 들어, Tet 내성 유전자) 주위에 레트로트랜스포사제에 의해 인식되는 5' 및 3' UTR 서열을 함유하는 공여자 플라스미드. 용해물-기반 발현 산물, 표적 DNA, 및 공여자 플라스미드를 인큐베이션하여 전위가 발생할 수 있게 한다. PCR을 통해 전위를 검출한다. 또한, 전위 산물을 T5로 태그하고 NGS를 통해 시퀀싱하여 전위 이벤트의 집단 상의 삽입 부위를 결정한다. 대안적으로, 시험관 내 전위 산물을 항생제(예를 들어, Tet) 선별 하에 대장균 내로 형질시킬 수 있으며, 여기서 선별 마커가 플라스미드 내에 안정적으로 삽입될 때 성장이 발생한다. 단일 콜로니 또는 E. coli 집단 중 어느 하나를 시퀀싱하여 삽입 부위를 결정할 수 있다.
통합 효율성을 통합된 카고가 있는 표적 DNA의 실험 출력의 ddPCR 또는 qPCR을 통해 측정할 수 있으며, ddPCR을 통해 측정된 변형되지 않은 표적 DNA의 양으로 정규화한다.
이러한 검정은 또한 용해물-기반 발현보다는 정제된 단백질 성분으로 수행될 수 있다. 이 경우, 단백질은 T7 유도성 프로모터 하에 E. coli 프로테아제-결핍 B 균주에서 발현되고, 세포는 초음파처리를 사용하여 용해되고, His-태그된 관심 단백질은 AKTA Avant FPLC(GE Lifescience) 상의 HisTrap FF(GE Lifescience) Ni-NTA 친화도 크로마토그래피를 사용하여 정제된다. 순도는 SDS-PAGE 및 InstantBlue Ultrafast(Sigma-Aldrich) 쿠마시 염색 아크릴아미드 겔(Bio-Rad) 상에서 분해된 단백질 밴드의 ImageLab 소프트웨어(Bio-Rad)에서의 밀도계를 사용하여 결정된다. 단백질은 50 mM 트리스-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5(또는 최대 안정성을 위해 결정된 다른 완충액)로 구성된 보관 완충액에서 탈염되고 -80°C에서 보관된다. 정제 후, 트랜스포존 유전자를 반응 완충액, 예를 들어 15 mM MgOAc2가 보충된 26 mM HEPES pH 7.5, 4.2 mM TRIS pH 8, 50 μg/mL BSA, 2 mM ATP, 2.1 mM DTT, 0.05 mM EDTA, 0.2 mM MgCl2, 30-200 mM NaCl, 21 mM KCl, 1.35% 글리세롤, (pH 7.5 측정)에서 전술한 바와 같이 표적 DNA 및 공여자 플라스미드에 첨가한다.
예 4 - 겔 시프트를 통한 레트로트랜스포존 말단 검증(예시)
레트로트랜스포존 말단을 전기영동 이동성 시프트 분석(EMSA, electrophoretic mobility shift assay)을 통해 레트로트랜스포사제 결합에 대해 시험한다. 이 경우, 표적 DNA 단편(100-500 bp)을 FAM-표지된 프라이머를 사용하는 PCR을 통해 FAM으로 말단-표지한다. 3' UTR RNA 및 5' UTR RNA를 T7 RNA 중합효소를 사용하여 시험관 내에서 생성하고 정제한다. 레트로트랜스포사제 단백질을 시험관 내 전사/번역 시스템(예를 들어, PURExpress)에서 합성한다. 합성 후, 결합 완충액(예를 들어 20 mM HEPES pH 7.5, 2.5 mM Tris pH 7.5, 10 mM NaCl, 0.0625 mM EDTA, 5 mM TCEP, 0.005% BSA, 1 μg/mL 폴리(dI-dC), 및 5% 글리세롤) 중 10 μL 반응에서 1 μL의 단백질을 50 nM의 표지된 DNA 및 100 ng의 3' 또는 5' UTR RNA에 첨가한다. 결합을 30°에서 40분 동안 인큐베이션한 다음, 2 μL의 6X 로딩 완충액(60 mM KCl, 10 mM Tris pH 7.6, 50% 글리세롤)을 첨가한다. 결합 반응을 5% TBE 겔 상에서 분리하고 시각화한다. 레트로트랜스포사제 단백질 및 표적 DNA의 존재 하의 3' 또는 5' UTR의 시프트는 성공적인 결합에 기인할 수 있고, 레트로트랜스포사제 활성을 나타낸다. 이러한 검정은 또한 E. coli 추출물 또는 정제된 단백질을 사용할 뿐만 아니라, 레트로트랜스포사제 절단 또는 돌연변이로 수행할 수 있다.
예 5 - 표적 DNA 검증의 절단(예시)
레트로트랜스포사제가 표적 DNA의 절단에 관여함을 확인하기 위해, 짧은(약 140 bp) DNA 단편을 FAM-표지된 프라이머를 사용하는 PCR을 통해 양 말단에서 FAM으로 표지한다. 시험관 내 전사/번역 레트로트랜스포사제 산물을 1 μg의 Rnase A(음성 대조군), 또는 3' UTR, 5' UTR 또는 비-특이적 RNA 단편(대조군)과 함께 사전 인큐베이션한 다음, 표지된 표적 DNA와 함께 37℃에서 인큐베이션한다. 그런 다음, DNA를 변성 겔 상에서 분석한다. DNA의 하나 또는 양쪽 가닥의 절단은 겔 상에서 상이한 속도로 이동하는 다양한 크기의 표지된 단편을 초래할 수 있다.
예 6 - E. coli 에서의 인테그라아제 활성(예시)
조작된 E. coli 균주를 레트로트랜스포존 유전자를 발현하는 플라스미드 및 통합에 관여하는 레트로트랜스포존의 5' 및 3' UTR이 측면에 위치한 선별 마커를 갖는 온도-민감성 복제 기점을 함유하는 플라스미드로 형질전환한다. 그런 다음, 이들 유전자의 발현을 위해 유도된 형질전환체를 플라스미드 복제를 위한 제한 온도에서의 선별에 의해 게놈 표적으로의 마커의 전달에 대해 스크리닝하고, 게놈 내의 마커 통합을 PCR에 의해 확인한다.
통합을 편향되지 않은 접근법을 사용하여 스크리닝한다. 간단하게, 정제된 gDNA는 Tn5로 태그하고, 그런 다음 관심 DNA는 Tn5 태그 부착 및 선별 마커에 특이적인 프라이머를 사용하여 PCR 증폭한다. 그런 다음, 앰플리콘을 NGS 시퀀싱을 위해 준비한다. 생성된 서열의 분석을 트랜스포존 서열로 트리밍하고, 측면 서열을 게놈에 맵핑하여 삽입 위치를 결정하고, 삽입 비율을 결정한다.
예 7 - 역 전사된 DNA를 포유류 게놈에 통합(예시)
포유류 세포에서 표적화 및 절단 활성을 나타내기 위해, 인테그라아제 단백질을 단백질 서열의 N, C 또는 양쪽 말단에서 2개의 NLS 펩티드를 갖는 E. coli 또는 sf9 세포에서 정제한다. 이 절차에서, 전위에 관여하고 CMV 프로모터의 조절 하에 있는 5' 및 3' UTR 영역이 측면에 위치한 선별 가능한 네오마이신 내성 마커(NeoR) 또는 형광 마커를 함유하는 플라스미드를 합성한다. 세포를 플라스미드로 형질감염시키고, RNA 전사를 위해 4 내지 6시간 동안 회수한 다음, 정제된 인테그라아제 단백질로 전기천공한다. 게놈 내로의 항생제 내성 통합을 G418-내성 콜로니 계수(형질감염 후 7일차에 시작하도록 선별함)에 의해 정량화하고, 형광 마커에 의한 양성 전위를 형광 활성화 세포 세포 계측법에 의해 분석한다. 제2 형질감염 후 7 내지 10일차에, 게놈 DNA를 추출하여 NGS 라이브러리의 제조에 사용한다. 표적 외 빈도를, 게놈을 단편화하고 트랜스포존 마커의 앰플리콘을 제조하고 NGS 라이브러리 제조를 위한 측부 DNA에 의해 분석한다. 각각의 표적화 시스템의 활성을 시험하기 위해 적어도 40개의 상이한 표적 부위를 선택한다.
또한 포유류 세포에서의 통합을 RNA 전달을 통해 평가할 수 있다. 2개의 NLS를 갖는 레트로트랜스포사제를 암호화하는 RNA를 설계하고, 캡 및 폴리A 꼬리를 첨가한다. 제2 RNA를 선별 가능한 네오마이신 내성 마커(NeoR) 또는 5' 및 3' UTR 영역이 측면에 위치한 형광 마커를 함유하도록 설계한다. RNA 작제물을 Lipofectamine™ RNAiMAX 또는 TransIT®-mRNA 형질감염 시약을 통해 포유류 세포 내로 도입한다. 형질감염 후 10일차에, 게놈 DNA를 추출하여 ddPCR 및 NGS를 사용하여 전위 효율을 측정한다.
예 8 - RT의 생물정보학적 발견
미생물, 바이러스 및 진핵생물 게놈의 광범위한 조립-구동 메타게놈 데이터베이스를 채굴하여 역전사 효소 기능을 갖는 예측된 단백질을 검색하였다. Pfam 도메인 PF00078 및 PF07727에 대한 히트를 갖는 것에 기초하여 450만 개가 넘는 RT 단백질을 예측하였는데, 이 중 340만 개가 유의한 e-값(< 1 x 10-5)을 가졌다. RT(역전사 효소) 도메인 커버리지가 ≥ 70%이고 예측된 촉매 잔기([F/Y]XDD)를 갖는 완전한 ORF에 대해 필터링한 후, 추가 분석을 위해 거의 50만 개의 단백질을 보유하였다. RT 도메인을 이러한 단백질 세트뿐만 아니라, 공개 데이터베이스로부터 검색된 기준 서열로부터 추출하였다. 도메인 서열을 Mmseqs2 이지-클러스터를 사용해 80% 커버리지에 걸쳐 50% 동일성으로 클러스터링하였으며(Bioinformatics 2016 May 1;32(9):1323-30 참조, 이는 그 전체가 참조로서 본원에 통합됨), 대표적인 서열(총 26,824개)을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬하였고(Bioinformatics 2016; 32: 3246-3251 참조, 이는 그 전체가 참조로서 본원에 통합됨), 도메인 정렬은 FastTree2를 사용하여 계통발생 트리를 추론하는 데 사용하였다(Plos One 2010; 5: e9490 참조, 이는 그 전체가 참조로서 본원에 통합됨). RT 도메인의 계통발생 분석은 서열 다양성이 높은 많은 상이한 부류의 RT가 회수되었음을 시사한다(도 4).
예 9 - 비-LTR 레트로트랜스포존(MG140, MG146, MG147, MG148, 및 MG149 패밀리)의 예
레트로트랜스포존 생물정보학 분석
비 긴 말단 반복(비-LTR) 레트로트랜스포사제는 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. 비-LTR 레트로트랜스포사제를 도 4의 계통발생 트리의 R2/R4 및 LINE 계통군 내에서 식별하였다. R2, R4, 및 LINE으로 분류된 RT 도메인을 함유하는 전장 단백질을 99% 서열 동일성으로 클러스터링하고, 대표적인 서열을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시켰다. 이러한 정렬로부터 계통발생 트리를 추론하고, R2/R4 레트로트랜스포사제 계열뿐만 아니라 다른 RT-관련 계열을 기술하였다(도 5a).
R2는 표적-프라이밍된 역전사(TPRT)를 통해 카고를 통합하는 비-LTR 레트로트랜스포존이다. MG140 계열의 많은 R2 효소는 RT 도메인뿐만 아니라, Zn-핑거를 기술하는 엔도뉴클레아제 도메인 및 다수의 Zn-결합 리본 모티프를 함유한다(도 5b 6a). 일부 R2 레트로트랜스포존은, 28S rDNA 유전자의 단편이 측면에 위치한 MG140-47(서열번호 395) R2 레트로트랜스포존의 경계에 의해 도시된 바와 같이, 28S rDNA에 통합된다(도 6b). 다른 레트로트랜스포존은 18S rRNA 유전자에 통합되고, 트랜스포존의 3' 말단을 정의하는 폴리A 또는 폴리T 꼬리를 함유한다(도 7). 정확한 표적 결합 부위뿐만 아니라 5'-UTR, 3'-UTR, 및 폴리-T가 정확하고 특이적인 통합에 관여하는 것이 가능하다.
Archaeal 게놈으로부터 유래된 레트로트랜스포존 MG146-1(서열번호 402)은 RT 도메인, Zn-결합 리본 모티프, 및 엔도뉴클레아제 도메인을 함유하고, 효소 내의 도메인 구조는 다른 단일 ORF 비-LTR 레트로트랜스포존의 도메인 구조와 상이하다(도 8a).
MG147 계열 구성원 MG140-17-R2(서열번호 18) 레트로트랜스포존은 5' 및 3' UTR이 측면에 위치한 3개의 ORF로 조직된다(도 8b). RNA 인식 모티프(RRM) 유전자는 RNA 주형의 인식에 관여할 가능성이 있는 반면, 엔도뉴클레아제 유전자는 표적 부위의 인식 및 닉킹에 관여할 가능성이 있다. ORF 3개는 주형의 역전사를 담당하는 효소이며 RT 도메인, Zn-결합 리본 모티프, 및 RNAse-H 도메인을 함유한다.
계열 MG148은 모든 예상 촉매 잔기의 존재에 의해 활성일 것으로 예측되는, 초 발산 RT 상동체를 포함한다. 여러 계열 구성원에 대한 뉴클레오티드 수준에서의 정렬은 5' UTR 내에서 보존된 영역을 커버하지 않았으며, 이는 RT 기능, 활성 또는 동원에 관련될 수 있다(도 9b).
qPCR에 의한 레트로트랜스포존 RT(역전사 효소)의 시험관 내 활성 시험
레트로트랜스포존 RT의 시험관 내 활성을 40 mM Tris-HCl(pH 7.5), 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서 무세포 발현 시스템(PURExpress, NEB)에서 유래된 RT 효소와 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(200nt)을 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 전장 cDNA 산물을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽함으로써 qPCR에 의해 정량화하였다.
MG140-3(서열번호 3), MG140-6(서열번호 6), MG140-7(서열번호 7), MG140-8(서열번호 8), MG140-13(서열번호 14), 및 MG146-1(서열번호 402) 을 프라이머 연장을 통해 활성이다(도 10 및 도 11). MG140-3 및 MG146-1에 대해 충실도의 예비 평가를 수행하여, 상대 오차율이 MMLV보다 각각 1.5배 및 1.35배 더 높았다(도 12). 충실도 측정을 위해, 전술한 프라이머 연장 검정에서 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다.
통합 부위
일부 비-LTR 레트로트랜스포존(예를 들어 MG140-1과 같은 MG140 계열)은 제2(G) 위치와 제3(T) 위치 사이의 삽입 부위를 갖는 특이적 GGTGAC 모티프를 표적화함으로써 28S rDNA 유전자에 통합될 것으로 예측된다. 이러한 레트로트랜스포존 단백질의 N-말단은 3개의 아연(Zn) 핑거(CCHH 유형 중 2개 및 CCHC 유형 중 하나)를 함유하고, 이어서 YADD 활성 부위를 갖는 역전사 효소(RT) 도메인을 함유한다. 이러한 레트로트랜스포존 단백질의 C-말단은 추가 CCHC Zn-핑거를 갖는 엔도뉴클레아제 도메인을 포함한다. 단백질은 각각 289 및 478 bp 길이의 5' 및 3' UTR이 측면에 위치한다(도 31).
예 10 - II족 인트론 RT(MG153, MG163, MG164, MG165, MG166, MG167, MG168, MG169, 및 MG170 계열)
II족 생물정보학 분석
II족 인트론은 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. II족 인트론으로부터의 RT 도메인을 식별하고 도 4의 계통발생 트리에 기술하였다. RT 효소의 측면에 > 2 kb의 서열을 갖는 콘티그로부터의 RT 도메인을 함유하는 10,000개가 넘는 고유한 전장 II족 인트론 단백질을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬하였다. 이러한 정렬로부터 계통발생 트리를 추론하고, II족 인트론 계열을 추가로 식별하였다(도 13). II족 인트론 효소를 클래스 A-G, ML, 및 CL로 분류할 수 있고, 이들의 도메인 구조는 활성인 것으로 예측된 RT 도메인뿐만 아니라 인트론 동원에 관여하는 성숙효소 도메인을 포함한다. 일부 II족 인트론 단백질은 표적 인식 및 절단에 관여할 가능성이 있는 추가 엔도뉴클레아제 도메인을 함유한다. 식별된 모든 계열의 많은 후보를 실험실 특성화를 위해 지명하였다.
II족 인트론 RT 클래스 C, D, 및 F의 시험관 내 활성을 시험
GII 인트론 클래스 C(MG153), 클래스 D(MG165), 및 클래스 F(MG167) RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였으며 이는 N-말단 단일 Strep 태그를 함유하였다. RT의 발현을 SDS-PAGE 분석에 의해 확인하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.
변성 겔 상의 cDNA 산물의 검출에 의해, 다음의 GII 인트론 클래스 C 후보는 이러한 실험 조건 하에서 활성이었다: MG153-1 내지 MG153-6(서열번호 555-560), MG153-9(서열번호 563), MG153-10(서열번호 564), MG153-12(서열번호 566), MG153-13(서열번호 567), MG153-15(서열번호 569), MG153-18(서열번호 572), MG153-20(서열번호 574), MG153-29 내지 MG153-31(서열번호 580-582), MG153-33 내지 MG153-37(서열번호 584-588), MG153-41(서열번호 592), MG153-42(서열번호 593), MG153-45(서열번호 596), MG153-51(서열번호 602), MG153-53(서열번호 604), MG153-54(서열번호 605), 및 MG153-57(서열번호 608). (도 14 15). 활성의 신규한 후보는 더 작은 cDNA 드롭오프 산물의 존재에 의해 나타나는, 고도로 가공성인 대조군 GII 클래스 C RT GsI-IIC 및 MarathonRT에 비해 다양한 정도의 겉보기 가공성을 나타낸다. qPCR에 의해, 다음의 추가 후보도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨): MG153-7(서열번호 561), MG153-8(서열번호 562), MG153-10(서열번호 564), MG153-11(서열번호 565), MG153-14(서열번호 568), MG153-17(서열번호 571), MG153-19(서열번호 573), MG153-25 내지 MG153-28(서열번호 576-579), MG153-32(서열번호 583), MG153-39(서열번호 590), MG153-40(서열번호 591), MG153-43(서열번호 594), MG153-47(서열번호 598), MG153-50(서열번호 601), MG153-55(서열번호 606) 및 MG153-56(서열번호 607)(도 14d 15d).
변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 D 후보 MG165-1(서열번호 684) 및 MG165-5(서열번호 688)는 이들 실험 조건 하에서 활성이다(도 16a). qPCR에 의해, 추가 후보 MG165-4(서열번호 687), MG165-6(서열번호 689), 및 MG165-8(서열번호 691)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 16b).
변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 F 후보 MG167-1(서열번호 698) 및 MG167-4(서열번호 701)는 이들 실험 조건 하에서 활성이다(도 17a). qPCR에 의해, 추가 후보 MG167-3(서열번호 700) 및 MG167-5(서열번호 702)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 17b).
GII 인트론 RT의 상대 충실도 평가
GII 클래스 C MG153 후보의 상대 충실도를 평가하기 위해, 전술한 프라이머 연장 검정에서 생성된 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 짝을 지은 판독물을 완벽한 중첩을 요구하고 중첩되지 않는 모든 부분을 트리밍하는 bbmerge.sh 사용하여 병합하였다(Plos One 2017; 12: e0185056). 그런 다음, 병합된 판독물을 BWA-MEM(Li H. 2013)을 사용하여 기준 주형에 정렬시키고, 파삼스타트(https://github.com/alimanfoo/pysamstats)를 사용하여 기준 대비 각 위치에서 불일치의 수를 계산하였다. 시험된 GII 클래스 C 후보 중에서, MG153-6(서열번호 560) 및 MG153-12(서열번호 566)는 MMLV 대조군 RT 및 다른 GII 인트론 클래스 C RT에 비해 재현 가능한 정도로 더 높은 오차율을 갖는다(도 18).
인간 세포 cDNA 합성 결과
포유류 환경에서 cDNA를 생산하는 이들 효소의 능력을 포유류 세포에서 발현시키고 PCR에 의한 cDNA 합성을 검출한 다음, 아가로오스 전기영동 및 D1000 TapeStation에 의해 시험하였다. 역전사 효소를 플래그-HA 태그(FH)에 더하여, N 말단에서 MS2 외피 단백질(MCP)을 갖는 융합 단백질로서 CMV 프로모터 하에서 포유류 발현을 위한 플라스미드에 클로닝하였다. MCP는 MS2 박테리오파지로부터 유래된 단백질로서, 높은 친화도(나노몰 미만 Kd)로 20개의 뉴클레오티드 RNA 줄기 루프를 인식한다. RT를 MCP와 융합하고 RNA 주형에 MS2 루프를 가짐으로써, RT가 번역되면, RNA 주형을 찾아 RNA 주형에 혼성화된 DNA 프라이머로부터 cDNA 합성을 시작하는 것이 보장된다.
CMV 프로모터 하에 RT 후보물질에 융합된 MCP를 함유하는 플라스미드를 클로닝하고 HEK293T 세포에서 형질감염을 위해 단리하였다. 형질감염은 리포펙타민 2000을 사용하여 수행하였다. 제조자 지침에 따라 mMESSAGE mMACHINE(Thermo Fisher)을 사용하여 mRNA 암호화 나노루시퍼라제(서열번호 33)를 제조하였다. mRNA 제제에 남아 있는 임의의 DNA 주형을 분해하기 위해, 반응물을 1시간 동안 Turbo Dnase(Thermo Fisher)로 처리하고, MEGAclear Transcription Clean-Up 키트(Thermo Fisher)를 사용하여 mRNA를 세정하였다. mRNA를 10mM Tris pH 7.5, 50mM NaCl 중 상보성 DNA 프라이머(서열번호 34)에 95℃에서 2분 동안 혼성화시키고, 0.1℃/s의 속도로 4℃로 냉각시켰다. MCP-RT 융합을 함유하는 플라스미드가 형질감염된 후 6시간차에, mRNA/DNA 혼성체를 Lipofectamine Messenger Max를 사용하여 HEK293T 세포 내로 형질감염시켰다. mRNA/DNA 형질감염 후 18시간차에, QuickExtra DNA 추출 용액(Lucigen)을 사용하여 세포를 용해시키고, 24 웰 플레이트에서 24 웰 당 100 μL의 빠른 추출물을 첨가하였다. 나노루시페라제는 약 500 bp 길이이고, 새롭게 합성된 cDNA로부터 100 bp 및 542 bp의 산물을 증폭하기 위한 프라이머를 설계하였다(서열번호 38 및 39). cDNA를 전술한 프라이머 세트를 사용하여 증폭시키고, PCR 산물을 아가로오스 겔 전기영동(도 19a) 또는 DNA Tape Station(도 19b)에 의해 검출하였다.
100bp 및 500bp DNA 산물의 존재에 의해 도시된 바와 같이, 대조군 GII 인트론 RT Marathon, Marathon PE2, 및 TGIRT에 대한 활성을 검출하였다(도 19a 19b). 또한, 신규한 GII 인트론 유래 RT MG153-1 내지 MG153-4(서열번호 555-558), MG153-7 내지 MG153-13(서열번호 561-567), MG153-15(서열번호 569), MG153-16(서열번호 570) 및 MG153-21(서열번호 575)에 대한 활성도 도시하였다(도 19a, 19b, 19c). 신규 RT에 대한 PCR 산물의 신호는 Marathon 및 TGIRT의 신호와 유사하였다. 전체적으로, 이는 새롭게 발견된 RT가 발현되고, 적절하게 접히고, 살아있는 포유류 세포 내에서 활성이어서, 이들의 생명공학적 적용을 위한 옵션을 개방한다는 것을 보여준다.
II족 인트론 RT는 변형된 프라이머를 사용하여 cDNA를 합성할 수 있다
RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 프라이머 내의 다양한 위치에서 포스포로티오에이트(PS) 결합 변형을 함유하는 5'-FAM 표지된 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 프라이머 1(서열번호 736, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTTGTCTG을 함유함)은 올리고의 5' 말단에 5개의 PS 결합을 함유한다. 프라이머 2(서열번호 737, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*T*G를 포함함, 여기서 *는 포스포로티오에이트 결합을 나타냄)는 올리고의 5' 및 3 말단 모두에서 5개의 PS 결합을 함유한다. 프라이머 3(서열번호 738, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*TG를 함유함, 여기서 *는 포스포로티오에이트 결합을 나타냄)은 표준 결합이 2개의 최대 3' 말단 뉴클레오티드 사이에서 치환된다는 점에서 프라이머 2와 상이하다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 대조군 RT MMLV(바이러스) 및 TGIRT-III(GII 인트론)은 모두 모든 변형된 프라이머로 프라이머 연장을 수행할 수 있다(도 32). GII 인트론 RT MG153-9는 또한 시험된 모든 PS-변형된 DNA 프라이머로부터 연장될 수 있다(도 33).
인간 세포 RT 발현 및 cDNA 합성 결과
포유류 세포 환경에서 cDNA를 합성하는 신규한 GII RT의 능력을 실질적이지 않은 변형으로 전술한 바와 같이 시험하였다. PCR을 사용하여 cDNA 합성을 검출하고 아가로오스 겔 전기영동 또는 TapeStation에 의해 분석하였다. 정량적 판독을 갖기 위해, 서열번호 739로 열거된 Taqman 프로브로 이미 문서화된 Taqman qPCR 프라이머를 사용하여 Taqman qPCR 검정을 개발하였다. MG153 계열의 모든 시험된 후보는 다양한 정도로 활성이 있었으며, 활성은 400배만큼 광범위하였다(도 34). 시험된 계열의 RT는 MG153-1 내지 MG153-13, MG153-15, MG153-16, MG153-18, MG153-20, MG153-21, MG153-29 내지 MG153-31, MG153-33 내지 MG153-37, MG153-45, MG153-51, MG153-53, MG153-54, MG153-57, MG165-1, MG165-5, MG167-1 및 MG167-4를 포함한다. 여러 RT(MG153-15, MG153-53, MG153-4, MG153-18, MG153-20, MG153-7 및 MG153-5)가 TGIRT 대조군을 능가하였다(도 34).
포유류 세포에서 GII RT의 단백질 발현 및 안정성을 이해하기 위해, 면역블롯을 수행하였다. 간략하게, 형질감염된 세포를 프로테아제 억제제(24 웰 포맷의 웰 당 80 μL)가 보충된 RIPA 용해 완충액(Thermo Fisher)으로 용해시켰다. 불용성 응집체를 제거하기 위해 용해물을 4℃에서 14,000 g로 10분 동안 원심분리하였다. BCA를 사용하여 단백질을 정량화하였다. 레인 당 3 또는 10 μg의 총 단백질을 4-12% 폴리아크릴아미드 SDS 겔(Thermo Fisher)에 로딩하였다. 모든 레인을 동일한 양의 단백질로 정규화하였다. 단백질을 iBlot 겔 전달 시스템(Invitrogen)을 사용하여 PVDF 막으로 옮겼다. HRP-기반 검출 방법을 사용하여 토끼 HA 항체(Cell Signaling)를 사용하여 단백질을 검출하였다. 결과는 밴드의 강도에 의해 주어진 바와 같이, 다양한 수준의 단백질 발현 또는 안정성을 시사한다(도 35). 우리는 각 단백질의 발현을 정량화하고 총 단백질 발현에 대해 cDNA 합성 활성을 정규화하였다: 7개의 MG153 RT가 TGIRT 대조군을 능가하였다(도 36). 주목할 만한 MG153-15는 이들 조건 하에서 TGIRT보다 10배 더 높은 cDNA 합성 활성을 나타낸다.
일부 GII 유래 RT는 양성 대조군, MarathonRT, 및 MG153-1 내지 MG153-4 및 MG153-9 중 하나를 포함하는 매우 안정적인 이량체를 형성한다(도 35). "CAQQ" 모티프는 Marathon RT에서 안정한 이량체화를 담당하는 것으로 문서화되었다(Nat Struct Mol Biol. 2016 Jun; 23(6): 558-565). 면역블롯 상에서 안정한 이량체 형성을 나타낸 RT(MG153-1 내지 MG153-4)는 또한 CAQQ 이량체화 아미노산 모티프를 함유한다(도 35c). 이량체화는 복잡성이 추가됨으로 인해 바람직하지 않은 특징일 수 있으므로, 이량체를 형성하지 않는 RT는 특정 생명공학 응용에 최적일 수 있다.
시험된 RT 후보에 대한 예상 분자 크기
RT 예상 단백질 크기(kDa)*
Marathon 67.8
TGIRT 67
MG153-1 74
MG153-2 74
MG153-3 74
MG153-4 67.6
MG153-7 71.7
MG153-8 67.6
MG153-9 72
MG153-10 72.2
MG153-11 70.9
MG153-12 72.5
MG153-13 67.9
MG153-15 68.6
MG153-16 71.7
MG153-21 70.6
*크기에는 Flag-HA-MCP 태그가 포함된다.
예 11 - G2L4 (MG172 계열)
G2L4는 도 4에 식별된, II족 인트론과 관련이 먼 RT-함유 서열(II족 인트론-유사 RT)이다. 600개가 넘는 신규한 전장 G2L4 효소를 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시키고, 계통발생 트리를 이러한 정렬로부터 추론하였다(도 20). MG172 계열 구성원은 RT 및 성숙효소 도메인을 함유하며, 보존된 Y[I/L]DD 활성 부위 모티프를 가질 것으로 예측되었다. 모티프 YIDD는 최근에 하나의 G2L4 기준(BioRxiv 10.1101/2022.03.14.484287)에서 더 짧은 DNA 프라이머로 증가된 효율을 나타내는 것으로 보고되었다. MG172 효소는 평균 길이가 425 aa이고 32% AAI를 공유하는데, 이는 이들 시스템의 신규성을 강조한다.
예 12 - LTR 레트로트랜스포존(MG151 계열)
LTR 레트로트랜스포존 생물정보학 분석
긴 말단 반복(LTR) 레트로트랜스포존은 RNA 주형의 역전사를 통해 표적 부위 내로 통합된다. 레트로바이러스 및 비-바이러스 트랜스포존을 포함하는, LTR 레트로트랜스포존의 MG151 계열을 도 4의 계통발생 트리에서 식별하였다. LTR RT 도메인을 함유하는 전장 단백질을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬시켰다. 계통발생 트리를 이러한 정렬로부터 추론하였다(도 21a). MG151 계열의 100개 초과의 비-바이러스 및 레트로바이러스 RT 효소는 RT 및 RnaseH 도메인을 함유하며, 촉매 잔기의 존재에 기초하여 활성일 것으로 예측된다. LTR RT 다단백질은 또한 HIV 및 MMLV LTR RT에 대해 관찰된 것과 유사한 구조에서 프로테아제 및 인테그라아제 도메인을 암호화한다(도 21a, 21b, 21c, 22). RT 및 gag 또는 엔벨로프와 같은 다른 유전자는 긴 불완전한 긴 말단 반복이 측면에 위치한다(도 21b). MG151 계열 구성원은 다양하고 신규하며, 30% 아미노산 동일성을 공유한다(도 22).
LTR 레트로트랜스포존의 다단백질은 프로테아제, RT 및 Rnase H, 및 인테그라아제 기능적 단위로 자연적으로 가공된다. 따라서, MG151 RT-RNAse H 기능적 단위 경계를 서열 및 구조적 정렬의 조합에 의해 결정하였다. MG151 다단백질에 대한 3D 구조를 Alphafold2(Nature 2021; 596: 583-589; 및 Nucleic Acids Res 2022; 50: D439-D444)를 사용하여 예측하고 PyMOL(https://github.com/schrodinger/pymol-open-source)로 시각화하였다. 예를 들어, MG151-82(서열번호 457)의 경우, 예측된 3D 구조는 비구조화 링커 영역에 의해 분리된 이산적 프로테아제, RT, RNAseH, 및 인테그라아제 도메인을 식별하였다(도 21c). 따라서, RT-RNAse H 기능적 단위는 비구조화 루프가 측면에 위치한 2개의 관련 구조적 도메인으로서 결정하였다. RT 및 RNAse H 도메인을 함유하는 트리밍된 변이체를 합성 및 실험실 특성화를 위해 지명하였다.
LTR 레트로트랜스포존 RT의 시험관 내 활성 시험
LTR 레트로트랜스포존 RT(MG151)의 시험관 내 활성을, 50 mM Tris-HCl pH 8, 75 mM KCl, 3 mM MgCl2, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서, 전술한 바와 같이 5'-FAM 표지된 프라이머에 어닐링된 RNA 주형 및 무세포 발현 시스템으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 cDNA 산물을 변성 폴리아크릴아미드 겔 상에서 분리하고 Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, MG151-80 내지 MG151-84(도 23a)뿐만 아니라 MG151-87 내지 MG151-90(서열번호 524-527), 및 MG151-92 내지 MG151-95(서열번호 529-532)(도 23b)는 시험관 내에서 cDNA를 합성할 수 있다.
대조군 LTR 레트로트랜스포존 RT인 Ty3에 대해 시험관 내 활성이 관찰되는 검정 조건을 결정하기 위해, 다음의 4개의 반응 완충액을 시험하였다: 완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP); 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl2, 1 mM TCEP, 2% PEG-8000); 완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl2, 1 mM TCEP, 0.01% (v/v) Triton X-100); 및 완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl2, 1 mM TCEP, 10% 글리세롤). 완충액 A 및 B에 대해 시험관 내 활성을 관찰하였다(도 23c).
구조 RNA 주형 상에서 프라이밍 파라미터 및 가공성 시험
구조화된 RNA 주형 상에서 이들 LTR RT의 역전사 효소 활성을 결정하기 위해, 길이 6, 8, 10, 13, 16 및 20 nt의 상이한 프라이머를 구조화된 RNA 스캐폴드 상에 어닐링하였다. 이들 어닐링된 RNA/DNA 하이브리드를 전체 활성에 사용된 것과 동등한 cDNA 생성 분석에 사용하였다. 도 24에 도시된 바와 같이, MMLV는 프라이머 결합 부위가 10 내지 20 nt인 구조화된 RNA 상에서 활성이고, 주형을 5' 말단까지 완전히 연장시켜 주형 내의 모든 구조를 개방한다. MG151-89(서열번호 526)는 13-20의 프라이머 길이로 활성이고, sgRNA 스캐폴드 헤어핀에 도달할 때까지 pegRNA의 길이를 대략 18 nt 연장할 수 있다. MG151-92(서열번호 529) 및 MG151-97(서열번호 534)은 검출 수준에서 이 주형 상에서 활성이 아니었다.
예 13 - 레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG160 계열)
레트론 생물정보학 분석
박테리아 레트론은 RT-코딩 유전자(ret) 및 역위 서열, msr 및 msd를 함유하는 인접 비코딩 RNA를 암호화하는 대략 2000 bp 길이의 DNA 요소이다. 레트론은 RT-DNA 합성을 위한 고유한 메커니즘을 사용하며, 여기서 ncRNA 주형은 2개의 역위 반복(a1/a2) 사이에서 절연된 보존된 이차 구조로 접힌다. 레트론 RT는 접힌 ncRNA를 인식하고, 역전사는 역위 반복에 인접한 보존된 구아노신 2'OH로부터 개시되어, 주형 RNA와 초기 cDNA 가닥 사이에 2'-5' 결합을 형성한다. 일부 레트론에서, 이러한 2'-5' 결합은 가공된 RT-DNA의 성숙한 형태로 지속되는 반면, 다른 것에서는 엑소뉴클레아제가 DNA 산물을 절단하여 유리된 5' 말단을 생성한다. 또한, RT는 RNA 주형과 동일한 레트론으로부터 유래된 msr-msd를 표적화하여, 표적 외 역전사를 피할 수 있는 특이성을 제공한다.
4031개가 넘는 RT 도메인 서열이 도 4의 계통발생 트리에서 레트론 RT로서 식별되었다. 촉매 잔기(xxDD)의 존재 및 레트론 RT(NaxxH 및 VTG)에 문서화된 보존된 모티프에 기초하여 추가 분석을 위해 2407개의 전장 레트론 단백질 서열의 하위 집합을 선택하였다(도 25 26). 계열 MG154-MG159 및 MG173의 레트론은 길이가 300 내지 650 aa인 구성원을 포함하고, 이들의 5' UTR은 역위 반복이 측면에 위치한 예측된 ncRNA(msr-msd) 트리밍을 함유한다(도 27).
또한, "레트론-유사" 단일-도메인 RT 서열의 다양한 군이 도 4의 레트론 계통군 내에서 식별되었다. MG160 계열의 단일-도메인 RT는 250 내지 300 aa의 범위이고, 예상 RT 촉매 잔기 [F/Y]XDD의 존재에 기초하여 활성일 것으로 예측된다. 공개 데이터베이스에서 레트론 RT 결정 및 동결-EM 구조가 결여되어 있지만, MG160-3(서열번호 629)의 3D 구조 예측은 II족 인트론 RT 도메인과 정렬되는 보존된 RT 도메인을 나타낸다(도 28a 28b). MG160 계열의 5' UTR은 계열 구성원 사이에서 보존되고 요소 활성 또는 이동화에 중요할 가능성이 있는 보존된 이차 구조로 접힌다(도 28c).
MG154, MG155, MG156, MG157, MG158, 및 MG159 계열의 레트론-유사 RT의 시험관 내 활성
일반 RNA 주형에 대한 레트론 RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 다음의 레트론 RT는 그들 자신의 ncRNA가 아닌 일반 RNA 주형 상에서 프라이머 연장을 수행할 수 있다: MG155-2(서열번호 612), MG155-3(서열번호 613), MG156-2(서열번호 617), MG157-5(서열번호 622), 및 MG159-1(서열번호 624).
MG160 계열의 레트론-유사 RT의 시험관 내 활성
레트론-유사 RT(MG160 계열)의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양은 문서화된 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.
겔 분석에 의해, MG160-1 내지 MG160-4(서열번호 627-630) 및 MG160-6(서열번호 633)은 활성이고 대조군 GII 인트론 클래스 C RT인 GsI-IIC와 비교하여 감소된 공정성을 가졌다(도 29). 가공성은 cDNA 산물의 유사한 드롭오프 패턴을 생성하는 레트로바이러스 대조군 RT인 MMLV의 것과 더 유사하게 보인다(도 29a). qPCR에 의해, MG160-1 내지 MG160-4(서열번호 627-630)는 전장 cDNA를 생산할 수 있는 반면, MG160-6(서열번호 633)은 전장 산물보다 적은 산물을 생산하였다(도 29b).
레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG173 계열)의 무세포 발현 및 레트론 ncRNA의 시험관 내 전사
37℃에서 2시간 동안 PURExpress 성분과 함께 N-말단 단일 Strep 태그로 E. coli- 최적화된 유전자를 암호화하는 DNA 주형의 10 ng/μL를 인큐베이션함으로써 무세포 발현 시스템(PURExpress)에서 레트론 RT를 생산하였다. 모든 시험된 레트론 RT(MG156-1(서열번호 616), MG156-2(서열번호 617), MG157-1(서열번호 618), MG157-2(서열번호 619), MG157-5(서열번호 622), MG159-1(서열번호 624))를 SDS-PAGE 분석에 의해 표시된 바와 같이 생산하였다(도 30a 30b).
레트론 ncRNA를 HiScribe T7 시험관 내 전사 키트(NEB) 및 T7 프로모터 다음에 각각의 ncRNA 유전자를 암호화하는 DNA 주형을 사용하여 생성하였다. 그런 다음, 반응물을 Dnase-I와 함께 인큐베이션하여 DNA 주형을 제거한 다음, RNA 클린업 키트(Monarch)로 정제한다. ncRNA의 양을 나노드롭에 의해 결정하고, 순도를 Tape Station RNA 분석에 의해 평가하였다(도 30c).
예 14 - 레트론 RT 시험관 내 활성 시험(예시)
레트론 RT 효소는 전술한 바와 같이 N-말단 단일 Strep 태그를 갖는 E. coli 코돈 최적화된 유전자를 함유하는 작제물을 사용하여 무세포 발현 시스템에서 생산된다. 효소의 발현은 SDS-PAGE 분석에 의해 확인된다. 일반 주형 상의 레트론 RT 활성은 5'-FAM 표지된 DNA 프라이머에 어닐링된 200 nt RNA를 함유하는, 전술한 바와 같은 프라이머 연장 분석에 의해 결정된다. 생성된 cDNA 산물은 변성 폴리아크릴아미드 겔 상에서 또는 전장 cDNA 산물에 특이적인 프라이머를 갖는 qPCR에 의해 검출된다.
자체 ncRNA에 대한 레트론 RT 시험관 내 활성을 완충액, dNTP, 무세포 발현 시스템으로부터 생산된 레트론 RT, 및 재접힘된 ncRNA를 함유하는 반응에서 평가한다. N-말단 단일 Strep 태그를 통해 무세포 발현 시스템으로부터 RT를 정제하기 전과 후의 RT 활성을 비교한다. 인큐베이션 후, 반응의 절반을 Rnase A/T1로 처리한다. Rnase A/T1 처리 전후의 생성물을 변성 폴리아크릴아미드 겔 상에서 평가하고 SYBR 금 염색에 의해 시각화한다. 이 절차에서, Rnase A/T1은 RNA 주형을 분해하여 ssDNA를 함유하는 더 작은 생성물로 질량 이동을 초래하는 것으로 이해된다. Rnase H는 5' 및 3' ssDNA 경계의 균질성을 개선할 것으로 예상되기 때문에, 생성물의 분포에 대한 Rnase H의 영향도 또한 겔 분석에 의해 평가된다. ncRNA 주형과 ssDNA 사이의 공유 결합은 탈분지 효소(DBR1)로 처리하기 전 또는 후에 RT 산물을 5'에서 3' ssDNA 엑소뉴클레아제(RecJ)로 인큐베이션함으로써 확인된다. RecJ는 DBR1이 RNA와 ssDNA 사이의 2'-5' 인산디에스테르 결합을 제거한 후에 ssDNA를 분해할 수 있을 것으로 예상된다.
예 15 - NGS에 의한 레트론 msr-msd 경계 결정(예시)
msr-msd 경계를 DBR1에 의해 2'-5' 인산에스테르 결합을 제거한 후 msDNA 산물의 5' 및 3' 말단에 대한 어댑터 서열의 편향되지 않은 결찰에 의해 결정한다. 생성된 결찰된 산물은 PCR 증폭시키고, 라이브러리를 제조하고, 차세대 시퀀싱을 수행한다. 시퀀싱 판독물을 기준 서열에 정렬시켜 msd의 5' 및 3' 경계를 결정한다. RT 반응에서 Rnase H의 존재가 5' 및 3' msd 경계의 균질성에 미치는 영향도 또한 평가한다.
예 16 - RT 활성에 대한 msd 내로의 삽입 서열의 체계적 평가(예시)
구별되는 길이, 예측된 이차 구조, 및 GC-함량의 서열을 NGS 및 ncRNA의 이차 구조 예측에 의해 결정된 msd 경계에 의해 알려진 선택된 삽입 부위에서 msd 내로 삽입한다. 이들 삽입 서열이 RT 활성에 미치는 영향을 전술한 바와 같이 겔 분석 또는 NGS에 의해 평가한다.
예 17 - 신규 RT의 시험관 내 활성 시험(예시)
RT 활성을 무세포 발현 시스템으로부터 유래된 RT 및 전술한 바와 같이 DNA 프라이머에 어닐링된 RNA 주형을 함유하는 프라이머 연장 검정을 사용하여 평가한다. 생성된 cDNA 산물을 전술한 바와 같이 변성 폴리아크릴아미드 겔 및 qPCR에 의해 검출한다. 변성 겔 상의 cDNA 드롭오프 산물의 검출은 신규 후보에 대한 가공성의 상대적 평가를 제공한다.
예 18 - 신규 RT의 프라이밍 파라미터 평가(예시)
최적의 프라이머 길이는 6, 8, 10, 13, 16, 또는 20개 뉴클레오티드 길이의 5'-FAM 표지된 DNA 프라이머에 어닐링된 RNA 주형 상에서 RT의 활성을 시험함으로써 결정한다. RT는 전술한 바와 같이 무세포 발현 시스템으로부터 유래된다. 반응물을 인큐베이션한 후, Rnase H의 첨가를 통해 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석한다. 최적의 프라이머 길이는 RT가 가장 많은 프라이머를 cDNA 산물로 변환할 수 있게 하는 길이로서 결정한다. 그런 다음, 실험적으로 결정된 최적의 프라이머 길이를 시험관 내 RT를 추가로 특성화하기 위해, 충실도 및 가공성 검정과 같은 후속 실험에서 사용한다.
예 19 - RT 충실도 평가(예시)
PCR 및 시퀀싱 동안 도입된 오류를 설명하기 위해, 14-nt 고유 분자 식별자(UMI) 바코드가 역전사 반응을 위한 프라이머에 포함되는 것을 제외하고는 전술한 바와 같은 프라이머 연장 검정에 의해 RT 충실도를 평가한다. 생성된 전장 cDNA 산물을 PCR 증폭시키고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행한다. >5개의 리드를 갖는 바코드를 분석한다. 기준 서열과 정렬한 후, 동일한 바코드를 갖는 모든 서열 판독에 오류가 존재하는 경우, 돌연변이, 삽입 및 결실을 계수한다. 모든 시퀀싱 판독물이 아닌 하나의 시퀀싱 판독물에 존재하는 오류는 PCR 또는 시퀀싱 동안 도입되는 것으로 간주한다. RNA 주형 내의 돌연변이 핫스팟의 식별에 더하여, 치환, 삽입 및 결실 프로파일의 추가 분석을 수행한다. 충실도 측정은 또한 주형에서 변형된 염기, 예를 들어 슈도우리딘으로 수행한다.
예 20 - RT의 가공성 계수 결정(예시)
RT 가공성을 전술한 바와 같은 무세포 발현 시스템으로부터 유래된 RT 효소 및 5'-FAM 표지된 프라이머(겔 분석용) 또는 비표지된 프라이머(시퀀싱 분석용)에 어닐링된 길이가 1.6 kb 내지 6.6 kb인 RNA 주형을 함유하는 프라이머 연장 분석을 사용하여 평가한다.
cDNA 합성 동안 RNA 주형에서 떨어진 RT 효소의 재결합을 선호하지 않게 하기 위해 역전사 반응을 단일 사이클 조건 하에서 수행한다. 단일 사이클 조건을 달성하기 위한 최적의 트랩 분자 및 농도를 실험적으로 결정한다. 반응 개시 전에 인큐베이션되는 경우 cDNA 합성의 충분한 억제를 제공하지만, 그렇지 않으면 반응의 속도에 영향을 미치지 않도록 선택된 조건을 설계한다. 시험할 최적의 트랩 분자는 다양한 길이의 DNA 프라이머에 어닐링된 비관련 RNA 주형 및 비관련 RNA 주형을 포함한다.
단일 사이클 반응 조건을 최적화하면, 반응 완충액 중 DNA 프라이머에 어닐링된 RNA 주형으로 RT를 사전 평형화한 후 dNTP 및 선택된 트랩 분자를 첨가하여 반응을 개시함으로써 가공성을 평가한다. 반응물을 인큐베이션한 후, RnaseH를 첨가하여 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석하거나, 긴 판독 시퀀싱을 위해 준비한 PCR 및 라이브러리에 적용한다. 이들 실험으로부터, 전장 cDNA 산물의 50%를 생성하는 주형 길이로서 가공성 계수를 정량화한다. 단일 사이클 프라이머 연장 반응으로부터의 cDNA 산물의 길이 중앙값은 RT가 시험된 주형 상에서 해리될 확률을 추정하는 데 사용된다. 이로부터, 각각의 해리가 독립적인 이벤트이고 해리 확률이 모든 뉴클레오티드 위치에서 동일하다고 가정하면, RT가 각각의 뉴클레오티드 위치에서 해리될 확률이 계산된다. 그런 다음, 해리된 RT의 50%에서 주형의 길이를 나타내는 가공성 계수를 1/(2*P d )로서 결정하며, 여기서 P d 는 각 뉴클레오티드에서 해리 확률이다.
예 21 - 프라이머 연장부 상의 도전적인 구조의 체계적 분석(예시)
RT 활성에 대한 도전적인 주형의 영향을 평가하기 위해, 프라이머 연장 반응을 변형과 함께 전술한 바와 같이 수행한다. RNA 주형은 프라이머 결합 부위의 하류에 고정된 거리(100 내지 300 nt)에서 다음의 도전적인 모티프 중 하나를 함유한다: 동종중합체 신축, 열역학적으로 안정한 GC-풍부 줄기 루프, 슈도노트(pseudoknot), tRNA, GII 인트론, 및 염기 또는 골격 변형(예를 들어 슈도우리딘, 포스포티오레이트 결합)을 함유하는 RNA 주형. 반응을 급랭시킨 후, 폴리아크릴아미드 겔을 변성시켜 cDNA 산물의 크기 분포를 분석한다. 또한 어댑터 서열을 T4 리가아제를 사용하여 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킨다. 그런 다음, 결찰된 산물을 PCR 증폭하고, 라이브러리를 차세대 시퀀싱을 위해 준비하여 RT 잘못혼입/삽입/결실 부위 및 단일 뉴클레오티드 분해(resolution)를 갖는 RT 드롭오프 부위 모두를 식별한다. 주어진 위치에서의 RT 드롭오프의 정도는 드롭오프 산물에 상응하는 시퀀싱 판독물의 수를 전장 산물에 상응하는 시퀀싱 판독물의 수와 비교함으로써 정량화한다.
예 22 - 비-주형 염기 첨가 평가(예시)
cDNA 산물의 5' 말단에 염기의 비-주형 첨가를 차세대 시퀀싱에 의해 평가한다. 무세포 발현 시스템 및 RNA 주형으로부터 유래된 RT를 함유하는 프라이머 연장 반응을 전술한 바와 같이 수행한다. 5' 말단에서 상이한 RNA 주형 길이 및 서열 모티프의 체계적 분석을 시험한다. 어댑터 서열을 T4 리가아제에 의해 생성된 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킴으로써, 이들의 3' 말단의 잠재적인 이종 성질에도 불구하고 모든 cDNA 산물이 포획된다. 그런 다음, 결찰된 산물을 PCR로 증폭시키고 차세대 시퀀싱을 위해 라이브러리를 준비한다. 전장보다 긴 실험적으로 생산된 cDNA 서열과 예상 전장 cDNA 기준 서열의 비교를 통해 RNA에 의해 주형화되지 않은 5'-말단에 대한 염기 첨가의 유형 및 수 둘 다를 식별할 수 있다.
예 23 - R2, 비-LTR 및 유사한 시스템에 대한 활성 및 가공성에 대한 5' 및 3' UTR 파라미터 결정(예시)
관심 단백질을 E. coli에서 IPTG-유도 과발현 후 Twin-strep 태그를 통해 정제한다. 정제된 단백질을, 이들의 고유 컨텍스트로부터 식별된 3' UTR 및 시작 코돈을 지나 5' UTR + 400 bp가 측면에 위치한 1 kb 및 4 kb 카고에 대해 시험한다. 활성에 대한 5' 및 3' 측부 서열의 효과를 qPCR을 통해 주형의 말단 근처의 절편에 대해 분석하여 이들 고유 특징을 갖는 카고가 우수한 결과를 생성하는지 여부를 결정한다.
예 24 - RT cDNA 합성 활성은 다수의 적용에 대해 이용될 수 있다(예시).
RNA에 의존하는 공정은 발현, 처리, 변형 및 반감기와 같은 생물학에 중요하다. RNA에 대해 수행된 생명공학에서의 품질 관리 절차는 RNA의 cDNA로의 변환을 이용한다. 따라서, 수년에 걸쳐 cDNA 라이브러리의 생산을 위해 다수의 RT가 사용되어 왔다. 이러한 목적을 위해 사용되는 상업적으로 이용 가능한 RT는 MMLV RT, AMV RT, 및 GsI-IIC RT(TGIRT)를 포함한다. 처음 2개는 레트로바이러스 RT를 나타내는 반면, 후자는 GII 인트론 유래 RT이다. GII 인트론 유래 RT뿐만 아니라 비-LTR 유래 RT는 이들의 레트로바이러스 대응물과 비교하여 여러 이점을 나타낸다. 예를 들어, 이들은 보다 가공성이어서, 구조적 및 변형된 RNA를 통해 판독한다. 구조적 또는 변형된 RNA는 RNA 단편으로서 오해석될 수 있는 조기 종결 산물을 생성하기 때문에 레트로바이러스 RT에 대한 최적의 기질이 아닐 수 있다. 또한, 일부 RT의 스위치를 주형화하는 능력은 초기 어댑터 추가를 위해 활용될 수 있어서, 어댑터 결찰 절차를 라이브러리 준비 동안 덜 중요하게 한다. 따라서, 고도로 가공성인 RT는 복합체 RNA를 갖는 라이브러리의 생성에 적합하다. 또한, 일부 고도로 가공성인 RT는 일반적으로 현재 사용되는 레트로바이러스 RT보다 작으므로, 이들의 생산 및 연관된 하류 공정을 더 용이하게 한다. 본원에 기술된 여러 신규 RT는 상업적으로 이용 가능한 TGIRT 효소를 능가하며, 일부는 cDNA 합성 활성의 10배를 초과한다. 이와 같이, 이들 신규한 RT 중 다수는 cDNA 합성 키트를 상업적으로 적용하기 위한 큰 가능성을 나타낸다.
본 발명의 바람직한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 예에 의해 한정되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 실시예의 설명 및 예시는 한정적인 의미로 해석되는 것을 의미하지는 않는다. 이제 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 따라 달라지는 본원에 제시된 특정 도시, 구성, 또는 상대 비율로 한정되지 않음을 이해할 것이다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변이, 또는 균등물도 포괄하는 것으로 고려된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위의 범위에 속하는 방법 및 구조와 이들의 등가물이 이에 의해 포괄되는 것으로 의도된다.
본원에서 참조되는 단백질 및 핵산 서열
카탈로그 서열번호 설명 유형
MG140 전위 단백질 1 MG140-1-R2 전위 단백질 단백질
MG140 전위 단백질 2 MG140-2-R2 전위 단백질 단백질
MG140 전위 단백질 3 MG140-3-R2 전위 단백질 단백질
MG140 전위 단백질 4 MG140-4-R2 전위 단백질 단백질
MG140 전위 단백질 5 MG140-5-R2 전위 단백질 단백질
MG140 전위 단백질 6 MG140-6-R2 전위 단백질 단백질
MG140 전위 단백질 7 MG140-7-R2 전위 단백질 단백질
MG140 전위 단백질 8 MG140-8-R2 전위 단백질 단백질
MG140 전위 단백질 9 MG140-147 전위 단백질 단백질
MG140 전위 단백질 10 MG140-9-R2 전위 단백질 단백질
MG140 전위 단백질 11 MG140-10-R2 전위 단백질 단백질
MG140 전위 단백질 12 MG140-11-R2 전위 단백질 단백질
MG140 전위 단백질 13 MG140-12-R2 전위 단백질 단백질
MG140 전위 단백질 14 MG140-13-R2 전위 단백질 단백질
MG140 전위 단백질 15 MG140-14-R2 전위 단백질 단백질
MG140 전위 단백질 16 MG140-15-R2 전위 단백질 단백질
MG140 전위 단백질 17 MG140-16-R2 전위 단백질 단백질
MG140 전위 단백질 18 MG140-17-R2 전위 단백질 단백질
MG140 전위 단백질 19 MG140-18-R2 전위 단백질 단백질
MG140 전위 단백질 20 MG140-19-R2 전위 단백질 단백질
MG140 전위 단백질 21 MG140-20-R2 전위 단백질 단백질
MG140 전위 단백질 22 MG140-21-R2 전위 단백질 단백질
MG140 전위 단백질 23 MG140-22-R2 전위 단백질 단백질
MG140 전위 단백질 24 MG140-23-R2 전위 단백질 단백질
MG140 전위 단백질 25 MG140-24-R2 전위 단백질 단백질
MG140 전위 단백질 26 MG140-25-R2 전위 단백질 단백질
MG140 전위 단백질 27 MG140-26-R2 전위 단백질 단백질
MG140 전위 단백질 28 MG140-27-R2 전위 단백질 단백질
MG140 전위 단백질 29 MG140-28-R2 전위 단백질 단백질
MG153 RT MCP 융합 30 FH-MCP-MG153-1 뉴클레오티드
MG153 RT MCP 융합 31 FH-MCP-MG153-2 뉴클레오티드
MG153 RT MCP 융합 32 FH-MCP-MG153-3 뉴클레오티드
나노루시퍼라제 주형s 33 나노루시퍼라제 주형 뉴클레오티드
상보성 DNA 프라이머 34 상보성 DNA 프라이머 뉴클레오티드
PCR 프라이머 35 100/542 bp 앰플리콘용 순방향 프라이머 뉴클레오티드
PCR 프라이머 36 100 bp 앰플리콘용 역방향 프라이머 뉴클레오티드
PCR 프라이머 37 542 bp 앰플리콘용 역방향 프라이머 뉴클레오티드
cDNA로부터 유래된 PCR 앰플리콘 38 100 bp 앰플리콘 뉴클레오티드
cDNA로부터 유래된 PCR 앰플리콘 39 542 bp 앰플리콘 뉴클레오티드
MG153 RT MCP 융합 40 FH-MCP-MG153-4 뉴클레오티드
MG153 RT MCP 융합 41 FH-MCP-MG153-7 뉴클레오티드
MG153 RT MCP 융합 42 FH-MCP-MG153-8 뉴클레오티드
MG153 RT MCP 융합 43 FH-MCP-MG153-9 뉴클레오티드
MG153 RT MCP 융합 44 FH-MCP-MG153-10 뉴클레오티드
MG153 RT MCP 융합 45 FH-MCP-MG153-11 뉴클레오티드
MG153 RT MCP 융합 46 FH-MCP-MG153-12 뉴클레오티드
MG153 RT MCP 융합 47 FH-MCP-MG153-13 뉴클레오티드
MG153 RT MCP 융합 48 FH-MCP-MG153-15 뉴클레오티드
MG153 RT MCP 융합 49 FH-MCP-MG153-16 뉴클레오티드
MG153 RT MCP 융합 50 FH-MCP-MG153-21 뉴클레오티드
pET21(+)로부터 증폭시키기 위한 프라이머 51 LA_061_pmgx_txtl_rv 뉴클레오티드
pET21(+)로부터 증폭시키기 위한 프라이머 52 LA_062_pmgx_txtl_fw 뉴클레오티드
RT RNA 주형 53 emx1에 대한 구조화된 RT 주형 RNA 뉴클레오티드
RT RNA 주형 54 emx1에 대한 구조화된 RT 주형 RNA(5' 절단됨) 뉴클레오티드
RT RNA 주형 55 소형 RT 주형 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 56 LA321_282_FAM 뉴클레오티드
NGS 프라이머 57 LA065_NGS_풍부_fw 뉴클레오티드
NGS 프라이머 58 LA395_282_NGS 뉴클레오티드
NGS 프라이머 59 LA396_RT_짧은_NGS 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 60 LA423_emx1_6pbs 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 61 LA424_emx1_8pbs 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 62 LA425_emx1_10pbs 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 63 LA426_emx1_13pbs 뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고 64 LA427_emx1_20pbs 뉴클레오티드
NGS 충실도에 대한 UMI 프라이머 65 LA430_umi_cdna 뉴클레오티드
MG153 Strep 태그된 유전자 66 Nstrep-MG153-1 뉴클레오티드
MG153 Strep 태그된 유전자 67 Nstrep-MG153-2 뉴클레오티드
MG153 Strep 태그된 유전자 68 Nstrep-MG153-3 뉴클레오티드
MG153 Strep 태그된 유전자 69 Nstrep-MG153-4 뉴클레오티드
MG153 Strep 태그된 유전자 70 Nstrep-MG153-5 뉴클레오티드
MG153 Strep 태그된 유전자 71 Nstrep-MG153-6 뉴클레오티드
MG153 Strep 태그된 유전자 72 Nstrep-MG153-7 뉴클레오티드
MG153 Strep 태그된 유전자 73 Nstrep-MG153-8 뉴클레오티드
MG153 Strep 태그된 유전자 74 Nstrep-MG153-9 뉴클레오티드
MG153 Strep 태그된 유전자 75 Nstrep-MG153-10 뉴클레오티드
MG153 Strep 태그된 유전자 76 Nstrep-MG153-11 뉴클레오티드
MG153 Strep 태그된 유전자 77 Nstrep-MG153-12 뉴클레오티드
MG153 Strep 태그된 유전자 78 Nstrep-MG153-13 뉴클레오티드
MG153 Strep 태그된 유전자 79 Nstrep-MG153-14 뉴클레오티드
MG153 Strep 태그된 유전자 80 Nstrep-MG153-15 뉴클레오티드
MG153 Strep 태그된 유전자 81 Nstrep-MG153-16 뉴클레오티드
MG153 Strep 태그된 유전자 82 Nstrep-MG153-17 뉴클레오티드
MG153 Strep 태그된 유전자 83 Nstrep-MG153-18 뉴클레오티드
MG153 Strep 태그된 유전자 84 Nstrep-MG153-19 뉴클레오티드
MG153 Strep 태그된 유전자 85 Nstrep-MG153-20 뉴클레오티드
MG153 Strep 태그된 유전자 86 Nstrep-MG153-21 뉴클레오티드
MG153 Strep 태그된 유전자 87 Nstrep-MG153-25 뉴클레오티드
MG153 Strep 태그된 유전자 88 Nstrep-MG153-26 뉴클레오티드
MG153 Strep 태그된 유전자 89 Nstrep-MG153-27 뉴클레오티드
MG153 Strep 태그된 유전자 90 Nstrep-MG153-28 뉴클레오티드
MG153 Strep 태그된 유전자 91 Nstrep-MG153-29 뉴클레오티드
MG153 Strep 태그된 유전자 92 Nstrep-MG153-30 뉴클레오티드
MG153 Strep 태그된 유전자 93 Nstrep-MG153-31 뉴클레오티드
MG153 Strep 태그된 유전자 94 Nstrep-MG153-32 뉴클레오티드
MG153 Strep 태그된 유전자 95 Nstrep-MG153-33 뉴클레오티드
MG153 Strep 태그된 유전자 96 Nstrep-MG153-34 뉴클레오티드
MG153 Strep 태그된 유전자 97 Nstrep-MG153-35 뉴클레오티드
MG153 Strep 태그된 유전자 98 Nstrep-MG153-36 뉴클레오티드
MG153 Strep 태그된 유전자 99 Nstrep-MG153-37 뉴클레오티드
MG153 Strep 태그된 유전자 100 Nstrep-MG153-38 뉴클레오티드
MG153 Strep 태그된 유전자 101 Nstrep-MG153-39 뉴클레오티드
MG153 Strep 태그된 유전자 102 Nstrep-MG153-40 뉴클레오티드
MG153 Strep 태그된 유전자 103 Nstrep-MG153-41 뉴클레오티드
MG153 Strep 태그된 유전자 104 Nstrep-MG153-42 뉴클레오티드
MG153 Strep 태그된 유전자 105 Nstrep-MG153-43 뉴클레오티드
MG153 Strep 태그된 유전자 106 Nstrep-MG153-44 뉴클레오티드
MG153 Strep 태그된 유전자 107 Nstrep-MG153-45 뉴클레오티드
MG153 Strep 태그된 유전자 108 Nstrep-MG153-46 뉴클레오티드
MG153 Strep 태그된 유전자 109 Nstrep-MG153-47 뉴클레오티드
MG153 Strep 태그된 유전자 110 Nstrep-MG153-48 뉴클레오티드
MG153 Strep 태그된 유전자 111 Nstrep-MG153-49 뉴클레오티드
MG153 Strep 태그된 유전자 112 Nstrep-MG153-50 뉴클레오티드
MG153 Strep 태그된 유전자 113 Nstrep-MG153-51 뉴클레오티드
MG153 Strep 태그된 유전자 114 Nstrep-MG153-52 뉴클레오티드
MG153 Strep 태그된 유전자 115 Nstrep-MG153-53 뉴클레오티드
MG153 Strep 태그된 유전자 116 Nstrep-MG153-54 뉴클레오티드
MG153 Strep 태그된 유전자 117 Nstrep-MG153-55 뉴클레오티드
MG153 Strep 태그된 유전자 118 Nstrep-MG153-56 뉴클레오티드
MG153 Strep 태그된 유전자 119 Nstrep-MG153-57 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 120 MG153-1 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 121 MG153-2 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 122 MG153-3 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 123 MG153-4 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 124 MG153-5 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 125 MG153-6 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 126 MG153-7 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 127 MG153-8 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 128 MG153-9 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 129 MG153-10 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 130 MG153-11 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 131 MG153-12 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 132 MG153-13 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 133 MG153-14 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 134 MG153-15 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 135 MG153-16 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 136 MG153-17 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 137 MG153-18 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 138 MG153-19 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 139 MG153-20 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 140 MG153-21 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 141 MG153-25 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 142 MG153-26 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 143 MG153-27 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 144 MG153-28 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 145 MG153-29 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 146 MG153-30 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 147 MG153-31 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 148 MG153-32 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 149 MG153-33 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 150 MG153-34 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 151 MG153-35 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 152 MG153-36 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 153 MG153-37 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 154 MG153-38 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 155 MG153-39 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 156 MG153-40 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 157 MG153-41 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 158 MG153-42 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 159 MG153-43 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 160 MG153-44 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 161 MG153-45 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 162 MG153-46 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 163 MG153-47 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 164 MG153-48 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 165 MG153-49 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 166 MG153-50 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 167 MG153-51 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 168 MG153-52 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 169 MG153-53 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 170 MG153-54 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 171 MG153-55 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 172 MG153-56 뉴클레오티드
MG153 대장균 코돈 최적화된 유전자 173 MG153-57 뉴클레오티드
MG160 Strep 태그된 유전자 174 Nstrep-MG160-1 뉴클레오티드
MG160 Strep 태그된 유전자 175 Nstrep-MG160-2 뉴클레오티드
MG160 Strep 태그된 유전자 176 Nstrep-MG160-3 뉴클레오티드
MG160 Strep 태그된 유전자 177 Nstrep-MG160-4 뉴클레오티드
MG160 Strep 태그된 유전자 178 Nstrep-MG160-5 뉴클레오티드
MG160 Strep 태그된 유전자 179 Nstrep-MG160-6 뉴클레오티드
MG160 Strep 태그된 유전자 180 Nstrep-MG160-8 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 181 MG160-1 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 182 MG160-2 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 183 MG160-3 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 184 MG160-4 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 185 MG160-5 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 186 MG160-6 뉴클레오티드
MG160 대장균 코돈 최적화된 유전자 187 MG160-8 뉴클레오티드
MG163 Strep 태그된 유전자 188 Nstrep-MG163-1 뉴클레오티드
MG163 Strep 태그된 유전자 189 Nstrep-MG163-2 뉴클레오티드
MG163 Strep 태그된 유전자 190 Nstrep-MG163-3 뉴클레오티드
MG163 Strep 태그된 유전자 191 Nstrep-MG163-4 뉴클레오티드
MG163 Strep 태그된 유전자 192 Nstrep-MG163-5 뉴클레오티드
MG163 대장균 코돈 최적화된 유전자 193 MG163-1 뉴클레오티드
MG163 대장균 코돈 최적화된 유전자 194 MG163-2 뉴클레오티드
MG163 대장균 코돈 최적화된 유전자 195 MG163-3 뉴클레오티드
MG163 대장균 코돈 최적화된 유전자 196 MG163-4 뉴클레오티드
MG163 대장균 코돈 최적화된 유전자 197 MG163-5 뉴클레오티드
MG164 Strep 태그된 유전자 198 Nstrep-MG164-1 뉴클레오티드
MG164 Strep 태그된 유전자 199 Nstrep-MG164-2 뉴클레오티드
MG164 Strep 태그된 유전자 200 Nstrep-MG164-3 뉴클레오티드
MG164 Strep 태그된 유전자 201 Nstrep-MG164-4 뉴클레오티드
MG164 Strep 태그된 유전자 202 Nstrep-MG164-5 뉴클레오티드
MG164 대장균 코돈 최적화된 유전자 203 MG164-1 뉴클레오티드
MG164 대장균 코돈 최적화된 유전자 204 MG164-2 뉴클레오티드
MG164 대장균 코돈 최적화된 유전자 205 MG164-3 뉴클레오티드
MG164 대장균 코돈 최적화된 유전자 206 MG164-4 뉴클레오티드
MG164 대장균 코돈 최적화된 유전자 207 MG164-5 뉴클레오티드
MG165 Strep 태그된 유전자 208 Nstrep-MG165-1 뉴클레오티드
MG165 Strep 태그된 유전자 209 Nstrep-MG165-2 뉴클레오티드
MG165 Strep 태그된 유전자 210 Nstrep-MG165-3 뉴클레오티드
MG165 Strep 태그된 유전자 211 Nstrep-MG165-4 뉴클레오티드
MG165 Strep 태그된 유전자 212 Nstrep-MG165-5 뉴클레오티드
MG165 Strep 태그된 유전자 213 Nstrep-MG165-6 뉴클레오티드
MG165 Strep 태그된 유전자 214 Nstrep-MG165-7 뉴클레오티드
MG165 Strep 태그된 유전자 215 Nstrep-MG165-8 뉴클레오티드
MG165 Strep 태그된 유전자 216 Nstrep-MG165-9 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 217 MG165-1 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 218 MG165-2 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 219 MG165-3 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 220 MG165-4 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 221 MG165-5 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 222 MG165-6 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 223 MG165-7 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 224 MG165-8 뉴클레오티드
MG165 대장균 코돈 최적화된 유전자 225 MG165-9 뉴클레오티드
MG166 Strep 태그된 유전자 226 Nstrep-MG166-1 뉴클레오티드
MG166 Strep 태그된 유전자 227 Nstrep-MG166-2 뉴클레오티드
MG166 Strep 태그된 유전자 228 Nstrep-MG166-3 뉴클레오티드
MG166 Strep 태그된 유전자 229 Nstrep-MG166-4 뉴클레오티드
MG166 Strep 태그된 유전자 230 Nstrep-MG166-5 뉴클레오티드
MG166 대장균 코돈 최적화된 유전자 231 MG166-1 뉴클레오티드
MG166 대장균 코돈 최적화된 유전자 232 MG166-2 뉴클레오티드
MG166 대장균 코돈 최적화된 유전자 233 MG166-3 뉴클레오티드
MG166 대장균 코돈 최적화된 유전자 234 MG166-4 뉴클레오티드
MG166 대장균 코돈 최적화된 유전자 235 MG166-5 뉴클레오티드
MG167 Strep 태그된 유전자 236 Nstrep-MG167-1 뉴클레오티드
MG167 Strep 태그된 유전자 237 Nstrep-MG167-2 뉴클레오티드
MG167 Strep 태그된 유전자 238 Nstrep-MG167-3 뉴클레오티드
MG167 Strep 태그된 유전자 239 Nstrep-MG167-4 뉴클레오티드
MG167 Strep 태그된 유전자 240 Nstrep-MG167-5 뉴클레오티드
MG167 대장균 코돈 최적화된 유전자 241 MG167-1 뉴클레오티드
MG167 대장균 코돈 최적화된 유전자 242 MG167-2 뉴클레오티드
MG167 대장균 코돈 최적화된 유전자 243 MG167-3 뉴클레오티드
MG167 대장균 코돈 최적화된 유전자 244 MG167-4 뉴클레오티드
MG167 대장균 코돈 최적화된 유전자 245 MG167-5 뉴클레오티드
MG168 Strep 태그된 유전자 246 Nstrep-MG168-1 뉴클레오티드
MG168 Strep 태그된 유전자 247 Nstrep-MG168-2 뉴클레오티드
MG168 Strep 태그된 유전자 248 Nstrep-MG168-3 뉴클레오티드
MG168 Strep 태그된 유전자 249 Nstrep-MG168-4 뉴클레오티드
MG168 Strep 태그된 유전자 250 Nstrep-MG168-5 뉴클레오티드
MG168 대장균 코돈 최적화된 유전자 251 MG168-1 뉴클레오티드
MG168 대장균 코돈 최적화된 유전자 252 MG168-2 뉴클레오티드
MG168 대장균 코돈 최적화된 유전자 253 MG168-3 뉴클레오티드
MG168 대장균 코돈 최적화된 유전자 254 MG168-4 뉴클레오티드
MG168 대장균 코돈 최적화된 유전자 255 MG168-5 뉴클레오티드
MG169 Strep 태그된 유전자 256 Nstrep-MG169-1 뉴클레오티드
MG169 Strep 태그된 유전자 257 Nstrep-MG169-2 뉴클레오티드
MG169 Strep 태그된 유전자 258 Nstrep-MG169-3 뉴클레오티드
MG169 Strep 태그된 유전자 259 Nstrep-MG169-4 뉴클레오티드
MG169 Strep 태그된 유전자 260 Nstrep-MG169-5 뉴클레오티드
MG169 Strep 태그된 유전자 261 Nstrep-MG169-6 뉴클레오티드
MG169 Strep 태그된 유전자 262 Nstrep-MG169-7 뉴클레오티드
MG169 Strep 태그된 유전자 263 Nstrep-MG169-8 뉴클레오티드
MG169 Strep 태그된 유전자 264 Nstrep-MG169-9 뉴클레오티드
MG169 Strep 태그된 유전자 265 Nstrep-MG169-10 뉴클레오티드
MG169 Strep 태그된 유전자 266 Nstrep-MG169-11 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 267 MG169-1 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 268 MG169-2 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 269 MG169-3 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 270 MG169-4 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 271 MG169-5 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 272 MG169-6 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 273 MG169-7 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 274 MG169-8 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 275 MG169-9 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 276 MG169-10 뉴클레오티드
MG169 대장균 코돈 최적화된 유전자 277 MG169-11 뉴클레오티드
MG170 Strep 태그된 유전자 278 Nstrep-MG170-1 뉴클레오티드
MG170 Strep 태그된 유전자 279 Nstrep-MG170-2 뉴클레오티드
MG170 Strep 태그된 유전자 280 Nstrep-MG170-3 뉴클레오티드
MG170 Strep 태그된 유전자 281 Nstrep-MG170-4 뉴클레오티드
MG170 Strep 태그된 유전자 282 Nstrep-MG170-5 뉴클레오티드
MG170 Strep 태그된 유전자 283 Nstrep-MG170-6 뉴클레오티드
MG170 Strep 태그된 유전자 284 Nstrep-MG170-7 뉴클레오티드
MG170 Strep 태그된 유전자 285 Nstrep-MG170-8 뉴클레오티드
MG170 Strep 태그된 유전자 286 Nstrep-MG170-9 뉴클레오티드
MG170 Strep 태그된 유전자 287 Nstrep-MG170-10 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 288 MG170-1 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 289 MG170-2 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 290 MG170-3 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 291 MG170-4 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 292 MG170-5 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 293 MG170-6 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 294 MG170-7 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 295 MG170-8 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 296 MG170-9 뉴클레오티드
MG170 대장균 코돈 최적화된 유전자 297 MG170-10 뉴클레오티드
MG172 Strep 태그된 유전자 298 Nstrep-MG172-1 뉴클레오티드
MG172 Strep 태그된 유전자 299 Nstrep-MG172-2 뉴클레오티드
MG172 Strep 태그된 유전자 300 Nstrep-MG172-3 뉴클레오티드
MG172 Strep 태그된 유전자 301 Nstrep-MG172-4 뉴클레오티드
MG172 Strep 태그된 유전자 302 Nstrep-MG172-5 뉴클레오티드
MG172 대장균 코돈 최적화된 유전자 303 MG172-1 뉴클레오티드
MG172 대장균 코돈 최적화된 유전자 304 MG172-2 뉴클레오티드
MG172 대장균 코돈 최적화된 유전자 305 MG172-3 뉴클레오티드
MG172 대장균 코돈 최적화된 유전자 306 MG172-4 뉴클레오티드
MG172 대장균 코돈 최적화된 유전자 307 MG172-5 뉴클레오티드
MG154 Strep 태그된 유전자 308 Nstrep-MG154-1 뉴클레오티드
MG154 Strep 태그된 유전자 309 Nstrep-MG154-2 뉴클레오티드
MG155 Strep 태그된 유전자 310 Nstrep-MG155-1 뉴클레오티드
MG155 Strep 태그된 유전자 311 Nstrep-MG155-2 뉴클레오티드
MG155 Strep 태그된 유전자 312 Nstrep-MG155-3 뉴클레오티드
MG156 Strep 태그된 유전자 313 Nstrep-MG156-1 뉴클레오티드
MG156 Strep 태그된 유전자 314 Nstrep-MG156-2 뉴클레오티드
MG157 Strep 태그된 유전자 315 Nstrep-MG157-1 뉴클레오티드
MG157 Strep 태그된 유전자 316 Nstrep-MG157-2 뉴클레오티드
MG157 Strep 태그된 유전자 317 Nstrep-MG157-3 뉴클레오티드
MG157 Strep 태그된 유전자 318 Nstrep-MG157-4 뉴클레오티드
MG157 Strep 태그된 유전자 319 Nstrep-MG157-5 뉴클레오티드
MG158 Strep 태그된 유전자 320 Nstrep-MG158-1 뉴클레오티드
MG159 Strep 태그된 유전자 321 Nstrep-MG159-1 뉴클레오티드
MG159 Strep 태그된 유전자 322 Nstrep-MG159-2 뉴클레오티드
MG159 Strep 태그된 유전자 323 Nstrep-MG159-3 뉴클레오티드
MG154 대장균 코돈 최적화된 유전자 324 MG154-1 뉴클레오티드
MG154 대장균 코돈 최적화된 유전자 325 MG154-2 뉴클레오티드
MG155 대장균 코돈 최적화된 유전자 326 MG155-1 뉴클레오티드
MG155 대장균 코돈 최적화된 유전자 327 MG155-2 뉴클레오티드
MG155 대장균 코돈 최적화된 유전자 328 MG155-3 뉴클레오티드
MG156 대장균 코돈 최적화된 유전자 329 MG156-1 뉴클레오티드
MG156 대장균 코돈 최적화된 유전자 330 MG156-2 뉴클레오티드
MG157 대장균 코돈 최적화된 유전자 331 MG157-1 뉴클레오티드
MG157 대장균 코돈 최적화된 유전자 332 MG157-2 뉴클레오티드
MG157 대장균 코돈 최적화된 유전자 333 MG157-3 뉴클레오티드
MG157 대장균 코돈 최적화된 유전자 334 MG157-4 뉴클레오티드
MG157 대장균 코돈 최적화된 유전자 335 MG157-5 뉴클레오티드
MG158 대장균 코돈 최적화된 유전자 336 MG158-1 뉴클레오티드
MG159 대장균 코돈 최적화된 유전자 337 MG159-1 뉴클레오티드
MG159 대장균 코돈 최적화된 유전자 338 MG159-2 뉴클레오티드
MG159 대장균 코돈 최적화된 유전자 339 MG159-3 뉴클레오티드
MG154 ncRNA 340 MG154-1_ncRNA 뉴클레오티드
MG154 ncRNA 341 MG154-2_ncRNA 뉴클레오티드
MG155 ncRNA 342 MG155-1_ncRNA 뉴클레오티드
MG155 ncRNA 343 MG155-2_ncRNA 뉴클레오티드
MG155 ncRNA 344 MG155-3_ncRNA 뉴클레오티드
MG156 ncRNA 345 MG156-1_ncRNA 뉴클레오티드
MG156 ncRNA 346 MG156-2_ncRNA 뉴클레오티드
MG157 ncRNA 347 MG157-1_ncRNA 뉴클레오티드
MG157 ncRNA 348 MG157-2_ncRNA 뉴클레오티드
MG157 ncRNA 349 MG157-3_ncRNA 뉴클레오티드
MG157 ncRNA 350 MG157-4_ncRNA 뉴클레오티드
MG157 ncRNA 351 MG157-5_ncRNA 뉴클레오티드
MG158 ncRNA 352 MG158-1_ncRNA 뉴클레오티드
MG159 ncRNA 353 MG159-1_ncRNA 뉴클레오티드
MG159 ncRNA 354 MG159-2_ncRNA 뉴클레오티드
MG159 ncRNA 355 MG159-3_ncRNA 뉴클레오티드
MG151 TwinStrep 태그된 유전자 356 TwinStrep-MG151-80 뉴클레오티드
MG151 TwinStrep 태그된 유전자 357 TwinStrep-MG151-81 뉴클레오티드
MG151 TwinStrep 태그된 유전자 358 TwinStrep-MG151-82 뉴클레오티드
MG151 TwinStrep 태그된 유전자 359 TwinStrep-MG151-83 뉴클레오티드
MG151 TwinStrep 태그된 유전자 360 TwinStrep-MG151-84 뉴클레오티드
MG151 TwinStrep 태그된 유전자 361 TwinStrep-MG151-85 뉴클레오티드
MG151 TwinStrep 태그된 유전자 362 TwinStrep-MG151-86 뉴클레오티드
MG151 Strep 태그된 유전자 363 Strep-MG151-87 뉴클레오티드
MG151 Strep 태그된 유전자 364 Strep-MG151-88 뉴클레오티드
MG151 Strep 태그된 유전자 365 Strep-MG151-89 뉴클레오티드
MG151 Strep 태그된 유전자 366 Strep-MG151-90 뉴클레오티드
MG151 Strep 태그된 유전자 367 Strep-MG151-91 뉴클레오티드
MG151 Strep 태그된 유전자 368 Strep-MG151-92 뉴클레오티드
MG151 Strep 태그된 유전자 369 Strep-MG151-93 뉴클레오티드
MG151 Strep 태그된 유전자 370 Strep-MG151-94 뉴클레오티드
MG151 Strep 태그된 유전자 371 Strep-MG151-95 뉴클레오티드
MG151 Strep 태그된 유전자 372 Strep-MG151-96 뉴클레오티드
MG151 Strep 태그된 유전자 373 Strep-MG151-97 뉴클레오티드
MG140 HA-His 태그된 유전자 374 MG140-1-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 375 MG140-3-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 376 MG140-4-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 377 MG140-5-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 378 MG140-6-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 379 MG140-7-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 380 MG140-8-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 381 MG140-10-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 382 MG140-13-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 383 MG140-14-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 384 MG140-45-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 385 MG140-46-HA-His 뉴클레오티드
MG140 HA-His 태그된 유전자 386 MG140-47-HA-His 뉴클레오티드
MG146 HA-His 태그된 유전자 387 MG146-1-HA-His 뉴클레오티드
MG147 HA-His 태그된 유전자 388 MG147-1-HA-His 뉴클레오티드
MG148 HA-His 태그된 유전자 389 MG148-1-HA-His 뉴클레오티드
MG148 HA-His 태그된 유전자 390 MG148-2-HA-His 뉴클레오티드
MG148 HA-His 태그된 유전자 391 MG148-3-HA-His 뉴클레오티드
MG148 HA-His 태그된 유전자 392 MG148-4-HA-His 뉴클레오티드
MG140 전위 단백질 393 MG140-45 전위 단백질 단백질
MG140 전위 단백질 394 MG140-46 전위 단백질 단백질
MG140 전위 단백질 395 MG140-47 전위 단백질 단백질
MG140 전위 단백질 396 MG140-48 전위 단백질 단백질
MG140 전위 단백질 397 MG140-49 전위 단백질 단백질
MG140 전위 단백질 398 MG140-50 전위 단백질 단백질
MG140 전위 단백질 399 MG140-51 전위 단백질 단백질
MG140 전위 단백질 400 MG140-52 전위 단백질 단백질
MG140 전위 단백질 401 MG140-53 전위 단백질 단백질
MG146 전위 단백질 402 MG146-1 전위 단백질 단백질
MG148 역전사 효소 단백질 403 MG148-13 역전사 효소 단백질
MG148 역전사 효소 단백질 404 MG148-14 역전사 효소 단백질
MG148 역전사 효소 단백질 405 MG148-15 역전사 효소 단백질
MG148 역전사 효소 단백질 406 MG148-16 역전사 효소 단백질
MG148 역전사 효소 단백질 407 MG148-17 역전사 효소 단백질
MG148 역전사 효소 단백질 408 MG148-18 역전사 효소 단백질
MG148 역전사 효소 단백질 409 MG148-19 역전사 효소 단백질
MG148 역전사 효소 단백질 410 MG148-20 역전사 효소 단백질
MG148 역전사 효소 단백질 411 MG148-21 역전사 효소 단백질
MG148 역전사 효소 단백질 412 MG148-22 역전사 효소 단백질
MG148 역전사 효소 단백질 413 MG148-23 역전사 효소 단백질
MG148 역전사 효소 단백질 414 MG148-24 역전사 효소 단백질
MG148 역전사 효소 단백질 415 MG148-25 역전사 효소 단백질
MG148 역전사 효소 단백질 416 MG148-26 역전사 효소 단백질
MG148 역전사 효소 단백질 417 MG148-27 역전사 효소 단백질
MG148 역전사 효소 단백질 418 MG148-29 역전사 효소 단백질
MG148 역전사 효소 단백질 419 MG148-30 역전사 효소 단백질
MG148 역전사 효소 단백질 420 MG148-31 역전사 효소 단백질
MG148 역전사 효소 단백질 421 MG148-32 역전사 효소 단백질
MG148 역전사 효소 단백질 422 MG148-33 역전사 효소 단백질
MG148 역전사 효소 단백질 423 MG148-34 역전사 효소 단백질
MG148 역전사 효소 단백질 424 MG148-35 역전사 효소 단백질
MG148 역전사 효소 단백질 425 MG148-36 역전사 효소 단백질
MG148 역전사 효소 단백질 426 MG148-37 역전사 효소 단백질
MG149 역전사 효소 단백질 427 MG149-1 역전사 효소 단백질
MG149 역전사 효소 단백질 428 MG149-2 역전사 효소 단백질
MG149 역전사 효소 단백질 429 MG149-3 역전사 효소 단백질
MG149 역전사 효소 단백질 430 MG149-5 역전사 효소 단백질
MG149 역전사 효소 단백질 431 MG149-6 역전사 효소 단백질
MG149 역전사 효소 단백질 432 MG149-7 역전사 효소 단백질
MG149 역전사 효소 단백질 433 MG149-8 역전사 효소 단백질
MG149 역전사 효소 단백질 434 MG149-9 역전사 효소 단백질
MG149 역전사 효소 단백질 435 MG149-10 역전사 효소 단백질
MG149 역전사 효소 단백질 436 MG149-11 역전사 효소 단백질
MG149 역전사 효소 단백질 437 MG149-12 역전사 효소 단백질
MG149 역전사 효소 단백질 438 MG149-13 역전사 효소 단백질
MG149 역전사 효소 단백질 439 MG149-14 역전사 효소 단백질
MG151 역전사 효소 단백질 440 MG151-1 역전사 효소 단백질
MG151 역전사 효소 단백질 441 MG151-2 역전사 효소 단백질
MG151 역전사 효소 단백질 442 MG151-3 역전사 효소 단백질
MG151 역전사 효소 단백질 443 MG151-4 역전사 효소 단백질
MG151 역전사 효소 단백질 444 MG151-5 역전사 효소 단백질
MG151 역전사 효소 단백질 445 MG151-6 역전사 효소 단백질
MG151 역전사 효소 단백질 446 MG151-7 역전사 효소 단백질
MG151 역전사 효소 단백질 447 MG151-8 역전사 효소 단백질
MG151 역전사 효소 단백질 448 MG151-9 역전사 효소 단백질
MG151 역전사 효소 단백질 449 MG151-10 역전사 효소 단백질
MG151 역전사 효소 단백질 450 MG151-12 역전사 효소 단백질
MG151 역전사 효소 단백질 451 MG151-13 역전사 효소 단백질
MG151 역전사 효소 단백질 452 MG151-14 역전사 효소 단백질
MG151 역전사 효소 단백질 453 MG151-15 역전사 효소 단백질
MG151 역전사 효소 단백질 454 MG151-16 역전사 효소 단백질
MG151 역전사 효소 단백질 455 MG151-17 역전사 효소 단백질
MG151 역전사 효소 단백질 456 MG151-18 역전사 효소 단백질
MG151 역전사 효소 단백질 457 MG151-19 역전사 효소 단백질
MG151 역전사 효소 단백질 458 MG151-20 역전사 효소 단백질
MG151 역전사 효소 단백질 459 MG151-21 역전사 효소 단백질
MG151 역전사 효소 단백질 460 MG151-22 역전사 효소 단백질
MG151 역전사 효소 단백질 461 MG151-23 역전사 효소 단백질
MG151 역전사 효소 단백질 462 MG151-24 역전사 효소 단백질
MG151 역전사 효소 단백질 463 MG151-25 역전사 효소 단백질
MG151 역전사 효소 단백질 464 MG151-26 역전사 효소 단백질
MG151 역전사 효소 단백질 465 MG151-27 역전사 효소 단백질
MG151 역전사 효소 단백질 466 MG151-28 역전사 효소 단백질
MG151 역전사 효소 단백질 467 MG151-29 역전사 효소 단백질
MG151 역전사 효소 단백질 468 MG151-30 역전사 효소 단백질
MG151 역전사 효소 단백질 469 MG151-31 역전사 효소 단백질
MG151 역전사 효소 단백질 470 MG151-32 역전사 효소 단백질
MG151 역전사 효소 단백질 471 MG151-33 역전사 효소 단백질
MG151 역전사 효소 단백질 472 MG151-34 역전사 효소 단백질
MG151 역전사 효소 단백질 473 MG151-35 역전사 효소 단백질
MG151 역전사 효소 단백질 474 MG151-36 역전사 효소 단백질
MG151 역전사 효소 단백질 475 MG151-37 역전사 효소 단백질
MG151 역전사 효소 단백질 476 MG151-38 역전사 효소 단백질
MG151 역전사 효소 단백질 477 MG151-39 역전사 효소 단백질
MG151 역전사 효소 단백질 478 MG151-40 역전사 효소 단백질
MG151 역전사 효소 단백질 479 MG151-41 역전사 효소 단백질
MG151 역전사 효소 단백질 480 MG151-42 역전사 효소 단백질
MG151 역전사 효소 단백질 481 MG151-43 역전사 효소 단백질
MG151 역전사 효소 단백질 482 MG151-44 역전사 효소 단백질
MG151 역전사 효소 단백질 483 MG151-45 역전사 효소 단백질
MG151 역전사 효소 단백질 484 MG151-46 역전사 효소 단백질
MG151 역전사 효소 단백질 485 MG151-47 역전사 효소 단백질
MG151 역전사 효소 단백질 486 MG151-48 역전사 효소 단백질
MG151 역전사 효소 단백질 487 MG151-49 역전사 효소 단백질
MG151 역전사 효소 단백질 488 MG151-50 역전사 효소 단백질
MG151 역전사 효소 단백질 489 MG151-51 역전사 효소 단백질
MG151 역전사 효소 단백질 490 MG151-52 역전사 효소 단백질
MG151 역전사 효소 단백질 491 MG151-53 역전사 효소 단백질
MG151 역전사 효소 단백질 492 MG151-54 역전사 효소 단백질
MG151 역전사 효소 단백질 493 MG151-55 역전사 효소 단백질
MG151 역전사 효소 단백질 494 MG151-56 역전사 효소 단백질
MG151 역전사 효소 단백질 495 MG151-57 역전사 효소 단백질
MG151 역전사 효소 단백질 496 MG151-58 역전사 효소 단백질
MG151 역전사 효소 단백질 497 MG151-59 역전사 효소 단백질
MG151 역전사 효소 단백질 498 MG151-60 역전사 효소 단백질
MG151 역전사 효소 단백질 499 MG151-61 역전사 효소 단백질
MG151 역전사 효소 단백질 500 MG151-62 역전사 효소 단백질
MG151 역전사 효소 단백질 501 MG151-63 역전사 효소 단백질
MG151 역전사 효소 단백질 502 MG151-64 역전사 효소 단백질
MG151 역전사 효소 단백질 503 MG151-65 역전사 효소 단백질
MG151 역전사 효소 단백질 504 MG151-66 역전사 효소 단백질
MG151 역전사 효소 단백질 505 MG151-67 역전사 효소 단백질
MG151 역전사 효소 단백질 506 MG151-68 역전사 효소 단백질
MG151 역전사 효소 단백질 507 MG151-69 역전사 효소 단백질
MG151 역전사 효소 단백질 508 MG151-70 역전사 효소 단백질
MG151 역전사 효소 단백질 509 MG151-71 역전사 효소 단백질
MG151 역전사 효소 단백질 510 MG151-72 역전사 효소 단백질
MG151 역전사 효소 단백질 511 MG151-73 역전사 효소 단백질
MG151 역전사 효소 단백질 512 MG151-74 역전사 효소 단백질
MG151 역전사 효소 단백질 513 MG151-75 역전사 효소 단백질
MG151 역전사 효소 단백질 514 MG151-76 역전사 효소 단백질
MG151 역전사 효소 단백질 515 MG151-77 역전사 효소 단백질
MG151 역전사 효소 단백질 516 MG151-78 역전사 효소 단백질
MG151 역전사 효소 단백질 517 MG151-79 역전사 효소 단백질
MG151 역전사 효소 단백질 518 MG151-80 역전사 효소 단백질
MG151 역전사 효소 단백질 519 MG151-81 역전사 효소 단백질
MG151 역전사 효소 단백질 520 MG151-82 역전사 효소 단백질
MG151 역전사 효소 단백질 521 MG151-83 역전사 효소 단백질
MG151 역전사 효소 단백질 522 MG151-84 역전사 효소 단백질
MG151 역전사 효소 단백질 523 MG151-85 역전사 효소 단백질
MG151 역전사 효소 단백질 524 MG151-87 역전사 효소 단백질
MG151 역전사 효소 단백질 525 MG151-88 역전사 효소 단백질
MG151 역전사 효소 단백질 526 MG151-89 역전사 효소 단백질
MG151 역전사 효소 단백질 527 MG151-90 역전사 효소 단백질
MG151 역전사 효소 단백질 528 MG151-91 역전사 효소 단백질
MG151 역전사 효소 단백질 529 MG151-92 역전사 효소 단백질
MG151 역전사 효소 단백질 530 MG151-93 역전사 효소 단백질
MG151 역전사 효소 단백질 531 MG151-94 역전사 효소 단백질
MG151 역전사 효소 단백질 532 MG151-95 역전사 효소 단백질
MG151 역전사 효소 단백질 533 MG151-96 역전사 효소 단백질
MG151 역전사 효소 단백질 534 MG151-97 역전사 효소 단백질
MG151 역전사 효소 단백질 535 MG151-98 역전사 효소 단백질
MG151 역전사 효소 단백질 536 MG151-99 역전사 효소 단백질
MG151 역전사 효소 단백질 537 MG151-100 역전사 효소 단백질
MG151 역전사 효소 단백질 538 MG151-101 역전사 효소 단백질
MG151 역전사 효소 단백질 539 MG151-102 역전사 효소 단백질
MG151 역전사 효소 단백질 540 MG151-103 역전사 효소 단백질
MG151 역전사 효소 단백질 541 MG151-104 역전사 효소 단백질
MG151 역전사 효소 단백질 542 MG151-105 역전사 효소 단백질
MG151 역전사 효소 단백질 543 MG151-106 역전사 효소 단백질
MG151 역전사 효소 단백질 544 MG151-107 역전사 효소 단백질
MG151 역전사 효소 단백질 545 MG151-108 역전사 효소 단백질
MG151 역전사 효소 단백질 546 MG151-109 역전사 효소 단백질
MG151 역전사 효소 단백질 547 MG151-110 역전사 효소 단백질
MG151 역전사 효소 단백질 548 MG151-111 역전사 효소 단백질
MG151 역전사 효소 단백질 549 MG151-112 역전사 효소 단백질
MG151 역전사 효소 단백질 550 MG151-113 역전사 효소 단백질
MG151 역전사 효소 단백질 551 MG151-114 역전사 효소 단백질
MG151 역전사 효소 단백질 552 MG151-115 역전사 효소 단백질
MG151 역전사 효소 단백질 553 MG151-116 역전사 효소 단백질
MG151 역전사 효소 단백질 554 MG151-117 역전사 효소 단백질
MG153 역전사 효소 단백질 555 MG153-1 역전사 효소 단백질
MG153 역전사 효소 단백질 556 MG153-2 역전사 효소 단백질
MG153 역전사 효소 단백질 557 MG153-3 역전사 효소 단백질
MG153 역전사 효소 단백질 558 MG153-4 역전사 효소 단백질
MG153 역전사 효소 단백질 559 MG153-5 역전사 효소 단백질
MG153 역전사 효소 단백질 560 MG153-6 역전사 효소 단백질
MG153 역전사 효소 단백질 561 MG153-7 역전사 효소 단백질
MG153 역전사 효소 단백질 562 MG153-8 역전사 효소 단백질
MG153 역전사 효소 단백질 563 MG153-9 역전사 효소 단백질
MG153 역전사 효소 단백질 564 MG153-10 역전사 효소 단백질
MG153 역전사 효소 단백질 565 MG153-11 역전사 효소 단백질
MG153 역전사 효소 단백질 566 MG153-12 역전사 효소 단백질
MG153 역전사 효소 단백질 567 MG153-13 역전사 효소 단백질
MG153 역전사 효소 단백질 568 MG153-14 역전사 효소 단백질
MG153 역전사 효소 단백질 569 MG153-15 역전사 효소 단백질
MG153 역전사 효소 단백질 570 MG153-16 역전사 효소 단백질
MG153 역전사 효소 단백질 571 MG153-17 역전사 효소 단백질
MG153 역전사 효소 단백질 572 MG153-18 역전사 효소 단백질
MG153 역전사 효소 단백질 573 MG153-19 역전사 효소 단백질
MG153 역전사 효소 단백질 574 MG153-20 역전사 효소 단백질
MG153 역전사 효소 단백질 575 MG153-21 역전사 효소 단백질
MG153 역전사 효소 단백질 576 MG153-25 역전사 효소 단백질
MG153 역전사 효소 단백질 577 MG153-26 역전사 효소 단백질
MG153 역전사 효소 단백질 578 MG153-27 역전사 효소 단백질
MG153 역전사 효소 단백질 579 MG153-28 역전사 효소 단백질
MG153 역전사 효소 단백질 580 MG153-29 역전사 효소 단백질
MG153 역전사 효소 단백질 581 MG153-30 역전사 효소 단백질
MG153 역전사 효소 단백질 582 MG153-31 역전사 효소 단백질
MG153 역전사 효소 단백질 583 MG153-32 역전사 효소 단백질
MG153 역전사 효소 단백질 584 MG153-33 역전사 효소 단백질
MG153 역전사 효소 단백질 585 MG153-34 역전사 효소 단백질
MG153 역전사 효소 단백질 586 MG153-35 역전사 효소 단백질
MG153 역전사 효소 단백질 587 MG153-36 역전사 효소 단백질
MG153 역전사 효소 단백질 588 MG153-37 역전사 효소 단백질
MG153 역전사 효소 단백질 589 MG153-38 역전사 효소 단백질
MG153 역전사 효소 단백질 590 MG153-39 역전사 효소 단백질
MG153 역전사 효소 단백질 591 MG153-40 역전사 효소 단백질
MG153 역전사 효소 단백질 592 MG153-41 역전사 효소 단백질
MG153 역전사 효소 단백질 593 MG153-42 역전사 효소 단백질
MG153 역전사 효소 단백질 594 MG153-43 역전사 효소 단백질
MG153 역전사 효소 단백질 595 MG153-44 역전사 효소 단백질
MG153 역전사 효소 단백질 596 MG153-45 역전사 효소 단백질
MG153 역전사 효소 단백질 597 MG153-46 역전사 효소 단백질
MG153 역전사 효소 단백질 598 MG153-47 역전사 효소 단백질
MG153 역전사 효소 단백질 599 MG153-48 역전사 효소 단백질
MG153 역전사 효소 단백질 600 MG153-49 역전사 효소 단백질
MG153 역전사 효소 단백질 601 MG153-50 역전사 효소 단백질
MG153 역전사 효소 단백질 602 MG153-51 역전사 효소 단백질
MG153 역전사 효소 단백질 603 MG153-52 역전사 효소 단백질
MG153 역전사 효소 단백질 604 MG153-53 역전사 효소 단백질
MG153 역전사 효소 단백질 605 MG153-54 역전사 효소 단백질
MG153 역전사 효소 단백질 606 MG153-55 역전사 효소 단백질
MG153 역전사 효소 단백질 607 MG153-56 역전사 효소 단백질
MG153 역전사 효소 단백질 608 MG153-57 역전사 효소 단백질
MG154 역전사 효소 단백질 609 MG154-1 역전사 효소 단백질
MG154 역전사 효소 단백질 610 MG154-2 역전사 효소 단백질
MG155 역전사 효소 단백질 611 MG155-1 역전사 효소 단백질
MG155 역전사 효소 단백질 612 MG155-2 역전사 효소 단백질
MG155 역전사 효소 단백질 613 MG155-3 역전사 효소 단백질
MG155 역전사 효소 단백질 614 MG155-4 역전사 효소 단백질
MG155 역전사 효소 단백질 615 MG155-5 역전사 효소 단백질
MG156 역전사 효소 단백질 616 MG156-1 역전사 효소 단백질
MG156 역전사 효소 단백질 617 MG156-2 역전사 효소 단백질
MG157 역전사 효소 단백질 618 MG157-1 역전사 효소 단백질
MG157 역전사 효소 단백질 619 MG157-2 역전사 효소 단백질
MG157 역전사 효소 단백질 620 MG157-3 역전사 효소 단백질
MG157 역전사 효소 단백질 621 MG157-4 역전사 효소 단백질
MG157 역전사 효소 단백질 622 MG157-5 역전사 효소 단백질
MG158 역전사 효소 단백질 623 MG158-1 역전사 효소 단백질
MG159 역전사 효소 단백질 624 MG159-1 역전사 효소 단백질
MG159 역전사 효소 단백질 625 MG159-2 역전사 효소 단백질
MG159 역전사 효소 단백질 626 MG159-3 역전사 효소 단백질
MG160 역전사 효소 단백질 627 MG160-1 역전사 효소 단백질
MG160 역전사 효소 단백질 628 MG160-2 역전사 효소 단백질
MG160 역전사 효소 단백질 629 MG160-3 역전사 효소 단백질
MG160 역전사 효소 단백질 630 MG160-4 역전사 효소 단백질
MG160 역전사 효소 단백질 631 MG160-5 역전사 효소 단백질
MG160 역전사 효소 단백질 632 MG160-8 역전사 효소 단백질
MG160 역전사 효소 단백질 633 MG160-6 역전사 효소 단백질
MG160 역전사 효소 단백질 634 MG160-9 역전사 효소 단백질
MG160 역전사 효소 단백질 635 MG160-10 역전사 효소 단백질
MG160 역전사 효소 단백질 636 MG160-11 역전사 효소 단백질
MG160 역전사 효소 단백질 637 MG160-12 역전사 효소 단백질
MG160 역전사 효소 단백질 638 MG160-13 역전사 효소 단백질
MG160 역전사 효소 단백질 639 MG160-14 역전사 효소 단백질
MG160 역전사 효소 단백질 640 MG160-15 역전사 효소 단백질
MG160 역전사 효소 단백질 641 MG160-16 역전사 효소 단백질
MG160 역전사 효소 단백질 642 MG160-17 역전사 효소 단백질
MG160 역전사 효소 단백질 643 MG160-18 역전사 효소 단백질
MG160 역전사 효소 단백질 644 MG160-19 역전사 효소 단백질
MG160 역전사 효소 단백질 645 MG160-20 역전사 효소 단백질
MG160 역전사 효소 단백질 646 MG160-21 역전사 효소 단백질
MG160 역전사 효소 단백질 647 MG160-22 역전사 효소 단백질
MG160 역전사 효소 단백질 648 MG160-23 역전사 효소 단백질
MG160 역전사 효소 단백질 649 MG160-24 역전사 효소 단백질
MG160 역전사 효소 단백질 650 MG160-25 역전사 효소 단백질
MG160 역전사 효소 단백질 651 MG160-26 역전사 효소 단백질
MG160 역전사 효소 단백질 652 MG160-27 역전사 효소 단백질
MG160 역전사 효소 단백질 653 MG160-28 역전사 효소 단백질
MG160 역전사 효소 단백질 654 MG160-29 역전사 효소 단백질
MG160 역전사 효소 단백질 655 MG160-30 역전사 효소 단백질
MG160 역전사 효소 단백질 656 MG160-31 역전사 효소 단백질
MG160 역전사 효소 단백질 657 MG160-32 역전사 효소 단백질
MG160 역전사 효소 단백질 658 MG160-33 역전사 효소 단백질
MG160 역전사 효소 단백질 659 MG160-34 역전사 효소 단백질
MG160 역전사 효소 단백질 660 MG160-35 역전사 효소 단백질
MG160 역전사 효소 단백질 661 MG160-36 역전사 효소 단백질
MG160 역전사 효소 단백질 662 MG160-37 역전사 효소 단백질
MG160 역전사 효소 단백질 663 MG160-38 역전사 효소 단백질
MG160 역전사 효소 단백질 664 MG160-39 역전사 효소 단백질
MG160 역전사 효소 단백질 665 MG160-40 역전사 효소 단백질
MG160 역전사 효소 단백질 666 MG160-41 역전사 효소 단백질
MG160 역전사 효소 단백질 667 MG160-42 역전사 효소 단백질
MG160 역전사 효소 단백질 668 MG160-43 역전사 효소 단백질
MG160 역전사 효소 단백질 669 MG160-44 역전사 효소 단백질
MG160 역전사 효소 단백질 670 MG160-45 역전사 효소 단백질
MG160 역전사 효소 단백질 671 MG160-46 역전사 효소 단백질
MG160 역전사 효소 단백질 672 MG160-47 역전사 효소 단백질
MG160 역전사 효소 단백질 673 MG160-48 역전사 효소 단백질
MG163 역전사 효소 단백질 674 MG163-1 역전사 효소 단백질
MG163 역전사 효소 단백질 675 MG163-2 역전사 효소 단백질
MG163 역전사 효소 단백질 676 MG163-3 역전사 효소 단백질
MG163 역전사 효소 단백질 677 MG163-4 역전사 효소 단백질
MG163 역전사 효소 단백질 678 MG163-5 역전사 효소 단백질
MG164 역전사 효소 단백질 679 MG164-1 역전사 효소 단백질
MG164 역전사 효소 단백질 680 MG164-2 역전사 효소 단백질
MG164 역전사 효소 단백질 681 MG164-3 역전사 효소 단백질
MG164 역전사 효소 단백질 682 MG164-4 역전사 효소 단백질
MG164 역전사 효소 단백질 683 MG164-5 역전사 효소 단백질
MG165 역전사 효소 단백질 684 MG165-1 역전사 효소 단백질
MG165 역전사 효소 단백질 685 MG165-2 역전사 효소 단백질
MG165 역전사 효소 단백질 686 MG165-3 역전사 효소 단백질
MG165 역전사 효소 단백질 687 MG165-4 역전사 효소 단백질
MG165 역전사 효소 단백질 688 MG165-5 역전사 효소 단백질
MG165 역전사 효소 단백질 689 MG165-6 역전사 효소 단백질
MG165 역전사 효소 단백질 690 MG165-7 역전사 효소 단백질
MG165 역전사 효소 단백질 691 MG165-8 역전사 효소 단백질
MG165 역전사 효소 단백질 692 MG165-9 역전사 효소 단백질
MG166 역전사 효소 단백질 693 MG166-1 역전사 효소 단백질
MG166 역전사 효소 단백질 694 MG166-2 역전사 효소 단백질
MG166 역전사 효소 단백질 695 MG166-3 역전사 효소 단백질
MG166 역전사 효소 단백질 696 MG166-4 역전사 효소 단백질
MG166 역전사 효소 단백질 697 MG166-5 역전사 효소 단백질
MG167 역전사 효소 단백질 698 MG167-1 역전사 효소 단백질
MG167 역전사 효소 단백질 699 MG167-2 역전사 효소 단백질
MG167 역전사 효소 단백질 700 MG167-3 역전사 효소 단백질
MG167 역전사 효소 단백질 701 MG167-4 역전사 효소 단백질
MG167 역전사 효소 단백질 702 MG167-5 역전사 효소 단백질
MG168 역전사 효소 단백질 703 MG168-1 역전사 효소 단백질
MG168 역전사 효소 단백질 704 MG168-2 역전사 효소 단백질
MG168 역전사 효소 단백질 705 MG168-3 역전사 효소 단백질
MG168 역전사 효소 단백질 706 MG168-4 역전사 효소 단백질
MG168 역전사 효소 단백질 707 MG168-5 역전사 효소 단백질
MG169 역전사 효소 단백질 708 MG169-1 역전사 효소 단백질
MG169 역전사 효소 단백질 709 MG169-2 역전사 효소 단백질
MG169 역전사 효소 단백질 710 MG169-3 역전사 효소 단백질
MG169 역전사 효소 단백질 711 MG169-4 역전사 효소 단백질
MG169 역전사 효소 단백질 712 MG169-5 역전사 효소 단백질
MG169 역전사 효소 단백질 713 MG169-6 역전사 효소 단백질
MG169 역전사 효소 단백질 714 MG169-7 역전사 효소 단백질
MG169 역전사 효소 단백질 715 MG169-8 역전사 효소 단백질
MG169 역전사 효소 단백질 716 MG169-9 역전사 효소 단백질
MG169 역전사 효소 단백질 717 MG169-10 역전사 효소 단백질
MG169 역전사 효소 단백질 718 MG169-11 역전사 효소 단백질
MG170 역전사 효소 단백질 719 MG170-1 역전사 효소 단백질
MG170 역전사 효소 단백질 720 MG170-2 역전사 효소 단백질
MG170 역전사 효소 단백질 721 MG170-3 역전사 효소 단백질
MG170 역전사 효소 단백질 722 MG170-4 역전사 효소 단백질
MG170 역전사 효소 단백질 723 MG170-5 역전사 효소 단백질
MG170 역전사 효소 단백질 724 MG170-6 역전사 효소 단백질
MG170 역전사 효소 단백질 725 MG170-7 역전사 효소 단백질
MG170 역전사 효소 단백질 726 MG170-8 역전사 효소 단백질
MG170 역전사 효소 단백질 727 MG170-9 역전사 효소 단백질
MG170 역전사 효소 단백질 728 MG170-10 역전사 효소 단백질
MG172 역전사 효소 단백질 729 MG172-1 역전사 효소 단백질
MG172 역전사 효소 단백질 730 MG172-2 역전사 효소 단백질
MG172 역전사 효소 단백질 731 MG172-3 역전사 효소 단백질
MG172 역전사 효소 단백질 732 MG172-4 역전사 효소 단백질
MG172 역전사 효소 단백질 733 MG172-5 역전사 효소 단백질
MG173 역전사 효소 단백질 734 MG173-1 역전사 효소 단백질
MG173 역전사 효소 단백질 735 MG173-2 역전사 효소 단백질
PS 변형된 프라이머 736 PS-변형된 DNA 프라이머 #1, *로 표시된 PS 결합 뉴클레오티드
PS 변형된 프라이머 737 PS-변형된 DNA 프라이머 #2, *로 표시된 PS 결합 뉴클레오티드
PS 변형된 프라이머 738 PS-변형된 DNA 프라이머 #3, *로 표시된 PS 결합 뉴클레오티드
QPCR용 Taqman 프로브 739 542 bp 앰플리콘용 Taqman 프로브 뉴클레오티드
MG153 RT MCP 융합 740 FH-MCP-MG153-5 뉴클레오티드
MG153 RT MCP 융합 741 FH-MCP-MG153-6 뉴클레오티드
MG153 RT MCP 융합 742 FH-MCP-MG153-18 뉴클레오티드
MG153 RT MCP 융합 743 FH-MCP-MG153-20 뉴클레오티드
MG153 RT MCP 융합 744 FH-MCP-MG153-29 뉴클레오티드
MG153 RT MCP 융합 745 FH-MCP-MG153-30 뉴클레오티드
MG153 RT MCP 융합 746 FH-MCP-MG153-31 뉴클레오티드
MG153 RT MCP 융합 747 FH-MCP-MG153-33 뉴클레오티드
MG153 RT MCP 융합 748 FH-MCP-MG153-34 뉴클레오티드
MG153 RT MCP 융합 749 FH-MCP-MG153-35 뉴클레오티드
MG153 RT MCP 융합 750 FH-MCP-MG153-36 뉴클레오티드
MG153 RT MCP 융합 751 FH-MCP-MG153-37 뉴클레오티드
MG153 RT MCP 융합 752 FH-MCP-MG153-45 뉴클레오티드
MG153 RT MCP 융합 753 FH-MCP-MG153-51 뉴클레오티드
MG153 RT MCP 융합 754 FH-MCP-MG153-53 뉴클레오티드
MG153 RT MCP 융합 755 FH-MCP-MG153-54 뉴클레오티드
MG153 RT MCP 융합 756 FH-MCP-MG153-57 뉴클레오티드
MG165 RT MCP 융합 757 FH-MCP-MG165-1 뉴클레오티드
MG165 RT MCP 융합 758 FH-MCP-MG165-5 뉴클레오티드
MG167 RT MCP 융합 759 FH-MCP-MG167-1 뉴클레오티드
MG167 RT MCP 융합 760 FH-MCP-MG167-4 뉴클레오티드
MG140 UTR 761 MG140-54 5' UTR 뉴클레오티드
MG140 UTR 762 MG140-54 3' UTR 뉴클레오티드
MG140 UTR 763 MG140-55 5' UTR 뉴클레오티드
MG140 UTR 764 MG140-55 3' UTR 뉴클레오티드
MG140 UTR 765 MG140-56 5' UTR 뉴클레오티드
MG140 UTR 766 MG140-56 3' UTR 뉴클레오티드
MG140 UTR 767 MG140-1 5' UTR 뉴클레오티드
MG140 UTR 768 MG140-1 3' UTR 뉴클레오티드
MG140 UTR 769 MG140-3 5' UTR 뉴클레오티드
MG140 UTR 770 MG140-3 3' UTR 뉴클레오티드
MG140 UTR 771 MG140-4 5' UTR 뉴클레오티드
MG140 UTR 772 MG140-4 3' UTR 뉴클레오티드
MG140 UTR 773 MG140-5 5' UTR 뉴클레오티드
MG140 UTR 774 MG140-5 3' UTR 뉴클레오티드
MG140 UTR 775 MG140-6 5' UTR 뉴클레오티드
MG140 UTR 776 MG140-6 3' UTR 뉴클레오티드
MG140 UTR 777 MG140-7 5' UTR 뉴클레오티드
MG140 UTR 778 MG140-7 3' UTR 뉴클레오티드
MG140 UTR 779 MG140-8 5' UTR 뉴클레오티드
MG140 UTR 780 MG140-8 3' UTR 뉴클레오티드
MG140 UTR 781 MG140-10 5' UTR 뉴클레오티드
MG140 UTR 782 MG140-10 3' UTR 뉴클레오티드
MG140 UTR 783 MG140-13 5' UTR 뉴클레오티드
MG140 UTR 784 MG140-13 3' UTR 뉴클레오티드
MG140 UTR 785 MG140-14 5' UTR 뉴클레오티드
MG140 UTR 786 MG140-14 3' UTR 뉴클레오티드
MG140 UTR 787 MG140-45 5' UTR 뉴클레오티드
MG140 UTR 788 MG140-45 3' UTR 뉴클레오티드
MG140 UTR 789 MG140-46 5' UTR 뉴클레오티드
MG140 UTR 790 MG140-46 3' UTR 뉴클레오티드
MG140 UTR 791 MG140-47 5' UTR 뉴클레오티드
MG140 UTR 792 MG140-47 3' UTR 뉴클레오티드
MG140 UTR 793 MG140-54 5' UTR 뉴클레오티드
MG140 UTR 794 MG140-54 3' UTR 뉴클레오티드
MG140 UTR 795 MG140-55 5' UTR 뉴클레오티드
MG140 UTR 796 MG140-55 3' UTR 뉴클레오티드
MG140 UTR 797 MG140-56 5' UTR 뉴클레오티드
MG140 UTR 798 MG140-56 3' UTR 뉴클레오티드
MG140 역전사 효소 단백질 799 MG140-54 역전사 효소 단백질
MG140 역전사 효소 단백질 800 MG140-55 역전사 효소 단백질
MG140 역전사 효소 단백질 801 MG140-56 역전사 효소 단백질
MG140 역전사 효소 단백질 802 MG140-54 역전사 효소 단백질
MG140 역전사 효소 단백질 803 MG140-55 역전사 효소 단백질
MG140 역전사 효소 단백질 804 MG140-56 역전사 효소 단백질
MG140 역전사 효소 단백질 805 MG140-57 역전사 효소 단백질
MG140 역전사 효소 단백질 806 MG140-58 역전사 효소 단백질
MG140 역전사 효소 단백질 807 MG140-59 역전사 효소 단백질
MG140 역전사 효소 단백질 808 MG140-60 역전사 효소 단백질
MG140 역전사 효소 단백질 809 MG140-61 역전사 효소 단백질
MG140 역전사 효소 단백질 810 MG140-62 역전사 효소 단백질
MG140 역전사 효소 단백질 811 MG140-63 역전사 효소 단백질
MG140 역전사 효소 단백질 812 MG140-64 역전사 효소 단백질
MG140 역전사 효소 단백질 813 MG140-65 역전사 효소 단백질
MG140 역전사 효소 단백질 814 MG140-66 역전사 효소 단백질
MG140 역전사 효소 단백질 815 MG140-67 역전사 효소 단백질
MG140 역전사 효소 단백질 816 MG140-68 역전사 효소 단백질
MG140 역전사 효소 단백질 817 MG140-69 역전사 효소 단백질
MG140 역전사 효소 단백질 818 MG140-70 역전사 효소 단백질
MG140 역전사 효소 단백질 819 MG140-71 역전사 효소 단백질
MG140 역전사 효소 단백질 820 MG140-72 역전사 효소 단백질
MG140 역전사 효소 단백질 821 MG140-73 역전사 효소 단백질
MG140 역전사 효소 단백질 822 MG140-74 역전사 효소 단백질
MG140 역전사 효소 단백질 823 MG140-75 역전사 효소 단백질
MG140 역전사 효소 단백질 824 MG140-76 역전사 효소 단백질
MG140 역전사 효소 단백질 825 MG140-77 역전사 효소 단백질
MG140 역전사 효소 단백질 826 MG140-78 역전사 효소 단백질
MG140 역전사 효소 단백질 827 MG140-79 역전사 효소 단백질
MG140 역전사 효소 단백질 828 MG140-80 역전사 효소 단백질
MG140 역전사 효소 단백질 829 MG140-81 역전사 효소 단백질
MG140 역전사 효소 단백질 830 MG140-82 역전사 효소 단백질
MG140 역전사 효소 단백질 831 MG140-83 역전사 효소 단백질
MG140 역전사 효소 단백질 832 MG140-84 역전사 효소 단백질
MG140 역전사 효소 단백질 833 MG140-85 역전사 효소 단백질
MG140 역전사 효소 단백질 834 MG140-86 역전사 효소 단백질
MG140 역전사 효소 단백질 835 MG140-87 역전사 효소 단백질
MG140 역전사 효소 단백질 836 MG140-88 역전사 효소 단백질
MG140 역전사 효소 단백질 837 MG140-89 역전사 효소 단백질
MG140 역전사 효소 단백질 838 MG140-90 역전사 효소 단백질
MG140 역전사 효소 단백질 839 MG140-91 역전사 효소 단백질
MG140 역전사 효소 단백질 840 MG140-92 역전사 효소 단백질
MG140 역전사 효소 단백질 841 MG140-93 역전사 효소 단백질
MG140 역전사 효소 단백질 842 MG140-94 역전사 효소 단백질
MG140 역전사 효소 단백질 843 MG140-95 역전사 효소 단백질
MG140 역전사 효소 단백질 844 MG140-96 역전사 효소 단백질
MG140 역전사 효소 단백질 845 MG140-97 역전사 효소 단백질
MG140 역전사 효소 단백질 846 MG140-98 역전사 효소 단백질
MG140 역전사 효소 단백질 847 MG140-99 역전사 효소 단백질
MG140 역전사 효소 단백질 848 MG140-100 역전사 효소 단백질
MG140 역전사 효소 단백질 849 MG140-101 역전사 효소 단백질
MG140 역전사 효소 단백질 850 MG140-102 역전사 효소 단백질
MG140 역전사 효소 단백질 851 MG140-103 역전사 효소 단백질
MG140 역전사 효소 단백질 852 MG140-104 역전사 효소 단백질
MG140 역전사 효소 단백질 853 MG140-105 역전사 효소 단백질
MG140 역전사 효소 단백질 854 MG140-106 역전사 효소 단백질
MG140 역전사 효소 단백질 855 MG140-107 역전사 효소 단백질
MG140 역전사 효소 단백질 856 MG140-108 역전사 효소 단백질
MG140 역전사 효소 단백질 857 MG140-109 역전사 효소 단백질
MG140 역전사 효소 단백질 858 MG140-110 역전사 효소 단백질
MG140 역전사 효소 단백질 859 MG140-111 역전사 효소 단백질
MG140 역전사 효소 단백질 860 MG140-112 역전사 효소 단백질
MG140 역전사 효소 단백질 861 MG140-113 역전사 효소 단백질
MG140 역전사 효소 단백질 862 MG140-114 역전사 효소 단백질
MG140 역전사 효소 단백질 863 MG140-115 역전사 효소 단백질
MG140 역전사 효소 단백질 864 MG140-116 역전사 효소 단백질
MG140 역전사 효소 단백질 865 MG140-117 역전사 효소 단백질
MG140 역전사 효소 단백질 866 MG140-118 역전사 효소 단백질
MG140 역전사 효소 단백질 867 MG140-119 역전사 효소 단백질
MG140 역전사 효소 단백질 868 MG140-120 역전사 효소 단백질
MG140 역전사 효소 단백질 869 MG140-121 역전사 효소 단백질
MG140 역전사 효소 단백질 870 MG140-122 역전사 효소 단백질
MG140 역전사 효소 단백질 871 MG140-123 역전사 효소 단백질
MG140 역전사 효소 단백질 872 MG140-124 역전사 효소 단백질
MG140 역전사 효소 단백질 873 MG140-125 역전사 효소 단백질
MG140 역전사 효소 단백질 874 MG140-126 역전사 효소 단백질
MG140 역전사 효소 단백질 875 MG140-127 역전사 효소 단백질
MG140 역전사 효소 단백질 876 MG140-128 역전사 효소 단백질
MG140 역전사 효소 단백질 877 MG140-129 역전사 효소 단백질
MG140 역전사 효소 단백질 878 MG140-130 역전사 효소 단백질
MG140 역전사 효소 단백질 879 MG140-131 역전사 효소 단백질
MG140 역전사 효소 단백질 880 MG140-132 역전사 효소 단백질
MG140 역전사 효소 단백질 881 MG140-133 역전사 효소 단백질
MG140 역전사 효소 단백질 882 MG140-134 역전사 효소 단백질
MG140 역전사 효소 단백질 883 MG140-135 역전사 효소 단백질
MG140 역전사 효소 단백질 884 MG140-136 역전사 효소 단백질
MG140 역전사 효소 단백질 885 MG140-137 역전사 효소 단백질
MG140 역전사 효소 단백질 886 MG140-138 역전사 효소 단백질
MG140 역전사 효소 단백질 887 MG140-139 역전사 효소 단백질
MG140 역전사 효소 단백질 888 MG140-140 역전사 효소 단백질
MG140 역전사 효소 단백질 889 MG140-141 역전사 효소 단백질
MG140 역전사 효소 단백질 890 MG140-142 역전사 효소 단백질
MG140 역전사 효소 단백질 891 MG140-143 역전사 효소 단백질
MG140 역전사 효소 단백질 892 MG140-144 역전사 효소 단백질
MG140 역전사 효소 단백질 893 MG140-145 역전사 효소 단백질
MG140 역전사 효소 단백질 894 MG140-146 역전사 효소 단백질
MG146 전위 단백질 895 MG146-2 전위 단백질 단백질
실시예
다음의 실시예는 어떤 방식으로도 제한하려는 것이 아니다.
실시예 1. 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하며, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 시스템.
실시예 2. 실시예 실시예 1에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 3. 실시예 실시예 1 또는 실시예 실시예 2에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 4. 실시예 실시예 1 내지 실시예 3 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 5. 실시예 실시예 1 내지 실시예 4 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 6. 실시예 실시예 1 내지 실시예 5 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.
실시예 7. 실시예 실시예 1 내지 실시예 6 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 비번역 영역(UTR) 및 5' 비번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 8. 실시예 실시예 1 내지 실시예 7 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.
실시예 9. 실시예 실시예 1 내지 실시예 8 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 10. 실시예 실시예 1 내지 실시예 9 중 어느 하나에 있어서, 상기 NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 11. 실시예 실시예 1 내지 실시예 10 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 12. 실시예 실시예 11에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 13. 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하며, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 14. 실시예 실시예 13에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 조작된 레트로트랜스포사제 시스템.
실시예 15. 실시예 실시예 13 또는 실시예 실시예 14에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 16. 실시예 실시예 13 내지 실시예 15 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 17. 실시예 실시예 13 내지 실시예 16 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 18. 실시예 실시예 13 내지 실시예 17 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.
실시예 19. 실시예 실시예 13 내지 실시예 18 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 20. 실시예 실시예 13 내지 실시예 19 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.
실시예 21. 실시예 실시예 13 내지 실시예 20 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 22. 실시예 실시예 21에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 23. 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 암호화하는, 데옥시리보핵산 폴리뉴클레오티드.
실시예 24. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 여기서 상기 핵산은 레트로트랜스포사제를 암호화하고, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 상기 유기체는 상기 미배양 미생물이 아닌, 핵산.
실시예 25. 실시예 실시예 24에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함하는, 핵산.
실시예 26. 실시예 실시예 24 또는 실시예 실시예 25에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함하는, 핵산.
실시예 27. 실시예 실시예 26에 있어서, 상기 NLS는 서열번호 896-911로부터 선택되는 서열을 포함하는, 핵산.
실시예 28. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 897을 포함하는, 핵산.
실시예 29. 실시예 실시예 28에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 N-말단에 근접한, 핵산.
실시예 30. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 896을 포함하는, 핵산.
실시예 31. 실시예 실시예 30에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 C-말단에 근접한, 핵산.
실시예 32. 실시예 실시예 24 내지 실시예 31에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간인, 핵산.
실시예 33. 실시예 실시예 24 내지 실시예 32 중 어느 하나의 상기 핵산을 포함하는, 벡터.
실시예 34. 실시예 실시예 33에 있어서, 상기 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함하는, 벡터.
실시예 35. 실시예 실시예 33 또는 실시예 실시예 34에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스인, 벡터.
실시예 36. 실시예 실시예 33 내지 실시예 35 중 어느 하나의 상기 벡터를 포함하는, 세포.
실시예 37. 레트로트랜스포사제를 제조하는 방법으로서, 실시예 실시예 36의 상기 세포를 배양하는 단계를 포함하는, 방법.
실시예 38. 표적 핵산 유전자좌를 포함하는 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 파괴, 결합, 닉킹, 절단, 마킹, 또는 변형시키는 방법으로서, 상기 방법은
(a) 상기 표적 핵산 유전자좌를 포함하는 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 상기 표적 핵산 유전자좌에 카고 뉴클레오티드 서열을 전위시키도록 구성된 레트로트랜스포사제와 접촉시키는 단계를 포함하고;
(b) 여기서 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 방법.
실시예 39. 실시예 실시예 38에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 방법.
실시예 40. 실시예 실시예 38 또는 실시예 실시예 39에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 41. 실시예 실시예 38 내지 실시예 40 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 42. 실시예 실시예 38 내지 실시예 41 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 43. 실시예 실시예 38 내지 실시예 42 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 방법.
실시예 44. 실시예 실시예 38 내지 실시예 43 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 45. 실시예 실시예 38 내지 실시예 44 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위되는, 방법.
실시예 46. 실시예 실시예 38 내지 실시예 45 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드인, 방법.
실시예 47. 표적 핵산 유전자좌를 파괴 또는 변형시키는 방법으로서, 상기 방법은 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 상기 표적 핵산 유전자좌에 전위시키도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는, 방법.
실시예 48. 실시예 실시예 47에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 단계는 상기 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형 또는 전위시키는 단계를 포함하는, 방법.
실시예 49. 실시예 실시예 47 내지 실시예 48에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함하는, 방법.
실시예 50. 실시예 실시예 49에 있어서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함하는, 방법.
실시예 51. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는, 방법.
실시예 52. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는, 방법.
실시예 53. 실시예 실시예 52에 있어서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포인, 방법.
실시예 54. 실시예 실시예 52 또는 실시예 53에 있어서, 상기 세포는 일차 세포인, 방법.
실시예 55. 실시예 실시예 54에 있어서, 상기 일차 세포는 T 세포인, 방법.
실시예 56. 실시예 실시예 54에 있어서, 상기 일차 세포는 조혈 줄기 세포(HSC)인, 방법.
실시예 57. 실시예 실시예 47 내지 실시예 56 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 실시예 실시예 24 내지 실시예 32 중 어느 하나의 핵산 또는 실시예 실시예 33 내지 실시예 35 중 어느 하나의 벡터를 전달하는 단계를 포함하는, 방법.
실시예 58. 실시예 실시예 47 내지 실시예 57 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함하는, 방법.
실시예 59. 실시예 실시예 58에 있어서, 상기 핵산은 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함하는, 방법.
실시예 60. 실시예 실시예 47 내지 실시예 59 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함하는, 방법.
실시예 61. 실시예 실시예 47 내지 실시예 60 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함하는, 방법.
실시예 62. 실시예 실시예 47 내지 실시예 61 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴을 유도하지 않는, 방법.
실시예 63. 서열번호 1-29, 393-735, 또는 799-895 또는 이들의 변이체와 적어도 75%의 서열 동일성을 갖는 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는, 숙주 세포.
실시예 64. 실시예 실시예 63에 있어서, 상기 숙주 세포는 대장균 세포인, 숙주 세포.
실시예 65. 실시예 실시예 64에 있어서, 상기 대장균 세포는 λDE3 리소겐이거나 상기 대장균 세포는 BL21(DE3) 균주인, 숙주 세포.
실시예 66. 실시예 실시예 64 또는 실시예 실시예 65에 있어서, 상기 대장균 세포는 ompT lon 유전자형을 갖는, 숙주 세포.
실시예 67. 실시예 실시예 63 내지 실시예 66 중 어느 하나에 있어서, 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
실시예 68. 실시예 실시예 63 내지 실시예 67 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.
실시예 69. 실시예 실시예 68에 있어서, 상기 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그인, 숙주 세포.
실시예 70. 실시예 실시예 69 에 있어서, 상기 IMAC 태그는 폴리히스티딘 태그인, 숙주 세포.
실시예 71. 실시예 실시예 68에 있어서, 상기 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합인, 숙주 세포.
실시예 72. 실시예 실시예 68 내지 실시예 71 중 어느 하나에 있어서, 상기 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내에서 연결되는, 숙주 세포.
실시예 73. 실시예 실시예 72에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합인, 숙주 세포.
실시예 74. 실시예 실시예 63 내지 실시예 73 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포에서의 발현에 대해 코돈 최적화된, 숙주 세포.
실시예 75. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 벡터 상에 제공되는, 숙주 세포.
실시예 76. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포의 게놈에 통합되는, 숙주 세포.
실시예 77. 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.
실시예 78. 레트로트랜스포사제를 생산하는 방법으로서, 적합한 성장 배지 중 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 방법.
실시예 79. 실시예 실시예 78에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함하는, 방법.
실시예 80. 실시예 실시예 79에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.
실시예 81. 실시예 실시예 78 내지 실시예 80 중 어느 하나에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.
실시예 82. 실시예 실시예 81에 있어서, 상기 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.
실시예 83. 실시예 실시예 82에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함하는, 방법.
실시예 84. 실시예 실시예 83에 있어서, 상기 IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내 연결되는, 방법.
실시예 85. 실시예 실시예 84에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함하는, 방법.
실시예 86. 실시예 실시예 84 또는 실시예 실시예 85에 있어서, 상기 프로테아제 절단 부위에 상응하는 프로테아제를 상기 레트로트랜스포사제에 접촉시킴으로써 상기 IMAC 친화성 태그를 절단하는 단계를 추가로 포함하는, 방법.
실시예 87. 실시예 실시예 86에 있어서, 감산 IMAC 친화도 크로마토그래피를 수행하여 상기 레트로트랜스포사제를 포함하는 조성물로부터 상기 친화성 태그를 제거하는 단계를 추가로 포함하는, 방법.
실시예 88. 세포에서 유전자좌를 파괴하는 방법으로서, 상기 방법은 상기 세포를
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및
(b) 레트로트랜스포사제를 포함하는 조성물에 접촉하는 단계를 포함하고, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 형질도입하도록 구성되고;
상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895, 또는 이들의 변이체 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고;
상기 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 방법.
실시예 89. 실시예 실시예 88에 있어서, 상기 전위 활성은 상기 표적 핵산 유전자좌를 포함하는 세포에 상기 레트로트랜스포사제를 도입하고 상기 세포에서 상기 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정되는, 방법.
실시예 90. 실시예 실시예 88 또는 실시예 89에 있어서, 상기 조성물은 20 pmole 이하의 상기 레트로트랜스포사제를 포함하는, 방법.
실시예 91. 실시예 90에 있어서, 상기 조성물은 1 pmol 이하의 상기 레트로트랜스포사제를 포함하는, 방법.

Claims (141)

  1. 조작된 레트로트랜스포사제 시스템으로서,
    (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
    (b) 레트로트랜스포사제를 포함하고, 여기서
    (i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
    (ii) 상기 레트로트랜스포사제는 역전사 효소(RT) 도메인, 서열번호 1-29 또는 393-401 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템.
  2. 제1항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  3. 제1항 또는 제2항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 포함하는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, (c) 상기 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  8. 제7항에 있어서, 상기 이중-가닥 DNA 서열은 상기 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하고, 여기서 상기 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 상기 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 상기 카고 서열의 5' 서열 또는 상기 카고 서열의 3' 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함하는, 조작된 레트로트랜스포사제 시스템.
  13. 조작된 DNA 서열로서,
    (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
    (b) 이종 카고 서열;
    (c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 서열; 및
    (d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열.
  14. 제13항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
  15. 제13항 또는 제14항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 조작된 DNA 서열.
  19. 제13항 내지 제18항 중 어느 한 항에 있어서, 상기 5' 서열 또는 상기 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 조작된 DNA 서열.
  20. 상보성 DNA(cDNA)를 합성하는 방법으로서,
    (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
    (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
    (c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
  21. 제20항에 있어서, 상기 역전사 효소가 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  22. 제20항 또는 제21항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
  23. 제20항 내지 제22항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
  24. 제23항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
  25. 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  26. 제25항에 있어서, 상기 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  27. 제25항 또는 제26항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 방법.
  28. 제27항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 방법.
  29. 제25항 내지 제28항 중 어느 한 항의 단백질을 암호화하는, 핵산.
  30. 개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  31. 제30항에 있어서, 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
  32. 조작된 레트로트랜스포사제 시스템으로서,
    (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
    (b) 레트로트랜스포사제를 포함하고, 여기서
    (i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
    (ii) 상기 레트로트랜스포사제는 서열번호 402 또는 895의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
  33. 제32항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  34. 제32항 또는 제33항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  35. 제32항 내지 제34항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  36. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  37. 제32항 내지 제36항 중 어느 한 항에 있어서, (c) 상기 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
  38. 제32항 내지 제37항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
  39. 제32항 내지 제38항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
  40. 조작된 DNA 서열로서,
    (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
    (b) 이종 카고 서열;
    (c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및
    (d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열.
  41. 제40항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 DNA 서열.
  42. 제40항 또는 제41항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
  43. 제40항 내지 제42항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
  44. 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
  45. 상보성 DNA(cDNA)를 합성하는 방법으로서,
    (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
    (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
    (c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
  46. 제45항에 있어서, 상기 역전사 효소는 서열번호 402 또는 895와 적어도 80% 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  47. 제45항 또는 제46항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
  49. 제48항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
  50. 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  51. 제50항에 있어서, 상기 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  52. 제50항 또는 제51항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
  53. 제52항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
  54. 제50항 내지 제53항 중 어느 한 항의 단백질을 암호화하는, 핵산.
  55. 개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  56. 제55항에 있어서, 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
  57. 상보성 DNA(cDNA)를 합성하는 방법으로서,
    (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
    (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
    (c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
  58. 제57항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  59. 제58항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  60. 제57항 내지 제59항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
  61. 제57항 내지 제60항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함하는, 방법.
  62. 제57항 내지 제61항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
  63. 제62항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
  64. 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  65. 제64항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  66. 제65항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  67. 제64항 내지 제66항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인이 RNA-결합 단백질 도메인인, 단백질.
  68. 제67항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
  69. 제68항에 있어서, 상기 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  70. 제68항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575, 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  71. 제64항 내지 제70항 중 어느 한 항의 단백질을 암호화하는, 핵산.
  72. 개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  73. 제72항에 있어서, 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80%의 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
  74. 제73항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
  75. 서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소와 적어도 80% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산으로서, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  76. 제75항에 있어서, 상기 ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화하는, 핵산.
  77. 제75항 또는 제76항에 있어서, 상기 ORF는 상기 박테리아 유기체에서의 발현에 최적화되거나, 상기 유기체는 E. coli인, 핵산.
  78. 제75항 또는 제76항에 있어서, 상기 ORF는 포유류 유기체에서의 발현에 최적화되거나, 상기 유기체는 영장류 유기체인, 핵산.
  79. 제78항에 있어서, 상기 영장류 유기체는 H. 사피엔스인, 핵산.
  80. 제75항 내지 제79항 중 어느 한 항에 있어서, 상기 ORF는 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인을 암호화하는 상기 서열에 작동 가능하게 연결된 친화성 태그를 포함하고, 여기서 상기 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는, 핵산.
  81. 제77항에 있어서, 상기 ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
  82. 제75항 내지 제81항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함하는, 핵산.
  83. 상보성 DNA(cDNA)를 합성하는 방법으로서,
    (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
    (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
    (c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
  84. 제83항에 있어서, 상기 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  85. 제84항에 있어서, 상기 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  86. 제83항 내지 제85항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
  87. 제83항 내지 제86항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 상기 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
  88. 제87항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
  89. 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  90. 제89항에 있어서, 상기 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  91. 제90항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 단백질.
  92. 제89항 내지 제91항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
  93. 제92항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
  94. 제89항 내지 제93항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  95. 제89항 내지 제94항 중 어느 한 항의 단백질을 암호화하는, 핵산.
  96. 개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  97. 제96항에 있어서, 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
  98. 제97항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
  99. 제96항 내지 제98항 중 어느 한 항에 있어서, 상기 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
  100. 상보성 DNA(cDNA)를 합성하는 방법으로서,
    (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
    (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
    (c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소, 또는 이들의 변이체를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
  101. 제100항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 방법.
  102. 제100항 또는 제101항에 있어서, 상기 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
  103. 제100항 내지 제102항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
  104. 제100항 내지 제103항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 방법.
  105. 제100항 내지 제104항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
  106. 제105항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
  107. 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  108. 제107항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 단백질.
  109. 제107항 또는 제108항에 있어서, 상기 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
  110. 제107항 내지 제109항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
  111. 제110항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
  112. 제107항 내지 제112항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
  113. 제107항 내지 제112항 중 어느 한 항의 단백질을 암호화하는, 핵산.
  114. 유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  115. 제114항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 핵산.
  116. 제114항 또는 제115항에 있어서, 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
  117. 제114항 내지 제116항 중 어느 한 항에 있어서, 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
  118. 제117항에 있어서, 상기 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
  119. 제114항 내지 제115항 중 어느 한 항에 있어서, 상기 유기체는 상기 RT 도메인의 기원과 상이한, 핵산.
  120. 제119항에 있어서, 상기 ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
  121. 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
  122. 제121항에 있어서, DNA 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
  123. 제121항 또는 제122항에 있어서, 적어도 하나의 포스포로티오에이트 결합을 추가로 포함하는, 합성 올리고뉴클레오티드.
  124. 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 벡터.
  125. 본원에 기술된 단백질 중 어느 하나를 암호화하는, 핵산.
  126. 본원에 기술된 핵산 중 어느 하나를 포함하는, 숙주 세포.
  127. 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 벡터.
  128. 제124항 또는 제127항의 벡터를 포함하는, 숙주 세포.
  129. 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 숙주 세포.
  130. 제129항에 있어서, 상기 숙주 세포는 E. coli 세포인, 숙주 세포.
  131. 제129항 또는 제130항에 있어서, 상기 E. coli 세포는 λDE3 리소겐이거나 상기 E. coli 세포는 BL21(DE3) 균주인, 숙주 세포.
  132. 제130항 또는 제131항에 있어서, 상기 E. coli 세포가 ompT lon 유전자형을 갖는, 숙주 세포.
  133. 제129항 내지 제132항 중 어느 한 항에 있어서, 상기 핵산이 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하고, 여기서 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
  134. 제133항에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인을 암호화하는 서열에 프레임 내에 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.
  135. 제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.
  136. 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법으로서, 제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지에서 배양하는 단계를 포함하는, 방법.
  137. 제136항에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함하는, 방법.
  138. 제137항에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.
  139. 제138항에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.
  140. 제139항에 있어서, 상기 단백질 추출물을 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.
  141. 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항, 또는 제113항 내지 제120항 중 어느 한 항의 핵산 중 어느 하나의 RNA 동족체를 포함하는, 시험관 내에서 전사된 mRNA.
KR1020247009394A 2021-09-08 2022-09-07 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 KR20240051994A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163241943P 2021-09-08 2021-09-08
US63/241,943 2021-09-08
PCT/US2022/076061 WO2023039438A1 (en) 2021-09-08 2022-09-07 Systems, compositions, and methods involving retrotransposons and functional fragments thereof

Publications (1)

Publication Number Publication Date
KR20240051994A true KR20240051994A (ko) 2024-04-22

Family

ID=85506902

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247009394A KR20240051994A (ko) 2021-09-08 2022-09-07 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법

Country Status (5)

Country Link
KR (1) KR20240051994A (ko)
CN (1) CN118076731A (ko)
AU (1) AU2022343719A1 (ko)
CA (1) CA3230213A1 (ko)
WO (1) WO2023039438A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020047124A1 (en) * 2018-08-28 2020-03-05 Flagship Pioneering, Inc. Methods and compositions for modulating a genome

Also Published As

Publication number Publication date
AU2022343719A1 (en) 2024-04-11
CN118076731A (zh) 2024-05-24
WO2023039438A1 (en) 2023-03-16
CA3230213A1 (en) 2023-03-16

Similar Documents

Publication Publication Date Title
KR102623312B1 (ko) Ruvc 도메인이 존재하는 효소
US20200332273A1 (en) Enzymes with ruvc domains
WO2021178934A1 (en) Class ii, type v crispr systems
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
KR20240055073A (ko) 클래스 ii, v형 crispr 시스템
EP4127155A1 (en) Class ii, type ii crispr systems
KR20240053585A (ko) 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법
WO2023076952A1 (en) Enzymes with hepn domains
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
US20220220460A1 (en) Enzymes with ruvc domains
EP4200422A1 (en) Systems and methods for transposing cargo nucleotide sequences
KR20240051994A (ko) 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법
WO2023039434A1 (en) Systems and methods for transposing cargo nucleotide sequences
CN118119704A (zh) 用于转座货物核苷酸序列的系统和方法
US20240110167A1 (en) Enzymes with ruvc domains
WO2023039377A1 (en) Class ii, type v crispr systems
GB2617659A (en) Enzymes with RUVC domains
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法