KR20240051994A

KR20240051994A - 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법

Info

Publication number: KR20240051994A
Application number: KR1020247009394A
Authority: KR
Inventors: 브라이언 씨 토마스; 크리스토퍼 브라운; 다니엘라 에스에이 골트스만; 사라 라페리에르; 신디 카스텔; 리사 알렉산더; 메리 케이틀린 치우; 모라이마 테모체-디아즈; 아누 토마스
Original assignee: 메타지노미, 인크.
Priority date: 2021-09-08
Filing date: 2022-09-07
Publication date: 2024-04-22
Also published as: AU2022343719A1; CN118076731A; WO2023039438A1; CA3230213A1

Abstract

본 개시내용은 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키기 위한 시스템 및 방법을 제공한다. 이들 시스템 및 방법은 카고 뉴클레오티드 서열을 포함하는 핵산을 포함할 수 있으며, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제 및 레트로트랜스포사제와 상호 작용하도록 구성되고, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키도록 구성된다. 시스템 및 방법은 또한 레트로트랜스포사제의 기능적 단편의 사용을 포함할 수 있다.

Description

레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법

상호 참조

본 출원은 발명의 명칭이 "카고 뉴클레오티드 서열을 전위시키기 위한 시스템 및 방법(SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES)"인 2021년 9월 8일에 출원된 미국 가출원 제63/241,943호의 이익을 주장하며, 상기 출원은 그 전체가 참조로서 본원에 통합된다.

전위 가능한(transposable) 요소는 유전자 기능 및 진화에 중요한 역할을 하는 이동성 DNA 서열이다. 전위 가능한 요소는 거의 모든 형태의 생활에서 발견되지만, 이들의 출현률은 유기체에 따라 달라지며, 대부분의 진핵생물 게놈은 전위 가능한 요소를 암호화한다(인간에서 적어도 45%).

서열 목록

본 출원은 XML 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 동 서열 목록은 그 전체가 참조로서 본원에 통합된다. 2022년 9월 7일에 생성된 상기 XML 사본의 명칭은 55921-734_601_SL.xml이며, 크기는 1,677,029 바이트이다.

전위 가능한 요소에 대한 기초 연구는 1940년대에 수행되었지만, DNA 조작 및 유전자 편집 적용에서 이들의 잠재적 유용성은 최근 몇 년 동안에만 인식되었다.

일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT, reverse transcriptase) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 시스템은 (c) 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, 이중-가닥 DNA 서열은 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하며, 여기서 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는, 카고 서열의 5' 서열 또는 카고 서열의 3' 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다. 일부 실시예에서, 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함한다.

일부 실시예에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 RT 도메인 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 5' 서열 또는 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다.

일부 측면에서, 본 개시내용은 상보성 DNA(cDNA, complementary DNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위해 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 DNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP, MS2 coat protein) 도메인을 포함한다

일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 핵산을 제공한다.

일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 적어도 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 대해 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기완과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.

일부 실시예에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 시스템은 (c) 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다.

일부 측면에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인를 포함하는, 레트로트랜스포사제; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함한다.

일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다.

일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서: (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.

일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.

일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.

일부 측면에서, 본 개시내용은 서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소(maturase) 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산을 제공하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화한다. 일부 실시예에서, ORF는 박테리아 유기체에서의 발현에 최적화되거나, 여기서 유기체는 대장균이다. 일부 실시예에서, ORF는 포유류 유기체에서의 발현에 최적화되거나, 여기서 유기체는 영장류 유기체이다. 일부 실시예에서, 영장류 유기체는 H. 사피엔스이다. 일부 실시예에서, ORF는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열에 작동 가능하게 연결된 친화성 태그를 포함하며, 여기서 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는다. 일부 실시예에서, ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인 또는 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함한다.

일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.

일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.

일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융한된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.

일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 핵산은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 유기체는 RT 도메인의 기원과 상이하다. 일부 실시예에서, ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.

일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는 합성 올리고뉴클레오티드를 제공한다. 일부 실시예에서, 합성 올리고뉴클레오티드는 DNA 뉴클레오티드를 포함한다. 일부 실시예에서, 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 추가로 포함한다.

일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 벡터를 제공한다.

일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 벡터를 제공한다.

일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 핵산은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하며, 여기서 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다.

일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.

일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소를 첨가함으로써 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물에 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피를 수행하는 단계를 추가로 포함한다.

일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나의 RNA 동족체를 포함하는 시험관 내에서 전사된 mRNA를 제공한다.

일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 카고 뉴클레오티드 서열은 조작된다. 일부 실시예에서, 카고 뉴클레오티드 서열은 이종이다. 일부 실시예에서, 카고 뉴클레오티드 서열은 유기체에 존재하는 야생형 게놈 서열의 서열을 갖지 않는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함한다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.

일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.

일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.

일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 핵산은 레트로트랜스포사제를 암호화하고, 여기서 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 여기서 유기체는 미배양 미생물이 아니다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로부터 선택되는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 897을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 N-말단에 근접한다. 일부 실시예에서, NLS는 서열번호 896을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 C-말단에 근접한다. 일부 실시예에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간이다

일부 실시예에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산을 포함하는 벡터를 제공한다. 일부 실시예에서, 벡터는 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함한다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.

일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 포함하는 세포를 제공한다.

일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 제조하는 방법을 제공한다.

일부 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 방법을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성된 레트로트랜스포사제를 이중-가닥 데옥시리보핵산 폴리뉴클레오티드와 접촉시키는 단계를 포함하며, 여기서 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.

일부 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공하며, 이러한 방법은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고, 여기서 복합체는, 복합체가 표적 핵산 유전자좌에 결합할 때, 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.

일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 방법을 제공하며, 여기서 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산 또는 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 레트로트랜스포사제를 암호화하는 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.

일부 측면에서, 본 개시내용은 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 이종 레트로트랜스포사제 또는 이들의 변이체를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다

일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 포함하는 배양물을 제공한다.

일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그가 부착된다. 일부 실시예에서, 방법은 감산(subtractive) IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.

일부 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공하며, 이는 조성물을 세포에 접촉시키는 단계를 포함하며, 상기 조성물은 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성된, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고, (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고; (iii) 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.

일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포 또는 포유류 세포이다. 일부 실시예에서, 숙주 세포는 E. coli 세포이고, 여기서 E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, 스트렙 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.

일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 단백질 중 어느 하나를 암호화하는 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 본원에 기술된 단백질 중 어느 하나를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 단백질의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 뉴클레아제의 발현을 유도하는 단계는 추가 화학 제제 또는 영양소의 증가된 양을 첨가하거나, 온도 증가 또는 감소에 의한 것이다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질을 포함하는 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 엔도뉴클레아제를 단리하는 단계를 추가로 포함한다. 일부 실시예에서, 단리하는 단계는 단백질 추출물에 대해 IMAC, 이온 교환 크로마토그래피, 음이온 교환 크로마토그래피, 또는 양이온 교환 크로마토그래피를 거치게 하는 단계를 포함한다. 일부 실시예에서, 숙주 세포는 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함하는 개방 해독 프레임을 포함하는 핵산을 포함한다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 단백질에 접촉시킴으로써 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 친화성 태그는 IMAC 친화성 태그다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 단백질을 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.

본 개시내용의 추가 측면 및 이점은, 본 개시의 예시적인 실시예만이 도시되고 설명되는, 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인지하게 되겠지만, 본 개시내용은 다른 실시예 및 상이한 실시예가 가능하고, 본 개시의 몇몇 세부 사항은 다양한 명백한 측면에서 본 개시를 벗어나지 않고도 변형될 수 있다. 따라서, 도면 및 본 발명을 실시하기 위한 구체적인 내용은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.

참조에 의한 통합

본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물, 특허, 또는 특허 출원이 참조에 의해 구체적으로 및 개별적으로 통합된 것으로 표시된 것과 동일한 정도로 참조에 의해 본원에 통합된다.

본 발명의 신규한 특징은 특히 첨부된 청구범위에 명시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시예가 제시되는 하기 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조함으로써 보다 잘 이해될 것이다.
도 1은 박테리아 레트로트랜스포존의 게놈 맥락을 도시한다. MG140-1은 Zn-핑거 DNA 결합 도메인 및 역전사 효소 도메인을 암호화하는 예측된 레트로트랜스포사제(화살표)이다. 레트로트랜스포사제의 측면에 위치하는 영역은 레트로트랜스포사제에 대한 결합 부위를 나타낼 가능성이 있는 이차 구조를 나타낸다(2차 구조 박스 및 확대된 이미지). 다른 상동체와의 유사 영역은 레트로트랜스포존이 통합된 추정 표적 부위를 나타낸다.
도 2는 MG140 계열의 MG 레트로트랜스포사제 단백질 서열의 다중 서열 정렬(MSA)을 도시한다. 도 2a는 역전사 효소 도메인의 MSA를 도시한다. 보존된 촉매 잔기 D, QG, [Y/F]ADD, 및 LG는 컨센서스 서열 상에서 강조된다. 도 2b는 Zn-핑거 및 엔도뉴클레아제 도메인의 MSA를 도시한다. Zn-핑거 모티프(CX_[2-3]C), 엔도뉴클레아제 도메인의 일부 및 뉴클레아제 촉매 잔기가 컨센서스 서열 상에서 강조된다.
도 3은 MG 및 기준 레트로트랜스포사제 유전자의 계통발생 유전자 트리를 도시한다. 도 3a는 미생물 MG 레트로트랜스포사제(계통군 4 상의 흑색 분지)가 바이러스 레트로트랜스포사제(계통군 6 상의 회색 분지)보다 진핵생물과 더 밀접하게 관련됨을 도시한다. 계통군 1: 텔로머라아제 역전사 효소; 계통군 2: II족 인트론 역전사 효소; 계통군 3: 진핵생물 R1형 레트로트랜스포사제; 계통군 4: 미생물 및 진핵생물 R2 레트로트랜스포사제; 계통군 5: 진핵생물 레트로바이러스-관련 역전사 효소; 및 계통군 6: 바이러스 역전사 효소. 도 3b는 도 3a의 계통발생 유전자 트리의 계통군 3 및 4를 도시한다. 일부 미생물 MG 레트로트랜스포사제는 다수의 Zn-핑거 모티프(수직 직사각형), 보존된 RVT_1 역전사 효소 도메인, 및 APE/RLE 또는 기타 엔도뉴클레아제 도메인(상단 및 하단 패널)을 함유한다. 일부 미생물 MG 레트로트랜스포사제는 엔도뉴클레아제 도메인(중간 패널)이 결여되어 있다.
도 4는 다양한 효소로부터의 역전사 효소 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. RT 서열은 DNA뿐만 아니라 RNA 조립체로부터 유래하였다. 기준 RT를 분류 목적을 위해 트리에 포함시켰다.
도 5a는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147) 및 관련 RT(MG148)의 신규한 계열로부터 식별된 RT 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 5b는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147)가 RT 도메인, 엔도뉴클레아제 도메인(Endo), 및 다수의 아연-결합 리본 모티프를 함유하는 반면, 계열 MG148 RT는 엔도뉴클레아제 도메인이 결여되어 있음을 입증하는 데이터를 도시한다.
도 6a는 MG140 R2 레트로트랜스포사제가 RT 및 엔도뉴클레아제(EN) 도메인뿐만 아니라 다수의 아연-핑거를 함유하고, 기준 Danio rerio R2 레트로트랜스포사제(R2Dr)와 24% 내지 26%의 평균 아미노산 동일성(AAI)을 공유한다는 것을 입증하는 데이터를 도시한다. 도 6B는 MG140-47 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 데이터를 도시한다. 기준(GQ398061) 리보솜 RNA 오페론에 대한 MG140-47 콘티그의 정렬은 MG140-47 28S rDNA 유전자(점선 박스) 내로의 R2 요소의 통합으로 인해 기준 28S rDNA 유전자에서 큰 갭을 나타낸다.
도 7a는 MG145-45 레트로트랜스포존의 게놈 맥락을 도시한다. 효소는 RT 및 아연-핑거 도메인을 함유한다. 5' 말단에서의 부분적인 18S rDNA 유전자 히트 및 3' 말단에서의 폴리-A 꼬리는 트랜스포존의 경계를 나타낼 가능성이 있다. 도 7b는 MG140-3, MG140-8, 및 MG140-45 게놈 서열의 정렬을 도시하며, 이는 정렬의 위치 200에 대한 18S rRNA 유전자의 보존을 도시하고, R2 요소가 18S rDNA 유전자(화살표)에 통합되었음을 나타낸다.
도 8a는 RT 및 엔도뉴클레아제 도메인을 갖는 MG146-1 레트로트랜스포사제를 암호화하는 콘티그를 도시한다. 도 8b는 동원에 관여할 것으로 예측된 3개의 유전자를 암호화하는 MG140-17-R2 레트로트랜스포존을 도시한다: RNA 인식 모티프 유전자(RRM); 엔도뉴클레아제 효소; 및 RT 및 RNAse H 도메인을 갖는 역전사 효소.
도 9a는 RT의 MG148 계열의 2개의 구성원의게놈 맥락을 도시한다. RT와 연관되지 않은 예측된 유전자는 백색 화살표로 표시된다. 도 9b는 RT의 상류에 보존된 영역(서열 아래의 박스)을 나타내는 MG148 계열의 5개의 구성원의뉴클레오티드 서열 정렬을 도시한다(컨센서스 서열에 걸쳐 주석이 달린 화살표).
도 10은 qPCR(MG140)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타(Taeniopygia guttata)); 양성 대조군 2: R2Bm (봄빅스 모리(Bombyx mori)). 2개의 양성 대조군은 문서화된 R2 레트로트랜스포존이다. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 11은 qPCR(MG146, MG147, MG148)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타), 문서화된 R2 레트로트랜스포존. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 12는 차세대 시퀀싱에 의해 R2 및 R2-유사 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 배경: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타).
도 13a는 다양한 부류의 신규한 계열로부터 식별된 전장 II족 인트론 RT의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 13b는 II족 인트론의 MG 계열의 요약표를 도시한다. AAI: 기준 II족 인트론 서열에 대한 MG 계열의 평균 쌍별 아미노산 동일성.
도 14a 내지 도 14d는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-1 내지 MG153-21 및 MG153-25 내지 MG153-27의 시험관 내 활성의 스크리닝을 도시한다. 도 14a 내지 도 14c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4-MarathonRT 대조군 RT. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 결과는 2개의 독립적인 실험을 나타낸다. 도 14a 레인 번호 5-14는 신규 후보 MG153-1 내지 MG153-10에 상응한다. 도 14b 레인 번호 5-14는 신규 후보 MG153-11 내지 MG153-20에 상응한다. 도 14c 레인 번호 5-8은 신규 후보 MG153-21, MG153-25, MG153-26, 및 MG153-27에 각각 상응한다. 도 14d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 14a 내지 도 14c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 15는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-28 내지 MG153-37 및 MG153-39 내지 MG153-57의 시험관 내 활성의 스크리닝을 도시한다. 도 15a 내지 도 15c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT. 굵은 글씨체로 표시된 번호는 겔 레인에 해당한다. 도 15a 레인 번호 4-13은 신규 후보 MG153-28 내지 MG153-37에 상응한다. 도 15b 레인 번호 4-13은 신규 후보 MG153-39 내지 MG153-48에 상응한다. 도 15c 레인 번호 4-13은 신규 후보 MG153-49 내지 MG153-57에 상응한다. 도 15d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 15a 내지 도 15c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 16은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 D MG165 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 16a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 12- 신규 후보 MG165-1 내지 9. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 16b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 16a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 17은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 F MG167 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 17a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 - 신규 후보 MG167-1 내지 8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 17b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 17a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 18은 차세대 시퀀싱에 의해 MG153 계열의 GII 인트론 클래스 C RT 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 결과는 2개의 독립적인 실험으로부터 결정하였다.
도 19는 포유류 세포에서 cDNA를 합성하는 표시된 대조군 RT 및 GII 인트론 클래스 C 후보의 능력을 평가하기 위한 스크리닝을 도시한다. 도 19a는 아가로오스 겔 분석에 의한 542 bp(상단) 및 100 bp(하단) PCR 산물의 검출을 도시한다. 도 19b는 D1000 TapeStation에 의한 542 bp(상단) 및 100bp(하단) PCR 산물의 검출을 도시한다. 도 19c는 추가 후보에 대한 D1000 TapeStation에 의한 542 bp PCR 산물의 검출을 도시한다. 도 19a 및 도 19b에 설명된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다.
도 20a는 전장 G2L4-유사 RT의 계통발생 트리를 도시한다. 기준 G2L4 서열 및 MG172 후보(점)가 강조된다. 도 20b는 기준 및 MG172 RT의 컬럼 277 내지 280이 역전사 효소 기능을 담당하는 촉매 잔기를 나타낸다는 것을 입증하는 데이터를 도시한다.
도 21a는 전장 LTR RT의 계통발생 트리를 도시한다. 기준 LTR RT 서열 및 MG151 후보(점)가 강조된다. 도 21b는 MG151-82 RT(ORF 7로 표지됨)의게놈 맥락을 도시한다. 예측된 도메인은 어두군 상자로서 도시되고, 긴 말단 반복(LTR)은 LTR 트랜스포존의 측면에 위치한 화살표로서 도시된다. 도 21c는 프로테아제, RT, RNAse H 및 인테그라아제 도메인을 보여주는 MG151-82의 3D 구조 예측을 도시한다.
도 22는 프로테아제, RT - RNAse H, 및 인테그라아제 도메인을 강조하기 위한 전장 pol 단백질 서열의 다중 서열 정렬을 도시한다. MMLV RT의 RT, RNAse H, 및 인테그라아제 도메인에 대한 촉매 잔기는 각 도메인 아래에 막대로 도시되어 있다. MMLV 기준 서열의 프로테아제 도메인은 정렬에 도시되지 않는다.
도 23은 프라이머 연장 검정에 의한 바이러스 후보 MG151-80 내지 MG151-97의 시험관 내 활성의 스크리닝을 도시한다. 도 23a의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형; 2-MMLV 대조군 RT; 3-Ty3 대조군 RT; 4 내지 9의 신규 후보 MG151-80 내지 85; 10- RT 대조군. 도 23b의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형, 2 내지 12- 신규 후보 MG151-87 내지 97, 13-MMLV 대조군 RT. 도 23c는 상이한 완충액 조건에서 Ty3 대조군 RT의 시험관 내 활성에 대한 시험을 도시한다. 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군; 2-완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl₂, 1 mM TCEP); 3- 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl₂, 1 mM TCEP, 2% PEG-8000); 4-완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl₂, 1 mM TCEP, 0.01% (v/v) Triton X-100); 5-완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl₂, 1 mM TCEP, 10% 글리세롤). 도 23a 내지 도 23c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 24는 구조화된 RNA 주형 상에서 후보 MG151-89, MG151-92, 및 MG151-97의 시험관 내 RT 공정도 및 프라이밍 파라미터의 시험을 도시한다. 도 24a 및 도 24b의 경우, 레인 1: 6,10, 및 16개 뉴클레오티드 올리고 마커(화살표); 레인 2: 8, 13, 및 20개 뉴클레오티드 올리고 마커; 레인 3: 43 및 55개 뉴클레오티드 올리고 마커; 레인 4 및 10: 6개 뉴클레오티드 프라이머; 레인 5 및 11: 8개 뉴클레오티드 프라이머; 레인 6 및 12: 10개 뉴클레오티드 프라이머; 레인 7 및 13: 13개 뉴클레오티드 프라이머; 레인 8 및 14: 16개 뉴클레오티드 프라이머; 레인 9 및 15: 20개 뉴클레오티드 프라이머. 도 24a 레인 4-9는 다양한 프라이머 길이를 갖는 MMLV를 함유하는 역전사 반응에 상응한다. MMLV는 구조화된 RNA 헤어핀을 통해 역전사한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-89를 함유하는 역전사 반응에 상응한다. MG151-89는 16개 및 20개의 뉴클레오티드의 프라이머 길이를 선호하며, 구조화된 RNA 헤어핀에서 역전사를 정지시키는 것으로 보인다. 도 24b 레인 4-9는 다양한 프라이머 길이를 갖는 MG151-92를 함유하는 역전사 반응에 상응한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-97을 함유하는 역전사 반응에 상응한다. MG151-92 또는 MG151-97은 이들 실험 조건 하에서 활성인 것으로 보이지 않는다.
도 25는 2407개의 레트론 RT의계통발생 분석을 도시하며, 제1 후보는 시험관 내에서 강조된 하류 특성화를 위해 선택되었다. 문헌에서 실험적으로 검증된 16개의 레트로엔 중 9개를 첨가하고 트리에서 강조하였다. 회색 별표는 후보 MG154-MG159 및 MG173 계열 구성원을 나타낸다.
도 26은 시험관 내에서 하류 특성화를 위해 선택된 일부 레트론-RT 후보의단백질 정렬을 도시한다. 문서화된 모든 역전사 효소에 공통인 레트론-특이적 모티프 및 촉매 XXDD 코어가 도면에 표시되어 있다.
도 27a는 MG157-1 레트론(두껍고 검은 선 상에 화살표 표지된 RT)의게놈 맥락을 도시한다. 레트론 비-암호화 RNA(ncRNA)는 점선 상자로 강조 표시되어 있다. 도 27b는 MG157-1 레트론 ncRNA의 측부 역 반복이 있음을 보여주는 삽입체를 도시한다. 도 27c는 MG157-1 레트론 ncRNA의 예측된 구조를 도시한다.
도 28a는 MG160-3 레트론-유사 단일-도메인 RT의 게놈 맥락을 도시한다. RT로부터 상류에 있는 영역(점선 상자)은 MG160 구성원에 걸쳐 보존된다. 도 28b는 MG160-3의 3D 구조 예측을 도시하며, 이는 II족 인트론 동결-EM 구조에 정렬된 RT 도메인을 나타낸다. 도 28c는 5개의 MG160 구성원의 5' UTR의 예측된 구조를 도시한다.
도 29는 프라이머 연장 검정에 의한 레트론-유사 후보 MG160-1 내지 MG160-6 및 MG160-8의 시험관 내 활성의 스크리닝을 도시한다. 도 29a 레인 번호는 다음의 샘플에 상응한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 10- 신규 후보 MG160-1 내지 MG160-6 및 MG160-8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 29b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 29a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 30은 시험관 내 전사에 의한 레트론 RT 후보의 세포-무함유 발현 및 레트론 ncRNA의 생성을 도시한다. 도 30a는 세포-무함유 발현 시스템에서의 레트 론 RT 단백질 생산의 확인을 도시한다. 레인은 다음에 해당한다: 1: 래더, 2: 주형 없는 대조군, 3: MG156-1(39 kDa) , 4: MG156-2(40 kDa), 5: MG157-1(38 kDa). 도 30b는 세포-무함유 발현 시스템에서의 레트론 RT 단백질 생산의확인을 도시한다. 레인은 다음에 해당한다- 1: 래더, 2: 주형 없는 대조군, 3: MG157-2(37 kDa), 4: MG157-5(43 kDa), 5: MG159-1(53 kDa), 6: Ec86(38 kDa, 양성 대조군 레트론 RT). 도 30c는 시험관 내 전사에 의한 레트론 ncRNA 주형의생성을 도시한다. 레인은 다음의 레트론에 상응하는 다음의 ncRNA에 상응한다- 1: MG154-1, 2: MG154-2, 3: MG155-1, 4: MG155-2, 5: MG155-3, 6: MG156-1, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86, 14: MG155-4, 15: MG173-1, 16: MG155-5.
도 31은 MG140-1 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 도메인 구조를 도시한다. R2 레트로트랜스포사제(밝은 회색 화살표)는 다수의 Zn-핑거뿐만 아니라 RT 및 엔도뉴클레아제 도메인을 함유한다. MG140-1의 측면에는 트랜스포존 경계를 정의하는 5' 및 3' UTR이 위치한다. MG140-1은 표적 부위 모티프 GGTAGC에서 G 및 T 뉴클레오티드 사이에 정확하게 통합된다.
도 32는 포스포로티오에이트 결합 변형을 함유하는 DNA 올리고를 갖는 프라이머 연장에 의한 RT 활성의 시험을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress PS-변형된 프라이머 1을 갖는 주형 없는 대조군, 2: PURExpress PS-변형된 프라이머 2를 갖는 주형 없는 대조군, 3: PURExpress PS-변형된 프라이머 3을 갖는 주형 없는 대조군, 4: 변형되지 않은 프라이머를 갖는 MMLV RT, 5: PS-변형된 프라이머 1을 갖는 MMLV RT, 6: PS-변형된 프라이머 2를 갖는 MMLV RT, 7: PS-변형된 프라이머 3을 갖는 MMLV RT, 8: 변형되지 않은 프라이머를 갖는 TGIRT-III, 9: PS-변형된 프라이머 1을 갖는 TGIRT-III, 10: PS-변형된 프라이머 2를 갖는 TGIRT-III, 11: PS-변형된 프라이머 3을 갖는 TGIRT-III, 12: 변형되지 않은 프라이머를 갖는 MG153-9, 13: PS-변형된 프라이머 1을 갖는 MG153-9, 14: PS-변형된 프라이머 2를 갖는 MG153-9, 15 PS-변형된 프라이머 3을 갖는 MG153-9. MMLV RT 및 TGIRT-III은 대조군 RT이다.
도 33은 프라이머 연장 검정에 의해 RNA 주형 상에서의 레트론 RT의 활성의 스크리닝을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress 주형 없는 대조군, 2: MMLV 대조군 RT, 3: MG154-1, 4: MG155-1, 5: MG155-2, 6: MG155-3, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86 대조군 레트론 RT, 14: Sa163 대조군 레트론 RT, 15: St85 대조군 레트론 RT. 굵은 글씨체로 표시된 레인은 시험된 기질 상에 프라이머 연장 활성을 나타내는 신규한 레트론 RT에 해당한다.
도 34는 포유류 세포에서 cDNA를 합성하는 MG153 GII 유래 RT의 능력에 대한 스크리닝을 도시한다. 542 bp cDNA 합성 PCR 산물의 검출을 Taqman qPCR로 분석하였다. TGIRT가 1의 값을 나타내는 활성 TGIRT 대조군으로 cDNA 활성을 정규화하였다. Y축은 로그 10 스케일로 도시되어 있다.
도 35는 면역블롯에 의한 MG153 GII 유래 RT의 단백질 발현을 도시한다. 도 35a 및 35b:후보 RT를 함유하는 플라스미드로 세포를 형질감염시키고, 면역블롯에 의해 단백질 발현을 평가하여, RT의 N 말단에 융합된 HA 펩티드를 검출하였다. 모든 레인을 총 단백질 농도로 정규화하였다. 백색 화살표는 단백질의 예상 분자 크기의 2X에서 밴드를 가리키며, 이는 단백질 이량체를 나타낸다. 도 35a 및 도 35b에 기술된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다. 도 35c: GII 유래 RT의 다중 서열 정렬. 나타낸 영역은 정렬의 위치 196 내지 201에 상응한다. 이량체화 모티프 CAQQQ가 강조된다.
도 36은 단백질 발현에 대해 정규화된 GII 유래 RT의 상대 활성을 도시한다. cDNA 합성은 Taqman qPCR에 의해 검출되었고, 단백질 발현은 면역블롯에 의해 검출되었다. TGIRT에 상대적인 활성을 총 단백질 농도에 따라 정규화하였다. Y축은 선형 스케일로 도시되어 있다.

서열 목록에 대한 간단한 설명

본원과 함께 출원된 서열 목록은 본 개시에 따른 방법, 조성물, 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 서열 목록 내 서열에 대한 예시적인 설명이 아래에 제시되어 있다.

MG140

서열번호 1-29 및 393-401은 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.

서열번호 374-386은 HA-His-태그된 MG140 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 761-798은 MG140 UTR의 뉴클레오티드 서열을 보여준다.

서열번호 799-894는 MG140 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

MG146

서열번호 402 및 895는 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.

서열번호 387은 HA-His-태그된 MG146 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG147

서열번호 388은 HA-His-태그된 MG147 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG148

서열번호 403-426은 MG148 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 389-392는 HA-His-태그된 MG148 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG149

서열번호 427-439는 MG149 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

MG151

서열번호 440-554는 MG151 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 356-362는 TwinStrep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 363-373은 strep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG153

서열번호 555-608은 MG153 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 30-32 및 40-50은 MG153 역전사 효소 단백질 및 MS2 외피 단백질(MCP)을 포함하는 융합 단백질의 뉴클레오티드 서열을 보여준다.

서열번호 66-119는 strep-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 120-173은 MG153 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 740-756은 MCP-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG154

서열번호 609-610은 MG154 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 308-309는 strep-태그된 MG154 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 324-325는 MG154 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 340-341은 MG154 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG155

서열번호 611-615는 MG155 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 310-312는 strep-태그된 MG155 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 326-328은 MG155 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 342-344는 MG155 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG156

서열번호 616-617은 MG156 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 313-314는 strep-태그된 MG156 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 329-330은 MG156 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 345-346은 MG156 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG157

서열번호 618-622는 MG157 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 315-319는 strep-태그된 MG157 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 331-335는 MG157 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 347-351은 MG157 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG158

서열번호 623은 MG158 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 320은 strep-태그된 MG158 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 336은 MG158 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 352는 MG158 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG159

서열번호 624-626은 MG159 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 321-323은 strep-태그된 MG159 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 337-339는 MG159 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 353-355는 MG159 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.

MG160

서열번호 627-673은 MG160 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 174-180은 strep-태그된 MG160 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 181-187은 최적화된 MG160 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG163

서열번호 674-678은 MG163 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 188-192는 strep-태그된 MG163 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 193-197은 최적화된 MG163 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG164

서열번호 679-683은 MG164 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 198-202는 strep-태그된 MG164 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 203-207은 최적화된 MG164 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG165

서열번호 684-692는 MG165 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 208-216은 strep-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 217-225는 최적화된 MG165 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 757-759는 MCP-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG166

서열번호 693-697은 MG166 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 226-230은 strep-태그된 MG166 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 231-235는 최적화된 MG166 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG167

서열번호 698-702는 MG167 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 236-240은 strep-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 241-245는 최적화된 MG167 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 759-760은 MCP-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

MG168

서열번호 703-707은 MG168 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 246-250은 strep-태그된 MG168 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 251-255는 최적화된 MG168 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG169

서열번호 708-718은 MG169 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 256-266은 strep-태그된 MG169 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 267-277은 최적화된 MG169 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG170

서열번호 719-728은 MG170 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 278-287은 strep-태그된 MG170 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 288-297은 최적화된 MG170 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG172

서열번호 729-733은 MG172 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

서열번호 298-302는 strep-태그된 MG172 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.

서열번호 303-307은 최적화된 MG172 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.

MG173

서열번호 734-735는 MG173 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.

기타 서열

서열번호 736-738은 포스포로티오에이트-변형된 프라이머의 뉴클레오티드 서열을 보여준다.

서열번호 739는 qPCR에 대한 Taqman 프로브의 뉴클레오티드 서열을 보여준다.

발명을 실시하기 위한 구체적인 내용

본 발명의 다양한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 수 있다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.

달리 명시되지 않는 한, 본원에 개시된 일부 방법을 실시하는 데에는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈, 및 재조합 DNA의 기술이 사용된다. 예를 들어 Sambrook 및 Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel 등(편); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames 및 G.R. Taylor(편) (1995)), Harlow and Lane(편) (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney(편) (2010))을 참조한다(이들은 그 전체가 참조로서 본원에 통합됨).

본원에서 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 달리 명시되지 않는 한, 복수 형태도 포함하도록 의도된다. 또한, 용어 "포함하는(including, includes, having, has, with)" 또는 이의 변형된 표현이 발명을 실시하기 위한 구체적인 내용 및/또는 청구범위에 사용되는 정도까지, 이러한 용어는 용어 "포함하는(comprising)"과 유사한 방식으로 포괄적인 것으로 의도된다.

용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내의 것을 의미하며, 이는 값이 측정되거나 결정되는 방법, 예를 들어 측정 시스템의 한계에 부분적으로 좌우될 것이다. 예를 들어, "약"은 당 기술분야의 관행에 따라 하나 또는 둘 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.

본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조, 기능, 또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물의 세포, 원생동물 세포, 식물 유래의 세포(예를 들어, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 석송, 뿔이끼류, 우산이끼, 이끼 유래의 세포), 해조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 라인하르트티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 쌍발이모자반(Sargassum patens C. Agardh, 등), 해초(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포류, 극피동물, 선충 등) 유래의 세포. 척추동물(예를 들어, 생선, 양서류, 파충류, 새, 포유동물) 유래의 세포, 포유동물(예를 들어, 돼지, 젖소, 염소, 양, 설치류, 랫트, 마우스, 비인간 영장류, 인간 등) 유래의 세포, 등. 때로는, 세포는 천연 유기체로부터 유래되지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있고, 이는 가끔 인공 세포라 불린다).

본원에서 사용되는 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염의 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산, 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP), 및 데옥시리보뉴클레오시드 삼인산, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는, 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만, 이에 한정되지는 않는다. 뉴클레오티드는 표지되지 않거나, 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여 검출 가능하게 표지될 수 있다. 표지화는 양자점(quantum dots)으로 수행될 수도 있다. 검출 가능한 표지는, 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지, 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 사아닌, 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만 이에 한정되지는 않는다. 형광 표지된 뉴클레오티드의 특정 예는 다음을 포함할 수 있다: Perkin Elmer(Foster City, Calif)로부터 입수할 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; Amersham(Arlington Heights, Il.)으로부터 입수할 수 있는 FluoroLink 데옥시뉴클레오티드, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink 플루오르 X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; Boehringer Mannheim(Indianapolis, Ind.)으로부터 입수할 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 Molecular Probes(Eugene, Oreg.)로부터 입수할 수 있는 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP. 뉴클레오티드는 화학적 변형에 의해 표지되거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적인 예는 다음을 포함할 수 있다: 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP).

용어 "폴리뉴클레오티드", "올리고뉴클레오티드", 및 "핵산"은 일반적으로 임의의 길이를 가진 뉴클로에티드의 중합체 형태를 지칭하도록 사용 교환적으로 사용되며, 상기 뉴클레오티드는 단일 가닥, 이중 가닥, 또는 다중 가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드이거나, 이의 유사체일 수 있다. 폴리뉴클레오티드는 세포에 대해 외인성이거나 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에서 존재할 수 있다. 폴리뉴클레오티드는 유전자이거나 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 백본, 당, 또는 핵염기가 변경된 유사체)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적인 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산(xeno nucleic acid), 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단 (예를 들어, 당류에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 큐오신, 및 와이오신. 폴리뉴클레오티드의 비제한적인 예는 다음을 포함한다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌/유전자좌들, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA (tRNA), 리보솜 RNA (rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브, 및 프라이머. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다.

용어 "형질감염(transfection 또는 transfected)"은 일반적으로 비-바이러스적인 방법 또는 바이러스-기반 방법에 의해 핵산을 세포 내로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 암호화하는 유전자 서열일 수 있다. 예를 들어, Sambrook 등의 문헌[1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88(이는 본원에 참조로서 전체적으로 통합됨)]을 참조한다.

용어 "펩티드", "폴리펩티드", 및 "단백질"은 일반적으로 펩티드 결합에 의해 결합된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하도록 본원에서 상호 교환적으로 사용된다. 이 용어는 중합체의 특정 길이를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용해 생산되는지 또는 자연적으로 발생하는지를 암시하거나 구별하도록 의도되지도 않는다. 상기 용어는 자연적으로 발생하는 아미노산 중합체뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 실시예에서, 중합체는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬, 및 2차 또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함한다. 상기 용어는 예를 들어, 이황화 결합 형성, 당질화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체도 포함한다. 본원에서 사용되는 용어 "아미노산(들)"은, 변형된 아미노산 및 아미노산 유사체를 포함하되 이에 한정되지 않는, 천연 및 비-천연 아미노산을 일반적으로 지칭한다. 변형된 아미노산은, 아미노산 상에는 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 천연 아미노산 및 비-천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 모두를 포함한다.

본원에서 사용되는 바와 같이, "비-고유(non-native)"는 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 일반적으로 지칭할 수 있다. 비-고유는 친화성 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입, 또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 금속전이효소 활성, 아세틸전이효소 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내거나 이를 암호화할 수 있다. 비-고유 핵산 또는 폴리펩티드 서열은 유전자 조작에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결되어 키메라 핵산 또는 폴리펩티드를 암호화하는 키메라 핵산 또는 폴리펩티드 서열을 생성할 수 있다.

본원에서 사용되는 바와 같이, 용어 "프로모터"는, 유전자의 전사 또는 발현을 조절하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하게 위치하거나 이와 중첩될 수 있는 조절 DNA 영역을 일반적으로 지칭한다. 프로모터는 종종 전사 인자로서 지칭되는 단백질 인자에 결합하는 특이적 DNA 서열을 함유할 수 있는데, 상기 인자는 RNA 중합효소가 DNA에 결합하는 것을 용이하게 하여 유전자 전사를 유도한다. '코어 프로모터'로도 지칭되는 '기저 프로모터(basal promoter)'는 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 모든 기본 요소를 함유하는 프로모터를 일반적으로 지칭할 수 있다. 진핵생물 기저 프로모터는 TATA-박스 또는 CAAT 박스를 함유할 수 있다.

본원에서 사용되는 바와 같이, 용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 공정 또는 전사된 mRNA가 후속하여 펩티드, 폴리펩티드, 또는 단백질로 번역되는 공정을 일반적으로 지칭한다. 전사체 및 암호화된 폴리펩티드는 "유전자 산물"로서 통칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.

본원에서 사용되는 바와 같이, "작동 가능하게 연결된(operably linked, operable linkage, operatively linked)" 또는 이와 문법적으로 동등한 표현은 유전자 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 일반적으로 지칭하는데, 여기서 요소들은 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사 개시에 도움을 주는 경우, 조절 요소는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.

본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 결합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 연관을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 유전자에 작동 가능하게 연결되어 표적에서 유전자의 발현을 용이하게 하는 유전자 요소, 예를 들어 조절 요소를 일반적으로 포함한다.

본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 일반적으로 상호 교환적으로 사용된다. 일부 실시예에서, 발현 카세트는 조절 요소와 발현을 위해 조절 요소가 작동 가능하게 연결되는 유전자(들)의 조합을 지칭한다.

DNA 또는 단백질 서열의 "기능적 단편"은 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적 활성)을 보유하는 단편을 일반적으로 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인한 방식으로 발현에 영향을 미치는 이의 능력일 수 있다.

본원에서 사용되는 바와 같이, "조작된" 객체란 객체가 인간 개입에 의해 변형되었음을 일반적으로 나타낸다. 비제한적인 예에 따르면: 핵산은 이의 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이 핵산을 자연에서 연관되지 않는 핵산과 결합시키되, 결합 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 결합시킴으로써 변형될 수 있고; 조작된 핵산은 자연에서 존재하지 않는 서열을 이용해 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에서 존재하지 않는 서열과 치환함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.

본원에서 사용되는 바와 같이, "합성" 및 "인공"은, 대체적으로 자연 발생 인간 단백질과 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하도록 상호 교환적으로 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전사 활성화 도메인이다.

본원에서 사용되는 바와 같이, 용어 "전위 가능한 요소(transposable element)"는 게놈 내의 한 위치에서 다른 위치로 이동할 수 있는 DNA 서열을 지칭한다(예를 들어, 이들은 "전위(transposed)"될 수 있음). 전위 가능한 요소는 일반적으로 2개의 부류로 분할될 수 있다. 클래스 I 전위 가능한 요소, 또는 "레트로트랜스포존"은 RNA 중간체의 전사 및 번역을 통해 전위되고, 이어서 역전사를 통해 그의 새로운 위치에 재통합된다(역전사 효소에 의해 매개되는 과정). 클래스 II 전위 가능한 요소, 또는 "DNA 트랜스포존"은 트랜스포사제가 양측에 위치하는 단일-가닥 또는 이중-가닥 DNA의 복합체를 통해 전위된다. 이러한 효소 계열의 추가 특징은, 예를 들어, Nature Education 2008, 1 (1), 204; 및 Genome Biology 2018, 19 (199), 1-12에서 찾을 수 있으며, 이들 각각은 참조로서 본원에 통합된다.

본원에서 사용되는 바와 같이, 용어 "레트로트랜스포존"은 RNA 중간체를 포함하는 2-파트 "복사 및 붙여넣기" 메커니즘에 따라 기능하는 클래스 I 전위 가능한 요소를 지칭한다. "레트로트랜스포사제"는 레트로트랜스포존의 전위를 담당하는 효소를 지칭한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다.

2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서의 용어 "서열 동일성" 또는 "동일성 백분율"은, 서열 비교 알고리즘을 사용해 측정했을 때, 부분적 또는 전체 비교 윈도우에 걸쳐 비교하고 최대 상응에 정렬했을 때 동일한 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열; 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열을 일반적으로 지칭한다. 폴리펩티드 서열에 대한 적절한 서열 비교 알고리즘은 예를 들어 다음을 포함한다: 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 30개 잔기를 초과하는 길이의 폴리펩티드 서열에 대해서는 조건부 조성 스코어 매트릭스 조정(conditional compositional score matrix)을 사용하는 BLASTP; 단어 길이(W) 2, 기대치(E) 1000000의 파라미터, 및 30개 잔기 미만의 서열에 대해서는 PAM30 스코어링 매트릭스(개방 갭 9, 연장 갭 1의 갭 비용 설정 - 이들은 https://blast.ncbi.nlm.nih.gov에서 이용할 수 있는 BLAST 세트 중 BLASTP에 대한 디폴트 파라미터임)를 사용하는 BLASTP; 일치 2, 불일치 -1, 및 갭 -1의 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW; 디폴트 파라미터를 사용하는 MUSCLE; retree 2 및 최대 반복 1000의 파라미터를 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign.

2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 최고 또는 "최적화된" 동일성 백분율 점수를 생성하는 정렬에 의해 결정했을 때, 아미노산 잔기 또는 뉴클레오티드의 최대 상응성에 정렬된 2개 이상의 (예를 들어, 쌍 정렬의) (예를 들어, 다중 서열 정렬의) 서열을 지칭한다.

용어 "개방 해독 프레임" 또는 "ORF"는 일반적으로 단백질 또는 단백질의 일부를 암호화할 수 있는 뉴클레오티드 서열을 지칭한다. 개방 해독 프레임은 시작 코돈(예를 들어, RNA 분자의 경우 AUG 및 표준 코드의 DNA 분자 중 ATG로 표시됨)으로 시작할 수 있고, 프레임이 정지 코돈(예를 들어, RNA 분자의 경우 UAA, UGA 또는 UAG 및 표준 코드의 DNA 분자 중 TAA, TGA 또는 TAG로 표시됨)으로 끝날 때까지 코돈-트리플릿에서 판독될 수 있다.

하나 이상의 보존적 아미노산 치환을 갖는 본원에 기술된 효소 중 어느 하나의 변이체가 본 개시내용에 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않고도 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 소수성, 극성, 및 R 사슬 길이가 서로 유사한 아미노산들을 치환함으로써 달성될 수 있다. 추가적으로 또는 대안적으로, 상이한 종의 상동성 단백질의 정렬된 서열을 비교함으로써, 종들 간에 돌연변이된 아미노산 잔기(예를 들어, 암호화된 단백질의 기본 기능을 변경시키지 않은 비보존적 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기술된 레트로트랜스포사제 단백질 서열 중 어느 하나(예를 들어 본원에 기술된 MG140 계열 레트로트랜스포사제, 또는 본원에 기술된 임의의 기타 계열 레트로트랜스포사제)와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시예에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 레트로트랜스포사제의 하나 이상의 중요한 활성 부위 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 중 적어도 하나의 치환이 결여되어 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 모두의 치환이 결여되어 있다.

또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위해 하나 이상의 촉매 잔기의 치환을 갖는, 본원에 기술된 효소 중 어느 하나의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시예에서, 본원에 기술된 단백질로서의 감소된 활성 변이체는 도 2에 언급된 적어도 1개, 적어도 2개, 또는 3개의 촉매 잔기 모두의 파괴 치환을 포함한다.

기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참조 문헌을 통해 이용할 수 있다(예를 들어, Creighton의 문헌[Protein: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (1993년 12월)] 참조). 다음의 8개의 기는 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:

1) 알라닌 (A), 글리신 (G);

2) 아스파르트산 (D), 글루탐산 (E);

3) 아스파라긴 (N), 글루타민 (Q);

4) 아르기닌 (R), 리신 (K);

5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);

6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);

7) 세린 (S), 트레오닌 (T); 및

8) 시스테인 (C), 메티오닌 (M).

하나 이상의 치환, 결실, 또는 삽입을 갖는 본원에 기술된 핵산 서열 중 어느 하나의 변이체가 또한 본 개시내용에 포함된다. 일부 실시예에서, 이러한 변이체는 본원에 기술된 핵산 서열 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는다.

본원에 기술된 단백질 서열 중 일부는 선택된 더 큰 단백질(예를 들어, 레트로트랜스포사제)의 서열로부터 특정 도메인(예를 들어, 역전사 효소 또는 RT 도메인)의 결정을 포함한다. 이러한 경우, 도메인이 검증된(예를 들어, 3D 구조로) 기준 더 큰 단백질(예를 들어, 레트로트랜스포사제)과 다중 서열 정렬(MSA, multiple sequence alignment)을 사용하여, 선택된 단백질을 검증된 도메인이 있는 더 큰 단백질에 정렬시킴으로써 도메인 경계가 식별된다. 서열이 너무 다양하기 때문에 MSA가 결정적이지 않은 경우, 더 큰 단백질의 3D 구조가 결정되고 구조 도메인이 알려진 도메인과 비교되어 경계가 한정된다. 이들 경계는 도메인 경계 내에서 도메인에 대한 중요한 촉매 잔기의 존재를 보장함으로써 추가로 검증될 수 있다.

본원에서 사용되는 바와 같이, 용어 "LINE 레트로트랜스포사제"는 일반적으로 자율적인 비-LTR 레트로트랜스포존(긴 산재 요소(Long INterspersed Element))의 부류를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "R2 레트로트랜스포사제" 또는 "R4 레트로트랜스포사제"는 일반적으로 유사한 도메인 구조를 공유하지만 R2 레트로트랜스포사제에서는 부위 특이적(예를 들어, rRNA 유전자의 특정 부위에서의 통합)일 수 있는 반면, R4 레트로트랜스포존은 rRNA 유전자뿐만 아니라 반복을 함유하는 다른 비특이적 부위 모두에서 통합될 수 있다는 점에서 상이한 LINE 레트로트랜스포사제의 하위 부류를 지칭한다.

개요

독특한 기능 및 구조를 갖는 새로운 전위 가능한 요소의 발견은 데옥시리보핵산(DNA)을 추가로 파괴할 수 있는 편집 기술을 제공함으로써, 속도, 특이성, 기능, 및 사용 편이성을 개선할 수 있다. 미생물에서 전위 가능한 요소의 예측된 출현률 및 미생물 종의 얇은 다양성에 비하여, 비교적 적은 기능적으로 특성화된 전위 가능한 요소가 문헌에 존재한다. 이는 부분적으로는 많은 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 포함하는 자연 환경 적소로부터의 메타게놈 시퀀싱은 신규 문서화된 전위 가능한 요소의 수를 극적으로 증가시키고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 가능성을 제공할 수 있다.

전위 가능한 요소는 게놈 내의 위치를 변화시킬 수 있는 데옥시리보핵산 서열로서, 종종 돌연변이의 생성 또는 완화를 초래한다. 진핵생물에서, 게놈의 큰 비율, 및 세포 DNA의 질량의 큰 공유는 전위 가능한 요소에 기인한다. 전위 가능한 요소는 다른 유전자를 희생하여 자신을 전파하는 "이기적 유전자(selfish genes)"이지만, 이들은 다양한 중요한 기능을 수행하고 게놈 진화에 중요한 것으로 밝혀졌다. 그들의 메커니즘에 기초하여, 전위 가능한 요소는 클래스 I "레트로트랜스포존" 또는 클래스 II "DNA 트랜스포존"으로 분류된다.

레트로트랜스포존으로도 지칭되는 클래스 I 전위 가능한 요소는 RNA 중간체를 포함하는 2개-부분 "복사 및 붙여넣기" 메커니즘에 따라 기능한다. 먼저, 레트로트랜스포존이 전사된다. 생성된 RNA는 이어서 역전사 효소(일반적으로 레트로트랜스포존 자체에 의해 암호화됨)에 의해 DNA로 다시 전환되고, 역 전사된 레트로트랜스포존은 인테그라아제에 의해 게놈 내의 그의 새로운 위치에 통합된다. 레트로트랜스포존은 3개의 목(order)으로 추가로 분류된다. 긴 말단 반복("LTR", long terminal repeat)을 갖는 레트로트랜스포존은 역전사 효소를 암호화하고 반복 DNA의 긴 가닥이 측면에 위치한다. 긴 산재된 핵 요소("LINE", long interspersed nuclear element)를 갖는 레트로트랜스포존은 역전사 효소를 암호화하고, LTR이 결여되고, RNA 중합효소 II에 의해 전사된다. 짧은 산재된 핵 요소("SINE", short interspersed nuclear element)를 갖는 레트로트랜스포존은 RNA 중합효소 III에 의해 전사되지만, 역전사 효소가 결여되어 있으며, 대신에 다른 전위 가능한 요소(예를 들어, LINE)의 역전사 기구에 의존한다.

DNA 트랜스포존으로도 지칭되는 클래스 II 전위 가능한 요소는 RNA 중간체를 포함하지 않는 메커니즘에 따라 기능한다. 많은 DNA 트랜스포존은 트랜스포사제가 트랜스포존 측부에 위치하는 말단 역위 반복("TIR", terminal inverted repeat)에 결합하고, 트랜스포존을 공여자 영역으로부터 절단하고, 이를 게놈의 표적 영역 내로 삽입하는 "절단 및 붙여넣기" 메커니즘을 나타낸다. "헬리트론(helitron)"으로 지칭되는 다른 것들은 단일-가닥 DNA 중간체를 포함하고 HUH 엔도뉴클레아제 기능 및 5'에서 3'로의 헬리카제 활성을 갖는 것으로 이해되는 문서화되지 않은 단백질에 의해 매개되는 "롤링 서클" 메커니즘을 나타낸다. 먼저, DNA의 원형 가닥을 닉킹하여 2개의 단일 DNA 가닥을 생성한다. 단백질은 닉킹된 가닥의 5' 인산염에 부착된 상태로 유지되어, 상보성 가닥의 3' 히드록실 말단을 노출시켜 중합효소가 닉킹되지 않은 가닥을 복제할 수 있게 한다. 복제가 완료되면, 새로운 가닥은 분리되고 원래 주형 가닥과 함께 자체적으로 복제된다. 또 다른 DNA 트랜스포존인 "폴린톤(Polinton)"은 "자가 합성" 메커니즘을 거치도록 이론화된다. 전위는 라켓형 구조를 형성하는 단일-가닥 염색체외 폴린톤 요소의 인테그라아제의 절제에 의해 개시된다. 폴린톤은 DNA 중합효소 B로 복제되고, 이중 가닥 폴린톤은 인테그라아제에 의해 게놈 내에 삽입된다. 또한, IS200/IS605 계열의 것들과 같은 일부 DNA 트랜스포존은, TnpA가 공여자 유전자의 후행 가닥 주형으로부터 단일 가닥 DNA 조각(원형 "트랜스포존 조인트"로서)을 절제하고 이를 표적 유전자의 복제 포크 내로 재삽입하는 "박리 및 붙여넣기" 메커니즘을 통해 진행된다.

전위 가능 요소는 생물학적 도구로서 일부 용도를 발견하였지만, 문서화된 전위 가능 요소는 가능한 생물다양성 및 표적성의 전체 범위를 포함하지 않으며, 모든 가능한 활성을 나타내지 않을 수 있다. 여기에서, 수천 개의 게놈 단편을 전위 가능한 요소에 대한 다수의 메타게놈으로부터 채굴하였다. 전위 가능한 요소의 문서화된 다양성이 확장되었을 수 있고, 신규 시스템이 고도로 표적화되고, 콤팩트하고, 정확한 유전자 편집제로 개발되었을 수 있다.

MG 효소

일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이들 후보는 하나 이상의 신규한 하위 유형을 나타낼 수 있고, 일부 하위 패밀리가 식별되었을 수 있다. 이들 레트로트랜스포사제는 약 1,400개 미만의 아미노산 길이이다. 이들 레트로트랜스포사제는 전달을 단순화할 수 있고 치료 적용을 연장할 수 있다.

일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이러한 레트로트랜스포사제는 본원에 기술된 바와 같은 MG140일 수 있다(도 1 및 도 2 참조).

일 측면에서, 본 개시내용은 메타게놈 시퀀싱을 통해 발견된 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 메타게놈 시퀀싱은 샘플에 대해 수행된다. 일부 실시예에서, 샘플은 다양한 환경으로부터 수집될 수 있다. 이러한 환경은 인간 마이크로바이옴, 동물 마이크로바이옴, 고온을 갖는 환경, 저온을 갖는 환경일 수 있다. 이러한 환경은 침전물을 포함할 수 있다.

일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 레트로트랜스포사제는 3' 미번역 영역(UTR)에 결합하도록 구성될 수 있다. 레트로트랜스포사제는 5' 미번역 영역(UTR)에 결합할 수 있다.

일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.

일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.

일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.

일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.

일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.

일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.

일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.

일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.

본 개시내용에 따라 레트로트랜스포사제와 함께 사용될 수 있는 NLS 서열의 예

소스	NLS 아미노산 서열	서열번호
SV40	PKKKRKV	896
뉴클레오플라스민 이분 NLS	KRPAATKKAGQAKKKK	897
c-myc NLS	PAAKRVKLD	898
c-myc NLS	RQRRNELKRSP	899
hRNPA1 M9 NLS	NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY	900
임포르틴-알파 IBB 도메인	RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV	901
Myoma T 단백질	VSRKRPRP	902
Myoma T 단백질	PPKKARED	903
p53	PQPKKKPL	904
마우스 c-abl IV	SALIKKKKKMAP	905
인플루엔자 바이러스 NS1	DRLRR	906
인플루엔자 바이러스 NS1	PKQKKRK	907
간염 바이러스 델타 항원	RKLKKKIKKL	908
마우스 Mx1 단백질	REKKKFLKRR	909
인간 폴리(ADP-리보오스) 중합효소	KRKGDEVDGVDEVAKKKSKK	910
스테로이드 호르몬 수용체(인간) 글루코코르티코이드	RKCLQAGMNLEARKTKK	911

일부 실시예에서, 서열은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.

일 측면에서, 본 개시내용은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.

일 측면에서, 본 개시내용은 조작된 핵산 서열을 포함하는 핵산을 제공한다. 일부 실시예에서, 조작된 핵산 서열은 유기체에서의 발현에 최적화된다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 유기체는 미배양 유기체가 아니다.

일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.

일부 실시예에서, 유기체는 원핵생물이다. 일부 실시예에서, 유기체는 박테리아이다. 일부 실시예에서, 유기체는 진핵생물이다. 일부 실시예에서, 유기체는 진균류이다. 일부 실시예에서, 유기체는 식물이다. 일부 실시예에서, 유기체는 포유류이다. 일부 실시예에서, 유기체는 설치류이다. 일부 실시예에서, 유기체는 인간이다.

일 측면에서, 본 개시내용은 조작된 벡터를 제공한다. 일부 실시예에서, 조작된 벡터는 레트로트랜스포사제를 암호화하는 핵산 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다.

일부 실시예에서, 조작된 벡터는 본원에 기술된 핵산을 포함한다. 일부 실시예에서, 본원에 기술된 핵산은 본원에 기술된 데옥시리보핵산 폴리뉴클레오티드이다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.

일 측면에서, 본 개시내용은 본원에 기술된 벡터를 포함하는 세포를 제공한다.

일 측면에서, 본 개시내용은 레트로트랜스포사제를 제조하는 방법을 제공한다. 일부 실시예에서, 방법은 세포를 배양하는 단계를 포함한다.

일 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 절단, 마킹, 또는 변형시키는 방법을 제공한다. 방법은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 레트로트랜스포사제와 접촉시키는 단계를 포함할 수 있다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.

일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.

일 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 일부 실시예에서, 복합체는 해당 복합체가 표적 핵산 유전자좌에 결합할 때, 해당 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다.

일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시예에서, 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.

일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 핵산 또는 본원에 기술된 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 프로모터를 포함한다. 일부 실시예에서, 레트로트랜스포사제를 암호화하는 개방 해독 프레임은 프로모터에 작동 가능하게 연결된다.

일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 RNA를 암호화하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함한다.

일부 실시예에서, 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.

일 측면에서, 본 개시내용은 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.

일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.

일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나, E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다.

일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다.

일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다.

일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.

일 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.

일 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.

일 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공한다. 일부 실시예에서, 방법은 레트로트랜스포사제를 포함하는 조성물을 세포에 접촉시키는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.

일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.

일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.

본 개시내용의 시스템은, 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 응용에 사용될 수 있다. 이러한 시스템은, 예를 들어 대상체에서 질환을 유발할 수 있는 유전적으로 물려받은 돌연변이를 처리(예를 들어 제거 또는 치환)하는 데 사용될 수 있고, 세포에서 유전자의 기능을 확실하게 하기 위해 유전자를 불활성화시키는 데 사용될 수 있고, (예를 들어, 역-전사된 바이러스 RNA를 절단하거나 질환-유발 돌연변이를 암호화하는 증폭된 DNA 서열을 절단함으로써) 질환을 유발하는 유전적 요소를 검출하기 위한 진단 도구로서 사용될 수 있고, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내 박테리아를 암호화하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 비활성화된 효소로서 사용될 수 있고, 바이러스 게놈을 표적화함으로써 바이러스를 불활성화시키거나 바이러스가 숙주 세포를 감염시킬 수 없게 하는 데 사용될 수 있고, 유전자를 추가하거나 대사 경로를 변경하여 유기체가 귀중한 소분자, 거대분자, 또는 이차 대사물을 생산하도록 이를 조작하는 데 사용될 수 있고, 진화적 선택을 위한 유전자 구동 요소를 확립하는 데 사용될 수 있고, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 섭동을 검출하는 데 사용될 수 있다.

예

IUPAC 규칙에 따라, 다음의 약어가 예 전체에 걸쳐 사용된다:

A = 아데닌

C = 시토신

G = 구아닌

T = 티민

R = 아데닌 또는 구아닌

Y = 시토신 또는 티민

S = 구아닌 또는 시토신

W = 아데닌 또는 티민

K = 구아닌 또는 티민

M = 아데닌 또는 시토신

B = C, G, 또는 T

D = A, G, 또는 T

H = A, C, 또는 T

V = A, C, 또는 G

예 1 - 신규 단백질에 대한 메타게놈 분석 방법

퇴적물, 토양 및 동물로부터 메타게놈 샘플을 수집하였다. 데옥시리보핵산(DNA)을 Zymobiomics DNA 미니-분취 키트로 추출하고 Illumina HiSeq^® 2500 상에서 시퀀싱하였다. 재산 소유자의 동의 하에 샘플을 수집하였다. 공개 소스로부터의 추가 원시 서열 데이터는 동물 미생물, 퇴전물, 토양, 온천, 열 벤트, 해양, 피트 보그, 퍼마프로스트, 및 하수 서열을 포함하였다. 신규한 레트로트랜스포사제를 식별하기 위해 문서화된 레트로트랜스포사제 단백질 서열에 기초하여 생성된 Hidden Markov Models을 사용하여 메타게놈 서열 데이터를 검색하였다. 검색에 의해 식별된 신규한 레트로트랜스포사제 문서화된 단백질과 정렬시켜 잠재적 활성 부위를 식별하였다. 이러한 메타게놈 워크플로우는 본원에 기술된 MG140 계열을 묘사한다.

예 2 - MG140 계열의 레트로트랜스포사제의 발견

예 1의 메타게놈 분석의 데이터를 분석한 결과, 1 계열(MG140)을 포함하는 기술되지 않은 추정 레트로트랜스포사제 시스템의 새로운 클러스터가 밝혀졌다. 이들 신규한 효소 및 이들의 예시적인 서브도메인에 대한 상응하는 단백질 서열은 서열번호 1-29, 393-401, 및 799-894로 제시된다.

예 3 - 역전사된 DNA의 시험관 내 활성의 통합(예시)

인테그라아제 활성은 대장균 용해물-기반 발현 시스템(예를 들어, myTXTL, Arbor Biosciences)에서의 발현을 통해 수행될 수 있다. 시험관 내 시험에 사용되는 성분은 3개의 플라스미드이다: T7 프로모터 하에 레트로트랜스포존 유전자를 갖는 발현 플라스미드, 표적 플라스미드, 및 선별 마커 유전자(예를 들어, Tet 내성 유전자) 주위에 레트로트랜스포사제에 의해 인식되는 5' 및 3' UTR 서열을 함유하는 공여자 플라스미드. 용해물-기반 발현 산물, 표적 DNA, 및 공여자 플라스미드를 인큐베이션하여 전위가 발생할 수 있게 한다. PCR을 통해 전위를 검출한다. 또한, 전위 산물을 T5로 태그하고 NGS를 통해 시퀀싱하여 전위 이벤트의 집단 상의 삽입 부위를 결정한다. 대안적으로, 시험관 내 전위 산물을 항생제(예를 들어, Tet) 선별 하에 대장균 내로 형질시킬 수 있으며, 여기서 선별 마커가 플라스미드 내에 안정적으로 삽입될 때 성장이 발생한다. 단일 콜로니 또는 E. coli 집단 중 어느 하나를 시퀀싱하여 삽입 부위를 결정할 수 있다.

통합 효율성을 통합된 카고가 있는 표적 DNA의 실험 출력의 ddPCR 또는 qPCR을 통해 측정할 수 있으며, ddPCR을 통해 측정된 변형되지 않은 표적 DNA의 양으로 정규화한다.

이러한 검정은 또한 용해물-기반 발현보다는 정제된 단백질 성분으로 수행될 수 있다. 이 경우, 단백질은 T7 유도성 프로모터 하에 E. coli 프로테아제-결핍 B 균주에서 발현되고, 세포는 초음파처리를 사용하여 용해되고, His-태그된 관심 단백질은 AKTA Avant FPLC(GE Lifescience) 상의 HisTrap FF(GE Lifescience) Ni-NTA 친화도 크로마토그래피를 사용하여 정제된다. 순도는 SDS-PAGE 및 InstantBlue Ultrafast(Sigma-Aldrich) 쿠마시 염색 아크릴아미드 겔(Bio-Rad) 상에서 분해된 단백질 밴드의 ImageLab 소프트웨어(Bio-Rad)에서의 밀도계를 사용하여 결정된다. 단백질은 50 mM 트리스-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5(또는 최대 안정성을 위해 결정된 다른 완충액)로 구성된 보관 완충액에서 탈염되고 -80°C에서 보관된다. 정제 후, 트랜스포존 유전자를 반응 완충액, 예를 들어 15 mM MgOAc₂가 보충된 26 mM HEPES pH 7.5, 4.2 mM TRIS pH 8, 50 μg/mL BSA, 2 mM ATP, 2.1 mM DTT, 0.05 mM EDTA, 0.2 mM MgCl₂, 30-200 mM NaCl, 21 mM KCl, 1.35% 글리세롤, (pH 7.5 측정)에서 전술한 바와 같이 표적 DNA 및 공여자 플라스미드에 첨가한다.

예 4 - 겔 시프트를 통한 레트로트랜스포존 말단 검증(예시)

레트로트랜스포존 말단을 전기영동 이동성 시프트 분석(EMSA, electrophoretic mobility shift assay)을 통해 레트로트랜스포사제 결합에 대해 시험한다. 이 경우, 표적 DNA 단편(100-500 bp)을 FAM-표지된 프라이머를 사용하는 PCR을 통해 FAM으로 말단-표지한다. 3' UTR RNA 및 5' UTR RNA를 T7 RNA 중합효소를 사용하여 시험관 내에서 생성하고 정제한다. 레트로트랜스포사제 단백질을 시험관 내 전사/번역 시스템(예를 들어, PURExpress)에서 합성한다. 합성 후, 결합 완충액(예를 들어 20 mM HEPES pH 7.5, 2.5 mM Tris pH 7.5, 10 mM NaCl, 0.0625 mM EDTA, 5 mM TCEP, 0.005% BSA, 1 μg/mL 폴리(dI-dC), 및 5% 글리세롤) 중 10 μL 반응에서 1 μL의 단백질을 50 nM의 표지된 DNA 및 100 ng의 3' 또는 5' UTR RNA에 첨가한다. 결합을 30°에서 40분 동안 인큐베이션한 다음, 2 μL의 6X 로딩 완충액(60 mM KCl, 10 mM Tris pH 7.6, 50% 글리세롤)을 첨가한다. 결합 반응을 5% TBE 겔 상에서 분리하고 시각화한다. 레트로트랜스포사제 단백질 및 표적 DNA의 존재 하의 3' 또는 5' UTR의 시프트는 성공적인 결합에 기인할 수 있고, 레트로트랜스포사제 활성을 나타낸다. 이러한 검정은 또한 E. coli 추출물 또는 정제된 단백질을 사용할 뿐만 아니라, 레트로트랜스포사제 절단 또는 돌연변이로 수행할 수 있다.

예 5 - 표적 DNA 검증의 절단(예시)

레트로트랜스포사제가 표적 DNA의 절단에 관여함을 확인하기 위해, 짧은(약 140 bp) DNA 단편을 FAM-표지된 프라이머를 사용하는 PCR을 통해 양 말단에서 FAM으로 표지한다. 시험관 내 전사/번역 레트로트랜스포사제 산물을 1 μg의 Rnase A(음성 대조군), 또는 3' UTR, 5' UTR 또는 비-특이적 RNA 단편(대조군)과 함께 사전 인큐베이션한 다음, 표지된 표적 DNA와 함께 37℃에서 인큐베이션한다. 그런 다음, DNA를 변성 겔 상에서 분석한다. DNA의 하나 또는 양쪽 가닥의 절단은 겔 상에서 상이한 속도로 이동하는 다양한 크기의 표지된 단편을 초래할 수 있다.

예 6 - E. coli 에서의 인테그라아제 활성(예시)

조작된 E. coli 균주를 레트로트랜스포존 유전자를 발현하는 플라스미드 및 통합에 관여하는 레트로트랜스포존의 5' 및 3' UTR이 측면에 위치한 선별 마커를 갖는 온도-민감성 복제 기점을 함유하는 플라스미드로 형질전환한다. 그런 다음, 이들 유전자의 발현을 위해 유도된 형질전환체를 플라스미드 복제를 위한 제한 온도에서의 선별에 의해 게놈 표적으로의 마커의 전달에 대해 스크리닝하고, 게놈 내의 마커 통합을 PCR에 의해 확인한다.

통합을 편향되지 않은 접근법을 사용하여 스크리닝한다. 간단하게, 정제된 gDNA는 Tn5로 태그하고, 그런 다음 관심 DNA는 Tn5 태그 부착 및 선별 마커에 특이적인 프라이머를 사용하여 PCR 증폭한다. 그런 다음, 앰플리콘을 NGS 시퀀싱을 위해 준비한다. 생성된 서열의 분석을 트랜스포존 서열로 트리밍하고, 측면 서열을 게놈에 맵핑하여 삽입 위치를 결정하고, 삽입 비율을 결정한다.

예 7 - 역 전사된 DNA를 포유류 게놈에 통합(예시)

포유류 세포에서 표적화 및 절단 활성을 나타내기 위해, 인테그라아제 단백질을 단백질 서열의 N, C 또는 양쪽 말단에서 2개의 NLS 펩티드를 갖는 E. coli 또는 sf9 세포에서 정제한다. 이 절차에서, 전위에 관여하고 CMV 프로모터의 조절 하에 있는 5' 및 3' UTR 영역이 측면에 위치한 선별 가능한 네오마이신 내성 마커(NeoR) 또는 형광 마커를 함유하는 플라스미드를 합성한다. 세포를 플라스미드로 형질감염시키고, RNA 전사를 위해 4 내지 6시간 동안 회수한 다음, 정제된 인테그라아제 단백질로 전기천공한다. 게놈 내로의 항생제 내성 통합을 G418-내성 콜로니 계수(형질감염 후 7일차에 시작하도록 선별함)에 의해 정량화하고, 형광 마커에 의한 양성 전위를 형광 활성화 세포 세포 계측법에 의해 분석한다. 제2 형질감염 후 7 내지 10일차에, 게놈 DNA를 추출하여 NGS 라이브러리의 제조에 사용한다. 표적 외 빈도를, 게놈을 단편화하고 트랜스포존 마커의 앰플리콘을 제조하고 NGS 라이브러리 제조를 위한 측부 DNA에 의해 분석한다. 각각의 표적화 시스템의 활성을 시험하기 위해 적어도 40개의 상이한 표적 부위를 선택한다.

또한 포유류 세포에서의 통합을 RNA 전달을 통해 평가할 수 있다. 2개의 NLS를 갖는 레트로트랜스포사제를 암호화하는 RNA를 설계하고, 캡 및 폴리A 꼬리를 첨가한다. 제2 RNA를 선별 가능한 네오마이신 내성 마커(NeoR) 또는 5' 및 3' UTR 영역이 측면에 위치한 형광 마커를 함유하도록 설계한다. RNA 작제물을 Lipofectamine™ RNAiMAX 또는 TransIT®-mRNA 형질감염 시약을 통해 포유류 세포 내로 도입한다. 형질감염 후 10일차에, 게놈 DNA를 추출하여 ddPCR 및 NGS를 사용하여 전위 효율을 측정한다.

예 8 - RT의 생물정보학적 발견

미생물, 바이러스 및 진핵생물 게놈의 광범위한 조립-구동 메타게놈 데이터베이스를 채굴하여 역전사 효소 기능을 갖는 예측된 단백질을 검색하였다. Pfam 도메인 PF00078 및 PF07727에 대한 히트를 갖는 것에 기초하여 450만 개가 넘는 RT 단백질을 예측하였는데, 이 중 340만 개가 유의한 e-값(< 1 x 10^-5)을 가졌다. RT(역전사 효소) 도메인 커버리지가 ≥ 70%이고 예측된 촉매 잔기([F/Y]XDD)를 갖는 완전한 ORF에 대해 필터링한 후, 추가 분석을 위해 거의 50만 개의 단백질을 보유하였다. RT 도메인을 이러한 단백질 세트뿐만 아니라, 공개 데이터베이스로부터 검색된 기준 서열로부터 추출하였다. 도메인 서열을 Mmseqs2 이지-클러스터를 사용해 80% 커버리지에 걸쳐 50% 동일성으로 클러스터링하였으며(Bioinformatics 2016 May 1;32(9):1323-30 참조, 이는 그 전체가 참조로서 본원에 통합됨), 대표적인 서열(총 26,824개)을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬하였고(Bioinformatics 2016; 32: 3246-3251 참조, 이는 그 전체가 참조로서 본원에 통합됨), 도메인 정렬은 FastTree2를 사용하여 계통발생 트리를 추론하는 데 사용하였다(Plos One 2010; 5: e9490 참조, 이는 그 전체가 참조로서 본원에 통합됨). RT 도메인의 계통발생 분석은 서열 다양성이 높은 많은 상이한 부류의 RT가 회수되었음을 시사한다(도 4).

예 9 - 비-LTR 레트로트랜스포존(MG140, MG146, MG147, MG148, 및 MG149 패밀리)의 예

레트로트랜스포존 생물정보학 분석

비 긴 말단 반복(비-LTR) 레트로트랜스포사제는 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. 비-LTR 레트로트랜스포사제를 도 4의 계통발생 트리의 R2/R4 및 LINE 계통군 내에서 식별하였다. R2, R4, 및 LINE으로 분류된 RT 도메인을 함유하는 전장 단백질을 99% 서열 동일성으로 클러스터링하고, 대표적인 서열을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시켰다. 이러한 정렬로부터 계통발생 트리를 추론하고, R2/R4 레트로트랜스포사제 계열뿐만 아니라 다른 RT-관련 계열을 기술하였다(도 5a).

R2는 표적-프라이밍된 역전사(TPRT)를 통해 카고를 통합하는 비-LTR 레트로트랜스포존이다. MG140 계열의 많은 R2 효소는 RT 도메인뿐만 아니라, Zn-핑거를 기술하는 엔도뉴클레아제 도메인 및 다수의 Zn-결합 리본 모티프를 함유한다(도 5b 및 6a). 일부 R2 레트로트랜스포존은, 28S rDNA 유전자의 단편이 측면에 위치한 MG140-47(서열번호 395) R2 레트로트랜스포존의 경계에 의해 도시된 바와 같이, 28S rDNA에 통합된다(도 6b). 다른 레트로트랜스포존은 18S rRNA 유전자에 통합되고, 트랜스포존의 3' 말단을 정의하는 폴리A 또는 폴리T 꼬리를 함유한다(도 7). 정확한 표적 결합 부위뿐만 아니라 5'-UTR, 3'-UTR, 및 폴리-T가 정확하고 특이적인 통합에 관여하는 것이 가능하다.

Archaeal 게놈으로부터 유래된 레트로트랜스포존 MG146-1(서열번호 402)은 RT 도메인, Zn-결합 리본 모티프, 및 엔도뉴클레아제 도메인을 함유하고, 효소 내의 도메인 구조는 다른 단일 ORF 비-LTR 레트로트랜스포존의 도메인 구조와 상이하다(도 8a).

MG147 계열 구성원 MG140-17-R2(서열번호 18) 레트로트랜스포존은 5' 및 3' UTR이 측면에 위치한 3개의 ORF로 조직된다(도 8b). RNA 인식 모티프(RRM) 유전자는 RNA 주형의 인식에 관여할 가능성이 있는 반면, 엔도뉴클레아제 유전자는 표적 부위의 인식 및 닉킹에 관여할 가능성이 있다. ORF 3개는 주형의 역전사를 담당하는 효소이며 RT 도메인, Zn-결합 리본 모티프, 및 RNAse-H 도메인을 함유한다.

계열 MG148은 모든 예상 촉매 잔기의 존재에 의해 활성일 것으로 예측되는, 초 발산 RT 상동체를 포함한다. 여러 계열 구성원에 대한 뉴클레오티드 수준에서의 정렬은 5' UTR 내에서 보존된 영역을 커버하지 않았으며, 이는 RT 기능, 활성 또는 동원에 관련될 수 있다(도 9b).

qPCR에 의한 레트로트랜스포존 RT(역전사 효소)의 시험관 내 활성 시험

레트로트랜스포존 RT의 시험관 내 활성을 40 mM Tris-HCl(pH 7.5), 0.2 M NaCl, 10 mM MgCl₂, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서 무세포 발현 시스템(PURExpress, NEB)에서 유래된 RT 효소와 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(200nt)을 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 전장 cDNA 산물을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽함으로써 qPCR에 의해 정량화하였다.

MG140-3(서열번호 3), MG140-6(서열번호 6), MG140-7(서열번호 7), MG140-8(서열번호 8), MG140-13(서열번호 14), 및 MG146-1(서열번호 402) 을 프라이머 연장을 통해 활성이다(도 10 및 도 11). MG140-3 및 MG146-1에 대해 충실도의 예비 평가를 수행하여, 상대 오차율이 MMLV보다 각각 1.5배 및 1.35배 더 높았다(도 12). 충실도 측정을 위해, 전술한 프라이머 연장 검정에서 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다.

통합 부위

일부 비-LTR 레트로트랜스포존(예를 들어 MG140-1과 같은 MG140 계열)은 제2(G) 위치와 제3(T) 위치 사이의 삽입 부위를 갖는 특이적 GGTGAC 모티프를 표적화함으로써 28S rDNA 유전자에 통합될 것으로 예측된다. 이러한 레트로트랜스포존 단백질의 N-말단은 3개의 아연(Zn) 핑거(CCHH 유형 중 2개 및 CCHC 유형 중 하나)를 함유하고, 이어서 YADD 활성 부위를 갖는 역전사 효소(RT) 도메인을 함유한다. 이러한 레트로트랜스포존 단백질의 C-말단은 추가 CCHC Zn-핑거를 갖는 엔도뉴클레아제 도메인을 포함한다. 단백질은 각각 289 및 478 bp 길이의 5' 및 3' UTR이 측면에 위치한다(도 31).

예 10 - II족 인트론 RT(MG153, MG163, MG164, MG165, MG166, MG167, MG168, MG169, 및 MG170 계열)

II족 생물정보학 분석

II족 인트론은 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. II족 인트론으로부터의 RT 도메인을 식별하고 도 4의 계통발생 트리에 기술하였다. RT 효소의 측면에 > 2 kb의 서열을 갖는 콘티그로부터의 RT 도메인을 함유하는 10,000개가 넘는 고유한 전장 II족 인트론 단백질을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬하였다. 이러한 정렬로부터 계통발생 트리를 추론하고, II족 인트론 계열을 추가로 식별하였다(도 13). II족 인트론 효소를 클래스 A-G, ML, 및 CL로 분류할 수 있고, 이들의 도메인 구조는 활성인 것으로 예측된 RT 도메인뿐만 아니라 인트론 동원에 관여하는 성숙효소 도메인을 포함한다. 일부 II족 인트론 단백질은 표적 인식 및 절단에 관여할 가능성이 있는 추가 엔도뉴클레아제 도메인을 함유한다. 식별된 모든 계열의 많은 후보를 실험실 특성화를 위해 지명하였다.

II족 인트론 RT 클래스 C, D, 및 F의 시험관 내 활성을 시험

GII 인트론 클래스 C(MG153), 클래스 D(MG165), 및 클래스 F(MG167) RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였으며 이는 N-말단 단일 Strep 태그를 함유하였다. RT의 발현을 SDS-PAGE 분석에 의해 확인하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl₂, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.

변성 겔 상의 cDNA 산물의 검출에 의해, 다음의 GII 인트론 클래스 C 후보는 이러한 실험 조건 하에서 활성이었다: MG153-1 내지 MG153-6(서열번호 555-560), MG153-9(서열번호 563), MG153-10(서열번호 564), MG153-12(서열번호 566), MG153-13(서열번호 567), MG153-15(서열번호 569), MG153-18(서열번호 572), MG153-20(서열번호 574), MG153-29 내지 MG153-31(서열번호 580-582), MG153-33 내지 MG153-37(서열번호 584-588), MG153-41(서열번호 592), MG153-42(서열번호 593), MG153-45(서열번호 596), MG153-51(서열번호 602), MG153-53(서열번호 604), MG153-54(서열번호 605), 및 MG153-57(서열번호 608). (도 14 및 15). 활성의 신규한 후보는 더 작은 cDNA 드롭오프 산물의 존재에 의해 나타나는, 고도로 가공성인 대조군 GII 클래스 C RT GsI-IIC 및 MarathonRT에 비해 다양한 정도의 겉보기 가공성을 나타낸다. qPCR에 의해, 다음의 추가 후보도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨): MG153-7(서열번호 561), MG153-8(서열번호 562), MG153-10(서열번호 564), MG153-11(서열번호 565), MG153-14(서열번호 568), MG153-17(서열번호 571), MG153-19(서열번호 573), MG153-25 내지 MG153-28(서열번호 576-579), MG153-32(서열번호 583), MG153-39(서열번호 590), MG153-40(서열번호 591), MG153-43(서열번호 594), MG153-47(서열번호 598), MG153-50(서열번호 601), MG153-55(서열번호 606) 및 MG153-56(서열번호 607)(도 14d 및 15d).

변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 D 후보 MG165-1(서열번호 684) 및 MG165-5(서열번호 688)는 이들 실험 조건 하에서 활성이다(도 16a). qPCR에 의해, 추가 후보 MG165-4(서열번호 687), MG165-6(서열번호 689), 및 MG165-8(서열번호 691)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 16b).

변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 F 후보 MG167-1(서열번호 698) 및 MG167-4(서열번호 701)는 이들 실험 조건 하에서 활성이다(도 17a). qPCR에 의해, 추가 후보 MG167-3(서열번호 700) 및 MG167-5(서열번호 702)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 17b).

GII 인트론 RT의 상대 충실도 평가

GII 클래스 C MG153 후보의 상대 충실도를 평가하기 위해, 전술한 프라이머 연장 검정에서 생성된 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 짝을 지은 판독물을 완벽한 중첩을 요구하고 중첩되지 않는 모든 부분을 트리밍하는 bbmerge.sh 사용하여 병합하였다(Plos One 2017; 12: e0185056). 그런 다음, 병합된 판독물을 BWA-MEM(Li H. 2013)을 사용하여 기준 주형에 정렬시키고, 파삼스타트(https://github.com/alimanfoo/pysamstats)를 사용하여 기준 대비 각 위치에서 불일치의 수를 계산하였다. 시험된 GII 클래스 C 후보 중에서, MG153-6(서열번호 560) 및 MG153-12(서열번호 566)는 MMLV 대조군 RT 및 다른 GII 인트론 클래스 C RT에 비해 재현 가능한 정도로 더 높은 오차율을 갖는다(도 18).

인간 세포 cDNA 합성 결과

포유류 환경에서 cDNA를 생산하는 이들 효소의 능력을 포유류 세포에서 발현시키고 PCR에 의한 cDNA 합성을 검출한 다음, 아가로오스 전기영동 및 D1000 TapeStation에 의해 시험하였다. 역전사 효소를 플래그-HA 태그(FH)에 더하여, N 말단에서 MS2 외피 단백질(MCP)을 갖는 융합 단백질로서 CMV 프로모터 하에서 포유류 발현을 위한 플라스미드에 클로닝하였다. MCP는 MS2 박테리오파지로부터 유래된 단백질로서, 높은 친화도(나노몰 미만 Kd)로 20개의 뉴클레오티드 RNA 줄기 루프를 인식한다. RT를 MCP와 융합하고 RNA 주형에 MS2 루프를 가짐으로써, RT가 번역되면, RNA 주형을 찾아 RNA 주형에 혼성화된 DNA 프라이머로부터 cDNA 합성을 시작하는 것이 보장된다.

CMV 프로모터 하에 RT 후보물질에 융합된 MCP를 함유하는 플라스미드를 클로닝하고 HEK293T 세포에서 형질감염을 위해 단리하였다. 형질감염은 리포펙타민 2000을 사용하여 수행하였다. 제조자 지침에 따라 mMESSAGE mMACHINE(Thermo Fisher)을 사용하여 mRNA 암호화 나노루시퍼라제(서열번호 33)를 제조하였다. mRNA 제제에 남아 있는 임의의 DNA 주형을 분해하기 위해, 반응물을 1시간 동안 Turbo Dnase(Thermo Fisher)로 처리하고, MEGAclear Transcription Clean-Up 키트(Thermo Fisher)를 사용하여 mRNA를 세정하였다. mRNA를 10mM Tris pH 7.5, 50mM NaCl 중 상보성 DNA 프라이머(서열번호 34)에 95℃에서 2분 동안 혼성화시키고, 0.1℃/s의 속도로 4℃로 냉각시켰다. MCP-RT 융합을 함유하는 플라스미드가 형질감염된 후 6시간차에, mRNA/DNA 혼성체를 Lipofectamine Messenger Max를 사용하여 HEK293T 세포 내로 형질감염시켰다. mRNA/DNA 형질감염 후 18시간차에, QuickExtra DNA 추출 용액(Lucigen)을 사용하여 세포를 용해시키고, 24 웰 플레이트에서 24 웰 당 100 μL의 빠른 추출물을 첨가하였다. 나노루시페라제는 약 500 bp 길이이고, 새롭게 합성된 cDNA로부터 100 bp 및 542 bp의 산물을 증폭하기 위한 프라이머를 설계하였다(서열번호 38 및 39). cDNA를 전술한 프라이머 세트를 사용하여 증폭시키고, PCR 산물을 아가로오스 겔 전기영동(도 19a) 또는 DNA Tape Station(도 19b)에 의해 검출하였다.

100bp 및 500bp DNA 산물의 존재에 의해 도시된 바와 같이, 대조군 GII 인트론 RT Marathon, Marathon PE2, 및 TGIRT에 대한 활성을 검출하였다(도 19a 및 19b). 또한, 신규한 GII 인트론 유래 RT MG153-1 내지 MG153-4(서열번호 555-558), MG153-7 내지 MG153-13(서열번호 561-567), MG153-15(서열번호 569), MG153-16(서열번호 570) 및 MG153-21(서열번호 575)에 대한 활성도 도시하였다(도 19a, 19b, 및 19c). 신규 RT에 대한 PCR 산물의 신호는 Marathon 및 TGIRT의 신호와 유사하였다. 전체적으로, 이는 새롭게 발견된 RT가 발현되고, 적절하게 접히고, 살아있는 포유류 세포 내에서 활성이어서, 이들의 생명공학적 적용을 위한 옵션을 개방한다는 것을 보여준다.

II족 인트론 RT는 변형된 프라이머를 사용하여 cDNA를 합성할 수 있다

RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 프라이머 내의 다양한 위치에서 포스포로티오에이트(PS) 결합 변형을 함유하는 5'-FAM 표지된 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 프라이머 1(서열번호 736, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTTGTCTG을 함유함)은 올리고의 5' 말단에 5개의 PS 결합을 함유한다. 프라이머 2(서열번호 737, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*T*G를 포함함, 여기서 *는 포스포로티오에이트 결합을 나타냄)는 올리고의 5' 및 3 말단 모두에서 5개의 PS 결합을 함유한다. 프라이머 3(서열번호 738, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*TG를 함유함, 여기서 *는 포스포로티오에이트 결합을 나타냄)은 표준 결합이 2개의 최대 3' 말단 뉴클레오티드 사이에서 치환된다는 점에서 프라이머 2와 상이하다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl₂, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 대조군 RT MMLV(바이러스) 및 TGIRT-III(GII 인트론)은 모두 모든 변형된 프라이머로 프라이머 연장을 수행할 수 있다(도 32). GII 인트론 RT MG153-9는 또한 시험된 모든 PS-변형된 DNA 프라이머로부터 연장될 수 있다(도 33).

인간 세포 RT 발현 및 cDNA 합성 결과

포유류 세포 환경에서 cDNA를 합성하는 신규한 GII RT의 능력을 실질적이지 않은 변형으로 전술한 바와 같이 시험하였다. PCR을 사용하여 cDNA 합성을 검출하고 아가로오스 겔 전기영동 또는 TapeStation에 의해 분석하였다. 정량적 판독을 갖기 위해, 서열번호 739로 열거된 Taqman 프로브로 이미 문서화된 Taqman qPCR 프라이머를 사용하여 Taqman qPCR 검정을 개발하였다. MG153 계열의 모든 시험된 후보는 다양한 정도로 활성이 있었으며, 활성은 400배만큼 광범위하였다(도 34). 시험된 계열의 RT는 MG153-1 내지 MG153-13, MG153-15, MG153-16, MG153-18, MG153-20, MG153-21, MG153-29 내지 MG153-31, MG153-33 내지 MG153-37, MG153-45, MG153-51, MG153-53, MG153-54, MG153-57, MG165-1, MG165-5, MG167-1 및 MG167-4를 포함한다. 여러 RT(MG153-15, MG153-53, MG153-4, MG153-18, MG153-20, MG153-7 및 MG153-5)가 TGIRT 대조군을 능가하였다(도 34).

포유류 세포에서 GII RT의 단백질 발현 및 안정성을 이해하기 위해, 면역블롯을 수행하였다. 간략하게, 형질감염된 세포를 프로테아제 억제제(24 웰 포맷의 웰 당 80 μL)가 보충된 RIPA 용해 완충액(Thermo Fisher)으로 용해시켰다. 불용성 응집체를 제거하기 위해 용해물을 4℃에서 14,000 g로 10분 동안 원심분리하였다. BCA를 사용하여 단백질을 정량화하였다. 레인 당 3 또는 10 μg의 총 단백질을 4-12% 폴리아크릴아미드 SDS 겔(Thermo Fisher)에 로딩하였다. 모든 레인을 동일한 양의 단백질로 정규화하였다. 단백질을 iBlot 겔 전달 시스템(Invitrogen)을 사용하여 PVDF 막으로 옮겼다. HRP-기반 검출 방법을 사용하여 토끼 HA 항체(Cell Signaling)를 사용하여 단백질을 검출하였다. 결과는 밴드의 강도에 의해 주어진 바와 같이, 다양한 수준의 단백질 발현 또는 안정성을 시사한다(도 35). 우리는 각 단백질의 발현을 정량화하고 총 단백질 발현에 대해 cDNA 합성 활성을 정규화하였다: 7개의 MG153 RT가 TGIRT 대조군을 능가하였다(도 36). 주목할 만한 MG153-15는 이들 조건 하에서 TGIRT보다 10배 더 높은 cDNA 합성 활성을 나타낸다.

일부 GII 유래 RT는 양성 대조군, MarathonRT, 및 MG153-1 내지 MG153-4 및 MG153-9 중 하나를 포함하는 매우 안정적인 이량체를 형성한다(도 35). "CAQQ" 모티프는 Marathon RT에서 안정한 이량체화를 담당하는 것으로 문서화되었다(Nat Struct Mol Biol. 2016 Jun; 23(6): 558-565). 면역블롯 상에서 안정한 이량체 형성을 나타낸 RT(MG153-1 내지 MG153-4)는 또한 CAQQ 이량체화 아미노산 모티프를 함유한다(도 35c). 이량체화는 복잡성이 추가됨으로 인해 바람직하지 않은 특징일 수 있으므로, 이량체를 형성하지 않는 RT는 특정 생명공학 응용에 최적일 수 있다.

시험된 RT 후보에 대한 예상 분자 크기

RT	예상 단백질 크기(kDa)*
Marathon	67.8
TGIRT	67
MG153-1	74
MG153-2	74
MG153-3	74
MG153-4	67.6
MG153-7	71.7
MG153-8	67.6
MG153-9	72
MG153-10	72.2
MG153-11	70.9
MG153-12	72.5
MG153-13	67.9
MG153-15	68.6
MG153-16	71.7
MG153-21	70.6

*크기에는 Flag-HA-MCP 태그가 포함된다.

예 11 - G2L4 (MG172 계열)

G2L4는 도 4에 식별된, II족 인트론과 관련이 먼 RT-함유 서열(II족 인트론-유사 RT)이다. 600개가 넘는 신규한 전장 G2L4 효소를 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시키고, 계통발생 트리를 이러한 정렬로부터 추론하였다(도 20). MG172 계열 구성원은 RT 및 성숙효소 도메인을 함유하며, 보존된 Y[I/L]DD 활성 부위 모티프를 가질 것으로 예측되었다. 모티프 YIDD는 최근에 하나의 G2L4 기준(BioRxiv 10.1101/2022.03.14.484287)에서 더 짧은 DNA 프라이머로 증가된 효율을 나타내는 것으로 보고되었다. MG172 효소는 평균 길이가 425 aa이고 32% AAI를 공유하는데, 이는 이들 시스템의 신규성을 강조한다.

예 12 - LTR 레트로트랜스포존(MG151 계열)

LTR 레트로트랜스포존 생물정보학 분석

긴 말단 반복(LTR) 레트로트랜스포존은 RNA 주형의 역전사를 통해 표적 부위 내로 통합된다. 레트로바이러스 및 비-바이러스 트랜스포존을 포함하는, LTR 레트로트랜스포존의 MG151 계열을 도 4의 계통발생 트리에서 식별하였다. LTR RT 도메인을 함유하는 전장 단백질을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬시켰다. 계통발생 트리를 이러한 정렬로부터 추론하였다(도 21a). MG151 계열의 100개 초과의 비-바이러스 및 레트로바이러스 RT 효소는 RT 및 RnaseH 도메인을 함유하며, 촉매 잔기의 존재에 기초하여 활성일 것으로 예측된다. LTR RT 다단백질은 또한 HIV 및 MMLV LTR RT에 대해 관찰된 것과 유사한 구조에서 프로테아제 및 인테그라아제 도메인을 암호화한다(도 21a, 21b, 21c, 및 22). RT 및 gag 또는 엔벨로프와 같은 다른 유전자는 긴 불완전한 긴 말단 반복이 측면에 위치한다(도 21b). MG151 계열 구성원은 다양하고 신규하며, 30% 아미노산 동일성을 공유한다(도 22).

LTR 레트로트랜스포존의 다단백질은 프로테아제, RT 및 Rnase H, 및 인테그라아제 기능적 단위로 자연적으로 가공된다. 따라서, MG151 RT-RNAse H 기능적 단위 경계를 서열 및 구조적 정렬의 조합에 의해 결정하였다. MG151 다단백질에 대한 3D 구조를 Alphafold2(Nature 2021; 596: 583-589; 및 Nucleic Acids Res 2022; 50: D439-D444)를 사용하여 예측하고 PyMOL(https://github.com/schrodinger/pymol-open-source)로 시각화하였다. 예를 들어, MG151-82(서열번호 457)의 경우, 예측된 3D 구조는 비구조화 링커 영역에 의해 분리된 이산적 프로테아제, RT, RNAseH, 및 인테그라아제 도메인을 식별하였다(도 21c). 따라서, RT-RNAse H 기능적 단위는 비구조화 루프가 측면에 위치한 2개의 관련 구조적 도메인으로서 결정하였다. RT 및 RNAse H 도메인을 함유하는 트리밍된 변이체를 합성 및 실험실 특성화를 위해 지명하였다.

LTR 레트로트랜스포존 RT의 시험관 내 활성 시험

LTR 레트로트랜스포존 RT(MG151)의 시험관 내 활성을, 50 mM Tris-HCl pH 8, 75 mM KCl, 3 mM MgCl₂, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서, 전술한 바와 같이 5'-FAM 표지된 프라이머에 어닐링된 RNA 주형 및 무세포 발현 시스템으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 cDNA 산물을 변성 폴리아크릴아미드 겔 상에서 분리하고 Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, MG151-80 내지 MG151-84(도 23a)뿐만 아니라 MG151-87 내지 MG151-90(서열번호 524-527), 및 MG151-92 내지 MG151-95(서열번호 529-532)(도 23b)는 시험관 내에서 cDNA를 합성할 수 있다.

대조군 LTR 레트로트랜스포존 RT인 Ty3에 대해 시험관 내 활성이 관찰되는 검정 조건을 결정하기 위해, 다음의 4개의 반응 완충액을 시험하였다: 완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl₂, 1 mM TCEP); 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl₂, 1 mM TCEP, 2% PEG-8000); 완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl₂, 1 mM TCEP, 0.01% (v/v) Triton X-100); 및 완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl₂, 1 mM TCEP, 10% 글리세롤). 완충액 A 및 B에 대해 시험관 내 활성을 관찰하였다(도 23c).

구조 RNA 주형 상에서 프라이밍 파라미터 및 가공성 시험

구조화된 RNA 주형 상에서 이들 LTR RT의 역전사 효소 활성을 결정하기 위해, 길이 6, 8, 10, 13, 16 및 20 nt의 상이한 프라이머를 구조화된 RNA 스캐폴드 상에 어닐링하였다. 이들 어닐링된 RNA/DNA 하이브리드를 전체 활성에 사용된 것과 동등한 cDNA 생성 분석에 사용하였다. 도 24에 도시된 바와 같이, MMLV는 프라이머 결합 부위가 10 내지 20 nt인 구조화된 RNA 상에서 활성이고, 주형을 5' 말단까지 완전히 연장시켜 주형 내의 모든 구조를 개방한다. MG151-89(서열번호 526)는 13-20의 프라이머 길이로 활성이고, sgRNA 스캐폴드 헤어핀에 도달할 때까지 pegRNA의 길이를 대략 18 nt 연장할 수 있다. MG151-92(서열번호 529) 및 MG151-97(서열번호 534)은 검출 수준에서 이 주형 상에서 활성이 아니었다.

예 13 - 레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG160 계열)

레트론 생물정보학 분석

박테리아 레트론은 RT-코딩 유전자(ret) 및 역위 서열, msr 및 msd를 함유하는 인접 비코딩 RNA를 암호화하는 대략 2000 bp 길이의 DNA 요소이다. 레트론은 RT-DNA 합성을 위한 고유한 메커니즘을 사용하며, 여기서 ncRNA 주형은 2개의 역위 반복(a1/a2) 사이에서 절연된 보존된 이차 구조로 접힌다. 레트론 RT는 접힌 ncRNA를 인식하고, 역전사는 역위 반복에 인접한 보존된 구아노신 2'OH로부터 개시되어, 주형 RNA와 초기 cDNA 가닥 사이에 2'-5' 결합을 형성한다. 일부 레트론에서, 이러한 2'-5' 결합은 가공된 RT-DNA의 성숙한 형태로 지속되는 반면, 다른 것에서는 엑소뉴클레아제가 DNA 산물을 절단하여 유리된 5' 말단을 생성한다. 또한, RT는 RNA 주형과 동일한 레트론으로부터 유래된 msr-msd를 표적화하여, 표적 외 역전사를 피할 수 있는 특이성을 제공한다.

4031개가 넘는 RT 도메인 서열이 도 4의 계통발생 트리에서 레트론 RT로서 식별되었다. 촉매 잔기(xxDD)의 존재 및 레트론 RT(NaxxH 및 VTG)에 문서화된 보존된 모티프에 기초하여 추가 분석을 위해 2407개의 전장 레트론 단백질 서열의 하위 집합을 선택하였다(도 25 및 26). 계열 MG154-MG159 및 MG173의 레트론은 길이가 300 내지 650 aa인 구성원을 포함하고, 이들의 5' UTR은 역위 반복이 측면에 위치한 예측된 ncRNA(msr-msd) 트리밍을 함유한다(도 27).

또한, "레트론-유사" 단일-도메인 RT 서열의 다양한 군이 도 4의 레트론 계통군 내에서 식별되었다. MG160 계열의 단일-도메인 RT는 250 내지 300 aa의 범위이고, 예상 RT 촉매 잔기 [F/Y]XDD의 존재에 기초하여 활성일 것으로 예측된다. 공개 데이터베이스에서 레트론 RT 결정 및 동결-EM 구조가 결여되어 있지만, MG160-3(서열번호 629)의 3D 구조 예측은 II족 인트론 RT 도메인과 정렬되는 보존된 RT 도메인을 나타낸다(도 28a 및 28b). MG160 계열의 5' UTR은 계열 구성원 사이에서 보존되고 요소 활성 또는 이동화에 중요할 가능성이 있는 보존된 이차 구조로 접힌다(도 28c).

MG154, MG155, MG156, MG157, MG158, 및 MG159 계열의 레트론-유사 RT의 시험관 내 활성

일반 RNA 주형에 대한 레트론 RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl₂, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 다음의 레트론 RT는 그들 자신의 ncRNA가 아닌 일반 RNA 주형 상에서 프라이머 연장을 수행할 수 있다: MG155-2(서열번호 612), MG155-3(서열번호 613), MG156-2(서열번호 617), MG157-5(서열번호 622), 및 MG159-1(서열번호 624).

MG160 계열의 레트론-유사 RT의 시험관 내 활성

레트론-유사 RT(MG160 계열)의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl₂, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양은 문서화된 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.

겔 분석에 의해, MG160-1 내지 MG160-4(서열번호 627-630) 및 MG160-6(서열번호 633)은 활성이고 대조군 GII 인트론 클래스 C RT인 GsI-IIC와 비교하여 감소된 공정성을 가졌다(도 29). 가공성은 cDNA 산물의 유사한 드롭오프 패턴을 생성하는 레트로바이러스 대조군 RT인 MMLV의 것과 더 유사하게 보인다(도 29a). qPCR에 의해, MG160-1 내지 MG160-4(서열번호 627-630)는 전장 cDNA를 생산할 수 있는 반면, MG160-6(서열번호 633)은 전장 산물보다 적은 산물을 생산하였다(도 29b).

레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG173 계열)의 무세포 발현 및 레트론 ncRNA의 시험관 내 전사

37℃에서 2시간 동안 PURExpress 성분과 함께 N-말단 단일 Strep 태그로 E. coli- 최적화된 유전자를 암호화하는 DNA 주형의 10 ng/μL를 인큐베이션함으로써 무세포 발현 시스템(PURExpress)에서 레트론 RT를 생산하였다. 모든 시험된 레트론 RT(MG156-1(서열번호 616), MG156-2(서열번호 617), MG157-1(서열번호 618), MG157-2(서열번호 619), MG157-5(서열번호 622), MG159-1(서열번호 624))를 SDS-PAGE 분석에 의해 표시된 바와 같이 생산하였다(도 30a 및 30b).

레트론 ncRNA를 HiScribe T7 시험관 내 전사 키트(NEB) 및 T7 프로모터 다음에 각각의 ncRNA 유전자를 암호화하는 DNA 주형을 사용하여 생성하였다. 그런 다음, 반응물을 Dnase-I와 함께 인큐베이션하여 DNA 주형을 제거한 다음, RNA 클린업 키트(Monarch)로 정제한다. ncRNA의 양을 나노드롭에 의해 결정하고, 순도를 Tape Station RNA 분석에 의해 평가하였다(도 30c).

예 14 - 레트론 RT 시험관 내 활성 시험(예시)

레트론 RT 효소는 전술한 바와 같이 N-말단 단일 Strep 태그를 갖는 E. coli 코돈 최적화된 유전자를 함유하는 작제물을 사용하여 무세포 발현 시스템에서 생산된다. 효소의 발현은 SDS-PAGE 분석에 의해 확인된다. 일반 주형 상의 레트론 RT 활성은 5'-FAM 표지된 DNA 프라이머에 어닐링된 200 nt RNA를 함유하는, 전술한 바와 같은 프라이머 연장 분석에 의해 결정된다. 생성된 cDNA 산물은 변성 폴리아크릴아미드 겔 상에서 또는 전장 cDNA 산물에 특이적인 프라이머를 갖는 qPCR에 의해 검출된다.

자체 ncRNA에 대한 레트론 RT 시험관 내 활성을 완충액, dNTP, 무세포 발현 시스템으로부터 생산된 레트론 RT, 및 재접힘된 ncRNA를 함유하는 반응에서 평가한다. N-말단 단일 Strep 태그를 통해 무세포 발현 시스템으로부터 RT를 정제하기 전과 후의 RT 활성을 비교한다. 인큐베이션 후, 반응의 절반을 Rnase A/T1로 처리한다. Rnase A/T1 처리 전후의 생성물을 변성 폴리아크릴아미드 겔 상에서 평가하고 SYBR 금 염색에 의해 시각화한다. 이 절차에서, Rnase A/T1은 RNA 주형을 분해하여 ssDNA를 함유하는 더 작은 생성물로 질량 이동을 초래하는 것으로 이해된다. Rnase H는 5' 및 3' ssDNA 경계의 균질성을 개선할 것으로 예상되기 때문에, 생성물의 분포에 대한 Rnase H의 영향도 또한 겔 분석에 의해 평가된다. ncRNA 주형과 ssDNA 사이의 공유 결합은 탈분지 효소(DBR1)로 처리하기 전 또는 후에 RT 산물을 5'에서 3' ssDNA 엑소뉴클레아제(RecJ)로 인큐베이션함으로써 확인된다. RecJ는 DBR1이 RNA와 ssDNA 사이의 2'-5' 인산디에스테르 결합을 제거한 후에 ssDNA를 분해할 수 있을 것으로 예상된다.

예 15 - NGS에 의한 레트론 msr-msd 경계 결정(예시)

msr-msd 경계를 DBR1에 의해 2'-5' 인산에스테르 결합을 제거한 후 msDNA 산물의 5' 및 3' 말단에 대한 어댑터 서열의 편향되지 않은 결찰에 의해 결정한다. 생성된 결찰된 산물은 PCR 증폭시키고, 라이브러리를 제조하고, 차세대 시퀀싱을 수행한다. 시퀀싱 판독물을 기준 서열에 정렬시켜 msd의 5' 및 3' 경계를 결정한다. RT 반응에서 Rnase H의 존재가 5' 및 3' msd 경계의 균질성에 미치는 영향도 또한 평가한다.

예 16 - RT 활성에 대한 msd 내로의 삽입 서열의 체계적 평가(예시)

구별되는 길이, 예측된 이차 구조, 및 GC-함량의 서열을 NGS 및 ncRNA의 이차 구조 예측에 의해 결정된 msd 경계에 의해 알려진 선택된 삽입 부위에서 msd 내로 삽입한다. 이들 삽입 서열이 RT 활성에 미치는 영향을 전술한 바와 같이 겔 분석 또는 NGS에 의해 평가한다.

예 17 - 신규 RT의 시험관 내 활성 시험(예시)

RT 활성을 무세포 발현 시스템으로부터 유래된 RT 및 전술한 바와 같이 DNA 프라이머에 어닐링된 RNA 주형을 함유하는 프라이머 연장 검정을 사용하여 평가한다. 생성된 cDNA 산물을 전술한 바와 같이 변성 폴리아크릴아미드 겔 및 qPCR에 의해 검출한다. 변성 겔 상의 cDNA 드롭오프 산물의 검출은 신규 후보에 대한 가공성의 상대적 평가를 제공한다.

예 18 - 신규 RT의 프라이밍 파라미터 평가(예시)

최적의 프라이머 길이는 6, 8, 10, 13, 16, 또는 20개 뉴클레오티드 길이의 5'-FAM 표지된 DNA 프라이머에 어닐링된 RNA 주형 상에서 RT의 활성을 시험함으로써 결정한다. RT는 전술한 바와 같이 무세포 발현 시스템으로부터 유래된다. 반응물을 인큐베이션한 후, Rnase H의 첨가를 통해 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석한다. 최적의 프라이머 길이는 RT가 가장 많은 프라이머를 cDNA 산물로 변환할 수 있게 하는 길이로서 결정한다. 그런 다음, 실험적으로 결정된 최적의 프라이머 길이를 시험관 내 RT를 추가로 특성화하기 위해, 충실도 및 가공성 검정과 같은 후속 실험에서 사용한다.

예 19 - RT 충실도 평가(예시)

PCR 및 시퀀싱 동안 도입된 오류를 설명하기 위해, 14-nt 고유 분자 식별자(UMI) 바코드가 역전사 반응을 위한 프라이머에 포함되는 것을 제외하고는 전술한 바와 같은 프라이머 연장 검정에 의해 RT 충실도를 평가한다. 생성된 전장 cDNA 산물을 PCR 증폭시키고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행한다. >5개의 리드를 갖는 바코드를 분석한다. 기준 서열과 정렬한 후, 동일한 바코드를 갖는 모든 서열 판독에 오류가 존재하는 경우, 돌연변이, 삽입 및 결실을 계수한다. 모든 시퀀싱 판독물이 아닌 하나의 시퀀싱 판독물에 존재하는 오류는 PCR 또는 시퀀싱 동안 도입되는 것으로 간주한다. RNA 주형 내의 돌연변이 핫스팟의 식별에 더하여, 치환, 삽입 및 결실 프로파일의 추가 분석을 수행한다. 충실도 측정은 또한 주형에서 변형된 염기, 예를 들어 슈도우리딘으로 수행한다.

예 20 - RT의 가공성 계수 결정(예시)

RT 가공성을 전술한 바와 같은 무세포 발현 시스템으로부터 유래된 RT 효소 및 5'-FAM 표지된 프라이머(겔 분석용) 또는 비표지된 프라이머(시퀀싱 분석용)에 어닐링된 길이가 1.6 kb 내지 6.6 kb인 RNA 주형을 함유하는 프라이머 연장 분석을 사용하여 평가한다.

cDNA 합성 동안 RNA 주형에서 떨어진 RT 효소의 재결합을 선호하지 않게 하기 위해 역전사 반응을 단일 사이클 조건 하에서 수행한다. 단일 사이클 조건을 달성하기 위한 최적의 트랩 분자 및 농도를 실험적으로 결정한다. 반응 개시 전에 인큐베이션되는 경우 cDNA 합성의 충분한 억제를 제공하지만, 그렇지 않으면 반응의 속도에 영향을 미치지 않도록 선택된 조건을 설계한다. 시험할 최적의 트랩 분자는 다양한 길이의 DNA 프라이머에 어닐링된 비관련 RNA 주형 및 비관련 RNA 주형을 포함한다.

단일 사이클 반응 조건을 최적화하면, 반응 완충액 중 DNA 프라이머에 어닐링된 RNA 주형으로 RT를 사전 평형화한 후 dNTP 및 선택된 트랩 분자를 첨가하여 반응을 개시함으로써 가공성을 평가한다. 반응물을 인큐베이션한 후, RnaseH를 첨가하여 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석하거나, 긴 판독 시퀀싱을 위해 준비한 PCR 및 라이브러리에 적용한다. 이들 실험으로부터, 전장 cDNA 산물의 50%를 생성하는 주형 길이로서 가공성 계수를 정량화한다. 단일 사이클 프라이머 연장 반응으로부터의 cDNA 산물의 길이 중앙값은 RT가 시험된 주형 상에서 해리될 확률을 추정하는 데 사용된다. 이로부터, 각각의 해리가 독립적인 이벤트이고 해리 확률이 모든 뉴클레오티드 위치에서 동일하다고 가정하면, RT가 각각의 뉴클레오티드 위치에서 해리될 확률이 계산된다. 그런 다음, 해리된 RT의 50%에서 주형의 길이를 나타내는 가공성 계수를 1/(2*P _d )로서 결정하며, 여기서 P _d 는 각 뉴클레오티드에서 해리 확률이다.

예 21 - 프라이머 연장부 상의 도전적인 구조의 체계적 분석(예시)

RT 활성에 대한 도전적인 주형의 영향을 평가하기 위해, 프라이머 연장 반응을 변형과 함께 전술한 바와 같이 수행한다. RNA 주형은 프라이머 결합 부위의 하류에 고정된 거리(100 내지 300 nt)에서 다음의 도전적인 모티프 중 하나를 함유한다: 동종중합체 신축, 열역학적으로 안정한 GC-풍부 줄기 루프, 슈도노트(pseudoknot), tRNA, GII 인트론, 및 염기 또는 골격 변형(예를 들어 슈도우리딘, 포스포티오레이트 결합)을 함유하는 RNA 주형. 반응을 급랭시킨 후, 폴리아크릴아미드 겔을 변성시켜 cDNA 산물의 크기 분포를 분석한다. 또한 어댑터 서열을 T4 리가아제를 사용하여 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킨다. 그런 다음, 결찰된 산물을 PCR 증폭하고, 라이브러리를 차세대 시퀀싱을 위해 준비하여 RT 잘못혼입/삽입/결실 부위 및 단일 뉴클레오티드 분해(resolution)를 갖는 RT 드롭오프 부위 모두를 식별한다. 주어진 위치에서의 RT 드롭오프의 정도는 드롭오프 산물에 상응하는 시퀀싱 판독물의 수를 전장 산물에 상응하는 시퀀싱 판독물의 수와 비교함으로써 정량화한다.

예 22 - 비-주형 염기 첨가 평가(예시)

cDNA 산물의 5' 말단에 염기의 비-주형 첨가를 차세대 시퀀싱에 의해 평가한다. 무세포 발현 시스템 및 RNA 주형으로부터 유래된 RT를 함유하는 프라이머 연장 반응을 전술한 바와 같이 수행한다. 5' 말단에서 상이한 RNA 주형 길이 및 서열 모티프의 체계적 분석을 시험한다. 어댑터 서열을 T4 리가아제에 의해 생성된 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킴으로써, 이들의 3' 말단의 잠재적인 이종 성질에도 불구하고 모든 cDNA 산물이 포획된다. 그런 다음, 결찰된 산물을 PCR로 증폭시키고 차세대 시퀀싱을 위해 라이브러리를 준비한다. 전장보다 긴 실험적으로 생산된 cDNA 서열과 예상 전장 cDNA 기준 서열의 비교를 통해 RNA에 의해 주형화되지 않은 5'-말단에 대한 염기 첨가의 유형 및 수 둘 다를 식별할 수 있다.

예 23 - R2, 비-LTR 및 유사한 시스템에 대한 활성 및 가공성에 대한 5' 및 3' UTR 파라미터 결정(예시)

관심 단백질을 E. coli에서 IPTG-유도 과발현 후 Twin-strep 태그를 통해 정제한다. 정제된 단백질을, 이들의 고유 컨텍스트로부터 식별된 3' UTR 및 시작 코돈을 지나 5' UTR + 400 bp가 측면에 위치한 1 kb 및 4 kb 카고에 대해 시험한다. 활성에 대한 5' 및 3' 측부 서열의 효과를 qPCR을 통해 주형의 말단 근처의 절편에 대해 분석하여 이들 고유 특징을 갖는 카고가 우수한 결과를 생성하는지 여부를 결정한다.

예 24 - RT cDNA 합성 활성은 다수의 적용에 대해 이용될 수 있다(예시).

RNA에 의존하는 공정은 발현, 처리, 변형 및 반감기와 같은 생물학에 중요하다. RNA에 대해 수행된 생명공학에서의 품질 관리 절차는 RNA의 cDNA로의 변환을 이용한다. 따라서, 수년에 걸쳐 cDNA 라이브러리의 생산을 위해 다수의 RT가 사용되어 왔다. 이러한 목적을 위해 사용되는 상업적으로 이용 가능한 RT는 MMLV RT, AMV RT, 및 GsI-IIC RT(TGIRT)를 포함한다. 처음 2개는 레트로바이러스 RT를 나타내는 반면, 후자는 GII 인트론 유래 RT이다. GII 인트론 유래 RT뿐만 아니라 비-LTR 유래 RT는 이들의 레트로바이러스 대응물과 비교하여 여러 이점을 나타낸다. 예를 들어, 이들은 보다 가공성이어서, 구조적 및 변형된 RNA를 통해 판독한다. 구조적 또는 변형된 RNA는 RNA 단편으로서 오해석될 수 있는 조기 종결 산물을 생성하기 때문에 레트로바이러스 RT에 대한 최적의 기질이 아닐 수 있다. 또한, 일부 RT의 스위치를 주형화하는 능력은 초기 어댑터 추가를 위해 활용될 수 있어서, 어댑터 결찰 절차를 라이브러리 준비 동안 덜 중요하게 한다. 따라서, 고도로 가공성인 RT는 복합체 RNA를 갖는 라이브러리의 생성에 적합하다. 또한, 일부 고도로 가공성인 RT는 일반적으로 현재 사용되는 레트로바이러스 RT보다 작으므로, 이들의 생산 및 연관된 하류 공정을 더 용이하게 한다. 본원에 기술된 여러 신규 RT는 상업적으로 이용 가능한 TGIRT 효소를 능가하며, 일부는 cDNA 합성 활성의 10배를 초과한다. 이와 같이, 이들 신규한 RT 중 다수는 cDNA 합성 키트를 상업적으로 적용하기 위한 큰 가능성을 나타낸다.

본 발명의 바람직한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 예에 의해 한정되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 실시예의 설명 및 예시는 한정적인 의미로 해석되는 것을 의미하지는 않는다. 이제 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 따라 달라지는 본원에 제시된 특정 도시, 구성, 또는 상대 비율로 한정되지 않음을 이해할 것이다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변이, 또는 균등물도 포괄하는 것으로 고려된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위의 범위에 속하는 방법 및 구조와 이들의 등가물이 이에 의해 포괄되는 것으로 의도된다.

본원에서 참조되는 단백질 및 핵산 서열

카탈로그	서열번호	설명	유형
MG140 전위 단백질	1	MG140-1-R2 전위 단백질	단백질
MG140 전위 단백질	2	MG140-2-R2 전위 단백질	단백질
MG140 전위 단백질	3	MG140-3-R2 전위 단백질	단백질
MG140 전위 단백질	4	MG140-4-R2 전위 단백질	단백질
MG140 전위 단백질	5	MG140-5-R2 전위 단백질	단백질
MG140 전위 단백질	6	MG140-6-R2 전위 단백질	단백질
MG140 전위 단백질	7	MG140-7-R2 전위 단백질	단백질
MG140 전위 단백질	8	MG140-8-R2 전위 단백질	단백질
MG140 전위 단백질	9	MG140-147 전위 단백질	단백질
MG140 전위 단백질	10	MG140-9-R2 전위 단백질	단백질
MG140 전위 단백질	11	MG140-10-R2 전위 단백질	단백질
MG140 전위 단백질	12	MG140-11-R2 전위 단백질	단백질
MG140 전위 단백질	13	MG140-12-R2 전위 단백질	단백질
MG140 전위 단백질	14	MG140-13-R2 전위 단백질	단백질
MG140 전위 단백질	15	MG140-14-R2 전위 단백질	단백질
MG140 전위 단백질	16	MG140-15-R2 전위 단백질	단백질
MG140 전위 단백질	17	MG140-16-R2 전위 단백질	단백질
MG140 전위 단백질	18	MG140-17-R2 전위 단백질	단백질
MG140 전위 단백질	19	MG140-18-R2 전위 단백질	단백질
MG140 전위 단백질	20	MG140-19-R2 전위 단백질	단백질
MG140 전위 단백질	21	MG140-20-R2 전위 단백질	단백질
MG140 전위 단백질	22	MG140-21-R2 전위 단백질	단백질
MG140 전위 단백질	23	MG140-22-R2 전위 단백질	단백질
MG140 전위 단백질	24	MG140-23-R2 전위 단백질	단백질
MG140 전위 단백질	25	MG140-24-R2 전위 단백질	단백질
MG140 전위 단백질	26	MG140-25-R2 전위 단백질	단백질
MG140 전위 단백질	27	MG140-26-R2 전위 단백질	단백질
MG140 전위 단백질	28	MG140-27-R2 전위 단백질	단백질
MG140 전위 단백질	29	MG140-28-R2 전위 단백질	단백질
MG153 RT MCP 융합	30	FH-MCP-MG153-1	뉴클레오티드
MG153 RT MCP 융합	31	FH-MCP-MG153-2	뉴클레오티드
MG153 RT MCP 융합	32	FH-MCP-MG153-3	뉴클레오티드
나노루시퍼라제 주형s	33	나노루시퍼라제 주형	뉴클레오티드
상보성 DNA 프라이머	34	상보성 DNA 프라이머	뉴클레오티드
PCR 프라이머	35	100/542 bp 앰플리콘용 순방향 프라이머	뉴클레오티드
PCR 프라이머	36	100 bp 앰플리콘용 역방향 프라이머	뉴클레오티드
PCR 프라이머	37	542 bp 앰플리콘용 역방향 프라이머	뉴클레오티드
cDNA로부터 유래된 PCR 앰플리콘	38	100 bp 앰플리콘	뉴클레오티드
cDNA로부터 유래된 PCR 앰플리콘	39	542 bp 앰플리콘	뉴클레오티드
MG153 RT MCP 융합	40	FH-MCP-MG153-4	뉴클레오티드
MG153 RT MCP 융합	41	FH-MCP-MG153-7	뉴클레오티드
MG153 RT MCP 융합	42	FH-MCP-MG153-8	뉴클레오티드
MG153 RT MCP 융합	43	FH-MCP-MG153-9	뉴클레오티드
MG153 RT MCP 융합	44	FH-MCP-MG153-10	뉴클레오티드
MG153 RT MCP 융합	45	FH-MCP-MG153-11	뉴클레오티드
MG153 RT MCP 융합	46	FH-MCP-MG153-12	뉴클레오티드
MG153 RT MCP 융합	47	FH-MCP-MG153-13	뉴클레오티드
MG153 RT MCP 융합	48	FH-MCP-MG153-15	뉴클레오티드
MG153 RT MCP 융합	49	FH-MCP-MG153-16	뉴클레오티드
MG153 RT MCP 융합	50	FH-MCP-MG153-21	뉴클레오티드
pET21(+)로부터 증폭시키기 위한 프라이머	51	LA_061_pmgx_txtl_rv	뉴클레오티드
pET21(+)로부터 증폭시키기 위한 프라이머	52	LA_062_pmgx_txtl_fw	뉴클레오티드
RT RNA 주형	53	emx1에 대한 구조화된 RT 주형 RNA	뉴클레오티드
RT RNA 주형	54	emx1에 대한 구조화된 RT 주형 RNA(5' 절단됨)	뉴클레오티드
RT RNA 주형	55	소형 RT 주형	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	56	LA321_282_FAM	뉴클레오티드
NGS 프라이머	57	LA065_NGS_풍부_fw	뉴클레오티드
NGS 프라이머	58	LA395_282_NGS	뉴클레오티드
NGS 프라이머	59	LA396_RT_짧은_NGS	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	60	LA423_emx1_6pbs	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	61	LA424_emx1_8pbs	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	62	LA425_emx1_10pbs	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	63	LA426_emx1_13pbs	뉴클레오티드
cDNA 검정을 위한 FAM-표지된 올리고	64	LA427_emx1_20pbs	뉴클레오티드
NGS 충실도에 대한 UMI 프라이머	65	LA430_umi_cdna	뉴클레오티드
MG153 Strep 태그된 유전자	66	Nstrep-MG153-1	뉴클레오티드
MG153 Strep 태그된 유전자	67	Nstrep-MG153-2	뉴클레오티드
MG153 Strep 태그된 유전자	68	Nstrep-MG153-3	뉴클레오티드
MG153 Strep 태그된 유전자	69	Nstrep-MG153-4	뉴클레오티드
MG153 Strep 태그된 유전자	70	Nstrep-MG153-5	뉴클레오티드
MG153 Strep 태그된 유전자	71	Nstrep-MG153-6	뉴클레오티드
MG153 Strep 태그된 유전자	72	Nstrep-MG153-7	뉴클레오티드
MG153 Strep 태그된 유전자	73	Nstrep-MG153-8	뉴클레오티드
MG153 Strep 태그된 유전자	74	Nstrep-MG153-9	뉴클레오티드
MG153 Strep 태그된 유전자	75	Nstrep-MG153-10	뉴클레오티드
MG153 Strep 태그된 유전자	76	Nstrep-MG153-11	뉴클레오티드
MG153 Strep 태그된 유전자	77	Nstrep-MG153-12	뉴클레오티드
MG153 Strep 태그된 유전자	78	Nstrep-MG153-13	뉴클레오티드
MG153 Strep 태그된 유전자	79	Nstrep-MG153-14	뉴클레오티드
MG153 Strep 태그된 유전자	80	Nstrep-MG153-15	뉴클레오티드
MG153 Strep 태그된 유전자	81	Nstrep-MG153-16	뉴클레오티드
MG153 Strep 태그된 유전자	82	Nstrep-MG153-17	뉴클레오티드
MG153 Strep 태그된 유전자	83	Nstrep-MG153-18	뉴클레오티드
MG153 Strep 태그된 유전자	84	Nstrep-MG153-19	뉴클레오티드
MG153 Strep 태그된 유전자	85	Nstrep-MG153-20	뉴클레오티드
MG153 Strep 태그된 유전자	86	Nstrep-MG153-21	뉴클레오티드
MG153 Strep 태그된 유전자	87	Nstrep-MG153-25	뉴클레오티드
MG153 Strep 태그된 유전자	88	Nstrep-MG153-26	뉴클레오티드
MG153 Strep 태그된 유전자	89	Nstrep-MG153-27	뉴클레오티드
MG153 Strep 태그된 유전자	90	Nstrep-MG153-28	뉴클레오티드
MG153 Strep 태그된 유전자	91	Nstrep-MG153-29	뉴클레오티드
MG153 Strep 태그된 유전자	92	Nstrep-MG153-30	뉴클레오티드
MG153 Strep 태그된 유전자	93	Nstrep-MG153-31	뉴클레오티드
MG153 Strep 태그된 유전자	94	Nstrep-MG153-32	뉴클레오티드
MG153 Strep 태그된 유전자	95	Nstrep-MG153-33	뉴클레오티드
MG153 Strep 태그된 유전자	96	Nstrep-MG153-34	뉴클레오티드
MG153 Strep 태그된 유전자	97	Nstrep-MG153-35	뉴클레오티드
MG153 Strep 태그된 유전자	98	Nstrep-MG153-36	뉴클레오티드
MG153 Strep 태그된 유전자	99	Nstrep-MG153-37	뉴클레오티드
MG153 Strep 태그된 유전자	100	Nstrep-MG153-38	뉴클레오티드
MG153 Strep 태그된 유전자	101	Nstrep-MG153-39	뉴클레오티드
MG153 Strep 태그된 유전자	102	Nstrep-MG153-40	뉴클레오티드
MG153 Strep 태그된 유전자	103	Nstrep-MG153-41	뉴클레오티드
MG153 Strep 태그된 유전자	104	Nstrep-MG153-42	뉴클레오티드
MG153 Strep 태그된 유전자	105	Nstrep-MG153-43	뉴클레오티드
MG153 Strep 태그된 유전자	106	Nstrep-MG153-44	뉴클레오티드
MG153 Strep 태그된 유전자	107	Nstrep-MG153-45	뉴클레오티드
MG153 Strep 태그된 유전자	108	Nstrep-MG153-46	뉴클레오티드
MG153 Strep 태그된 유전자	109	Nstrep-MG153-47	뉴클레오티드
MG153 Strep 태그된 유전자	110	Nstrep-MG153-48	뉴클레오티드
MG153 Strep 태그된 유전자	111	Nstrep-MG153-49	뉴클레오티드
MG153 Strep 태그된 유전자	112	Nstrep-MG153-50	뉴클레오티드
MG153 Strep 태그된 유전자	113	Nstrep-MG153-51	뉴클레오티드
MG153 Strep 태그된 유전자	114	Nstrep-MG153-52	뉴클레오티드
MG153 Strep 태그된 유전자	115	Nstrep-MG153-53	뉴클레오티드
MG153 Strep 태그된 유전자	116	Nstrep-MG153-54	뉴클레오티드
MG153 Strep 태그된 유전자	117	Nstrep-MG153-55	뉴클레오티드
MG153 Strep 태그된 유전자	118	Nstrep-MG153-56	뉴클레오티드
MG153 Strep 태그된 유전자	119	Nstrep-MG153-57	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	120	MG153-1	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	121	MG153-2	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	122	MG153-3	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	123	MG153-4	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	124	MG153-5	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	125	MG153-6	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	126	MG153-7	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	127	MG153-8	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	128	MG153-9	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	129	MG153-10	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	130	MG153-11	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	131	MG153-12	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	132	MG153-13	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	133	MG153-14	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	134	MG153-15	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	135	MG153-16	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	136	MG153-17	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	137	MG153-18	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	138	MG153-19	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	139	MG153-20	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	140	MG153-21	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	141	MG153-25	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	142	MG153-26	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	143	MG153-27	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	144	MG153-28	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	145	MG153-29	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	146	MG153-30	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	147	MG153-31	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	148	MG153-32	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	149	MG153-33	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	150	MG153-34	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	151	MG153-35	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	152	MG153-36	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	153	MG153-37	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	154	MG153-38	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	155	MG153-39	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	156	MG153-40	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	157	MG153-41	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	158	MG153-42	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	159	MG153-43	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	160	MG153-44	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	161	MG153-45	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	162	MG153-46	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	163	MG153-47	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	164	MG153-48	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	165	MG153-49	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	166	MG153-50	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	167	MG153-51	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	168	MG153-52	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	169	MG153-53	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	170	MG153-54	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	171	MG153-55	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	172	MG153-56	뉴클레오티드
MG153 대장균 코돈 최적화된 유전자	173	MG153-57	뉴클레오티드
MG160 Strep 태그된 유전자	174	Nstrep-MG160-1	뉴클레오티드
MG160 Strep 태그된 유전자	175	Nstrep-MG160-2	뉴클레오티드
MG160 Strep 태그된 유전자	176	Nstrep-MG160-3	뉴클레오티드
MG160 Strep 태그된 유전자	177	Nstrep-MG160-4	뉴클레오티드
MG160 Strep 태그된 유전자	178	Nstrep-MG160-5	뉴클레오티드
MG160 Strep 태그된 유전자	179	Nstrep-MG160-6	뉴클레오티드
MG160 Strep 태그된 유전자	180	Nstrep-MG160-8	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	181	MG160-1	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	182	MG160-2	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	183	MG160-3	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	184	MG160-4	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	185	MG160-5	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	186	MG160-6	뉴클레오티드
MG160 대장균 코돈 최적화된 유전자	187	MG160-8	뉴클레오티드
MG163 Strep 태그된 유전자	188	Nstrep-MG163-1	뉴클레오티드
MG163 Strep 태그된 유전자	189	Nstrep-MG163-2	뉴클레오티드
MG163 Strep 태그된 유전자	190	Nstrep-MG163-3	뉴클레오티드
MG163 Strep 태그된 유전자	191	Nstrep-MG163-4	뉴클레오티드
MG163 Strep 태그된 유전자	192	Nstrep-MG163-5	뉴클레오티드
MG163 대장균 코돈 최적화된 유전자	193	MG163-1	뉴클레오티드
MG163 대장균 코돈 최적화된 유전자	194	MG163-2	뉴클레오티드
MG163 대장균 코돈 최적화된 유전자	195	MG163-3	뉴클레오티드
MG163 대장균 코돈 최적화된 유전자	196	MG163-4	뉴클레오티드
MG163 대장균 코돈 최적화된 유전자	197	MG163-5	뉴클레오티드
MG164 Strep 태그된 유전자	198	Nstrep-MG164-1	뉴클레오티드
MG164 Strep 태그된 유전자	199	Nstrep-MG164-2	뉴클레오티드
MG164 Strep 태그된 유전자	200	Nstrep-MG164-3	뉴클레오티드
MG164 Strep 태그된 유전자	201	Nstrep-MG164-4	뉴클레오티드
MG164 Strep 태그된 유전자	202	Nstrep-MG164-5	뉴클레오티드
MG164 대장균 코돈 최적화된 유전자	203	MG164-1	뉴클레오티드
MG164 대장균 코돈 최적화된 유전자	204	MG164-2	뉴클레오티드
MG164 대장균 코돈 최적화된 유전자	205	MG164-3	뉴클레오티드
MG164 대장균 코돈 최적화된 유전자	206	MG164-4	뉴클레오티드
MG164 대장균 코돈 최적화된 유전자	207	MG164-5	뉴클레오티드
MG165 Strep 태그된 유전자	208	Nstrep-MG165-1	뉴클레오티드
MG165 Strep 태그된 유전자	209	Nstrep-MG165-2	뉴클레오티드
MG165 Strep 태그된 유전자	210	Nstrep-MG165-3	뉴클레오티드
MG165 Strep 태그된 유전자	211	Nstrep-MG165-4	뉴클레오티드
MG165 Strep 태그된 유전자	212	Nstrep-MG165-5	뉴클레오티드
MG165 Strep 태그된 유전자	213	Nstrep-MG165-6	뉴클레오티드
MG165 Strep 태그된 유전자	214	Nstrep-MG165-7	뉴클레오티드
MG165 Strep 태그된 유전자	215	Nstrep-MG165-8	뉴클레오티드
MG165 Strep 태그된 유전자	216	Nstrep-MG165-9	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	217	MG165-1	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	218	MG165-2	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	219	MG165-3	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	220	MG165-4	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	221	MG165-5	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	222	MG165-6	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	223	MG165-7	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	224	MG165-8	뉴클레오티드
MG165 대장균 코돈 최적화된 유전자	225	MG165-9	뉴클레오티드
MG166 Strep 태그된 유전자	226	Nstrep-MG166-1	뉴클레오티드
MG166 Strep 태그된 유전자	227	Nstrep-MG166-2	뉴클레오티드
MG166 Strep 태그된 유전자	228	Nstrep-MG166-3	뉴클레오티드
MG166 Strep 태그된 유전자	229	Nstrep-MG166-4	뉴클레오티드
MG166 Strep 태그된 유전자	230	Nstrep-MG166-5	뉴클레오티드
MG166 대장균 코돈 최적화된 유전자	231	MG166-1	뉴클레오티드
MG166 대장균 코돈 최적화된 유전자	232	MG166-2	뉴클레오티드
MG166 대장균 코돈 최적화된 유전자	233	MG166-3	뉴클레오티드
MG166 대장균 코돈 최적화된 유전자	234	MG166-4	뉴클레오티드
MG166 대장균 코돈 최적화된 유전자	235	MG166-5	뉴클레오티드
MG167 Strep 태그된 유전자	236	Nstrep-MG167-1	뉴클레오티드
MG167 Strep 태그된 유전자	237	Nstrep-MG167-2	뉴클레오티드
MG167 Strep 태그된 유전자	238	Nstrep-MG167-3	뉴클레오티드
MG167 Strep 태그된 유전자	239	Nstrep-MG167-4	뉴클레오티드
MG167 Strep 태그된 유전자	240	Nstrep-MG167-5	뉴클레오티드
MG167 대장균 코돈 최적화된 유전자	241	MG167-1	뉴클레오티드
MG167 대장균 코돈 최적화된 유전자	242	MG167-2	뉴클레오티드
MG167 대장균 코돈 최적화된 유전자	243	MG167-3	뉴클레오티드
MG167 대장균 코돈 최적화된 유전자	244	MG167-4	뉴클레오티드
MG167 대장균 코돈 최적화된 유전자	245	MG167-5	뉴클레오티드
MG168 Strep 태그된 유전자	246	Nstrep-MG168-1	뉴클레오티드
MG168 Strep 태그된 유전자	247	Nstrep-MG168-2	뉴클레오티드
MG168 Strep 태그된 유전자	248	Nstrep-MG168-3	뉴클레오티드
MG168 Strep 태그된 유전자	249	Nstrep-MG168-4	뉴클레오티드
MG168 Strep 태그된 유전자	250	Nstrep-MG168-5	뉴클레오티드
MG168 대장균 코돈 최적화된 유전자	251	MG168-1	뉴클레오티드
MG168 대장균 코돈 최적화된 유전자	252	MG168-2	뉴클레오티드
MG168 대장균 코돈 최적화된 유전자	253	MG168-3	뉴클레오티드
MG168 대장균 코돈 최적화된 유전자	254	MG168-4	뉴클레오티드
MG168 대장균 코돈 최적화된 유전자	255	MG168-5	뉴클레오티드
MG169 Strep 태그된 유전자	256	Nstrep-MG169-1	뉴클레오티드
MG169 Strep 태그된 유전자	257	Nstrep-MG169-2	뉴클레오티드
MG169 Strep 태그된 유전자	258	Nstrep-MG169-3	뉴클레오티드
MG169 Strep 태그된 유전자	259	Nstrep-MG169-4	뉴클레오티드
MG169 Strep 태그된 유전자	260	Nstrep-MG169-5	뉴클레오티드
MG169 Strep 태그된 유전자	261	Nstrep-MG169-6	뉴클레오티드
MG169 Strep 태그된 유전자	262	Nstrep-MG169-7	뉴클레오티드
MG169 Strep 태그된 유전자	263	Nstrep-MG169-8	뉴클레오티드
MG169 Strep 태그된 유전자	264	Nstrep-MG169-9	뉴클레오티드
MG169 Strep 태그된 유전자	265	Nstrep-MG169-10	뉴클레오티드
MG169 Strep 태그된 유전자	266	Nstrep-MG169-11	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	267	MG169-1	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	268	MG169-2	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	269	MG169-3	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	270	MG169-4	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	271	MG169-5	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	272	MG169-6	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	273	MG169-7	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	274	MG169-8	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	275	MG169-9	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	276	MG169-10	뉴클레오티드
MG169 대장균 코돈 최적화된 유전자	277	MG169-11	뉴클레오티드
MG170 Strep 태그된 유전자	278	Nstrep-MG170-1	뉴클레오티드
MG170 Strep 태그된 유전자	279	Nstrep-MG170-2	뉴클레오티드
MG170 Strep 태그된 유전자	280	Nstrep-MG170-3	뉴클레오티드
MG170 Strep 태그된 유전자	281	Nstrep-MG170-4	뉴클레오티드
MG170 Strep 태그된 유전자	282	Nstrep-MG170-5	뉴클레오티드
MG170 Strep 태그된 유전자	283	Nstrep-MG170-6	뉴클레오티드
MG170 Strep 태그된 유전자	284	Nstrep-MG170-7	뉴클레오티드
MG170 Strep 태그된 유전자	285	Nstrep-MG170-8	뉴클레오티드
MG170 Strep 태그된 유전자	286	Nstrep-MG170-9	뉴클레오티드
MG170 Strep 태그된 유전자	287	Nstrep-MG170-10	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	288	MG170-1	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	289	MG170-2	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	290	MG170-3	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	291	MG170-4	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	292	MG170-5	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	293	MG170-6	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	294	MG170-7	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	295	MG170-8	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	296	MG170-9	뉴클레오티드
MG170 대장균 코돈 최적화된 유전자	297	MG170-10	뉴클레오티드
MG172 Strep 태그된 유전자	298	Nstrep-MG172-1	뉴클레오티드
MG172 Strep 태그된 유전자	299	Nstrep-MG172-2	뉴클레오티드
MG172 Strep 태그된 유전자	300	Nstrep-MG172-3	뉴클레오티드
MG172 Strep 태그된 유전자	301	Nstrep-MG172-4	뉴클레오티드
MG172 Strep 태그된 유전자	302	Nstrep-MG172-5	뉴클레오티드
MG172 대장균 코돈 최적화된 유전자	303	MG172-1	뉴클레오티드
MG172 대장균 코돈 최적화된 유전자	304	MG172-2	뉴클레오티드
MG172 대장균 코돈 최적화된 유전자	305	MG172-3	뉴클레오티드
MG172 대장균 코돈 최적화된 유전자	306	MG172-4	뉴클레오티드
MG172 대장균 코돈 최적화된 유전자	307	MG172-5	뉴클레오티드
MG154 Strep 태그된 유전자	308	Nstrep-MG154-1	뉴클레오티드
MG154 Strep 태그된 유전자	309	Nstrep-MG154-2	뉴클레오티드
MG155 Strep 태그된 유전자	310	Nstrep-MG155-1	뉴클레오티드
MG155 Strep 태그된 유전자	311	Nstrep-MG155-2	뉴클레오티드
MG155 Strep 태그된 유전자	312	Nstrep-MG155-3	뉴클레오티드
MG156 Strep 태그된 유전자	313	Nstrep-MG156-1	뉴클레오티드
MG156 Strep 태그된 유전자	314	Nstrep-MG156-2	뉴클레오티드
MG157 Strep 태그된 유전자	315	Nstrep-MG157-1	뉴클레오티드
MG157 Strep 태그된 유전자	316	Nstrep-MG157-2	뉴클레오티드
MG157 Strep 태그된 유전자	317	Nstrep-MG157-3	뉴클레오티드
MG157 Strep 태그된 유전자	318	Nstrep-MG157-4	뉴클레오티드
MG157 Strep 태그된 유전자	319	Nstrep-MG157-5	뉴클레오티드
MG158 Strep 태그된 유전자	320	Nstrep-MG158-1	뉴클레오티드
MG159 Strep 태그된 유전자	321	Nstrep-MG159-1	뉴클레오티드
MG159 Strep 태그된 유전자	322	Nstrep-MG159-2	뉴클레오티드
MG159 Strep 태그된 유전자	323	Nstrep-MG159-3	뉴클레오티드
MG154 대장균 코돈 최적화된 유전자	324	MG154-1	뉴클레오티드
MG154 대장균 코돈 최적화된 유전자	325	MG154-2	뉴클레오티드
MG155 대장균 코돈 최적화된 유전자	326	MG155-1	뉴클레오티드
MG155 대장균 코돈 최적화된 유전자	327	MG155-2	뉴클레오티드
MG155 대장균 코돈 최적화된 유전자	328	MG155-3	뉴클레오티드
MG156 대장균 코돈 최적화된 유전자	329	MG156-1	뉴클레오티드
MG156 대장균 코돈 최적화된 유전자	330	MG156-2	뉴클레오티드
MG157 대장균 코돈 최적화된 유전자	331	MG157-1	뉴클레오티드
MG157 대장균 코돈 최적화된 유전자	332	MG157-2	뉴클레오티드
MG157 대장균 코돈 최적화된 유전자	333	MG157-3	뉴클레오티드
MG157 대장균 코돈 최적화된 유전자	334	MG157-4	뉴클레오티드
MG157 대장균 코돈 최적화된 유전자	335	MG157-5	뉴클레오티드
MG158 대장균 코돈 최적화된 유전자	336	MG158-1	뉴클레오티드
MG159 대장균 코돈 최적화된 유전자	337	MG159-1	뉴클레오티드
MG159 대장균 코돈 최적화된 유전자	338	MG159-2	뉴클레오티드
MG159 대장균 코돈 최적화된 유전자	339	MG159-3	뉴클레오티드
MG154 ncRNA	340	MG154-1_ncRNA	뉴클레오티드
MG154 ncRNA	341	MG154-2_ncRNA	뉴클레오티드
MG155 ncRNA	342	MG155-1_ncRNA	뉴클레오티드
MG155 ncRNA	343	MG155-2_ncRNA	뉴클레오티드
MG155 ncRNA	344	MG155-3_ncRNA	뉴클레오티드
MG156 ncRNA	345	MG156-1_ncRNA	뉴클레오티드
MG156 ncRNA	346	MG156-2_ncRNA	뉴클레오티드
MG157 ncRNA	347	MG157-1_ncRNA	뉴클레오티드
MG157 ncRNA	348	MG157-2_ncRNA	뉴클레오티드
MG157 ncRNA	349	MG157-3_ncRNA	뉴클레오티드
MG157 ncRNA	350	MG157-4_ncRNA	뉴클레오티드
MG157 ncRNA	351	MG157-5_ncRNA	뉴클레오티드
MG158 ncRNA	352	MG158-1_ncRNA	뉴클레오티드
MG159 ncRNA	353	MG159-1_ncRNA	뉴클레오티드
MG159 ncRNA	354	MG159-2_ncRNA	뉴클레오티드
MG159 ncRNA	355	MG159-3_ncRNA	뉴클레오티드
MG151 TwinStrep 태그된 유전자	356	TwinStrep-MG151-80	뉴클레오티드
MG151 TwinStrep 태그된 유전자	357	TwinStrep-MG151-81	뉴클레오티드
MG151 TwinStrep 태그된 유전자	358	TwinStrep-MG151-82	뉴클레오티드
MG151 TwinStrep 태그된 유전자	359	TwinStrep-MG151-83	뉴클레오티드
MG151 TwinStrep 태그된 유전자	360	TwinStrep-MG151-84	뉴클레오티드
MG151 TwinStrep 태그된 유전자	361	TwinStrep-MG151-85	뉴클레오티드
MG151 TwinStrep 태그된 유전자	362	TwinStrep-MG151-86	뉴클레오티드
MG151 Strep 태그된 유전자	363	Strep-MG151-87	뉴클레오티드
MG151 Strep 태그된 유전자	364	Strep-MG151-88	뉴클레오티드
MG151 Strep 태그된 유전자	365	Strep-MG151-89	뉴클레오티드
MG151 Strep 태그된 유전자	366	Strep-MG151-90	뉴클레오티드
MG151 Strep 태그된 유전자	367	Strep-MG151-91	뉴클레오티드
MG151 Strep 태그된 유전자	368	Strep-MG151-92	뉴클레오티드
MG151 Strep 태그된 유전자	369	Strep-MG151-93	뉴클레오티드
MG151 Strep 태그된 유전자	370	Strep-MG151-94	뉴클레오티드
MG151 Strep 태그된 유전자	371	Strep-MG151-95	뉴클레오티드
MG151 Strep 태그된 유전자	372	Strep-MG151-96	뉴클레오티드
MG151 Strep 태그된 유전자	373	Strep-MG151-97	뉴클레오티드
MG140 HA-His 태그된 유전자	374	MG140-1-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	375	MG140-3-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	376	MG140-4-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	377	MG140-5-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	378	MG140-6-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	379	MG140-7-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	380	MG140-8-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	381	MG140-10-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	382	MG140-13-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	383	MG140-14-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	384	MG140-45-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	385	MG140-46-HA-His	뉴클레오티드
MG140 HA-His 태그된 유전자	386	MG140-47-HA-His	뉴클레오티드
MG146 HA-His 태그된 유전자	387	MG146-1-HA-His	뉴클레오티드
MG147 HA-His 태그된 유전자	388	MG147-1-HA-His	뉴클레오티드
MG148 HA-His 태그된 유전자	389	MG148-1-HA-His	뉴클레오티드
MG148 HA-His 태그된 유전자	390	MG148-2-HA-His	뉴클레오티드
MG148 HA-His 태그된 유전자	391	MG148-3-HA-His	뉴클레오티드
MG148 HA-His 태그된 유전자	392	MG148-4-HA-His	뉴클레오티드
MG140 전위 단백질	393	MG140-45 전위 단백질	단백질
MG140 전위 단백질	394	MG140-46 전위 단백질	단백질
MG140 전위 단백질	395	MG140-47 전위 단백질	단백질
MG140 전위 단백질	396	MG140-48 전위 단백질	단백질
MG140 전위 단백질	397	MG140-49 전위 단백질	단백질
MG140 전위 단백질	398	MG140-50 전위 단백질	단백질
MG140 전위 단백질	399	MG140-51 전위 단백질	단백질
MG140 전위 단백질	400	MG140-52 전위 단백질	단백질
MG140 전위 단백질	401	MG140-53 전위 단백질	단백질
MG146 전위 단백질	402	MG146-1 전위 단백질	단백질
MG148 역전사 효소 단백질	403	MG148-13 역전사 효소	단백질
MG148 역전사 효소 단백질	404	MG148-14 역전사 효소	단백질
MG148 역전사 효소 단백질	405	MG148-15 역전사 효소	단백질
MG148 역전사 효소 단백질	406	MG148-16 역전사 효소	단백질
MG148 역전사 효소 단백질	407	MG148-17 역전사 효소	단백질
MG148 역전사 효소 단백질	408	MG148-18 역전사 효소	단백질
MG148 역전사 효소 단백질	409	MG148-19 역전사 효소	단백질
MG148 역전사 효소 단백질	410	MG148-20 역전사 효소	단백질
MG148 역전사 효소 단백질	411	MG148-21 역전사 효소	단백질
MG148 역전사 효소 단백질	412	MG148-22 역전사 효소	단백질
MG148 역전사 효소 단백질	413	MG148-23 역전사 효소	단백질
MG148 역전사 효소 단백질	414	MG148-24 역전사 효소	단백질
MG148 역전사 효소 단백질	415	MG148-25 역전사 효소	단백질
MG148 역전사 효소 단백질	416	MG148-26 역전사 효소	단백질
MG148 역전사 효소 단백질	417	MG148-27 역전사 효소	단백질
MG148 역전사 효소 단백질	418	MG148-29 역전사 효소	단백질
MG148 역전사 효소 단백질	419	MG148-30 역전사 효소	단백질
MG148 역전사 효소 단백질	420	MG148-31 역전사 효소	단백질
MG148 역전사 효소 단백질	421	MG148-32 역전사 효소	단백질
MG148 역전사 효소 단백질	422	MG148-33 역전사 효소	단백질
MG148 역전사 효소 단백질	423	MG148-34 역전사 효소	단백질
MG148 역전사 효소 단백질	424	MG148-35 역전사 효소	단백질
MG148 역전사 효소 단백질	425	MG148-36 역전사 효소	단백질
MG148 역전사 효소 단백질	426	MG148-37 역전사 효소	단백질
MG149 역전사 효소 단백질	427	MG149-1 역전사 효소	단백질
MG149 역전사 효소 단백질	428	MG149-2 역전사 효소	단백질
MG149 역전사 효소 단백질	429	MG149-3 역전사 효소	단백질
MG149 역전사 효소 단백질	430	MG149-5 역전사 효소	단백질
MG149 역전사 효소 단백질	431	MG149-6 역전사 효소	단백질
MG149 역전사 효소 단백질	432	MG149-7 역전사 효소	단백질
MG149 역전사 효소 단백질	433	MG149-8 역전사 효소	단백질
MG149 역전사 효소 단백질	434	MG149-9 역전사 효소	단백질
MG149 역전사 효소 단백질	435	MG149-10 역전사 효소	단백질
MG149 역전사 효소 단백질	436	MG149-11 역전사 효소	단백질
MG149 역전사 효소 단백질	437	MG149-12 역전사 효소	단백질
MG149 역전사 효소 단백질	438	MG149-13 역전사 효소	단백질
MG149 역전사 효소 단백질	439	MG149-14 역전사 효소	단백질
MG151 역전사 효소 단백질	440	MG151-1 역전사 효소	단백질
MG151 역전사 효소 단백질	441	MG151-2 역전사 효소	단백질
MG151 역전사 효소 단백질	442	MG151-3 역전사 효소	단백질
MG151 역전사 효소 단백질	443	MG151-4 역전사 효소	단백질
MG151 역전사 효소 단백질	444	MG151-5 역전사 효소	단백질
MG151 역전사 효소 단백질	445	MG151-6 역전사 효소	단백질
MG151 역전사 효소 단백질	446	MG151-7 역전사 효소	단백질
MG151 역전사 효소 단백질	447	MG151-8 역전사 효소	단백질
MG151 역전사 효소 단백질	448	MG151-9 역전사 효소	단백질
MG151 역전사 효소 단백질	449	MG151-10 역전사 효소	단백질
MG151 역전사 효소 단백질	450	MG151-12 역전사 효소	단백질
MG151 역전사 효소 단백질	451	MG151-13 역전사 효소	단백질
MG151 역전사 효소 단백질	452	MG151-14 역전사 효소	단백질
MG151 역전사 효소 단백질	453	MG151-15 역전사 효소	단백질
MG151 역전사 효소 단백질	454	MG151-16 역전사 효소	단백질
MG151 역전사 효소 단백질	455	MG151-17 역전사 효소	단백질
MG151 역전사 효소 단백질	456	MG151-18 역전사 효소	단백질
MG151 역전사 효소 단백질	457	MG151-19 역전사 효소	단백질
MG151 역전사 효소 단백질	458	MG151-20 역전사 효소	단백질
MG151 역전사 효소 단백질	459	MG151-21 역전사 효소	단백질
MG151 역전사 효소 단백질	460	MG151-22 역전사 효소	단백질
MG151 역전사 효소 단백질	461	MG151-23 역전사 효소	단백질
MG151 역전사 효소 단백질	462	MG151-24 역전사 효소	단백질
MG151 역전사 효소 단백질	463	MG151-25 역전사 효소	단백질
MG151 역전사 효소 단백질	464	MG151-26 역전사 효소	단백질
MG151 역전사 효소 단백질	465	MG151-27 역전사 효소	단백질
MG151 역전사 효소 단백질	466	MG151-28 역전사 효소	단백질
MG151 역전사 효소 단백질	467	MG151-29 역전사 효소	단백질
MG151 역전사 효소 단백질	468	MG151-30 역전사 효소	단백질
MG151 역전사 효소 단백질	469	MG151-31 역전사 효소	단백질
MG151 역전사 효소 단백질	470	MG151-32 역전사 효소	단백질
MG151 역전사 효소 단백질	471	MG151-33 역전사 효소	단백질
MG151 역전사 효소 단백질	472	MG151-34 역전사 효소	단백질
MG151 역전사 효소 단백질	473	MG151-35 역전사 효소	단백질
MG151 역전사 효소 단백질	474	MG151-36 역전사 효소	단백질
MG151 역전사 효소 단백질	475	MG151-37 역전사 효소	단백질
MG151 역전사 효소 단백질	476	MG151-38 역전사 효소	단백질
MG151 역전사 효소 단백질	477	MG151-39 역전사 효소	단백질
MG151 역전사 효소 단백질	478	MG151-40 역전사 효소	단백질
MG151 역전사 효소 단백질	479	MG151-41 역전사 효소	단백질
MG151 역전사 효소 단백질	480	MG151-42 역전사 효소	단백질
MG151 역전사 효소 단백질	481	MG151-43 역전사 효소	단백질
MG151 역전사 효소 단백질	482	MG151-44 역전사 효소	단백질
MG151 역전사 효소 단백질	483	MG151-45 역전사 효소	단백질
MG151 역전사 효소 단백질	484	MG151-46 역전사 효소	단백질
MG151 역전사 효소 단백질	485	MG151-47 역전사 효소	단백질
MG151 역전사 효소 단백질	486	MG151-48 역전사 효소	단백질
MG151 역전사 효소 단백질	487	MG151-49 역전사 효소	단백질
MG151 역전사 효소 단백질	488	MG151-50 역전사 효소	단백질
MG151 역전사 효소 단백질	489	MG151-51 역전사 효소	단백질
MG151 역전사 효소 단백질	490	MG151-52 역전사 효소	단백질
MG151 역전사 효소 단백질	491	MG151-53 역전사 효소	단백질
MG151 역전사 효소 단백질	492	MG151-54 역전사 효소	단백질
MG151 역전사 효소 단백질	493	MG151-55 역전사 효소	단백질
MG151 역전사 효소 단백질	494	MG151-56 역전사 효소	단백질
MG151 역전사 효소 단백질	495	MG151-57 역전사 효소	단백질
MG151 역전사 효소 단백질	496	MG151-58 역전사 효소	단백질
MG151 역전사 효소 단백질	497	MG151-59 역전사 효소	단백질
MG151 역전사 효소 단백질	498	MG151-60 역전사 효소	단백질
MG151 역전사 효소 단백질	499	MG151-61 역전사 효소	단백질
MG151 역전사 효소 단백질	500	MG151-62 역전사 효소	단백질
MG151 역전사 효소 단백질	501	MG151-63 역전사 효소	단백질
MG151 역전사 효소 단백질	502	MG151-64 역전사 효소	단백질
MG151 역전사 효소 단백질	503	MG151-65 역전사 효소	단백질
MG151 역전사 효소 단백질	504	MG151-66 역전사 효소	단백질
MG151 역전사 효소 단백질	505	MG151-67 역전사 효소	단백질
MG151 역전사 효소 단백질	506	MG151-68 역전사 효소	단백질
MG151 역전사 효소 단백질	507	MG151-69 역전사 효소	단백질
MG151 역전사 효소 단백질	508	MG151-70 역전사 효소	단백질
MG151 역전사 효소 단백질	509	MG151-71 역전사 효소	단백질
MG151 역전사 효소 단백질	510	MG151-72 역전사 효소	단백질
MG151 역전사 효소 단백질	511	MG151-73 역전사 효소	단백질
MG151 역전사 효소 단백질	512	MG151-74 역전사 효소	단백질
MG151 역전사 효소 단백질	513	MG151-75 역전사 효소	단백질
MG151 역전사 효소 단백질	514	MG151-76 역전사 효소	단백질
MG151 역전사 효소 단백질	515	MG151-77 역전사 효소	단백질
MG151 역전사 효소 단백질	516	MG151-78 역전사 효소	단백질
MG151 역전사 효소 단백질	517	MG151-79 역전사 효소	단백질
MG151 역전사 효소 단백질	518	MG151-80 역전사 효소	단백질
MG151 역전사 효소 단백질	519	MG151-81 역전사 효소	단백질
MG151 역전사 효소 단백질	520	MG151-82 역전사 효소	단백질
MG151 역전사 효소 단백질	521	MG151-83 역전사 효소	단백질
MG151 역전사 효소 단백질	522	MG151-84 역전사 효소	단백질
MG151 역전사 효소 단백질	523	MG151-85 역전사 효소	단백질
MG151 역전사 효소 단백질	524	MG151-87 역전사 효소	단백질
MG151 역전사 효소 단백질	525	MG151-88 역전사 효소	단백질
MG151 역전사 효소 단백질	526	MG151-89 역전사 효소	단백질
MG151 역전사 효소 단백질	527	MG151-90 역전사 효소	단백질
MG151 역전사 효소 단백질	528	MG151-91 역전사 효소	단백질
MG151 역전사 효소 단백질	529	MG151-92 역전사 효소	단백질
MG151 역전사 효소 단백질	530	MG151-93 역전사 효소	단백질
MG151 역전사 효소 단백질	531	MG151-94 역전사 효소	단백질
MG151 역전사 효소 단백질	532	MG151-95 역전사 효소	단백질
MG151 역전사 효소 단백질	533	MG151-96 역전사 효소	단백질
MG151 역전사 효소 단백질	534	MG151-97 역전사 효소	단백질
MG151 역전사 효소 단백질	535	MG151-98 역전사 효소	단백질
MG151 역전사 효소 단백질	536	MG151-99 역전사 효소	단백질
MG151 역전사 효소 단백질	537	MG151-100 역전사 효소	단백질
MG151 역전사 효소 단백질	538	MG151-101 역전사 효소	단백질
MG151 역전사 효소 단백질	539	MG151-102 역전사 효소	단백질
MG151 역전사 효소 단백질	540	MG151-103 역전사 효소	단백질
MG151 역전사 효소 단백질	541	MG151-104 역전사 효소	단백질
MG151 역전사 효소 단백질	542	MG151-105 역전사 효소	단백질
MG151 역전사 효소 단백질	543	MG151-106 역전사 효소	단백질
MG151 역전사 효소 단백질	544	MG151-107 역전사 효소	단백질
MG151 역전사 효소 단백질	545	MG151-108 역전사 효소	단백질
MG151 역전사 효소 단백질	546	MG151-109 역전사 효소	단백질
MG151 역전사 효소 단백질	547	MG151-110 역전사 효소	단백질
MG151 역전사 효소 단백질	548	MG151-111 역전사 효소	단백질
MG151 역전사 효소 단백질	549	MG151-112 역전사 효소	단백질
MG151 역전사 효소 단백질	550	MG151-113 역전사 효소	단백질
MG151 역전사 효소 단백질	551	MG151-114 역전사 효소	단백질
MG151 역전사 효소 단백질	552	MG151-115 역전사 효소	단백질
MG151 역전사 효소 단백질	553	MG151-116 역전사 효소	단백질
MG151 역전사 효소 단백질	554	MG151-117 역전사 효소	단백질
MG153 역전사 효소 단백질	555	MG153-1 역전사 효소	단백질
MG153 역전사 효소 단백질	556	MG153-2 역전사 효소	단백질
MG153 역전사 효소 단백질	557	MG153-3 역전사 효소	단백질
MG153 역전사 효소 단백질	558	MG153-4 역전사 효소	단백질
MG153 역전사 효소 단백질	559	MG153-5 역전사 효소	단백질
MG153 역전사 효소 단백질	560	MG153-6 역전사 효소	단백질
MG153 역전사 효소 단백질	561	MG153-7 역전사 효소	단백질
MG153 역전사 효소 단백질	562	MG153-8 역전사 효소	단백질
MG153 역전사 효소 단백질	563	MG153-9 역전사 효소	단백질
MG153 역전사 효소 단백질	564	MG153-10 역전사 효소	단백질
MG153 역전사 효소 단백질	565	MG153-11 역전사 효소	단백질
MG153 역전사 효소 단백질	566	MG153-12 역전사 효소	단백질
MG153 역전사 효소 단백질	567	MG153-13 역전사 효소	단백질
MG153 역전사 효소 단백질	568	MG153-14 역전사 효소	단백질
MG153 역전사 효소 단백질	569	MG153-15 역전사 효소	단백질
MG153 역전사 효소 단백질	570	MG153-16 역전사 효소	단백질
MG153 역전사 효소 단백질	571	MG153-17 역전사 효소	단백질
MG153 역전사 효소 단백질	572	MG153-18 역전사 효소	단백질
MG153 역전사 효소 단백질	573	MG153-19 역전사 효소	단백질
MG153 역전사 효소 단백질	574	MG153-20 역전사 효소	단백질
MG153 역전사 효소 단백질	575	MG153-21 역전사 효소	단백질
MG153 역전사 효소 단백질	576	MG153-25 역전사 효소	단백질
MG153 역전사 효소 단백질	577	MG153-26 역전사 효소	단백질
MG153 역전사 효소 단백질	578	MG153-27 역전사 효소	단백질
MG153 역전사 효소 단백질	579	MG153-28 역전사 효소	단백질
MG153 역전사 효소 단백질	580	MG153-29 역전사 효소	단백질
MG153 역전사 효소 단백질	581	MG153-30 역전사 효소	단백질
MG153 역전사 효소 단백질	582	MG153-31 역전사 효소	단백질
MG153 역전사 효소 단백질	583	MG153-32 역전사 효소	단백질
MG153 역전사 효소 단백질	584	MG153-33 역전사 효소	단백질
MG153 역전사 효소 단백질	585	MG153-34 역전사 효소	단백질
MG153 역전사 효소 단백질	586	MG153-35 역전사 효소	단백질
MG153 역전사 효소 단백질	587	MG153-36 역전사 효소	단백질
MG153 역전사 효소 단백질	588	MG153-37 역전사 효소	단백질
MG153 역전사 효소 단백질	589	MG153-38 역전사 효소	단백질
MG153 역전사 효소 단백질	590	MG153-39 역전사 효소	단백질
MG153 역전사 효소 단백질	591	MG153-40 역전사 효소	단백질
MG153 역전사 효소 단백질	592	MG153-41 역전사 효소	단백질
MG153 역전사 효소 단백질	593	MG153-42 역전사 효소	단백질
MG153 역전사 효소 단백질	594	MG153-43 역전사 효소	단백질
MG153 역전사 효소 단백질	595	MG153-44 역전사 효소	단백질
MG153 역전사 효소 단백질	596	MG153-45 역전사 효소	단백질
MG153 역전사 효소 단백질	597	MG153-46 역전사 효소	단백질
MG153 역전사 효소 단백질	598	MG153-47 역전사 효소	단백질
MG153 역전사 효소 단백질	599	MG153-48 역전사 효소	단백질
MG153 역전사 효소 단백질	600	MG153-49 역전사 효소	단백질
MG153 역전사 효소 단백질	601	MG153-50 역전사 효소	단백질
MG153 역전사 효소 단백질	602	MG153-51 역전사 효소	단백질
MG153 역전사 효소 단백질	603	MG153-52 역전사 효소	단백질
MG153 역전사 효소 단백질	604	MG153-53 역전사 효소	단백질
MG153 역전사 효소 단백질	605	MG153-54 역전사 효소	단백질
MG153 역전사 효소 단백질	606	MG153-55 역전사 효소	단백질
MG153 역전사 효소 단백질	607	MG153-56 역전사 효소	단백질
MG153 역전사 효소 단백질	608	MG153-57 역전사 효소	단백질
MG154 역전사 효소 단백질	609	MG154-1 역전사 효소	단백질
MG154 역전사 효소 단백질	610	MG154-2 역전사 효소	단백질
MG155 역전사 효소 단백질	611	MG155-1 역전사 효소	단백질
MG155 역전사 효소 단백질	612	MG155-2 역전사 효소	단백질
MG155 역전사 효소 단백질	613	MG155-3 역전사 효소	단백질
MG155 역전사 효소 단백질	614	MG155-4 역전사 효소	단백질
MG155 역전사 효소 단백질	615	MG155-5 역전사 효소	단백질
MG156 역전사 효소 단백질	616	MG156-1 역전사 효소	단백질
MG156 역전사 효소 단백질	617	MG156-2 역전사 효소	단백질
MG157 역전사 효소 단백질	618	MG157-1 역전사 효소	단백질
MG157 역전사 효소 단백질	619	MG157-2 역전사 효소	단백질
MG157 역전사 효소 단백질	620	MG157-3 역전사 효소	단백질
MG157 역전사 효소 단백질	621	MG157-4 역전사 효소	단백질
MG157 역전사 효소 단백질	622	MG157-5 역전사 효소	단백질
MG158 역전사 효소 단백질	623	MG158-1 역전사 효소	단백질
MG159 역전사 효소 단백질	624	MG159-1 역전사 효소	단백질
MG159 역전사 효소 단백질	625	MG159-2 역전사 효소	단백질
MG159 역전사 효소 단백질	626	MG159-3 역전사 효소	단백질
MG160 역전사 효소 단백질	627	MG160-1 역전사 효소	단백질
MG160 역전사 효소 단백질	628	MG160-2 역전사 효소	단백질
MG160 역전사 효소 단백질	629	MG160-3 역전사 효소	단백질
MG160 역전사 효소 단백질	630	MG160-4 역전사 효소	단백질
MG160 역전사 효소 단백질	631	MG160-5 역전사 효소	단백질
MG160 역전사 효소 단백질	632	MG160-8 역전사 효소	단백질
MG160 역전사 효소 단백질	633	MG160-6 역전사 효소	단백질
MG160 역전사 효소 단백질	634	MG160-9 역전사 효소	단백질
MG160 역전사 효소 단백질	635	MG160-10 역전사 효소	단백질
MG160 역전사 효소 단백질	636	MG160-11 역전사 효소	단백질
MG160 역전사 효소 단백질	637	MG160-12 역전사 효소	단백질
MG160 역전사 효소 단백질	638	MG160-13 역전사 효소	단백질
MG160 역전사 효소 단백질	639	MG160-14 역전사 효소	단백질
MG160 역전사 효소 단백질	640	MG160-15 역전사 효소	단백질
MG160 역전사 효소 단백질	641	MG160-16 역전사 효소	단백질
MG160 역전사 효소 단백질	642	MG160-17 역전사 효소	단백질
MG160 역전사 효소 단백질	643	MG160-18 역전사 효소	단백질
MG160 역전사 효소 단백질	644	MG160-19 역전사 효소	단백질
MG160 역전사 효소 단백질	645	MG160-20 역전사 효소	단백질
MG160 역전사 효소 단백질	646	MG160-21 역전사 효소	단백질
MG160 역전사 효소 단백질	647	MG160-22 역전사 효소	단백질
MG160 역전사 효소 단백질	648	MG160-23 역전사 효소	단백질
MG160 역전사 효소 단백질	649	MG160-24 역전사 효소	단백질
MG160 역전사 효소 단백질	650	MG160-25 역전사 효소	단백질
MG160 역전사 효소 단백질	651	MG160-26 역전사 효소	단백질
MG160 역전사 효소 단백질	652	MG160-27 역전사 효소	단백질
MG160 역전사 효소 단백질	653	MG160-28 역전사 효소	단백질
MG160 역전사 효소 단백질	654	MG160-29 역전사 효소	단백질
MG160 역전사 효소 단백질	655	MG160-30 역전사 효소	단백질
MG160 역전사 효소 단백질	656	MG160-31 역전사 효소	단백질
MG160 역전사 효소 단백질	657	MG160-32 역전사 효소	단백질
MG160 역전사 효소 단백질	658	MG160-33 역전사 효소	단백질
MG160 역전사 효소 단백질	659	MG160-34 역전사 효소	단백질
MG160 역전사 효소 단백질	660	MG160-35 역전사 효소	단백질
MG160 역전사 효소 단백질	661	MG160-36 역전사 효소	단백질
MG160 역전사 효소 단백질	662	MG160-37 역전사 효소	단백질
MG160 역전사 효소 단백질	663	MG160-38 역전사 효소	단백질
MG160 역전사 효소 단백질	664	MG160-39 역전사 효소	단백질
MG160 역전사 효소 단백질	665	MG160-40 역전사 효소	단백질
MG160 역전사 효소 단백질	666	MG160-41 역전사 효소	단백질
MG160 역전사 효소 단백질	667	MG160-42 역전사 효소	단백질
MG160 역전사 효소 단백질	668	MG160-43 역전사 효소	단백질
MG160 역전사 효소 단백질	669	MG160-44 역전사 효소	단백질
MG160 역전사 효소 단백질	670	MG160-45 역전사 효소	단백질
MG160 역전사 효소 단백질	671	MG160-46 역전사 효소	단백질
MG160 역전사 효소 단백질	672	MG160-47 역전사 효소	단백질
MG160 역전사 효소 단백질	673	MG160-48 역전사 효소	단백질
MG163 역전사 효소 단백질	674	MG163-1 역전사 효소	단백질
MG163 역전사 효소 단백질	675	MG163-2 역전사 효소	단백질
MG163 역전사 효소 단백질	676	MG163-3 역전사 효소	단백질
MG163 역전사 효소 단백질	677	MG163-4 역전사 효소	단백질
MG163 역전사 효소 단백질	678	MG163-5 역전사 효소	단백질
MG164 역전사 효소 단백질	679	MG164-1 역전사 효소	단백질
MG164 역전사 효소 단백질	680	MG164-2 역전사 효소	단백질
MG164 역전사 효소 단백질	681	MG164-3 역전사 효소	단백질
MG164 역전사 효소 단백질	682	MG164-4 역전사 효소	단백질
MG164 역전사 효소 단백질	683	MG164-5 역전사 효소	단백질
MG165 역전사 효소 단백질	684	MG165-1 역전사 효소	단백질
MG165 역전사 효소 단백질	685	MG165-2 역전사 효소	단백질
MG165 역전사 효소 단백질	686	MG165-3 역전사 효소	단백질
MG165 역전사 효소 단백질	687	MG165-4 역전사 효소	단백질
MG165 역전사 효소 단백질	688	MG165-5 역전사 효소	단백질
MG165 역전사 효소 단백질	689	MG165-6 역전사 효소	단백질
MG165 역전사 효소 단백질	690	MG165-7 역전사 효소	단백질
MG165 역전사 효소 단백질	691	MG165-8 역전사 효소	단백질
MG165 역전사 효소 단백질	692	MG165-9 역전사 효소	단백질
MG166 역전사 효소 단백질	693	MG166-1 역전사 효소	단백질
MG166 역전사 효소 단백질	694	MG166-2 역전사 효소	단백질
MG166 역전사 효소 단백질	695	MG166-3 역전사 효소	단백질
MG166 역전사 효소 단백질	696	MG166-4 역전사 효소	단백질
MG166 역전사 효소 단백질	697	MG166-5 역전사 효소	단백질
MG167 역전사 효소 단백질	698	MG167-1 역전사 효소	단백질
MG167 역전사 효소 단백질	699	MG167-2 역전사 효소	단백질
MG167 역전사 효소 단백질	700	MG167-3 역전사 효소	단백질
MG167 역전사 효소 단백질	701	MG167-4 역전사 효소	단백질
MG167 역전사 효소 단백질	702	MG167-5 역전사 효소	단백질
MG168 역전사 효소 단백질	703	MG168-1 역전사 효소	단백질
MG168 역전사 효소 단백질	704	MG168-2 역전사 효소	단백질
MG168 역전사 효소 단백질	705	MG168-3 역전사 효소	단백질
MG168 역전사 효소 단백질	706	MG168-4 역전사 효소	단백질
MG168 역전사 효소 단백질	707	MG168-5 역전사 효소	단백질
MG169 역전사 효소 단백질	708	MG169-1 역전사 효소	단백질
MG169 역전사 효소 단백질	709	MG169-2 역전사 효소	단백질
MG169 역전사 효소 단백질	710	MG169-3 역전사 효소	단백질
MG169 역전사 효소 단백질	711	MG169-4 역전사 효소	단백질
MG169 역전사 효소 단백질	712	MG169-5 역전사 효소	단백질
MG169 역전사 효소 단백질	713	MG169-6 역전사 효소	단백질
MG169 역전사 효소 단백질	714	MG169-7 역전사 효소	단백질
MG169 역전사 효소 단백질	715	MG169-8 역전사 효소	단백질
MG169 역전사 효소 단백질	716	MG169-9 역전사 효소	단백질
MG169 역전사 효소 단백질	717	MG169-10 역전사 효소	단백질
MG169 역전사 효소 단백질	718	MG169-11 역전사 효소	단백질
MG170 역전사 효소 단백질	719	MG170-1 역전사 효소	단백질
MG170 역전사 효소 단백질	720	MG170-2 역전사 효소	단백질
MG170 역전사 효소 단백질	721	MG170-3 역전사 효소	단백질
MG170 역전사 효소 단백질	722	MG170-4 역전사 효소	단백질
MG170 역전사 효소 단백질	723	MG170-5 역전사 효소	단백질
MG170 역전사 효소 단백질	724	MG170-6 역전사 효소	단백질
MG170 역전사 효소 단백질	725	MG170-7 역전사 효소	단백질
MG170 역전사 효소 단백질	726	MG170-8 역전사 효소	단백질
MG170 역전사 효소 단백질	727	MG170-9 역전사 효소	단백질
MG170 역전사 효소 단백질	728	MG170-10 역전사 효소	단백질
MG172 역전사 효소 단백질	729	MG172-1 역전사 효소	단백질
MG172 역전사 효소 단백질	730	MG172-2 역전사 효소	단백질
MG172 역전사 효소 단백질	731	MG172-3 역전사 효소	단백질
MG172 역전사 효소 단백질	732	MG172-4 역전사 효소	단백질
MG172 역전사 효소 단백질	733	MG172-5 역전사 효소	단백질
MG173 역전사 효소 단백질	734	MG173-1 역전사 효소	단백질
MG173 역전사 효소 단백질	735	MG173-2 역전사 효소	단백질
PS 변형된 프라이머	736	PS-변형된 DNA 프라이머 #1, *로 표시된 PS 결합	뉴클레오티드
PS 변형된 프라이머	737	PS-변형된 DNA 프라이머 #2, *로 표시된 PS 결합	뉴클레오티드
PS 변형된 프라이머	738	PS-변형된 DNA 프라이머 #3, *로 표시된 PS 결합	뉴클레오티드
QPCR용 Taqman 프로브	739	542 bp 앰플리콘용 Taqman 프로브	뉴클레오티드
MG153 RT MCP 융합	740	FH-MCP-MG153-5	뉴클레오티드
MG153 RT MCP 융합	741	FH-MCP-MG153-6	뉴클레오티드
MG153 RT MCP 융합	742	FH-MCP-MG153-18	뉴클레오티드
MG153 RT MCP 융합	743	FH-MCP-MG153-20	뉴클레오티드
MG153 RT MCP 융합	744	FH-MCP-MG153-29	뉴클레오티드
MG153 RT MCP 융합	745	FH-MCP-MG153-30	뉴클레오티드
MG153 RT MCP 융합	746	FH-MCP-MG153-31	뉴클레오티드
MG153 RT MCP 융합	747	FH-MCP-MG153-33	뉴클레오티드
MG153 RT MCP 융합	748	FH-MCP-MG153-34	뉴클레오티드
MG153 RT MCP 융합	749	FH-MCP-MG153-35	뉴클레오티드
MG153 RT MCP 융합	750	FH-MCP-MG153-36	뉴클레오티드
MG153 RT MCP 융합	751	FH-MCP-MG153-37	뉴클레오티드
MG153 RT MCP 융합	752	FH-MCP-MG153-45	뉴클레오티드
MG153 RT MCP 융합	753	FH-MCP-MG153-51	뉴클레오티드
MG153 RT MCP 융합	754	FH-MCP-MG153-53	뉴클레오티드
MG153 RT MCP 융합	755	FH-MCP-MG153-54	뉴클레오티드
MG153 RT MCP 융합	756	FH-MCP-MG153-57	뉴클레오티드
MG165 RT MCP 융합	757	FH-MCP-MG165-1	뉴클레오티드
MG165 RT MCP 융합	758	FH-MCP-MG165-5	뉴클레오티드
MG167 RT MCP 융합	759	FH-MCP-MG167-1	뉴클레오티드
MG167 RT MCP 융합	760	FH-MCP-MG167-4	뉴클레오티드
MG140 UTR	761	MG140-54 5' UTR	뉴클레오티드
MG140 UTR	762	MG140-54 3' UTR	뉴클레오티드
MG140 UTR	763	MG140-55 5' UTR	뉴클레오티드
MG140 UTR	764	MG140-55 3' UTR	뉴클레오티드
MG140 UTR	765	MG140-56 5' UTR	뉴클레오티드
MG140 UTR	766	MG140-56 3' UTR	뉴클레오티드
MG140 UTR	767	MG140-1 5' UTR	뉴클레오티드
MG140 UTR	768	MG140-1 3' UTR	뉴클레오티드
MG140 UTR	769	MG140-3 5' UTR	뉴클레오티드
MG140 UTR	770	MG140-3 3' UTR	뉴클레오티드
MG140 UTR	771	MG140-4 5' UTR	뉴클레오티드
MG140 UTR	772	MG140-4 3' UTR	뉴클레오티드
MG140 UTR	773	MG140-5 5' UTR	뉴클레오티드
MG140 UTR	774	MG140-5 3' UTR	뉴클레오티드
MG140 UTR	775	MG140-6 5' UTR	뉴클레오티드
MG140 UTR	776	MG140-6 3' UTR	뉴클레오티드
MG140 UTR	777	MG140-7 5' UTR	뉴클레오티드
MG140 UTR	778	MG140-7 3' UTR	뉴클레오티드
MG140 UTR	779	MG140-8 5' UTR	뉴클레오티드
MG140 UTR	780	MG140-8 3' UTR	뉴클레오티드
MG140 UTR	781	MG140-10 5' UTR	뉴클레오티드
MG140 UTR	782	MG140-10 3' UTR	뉴클레오티드
MG140 UTR	783	MG140-13 5' UTR	뉴클레오티드
MG140 UTR	784	MG140-13 3' UTR	뉴클레오티드
MG140 UTR	785	MG140-14 5' UTR	뉴클레오티드
MG140 UTR	786	MG140-14 3' UTR	뉴클레오티드
MG140 UTR	787	MG140-45 5' UTR	뉴클레오티드
MG140 UTR	788	MG140-45 3' UTR	뉴클레오티드
MG140 UTR	789	MG140-46 5' UTR	뉴클레오티드
MG140 UTR	790	MG140-46 3' UTR	뉴클레오티드
MG140 UTR	791	MG140-47 5' UTR	뉴클레오티드
MG140 UTR	792	MG140-47 3' UTR	뉴클레오티드
MG140 UTR	793	MG140-54 5' UTR	뉴클레오티드
MG140 UTR	794	MG140-54 3' UTR	뉴클레오티드
MG140 UTR	795	MG140-55 5' UTR	뉴클레오티드
MG140 UTR	796	MG140-55 3' UTR	뉴클레오티드
MG140 UTR	797	MG140-56 5' UTR	뉴클레오티드
MG140 UTR	798	MG140-56 3' UTR	뉴클레오티드
MG140 역전사 효소 단백질	799	MG140-54 역전사 효소	단백질
MG140 역전사 효소 단백질	800	MG140-55 역전사 효소	단백질
MG140 역전사 효소 단백질	801	MG140-56 역전사 효소	단백질
MG140 역전사 효소 단백질	802	MG140-54 역전사 효소	단백질
MG140 역전사 효소 단백질	803	MG140-55 역전사 효소	단백질
MG140 역전사 효소 단백질	804	MG140-56 역전사 효소	단백질
MG140 역전사 효소 단백질	805	MG140-57 역전사 효소	단백질
MG140 역전사 효소 단백질	806	MG140-58 역전사 효소	단백질
MG140 역전사 효소 단백질	807	MG140-59 역전사 효소	단백질
MG140 역전사 효소 단백질	808	MG140-60 역전사 효소	단백질
MG140 역전사 효소 단백질	809	MG140-61 역전사 효소	단백질
MG140 역전사 효소 단백질	810	MG140-62 역전사 효소	단백질
MG140 역전사 효소 단백질	811	MG140-63 역전사 효소	단백질
MG140 역전사 효소 단백질	812	MG140-64 역전사 효소	단백질
MG140 역전사 효소 단백질	813	MG140-65 역전사 효소	단백질
MG140 역전사 효소 단백질	814	MG140-66 역전사 효소	단백질
MG140 역전사 효소 단백질	815	MG140-67 역전사 효소	단백질
MG140 역전사 효소 단백질	816	MG140-68 역전사 효소	단백질
MG140 역전사 효소 단백질	817	MG140-69 역전사 효소	단백질
MG140 역전사 효소 단백질	818	MG140-70 역전사 효소	단백질
MG140 역전사 효소 단백질	819	MG140-71 역전사 효소	단백질
MG140 역전사 효소 단백질	820	MG140-72 역전사 효소	단백질
MG140 역전사 효소 단백질	821	MG140-73 역전사 효소	단백질
MG140 역전사 효소 단백질	822	MG140-74 역전사 효소	단백질
MG140 역전사 효소 단백질	823	MG140-75 역전사 효소	단백질
MG140 역전사 효소 단백질	824	MG140-76 역전사 효소	단백질
MG140 역전사 효소 단백질	825	MG140-77 역전사 효소	단백질
MG140 역전사 효소 단백질	826	MG140-78 역전사 효소	단백질
MG140 역전사 효소 단백질	827	MG140-79 역전사 효소	단백질
MG140 역전사 효소 단백질	828	MG140-80 역전사 효소	단백질
MG140 역전사 효소 단백질	829	MG140-81 역전사 효소	단백질
MG140 역전사 효소 단백질	830	MG140-82 역전사 효소	단백질
MG140 역전사 효소 단백질	831	MG140-83 역전사 효소	단백질
MG140 역전사 효소 단백질	832	MG140-84 역전사 효소	단백질
MG140 역전사 효소 단백질	833	MG140-85 역전사 효소	단백질
MG140 역전사 효소 단백질	834	MG140-86 역전사 효소	단백질
MG140 역전사 효소 단백질	835	MG140-87 역전사 효소	단백질
MG140 역전사 효소 단백질	836	MG140-88 역전사 효소	단백질
MG140 역전사 효소 단백질	837	MG140-89 역전사 효소	단백질
MG140 역전사 효소 단백질	838	MG140-90 역전사 효소	단백질
MG140 역전사 효소 단백질	839	MG140-91 역전사 효소	단백질
MG140 역전사 효소 단백질	840	MG140-92 역전사 효소	단백질
MG140 역전사 효소 단백질	841	MG140-93 역전사 효소	단백질
MG140 역전사 효소 단백질	842	MG140-94 역전사 효소	단백질
MG140 역전사 효소 단백질	843	MG140-95 역전사 효소	단백질
MG140 역전사 효소 단백질	844	MG140-96 역전사 효소	단백질
MG140 역전사 효소 단백질	845	MG140-97 역전사 효소	단백질
MG140 역전사 효소 단백질	846	MG140-98 역전사 효소	단백질
MG140 역전사 효소 단백질	847	MG140-99 역전사 효소	단백질
MG140 역전사 효소 단백질	848	MG140-100 역전사 효소	단백질
MG140 역전사 효소 단백질	849	MG140-101 역전사 효소	단백질
MG140 역전사 효소 단백질	850	MG140-102 역전사 효소	단백질
MG140 역전사 효소 단백질	851	MG140-103 역전사 효소	단백질
MG140 역전사 효소 단백질	852	MG140-104 역전사 효소	단백질
MG140 역전사 효소 단백질	853	MG140-105 역전사 효소	단백질
MG140 역전사 효소 단백질	854	MG140-106 역전사 효소	단백질
MG140 역전사 효소 단백질	855	MG140-107 역전사 효소	단백질
MG140 역전사 효소 단백질	856	MG140-108 역전사 효소	단백질
MG140 역전사 효소 단백질	857	MG140-109 역전사 효소	단백질
MG140 역전사 효소 단백질	858	MG140-110 역전사 효소	단백질
MG140 역전사 효소 단백질	859	MG140-111 역전사 효소	단백질
MG140 역전사 효소 단백질	860	MG140-112 역전사 효소	단백질
MG140 역전사 효소 단백질	861	MG140-113 역전사 효소	단백질
MG140 역전사 효소 단백질	862	MG140-114 역전사 효소	단백질
MG140 역전사 효소 단백질	863	MG140-115 역전사 효소	단백질
MG140 역전사 효소 단백질	864	MG140-116 역전사 효소	단백질
MG140 역전사 효소 단백질	865	MG140-117 역전사 효소	단백질
MG140 역전사 효소 단백질	866	MG140-118 역전사 효소	단백질
MG140 역전사 효소 단백질	867	MG140-119 역전사 효소	단백질
MG140 역전사 효소 단백질	868	MG140-120 역전사 효소	단백질
MG140 역전사 효소 단백질	869	MG140-121 역전사 효소	단백질
MG140 역전사 효소 단백질	870	MG140-122 역전사 효소	단백질
MG140 역전사 효소 단백질	871	MG140-123 역전사 효소	단백질
MG140 역전사 효소 단백질	872	MG140-124 역전사 효소	단백질
MG140 역전사 효소 단백질	873	MG140-125 역전사 효소	단백질
MG140 역전사 효소 단백질	874	MG140-126 역전사 효소	단백질
MG140 역전사 효소 단백질	875	MG140-127 역전사 효소	단백질
MG140 역전사 효소 단백질	876	MG140-128 역전사 효소	단백질
MG140 역전사 효소 단백질	877	MG140-129 역전사 효소	단백질
MG140 역전사 효소 단백질	878	MG140-130 역전사 효소	단백질
MG140 역전사 효소 단백질	879	MG140-131 역전사 효소	단백질
MG140 역전사 효소 단백질	880	MG140-132 역전사 효소	단백질
MG140 역전사 효소 단백질	881	MG140-133 역전사 효소	단백질
MG140 역전사 효소 단백질	882	MG140-134 역전사 효소	단백질
MG140 역전사 효소 단백질	883	MG140-135 역전사 효소	단백질
MG140 역전사 효소 단백질	884	MG140-136 역전사 효소	단백질
MG140 역전사 효소 단백질	885	MG140-137 역전사 효소	단백질
MG140 역전사 효소 단백질	886	MG140-138 역전사 효소	단백질
MG140 역전사 효소 단백질	887	MG140-139 역전사 효소	단백질
MG140 역전사 효소 단백질	888	MG140-140 역전사 효소	단백질
MG140 역전사 효소 단백질	889	MG140-141 역전사 효소	단백질
MG140 역전사 효소 단백질	890	MG140-142 역전사 효소	단백질
MG140 역전사 효소 단백질	891	MG140-143 역전사 효소	단백질
MG140 역전사 효소 단백질	892	MG140-144 역전사 효소	단백질
MG140 역전사 효소 단백질	893	MG140-145 역전사 효소	단백질
MG140 역전사 효소 단백질	894	MG140-146 역전사 효소	단백질
MG146 전위 단백질	895	MG146-2 전위 단백질	단백질

실시예

다음의 실시예는 어떤 방식으로도 제한하려는 것이 아니다.

실시예 1. 조작된 레트로트랜스포사제 시스템으로서,

(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및

(b) 레트로트랜스포사제를 포함하며, 여기서

상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 시스템.

실시예 2. 실시예 실시예 1에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 3. 실시예 실시예 1 또는 실시예 실시예 2에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 4. 실시예 실시예 1 내지 실시예 3 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 5. 실시예 실시예 1 내지 실시예 4 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 6. 실시예 실시예 1 내지 실시예 5 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.

실시예 7. 실시예 실시예 1 내지 실시예 6 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 비번역 영역(UTR) 및 5' 비번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.

실시예 8. 실시예 실시예 1 내지 실시예 7 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.

실시예 9. 실시예 실시예 1 내지 실시예 8 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 10. 실시예 실시예 1 내지 실시예 9 중 어느 하나에 있어서, 상기 NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 11. 실시예 실시예 1 내지 실시예 10 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.

실시예 12. 실시예 실시예 11에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.

실시예 13. 조작된 레트로트랜스포사제 시스템으로서,

(b) 레트로트랜스포사제를 포함하며, 여기서

상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 14. 실시예 실시예 13에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 조작된 레트로트랜스포사제 시스템.

실시예 15. 실시예 실시예 13 또는 실시예 실시예 14에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 16. 실시예 실시예 13 내지 실시예 15 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 17. 실시예 실시예 13 내지 실시예 16 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 18. 실시예 실시예 13 내지 실시예 17 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.

실시예 19. 실시예 실시예 13 내지 실시예 18 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.

실시예 20. 실시예 실시예 13 내지 실시예 19 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.

실시예 21. 실시예 실시예 13 내지 실시예 20 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.

실시예 22. 실시예 실시예 21에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.

실시예 23. 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 암호화하는, 데옥시리보핵산 폴리뉴클레오티드.

실시예 24. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 여기서 상기 핵산은 레트로트랜스포사제를 암호화하고, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 상기 유기체는 상기 미배양 미생물이 아닌, 핵산.

실시예 25. 실시예 실시예 24에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함하는, 핵산.

실시예 26. 실시예 실시예 24 또는 실시예 실시예 25에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함하는, 핵산.

실시예 27. 실시예 실시예 26에 있어서, 상기 NLS는 서열번호 896-911로부터 선택되는 서열을 포함하는, 핵산.

실시예 28. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 897을 포함하는, 핵산.

실시예 29. 실시예 실시예 28에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 N-말단에 근접한, 핵산.

실시예 30. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 896을 포함하는, 핵산.

실시예 31. 실시예 실시예 30에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 C-말단에 근접한, 핵산.

실시예 32. 실시예 실시예 24 내지 실시예 31에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간인, 핵산.

실시예 33. 실시예 실시예 24 내지 실시예 32 중 어느 하나의 상기 핵산을 포함하는, 벡터.

실시예 34. 실시예 실시예 33에 있어서, 상기 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함하는, 벡터.

실시예 35. 실시예 실시예 33 또는 실시예 실시예 34에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스인, 벡터.

실시예 36. 실시예 실시예 33 내지 실시예 35 중 어느 하나의 상기 벡터를 포함하는, 세포.

실시예 37. 레트로트랜스포사제를 제조하는 방법으로서, 실시예 실시예 36의 상기 세포를 배양하는 단계를 포함하는, 방법.

실시예 38. 표적 핵산 유전자좌를 포함하는 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 파괴, 결합, 닉킹, 절단, 마킹, 또는 변형시키는 방법으로서, 상기 방법은

(a) 상기 표적 핵산 유전자좌를 포함하는 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 상기 표적 핵산 유전자좌에 카고 뉴클레오티드 서열을 전위시키도록 구성된 레트로트랜스포사제와 접촉시키는 단계를 포함하고;

(b) 여기서 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 방법.

실시예 39. 실시예 실시예 38에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 방법.

실시예 40. 실시예 실시예 38 또는 실시예 실시예 39에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 41. 실시예 실시예 38 내지 실시예 40 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 42. 실시예 실시예 38 내지 실시예 41 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.

실시예 43. 실시예 실시예 38 내지 실시예 42 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 방법.

실시예 44. 실시예 실시예 38 내지 실시예 43 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.

실시예 45. 실시예 실시예 38 내지 실시예 44 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위되는, 방법.

실시예 46. 실시예 실시예 38 내지 실시예 45 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드인, 방법.

실시예 47. 표적 핵산 유전자좌를 파괴 또는 변형시키는 방법으로서, 상기 방법은 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 상기 표적 핵산 유전자좌에 전위시키도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는, 방법.

실시예 48. 실시예 실시예 47에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 단계는 상기 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형 또는 전위시키는 단계를 포함하는, 방법.

실시예 49. 실시예 실시예 47 내지 실시예 48에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함하는, 방법.

실시예 50. 실시예 실시예 49에 있어서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함하는, 방법.

실시예 51. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는, 방법.

실시예 52. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는, 방법.

실시예 53. 실시예 실시예 52에 있어서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포인, 방법.

실시예 54. 실시예 실시예 52 또는 실시예 53에 있어서, 상기 세포는 일차 세포인, 방법.

실시예 55. 실시예 실시예 54에 있어서, 상기 일차 세포는 T 세포인, 방법.

실시예 56. 실시예 실시예 54에 있어서, 상기 일차 세포는 조혈 줄기 세포(HSC)인, 방법.

실시예 57. 실시예 실시예 47 내지 실시예 56 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 실시예 실시예 24 내지 실시예 32 중 어느 하나의 핵산 또는 실시예 실시예 33 내지 실시예 35 중 어느 하나의 벡터를 전달하는 단계를 포함하는, 방법.

실시예 58. 실시예 실시예 47 내지 실시예 57 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함하는, 방법.

실시예 59. 실시예 실시예 58에 있어서, 상기 핵산은 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함하는, 방법.

실시예 60. 실시예 실시예 47 내지 실시예 59 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함하는, 방법.

실시예 61. 실시예 실시예 47 내지 실시예 60 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함하는, 방법.

실시예 62. 실시예 실시예 47 내지 실시예 61 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴을 유도하지 않는, 방법.

실시예 63. 서열번호 1-29, 393-735, 또는 799-895 또는 이들의 변이체와 적어도 75%의 서열 동일성을 갖는 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는, 숙주 세포.

실시예 64. 실시예 실시예 63에 있어서, 상기 숙주 세포는 대장균 세포인, 숙주 세포.

실시예 65. 실시예 실시예 64에 있어서, 상기 대장균 세포는 λDE3 리소겐이거나 상기 대장균 세포는 BL21(DE3) 균주인, 숙주 세포.

실시예 66. 실시예 실시예 64 또는 실시예 실시예 65에 있어서, 상기 대장균 세포는 ompT lon 유전자형을 갖는, 숙주 세포.

실시예 67. 실시예 실시예 63 내지 실시예 66 중 어느 하나에 있어서, 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.

실시예 68. 실시예 실시예 63 내지 실시예 67 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.

실시예 69. 실시예 실시예 68에 있어서, 상기 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그인, 숙주 세포.

실시예 70. 실시예 실시예 69 에 있어서, 상기 IMAC 태그는 폴리히스티딘 태그인, 숙주 세포.

실시예 71. 실시예 실시예 68에 있어서, 상기 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합인, 숙주 세포.

실시예 72. 실시예 실시예 68 내지 실시예 71 중 어느 하나에 있어서, 상기 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내에서 연결되는, 숙주 세포.

실시예 73. 실시예 실시예 72에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합인, 숙주 세포.

실시예 74. 실시예 실시예 63 내지 실시예 73 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포에서의 발현에 대해 코돈 최적화된, 숙주 세포.

실시예 75. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 벡터 상에 제공되는, 숙주 세포.

실시예 76. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포의 게놈에 통합되는, 숙주 세포.

실시예 77. 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.

실시예 78. 레트로트랜스포사제를 생산하는 방법으로서, 적합한 성장 배지 중 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 방법.

실시예 79. 실시예 실시예 78에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함하는, 방법.

실시예 80. 실시예 실시예 79에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.

실시예 81. 실시예 실시예 78 내지 실시예 80 중 어느 하나에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.

실시예 82. 실시예 실시예 81에 있어서, 상기 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.

실시예 83. 실시예 실시예 82에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함하는, 방법.

실시예 84. 실시예 실시예 83에 있어서, 상기 IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내 연결되는, 방법.

실시예 85. 실시예 실시예 84에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함하는, 방법.

실시예 86. 실시예 실시예 84 또는 실시예 실시예 85에 있어서, 상기 프로테아제 절단 부위에 상응하는 프로테아제를 상기 레트로트랜스포사제에 접촉시킴으로써 상기 IMAC 친화성 태그를 절단하는 단계를 추가로 포함하는, 방법.

실시예 87. 실시예 실시예 86에 있어서, 감산 IMAC 친화도 크로마토그래피를 수행하여 상기 레트로트랜스포사제를 포함하는 조성물로부터 상기 친화성 태그를 제거하는 단계를 추가로 포함하는, 방법.

실시예 88. 세포에서 유전자좌를 파괴하는 방법으로서, 상기 방법은 상기 세포를

(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및

(b) 레트로트랜스포사제를 포함하는 조성물에 접촉하는 단계를 포함하고, 여기서

상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 형질도입하도록 구성되고;

상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895, 또는 이들의 변이체 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고;

상기 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 방법.

실시예 89. 실시예 실시예 88에 있어서, 상기 전위 활성은 상기 표적 핵산 유전자좌를 포함하는 세포에 상기 레트로트랜스포사제를 도입하고 상기 세포에서 상기 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정되는, 방법.

실시예 90. 실시예 실시예 88 또는 실시예 89에 있어서, 상기 조성물은 20 pmole 이하의 상기 레트로트랜스포사제를 포함하는, 방법.

실시예 91. 실시예 90에 있어서, 상기 조성물은 1 pmol 이하의 상기 레트로트랜스포사제를 포함하는, 방법.

Claims

조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하고, 여기서
(i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
(ii) 상기 레트로트랜스포사제는 역전사 효소(RT) 도메인, 서열번호 1-29 또는 393-401 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 또는 제2항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 포함하는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, (c) 상기 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제7항에 있어서, 상기 이중-가닥 DNA 서열은 상기 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하고, 여기서 상기 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 상기 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 상기 카고 서열의 5' 서열 또는 상기 카고 서열의 3' 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함하는, 조작된 레트로트랜스포사제 시스템.
조작된 DNA 서열로서,
(a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
(b) 이종 카고 서열;
(c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 서열; 및
(d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열.
제13항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
제13항 또는 제14항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
제13항 내지 제15항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
제13항 내지 제16항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
제13항 내지 제17항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 조작된 DNA 서열.
제13항 내지 제18항 중 어느 한 항에 있어서, 상기 5' 서열 또는 상기 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 조작된 DNA 서열.
상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
제20항에 있어서, 상기 역전사 효소가 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제20항 또는 제21항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
제20항 내지 제22항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
제23항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함하는, 방법.
서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제25항에 있어서, 상기 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제25항 또는 제26항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 방법.
제27항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 방법.
제25항 내지 제28항 중 어느 한 항의 단백질을 암호화하는, 핵산.
개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제30항에 있어서, 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하고, 여기서
(i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
(ii) 상기 레트로트랜스포사제는 서열번호 402 또는 895의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항 또는 제33항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항 내지 제34항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항 내지 제35항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항 내지 제36항 중 어느 한 항에 있어서, (c) 상기 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
제32항 내지 제37항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
제32항 내지 제38항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
조작된 DNA 서열로서,
(a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
(b) 이종 카고 서열;
(c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및
(d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열.
제40항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 DNA 서열.
제40항 또는 제41항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
제40항 내지 제42항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
제40항 내지 제43항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX_[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
제45항에 있어서, 상기 역전사 효소는 서열번호 402 또는 895와 적어도 80% 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제45항 또는 제46항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
제45항 내지 제47항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
제48항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함하는, 방법.
서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제50항에 있어서, 상기 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제50항 또는 제51항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
제52항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
제50항 내지 제53항 중 어느 한 항의 단백질을 암호화하는, 핵산.
개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제55항에 있어서, 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
제57항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제58항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제57항 내지 제59항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
제57항 내지 제60항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함하는, 방법.
제57항 내지 제61항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
제62항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함하는, 방법.
서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제64항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제65항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제64항 내지 제66항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인이 RNA-결합 단백질 도메인인, 단백질.
제67항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
제68항에 있어서, 상기 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제68항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575, 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제64항 내지 제70항 중 어느 한 항의 단백질을 암호화하는, 핵산.
개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제72항에 있어서, 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80%의 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
제73항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소와 적어도 80% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산으로서, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제75항에 있어서, 상기 ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화하는, 핵산.
제75항 또는 제76항에 있어서, 상기 ORF는 상기 박테리아 유기체에서의 발현에 최적화되거나, 상기 유기체는 E. coli인, 핵산.
제75항 또는 제76항에 있어서, 상기 ORF는 포유류 유기체에서의 발현에 최적화되거나, 상기 유기체는 영장류 유기체인, 핵산.
제78항에 있어서, 상기 영장류 유기체는 H. 사피엔스인, 핵산.
제75항 내지 제79항 중 어느 한 항에 있어서, 상기 ORF는 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인을 암호화하는 상기 서열에 작동 가능하게 연결된 친화성 태그를 포함하고, 여기서 상기 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는, 핵산.
제77항에 있어서, 상기 ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
제75항 내지 제81항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함하는, 핵산.
상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
제83항에 있어서, 상기 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제84항에 있어서, 상기 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제83항 내지 제85항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
제83항 내지 제86항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 상기 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
제87항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함하는, 방법.
서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제89항에 있어서, 상기 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제90항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 단백질.
제89항 내지 제91항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
제92항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
제89항 내지 제93항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제89항 내지 제94항 중 어느 한 항의 단백질을 암호화하는, 핵산.
개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제96항에 있어서, 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
제97항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
제96항 내지 제98항 중 어느 한 항에 있어서, 상기 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소, 또는 이들의 변이체를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법.
제100항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 방법.
제100항 또는 제101항에 있어서, 상기 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
제100항 내지 제102항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
제100항 내지 제103항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 방법.
제100항 내지 제104항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
제105항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg²⁺, 또는 Mn²⁺를 추가로 포함하는, 방법.
서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제107항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 단백질.
제107항 또는 제108항에 있어서, 상기 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
제107항 내지 제109항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
제110항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
제107항 내지 제112항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
제107항 내지 제112항 중 어느 한 항의 단백질을 암호화하는, 핵산.
유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제114항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 핵산.
제114항 또는 제115항에 있어서, 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
제114항 내지 제116항 중 어느 한 항에 있어서, 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
제117항에 있어서, 상기 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
제114항 내지 제115항 중 어느 한 항에 있어서, 상기 유기체는 상기 RT 도메인의 기원과 상이한, 핵산.
제119항에 있어서, 상기 ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
제121항에 있어서, DNA 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
제121항 또는 제122항에 있어서, 적어도 하나의 포스포로티오에이트 결합을 추가로 포함하는, 합성 올리고뉴클레오티드.
서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 벡터.
본원에 기술된 단백질 중 어느 하나를 암호화하는, 핵산.
본원에 기술된 핵산 중 어느 하나를 포함하는, 숙주 세포.
제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 벡터.
제124항 또는 제127항의 벡터를 포함하는, 숙주 세포.
제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 숙주 세포.
제129항에 있어서, 상기 숙주 세포는 E. coli 세포인, 숙주 세포.
제129항 또는 제130항에 있어서, 상기 E. coli 세포는 λDE3 리소겐이거나 상기 E. coli 세포는 BL21(DE3) 균주인, 숙주 세포.
제130항 또는 제131항에 있어서, 상기 E. coli 세포가 ompT lon 유전자형을 갖는, 숙주 세포.
제129항 내지 제132항 중 어느 한 항에 있어서, 상기 핵산이 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하고, 여기서 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP _BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
제133항에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인을 암호화하는 서열에 프레임 내에 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.
제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.
레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법으로서, 제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지에서 배양하는 단계를 포함하는, 방법.
제136항에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함하는, 방법.
제137항에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.
제138항에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.
제139항에 있어서, 상기 단백질 추출물을 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.
제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항, 또는 제113항 내지 제120항 중 어느 한 항의 핵산 중 어느 하나의 RNA 동족체를 포함하는, 시험관 내에서 전사된 mRNA.