KR20240021218A

KR20240021218A - 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템

Info

Publication number: KR20240021218A
Application number: KR1020247000678A
Authority: KR
Inventors: 안드레 코넨; 플로리안 리흐터; 필립 크니포위센; 안드레아스 니린스; 사스키아 디아나 마르케르트; 크리스티엔 베드나르스키; 쇠렌 투란
Original assignee: 바이엘 악티엔게젤샤프트
Priority date: 2021-06-11
Filing date: 2022-06-09
Publication date: 2024-02-16
Also published as: IL308896A; EP4352214A1; BR112023023768A2; AU2022290382A9; CA3222950A1; WO2022258753A1; AU2022290382A1

Abstract

본원에는 신규 유형 V B-GEn.1 또는 B-GEn.2 뉴클레아제 및 그의 변이체를 사용하여, 세포 또는 무세포 환경에서 DNA를 표적화, 편집 또는 조작하기 위한 신규 시스템 뿐만 아니라 DNA를 조작하기 위한 방법 및 키트가 기재되어 있다. 신규 및 개선된 단일 가이드 RNA가 추가로 개시된다.

Description

신규 유형 V RNA 프로그래밍가능 엔도뉴클레아제 시스템

본 개시내용은 일반적으로 분자 생물학 분야, 특히 유전자 편집을 위한 신규 CRISPR Cas RNA 프로그래밍가능 DNA 엔도뉴클레아제에 관한 것이다.

CRISPR-Cas 또는 CRISPR/Cas 시스템으로서 집합적으로 공지된, 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 CRISPR-연관 (Cas) 유전자는 현재 파지 감염에 대항하여 박테리아 및 고세균에 대한 면역을 제공하는 것으로 이해되고 있다. 원핵 적응 면역의 CRISPR-Cas 시스템은 매우 다양한 단백질 이펙터 비-코딩 요소 군 뿐만 아니라 로커스 아키텍처이며, 이들의 일부 예는 중요한 생명공학 물질을 생산하기 위해 조작 및 적응되었다.

숙주 방어에 관여하는 시스템의 구성요소는 DNA 또는 RNA를 변형시킬 수 있는 하나 이상의 이펙터 단백질, 및 이러한 단백질 활성이 파지 DNA 또는 RNA 상의 특이적 서열을 표적화하는 것을 담당하는 RNA 가이드 요소를 포함한다. RNA 가이드는 CRISPR RNA (crRNA)로 구성되며 이펙터 단백질(들)에 의한 표적화된 핵산 조작을 가능하게 하기 위해 부가의 트랜스-작용 RNA (tracrRNA)를 필요로 할 수 있다. crRNA는 crRNA와 이펙터 단백질의 결합을 담당하는 "직접 반복부"라는 세그먼트, 및 원하는 핵산 표적 서열에 상보적인 "스페이서 서열"이라는 세그먼트로 이루어진다. CRISPR 시스템은 crRNA의 스페이서 서열을 변형시킴으로써 대체 DNA 또는 RNA 표적을 표적화하도록 재프로그래밍될 수 있다.

CRISPR-Cas 시스템은 크게 2가지 클래스로 분류될 수 있다: 클래스 1 시스템은 crRNA 주위에 복합체를 함께 형성하는 다수의 이펙터 단백질로 구성되고, 클래스 2 시스템은 DNA 또는 RNA 기질을 표적화하기 위해 crRNA 가이드와 복합체를 이루는 단일 이펙터 단백질로 이루어진다. 클래스 2 시스템의 단일-서브유닛 이펙터 조성물은 조작 및 적용을 위한 간단한 구성요소 세트를 제공하므로 지금까지 프로그래밍가능 이펙터의 중요한 공급원이었다. 따라서, 신규 클래스 2 시스템의 발견, 조작 및 최적화는 게놈 조작 및 그 이상을 위한 광범위하고 강력한 프로그래밍가능 기술로 이어질 수 있다. CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)-Cas (CRISPR 연관 단백질)의 RNA-가이드된 DNA 표적화 원리를 사용하여 게놈을 편집하는 것이 지난 몇 년 동안 널리 활용되어 왔다. CRISPR-Cas 시스템의 5가지 유형 (유형 I, 유형 II 및 IIb, 유형 III, 유형 V 및 유형 VI)이 보고되었다. 게놈 편집을 위한 CRISPR-Cas의 대부분의 사용은 유형 II 시스템에서 이루어졌다. 박테리아 유형 II CRISPR-Cas 시스템에 의해 제공되는 주요 이점은 프로그래밍가능 DNA 간섭에 대한 최소한의 요구 사항: 맞춤형 이중-RNA 구조에 의해 가이드되는 엔도뉴클레아제 Cas9에 있다. 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)의 원래 유형 II 시스템에서 처음 입증된 바와 같이, 트랜스-활성화 CRISPR RNA (tracrRNA)는 전구체 CRISPR RNA (프리-crRNA)의 불변 반복부와 결합하여, Cas9의 존재 하에 RNase III에 의한 crRNA 공동 성숙과 Cas9에 의한 침입 DNA 절단 둘 다에 필수적인 이중-RNA를 형성한다. 스트렙토코쿠스 피오게네스에서 입증된 바와 같이, 성숙한 활성화 tracrRNA와 표적화 crRNA 간에 형성된 이중나선에 의해 가이드되는 Cas9는, 침입 동족 DNA에 부위-특이적 이중 가닥 DNA (dsDNA) 파손부를 도입한다. Cas9는 HNH 뉴클레아제 도메인을 사용하여 표적 가닥 (crRNA의 스페이서 서열에 상보적인 것으로서 정의됨)을 절단하고 RuvC-유사 도메인을 사용하여 비-표적 가닥을 절단하는 다중 도메인 효소이다.

유형 II CRISPR Cas 9 뉴클레아제 외에도, 수많은 상이한 유형 V CRISPR Cas 뉴클레아제, 예컨대 Cas12a, Cas12b, Cas12e, Cas12f, Cas13a, Cas13b가 보고되었다 (Koonin et al., Curr Opin Microbiol. 2017 Jun; 37: 67-78, 및 Makarova et al., Nat Rev Microbiol. 2020 Feb;18(2):67-83). 이러한 시스템 중 일부는 tracr RNA (Cas 12a, Cas 13a, cas 13b)를 필요로 하지 않는 반면, Cas 12b는 전형적으로 tracr RNA를 필요로 한다 (Koonin et al., Curr Opin Microbiol. 2017 Jun; 37: 67-78).

포유동물 세포에서의 게놈 편집은 부분적으로, 다양한 Cas9 단백질의 크기로 인해 제한되었다. 현재까지 가장 널리 사용되고 있는 효소인 스타필로코쿠스 피오게네스(Staphylococcus pyogenes)로부터의 Cas9 (SpyCas9)는 대략 4.2 kb의 DNA를 포함하며 (W02013/176722), 동족 단일 가이드 RNA (sgRNA)와 직접 조합하면 크기가 더욱 증가한다. 아데노-연관 바이러스는 유전자 요법 적용에서 Cas9 효소의 전달에 사용되는 벡터 중 하나이다. 그러나, AAV 카고 크기는 약 4.5 kb로 제한된다. 이러한 크기 제약으로 인해, sgRNA 및 잠재적인 DNA 복구 템플릿과 함께 Cas9를 전달하는 것은, 이러한 방법을 사용하는데 장애가 될 수 있다. 더 작은 Cas9 분자가 명확히 규명되었지만, 이들 대부분은 SpyCas9에 의해 사용된 것만큼 널리 규정되지 않은 프로토스페이서 인접 모티프 (PAM) 서열로 인해 어려움을 겪고 있다. 예를 들어, 스타필로코쿠스 아우레우스(Staphylococcus aureus) (SauCas9)는 "NNGRR(T)" 서열 (여기서, R = A 또는 G)을 사용하며, 캄필로박터 제주니(Campylobacter jejuni) (CjCas9)는 "NNNACAC"/"NNNRYAC" PAM (여기서 Y = T 또는 G)을 사용한다. PAM 모호성은 PAM에 대해 높거나 완벽한 서열 동일성을 지닌 오프-타겟 서열에서 효소의 바람직하지 않은 활성 가능성을 증가시킨다. 우연히 유사한 부위를 표적화하는 것 ("오프-타겟")이 유해 사건의 가능성을 증가시키기 때문에, 이들 시스템의 특이성은 여전히 우려 사항으로 남아 있다.

기존의 CRISPR-Cas 시스템은 일반적으로 하기와 같은 단점 중 하나 이상을 갖는다:

a) 이들의 크기가 너무 커서 아데노 연관 바이러스 (AAV)와 같이 확립된 치료상 적합한 바이러스 전달 시스템의 게놈 내부로 운반될 수 없음.

b) 이들 중 다수는 비-숙주 환경, 예를 들어 진핵 세포, 특히 포유동물 세포에서는 실질적으로 활성이 없음.

c) 이들의 뉴클레아제는 스페이서와 프로토스페이서 서열 간의 미스매치가 존재할 때 DNA 가닥 절단을 촉매할 수 있으며, 이는 예를 들어 유전자 치료 용도 또는 높은 정밀도를 필요로 하는 기타 적용 분야에 부적합하게 만드는 바람직하지 않은 오프 타겟 효과를 초래할 수 있음.

d) 이들은 포유동물에서의 생체 내 적용에 대한 사용을 제한할 수 있는 면역 반응을 촉발시킬 수 있음.

e) 이들은 DNA 표적화 세그먼트에 대한 표적 선택을 제한하는 복잡하고/거나 긴 PAM을 필요로 함.

f) 이들은 플라스미드 또는 바이러스 벡터로부터의 불량한 발현을 나타냄.

g) 이들은 활성이 되려면 부가의 RNA 서열을 필요로 하거나 또는 가이드 RNA의 일부로서 부가의 RNA 서열을 필요로 함.

본 발명은 B-GEn.1 (서열식별번호(SEQ ID NO): 1), B-Gen1.2 (서열식별번호: 39) 및 B-GEn.2 (서열식별번호: 2), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 또는 39 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산을 포함하는, B-GEn으로 명명된 신규 유형 V CRISPR Cas 뉴클레아제에 관한 것이다.

대안적으로, 본 발명은 B-GEn.1 (서열식별번호: 1) 및 B-GEn.2 (서열식별번호: 2), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산을 포함하는, B-GEn으로 명명된 신규 유형 V CRISPR Cas 뉴클레아제에 관한 것이다.

이는 추가로, B-GEn.1 또는 B-GEn.2, 서열식별번호: 3 및 서열식별번호: 4에 포함된 서열을 포함하는 적합한 가이드 RNA (특히 서열식별번호: 40-44에 따름), 및 표적 DNA를 포함하는 CRISPR Cas 시스템에 관한 것이다.

대안적인 실시양태에서, 임의의 B-Gen1.2 (서열식별번호: 39)는 B-GEn.1 (서열식별번호: 1)에 대한 본원의 임의의 실시양태에 따른 적합하고 기능적으로 동일한 대체물이다.

한 측면에서, 본원에는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 이러한 방법은 (I) 본원에 개시된 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 본원에 개시된 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및 (II) 하나 이상의 이종 단일 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)를 코딩하는 DNA(들)를 세포 내로 또는 시험관 내 환경 내로 도입하는 단계로서, 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 (a) RNA를 포함하고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) RNA로 구성된 tracr 메이트 서열, 및 (c) RNA로 구성된 tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열되는 것인 단계; 및 (III) 표적 DNA에 하나 이상의 닉 또는 커트 또는 염기 편집을 생성하는 단계로서, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 sgRNA에 의해 표적 DNA로 지시되는 것인 단계를 포함한다.

한 측면에서, 본원에는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도가 본원에 제공된다: (I) 본원에 개시된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그를 코딩하는 핵산; 및/또는 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 (a) RNA로 구성되고 폴리뉴클레오티드 로커스 내의 이러한 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) RNA로 구성된 tracr 메이트 서열, 및 (c) RNA로 구성된 tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (c), (b) 및 (a)는 각각 5'에서 3' 배향으로 배열됨.

또 다른 측면에서, 본원에는 하기를 포함하는 세포가 제공된다: (I) 본원에 개시된 바와 같은 B-GEn.1 또는 B-GEn.2 폴리펩티드, 또는 본원에 개시된 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산; 및 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 (a) 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) tracr 메이트 서열, 및 (c) tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (c), (b) 및 (a)는 각각 5'에서 3' 배향으로 배열됨.

또 다른 측면에서, 본원에는 하기를 포함하는 키트가 제공된다: (I) 본원에 개시된 바와 같은 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산 서열, 여기서 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열은 프로모터에 작동가능하게 연결됨; 및 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 각각의 sgRNA는 (a) 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) tracr 메이트 서열, 및 (c) tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b), 및 (c)는 5'에서 3' 배향으로 배열됨.

또 다른 측면에서, 5개의 합성적으로 유래되고 최적화된 sgRNA (서열식별번호: 40-44) 서열이 또한 본원에 개시된다. 이들 서열은 서열 특이적 가이드를 제공하는 3' 단부 상의 약 20개 뉴클레오티드의 서열 특이적 연장물을 필요로 한다.

낮은 활성 표적에 대한 B-GEn.1 (서열식별번호: 1) 및 잠재적으로 다른 유형 V CRISPR Cas 뉴클레아제의 활성을 개선시키고 향후 치료 프로그램에 대한 RNA 합성 부담을 감소시키기 위해, 단축되고 돌연변이된 sgRNA가 설계되었다. 서열식별번호: 40-44에 따른 sgRNA는 특히 편집이 어렵고 상당히 감소된 길이 (20개의 뉴클레오티드 가이드 서열로 표시됨)를 갖는 표적에 대해 개선된 활성을 나타낸다:

1. 서열식별번호: 40: B-GEn.1_sgRNA4, 117개 뉴클레오티드

2. 서열식별번호: 41: B-GEn.1_sgRNA4.2, 107개 뉴클레오티드

3. 서열식별번호: 42: B-GEn.1_sgRNA4.3, 107개 뉴클레오티드

4. 서열식별번호: 43: B-GEn.1_sgRNA4.4, 107개 뉴클레오티드

5. 서열식별번호: 44: B-GEn.1_sgRNA4.5, 106개 뉴클레오티드.

또 다른 측면에서 본 발명은 하기의 조합에 관한 것이다:

a) B-GEn.1 (서열식별번호: 1) 또는 B-GEn.1.2 (서열식별번호: 39), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산, 및

b) 서열식별번호: 40, 41, 42, 43 및 45로부터 선택된 서열을 포함하는 sgRNA.

전형적으로, 이러한 sgRNA 서열은 그의 3' 단부 상에 표적 특이적 서열을 함유하며, 전형적으로 약 20개의 뉴클레오티드의 길이를 갖는다.

sgRNA는 다른 유형 V CRSIPR Cas 뉴클레아제에도 사용될 수 있다.

본원에 언급된 각각의 특허 문서 및 과학 논문, 및 그에 의해 인용된 특허 문서 및 과학 논문의 전체 개시내용은 모든 목적을 위해 본원에 참조로 명시적으로 포함된다.

본 발명의 부가의 특색 및 이점은 하기에 보다 특정하게 기재된다.

도 1은 CRISPR Cas 엔도뉴클레아제로서 B-GEn 폴리펩티드의 활성을 시험하는데 사용된 검정 뿐만 아니라 스크리닝 검정을 예시한다.
도 2는 실험 3의 결과를 나타낸다.
하기 sgRNA 서열: v1 서열식별번호: 3; v4 서열식별번호: 40; v4.2 서열식별번호: 41; v4.3 서열식별번호: 42; v4.4 서열식별번호: 43; v4.5 서열식별번호: 44이 사용되었고, v4.6, v5, v5.2, v5.3, v5.4, v5.5, v5.6은 보다 적은 활성 또는 비-활성 서열이다.
모든 sgRNA는 그의 3' 단부 상에 실시예 3에 따른 23개의 뉴클레오티드 긴 TCRA 서열 특이적 영역을 포함한다. TCRA 가이드 1의 경우 솔리드 바이고 TCRA 가이드 2의 경우 해치 바이다.

서열 목록에 대한 참조

본원에 개시된 서열은 BHC211037-FC_Sequence_Listing.xml로 명명된 서열 목록에 함유되어 있다. 서열식별번호: 1 (B-GEn.1 단백질) 및 서열식별번호: 2 (B-GEn.2 단백질)의 서열이 또한 인쇄되어 있다.

서열 목록에 나타나는 서열의 요약

발명의 상세한 설명

본 출원은 신규 CRISPR-Cas 뉴클레아제 및 이러한 뉴클레아제에 기반한 유전자 편집 시스템을 제공한다. 신규 뉴클레아제는 본원에서 B-GEn 뉴클레아제 또는 B-GEn.1 또는 B-GEn.2 뉴클레아제로서 지칭된다.

일반적으로, B-GEn 뉴클레아제 군은 표 1에 기재되는 하기 구성원을 포함한다:

본 발명에 따른 한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 80% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 하나의 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 85% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 하나의 보다 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 90% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 하나의 보다 더 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 95% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 하나의 특히 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 99% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 하나의 매우 특히 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 99.5% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.

본 발명에 따른 또 다른 실시양태는 B-GEn.1 또는 B-GEn.2의 하기 변이체이다:

(I) 전체 길이에 걸쳐 서열식별번호: 1 또는 2 중 임의의 것에 따른 서열과 적어도 80%, 예를 들어, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 99.5%의 아미노산 동일성에 대한 선호도가 증가하는 순서의 변이체;

(II) 무세포 반응에서 또는 원핵 세포에서 뿐만 아니라 식물 또는 동물과 같은 살아있는 유기체를 포함한 진핵 세포 환경에서도 B-GEn.1 또는 B-GEn.2 CRISPR 시스템의 적절한 활성을 수득하기 위해, 예를 들어 핵 국재화 신호로서 부가의 구성요소를 함유하는 (I)에 따른 변이체;

(III) B-GEn.1 또는 B-GEn.2 및 (I) 및 (II)에 따른 변이체를 코딩하는 상응하는 폴리뉴클레오티드 서열의 코돈 최적화된 변이체.

달리 명시되지 않는 한, 용어 B-GEn 및 B-GEn.1 또는 B-GEn.2는 (I), (II), (III) 하에 명시된 모든 변이체를 포함한다.

본 발명에 따른 또 다른 대안적 실시양태는 하기 아미노산 교환물: L235Q, K673R, D1036E을 갖는 B-GEn.1의 하기 변이체를 단독으로, 2가지의 조합으로, 또는 바람직하게 3가지 모두의 조합으로 사용한 것, 특히 서열식별번호: 39에 따른 B-GEn.1의 변이체이다:

(I) 전체 길이에 걸쳐 서열식별번호: 1 또는 39 중 임의의 것에 따른 서열과 적어도 80%, 예를 들어, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 99.5%의 아미노산 동일성에 대한 선호도가 증가하는 순서의 변이체;

(II) 무세포 반응에서 또는 원핵 세포에서 뿐만 아니라 식물 또는 동물과 같은 살아있는 유기체를 포함한 진핵 세포 환경에서도 B-GEn.1 또는 B-GEn.1.2 CRISPR 시스템의 적절한 활성을 수득하기 위해, 예를 들어 핵 국재화 신호로서 부가의 구성요소를 함유하는 (I)에 따른 변이체;

(III) B-GEn.1 또는 B-GEn.1.2 및 (I) 및 (II)에 따른 변이체를 코딩하는 상응하는 폴리뉴클레오티드 서열의 코돈 최적화된 변이체.

B- GEn .1 또는 B- GEn .2를 기반으로 하는 CRISPR-Cas 시스템

본 발명에 따른 한 실시양태는 하기를 포함하는 조성물을 나타낸다:

(a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 이러한 B-GEn.1 또는 B-GEn.2를 코딩하는 폴리뉴클레오티드;

(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성을 허용하는 DNA:

i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,

ii. RNA로 구성된 tracr 메이트 서열, 및

iii. RNA로 구성된 tracr RNA 서열,

여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨.

sgRNA 내에서 tracr 메이트 서열 및 tracr 서열은 일반적으로, 적합한 루프 서열에 의해 연결되어 스템-루프 구조를 형성한다.

B- GEn .1 또는 B- GEn .2를 포함하는 CRISPR - Cas 시스템의 사용에 적합한 PAM 서열

B-GEn.1 및 B-GEn.2의 기능은 표적 서열 상에 적합한 프로토스페이서 인접 모티프 ("PAM") 서열을 필요로 한다.

적합한 PAM 서열은 표 2에 열거되어 있으며, 여기서 조작된 DNA 표적화 세그먼트는 그의 3' 단부 상에서 표적화된 DNA 세그먼트 상의 PAM 서열에 직접적으로 인접하거나, 또는 이러한 PAM 서열은 5' 부분에서 표적화된 DNA 서열의 일부이다.

표 2: 상응하는 B- GEn .1 또는 B- GEn .2 엔도뉴클레아제에 적합한 PAM 서열

CRISPR Cas 시스템에서 B- GEn .1 또는 B- GEn .2를 사용하는데 적합한 tracr 서열

CRISPR Cas 시스템에서 B-GEn.1 또는 B-GEn.2를 사용하는데 적합한 tracr 서열은 표 3에 열거되어 있다. 대안적으로, 이들 서열의 변이체가 이용될 수 있다. 변이체는 그러한 서열의 일부 또는 말단절단된 버전 및/또는 이들 서열의 하나 이상의 위치에 염기 변형이 있는 서열을 포함할 수 있다. 각각의 DNA 서열은 서열식별번호: 5 및 6에 각각 개시되어 있다.

표 3

일부 실시양태에서, B-GEn.1 또는 B-GEn.2를 코딩하는 폴리뉴클레오티드 및 sgRNA는 세포 내 또는 시험관 내 환경에서의 발현을 위한 적합한 프로모터 및/또는 적합한 핵 국재화 신호를 함유한다.

본 발명에 따른 또 다른 실시양태는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법을 나타내며, 이러한 방법은 하기 단계를 포함한다:

(a) 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 이러한 단백질을 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및

(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA를 도입하는 단계로서:

ii. RNA로 구성된 tracr 메이트 서열, 및

iii. RNA로 구성된 tracr RNA 서열,

여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열되는 것인 단계;

(c) 표적 DNA에 하나 이상의 커트, 닉 또는 편집을 생성하는 단계로서, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 gRNA에 의해 표적 DNA로 지시되는 것인 단계.

본 발명에 따른 또 다른 실시양태는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도이다:

(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA:

ii. RNA로 구성된 tracr 메이트 서열, 및

iii. RNA로 구성된 tracr RNA 서열,

본 발명에 따른 또 다른 실시양태는 하기를 포함하는 생체 외 또는 시험관 내 세포:

(a) 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그를 코딩하는 핵산;

ii. RNA로 구성된 tracr 메이트 서열, 및

iii. RNA로 구성된 tracr RNA 서열,

여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨;

또는 상기 (a) 및 (b)를 사용하여 게놈이 표적화, 편집, 변형 또는 조작된 상기 세포이다.

본 발명에 따른 부가의 실시양태는 하기를 포함하는 키트이다:

(a) B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열, 여기서 프로모터 또는 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열은 리보솜 결합 부위에 작동가능하게 연결됨;

ii. RNA로 구성된 tracr 메이트 서열, 및

iii. RNA로 구성된 tracr RNA 서열,

여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨, 또는

(a) B-GEn.1 또는 B-GEn.2 단백질;

(b) 하나 이상의 단일 이종 가이드 RNA (sgRNA), 이들 각각은 하기를 포함하며:

iv. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,

v. RNA로 구성된 tracr 메이트 서열, 및

vi. RNA로 구성된 tracr RNA 서열,

본 발명에 따른 또 다른 실시양태는 하기를 포함하는, 세포 내 또는 시험관 내 하나 이상의 위치에서 하나 이상의 표적 DNA(들)를 표적화, 편집, 변형 또는 조작하기 위한 조성물 및 방법을 포함한다:

(a) B-GEn.1 또는 B-GEn.2;

(b) 하기를 포함하는, 가이드 RNA (gRNA) 또는 이러한 gRNA의 계내 생성에 적합한 DNA:

ii. RNA로 구성된 tracr RNA 서열,

여기서 (i) 및 (ii)는 하나의 단일 RNA 분자이고 (iii)은 별도의 RNA 분자 상에 있음.

다중화

또 다른 측면에서, 본원에는 세포 내 다수 위치에서 DNA를 편집하거나 변형시키는 방법이 제공되며, 이러한 방법은 본질적으로 i) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산을 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나의 프로모터의 제어 하에 있는 2개 이상의 프리-CRISPR RNA (프리-crRNA)를 포함하는 단일 이종 핵산을 세포 내로 도입하는 단계로서, 각각의 프리-crRNA는 반복부-스페이서 어레이 또는 반복부-스페이서를 포함하며, 여기서 스페이서는 DNA 내의 표적 서열에 상보적인 핵산 서열을 포함하고 반복부는 스템-루프 구조를 포함하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 스템-루프 구조의 상류에 있는 2개 이상의 프리-crRNA를 절단하여 2개 이상의 중간 crRNA를 생성하며, 여기서 2개 이상의 중간 crRNA는 2개 이상의 성숙한 crRNA로 프로세싱되고, 각각의 2개 이상의 성숙한 crRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 가이드하여 2개 이상의 이중 가닥 파손부 (DSB)를 DNA에 발생시키는 단계로 이루어진다. 예를 들어, B-GEn.1 또는 B-GEn.2의 하나의 이점은 여러 개의 반복부-스페이서 단위를 포함하는 단지 하나의 프리-crRNA를 도입하는 것이 가능하다는 것이며, 이는 도입 시 B-GEn.1 또는 B-GEn.2에 의해 DNA 상의 여러 상이한 서열을 표적화하는 활성 반복부-스페이서 단위로 프로세싱된다.

또 다른 측면에서, 본원에는 본질적으로 하기 단계로 이루어진, 세포 내 다수 위치에서 DNA를 편집하거나 변형시키는 방법이 제공된다: i) 감소된 엔도리보뉴클레아제 활성을 갖는 B-GEn.1 또는 B-GEn.2 형태를, 폴리펩티드로서 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산으로서 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나 이상의 프로모터의 제어 하에 있는 2개 이상의 프리-CRISPR RNA (프리-crRNA), 중간 crRNA 또는 성숙한 crRNA를 포함하는 단일 이종 핵산을 도입하는 단계로서, 각각의 crRNA는 반복부-스페이서 어레이를 포함하며, 여기서 스페이서는 DNA 내의 표적 서열에 상보적인 핵산 서열을 포함하고 반복부는 스템-루프 구조를 포함하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 단일 이종 핵산 내의 하나 이상의 스페이서 서열에 의해 지시된 바와 같이 엔도리보뉴클레아제 활성이 감소되거나 부재하고 무손상 엔도뉴클레아제 활성을 갖는 단일 이종 RNA의 하나 이상의 영역과 결합하는 것인 단계.

일부 실시양태에서 단일 이종 핵산 내의 프리-crRNA 서열은 상이한 crRNA 서열에 의해 명시된 각각의 부위에서 B-GEn.1 또는 B-GEn.2의 엔도뉴클레아제 활성을 지시하거나 차별적으로 조정하기 위해 특이적 위치, 배향, 서열 또는 특이적 화학적 연결로 함께 연결된다.

또 다른 측면에서, 본원에는 본질적으로 하기 단계로 이루어진, 세포 내 다수 위치에서 DNA의 구조 또는 기능을 편집하거나 변형시키기 위한 일반적인 방법의 예가 제공된다: i) RNA-가이드된 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를, 폴리펩티드로서 또는 RNA-가이드된 엔도뉴클레아제를 코딩하는 핵산으로서 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나 이상의 프로모터의 제어 하에 있는 2개 이상의 가이드 RNA를 포함하거나 그를 코딩하는 단일 이종 핵산을 도입하는 단계로서, 여기서 RNA-가이드된 엔도뉴클레아제의 활성 또는 기능은 단일 이종 핵산 내의 가이드 RNA 서열에 의해 지시되는 것인 단계.

정의

본원에서 상호교환가능하게 사용되는 용어 "폴리뉴클레오티드", "핵산" 및 "핵산"은 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 중 임의의 길이의 뉴클레오티드의 중합체성 형태를 지칭한다. 따라서, 이러한 용어는 단일 가닥, 이중 가닥 또는 다중 가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드/삼중 나선, 또는 퓨린 및 피리미딘 염기 또는 기타 자연, 화학적으로 또는 생화학적으로 변형된, 비-자연 또는 유도체화된 뉴클레오티드 염기를 포함한 중합체를 포함하나 이에 제한되지는 않는다.

"올리고뉴클레오티드"는 일반적으로, 단일 가닥 또는 이중 가닥 DNA의 약 5개 내지 약 100개 뉴클레오티드의 폴리뉴클레오티드를 지칭한다. 그러나, 본 개시내용의 목적상, 올리고뉴클레오티드의 길이에 대한 상한은 없다. 올리고뉴클레오티드는 "올리고머" 또는 "올리고"로서 공지되기도 하며, 유전자로부터 단리되거나, 또는 관련 기술분야에 공지된 방법에 의해 화학적으로 합성될 수 있다. 용어 "폴리뉴클레오티드" 및 "핵산"은 기재된 실시양태에 적용가능한 경우, 단일 가닥 (예컨대 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오티드를 포함하는 것으로 이해되어야 한다.

"게놈 DNA"는 박테리움, 진균, 고세균, 원생생물, 바이러스, 식물 또는 동물의 게놈 DNA를 포함하나 이에 제한되지는 않는 유기체의 게놈 DNA를 지칭한다.

용어 DNA를 "조작하는 것"은 DNA의 결합, 한 가닥의 닉킹, 또는 절단, 예를 들어 DNA의 두 가닥 모두의 커팅을 포괄하거나; DNA 또는 이러한 DNA와 연관된 폴리펩티드를 변형 또는 편집하는 것을 포괄한다. DNA를 조작하면 RNA 또는 DNA에 의해 코딩된 폴리펩티드의 발현이 침묵, 활성화 또는 조정 (증가 또는 감소)되거나, 또는 DNA에 대한 폴리펩티드의 결합이 방지되거나 향상될 수 있다.

"스템-루프 구조"는 주로 단일 가닥 뉴클레오티드 (루프 부분) 영역에 의해 한쪽이 연결되는 이중 가닥 (줄기 부분)을 형성하는 것으로 공지되어 있거나 예측되는 뉴클레오티드 영역을 포함하는 2차 구조를 갖는 핵산을 지칭한다. 용어 "헤어핀" 및 "폴드-백" 구조는 또한 스템-루프 구조를 지칭하기 위해 본원에서 사용된다. 이러한 구조는 관련 기술분야에 널리 공지되어 있으며 이러한 용어는 관련 기술분야에서 공지된 의미와 일치하게 사용된다. 관련 기술분야에 공지된 바와 같이, 스템-루프 구조는 정확한 염기쌍 형성을 필요로 하지 않는다. 따라서, 스템은 하나 이상의 염기 미스매치를 포함할 수 있다. 대안적으로, 염기쌍 형성은 정확할 수 있으며, 예를 들어 어떠한 미스매치도 포함하지 않을 수 있다.

"혼성화가능한" 또는 "상보적인" 또는 "실질적으로 상보적인"이란 핵산 (예를 들어, RNA 또는 DNA)이 비-공유적으로 결합할 수 있게 하는, 예를 들어 왓슨-크릭(Watson-Crick) 염기쌍 및/또는 G/U 염기쌍을 형성할 수 있게 하거나, 온도 및 용액 이온 강도의 적절한 시험관 내 및/또는 생체 내 조건 하에서 서열-특이적, 역평행 방식 (예를 들어, 핵산이 상보적인 핵산과 특이적으로 결합함)으로 또 다른 핵산에 "어닐링" 또는 "혼성화"할 수 있게 하는 뉴클레오티드 서열을 포함하는 것을 의미한다. 관련 기술분야에 공지된 바와 같이, 표준 왓슨-크릭 염기쌍 형성은 아데닌 (A)과 티미딘 (T)의 쌍 형성, 아데닌 (A)과 우라실 (U)의 쌍 형성, 및 구아닌 (G)과 시토신 (C)의 쌍 형성을 포함한다 [DNA, RNA]. 또한, 2개의 RNA 분자 (예를 들어, dsRNA) 간의 혼성화를 위해, 구아닌 (G)이 우라실 (U)과 염기 쌍을 형성하는 것이 또한 관련 기술분야에 공지되어 있다. 예를 들어, G/U 염기쌍 형성은 mRNA 내의 코돈과 tRNA 안티코돈 염기쌍 형성의 맥락에서 유전적 코드의 축퇴 (예를 들어, 중복성)에 부분적으로 책임이 있다. 본 개시내용의 맥락에서, 가이드 RNA 분자의 단백질-결합 세그먼트 (dsRNA 이중나선)의 구아닌 (G)은 우라실 (U)에 상보적인 것으로 간주되며, 그 반대도 마찬가지이다. 따라서, G/U 염기쌍이 가이드 RNA 분자의 단백질-결합 세그먼트 (dsRNA 이중나선)의 주어진 뉴클레오티드 위치에서 만들어질 수 있는 경우, 그 위치는 비-상보적인 것으로 간주되지 않고, 대신 상보적인 것으로 간주된다.

혼성화 및 세척 조건은 널리 공지되어 있고 문헌 [Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), particularly Chapter 11 and Table 11.1 therein; 및 Sambrook, J. and Russell, W., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (2001)]에 예시되어 있다. 온도와 이온 강도의 조건이 혼성화의 "엄격도"를 결정한다.

혼성화는 두 핵산이 상보적인 서열을 함유하는 것으로 필요로 하지만, 염기 간의 미스매치도 가능하다. 두 핵산 간의 혼성화에 적절한 조건은 관련 기술분야에 널리 공지된 변수인 핵산의 길이와 상보성 정도에 따라 달라진다. 2개의 뉴클레오티드 서열 간의 상보성 정도가 더 클수록, 이들 서열을 갖는 핵산의 하이브리드에 대한 용융 온도 (Tm)의 값은 더 커진다. 짧은 상보성 연장물 (예를 들어, 35개 이하, 30개 이하, 25개 이하, 22개 이하, 20개 이하 또는 18개 이하의 뉴클레오티드에 대한 상보성)을 갖는 핵산 간의 혼성화의 경우에는, 미스매치 위치가 중요해진다 (상기 문헌 [Sambrook et al., 11.7-11.8] 참조). 일반적으로, 혼성화가능한 핵산에 대한 길이는 적어도 10개의 뉴클레오티드이다. 혼성화가능한 핵산에 대한 예시적인 최소 길이는 적어도 15개의 뉴클레오티드; 적어도 20개의 뉴클레오티드; 적어도 22개의 뉴클레오티드; 적어도 25개의 뉴클레오티드; 및 적어도 30개의 뉴클레오티드이다. 더욱이, 통상의 기술자는 온도 및 세척 용액 염 농도가 상보성 영역의 길이 및 상보성 정도와 같은 요인에 따라 필요에 따라 조정될 수 있음을 인식할 것이다.

폴리뉴클레오티드의 서열은 특이적으로 혼성화되기 위해 그의 표적 핵산의 서열과 100% 상보적일 필요는 없는 것으로 관련 기술분야에서 이해된다. 더욱이, 폴리뉴클레오티드는 개재 또는 인접 세그먼트가 혼성화 사건에 관여하지 않도록 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있다 (예를 들어, 루프 구조 또는 헤어핀 구조). 폴리뉴클레오티드는 그들이 표적화하는 표적 핵산 서열 내의 표적 영역과 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100%의 서열 상보성을 포함할 수 있다. 예를 들어, 안티센스 화합물의 20개 뉴클레오티드 중 18개가 표적 영역에 상보적이므로, 특이적으로 혼성화하는 안티센스 핵산은 90 퍼센트 상보성을 나타낼 것이다. 이러한 예에서, 나머지 비-상보적 뉴클레오티드는 상보적 뉴클레오티드와 클러스터링되거나 산재될 수 있으며 서로 또는 상보적 뉴클레오티드에 인접할 필요는 없다. 핵산 내의 특정한 핵산 서열 연장물 간의 상보성 퍼센트는 문헌 [Smith and Waterman (Adv. Appl. Math. 1981(2) 482-489)]의 알고리즘을 사용하는 디폴트 설정을 사용하여, 관련 기술분야에 공지된 BLAST 프로그램 (기본 국소 정렬 검색 도구) 및 PowerBLAST 프로그램 (문헌 [Altschul et al., J. Mol. Biol. 1990,215, 403-410; Zhang and Madden, Genome Res., 1997,7, 649-656]) 또는 Gap 프로그램 (Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)을 사용하여 일상적으로 결정될 수 있다.

용어 "펩티드", "폴리펩티드" 및 "단백질"은 본원에서 상호교환가능하게 사용되며, 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩티드 백본을 갖는 폴리펩티드를 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 지칭한다.

본원에 사용된 바와 같은 "결합" (예를 들어, 폴리펩티드의 RNA-결합 도메인과 관련하여)은 거대분자 간 (예를 들어, 단백질과 핵산 간)의 비-공유 상호작용을 지칭한다. 비-공유 상호작용 상태에 있는 동안, 거대분자는 "회합된" 또는 "상호작용하는" 또는 "결합하는" 것이라고 한다 (예를 들어, 분자 X가 분자 Y와 상호작용한다고 하는 경우, 이는 분자 X가 비-공유 방식으로 분자 Y와 결합한다는 것을 의미함). 결합 상호작용의 모든 구성요소가 서열-특이적일 필요는 없지만 (예를 들어, DNA 백본 내의 포스페이트 잔기와의 접촉), 결합 상호작용의 일부 부분은 서열-특이적일 수 있다. 결합 상호작용은 일반적으로 10^-6 M 미만, 10^-7 M 미만, 10^-8 M 미만, 10^-9 M 미만, 10^-10 M 미만, 10^-11 M 미만, 10^-12 M 미만, 10^-13 M 미만, 10^-14 M 미만 또는 10^-15 M 미만의 해리 상수 (Kd)를 특징으로 한다. "친화도"는 결합 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 Kd와 상관관계가 있다.

"결합 도메인"은 또 다른 분자와 비-공유적으로 결합할 수 있는 단백질 도메인을 의미한다. 결합 도메인은, 예를 들어 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)와 결합할 수 있다. 단백질 도메인-결합 단백질의 경우, 이는 그 자체와 결합할 수 있고/거나 (동종-이량체, 동종-삼량체 등을 형성) 상이한 단백질 또는 단백질들의 하나 이상의 분자와 결합할 수 있다.

용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질 내 상호교환가능성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 군은 글리신, 알라닌, 발린, 류신 및 이소류신으로 이루어지고; 지방족-히드록실 측쇄를 갖는 아미노산 군은 세린 및 트레오닌으로 이루어지고; 아미드 함유 측쇄를 갖는 아미노산 군은 아스파라긴 및 글루타민으로 이루어지고; 방향족 측쇄를 갖는 아미노산 군은 페닐알라닌, 티로신 및 트립토판으로 이루어지고; 염기성 측쇄를 갖는 아미노산 군은 리신, 아르기닌 및 히스티딘으로 이루어지고; 산성 측쇄를 갖는 아미노산 군은 글루타메이트 및 아스파르테이트로 이루어지고; 황 함유 측쇄를 갖는 아미노산 군은 시스테인 및 메티오닌으로 이루어진다. 예시적인 보존적 아미노산 치환 군은 발린-류신-이소류신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다.

폴리뉴클레오티드 또는 폴리펩티드는 또 다른 폴리뉴클레오티드 또는 폴리펩티드과 특정 퍼센트의 "서열 동일성"을 가지며, 이는 정렬된 경우, 두 서열을 비교할 때 염기 또는 아미노산의 백분율이 동일하고 동일한 상대 위치에 있음을 의미한다. 서열 동일성은 수많은 상이한 방식으로 결정될 수 있다. 서열 동일성을 결정하기 위해, ncbi.nlm.nili.gov/BLAST, ebi.ac.uk/Tools/msa/tcoffee, ebi.Ac.Uk/Tools/msa/muscle, mafft.cbrc/alignment/software를 포함한 월드와이드 웹 사이트에서 이용가능한 다양한 방법 및 컴퓨터 프로그램 (예를 들어, BLAST, T-COFFEE, MUSCLE, MAFFT 등)을 사용하여 서열을 정렬할 수 있다. 예를 들어, 문헌 [Altschul et al. (1990), J. Mol. Biol. 215:403-10]을 참조한다. 본 개시내용의 일부 실시양태에서, 관련 기술분야에서의 서열 정렬 표준은 또 다른 Cas9 엔도뉴클레아제 내의 아미노산 잔기에 "상응하는" B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 내의 아미노산 잔기를 결정하기 위해 본 개시내용에 따라 사용된다. 다른 Cas9 엔도뉴클레아제의 아미노산 잔기에 상응하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 아미노산 잔기는 서열 정렬에서 동일한 위치에 나타난다.

특정한 RNA를 "코딩하는" DNA 서열은 RNA로 전사되는 DNA 핵산 서열이다. 폴리데옥시리보뉴클레오티드는 단백질로 번역되는 RNA (mRNA)를 코딩할 수 있거나, 폴리데옥시리보뉴클레오티드는 단백질로 번역되지 않는 RNA (예를 들어, tRNA, rRNA 또는 가이드 RNA; "비-코딩" RNA 또는 "ncRNA"라고도 함)를 코딩할 수 있다. "단백질 코딩 서열" 또는 특정한 단백질 또는 폴리펩티드를 코딩하는 서열은 적절한 조절 서열의 제어 하에 위치할 때 시험관 내 또는 생체 내에서 mRNA로 전사되고 (DNA의 경우) 폴리펩티드로 번역되는 (mRNA의 경우) 핵산 서열이다. 코딩 서열의 경계는 5' 말단 (N-말단)에서의 시작 코돈과 3' 말단 (C-말단)에서의 번역 정지 넌센스 코돈에 의해 결정된다. 코딩 서열은 원핵 또는 진핵 mRNA로부터의 cDNA, 원핵 또는 진핵 DNA로부터의 게놈 DNA 서열, 및 합성 핵산을 포함할 수 있으나 이에 제한되지는 않는다. 전사 종결 서열은 일반적으로 코딩 서열의 3'에 위치할 것이다.

본원에 사용된 바와 같은, "프로모터 서열" 또는 "프로모터"는 RNA 폴리머라제와 결합하고 하류 (3' 방향) 코딩 또는 비-코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다. 본원에 사용된 바와 같은, 프로모터 서열은 전사 개시 부위에 의해 3' 말단에서 경계를 이루고 배경보다 검출가능한 수준에서 전사를 개시하는데 필요한 최소 수의 염기 또는 요소를 포함하도록 상류 (5' 방향)로 연장된다. 프로모터 서열 내에는 전사 개시 부위 뿐만 아니라 RNA 폴리머라제의 결합을 담당하는 단백질 결합 도메인도 발견된다. 진핵 프로모터는 항상 그런 것은 아니지만 종종, "TATA" 박스 및 "CAAT" 박스를 함유한다. 유도성 프로모터를 포함한 다양한 프로모터를 사용하여 본 개시내용의 다양한 벡터를 구동할 수 있다. 프로모터는 구성적으로 활성인 프로모터 (예를 들어, 구성적으로 활성 "온" 상태인 프로모터)일 수 있고, 유도성 프로모터 (예를 들어, 활성/"온" 또는 불활성/"오프" 상태가 외부 자극, 예를 들어 특정한 온도, 화합물 또는 단백질의 존재에 의해 제어되는 프로모터)일 수 있으며, 공간적으로 제한된 프로모터 (예를 들어, 전사 제어 요소, 인핸서 등) (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 시간적으로 제한된 프로모터 (예를 들어, 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계, 예를 들어 마우스의 모낭 주기 동안 "온" 상태 또는 "오프" 상태에 있음)일 수 있다. 적합한 프로모터는 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로서 지칭될 수 있거나, 원핵 또는 진핵 유기체를 포함한 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터를 사용하여 임의의 RNA 폴리머라제 (예를 들어, pol I, pol II, pol III)에 의한 발현을 구동할 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복부 (LTR) 프로모터; 아데노바이러스 주요 후기 프로모터 (Ad MLP); 단순 포진 바이러스 (HSV) 프로모터, 시토메갈로바이러스 (CMV) 프로모터, 예컨대 CMV 즉시 초기 프로모터 영역 (CMVIE), 라우스 육종 바이러스 (RSV) 프로모터, 인간 U6 소형 핵 프로모터 (U6) (문헌 [Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)]), 향상된 U6 프로모터 (예를 들어, 문헌 [Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)]), 인간 H1 프로모터 (H1) 등을 포함하나 이에 제한되지는 않는다. 유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노시드 (IPTG)-조절된 프로모터, 락토스 유도된 프로모터, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 포함하나 이에 제한되지는 않는다. 따라서 유도성 프로모터는 독시시클린; RNA 폴리머라제, 예를 들어 T7 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합 등을 포함하나 이에 제한되지는 않는 분자에 의해 조절될 수 있다.

일부 실시양태에서, 프로모터는 다세포 유기체에서 프로모터가 특이적 세포의 서브세트에서 활성 (예를 들어, "온")이 되도록 공간적으로 제한된 프로모터 (예를 들어, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이다. 공간적으로 제한된 프로모터는 인핸서, 전사 제어 요소, 제어 서열 등으로서 지칭될 수도 있다. 임의의 적합한 공간적으로 제한된 프로모터가 사용될 수 있으며 적합한 프로모터 (예를 들어, 뇌 특이적 프로모터, 뉴런의 서브세트에서의 발현을 구동시키는 프로모터, 생식계열에서의 발현을 구동시키는 프로모터, 폐에서의 발현을 구동시키는 프로모터, 근육에서의 발현을 구동시키는 프로모터, 췌장의 섬 세포에서의 발현을 구동시키는 프로모터 등)의 선택은 유기체에 따라 달라질 것이다. 예를 들어, 식물, 파리, 벌레, 포유동물, 마우스 등에 대한 다양한 공간적으로 제한된 프로모터가 공지되어 있다. 따라서, 공간적으로 제한된 프로모터를 사용하여 유기체에 따라 매우 다양한 상이한 조직 및 세포 유형에서 부위-특이적 변형 효소를 코딩하는 핵산의 발현을 조절할 수 있다. 일부 공간적으로 제한된 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계 (예를 들어, 마우스의 모낭 주기) 동안 프로모터가 "온" 상태 또는 "오프" 상태에 있도록 시간적으로 제한된다. 예시 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하나 이에 제한되지는 않는다. 뉴런-특이적 공간적으로 제한된 프로모터는 뉴런-특이적 엔올라제 (NSE) 프로모터 (예를 들어, EMBL HSEN02, X51956 참조); 방향족 아미노산 데카르복실라제 (AADC) 프로모터; 신경필라멘트 프로모터 (예를 들어, 진뱅크(GenBank) HUMNFL, L04147 참조); 시냅신 프로모터 (예를 들어, 진뱅크 HUMSYNIB, M55301 참조); thy-1 프로모터 (예를 들어, 문헌 [Chen et al. (1987) Cell 51:7-19; 및 Llewellyn, et al. (2010) Nat. Med. 16(10):1161-1166] 참조); 세로토닌 수용체 프로모터 (예를 들어, 진뱅크 S62283 참조); 티로신 히드록실라제 프로모터 (TH) (예를 들어, 문헌 [Oh et al. (2009) Gene Ther. 16:437; Sasaoka et al. (1992) Mol. Brain Res. 16:274; Boundy et al.(1998) J. Neurosci. 18:9989; 및 Kaneda et al. (1991) Neuron 6:583-594] 참조); GnRH 프로모터 (예를 들어, 문헌 [Radovick et al. (1991) Proc. Natl. Acad. Sci. USA 88:3402-3406] 참조); L7 프로모터 (예를 들어, 문헌 [Oberdick et al.(1990) Science 248:223-226] 참조); DNMT 프로모터 (예를 들어, 문헌 [Bartge et al. (1988) Proc. Natl. Acad. Sci. USA 85:3648-3652] 참조); 엔케팔린 프로모터 (예를 들어, 문헌 [Comb et al. (1988) EMBO J. 17:3793-3805] 참조); 미엘린 염기성 단백질 (MBP) 프로모터; Ca2+-칼모듈린-의존성 단백질 키나제 11-알파 (CamKIIa) 프로모터 (예를 들어, 문헌 [Mayford et al. (1996) Proc. Natl. Acad. Sci. USA 93:13250; 및 Casanova et al. (2001) Genesis 31:37] 참조); CMV 인핸서/혈소판 유래 성장 인자-p 프로모터 (예를 들어, 문헌 [Liu et al. (2004) Gene Therapy 11:52-60] 참조) 등을 포함하나 이에 제한되지는 않는다.

본원에서 상호교환가능하게 사용되는 용어 "DNA 조절 서열", "제어 요소" 및 "조절 요소"는, 비-코딩 서열 (예를 들어, 가이드 RNA) 또는 코딩 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 전사를 제공 및/또는 조절하고/거나 코딩된 폴리펩티드의 번역을 조절하는 전사 및 번역 제어 서열, 예컨대 프로모터, 인핸서, 폴리아데닐화 신호, 종결인자, 단백질 분해 신호 등을 지칭한다.

핵산, 폴리펩티드, 세포 또는 유기체에 적용되는 것으로서 본원에 사용된 바와 같은 용어 "자연적으로 발생하는" 또는 "비변형된"은 자연에서 발견되는 핵산, 폴리펩티드, 세포 또는 유기체를 지칭한다. 예를 들어, 자연의 공급원으로부터 단리될 수 있고 실험실에서 인간에 의해 의도적으로 변형되지 않은 유기체 (바이러스 포함)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연적으로 발생한 것이다.

핵산 또는 폴리펩티드에 적용되는 바와 같은 본원에 사용된 바와 같은 용어 "키메라"는 상이한 공급원으로부터 유래된 구조로 구성되는 하나의 실체를 지칭한다. 예를 들어, "키메라"가 키메라 폴리펩티드 (예를 들어, 키메라 B-GEn.1 또는 B-GEn.2 단백질)와 관련하여 사용되는 경우, 키메라 폴리펩티드는 상이한 폴리펩티드로부터 유래되는 아미노산 서열을 포함한다. 키메라 폴리펩티드는 변형된 또는 자연적으로 발생하는 폴리펩티드 서열 (예를 들어, 변형된 또는 비변형된 B-GEn.1 또는 B-GEn.2 단백질로부터의 제1 아미노산 서열; 및 B-GEn.1 또는 B-GEn.2 단백질 이외의 제2 아미노산 서열)을 포함할 수 있다. 유사하게, 키메라 폴리펩티드를 코딩하는 폴리뉴클레오티드와 관련하여 "키메라"는 상이한 코딩 영역으로부터 유래된 뉴클레오티드 서열 (예를 들어, 변형된 또는 비변형된 B-GEn.1 또는 B-GEn.2 단백질을 코딩하는 제1 뉴클레오티드 서열; 및 B-GEn.1 또는 B-GEn.2 단백질 이외의 폴리펩티드를 코딩하는 제2 뉴클레오티드 서열)을 포함한다.

용어 "키메라 폴리펩티드"는 자연적으로 발생하지 않는, 예를 들어 인간 개입을 통해 달리 분리된 2개 이상의 아미노산 서열 세그먼트의 인공적인 조합 (예를 들어, "융합")에 의해 만들어진 폴리펩티드를 지칭한다. 키메라 아미노산 서열을 포함하는 폴리펩티드는 키메라 폴리펩티드이다. 일부 키메라 폴리펩티드는 "융합 변이체"로서 지칭될 수 있다.

본원에 사용된 바와 같은 "이종"은 각각 천연 핵산 또는 단백질에서 발견되지 않는 뉴클레오티드 또는 펩티드를 의미한다. 본원에 기재된 B-GEn.1 또는 B-GEn.2 융합 단백질은 이종 폴리펩티드 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 단백질로부터의 폴리펩티드 서열)과 융합된 B-GEn.1 또는 B-GEn.2 폴리펩티드 (또는 그의 변이체)의 RNA-결합 도메인을 포함할 수 있다. 이종 폴리펩티드는 B-GEn.1 또는 B-GEn.2 융합 단백질에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산은 자연적으로 발생하는 핵산 (또는 그의 변이체)에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 폴리뉴클레오티드를 생성할 수 있다. 또 다른 예로서, 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 이종 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 폴리펩티드)와 융합될 수 있으며, 이는 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 의해서도 나타날 활성을 나타낸다. 이종 핵산은 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 연결되어 (예를 들어, 유전 공학에 의함) 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 폴리뉴클레오티드를 생성할 수 있다. 본원에 사용된 바와 같은 "이종"은 부가적으로, 천연 세포가 아닌 세포 내의 뉴클레오티드 또는 폴리펩티드를 의미한다.

용어 "동족"은 자연에서 정상적으로 상호작용하거나 공존하는 2개의 생체분자를 지칭한다.

본원에 사용된 바와 같은 "재조합"은, 특정한 핵산 (DNA 또는 RNA) 또는 벡터가 클로닝, 제한, 폴리머라제 연쇄 반응 (PCR) 및/또는 라이게이션 단계의 다양한 조합의 산물이며 자연계에서 발견되는 내인성 핵산과 구별될 수 있는 구조적 코딩 또는 비-코딩 서열을 갖는 구축물을 생성하는 것을 의미한다. 폴리펩티드를 코딩하는 DNA 서열은 cDNA 단편 또는 일련의 합성 올리고뉴클레오티드로부터 어셈블리되어, 세포 또는 무세포 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역된 DNA 서열은 오픈 리딩 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 이러한 서열은 코딩 영역의 조작 또는 발현을 방해하지 않으며 실제로 다양한 메커니즘에 의해 원하는 산물의 생산을 조정하는 작용을 할 수 있다 (하기 "DNA 조절 서열" 참조). 추가적으로 또는 대안적으로, 번역되지 않은 RNA (예를 들어, 가이드 RNA)를 코딩하는 DNA 서열이 또한 재조합으로 간주될 수 있다. 따라서, 예를 들어 용어 "재조합" 핵산은 자연적으로 발생하지 않는 것, 예를 들어 인간 개입을 통해 달리 분리된 2개의 서열 세그먼트를 인공적으로 조합함으로써 만들어진 것을 지칭한다. 이러한 인공적인 조합은 종종 화학적 합성 수단에 의해, 또는 단리된 핵산 세그먼트의 인공적인 조작에 의해, 예를 들어, 유전 공학 기술에 의해 달성된다. 이는 일반적으로, 특정 코돈을 동일한 아미노산, 보존적 아미노산 또는 비-보존적 아미노산을 코딩하는 코돈으로 대체하기 위해 수행된다. 추가적으로 또는 대안적으로, 이는 원하는 기능의 조합을 생성하기 위해 원하는 기능의 핵산 세그먼트를 함께 연결하기 위해 수행된다. 이러한 인공적인 조합은 종종 화학적 합성 수단에 의해, 또는 단리된 핵산 세그먼트의 인공적인 조작에 의해, 예를 들어, 유전 공학 기술에 의해 달성된다. 재조합 폴리뉴클레오티드가 폴리펩티드를 코딩하는 경우, 코딩된 폴리펩티드의 서열은 자연적으로 발생하는 ("야생형")일 수 있거나 자연적으로 발생하는 서열의 변이체 (예를 들어, 돌연변이체)일 수 있다. 따라서, 용어 "재조합" 폴리펩티드는 반드시 서열이 자연적으로 발생하지 않는 폴리펩티드를 지칭하는 것은 아니다. 대신, "재조합" 폴리펩티드는 재조합 DNA 서열에 의해 코딩되지만, 폴리펩티드의 서열은 자연적으로 발생하거나 ("야생형") 비-자연적으로 발생할 수 있다 (예를 들어, 변이체, 돌연변이체 등). 따라서, "재조합" 폴리펩티드는 인간 개입의 결과이지만, 자연적으로 발생하는 아미노산 서열일 수도 있다. 용어 "비-자연적으로 발생하는"은 화학적으로 변형된 또는 돌연변이된 분자를 포함하여, 자연적으로 발생하는 대응물과 현저히 상이한 분자를 포함한다.

"벡터" 또는 "발현 벡터"는 또 다른 DNA 세그먼트, 예를 들어 "삽입물"이 부착되어 세포에서 부착된 세그먼트의 복제를 가져올 수 있는 레플리콘, 예컨대 플라스미드, 파지, 바이러스 또는 코스미드이다.

"발현 카세트"는 프로모터에 작동가능하게 연결된 DNA 코딩 서열을 포함한다. "작동가능하게 연결된"은 그렇게 기재된 구성요소가 의도한 방식으로 기능하도록 허용하는 관계에 있는 병치를 지칭한다. 예를 들어, 프로모터가 그의 전사 또는 발현에 영향을 미치는 경우, 프로모터는 코딩 서열에 작동가능하게 연결된다. 용어 "재조합 발현 벡터" 또는 "DNA 구축물"은 벡터 및 적어도 하나의 삽입물을 포함하는 DNA 분자를 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 재조합 발현 벡터는 일반적으로, 삽입물(들)을 발현 및/또는 증식시키기 위한 목적으로, 또는 다른 재조합 뉴클레오티드 서열을 구축하기 위해 생성된다. 핵산(들)은 프로모터 서열에 작동가능하게 연결되거나 연결되지 않을 수 있고, DNA 조절 서열에 작동가능하게 연결되거나 연결되지 않을 수 있다.

본원에 사용된 바와 같은 용어 "작동가능하게 연결된"은 2개 이상의 요소, 예를 들어 폴리펩티드 서열 또는 폴리뉴클레오티드 서열 간의 물리적 또는 기능적 연결을 의미하며, 이는 의도된 방식으로 작동하도록 허용한다. 예를 들어, 관심 폴리뉴클레오티드와 조절 서열 (예를 들어, 프로모터) 간의 작동가능한 연결은 관심 폴리뉴클레오티드의 발현을 허용하는 기능적 연결이다. 이러한 의미에서, 용어 "작동가능하게 연결된"은 조절 영역이 관심 코딩 서열의 전사 또는 번역을 조절하는데 유효하도록 조절 영역 및 전사될 코딩 서열의 위치를 지정하는 것을 지칭한다. 본원에 개시된 일부 실시양태에서, 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드 또는 기능적 RNA를 코딩하는 서열에 대해 적절한 위치에 배치되어, 제어 서열이 폴리펩티드를 코딩하는 mRNA, 폴리펩티드 및/또는 기능적 RNA의 발현 또는 세포 국재화를 지시하거나 조절하도록 하는 구성을 나타낸다. 따라서, 프로모터가 핵산 서열의 전사를 매개할 수 있는 경우, 이러한 프로모터는 핵산 서열과 작동가능하게 연결되어 있다. 작동가능하게 연결된 요소는 연속적이거나 비-연속적일 수 있다.

외인성 DNA가 세포 내부에 도입되었을 때, 그러한 세포는 외인성 DNA, 예를 들어 재조합 발현 벡터에 의해 "유전적으로 변형" 또는 "형질전환" 또는 "형질감염"되었다. 외인성 DNA의 존재는 영구적이거나 일시적인 유전적 변화를 초래한다. 형질전환 DNA는 세포의 게놈에 통합 (공유적으로 연결)될 수도 있고 그렇지 않을 수도 있다.

예를 들어, 원핵생물, 효모 및 포유동물 세포에서, 형질전환 DNA는 에피솜 요소, 예컨대 플라스미드 상에서 유지될 수 있다. 진핵 세포와 관련하여, 안정적으로 형질전환된 세포는 형질전환 DNA가 염색체에 통합되어 염색체 복제를 통해 딸 세포에 유전되는 세포이다. 이러한 안정성은 형질전환 DNA를 함유하는 딸 세포 집단을 포함하는 세포주 또는 클론을 확립할 수 있는 진핵 세포의 능력에 의해 입증된다. "클론"은 유사분열에 의해 단일 세포 또는 공통 조상으로부터 유래된 세포 집단이다. "세포주"는 여러 세대에 걸쳐 시험관 내에서 안정적으로 성장할 수 있는 1차 세포의 클론이다.

유전적 변형 ("형질전환"으로서 지칭되기도 함)의 적합한 방법은, 예를 들어, 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 원형질체 융합, 리포펙션, 전기천공, 인산칼슘 침전, 폴리에틸렌이민 (PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포솜-매개 형질감염, 입자 총 기술, 인산칼슘 침전, 직접 마이크로 주사, 나노입자-매개 핵산 전달 등을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pp: S0169-409X(12)00283-9. doi:10.1016/j.addr.2012.09.023] 참조).

본원에 사용된 바와 같은 "숙주 세포"는 생체 내 또는 시험관 내 진핵 세포, 원핵 세포 (예를 들어, 박테리아 또는 고세균 세포), 또는 단세포 실체로서 배양된 다세포 유기체 (예를 들어, 세포주)로부터의 세포를 의미하며, 진핵 또는 원핵 세포는 핵산에 대한 수용체로서 사용될 수 있거나, 또는 사용되어 왔으며, 핵산에 의해 형질전환된 원래 세포의 자손을 포함한다. 단일 세포의 자손은 자연적, 우발적 또는 고의적 돌연변이로 인해 원래의 부모와 형태 또는 게놈 또는 전체 DNA 보체에서 반드시 완전히 동일하지 않을 수도 있는 것으로 이해된다. "재조합 숙주 세포" ("유전적으로 변형된 숙주 세포"로서 지칭되기도 함)는 이종 핵산, 예를 들어 발현 벡터가 도입된 숙주 세포이다. 예를 들어, 박테리아 숙주 세포는 외인성 핵산 (예를 들어, 플라스미드 또는 재조합 발현 벡터)을 적합한 박테리아 숙주 세포 내로 도입함으로써 유전적으로 변형된 박테리아 숙주 세포이며, 진핵 숙주 세포는 외인성 핵산을 적합한 진핵 숙주 세포 내로 도입함으로써 유전적으로 변형된 진핵 숙주 세포 (예를 들어, 포유동물 생식 세포)이다.

본원에 사용된 바와 같은 "표적 DNA"는 "표적 부위" 또는 "표적 서열"을 포함하는 폴리데옥시리보뉴클레오티드이다. 용어 "표적 부위", "표적 서열", "표적 프로토스페이서 DNA" 또는 "프로토스페이서-유사 서열"은 결합을 위한 충분한 조건이 존재한다면, 가이드 RNA의 DNA-표적화 세그먼트 ("스페이서"로서 지칭되기도 함)가 결합할 표적 DNA에 존재하는 핵산 서열을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 예를 들어, 표적 DNA 내의 표적 부위 (또는 표적 서열) 5'-GAGCATATC-3'는 RNA 서열 5'-GAUAUGCUC-3'에 의해 표적화된다 (또는 이에 의해 결합되거나, 이와 혼성화되거나, 또는 이에 상보적임). 적합한 DNA/RNA 결합 조건은 세포에 정상적으로 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건 (예를 들어, 무세포 시스템에서의 조건)은 관련 기술분야에 공지되어 있으며; 예를 들어, 상기 문헌 [Sambrook]을 참조한다. 가이드 RNA에 상보적이며 이와 혼성화하는 표적 DNA의 가닥은 "상보적 가닥"으로서 지칭되며, "상보적 가닥"에 상보적인 (따라서 가이드 RNA에 상보적이지 않은) 표적 DNA의 가닥은 "비-상보적 가닥" 또는 "비-상보적 가닥"으로서 지칭된다.

"부위-특이적 변형 효소" 또는 "RNA-결합 부위-특이적 변형 효소"는 RNA와 결합하고 특이적 DNA 서열, 예컨대 B-GEn.1 또는 B-GEn.2 폴리펩티드를 표적화하는 폴리펩티드를 의미한다. 본원에 기재된 바와 같은 부위-특이적 변형 효소는 그것과 결합된 RNA 분자에 의해 특이적 DNA 서열을 표적화한다. RNA 분자는 표적 DNA 내의 표적 서열과 결합하거나, 이와 혼성화하거나 이에 상보적인 서열을 포함하므로, 결합된 폴리펩티드가 표적 DNA 내의 특이적 위치 (표적 서열)를 표적화한다. "절단"은 DNA 분자의 공유 백본이 파손되는 것을 의미한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단 둘 다가 가능하며, 2가지 별개의 단일 가닥 절단 사건의 결과로서 이중 가닥 절단이 발생할 수 있다. DNA 절단으로 인해 평활 단부 또는 엇갈린 단부가 생산될 수 있다. 특정 실시양태에서, 가이드 RNA와 부위-특이적 변형 효소를 포함하는 복합체는 표적화된 이중 가닥 DNA 절단을 위해 사용된다.

"뉴클레아제" 및 "엔도뉴클레아제"는 폴리뉴클레오티드 절단을 위한 엔도뉴클레오분해성 촉매 활성을 보유하는 효소를 의미하기 위해 본원에서 상호교환가능하게 사용된다.

뉴클레아제의 "절단 도메인" 또는 "활성 도메인" 또는 "뉴클레아제 도메인"은 DNA 절단에 대한 촉매 활성을 보유하는 뉴클레아제 내의 폴리펩티드 서열 또는 도메인을 의미한다. 절단 도메인은 단일 폴리펩티드 쇄에 함유될 수 있거나 절단 활성은 2개 (또는 그 초과의) 폴리펩티드의 회합으로 인해 발생할 수 있다. 단일 뉴클레아제 도메인은 주어진 폴리펩티드 내에서 하나 초과의 단리된 아미노산 연장물로 이루어질 수 있다.

"가이드 서열" 또는 "DNA-표적화 세그먼트" 또는 "DNA-표적화 서열" 또는 "스페이서"는 본원에서 "프로토스페이서-유사" 서열로 지정된 표적 DNA 내의 특이적 서열에 상보적인 뉴클레오티드 서열 (표적 DNA의 상보적 가닥)을 포함한다. 단백질-결합 세그먼트 (또는 "단백질-결합 서열")는 부위-특이적 변형 효소와 상호작용한다. 부위-특이적 변형 효소가 B-GEn.1 또는 B-GEn.2 또는 B-GEn.1 또는 B-GEn.2 관련 폴리펩티드인 경우 (하기에 더 자세히 기재됨), 표적 DNA의 부위-특이적 절단은 (i) 가이드 RNA와 표적 DNA 간의 염기쌍 형성 상보성; 및 (ii) 표적 DNA 내의 짧은 모티프 (프로토스페이서 인접 모티프 (PAM)로서 지칭됨) 둘 다에 의해 결정된 위치에서 발생한다. 가이드 RNA의 단백질-결합 세그먼트는 부분적으로, 서로 혼성화하여 이중 가닥 RNA 이중나선 (dsRNA 이중나선)를 형성하는 2개의 상보적인 뉴클레오티드 연장물을 포함한다. 일부 실시양태에서, 핵산 (예를 들어, 가이드 RNA, 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 부위-특이적 변형 효소를 코딩하는 핵산 등)은 부가의 바람직한 특색 (예를 들어, 변형 또는 조절된 안정성; 세포하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함한다. 비제한적인 예는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 안정성 제어 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 변형 또는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 그의 조합을 포함한다.

일부 실시양태에서, 가이드 RNA는 상기 기재된 특색 중 임의의 것을 제공하는 5' 또는 3' 단부에 부가의 세그먼트를 포함한다. 예를 들어, 적합한 제3 세그먼트는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 안정성 제어 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 그의 조합을 포함할 수 있다.

가이드 RNA 및 부위-특이적 변형 효소, 에컨대 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 리보핵단백질 복합체를 형성할 수 있다 (예를 들어, 비-공유 상호작용을 통해 결합함). 가이드 RNA는 표적 DNA의 서열에 상보적인 뉴클레오티드 서열을 포함함으로써 복합체에 표적 특이성을 제공한다. 복합체의 부위-특이적 변형 효소는 엔도뉴클레아제 활성을 제공한다. 다시 말해서, 부위-특이적 변형 효소는 가이드 RNA의 단백질-결합 세그먼트와의 회합을 통해 표적 DNA 서열 (예를 들어, 염색체 핵산 내의 표적 서열; 염색체외 핵산, 예를 들어 에피솜 핵산, 미니서클 등 내의 표적 서열; 미토콘드리아 핵산 내의 표적 서열; 엽록체 핵산 내의 표적 서열; 플라스미드 내의 표적 서열 등)로 가이드된다. RNA 압타머는 관련 기술분야에 공지되어 있으며 일반적으로 리보스위치의 합성 버전이다. 용어 "RNA 압타머" 및 "리보스위치"는 이들을 포함하는 RNA 분자의 구조의 유도성 조절 (따라서 특이적 서열의 이용가능성)을 제공하는 합성 및 자연 핵산 서열 둘 다를 포괄하기 위해 본원에서 상호교환가능하게 사용된다. RNA 압타머는 일반적으로 특정한 약물 (예를 들어, 소분자)과 특이적으로 결합하는 특정한 구조 (예를 들어, 헤어핀)로 폴딩되는 서열을 포함한다. 약물의 결합은 RNA의 폴딩에 있어서 구조적 변화를 유발시키며, 이는 압타머를 포함하는 핵산의 특색을 변화시킨다. 비제한적인 예로서: (i) 압타머가 있는 활성인자-RNA는, 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 표적 RNA과 결합하지 못할 수 있으며; (ii) 압타머가 있는 표적-RNA는, 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 활성인자-RNA와 결합하지 못할 수 있으며; (iii) 상이한 약물과 결합하는 상이한 압타머를 각각 포함하는 표적인자-RNA 및 활성인자-RNA는 두 약물이 모두 존재하지 않는 한 서로 결합하지 못할 수 있다. 이들 예에 의해 예시된 바와 같이, 2-분자 가이드 RNA는 유도가능하도록 설계될 수 있다.

압타머 및 리보스위치의 예는, 예를 들어 문헌 [Nakamura et al., Genes Cells. 2012 May;17(5):344-64; Vavalle et al., Future Cardiol. 2012 May;8(3):371-82; Citartan et al., Biosens Bioelectron. 2012 Apr 15;34(1):1-11; 및 Liberman et al., Wiley lnterdiscip Rev RNA. 2012 May-Jun;3(3):369-84]에서 찾을 수 있으며; 이들 모두는 그 전체 내용이 본원에 참조로 포함된다.

유전적 변형 방법의 선택은 일반적으로, 형질전환되는 세포의 유형과 형질전환이 일어나는 상황 (예를 들어, 시험관 내, 생체 외 또는 생체 내)에 따라 달라진다. 이러한 방법에 대한 일반적인 논의는 문헌 [Ausubel, et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons, 1995]에서 찾을 수 있다.

압타머 및 리보스위치의 예는, 예를 들어, 문헌 [Nakamura et al., Genes Cells. 2012 May;17(5):344-64; Vavalle et al., Future Cardiol. 2012 May;8(3):371-82; Citartan et al., Biosens Bioelectron. 2012 Apr 15;34(1):1-11; 및 Liberman et al., Wiley lnterdiscip Rev RNA. 2012 May-Jun;3(3):369-84]에서 찾을 수 있으며; 이들 모두는 그 전체 내용이 본원에 참조로 포함된다.

용어 "줄기 세포"는 자기 재생할 수 있는 능력과 분화된 세포 유형을 생성할 수 있는 능력 둘 다를 갖는 세포 (예를 들어, 식물 줄기 세포, 척추동물 줄기 세포)를 지칭하기 위해 본원에 사용된다 (문헌 [Morrison et al. (1997) Cell 88:287-298] 참조). 세포 개체발생의 맥락에서, "분화된" 또는 "분화하는"이라는 형용사는 상대적인 용어이다. "분화된 세포"는 이와 비교되는 세포보다 발달 경로를 더 아래로 진행한 세포이다. 따라서, 만능성 줄기 세포 (하기 기재됨)는 계통-제한된 전구 세포 (예를 들어, 중배엽 줄기 세포)로 분화할 수 있으며, 이는 결국 추가 제한되는 세포 (예를 들어, 뉴런 전구세포)로 분화할 수 있으며, 이는 말기 세포 (예를 들어, 말기 분화된 세포, 예를 들어 뉴런, 심근세포 등)로 분화할 수 있으며, 이는 특정의 조직 유형에서 특징적인 역할을 하며 향후 증식할 수 있는 능력을 보유할 수도 있고 보유하지 않을 수도 있다. 줄기 세포는 특이적 마커 (예를 들어, 단백질, RNA 등)의 존재와 특이적 마커의 부재 둘 다를 특징으로 할 수 있다. 줄기 세포는 또한 시험관 내 및 생체 내 둘 다에서의 기능적 검정, 특히 다수의 분화된 자손을 생성할 수 있는 줄기 세포의 능력과 관련된 검정에 의해 확인될 수 있다.

관심 줄기 세포는 만능성 줄기 세포 (PSC)를 포함한다. 용어 "만능성 줄기 세포" 또는 "PSC"는 유기체의 모든 세포 유형을 생산할 수 있는 줄기 세포를 의미하기 위해 본원에 사용된다. 따라서, PSC는 유기체의 모든 배엽층(예를 들어, 척추동물의 내배엽, 중배엽 및 외배엽)의 세포를 생성할 수 있다. 만능성 세포는 기형종을 형성할 수 있고 살아있는 유기체 내의 외배엽, 중배엽 또는 내배엽 조직에 기여할 수 있다. 식물의 만능성 줄기 세포는 식물의 모든 세포 유형 (예를 들어, 뿌리, 줄기, 잎 등의 세포)을 생성할 수 있다.

동물의 PSC는 수많은 상이한 방법으로 유래될 수 있다. 예를 들어, 배아 줄기 세포 (ESC)는 배아의 내부 세포 덩어리로부터 유래되는 반면 (문헌 [Thomson et al., Science. 1998 Nov 6;282(5391):1145-7]), 유도 만능성 줄기 세포 (iPSC)는 체세포로부터 유래된다 (Takahashi et al., Cell. 2007 Nov 30;131(5):861-72; Takahashi et al., Nat Protoc. 2007;2(12):3081-9; Yu et al., Science. 2007 Dec 21;318(5858):1917-20. Epub 2007 Nov 20).

용어 PSC는 유래에 관계없이 만능성 줄기 세포를 지칭하기 때문에, 용어 PSC는 용어 ESC 및 iPSC 뿐만 아니라 PSC의 또 다른 예인 용어 배아 생식 줄기 세포 (EGSC)를 포괄한다. PSC는 확립된 세포주의 형태일 수 있거나, 1차 배아 조직으로부터 직접적으로 수득될 수 있거나, 또는 체세포로부터 유래될 수 있다. PSC는 본원에 기재된 방법의 표적 세포일 수 있다.

"배아 줄기 세포" (ESC)는 배아, 일반적으로 배반포의 내부 세포 덩어리로부터 단리된 PSC를 의미한다. ESC 계통은 NIH 인간 배아 줄기 세포 레지스트리에 나열되어 있으며, 예를 들어, hESBGN-01, hESBGN-02, hESBGN-03, hESBGN-04 [브레사젠, 인크.(BresaGen, Inc.)]; HES-1, HES-2, HES-3, HES-4, HES-5, HES-6 [ES 셀 인터내셔날(ES Cell International)]; Miz-hES1 [미즈메디 병원-서울대학교(MizMedi Hospital-Seoul National University)]; HSF-1, HSF-6 (샌프란시스코 캘리포니아 대학교); 및 H1, H7, H9, H13, H14 (위스콘신 동문 연구 재단 (와이셀 연구소))이다. 관심 줄기 세포는 또한 다른 영장류로부터의 배아 줄기 세포, 예컨대 레수스(Rhesus) 줄기 세포 및 마모셋 줄기 세포를 포함한다. 줄기 세포는 임의의 포유동물 종, 예를 들어 인간, 말, 소, 돼지, 개, 고양이, 설치류, 예를 들어 마우스, 래트, 햄스터, 영장류 등으로부터 수득될 수 있다 (Thomson et al. (1998) Science 282:1145; Thomson et al. (1995) Proc. Natl. Acad. Sci. USA 92:7844; Thomson et al. (1996) Biol. Reprod. 55:254; Shamblott et al., Proc. Natl. Acad. Sci. USA 95:13726, 1998). 배양물에서, ESC는 일반적으로 큰 핵-세포질 비율을 갖고, 경계가 뚜렷하며 눈에 띄는 핵소체가 있는 편평한 콜로니로서 성장한다. 또한, ESC는 SSEA-3, SSEA-4, TRA-1-60, TRA-1-81 및 알칼리성 포스파타제를 발현하지만 SSEA-1은 발현하지 않는다. ESC를 생성하고 명확히 규명하는 방법의 예는, 예를 들어, 미국 특허 번호 7,029,913, 미국 특허 번호 5,843,780, 및 미국 특허 번호 6,200,806에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다. 미분화된 형태의 hESC를 증식시키는 방법은 WO 99/20741, WO 01/51616, 및 WO 03/020920에 기재되어 있다. "배아 생식 줄기 세포" (EGSC) 또는 "배아 생식 세포" 또는 "EG 세포"는 생식 세포 및/또는 생식 세포 전구세포, 예를 들어 원시 생식 세포, 예를 들어 정자와 난자가 될 세포로부터 유래되는 PSC를 의미한다. 배아 생식 세포 (EG 세포)는 상기 기재된 바와 같은 배아 줄기 세포와 유사한 특성을 갖는 것으로 생각된다. EG 세포를 생성하고 명확히 규명하는 방법의 예는, 예를 들어 미국 특허 번호 7,153,684; 문헌 [Matsui, Y., et al., (1992) Cell 70:841; Shamblott, M., et al. (2001) Proc. Natl. Acad. Sci. USA 98: 113; Shamblott, M., et al. (1998) Proc. Natl. Acad. Sci. USA, 95:13726; 및 Koshimizu, U., et al. (1996) Development, 122:1235]에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다.

"유도 만능성 줄기 세포" 또는 "iPSC"는 PSC가 아닌 세포 (예를 들어, PSC에 비해 분화되는 세포)로부터 유래된 PSC를 의미한다. iPSC는 말단 분화된 세포를 포함하여, 다수의 상이한 세포 유형으로부터 유래될 수 있다. iPSC는 ES 세포-유사 형태를 갖고 있으며, 큰 핵-세포질 비율을 갖고, 경계가 뚜렷하며 눈에 띄는 핵이 있는 편평한 콜로니로서 성장한다. 또한, iPSC는 알칼리성 포스파타제, SSEA3, SSEA4, Sox2, Oct3/4, Nanog, TRA160, TRA181, TDGF 1, Dnmt3b, Fox03, GDF3, Cyp26al, TERT, 및 zfp42를 포함하나 이에 제한되지는 않는, 관련 기술분야의 통상의 기술자에게 공지된 하나 이상의 주요 만능성 마커를 발현한다.

iPSC를 생성하고 명확히 규명하는 방법의 예는, 예를 들어, 미국 특허 공개 번호 US20090047263, US20090068742, US20090191159, US20090227032, US20090246875, 및 US20090304646에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다. 일반적으로, iPSC를 생성하기 위해, 체세포를 재프로그래밍하여 만능성 줄기 세포가 되도록 관련 기술분야에 공지된 재프로그래밍 인자 (예를 들어, Oct4, SOX2, KLF4, MYC, Nanog, Lin28 등)가 체세포에 제공된다.

"체세포"는 실험적 조작이 없을 경우 통상적으로 유기체 내의 모든 유형의 세포를 생성하지 않는 유기체 내의 임의의 세포를 의미한다. 다시 말해서, 체세포는 신체의 3가지 배엽 층, 예를 들어, 외배엽, 중배엽 및 내배엽 모두의 세포를 자연적으로 생성하지 않을 정도로 충분히 분화된 세포이다. 예를 들어, 체세포는 뉴런과 신경 전구세포 둘 다를 포함하며, 후자는 중추 신경계의 모든 또는 일부 세포 유형을 자연적으로 생성할 수 있지만 중배엽 또는 내배엽 계통의 세포를 생성할 수는 없다.

"유사분열 세포"는 유사분열을 겪는 세포를 의미한다.

"유사분열 후 세포"는 유사분열로부터 빠져나온 세포, 예를 들어 "정지" 상태, 예를 들어 더 이상 분열을 거치지 않는 세포를 의미한다. 이러한 정지 상태는 일시적, 예를 들어 가역적일 수 있거나, 또는 영구적일 수 있다.

"감수분열 세포"는 감수분열을 겪고 있는 세포를 의미한다.

"재조합"은 두 폴리뉴클레오티드 간의 유전적 정보 교환 프로세스를 의미한다. 본원에 사용된 바와 같은 "상동성-지시된 복구 (HDR)"는, 예를 들어, 세포 내의 이중 가닥 파손부를 복구하는 동안 발생하는 특수 형태의 DNA 복구를 지칭한다. 이러한 프로세스는 뉴클레오티드 서열 상동성을 필요로 하고, "공여자" 분자를 사용하여 "표적" 분자의 템플릿 복구 (예를 들어, 이중 가닥 파손을 경험한 분자)를 수행하며, 공여자에서 표적으로의 유전 정보의 전달을 초래한다. 공여자 폴리뉴클레오티드가 표적 분자와 상이하고 공여자 폴리뉴클레오티드 서열의 일부 또는 전부가 표적 DNA에 혼입되는 경우, 상동성-지시된 복구는 표적 분자의 서열 변경 (예를 들어, 삽입, 결실, 돌연변이)을 초래할 수 있다. 일부 실시양태에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부분, 공여자 폴리뉴클레오티드의 카피, 또는 공여자 폴리뉴클레오티드의 카피의 일부분이 표적 DNA에 통합된다.

"비-상동 말단 연결 (NHEJ)"은 상동 템플릿에 대한 필요성 없이 파손 말단을 서로 직접 라이게이션함으로써 DNA 내의 이중 가닥 파손부를 복구하는 것을 의미한다 (복구를 가이드하기 위해 상동 서열을 필요로 하는 상동성-지시된 복구와는 대조적임). NHEJ는 종종 이중 가닥 파손 부위 근처의 뉴클레오티드 서열의 손실 (결실)을 초래한다.

용어 "치료", "치료하는" 등은 일반적으로 원하는 약리학적 및/또는 생리학적 효과를 수득하는 것을 의미하기 위해 본원에 사용된다. 효과는 질환 또는 그의 증상을 완전히 또는 부분적으로 예방하는 관점에서 예방적일 수 있고/거나 질환 및/또는 질환으로 인한 부작용에 대한 부분적 또는 완전한 치유의 관점에서 치료적일 수 있다. 본원에 사용된 바와 같은 "치료"는 포유동물에서 질환 또는 증상의 임의의 치료를 포함하며, (a) 질환 또는 증상을 획득할 경향이 있지만 아직 질환 또는 증상이 있는 것으로 진단되지 않은 대상체에게 질환 또는 증상이 발생하는 것을 예방하는 것; (b) 질환이나 증상을 억제하는 것, 예를 들어 그의 발생을 저지하는 것; 또는 (c) 질환을 완화시키는 것, 예를 들어 질환의 퇴행을 유발시키는 것을 포함한다. 치료제는 질환 또는 손상의 발병 전, 발병 동안 또는 발병 후에 투여될 수 있다. 치료가 대상체의 바람직하지 않은 임상 증상을 안정화시키거나 감소시키는, 진행 중인 질환의 치료가 특히 중요하다. 이러한 치료는 바람직하게, 병에 걸린 조직에서의 기능이 완전히 상실되기 전에 수행된다. 요법은 바람직하게, 질환의 증상 단계 동안, 및 일부 경우에는 질환의 증상 단계 후에 투여될 것이다.

용어 "개체", "대상체", "숙주" 및 "환자"는 본원에서 상호교환가능하게 사용되며 진단, 치료 또는 요법이 요망되는 임의의 포유동물 대상체, 특히 인간을 지칭한다.

분자 및 세포 생화학에서의 일반적인 방법은 문헌 [Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (1. Lefkovits ed., Academic Press 1997); 및 Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]과 같은 표준 교과서에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다.

특정 범위의 값이 제공되는 경우, 문맥상 명백하게 달리 명시하지 않는 한 하한 단위의 10분의 1까지의 각각의 중간 값, 그러한 범위의 상한과 하한 사이 값, 및 임의의 다른 언급된 또는 그러한 언급된 범위 내의 중간 값이 본 개시내용 내에 포괄되는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 또한 언급된 범위에서 임의의 구체적으로 배제된 한계에 따라 본 개시내용 내에 포괄된다. 언급된 범위가 한계치 중 하나 또는 둘 다를 포함하는 경우, 포함된 한계치 중 하나 또는 둘 다를 제외하는 범위가 또한 본 개시내용에 포함된다.

문구 "로 본질적으로 이루어지는"은 본원에서 시스템의 명시된 활성 구성요소 또는 구성요소들이 아닌 것, 또는 분자의 명시된 활성 부분 또는 부분들이 아닌 임의의 것을 배제하는 것을 의미한다.

특정 범위는 본원에 수치 값으로 제시되며, 용어 "약"이 그 수치 앞에 표시된다. 용어 "약"은 그 뒤에 있는 정확한 숫자 뿐만 아니라 그 용어 뒤에 있는 숫자에 가깝거나 대략적인 숫자에 대한 문자 그대로의 지원을 제공하기 위해 본원에 사용된다. 숫자가 구체적으로 언급된 숫자에 가깝거나 대략적인지 여부를 결정할 때, 인용되지 않은 숫자에 가깝거나 대략적인 숫자는 제시된 맥락에서 구체적으로 언급된 숫자와 실질적으로 동등한 것을 제공하는 숫자일 수 있다.

명확성을 위해 별도의 실시양태의 맥락에서 기재되는 본 개시내용의 특정의 특색은 또한, 단일 실시양태에서 조합하여 제공될 수 있는 것으로 인지된다. 반대로, 간략화를 위해 단일 실시양태의 맥락에서 기재되는 본 개시내용의 다양한 특색은 또한, 별도로 또는 임의의 적절한 하위 조합으로 제공될 수 있다. 본 개시내용에 속하는 실시양태의 모든 조합은 본 개시내용에 의해 구체적으로 포함되며, 마치 각각의 모든 조합이 개별적이고 명시적으로 개시된 것처럼 본원에 개시된다. 또한, 다양한 실시양태의 모든 하위 조합 및 그의 요소가 또한, 본 개시내용에 의해 구체적으로 포함되며, 마치 각각의 모든 하위 조합이 본원에 개별적이고 명시적으로 개시된 것처럼 본원에 개시된다.

B- GEn .1 또는 B- GEn .2 융합 폴리펩티드

B-GEn.1 또는 B-GEn.2는 B-GEn.1 또는 B-GEn.2 뉴클레아제와 비교하여 부가의 도메인 및 활성을 갖는 융합 단백질을 형성하는데 사용될 수 있다. 비제한적인 예시로서, Fokl 도메인은 촉매적으로 활성인 엔도뉴클레아제 도메인을 함유할 수 있는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합될 수 있거나, 또는 Fokl 도메인은 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제 도메인을 불활성화하도록 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합될 수 있다. B-GEn.1 또는 B-GEn.2와 융합 단백질을 만들기 위해 융합될 수 있는 다른 도메인은 전사 조정인자, 후생유전학적 변형인자, 태그 및 기타 표지 또는 영상화제, 히스톤, 및/또는 유전자 서열의 구조 또는 활성을 조정하거나 변형시키는 관련 기술분야에 공지된 다른 양식을 포함한다.

일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 전사 활성인자 또는 억제인자, 또는 후생유전학적 변형인자, 예컨대 메틸라제, 데메틸라제, 아세틸라제 또는 데아세틸라제와 융합된다.

일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 검출, 분자간 상호작용, 번역 활성화, 변형, 또는 관련 기술분야에 공지된 임의의 다른 조작을 위한 기능적 단백질 구성요소와 융합된다.

예시적인 B- GEn .1 또는 B-GEn.2 변이체 폴리펩티드

일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 a) 표적화된 부위와 결합할 수 있는 능력을 유지하고, 임의로 b) 그의 활성을 유지한다. 일부 실시양태에서, 유지되는 활성은 엔도뉴클레아제 활성이다. 특정 실시양태에서, 엔도뉴클레아제 활성은 tracrRNA를 필요로 하지 않는다.

일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분이 변형된다. 일부 실시양태에서, 변형은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성을 감소 또는 증가시키는 아미노산 변화 (예를 들어, 결실, 삽입 또는 치환)를 포함한다. 예를 들어, 일부 실시양태에서, 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 상응하는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 갖는다. 일부 실시양태에서, 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 실질적인 뉴클레아제 활성을 갖지 않는다. 일부 실시양태에서, 이는 50%, 2배, 4배 또는 최대 10배 초과하는 뉴클레아제 활성을 가질 수 있다.

일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분은 DNA 변형 활성 및/또는 전사 인자 활성 및/또는 DNA-연관 폴리펩티드 변형 활성을 갖는 이종 폴리펩티드를 포함한다. 일부 실시양태에서, 이종 폴리펩티드는 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분을 대체한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 정상적으로 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분 (그리고 그러한 일부분은 완전히 활성이거나 대신 상응하는 비변형된 활성의 100% 미만을 갖도록 변형될 수 있음)과 이종 폴리펩티드 둘 다를 포함한다. 다시 말해서, 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 정상적으로 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분과 이종 폴리펩티드 둘 다를 포함하는 융합 폴리펩티드일 수 있다.

예를 들어, B-GEn.1 또는 B-GEn.2 융합 단백질에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 이종 폴리펩티드 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 단백질로부터의 폴리펩티드 서열)과 융합될 수 있다. 이종 폴리펩티드 서열은 B-GEn.1 또는 B-GEn.2 융합 단백질에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산 서열은 또 다른 핵산 서열에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 뉴클레오티드 서열을 생성할 수 있다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포하 국재화를 제공하는 이종 서열 (예를 들어, 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호: ER 체류 신호 등)과 융합함으로써 생성된다. 일부 실시양태에서, 이종 서열은 추적 또는 정제의 용이성을 위한 태그 (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; HIS 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다. 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다. 일부 실시양태에서, 이종 서열은 관심 뉴클레오티드 (예를 들어, 뉴클레오티드 결합 단백질의 압타머 또는 표적 부위)에 대한 결합 도메인 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드가 또 다른 관심 단백질, 예를 들어 DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제인자, 동원 단백질 등과 결합할 수 있는 능력을 제공하기 위함)을 제공할 수 있다.

일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체 중 임의의 것에 따르면, B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체는 감소된 엔도데옥시리보뉴클레아제 활성을 갖는다. 예를 들어, 본 개시내용의 전사 조정 방법에 사용하기 적합한 B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 엔도데옥시리보뉴클레아제 활성의 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 1% 미만, 또는 약 0.1% 미만을 나타낸다.

일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 검출가능한 엔도데옥시리보뉴클레아제 활성을 실질적으로 갖지 않는다 (dB-GEn.1 또는 B-GEn.2). 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체가 감소된 촉매 활성을 가질 때, 이러한 폴리펩티드는 가이드 RNA와 상호작용할 수 있는 능력을 유지하는 한 여전히 부위-특이적 방식으로 표적 DNA와 결합할 수 있다 (이는 가이드 RNA에 의해 표적 DNA 서열로 여전히 가이드되기 때문임). 일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 상보적 가닥을 절단할 수 있지만 표적 DNA의 비-상보적 가닥을 절단할 수 있는 능력이 감소된 닉카제이다.

일부 실시양태에서, 닉카제 내의 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 비-상보적 가닥을 절단할 수 있지만 표적 DNA의 상보적 가닥을 절단할 수 있는 능력이 감소된다.

일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 상보적 가닥과 비-상보적 가닥 둘 다를 절단할 수 있는 능력이 감소된다. 예를 들어, 알라닌 치환이 고려된다.

일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 융합 폴리펩티드 ("변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드"), 예를 들어 i) 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드; 및 ii) 공유적으로 연결된 이종 폴리펩티드 ("융합 파트너"로서 지칭되기도 함)를 포함하는 융합 폴리펩티드이다.

이종 폴리펩티드는 변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산 서열은 또 다른 핵산 서열에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 뉴클레오티드 서열을 생성할 수 있다. 일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드는 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 세포하 국재화를 제공하는 이종 서열과 융합함으로써 생성된다 (예를 들어, 이종 서열은 세포하 국재화 서열, 예를 들어 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호; ER 체류 신호 등임). 일부 실시양태에서, 이종 서열은 추적 및/또는 정제의 용이성을 위한 태그 (예를 들어, 이종 서열은 검출가능한 표지임) (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다. 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다 [예를 들어, 이종 서열은 안정성 제어 펩티드, 예를 들어 데그론이며, 이는 일부 경우에 제어가능하다 (예를 들어, 온도 감수성 또는 약물 제어가능한 데그론 서열, 하기 참조)]. 일부 실시양태에서, 이종 서열은 표적 DNA로부터의 증가되거나 감소된 전사를 제공할 수 있다 (예를 들어, 이종 서열은 전사 조정 서열, 예를 들어 전사 인자/활성인자 또는 그의 단편, 전사 인자/활성인자를 동원하는 단백질 또는 그의 단편, 전사 억제인자 또는 그의 단편, 전사 억제인자를 동원하는 단백질 또는 그의 단편, 소분자/약물 반응성 전사 조절인자 등임). 일부 실시양태에서, 이종 서열은 결합 도메인을 제공할 수 있다 (예를 들어, 이종 서열은, 예를 들어, 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드가 또 다른 관심 단백질, 예를 들어 DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제인자, 동원 단백질 등과 결합할 수 있는 능력을 제공하기 위한 단백질 결합 서열임).

증가되거나 감소된 안정성을 제공하는 적합한 융합 파트너는 데그론 서열을 포함하나 이에 제한되지는 않는다. 데그론은 그를 포함하는 단백질의 안정성을 제어하는 아미노산 서열인 것으로 관련 기술분야의 통상의 기술자에 의해 쉽게 이해된다. 예를 들어, 데그론 서열을 포함하는 단백질의 안정성은 데그론 서열에 의해 적어도 부분적으로 제어된다. 일부 실시양태에서, 적합한 데그론은, 이러한 데그론이 실험 제어와 무관하게 단백질 안정성에 영향을 미치도록 구성적이다 (예를 들어, 데그론은 약물 유도성, 온도 유도성 등이 아님). 일부 실시양태에서, 데그론은 원하는 조건에 따라 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 "온" (예를 들어, 안정) 또는 "오프" (예를 들어, 불안정, 성능 저하) 상태로 설정할 수 있도록 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 제어가능한 안정성을 제공한다. 예를 들어, 데그론이 온도 감수성 데그론인 경우, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 임계 온도 (예를 들어, 42℃, 41℃, 40℃, 39℃, 38℃, 37℃, 36℃, 35℃, 34℃, 33℃, 32℃, 31℃, 30℃ 등) 아래에서는 기능적일 수 있지만 (예를 들어, "온", 안정) 임계 온도 위에서는 비-기능적일 수 있다 (예를 들어, "오프", 성능 저하). 또 다른 예로서, 데그론이 약물 유도성 데그론인 경우, 약물의 존재 또는 부재는 단백질을 "오프" (예를 들어, 불안정) 상태에서 "온" (예를 들어, 안정) 상태로 또는 그 반대로 전환시킬 수 있다. 예시적인 약물 유도성 데그론은 FKBP12 단백질로부터 유래된다. 데그론의 안정성은 데그론과 결합하는 소분자의 존재 또는 부재에 의해 제어된다.

적합한 데그론의 예는 쉴드(Shield)-1, DHFR, 옥신 및/또는 온도에 의해 제어되는 데그론을 포함하나 이에 제한되지는 않는다. 적합한 데그론의 비제한적인 예는 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Dohmen et al., Science, 1994. 263(5151): p. 1273-1276: Heat-inducible degron: a method for constructing temperature-sensitive mutants; Schoeber et al., Am J Physiol Renal Physiol. 2009 Jan;296(1):F204-11: Conditional fast expression and function of multimeric TRPV5 channels using Shield-1; Chu et al., Bioorg Med Chem Lett. 2008 Nov 15;18(22):5941-4: Recent progress with FKBP-derived destabilizing domains; Kanemaki, Pflugers Arch. 2012 Dec 28: Frontiers of protein expression control with conditional degrons; Yang et al., Mol Cell. 2012 Nov 30;48(4):487-8: Titivated for destruction: the methyl degron; Barbour et al., Biosci Rep. 2013 Jan 18;33(1).: Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase; 및 Greussing et al., J Vis Exp. 2012 Nov 10;(69): Monitoring of ubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein]; 이들 모두는 전체 내용이 본원에 참조로 포함됨).

예시적인 데그론 서열은 세포와 동물 둘 다에서 널리 특징규명되었고 시험되었다. 따라서, B-GEn.1 또는 B-GEn.2를 데그론 서열과 융합시키면 "조정가능"하고 "유도성"인 B-GEn.1 또는 B-GEn.2 폴리펩티드가 생산된다. 본원에 기재된 융합 파트너 중 임의의 것은 임의의 바람직한 조합으로 사용될 수 있다. 이러한 점을 예시하기 위한 하나의 비제한적인 예로서, B-GEn.1 또는 B-GEn.2 융합 단백질은 검출을 위한 YFP 서열, 안정성을 위한 데그론 서열, 및 표적 DNA로부터의 전사를 증가시키기 위한 전사 활성인자 서열을 포함할 수 있다. 더욱이, B-GEn.1 또는 B-GEn.2 융합 단백질에 사용될 수 있는 융합 파트너의 수는 무제한이다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 융합 단백질은 1개 이상 (예를 들어, 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상)의 이종 서열을 포함한다.

적합한 융합 파트너는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 크로토닐화 활성, 탈크로토닐화 활성, 프로피오닐화 활성, 탈프로피오닐화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않으며, 이들 중 임의의 것은 DNA를 직접적으로 변형시키거나 (예를 들어, DNA의 메틸화) DNA-연관 폴리펩티드 (예를 들어, 히스톤 또는 DNA 결합 단백질)를 변형시키는 것을 지시될 수 있다. 추가의 적합한 융합 파트너는 경계 요소 (예를 들어, CTCF), 주변 동원을 제공하는 단백질 및 그의 단편 (예를 들어, 라민 A, 라민 B 등), 및 단백질 도킹 요소 (예를 들어, FKBP/FRB, Pil 1/Aby 1 등)를 포함하나 이에 제한되지는 않는다.

B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 또한 통상적인 재조합 합성 방법에 따라 단리 및 정제될 수 있다. 발현 숙주의 용해물을 제조할 수 있으며, 용해물은 HPLC, 배제 크로마토그래피, 겔 전기영동, 친화성 크로마토그래피, 또는 기타 정제 기술을 사용하여 정제될 수 있다. 대부분의 경우, 사용되는 조성물은 산물의 제조 방법 및 그의 정제와 관련된 오염 물질과 관련하여, 원하는 산물의 적어도 20 중량%, 적어도 약 75 중량%, 적어도 약 95 중량%를 포함할 것이며, 치료 목적의 경우에는, 전형적으로 적어도 99.5 중량%를 포함할 것이다. 일반적으로 백분율은 총 단백질을 기준으로 한다. DNA 절단 및 재조합을 유도하거나 표적 DNA에 대한 임의의 원하는 변형 또는 표적 DNA와 연관된 폴리펩티드에 대한 임의의 원하는 변형을 유도하기 위해, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드는, 그들이 핵산 또는 폴리펩티드로서 도입되는지의 여부에 관계없이, 약 30분 내지 약 24시간, 예를 들어 1시간, 1시간 30분, 2시간, 2시간 30분, 3시간, 3시간 30분, 4시간, 5시간, 6시간, 7시간, 8시간, 12시간, 16시간, 18시간, 20시간, 또는 약 30분 내지 약 24시간의 임의의 다른 기간 동안 세포에 제공되며, 이는 약 매일 내지 약 4일마다, 예를 들어 1.5일마다, 2일마다, 3일마다의 빈도, 또는 약 매일 내지 약 4일마다의 임의의 다른 빈도로 반복될 수 있다. 작용제(들)는 세포에 1회 이상, 예를 들어 1회, 2회, 3회, 또는 3회 초과로 제공될 수 있으며, 세포는 각각의 접촉 사건 후 일정 시간, 예를 들어, 16-24시간 동안 작용제(들)와 함께 인큐베이션되고, 그 후 배지는 신선한 배지로 교체되고 세포는 추가로 배양된다. 2개 이상의 상이한 표적화 복합체가 세포에 제공되는 경우 (예를 들어, 동일하거나 상이한 표적 DNA 내의 상이한 서열에 상보적인 2개의 상이한 가이드 RNA), 복합체는 동시에 제공되거나 (예를 들어, 2개의 폴리펩티드 및/또는 핵산으로서) 또는 동시에 전달될 수 있다. 대안적으로, 이들은 연속적으로 제공될 수 있으며, 예를 들어 표적화 복합체가 먼저 제공되고, 이어서 제2 표적화 복합체가 제공되거나 그 반대일 수도 있다.

핵산

가이드 RNA / sgRNA

일부 실시양태에서 본원에 기재된 시스템, 조성물 및 방법은 연관된 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 활성을 표적 핵산 내의 특이적 표적 서열로 지시할 수 있는 게놈-표적화 핵산을 이용한다. 일부 실시양태에서, 게놈-표적화 핵산은 RNA이다. 게놈-표적화 RNA는 본원에서 "가이드 RNA" 또는 "gRNA"로서 지칭된다. 가이드 RNA는 관심 표적 핵산 서열 및 CRISPR 반복 서열 (이러한 CRISPR 반복 서열은 "tracr 메이트 서열"로서 지칭되기도 함)과 혼성화할 수 있는 적어도 스페이서 서열을 갖는다. 유형 II 시스템에서, gRNA는 tracrRNA 서열이라는 제2 RNA를 갖는다. 유형 II 가이드 RNA (gRNA)에서는, CRISPR 반복 서열과 tracrRNA 서열이 서로 혼성화되어 이중나선을 형성한다. 유형 V 가이드 RNA (gRNA)에서는, crRNA가 이중나선을 형성한다. 두 시스템 모두에서, 이중나선은 가이드 RNA와 부위-지시된 폴리펩티드가 복합체를 형성하도록 부위-특이적 폴리펩티드와 결합한다. 게놈-표적화 핵산은 부위-특이적 폴리펩티드와의 회합을 통해 복합체에 표적 특이성을 제공한다. 따라서 게놈-표적화 핵산은 부위-특이적 폴리펩티드의 활성을 지시한다.

일부 실시양태에서, 게놈-표적화 핵산은 이중 분자 가이드 RNA이다. 일부 실시양태에서, 게놈-표적화 핵산은 단일 분자 가이드 RNA 또는 단일 가이드 RNA (sgRNA)이다. 이중 분자 가이드 RNA는 2개 가닥의 RNA를 갖는다. 제1 가닥은 5'에서 3' 방향으로, 임의적 스페이서 연장 서열, 스페이서 서열 및 최소 CRISPR 반복 서열을 갖는다. 제2 가닥은 최소 tracrRNA 서열 (최소 CRISPR 반복 서열에 상보적임), 3' tracrRNA 서열 및 임의적 tracrRNA 연장 서열을 갖는다. 유형 II 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 스페이서 연장 서열, 스페이서 서열, 최소 CRISPR 반복 서열, 단일 분자 가이드 링커, 최소 tracrRNA 서열, 3' tracrRNA 서열 및 임의적 tracrRNA 연장 서열을 갖는다. 임의적 tracrRNA 연장부는 가이드 RNA에 부가의 기능성 (예를 들어, 안정성)을 제공하는 요소를 가질 수 있다. 단일 분자 가이드 링커는 최소 CRISPR 반복부와 최소 tracrRNA 서열을 연결하여 헤어핀 구조를 형성한다. 임의적 tracrRNA 연장부는 하나 이상의 헤어핀을 갖는다.

유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 최소 CRISPR 반복 서열과 스페이서 서열을 갖는다. 또는 대안적으로, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 tracr 연장 서열, tracr RNA 서열, 단일 분자 가이드 링커, 최소 CRISPR 반복 서열, 스페이서 서열, 및 임의적 스페이서 연장 서열을 갖는다.

대안적으로, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 연장 서열, 최소 CRISPR 반복 서열, 스페이서 서열, 및 임의적 스페이서 연장 서열을 갖는다.

또 다른 대안에서, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 연장 서열, 인공 뉴클레아제 결합 RNA 서열 및 스페이서 서열, 및 임의적 스페이서 연장 서열을 포함한다.

본 발명에 따른 CRISPR Cas 뉴클레아제 및 잠재적으로 다른 유형 V CRISPR Cas 뉴클레아제에 특히 유용한 sgRNA는 서열식별번호: 40-44에 개시된 서열이다.

이들은 3' 단부 상에의 적합한 표적 특이적 서열의 부가를 허용한다.

예시적인 게놈-표적화 핵산은, 예를 들어, WO2018002719에 기재되어 있다. 일반적으로, CRISPR 반복 서열은 (1) 상응하는 tracr 서열을 함유하는 세포에서 CRISPR 반복 서열에 의해 플랭킹된 DNA 표적화 세그먼트를 절제하는 것; 및 (2) tracr 서열과 혼성화된 CRISPR 반복 서열을 포함하는 CRISPR 복합체를 표적 서열에서 형성하는 것 중 하나 이상을 촉진시키기 위해 tracr 서열과 충분한 상보성을 갖는 임의의 서열을 포함한다. 일반적으로, 상보성의 정도는 CRISPR 반복 서열과 tracr 서열 중 더 짧은 것의 길이를 따라, 이들 CRISPR 반복 서열과 tracr 서열의 최적의 정렬을 참조한 것이다. 최적의 정렬은 임의의 적합한 정렬 알고리즘에 의해 결정될 수 있으며 2차 구조, 예컨대 tracr 서열 또는 CRISPR 반복 서열 내의 자기 상보성을 추가로 설명할 수 있다. 일부 실시양태에서, 최적으로 정렬되었을 때 tracr 서열과 CRISPR 반복 서열 중 더 짧은 것의 30개 뉴클레오티드 길이를 따라 이들 tracr 서열과 CRISPR 반복 서열 간의 상보성 정도는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 또는 그 초과이다. 일부 실시양태에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50개 또는 그 초과의 뉴클레오티드 길이이다. 일부 실시양태에서, tracr 서열과 CRISPR 반복 서열은 단일 전사체 내에 함유되어, 이들 두 서열 간의 혼성화가 2차 구조, 에컨대 헤어핀을 갖는 전사체를 생산한다. 일부 실시양태에서, 전사체 또는 전사된 폴리뉴클레오티드 서열은 적어도 2개 이상의 헤어핀을 갖는다.

가이드 RNA의 스페이서는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함한다. 다시 말해서, 가이드 RNA의 스페이서는 혼성화 (예를 들어, 염기쌍 형성)를 통해 서열-특이적 방식으로 표적 DNA와 상호작용한다. 따라서, 스페이서의 뉴클레오티드 서열은 다양할 수 있으며 가이드 RNA와 표적 DNA가 상호작용할 표적 DNA 내의 위치를 결정할 수 있다. 가이드 RNA의 DNA-표적화 세그먼트는 표적 DNA 내의 임의의 원하는 서열과 혼성화되도록 변형될 수 있다 (예를 들어, 유전 공학에 의함).

일부 실시양태에서, 스페이서는 10개 뉴클레오티드 내지 30개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 13개 뉴클레오티드 내지 25개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 15개 뉴클레오티드 내지 23개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 18개 뉴클레오티드 내지 22개 뉴클레오티드, 예를 들어 20개 내지 22개 뉴클레오티드의 길이를 갖는다.

일부 실시양태에서, 스페이서의 DNA-표적화 서열과 표적 DNA의 프로토스페이서 간의 상보성 퍼센트는 20-22개 뉴클레오티드에 걸쳐 적어도 60% (예를 들어, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)이다.

일부 실시양태에서, 프로토스페이서는 그의 3' 단부 상에서 적합한 PAM 서열에 직접적으로 인접하거나 또는 이러한 PAM 서열은 3' 부분에서 DNA 표적화 서열의 일부이다.

가이드 RNA의 변형은 가이드 RNA 및 Cas 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 포함하는 CRISPR-Cas 게놈 편집 복합체의 형성 또는 안정성을 향상시키는데 사용될 수 있다. 가이드 RNA의 변형은 또한 또는 대안적으로, 게놈 편집 복합체와 게놈 내 표적 서열 간의 상호작용의 개시, 안정성 또는 동역학을 향상시키는데 사용될 수 있으며, 이는 예를 들어 온-타겟 활성을 향상시키는데 사용될 수 있다. 가이드 RNA의 변형은 또한 또는 대안적으로, 특이성, 예를 들어 다른 (오프-타겟) 부위에서의 효과와 비교 시 온-타겟 부위에서의 게놈 편집의 상대적 비율을 향상시키기 위해 사용될 수 있다.

변형은 또한 또는 대안적으로, 예를 들어 세포에 존재하는 리보뉴클레아제 (RNase)에 의한 분해에 대한 저항성을 증가시켜 세포 내 반감기를 증가시킴으로써, 가이드 RNA의 안정성을 증가시키기 위해 사용될 수 있다. 가이드 RNA 반감기를 향상시키는 변형은 Cas 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2가 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 생성하기 위해 번역되어야 하는 RNA를 통해 편집될 세포 내로 도입되는 실시양태에서 특히 유용할 수 있는데, 이는 엔도뉴클레아제를 코딩하는 RNA와 동시에 도입된 가이드 RNA의 반감기를 증가시키는 것이 가이드 RNA와 코딩된 Cas 엔도뉴클레아제가 세포에 공존하는 시간을 증가시키는데 사용될 수 있기 때문이다.

공여자 DNA 또는 공여자 템플릿

부위-특이적 폴리펩티드, 예컨대 DNA 엔도뉴클레아제는 핵산, 예를 들어 게놈 DNA에 이중 가닥 파손부 또는 단일 가닥 파손부를 도입할 수 있다. 이중 가닥 파손부는 세포의 내인성 DNA-복구 경로 (예를 들어, 상동성 의존적 복구 (HDR) 또는 비-상동 말단 연결 또는 대체 비-상동 말단 연결 (A-NHEJ) 또는 마이크로상동성-매개 말단 연결 (MMEJ))를 자극할 수 있다. NHEJ는 상동 템플릿에 대한 필요성 없이도 절단된 표적 핵산을 복구할 수 있다. 이로 인해 때때로 절단 부위의 표적 핵산에 작은 결실이나 삽입 (삽입-결실)이 발생하여 유전자 발현이 중단되거나 변경될 수 있다. 상동 재조합 (HR)으로서 공지되기도 한 HDR은 상동 복구 템플릿 또는 공여자가 이용가능한 경우에 발생할 수 있다.

상동 공여자 템플릿은 표적 핵산 절단 부위를 플랭킹하는 서열과 상동인 서열을 갖는다. 자매 염색분체는 일반적으로 복구 템플릿으로서 세포에 의해 사용된다. 그러나, 게놈 편집을 목적으로, 복구 템플릿은 종종 외인성 핵산, 예컨대 플라스미드, 이중나선 올리고뉴클레오티드, 단일 가닥 올리고뉴클레오티드, 이중 가닥 올리고뉴클레오티드, 또는 바이러스 핵산으로서 공급된다. 외인성 공여자 템플릿의 경우, 부가의 또는 변경된 핵산 서열이 또한 표적 로커스에 혼입되도록 상동성의 플랭킹 영역 사이에 부가의 핵산 서열 (예컨대 트랜스진) 또는 변형 (예컨대 단일 또는 다중 염기 변화 또는 결실)을 도입하는 것이 통상적이다. MMEJ는 절단 부위에서 작은 결실 및 삽입이 발생할 수 있다는 점에서 NHEJ와 유사한 유전적 결과를 초래한다. MMEJ는 절단 부위를 플랭킹하는 몇 개의 염기쌍의 상동 서열을 사용하여, 선호되는 말단-연결 DNA 복구 결과를 구동시킨다. 일부 실시양태에서, 뉴클레아제 표적 영역에서의 잠재적인 마이크로상동성의 분석에 기반하여 가능한 복구 결과를 예측하는 것이 가능할 수 있다.

따라서 일부 경우에, 외인성 폴리뉴클레오티드 서열을 표적 핵산 절단 부위에 삽입하기 위해 상동 재조합이 사용된다. 외인성 폴리뉴클레오티드 서열은 본원에서 공여자 폴리뉴클레오티드 (또는 공여자 또는 공여자 서열 또는 폴리뉴클레오티드 공여자 템플릿)로 지칭된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부분, 공여자 폴리뉴클레오티드의 카피, 또는 공여자 폴리뉴클레오티드의 카피의 일부분이 표적 핵산 절단 부위에 삽입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 외인성 폴리뉴클레오티드 서열, 즉 표적 핵산 절단 부위에서 자연적으로 발생하지 않는 서열이다.

이중 가닥 파손이 발생하는 세포의 핵 내부에 외인성 DNA 분자가 충분한 농도로 공급되는 경우, NHEJ 복구 프로세스 동안 외인성 DNA가 이중 가닥 파손부에 삽입될 수 있으므로 게놈에 영구적으로 부가될 수 있다. 이러한 외인성 DNA 분자는 일부 실시양태에서 공여자 템플릿으로서 지칭된다. 공여자 템플릿이 임의로 관련 조절 서열, 예컨대 프로모터, 인핸서, 폴리A 서열 및/또는 스플라이스 수용체 서열과 함께 본원에 기재된 하나 이상의 시스템 구성요소에 대한 코딩 서열을 함유하는 경우, 하나 이상의 시스템 구성요소는 게놈에 통합된 핵산으로부터 발현되어 세포의 수명 동안 영구적인 발현을 초래할 수 있다. 더욱이, 공여자 DNA 템플릿의 통합된 핵산은 세포가 분열할 때 딸 세포로 전달될 수 있다.

이중 가닥 파손부의 어느 한쪽 (상동성 아암으로서 지칭됨)에 DNA 서열과 상동성을 갖는 플랭킹 DNA 서열을 함유하는 충분한 농도의 공여자 DNA 템플릿이 있는 경우, 이러한 공여자 DNA 템플릿은 HDR 경로를 통해 통합될 수 있다. 상동성 아암은 공여자 템플릿과 이중 가닥 파손부의 어느 한쪽 서열 간의 상동 재조합을 위한 기질로서 작용한다. 이로 인해 이중 가닥 파손부의 어느 한쪽 서열이 비변형된 게놈 내의 것으로부터 변경되지 않는 공여자 템플릿의 오류 없는 삽입이 발생할 수 있다.

HDR에 의한 편집을 위해 공급되는 공여자는 매우 다양하지만 일반적으로 게놈 DNA에 어닐링을 허용하는 작거나 큰 플랭킹 상동성 아암이 있는 의도된 서열을 함유한다. 도입된 유전적 변화를 플랭킹하는 상동성 영역은 30 bp 이하이거나, 또는 프로모터, cDNA 등을 함유할 수 있는 멀티 킬로염기 카세트만큼 클 수 있다. 단일 가닥 및 이중 가닥 올리고뉴클레오티드 공여자 둘 다를 사용할 수 있다. 이러한 올리고뉴클레오티드의 크기는 100 nt 미만 내지 수 kb 초과의 범위이지만, 더 긴 ssDNA가 생성되어 사용될 수도 있다. PCR 앰플리콘, 플라스미드, 및 미니서클을 포함한 이중 가닥 공여자가 종종 사용된다. 일반적으로, 개별 공여자에 대한 패키징 제한이 <5 kb이긴 하지만, AAV 벡터는 공여자 템플릿을 전달하는 매우 효과적인 수단이라는 것이 밝혀졌다. 공여자의 활성 전사는 HDR을 3배 증가시켰는데, 이는 프로모터의 봉입이 전환을 증가시킬 수 있다는 것을 나타낸다. 반대로, 공여자의 CpG 메틸화는 유전자 발현과 HDR을 감소시킬 수 있다.

일부 실시양태에서, 공여자 DNA는 뉴클레아제와 함께 또는 독립적으로 다양한 상이한 방법, 예를 들어 형질감염, 나노입자, 마이크로-주사, 또는 바이러스 형질도입에 의해 공급될 수 있다. 일부 실시양태에서 HDR에 대한 공여자의 가용성을 증가시키기 위해 다양한 테더링 옵션이 사용될 수 있다. 그 예는 공여자를 뉴클레아제에 부착하는 것, 근처와 결합하는 DNA 결합 단백질에 부착하는 것, 또는 DNA 말단 결합 또는 복구에 관여하는 단백질에 부착하는 것을 포함한다.

NHEJ 또는 HDR에 의한 게놈 편집 외에도, NHEJ 경로와 HR 둘 다를 사용하는 부위-특이적 유전자 삽입을 시행할 수 있다. 가능하게는 인트론/엑손 경계를 포함한, 조합 접근 방식을 특정 설정에 적용할 수 있다. NHEJ는 인트론의 라이게이션에 유효한 것으로 입증될 수 있는 반면, 오류 없는 HDR은 코딩 영역에 더 적합할 수 있다.

벡터

또 다른 측면에서, 본원에는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, gRNA, 및/또는 본 개시내용의 실시양태를 수행하는데 필요한 임의의 핵산 또는 단백질성 분자를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산이 제공된다. 일부 실시양태에서, 이러한 핵산은 벡터 (예를 들어, 재조합 발현 벡터)이다.

고려되는 발현 벡터는 백시니아 바이러스, 폴리오바이러스, 아데노바이러스, 아데노-연관 바이러스, SV40, 단순 포진 바이러스, 인간 면역결핍 바이러스, 레트로바이러스를 기반으로 하는 바이러스 벡터 (예를 들어, 뮤린 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 에컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 및 기타 재조합 벡터를 포함하나 이에 제한되지는 않는다. 진핵 표적 세포에 대해 고려되는 다른 벡터는 벡터 pXT1, pSG5, pSVK3, pBPV, pMSG 및 pSVLSV40 [파마시아(Pharmacia)]을 포함하나 이에 제한되지는 않는다. 진핵 표적 세포에 대해 고려되는 부가의 벡터는 벡터 pCTx-1, pCTx-2 및 pCTx-3을 포함하나 이에 제한되지는 않는다. 숙주 세포와 양립가능한 한 다른 벡터가 또한 사용할 수 있다.

일부 실시양태에서, 벡터는 하나 이상의 전사 및/또는 번역 제어 요소를 갖는다. 활용되는 숙주/벡터 시스템에 따라, 구성적 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결인자 등을 포함한 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에 사용될 수 있다. 일부 실시양태에서, 벡터는 바이러스 서열 또는 CRISPR 기구의 구성요소 또는 기타 요소를 불활성화시키는 자기 불활성화 벡터이다.

적합한 진핵 프로모터 (즉, 진핵 세포에서 기능적인 프로모터)의 비제한적인 예는 시토메갈로바이러스 (CMV) 즉시 초기, 단순 포진 바이러스 (HSV) 티미딘 키나제, 초기 및 후기 SV40으로부터의 프로모터, 레트로바이러스로부터의 긴 말단 반복부 (LTR), 인간 신장 인자-1 프로모터 (EF1), 닭 베타-액틴 프로모터 (CAG)와 융합된 시토메갈로바이러스 (CMV) 인핸서를 갖는 하이브리드 구축물, 뮤린 줄기 세포 바이러스 프로모터 (MSCV), 포스포글리세레이트 키나제-1 로커스 프로모터 (PGK), 및 마우스 메탈로티오네인-I를 포함한다.

Cas 엔도뉴클레아제와 연계해서 사용되는 가이드 RNA를 포함한 작은 RNA를 발현하기 위해, 예를 들어 U6 및 H1을 포함한 다양한 프로모터, 예컨대 RNA 폴리머라제 III 프로모터가 유리할 수 있다. 이러한 프로모터의 사용을 향상시키기 위한 설명 및 파라미터는 관련 기술분야에 공지되어 있으며, 부가의 정보 및 접근 방식이 정기적으로 보고되고 있으며; 예를 들어, 문헌 [Ma, H. et al., Molecular Therapy - Nucleic Acids 3, e161 (2014) doi:10.1038/mtna.2014.12]을 참조한다.

발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결인자를 함유할 수 있다. 발현 벡터는 또한 발현 증폭을 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 부위-특이적 폴리펩티드와 융합되어 융합 단백질을 생성하는 비-천연 태그 (예를 들어, 히스티딘 태그, 헤마글루티닌 태그, 녹색 형광 단백질 등)를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.

일부 실시양태에서, 프로모터는 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등)이다. 일부 실시양태에서, 프로모터는 구성적 프로모터 (예를 들어, CMV 프로모터, UBC 프로모터)이다. 일부 실시양태에서, 프로모터는 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이다. 일부 실시양태에서, 유전자가 게놈에 삽입된 후 게놈에 존재하는 내인성 프로모터 하에서 발현될 예정이라면, 벡터는 숙주 세포에서 발현될 적어도 하나의 유전자에 대한 프로모터를 갖지 않는다.

핵산 및 폴리펩티드의 변형

일부 실시양태에서, 본원에 기재된 폴리뉴클레오티드는, 예를 들어, 활성, 안정성 또는 특이성을 향상시키거나, 전달을 변경시키거나, 숙주 세포에서의 선천성 면역 반응을 감소시키거나, 단백질 크기를 추가로 감소시키거나, 또는 본원에 추가로 기재되고 관련 기술분야에 공지된 바와 같은 기타 향상을 위해 사용될 수 있는 하나 이상의 변형을 포함한다. 일부 실시양태에서, 이러한 변형은 서열식별번호: 2의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 초래할 것이다.

코돈-최적화

특정 실시양태에서, 변형된 폴리뉴클레오티드는 본원에 기재된 CRISPR-B-GEn.1 또는 B-GEn.2 시스템에서 사용되며, 여기서 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 폴리뉴클레오티드 서열을 포함하는 DNA 또는 RNA는 하기에 기재되고 예시된 바와 같이 변형될 수 있다. 이러한 변형된 폴리뉴클레오티드는 임의의 하나 이상의 게놈 로커스를 편집하기 위해 CRISPR-B-GEn.1 또는 B-GEn.2 시스템에서 사용될 수 있다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드에서의 이러한 변형은 코돈-최적화를 통해 달성되며, 예를 들어 코딩된 폴리펩티드가 발현되는 특이적 숙주 세포를 기반으로 하여 코돈-최적화된다. 통상의 기술자는 본 개시내용의 임의의 뉴클레오티드 서열 및/또는 재조합 핵산이 임의의 관심 종에서의 발현을 위해 코돈 최적화될 수 있음을 인지할 것이다. 코돈 최적화는 관련 기술분야에 널리 공지되어 있으며 종 특이적 코돈 사용빈도 표를 사용하여 코돈 사용빈도 편향에 대한 뉴클레오티드 서열의 변형을 수반한다. 코돈 사용빈도 표는 관심 종에 대해 가장 많이 발현되는 유전자의 서열 분석을 기반으로 하여 생성된다. 비제한적인 예에서, 뉴클레오티드 서열이 핵에서 발현되어야 하는 경우, 관심 종에 대한 고도로 발현된 핵 유전자의 서열 분석을 기반으로 하여 코돈 사용빈도 표가 생성된다. 뉴클레오티드 서열의 변형은 종 특이적 코돈 사용빈도 표를 천연 폴리뉴클레오티드 서열에 존재하는 코돈과 비교함으로써 결정된다.

일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된다. 예를 들어, 의도된 표적 세포가 인간 세포인 경우, B-GEn.1 또는 B-GEn.2 (또는 B-GEn.1 또는 B-GEn.2 변이체, 예를 들어, 효소적으로 불활성인 변이체)를 코딩하는 인간 코돈-최적화된 폴리뉴클레오티드 서열이 적합할 것이다. 또 다른 비제한적인 예로서, 의도된 숙주 세포가 마우스 세포인 경우, B-GEn.1 또는 B-GEn.2 (또는 B-GEn.1 또는 B-GEn.2 변이체, 예를 들어, 효소적으로 불활성인 변이체)를 코딩하는 마우스 코돈-최적화된 폴리뉴클레오티드 서열이 적합할 것이다.

코돈 최적화를 위한 전략 및 방법론은 관련 기술분야에 공지되어 있으며 효모 (문헌 [Outchkourov et al., Protein Expr Purif, 24(1):18-24 (2002)]) 및 이. 콜라이(E. coli) (문헌 [Feng et al., Biochemistry, 39(50):15399-15409 (2000)])을 포함하나 이에 제한되지는 않는 다양한 시스템에 대해 기재되었다. 일부 실시양태에서, 코돈 최적화는 GeneGPS® 발현 최적화 기술 (ATUM)을 사용하고 제조업체가 권장하는 발현 최적화 알고리즘을 사용하여 수행되었다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 이. 콜라이 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 Sf9 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 코돈 최적화 절차에 사용되는 발현 최적화 알고리즘은 추정 폴리-A 신호 (예를 들어, AATAAA 및 ATTAAA) 뿐만 아니라 폴리머라제 미끄러짐을 초래할 수 있는 A의 긴 (4개 초과) 연장물을 피하도록 규정된다.

관련 기술분야에서 널리 이해되는 바와 같이, 뉴클레오티드 서열의 코돈 최적화를 통해 천연 뉴클레오티드 서열과 100% 미만 (예를 들어, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 미만)의 동일성을 갖지만 여전히 원래의 천연 뉴클레오티드 서열에 의해 코딩된 것과 동일한 기능을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 생성할 수 있다. 따라서, 본 개시내용의 대표적인 실시양태에서, 본 개시내용의 뉴클레오티드 서열 및/또는 재조합 핵산은 특정한 관심 종에서의 발현을 위해 코돈 최적화될 수 있다.

일부 실시양태에서, 코돈-최적화된 폴리뉴클레오티드 서열은 서열식별번호: 1과 적어도 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.2%, 99.5%, 99.8%, 99.9%, 또는 100%의 서열 동일성을 갖는다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 표적 세포에서의 코딩된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일반적으로, 본 개시내용의 폴리뉴클레오티드는 임의의 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 이. 콜라이 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일반적으로, 본 개시내용의 폴리뉴클레오티드는 임의의 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 Sf9 곤충 세포 발현 시스템에서의 발현 증가를 위해 코돈-최적화된다.

의도된 숙주에서의 발현을 최적화하기 위해 폴리아데닐화 신호를 선택할 수도 있다.

기타 변형

변형은 또한 또는 대안적으로, 세포 내로 도입된 RNA가 선천성 면역 반응을 유도하는 가능성 또는 정도를 감소시키기 위해 사용될 수 있다. 하기 및 관련 기술분야에 기재된 바와 같이 소형 간섭 RNA (siRNA)를 포함한 RNA 간섭 (RNAi)의 맥락에서 널리 특징규명되어 있는 이러한 반응은, RNA의 반감기 감소 및/또는 시토카인 또는 면역 반응과 연관된 기타 요인의 유도와 연관되는 경향이 있다.

RNA의 안정성을 향상시키는 변형 (예컨대, 세포에 존재하는 RNase에 의한 분해를 감소시킴으로써), 그 결과로 생성된 산물 (예를 들어, 엔도뉴클레아제)의 번역을 향상시키는 변형, 및/또는 세포 내로 도입된 RNA가 선천성 면역 반응을 유도하는 가능성 또는 정도를 감소시키는 변형을 포함하나 이에 제한되지 않는 하나 이상의 유형의 변형이 또한, 세포 내로 도입되는 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 RNA에 대해 이루어질 수 있다. 전술한 것과 다른 것의 변형의 조합이 마찬가지로 사용될 수 있다. 예를 들어 CRISPR-B-GEn.1 또는 B-GEn.2의 경우, 하나 이상의 유형의 변형이 가이드 RNA에 대해 이루어질 수 있고/거나 (상기 예시된 것 포함) 하나 이상의 유형의 변형이 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 코딩하는 RNA에 대해 이루어질 수 있다 (상기 예시된 것 포함).

예시를 통해, CRISPR-B-GEn.1 또는 B-GEn.2 시스템에 사용되는 가이드 RNA 또는 기타 더 작은 RNA는 하기 예시되고 관련 기술분야에 기재된 바와 같이, 화학적 수단에 의해 쉽게 합성될 수 있으므로 수많은 변형이 쉽게 혼입될 수 있게 한다. 화학적 합성 절차가 지속적으로 확장되고 있긴 하지만, 고성능 액체 크로마토그래피 (PAGE와 같은 겔의 사용을 피하는 HPLC)와 같은 절차를 통해 이러한 RNA를 정제하는 것은, 폴리뉴클레오티드 길이가 100개 정도의 뉴클레오티드를 훨씬 초과하여 증가함에 따라 더욱 어려워지는 경향이 있다. 더 긴 길이의 화학적으로 변형된 RNA를 생성하는데 사용되는 한가지 접근 방식은, 함께 라이게이션되는 2개 이상의 분자를 생산하는 것이다. 훨씬 더 긴 RNA, 예컨대 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 코딩하는 것은 효소적으로 더 쉽게 생성된다. 일반적으로 효소에 의해 생산된 RNA에 사용하기 위해 이용될 수 있는 변형 유형은 더 적지만, 예를 들어 안정성을 향상시키고/거나, 선천성 면역 반응의 가능성 또는 정도를 감소시키고/거나, 하기 및 관련 기술분야에 추가로 기재되는 바와 같은 다른 속성을 향상시키는데 사용될 수 있는 변형이 여전히 존재하며; 새로운 유형의 변형이 정기적으로 개발되고 있다. 다양한 유형의 변형, 특히 더 작은 화학적으로 합성된 RNA와 함께 자주 사용되는 변형의 예시로써, 변형은 당의 2' 위치에서 변형된 하나 이상의 뉴클레오티드, 일부 실시양태에서는 2'-O-알킬, 2'-O-알킬-O-알킬 또는 2'-플루오로-변형된 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, RNA 변형은 RNA의 3' 단부에 피리미딘의 리보스, 염기성 잔기 또는 역 염기 상의 2'-플루오로, 2'-아미노 및 2' O-메틸 변형을 포함한다. 이러한 변형은 일상적으로 올리고뉴클레오티드에 혼입되며, 이들 올리고뉴클레오티드는 주어진 표적에 대항한 2'-데옥시 올리고뉴클레오티드보다 더 높은 Tm (예를 들어, 더 높은 표적 결합 친화도)을 갖는 것으로 나타났다.

다수의 뉴클레오티드 및 뉴클레오시드 변형은 이들이 혼입되는 올리고뉴클레오티드가 천연 올리고뉴클레오티드보다 뉴클레아제 소화에 대해 더 저항성이 되도록 하는 것으로 나타났으며; 이러한 변형된 올리고뉴클레오티드는 비변형된 올리고뉴클레오티드보다 더 오랫동안 무손상으로 생존한다. 변형된 올리고뉴클레오티드의 구체적 예는 변형된 백본, 예를 들어 포스포로티오에이트, 포스포트리에스테르, 메틸 포스포네이트, 단쇄 알킬 또는 시클로알킬 당간 연결 또는 단쇄 헤테로원자 또는 헤테로시클릭 당간 연결을 포함하는 것을 포함한다. 일부 올리고뉴클레오티드는 포스포로티오에이트 백본을 갖는 올리고뉴클레오티드 및 헤테로원자 백본, 특히 CH2-NH-O-CH2, CH, -N(CH3)-O-CH2 (메틸렌(메틸이미노) 또는 MMI 백본으로서 공지됨), CH2-O-N(CH3)-CH2, CH2-N(CH3)-N(CH3)-CH2 및 O-N(CH3)-CH2-CH2 백본; 아미드 백본 (문헌 [De Mesmaeker et al., Ace. Chem. Res., 28:366-374 (1995)] 참조); 모르폴리노 백본 구조 (미국 특허 번호 5,034,506 (Summerton and Weller) 참조); 펩티드 핵산 (PNA) 백본 (여기서 올리고뉴클레오티드의 포스포디에스테르 백본은 폴리아미드 백본으로 대체되고, 뉴클레오티드는 폴리아미드 백본의 아자 질소 원자와 직접적으로 또는 간접적으로 결합됨; 문헌 [Nielsen et al., Science 1991, 254, 1497] 참조)을 갖는 올리고뉴클레오티드이다. 인-함유 연결은 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3' 알킬렌 포스포네이트 및 키랄 포스포네이트를 포함한 메틸 및 기타 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함한 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트, 이들의 2'-5' 연결된 유사체, 및 뉴클레오시드 단위의 인접한 쌍이 3'-5'에서 5'-3'로 연결되거나 또는 2'-5'에서 5'-2'로 연결되는 반전된 극성을 갖는 것을 포함하나 이에 제한되지는 않으며; 미국 특허 번호 3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 및 5,625,050을 참조한다.

모르폴리노-기반 올리고머 화합물은 문헌 [Braasch and Corey, Biochemistry, 41(14): 4503-4510 (2002); Genesis, Volume 30, Issue 3, (2001); Heasman, Dev. Biol., 243:209-214 (2002); Nasevicius et al., Nat. Genet., 26:216-220 (2000); Lacenra etc., Proc. Natl. Acad. Sci., 97: 9591-9596 (2000)]; 및 1991년 7월 23일에 허여된 미국 특허 번호 5,034,506에 기재되어 있다. 시클로헥세닐 핵산 올리고뉴클레오티드 모방체는 문헌 [Wang et al., J. Am. Chem. Soc., 122: 8595-8602 (2000)]에 기재되어 있다.

그 안에 인 원자를 포함하지 않는 변형된 올리고뉴클레오티드 백본은 단쇄 알킬 또는 시클로알킬 뉴클레오시드간 연결, 혼합 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결에 의해 형성되는 백본을 갖는다. 이들은 모르폴리노 연결 (부분적으로 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌히드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본; 및 혼합된 N, O, S 및 CH2 구성요소 일부를 갖는 기타를 갖는 것을 포함하며; 미국 특허 번호 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 및 5,677,439 (이들 각각은 본원에 참조로 포함됨)를 참조한다.

하나 이상의 치환된 당 모이어티가 또한 포함될 수 있으며, 예를 들어 2' 위치에 하기 중 하나를 포함한다: OH, SH, SCH₃, F, OCN, OCH₃, OCH₃ O(CH₂)_n CH₃, O(CH₂)_n NH₂ 또는 O(CH₂)_n CH₃ (여기서 n은 1 내지 10임); C₁ 내지 C₁₀ 저급 알킬, 알콕시알콕시, 치환된 저급 알킬, 알카릴 또는 아르알킬; Cl; Br; CN; CF₃; OCF₃; O-, S-, 또는 N-알킬; O-, S- 또는 N-알케닐: SOCH₃; SO₂CH₃; ONO₂; NO₂; N₃; NH₂; 헤테로시클로알킬; 헤테로시클로알카릴; 아미노알킬아미노; 폴리알킬아미노; 치환된 실릴; RNA 절단 기; 리포터 기; 인터칼레이터; 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기; 또는 올리고뉴클레오티드 및 유사한 특성을 갖는 다른 치환기의 약력학적 특성을 개선시키기 위한 군. 일부 실시양태에서, 변형은 2'-메톡시에톡시 (2'-O-(2-메톡시에틸)로서 공지되기도 한 2'-O-CH₂CH₂OCH₃)를 포함한다 (Martin et al., Helv. Chim. Acta, 1995, 78, 486). 다른 변형은 2'-메톡시 (2'-O-CH₃), 2'-프로폭시 (2'-OCH₂CH₂CH₃) 및 2'-플루오로 (2'-F)를 포함한다. 유사한 변형이 또한 올리고뉴클레오티드 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 올리고뉴클레오티드는 또한 펜토푸라노실 기 대신에 시클로부틸과 같은 당 모방체를 가질 수 있다. 일부 실시양태에서, 뉴클레오티드 단위의 당 및 뉴클레오시드간 연결, 예를 들어 백본은 모두 신규 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 혼성화를 위해 유지된다. 우수한 혼성화 특성을 갖는 것으로 밝혀진 올리고뉴클레오티드 모방체인 이러한 올리고머 화합물 중 하나가 펩티드 핵산 (PNA)으로서 지칭된다. PNA 화합물에서, 올리고뉴클레오티드의 당-백본은 아미드 함유 백본, 예를 들어 아미노에틸글리신 백본으로 대체된다. 핵염기는 유지되며 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합한다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262를 포함하나 이에 제한되지는 않는다. PNA 화합물에 대한 추가의 교시는 문헌 [Nielsen et al., Science, 254: 1497-1500 (1991)]에서 찾을 수 있다.

가이드 RNA는 또한 부가적으로 또는 대안적으로, 핵염기 (종종 관련 기술분야에서 간단히 "염기"로서 지칭됨) 변형 또는 치환을 포함할 수 있다. 본원에 사용된 바와 같은 "비변형된" 또는 "자연" 핵염기는 아데닌 (A), 구아닌 (G), 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 핵염기는 자연 핵산, 예를 들어, 히포크산틴, 6-메틸아데닌, 5-Me 피리미딘, 특히 5-메틸시토신 (5-메틸-2' 데옥시시토신으로서 지칭되기도 하며, 종종 관련 기술분야에서 5-Me-C로서 지칭됨), 5-히드록시메틸시토신 (HMC), 글리코실 HMC 및 젠토비오실 HMC 뿐만 아니라 합성 핵염기, 예를 들어 2-아미노아데닌, 2-(메틸아미노)아데닌, 2-(이미다졸릴알킬)아데닌, 2-(아미노알킬아미노)아데닌 또는 기타 헤테로치환된 알킬아데닌, 2-티오우라실, 2-티오티민, 5-브로모우라실, 5-히드록시메틸우라실, 8-아자구아닌, 7-데아자구아닌, N6 (6-아미노헥실)아데닌 및 2,6-디아미노퓨린에서 단지 드물게 또는 일시적으로 발견되는 핵염기를 포함한다 (Kornberg, A, DNA Replication, W. H. Freeman & Co., San Francisco, pp75-77 (1980); Gebeyehu et al., Nucl. Acids Res. 15:4513 (1997)). 관련 기술분야에 공지된 "범용" 염기, 예를 들어 이노신이 또한 포함될 수 있다. 5-Me-C 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi, Y. S., in Crooke, S. T. and Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 이는 염기 치환의 실시양태이다.

변형된 핵염기는 기타 합성 및 자연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 히포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도-우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 기타 a-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸쿠아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다.

다른 유용한 핵염기는 미국 특허 번호 3,687,808에 개시된 것, 문헌 ["The Concise Encyclopedia of Polymer Science And Engineering", pages 858-859, Kroschwitz, J.l., ed. John Wiley & Sons, 1990]에 개시된 것, 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, page 613]에 개시된 것, 및 문헌 [Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S.T. and Lebleu, B. ea., CRC Press, 1993]에 개시된 것을 포함한다. 이들 핵염기 중 특정한 것은 본 개시내용의 올리고머 화합물의 결합 친화도를 증가시키는데 특히 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘; 및 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 포함한 N-2, N-6 및 -O-6 치환된 퓨린을 포함한다. 5-메틸시토신 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi, Y.S., Crooke, S.T. and Lebleu, B., eds, "Antisense Research and Applications", CRC Press, Boca Raton, 1993, pp. 276-278]), 이는 더욱 특히 2'-O-메톡시에틸 당 변형과 조합될 때 염기 치환의 실시양태이다. 변형된 핵염기는 미국 특허 번호 3,687,808 뿐만 아니라 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,596,091; 5,614,617; 5,681,941; 5,750,692; 5,763,588; 5,830,653; 6,005,096; 및 미국 특허 출원 공보 20030158403에 기재되어 있다.

주어진 올리고뉴클레오티드 내의 모든 위치가 균일하게 변형될 필요는 없으며, 실제로 전술한 변형 중 하나 초과가 단일 올리고뉴클레오티드에 또는 심지어 올리고뉴클레오티드 내의 단일 뉴클레오시드 내에 혼입될 수 있다.

일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 현재 캡핑 방법, 예컨대 mCAP, ARCA 또는 효소적 캡핑 방법 중 어느 하나를 사용하여 캡핑되어 생물학적 활성을 유지하고 자기/비-자기 세포내 반응을 피하는 생육가능한 mRNA 구축물을 생성한다. 일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 클린캡(CleanCap™) [트리링크(TriLink)] 공동 전사 캡핑 방법을 사용함으로써 캡핑된다.

일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제를 코딩하는 mRNA는 슈도우리딘, N¹-메틸슈도우리딘 및 5-메톡시우리딘으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함한다. 일부 실시양태에서, 하나 이상의 N¹-메틸슈도우리딘은 동물 세포, 예컨대 포유동물 세포 (예를 들어, 인간 및 마우스)에서 향상된 RNA 안정성 및/또는 단백질 발현 및 감소된 면역원성을 제공하기 위해 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제를 코딩하는 mRNA에 혼입된다. 일부 실시양태에서, N¹-메틸슈도우리딘 변형은 하나 이상의 5-메틸시티딘과 조합하여 혼입된다.

일부 실시양태에서, 가이드 RNA 및/또는 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA (또는 DNA)는 올리고뉴클레오티드의 활성, 세포 분포, 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 접합체에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티 [문헌 (Letsinger et al., Proc. Natl. Acad. Sci. USA, 86: 6553-6556 (1989))]; 콜산 [문헌 (Manoharan et al., Bioorg. Med. Chem. Let., 4: 1053-1060 (1994))]; 티오에테르, 예를 들어 헥실-S-트리틸티올 [문헌 (Manoharan et al., Ann. N. Y Acad. Sci., 660: 306-309 (1992) 및 Manoharan et al., Bioorg. Med. Chem. Let., 3: 2765-2770 (1993))]; 티오콜레스테롤 [문헌 (Oberhauser et al., Nucl. Acids Res., 20: 533-538 (1992))]; 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 [문헌 (Kabanov et al., FEBS Lett., 259: 327-330 (1990) 및 Svinarchuk et al., Biochimie, 75: 49-54 (1993))]; 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트 [문헌 (Manoharan et al., Tetrahedron Lett., 36:3651-3654 (1995) 및 Shea et al., Nucl. Acids Res., 18: 3777-3783 (1990))]; 폴리아민 또는 폴리에틸렌 글리콜 쇄 [문헌 (Mancharan et al., Nucleosides & Nucleotides, 14: 969-973 (1995))]; 아다만탄 아세트산 [문헌 (Manoharan et al., Tetrahedron Lett., 36: 3651-3654 (1995))]; 팔미틸 모이어티 [문헌 (Mishra et al., Biochim. Biophys. Acta, 1264: 229-237 (1995))]; 또는 옥타데실아민 또는 헥실아미노-카르보닐-t 옥시콜레스테롤 모이어티 [문헌 (Crooke et al., J. Pharmacol. Exp. Ther., 277: 923-937 (1996))]를 포함하나 이에 제한되지는 않는다. 또한 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941을 참조한다.

당 및 기타 모이어티는 뉴클레오티드를 포함한 단백질 및 복합체, 예컨대 양이온성 폴리솜 및 리포솜을 특정한 부위로 표적화하는데 사용될 수 있다. 예를 들어, 간세포 지시된 전달은 아시알로당단백질 수용체 (ASGPR)를 통해 매개될 수 있으며; 예를 들어, 문헌 [Hu, et al., Protein Pept Lett. 21(1 0):1025-30 (2014)]을 참조한다. 관련 기술분야에 공지되어 있고 정기적으로 개발되는 다른 시스템을 사용하여 본 경우에 사용되는 생체분자 및/또는 그의 복합체를 특정한 관심 표적 세포에 표적화할 수 있다.

이들 표적화 모이어티 또는 접합체는 작용기, 예컨대 1차 또는 2차 히드록실기와 공유 결합된 접합기를 포함할 수 있다. 적합한 접합기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기, 및 올리고머의 약동학적 특성을 향상시키는 기를 포함한다. 전형적인 접합기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함한다. 약력학적 특성을 향상시킬 수 있는 기는 흡수를 개선시키고/거나, 분해에 대한 저항성을 향상시키고/거나 표적 핵산과의 서열-특이적 혼성화를 강화시키는 기를 포함한다. 약동학적 특성을 향상시킬 수 있는 기는 본 개시내용의 화합물의 흡수, 분포, 대사 또는 배설을 개선시키는 기를 포함한다. 대표적인 접합기는 국제 특허 출원 번호 PCT/US92/09196 (1992년 10월 23일에 출원됨), 및 미국 특허 번호 6,287,860에 개시되어 있으며, 이들은 본원에 참조로 포함된다. 접합 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티, 콜산, 티오에테르, 예를 들어 헥실-5-트리틸티올, 티오콜레스테롤, 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기, 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H 포스포네이트, 폴리아민 또는 폴리에틸렌 글리콜 쇄, 또는 아다만탄 아세트산, 팔미틸 모이어티, 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시 콜레스테롤 모이어티를 포함하나 이에 제한되지는 않는다. 예를 들어, 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941을 참조한다.

화학적 합성이 덜 용이하고 일반적으로 효소적 합성에 의해 생산되는 더 긴 폴리뉴클레오티드가 또한 다양한 수단에 의해 변형될 수 있다. 이러한 변형은, 예를 들어, 특정 뉴클레오티드 유사체의 도입, 분자의 5' 또는 3' 단부에 특정한 서열 또는 기타 모이어티의 혼입, 및 기타 변형을 포함할 수 있다. 예시로써, B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 대략 4 kb 길이이고 시험관 내 전사에 의해 합성될 수 있다. mRNA에 대한 변형은, 예를 들어, 번역 또는 안정성을 증가시키거나 (예컨대, 세포를 사용한 분해에 대한 저항성을 증가시킴으로써), 또는 외인성 RNA, 특히 더 긴 RNA, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 것의 도입 후 세포에서 종종 관찰되는 선천성 면역 반응을 유도하는 RNA의 경향을 감소시키기 위해 적용될 수 있다.

이러한 수많은 변형, 예컨대 폴리A 꼬리, 5' 캡 유사체 (예를 들어, 안티 리버스 캡 아날로그 (ARCA) 또는 m7G(5')ppp(5')G(mCAP)), 변형된 5' 또는 3' 비번역된 영역 (UTR), 변형된 염기 (예컨대 슈도-UTP, 2-티오-UTP, 5-메틸시티딘-5'-트리포스페이트 (5-메틸-CTP) 또는 N6-메틸-ATP)의 사용, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리가 관련 기술분야에 기재되어 있다. 이들 및 기타 변형은 관련 기술분야에 공지되어 있으며, RNA의 새로운 변형이 정기적으로 개발되고 있다.

예를 들어, 트리링크 바이오테크, 액솔랩스(Axolabs), 바이오-신테시스 인크.(Bio-Synthesis Inc.), 다마콘(Dharmacon) 등을 포함한, 변형된 RNA의 수많은 상업적 공급업체가 있다. 트리링크에 의해 기재된 바와 같이, 예를 들어 5-메틸-CTP는 바람직한 특징, 예컨대 뉴클레아제 안정성 증가, 번역 증가 또는 선천성 면역 수용체와 시험관 내 전사된 RNA의 상호작용 감소를 부여하는데 사용될 수 있다. 5'-메틸시티딘-5'-트리포스페이트 (5-메틸-CTP), N6-메틸-ATP 뿐만 아니라 슈도-UTP 및 2-티오-UTP는 또한, 하기 언급된 콘만(Konmann) 등 및 워렌(Warren) 등에 의한 간행물에 예시된 바와 같이 번역을 향상시키면서 배양 및 생체 내에서 선천성 면역 자극을 감소시키는 것으로 나타났다.

생체 내에서 전달된 화학적으로 변형된 mRNA를 사용하여 개선된 치료 효과를 달성할 수 있는 것으로 나타났으며; 예를 들어, 문헌 [Kormann et al., Nature Biotechnology 29, 154-157 (2011)]을 참조한다. 이러한 변형은, 예를 들어, RNA 분자의 안정성을 증가시키고/거나 그의 면역원성을 감소시키기 위해 사용될 수 있다. 화학적 변형, 에컨대 슈도-U, N6-메틸-A, 2-티오-U 및 5-메틸-C를 사용하여, 우리딘과 시티딘 잔기의 4분의 1만 각각 2-티오-U와 5-메틸-C로 치환하면, 마우스에서 mRNA의 톨-유사 수용체 (TLR) 매개된 인식이 크게 감소하는 것으로 밝혀졌다. 따라서 선천성 면역 체계의 활성화를 감소시킴으로써, 이러한 변형을 사용하여 생체 내에서 mRNA의 안정성과 수명을 효과적으로 증가시킬 수 있으며; 예를 들어, 상기 문헌 [Konmann et al.]을 참조한다.

또한 선천성 항바이러스 반응을 우회하도록 설계된 변형이 혼입된 합성 메신저 RNA를 반복적으로 투여하면 분화된 인간 세포를 만능성으로 재프로그램밍할 수 있는 것으로 나타났다. 예를 들어, 문헌 [Warren, et al., Cell Stem Cell, 7(5):618-30 (2010)]을 참조한다. 1차 재프로그래밍 단백질로서 작용하는 이러한 변형된 mRNA는 다수의 인간 세포 유형을 재프로그래밍하는 효율적인 수단이 될 수 있다. 이러한 세포는 유도 만능성 줄기 세포 (iPSC)로서 지칭되며, 5-메틸-CTP, 슈도-UTP 및 안티 리버스 캡 아날로그 (ARCA)를 혼입하는 효소적으로 합성된 RNA를 사용하여 세포의 항바이러스 반응을 효과적으로 회피할 수 있는 것으로 밝혀졌으며, 예를 들어, 상기 문헌 [Warren et al.]을 참조한다. 관련 기술분야에 기재된 폴리뉴클레오티드의 다른 변형은, 예를 들어 폴리A 꼬리의 사용, 5' 캡 유사체 (예컨대 m7G(5')ppp(5')G(mCAP))의 부가, 5' 또는 3' 비번역된 영역 (UTR)의 변형, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리를 포함하며, 또한 새로운 접근 방식이 정기적으로 개발되고 있다.

본원에 사용하기 위한 변형된 RNA의 생성에 적용할 수 있는 다수의 조성물 및 기술이, 소형 간섭 RNA (siRNA)를 비롯한 RNA 간섭 (RNAi)의 변형과 연계해서 개발되었다. siRNA는 mRNA 간섭을 통한 유전자 침묵에 대한 효과가 일반적으로 일시적이어서 반복 투여를 필요로 할 수 있기 때문에 생체 내에서 특정한 문제를 제시한다. 또한, siRNA는 이중 가닥 RNA (dsRNA)이며 포유동물 세포는 종종 바이러스 감염의 부산물인 dsRNA를 검출하고 중화하도록 진화된 면역 반응을 갖는다. 따라서 dsRNA에 대한 세포성 반응을 매개할 수 있는 포유동물 효소, 예컨대 PKR (dsRNA 반응성 키나제) 및 잠재적으로 레티노산-유도성 유전자 I (RIG-I) 뿐만 아니라 그러한 분자에 반응하여 시토카인의 유도를 촉발시킬 수 있는 톨-유사 수용체 (예컨대 TLR3, TLR7 및 TLR8)가 있으며; 예를 들어, 문헌 [Angart et al., Pharmaceuticals (Basel) 6(4): 440-468 (2013); Kanasty et al., Molecular Therapy 20(3): 513-524 (2012); Burnett et al., Biotechnol J. 6(9):1130-46 (2011); Judge and Maclachlan, Hum Gene Ther 19(2):111-24 (2008); 및 이들 문헌에 인용된 참고문헌]에 의한 고찰을 참조한다.

RNA 안정성을 향상시키고/거나, 선천성 면역 반응을 감소시키고/거나, 본원에 기재된 바와 같이 인간 세포 내로 폴리뉴클레오티드를 도입하는 것과 연계해서 유용할 수 있는 다른 혜택을 달성하기 위해 매우 다양한 변형이 개발 및 적용되었으며; 예를 들어, 문헌 [Whitehead KA et al., Annual Review of Chemical and Biomolecular Engineering, 2:77-96 (2011); Gaglione and Messere, Mini Rev Med Chem, 10(7):578-95 (2010); Chernolovskaya et al., Curr Opin Mol Ther., 12(2):158-67 (2010); Deleavey et al., Curr Protoc Nucleic Acid Chem Chapter 16:Unit 16.3 (2009); Behlke, Oligonucleotides 18(4):305-19 (2008): Fucini et al., Nucleic Acid Ther 22(3): 205-210 (2012); Bremsen et al., Front Genet 3:154 (2012)]에 의한 고찰을 참조한다.

상기 언급된 바와 같이, 변형된 RNA의 수많은 상업적 공급업체가 있으며, 그 중 다수는 siRNA의 유효성을 개선시키기 위해 설계된 변형을 전문으로 하고 있다. 문헌에 보고된 다양한 결과를 기반으로 하여 다양한 접근 방식이 제공된다. 예를 들어, 다마콘은 문헌 [Kale, Nature Reviews Drug Discovery 11:125-140 (2012)]에서 보고된 바와 같이, 비-브릿징 산소를 황 (포스포로티오에이트, PS)으로 대체하는 것이 siRNA의 뉴클레아제 저항성을 개선시키는데 광범위하게 사용되었다고 지적한다. 리보스의 2'-위치의 변형은 뉴클레오티드간 포스페이트 결합의 뉴클레아제 저항성을 개선시키는 것과 동시에 이중나선 안정성 (Tm)을 증가시키는 것으로 보고되었으며, 이는 또한 면역 활성화로부터 보호하는 것으로 나타났다. 문헌 [Soutschek et al. Nature 432:173-178 (2004)]에서 보고된 바와 같이, 중간 정도의 PS 백본 변형과 작고 내약성이 우수한 2'-치환 (2'-O-, 2'-플루오로, 2'-히드로)의 조합은 생체 내 적용을 위한 고도로 안정적인 siRNA와 연관이 있었으며; 2'-O-메틸 변형은 문헌 [Volkov, Oligonucleotides 19:191-202 (2009)]에서 보고된 바와 같이 안정성 개선에 효과적인 것으로 보고되었다. 선천성 면역 반응의 유도를 감소시키는 것과 관련하여, 2'-O-메틸, 2'-플루오로, 2'-히드로로 특이적 서열을 변형시키면, 일반적으로 침묵 활성을 유지하면서 TLR7/TLR8 상호작용이 감소하는 것으로 보고되었으며; 예를 들어, 문헌 [Judge et al., Mol. Ther. 13:494-505 (2006); 및 Cekaite et al., J. Mol. Biol. 365:90-108 (2007)]을 참조한다. 부가의 변형, 예컨대 2-티오우라실, 슈도우라실, 5-메틸시토신, 5-메틸우라실, 및 N6-메틸아데노신이 또한 TLR3, TLR7 및 TLR8에 의해 매개되는 면역 효과를 최소화하는 것으로 나타났으며; 예를 들어, 문헌 [Kariko et al., Immunity 23:165-175 (2005)]을 참조한다.

또한 관련 기술분야에 공지되어 있고 상업적으로 입수가능한 바와 같이, 예를 들어 콜레스테롤, 토코페롤 및 엽산, 지질, 펩티드, 중합체, 링커 및 압타머를 포함하여, 세포에 의한 전달 및/또는 흡수를 향상시킬 수 있는 다수의 접합체를 본원에서 사용하기 위해 폴리뉴클레오티드, 예컨대 RNA에 적용할 수 있으며; 예를 들어, 문헌 [Winkler, Ther. Deliv. 4:791-809 (2013)] 및 이러한 문헌에 인용된 참고문헌에 의한 고찰을 참조한다.

부가의 서열

일부 실시양태에서, 가이드 RNA는 5' 또는 3' 단부에 적어도 하나의 부가의 세그먼트를 포함한다. 예를 들어, 적합한 부가의 세그먼트는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화된 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 증가, 감소 및/또는 제어가능한 안정성을 제공하는 변형 또는 서열; 및 그의 조합을 포함할 수 있다.

안정성 제어 서열

안정성 제어 서열은 RNA (예를 들어, 가이드 RNA)의 안정성에 영향을 미친다. 적합한 안정성 제어 서열의 비제한적인 예는 전사 종결인자 세그먼트 (예를 들어, 전사 종결 서열)이다. 가이드 RNA의 전사 종결인자 세그먼트는 10개 뉴클레오티드 내지 100개 뉴클레오티드, 예를 들어 10개 뉴클레오티드 (nt) 내지 20 nt, 20 nt 내지 30 nt, 30 nt 내지 40 nt, 40 nt 내지 50 nt, 50 nt 내지 60 nt, 60 nt 내지 70 nt, 70 nt 내지 80 nt, 80 nt 내지 90 nt, 또는 90 nt 내지 100 nt의 총 길이를 가질 수 있다. 예를 들어, 전사 종결인자 세그먼트는 15개 뉴클레오티드 (nt) 내지 80 nt, 15 nt 내지 50 nt, 15 nt 내지 40 nt, 15 nt 내지 30 nt 또는 15 nt 내지 25 nt의 길이를 가질 수 있다.

일부 실시양태에서, 전사 종결 서열은 진핵 세포에서 기능적인 서열이다. 일부 실시양태에서, 전사 종결 서열은 원핵 세포에서 기능적인 서열이다.

안정성 제어 서열 (예를 들어, 전사 종결 세그먼트, 또는 증가된 안정성을 제공하기 위한 가이드 RNA의 임의의 세그먼트)에 포함될 수 있는 뉴클레오티드 서열은, 예를 들어 Rho-독립적 trp 종결 부위를 포함한다.

모방체

일부 실시양태에서, 핵산은 핵산 모방체일 수 있다. 폴리뉴클레오티드에 적용되는 바와 같은 용어 "모방체"는 푸라노스 고리 단독 또는 푸라노스 고리와 뉴클레오티드간 연결 둘 다를 비-푸라노스 기로 대체한 폴리뉴클레오티드를 포함하도록 의도되며, 푸라노스 고리 단독의 대체가 또한 관련 기술분야에서 당 대체물로서 지칭된다. 헤테로시클릭 염기 모이어티 또는 변형된 헤테로시클릭 염기 모이어티는 적절한 표적 핵산과의 혼성화를 위해 유지된다. 우수한 혼성화 특성을 갖는 것으로 밝혀진 폴리뉴클레오티드 모방체인 이러한 핵산 중 하나가 펩티드 핵산 (PNA)으로서 지칭된다. PNA에서, 폴리뉴클레오티드의 당-백본은 아미드 함유 백본, 특히 아미노에틸글리신 백본으로 대체된다. 뉴클레오티드는 유지되며 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합된다.

우수한 혼성화 특성을 갖는 것으로 보고된 폴리뉴클레오티드 모방체 중 하나는 펩티드 핵산 (PNA)이다. PNA 화합물 내의 백본은 2개 이상의 연결된 아미노에틸글리신 단위이며, 이는 PNA에 아미드 함유 백본을 제공한다. 헤테로시클릭 염기 모이어티는 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합된다. PNA 화합물의 제조를 기재하는 대표적인 미국 특허는 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262를 포함하나 이에 제한되지는 않는다.

연구된 폴리뉴클레오티드 모방체의 또 다른 클래스는 모르폴리노 고리에 부착된 헤테로시클릭 염기를 갖는 연결된 모르폴리노 단위 (모르폴리노 핵산)를 기반으로 한다. 모르폴리노 핵산 내의 모르폴리노 단량체 단위를 연결하는 다수의 연결 기가 보고되었다. 비-이온성 올리고머 화합물을 제공하기 위해 하나의 클래스의 연결 기가 선택되었다. 비-이온성 모르폴리노-기반 올리고머 화합물은 세포성 단백질과 원하지 않는 상호작용을 할 가능성이 적다. 모르폴리노-기반 폴리뉴클레오티드는 올리고뉴클레오티드의 비이온성 모방체이며, 이는 세포성 단백질과 원하지 않는 상호작용을 형성할 가능성이 적다 (Dwaine A. Braasch and David R. Corey, Biochemistry, 2002, 41(14), 45034510). 모르폴리노-기반 폴리뉴클레오티드는 미국 특허 번호 5,034,506에 개시되어 있다. 모르폴리노 클래스의 폴리뉴클레오티드 내의 다양한 화합물이 제조되었으며, 이는 단량체 서브유닛을 연결하는 다양한 상이한 연결 기를 갖는다.

폴리뉴클레오티드 모방체의 추가 클래스는 시클로헥세닐 핵산 (GeNA)으로서 지칭된다. DNA/RNA 분자에 정상적으로 존재하는 푸라노스 고리는 시클로헥세닐 고리로 대체된다. GeNA DMT 보호된 포스포르아미다이트 단량체는 고전적인 포스포르아미다이트 화학에 따라 올리고머 화합물 합성을 위해 제조 및 사용되었다. 완전히 변형된 GeNA 올리고머 화합물과 GeNA로 변형된 특이적 위치를 갖는 올리고뉴클레오티드가 제조되고 연구되었다 (문헌 [Wang et al., J. Am. Chem. Soc., 2000, 122, 85958602] 참조). 일반적으로 GeNA 단량체를 DNA 쇄에 혼입하면 DNA/RNA 하이브리드의 안정성이 증가된다. GeNA 올리고아데닐레이트는 천연 복합체와 유사한 안정성을 갖는 RNA 및 DNA 보체와 복합체를 형성하였다. GeNA 구조를 자연 핵산 구조에 혼입하는 연구는 NMR 및 원형 이색성 분석을 통해 입체형태적 적응이 쉽게 진행되는 것으로 나타났다.

추가의 변형은 2'-히드록실 기가 당 고리의 4' 탄소 원자에 연결되어 2'-C,4'-C-옥시메틸렌 연결을 형성하여 바이시클릭 당 모이어티를 형성하는 잠금 핵산 (LNA)을 포함한다. 상기 연결은 2' 산소 원자와 4' 탄소 원자를 브릿징하는 기인 메틸렌 (-CH2-)일 수 있으며, 여기서 n은 1 또는 2이다 (Singh et al., Chem. Commun., 1998, 4, 455-456). LNA 및 LNA 유사체는 상보적인 DNA 및 RNA와 함께 매우 높은 이중나선 열 안정성 (Tm = +3 내지 +10℃), 3'-엑소뉴클레오리틱 분해에 대한 안정성 및 우수한 용해도 특성을 나타낸다. LNA를 함유한 강력하고 독성이 없는 안티센스 올리고뉴클레오티드가 보고되었다 (Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A, 2000, 97, 5633-5638).

LNA 단량체인 아데닌, 시토신, 구아닌, 5-메틸-시토신, 티민 및 우라실의 합성 및 제조와 이들의 올리고머화 및 핵산 인식 특성이 보고되었다 (Koshkin et al., Tetrahedron, 1998, 54, 3607-3630). LNA 및 그의 제조는 또한 WO 98/39352 및 WO 99/14226에 기재되어 있다.

변형된 당 모이어티

핵산은 또한 하나 이상의 치환된 당 모이어티를 포함할 수 있다. 적합한 폴리뉴클레오티드는 OH; F; O-, S- 또는 N-알킬; O-, S- 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함하며, 여기서, 알킬, 알케닐 및 알키닐은 치환되거나 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. 특히 적합한 것은 O((CH2)nO)mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)CH3, O(CH2)nONH2, 및 O(CH2)nON((CH2)nCH3)2이고, 여기서 n 및 m은 1 내지 약 10이다. 다른 적합한 폴리뉴클레오티드는 하기로부터 선택된 당 치환기를 포함한다: C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알케닐, 알키닐, 알카릴, 아르알킬, O-알카릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로시클로알킬, 헤테로시클로알카릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 인터칼레이터, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약력학적 특성을 개선시키기 위한 기, 및 유사한 특성을 갖는 기타 치환기. 적합한 변형은 -2'-O-(2-메톡시에틸) 또는 2'-MOE로서 공지되기도 한 (문헌 [Martin et al., Hely. Chim. Acta, 1995, 78, 486-504]) 2'-메톡시에톡시 2'-O-CH2-CH2OCH3, 예를 들어, 알콕시알콕시 기를 포함한다. 추가의 적합한 변형은 하기 본원의 실시예에 기재된 바와 같은, 2'-디메틸아미노옥시에톡시, 예를 들어 O(CH2)2ON(CH3)2 기 (2'-DMAOE), 및 2'-디메틸아미노에톡시에톡시 (관련 기술분야에서 2'-O-디메틸-아미노-에톡시-에틸 또는 2'-DMAEOE로서 공지되기도 함), 예를 들어 2'-O-CH2-O-CH2-N(CH3)2를 포함한다.

다른 적합한 당 치환기는 메톡시 (-O-CH3), 아미노프로폭시 (-O-CH2CH2CH2NH2), 알릴 (-CH2-CH=CH2), -O-알릴 (-O-CH2-CH=CH2) 및 플루오로 (F)를 포함한다. 2'-당 치환기는 아라비노 (위) 위치 또는 리보 (아래) 위치에 있을 수 있다. 적합한 2'-아라비노 변형은 2'-F이다. 유사한 변형이 또한 올리고머 화합물 상의 다른 위치, 특히 3' 말단 뉴클레오시드 상의 또는 2'-5' 연결된 올리고뉴클레오티드 내의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 올리고머 화합물은 또한 당 모방체, 예컨대 펜토푸라노실 당 대신에 시클로부틸 모이어티를 가질 수 있다.

염기 변형 및 치환

핵산은 또한 핵염기 (종종 관련 기술분야에서 간단히 "염기"로서 지칭됨) 변형 또는 치환을 포함할 수 있다. 본원에 사용된 바와 같은, "비변형된" 또는 "자연" 핵염기는 퓨린 염기인 아데닌 (A) 및 구아닌 (G), 및 피리미딘 염기인 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 핵염기는 기타 합성 및 자연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 히포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 (-C=C-CH3) 우라실 및 시토신 및 피리미딘 염기의 기타 알키닐 유도체, 6-아조 우라실, 시토신 및 티민, 5 -우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 2-F-아데닌, 2-아미노-아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다. 추가의 변형된 핵염기는 트리시클릭 피리미딘, 예컨대 페녹사진 시티딘 (1H-피리미도(5,4-b)(1,4)벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도(5,4-b)(1,4)벤조티아진-2(3H)-온), G-클램프, 예컨대 치환된 페녹사진 시티딘 (예를 들어, 9-(2-아미노에톡시)-H-피리미도(5,4-(b)(1,4)벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도(4,5-b)인돌-2-온), 피리도인돌 시티딘 (H-피리도(3',2':4,5)피롤로(2,3-d)피리미딘-2-온)을 포함한다.

헤테로시클릭 염기 모이어티는 또한 퓨린 또는 피리미딘 염기가 다른 헤테로사이클로 대체된 것, 예를 들어 7-데아자-아데닌, 7-데아자구아노신, 2-아미노피리딘 및 2-피리돈을 포함할 수 있다. 추가 핵염기는 미국 특허 제3,687,808호에 개시된 것, 문헌 [The Concise Encyclopedia Of Polymer Science And Engineering, pages 858-859, Kroschwitz, J. 1., ed. John Wiley & Sons, 1990]에 개시된 것, 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]에 개시된 것, 및 문헌 [Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S. T. and Lebleu, B., ed., CRC Press, 1993]에 개시된 것을 포함한다. 이들 핵염기 중 특정의 것은 올리고머 화합물의 결합 친화도를 증가시키는데 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 퓨린 (2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신 포함)을 포함한다. 5-메틸시토신 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi et al., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 이는, 예를 들어, 2'-O-메톡시에틸 당 변형과 조합될 때 적합한 염기 치환이다.

"상보적"은 자연적으로 또는 비-자연적으로 발생하는 (예를 들어, 상기 기재된 바와 같이 변형된) 염기 (뉴클레오시드) 또는 그의 유사체를 포함하는 두 서열 간의 염기 스태킹 및 특이적 수소 결합을 통해 쌍을 이룰 수 있는 능력을 지칭한다. 예를 들어, 핵산의 한 위치에 있는 염기가 표적의 상응하는 위치에 있는 염기와 수소 결합을 할 수 있다면, 그 염기들은 그러한 위치에서 서로 상보적인 것으로 간주된다. 핵산은 수소 결합에 긍정적 또는 부정적 기여를 제공하지 않는 범용 염기 또는 불활성 무염기 스페이서를 포함할 수 있다. 염기쌍 형성은 표준 왓슨-크릭 염기쌍 형성과 비-왓슨-크릭 염기쌍 형성 (예를 들어, 워블 염기쌍 형성 및 후그스틴 염기쌍 형성) 둘 다를 포함할 수 있다.

상보적인 염기쌍 형성의 경우, 아데노신-유형 염기 (A)는 티미딘-유형 염기 (T) 또는 우라실-유형 염기 (U)에 상보적이고, 시토신-유형 염기 (C)는 구아노신-유형 염기 (G)에 상보적인 것으로 이해되며, 범용 염기,예컨대 3-니트로피롤 또는 5-니트로인돌은 임의의 A, C, U 또는 T와 혼성화할 수 있고 이에 상보적인 것으로 간주된다 (Nichols et al., Nature, 1994;369:492-493 및 Loakes et al., Nucleic Acids Res., 1994;22:4039-4043). 이노신 (I)은 또한 관련 기술분야에서 범용 염기인 것으로 간주되어 왔으며 임의의 A, C, U 또는 T에 상보적인 것으로 간주된다. 문헌 [Watkins and Santalucia, Nucl. Acids Research, 2005; 33 (19): 6258-6267]을 참조한다.

접합체

핵산의 또 다른 가능한 변형은 올리고뉴클레오티드의 활성, 세포 분포 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 접합체를 폴리뉴클레오티드에 화학적으로 연결하는 것을 수반한다. 이들 모이어티 또는 접합체는 작용기, 예컨대 1차 또는 2차 히드록실기와 공유 결합된 접합기를 포함할 수 있다. 접합기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기, 및 올리고머의 약동학적 특성을 향상시키는 기를 포함하나 이에 제한되지는 않는다. 적합한 접합기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함하나 이에 제한되지는 않는다. 약력학적 특성을 향상시키는 기는 흡수를 개선시키고/거나, 분해에 대한 저항성을 향상시키고/거나 표적 핵산과의 서열-특이적 혼성화를 강화시키는 기를 포함한다. 약동학적 특성을 향상시키는 기는 핵산의 흡수, 분포, 대사 또는 배설을 개선시키는 기를 포함한다.

접합 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티 (문헌 [Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556]), 콜산 (문헌 [Manoharan et al., Bioorg. Med. Chem. Let., 1994,4, 1053-1060]), 티오에테르, 예를 들어 헥실-S-트리틸티올 (문헌 [Manoharan et al., Ann. N.Y. Acad. Sci., 1992, 660, 306-309; Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765-2770]), 티오콜레스테롤 (문헌 [Oberhauser et al., Nucl. Acids Res., 1992, 20, 533-538]), 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 (문헌 [Saison-Behmoaras et al., EMBO J., 1991, 10, 1111-1118; Kabanov et al., FEBS Lett., 1990, 259, 327-330; Svinarchuk et al., Biochimie, 1993, 75, 49-54]), 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654; Shea et al., Nucl. Acids Res., 1990, 18, 3777-3783]), 폴리아민 또는 폴리에틸렌 글리콜 쇄 (문헌 [Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969-973]), 또는 아다만탄 아세트산 (문헌 [Manoharan et al. , Tetrahedron Lett., 1995, 36, 36513654]), 팔미틸 모이어티 (문헌 [Mishra et al., Biochim. Biophys. Acta, 1995, 1264, 229-237]), 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티 (문헌 [Crooke et al., J. Pharmacal. Exp. Ther., 1996,277, 923-937])를 포함하나 이에 제한되지는 않는다.

접합체는 "단백질 형질도입 도메인" 또는 PTD (CPP-세포 침투 펩티드로서 공지되기도 함)를 포함할 수 있으며, 이는 지질 이중층, 미셀, 세포막, 소기관 막, 또는 소포막 통과를 용이하게 하는 폴리펩티드, 폴리뉴클레오티드, 탄수화물, 또는 유기 또는 무기 화합물을 지칭할 수 있다. 작은 극성 분자부터 큰 거대분자 및/또는 나노입자까지 다양할 수 있는 또 다른 분자에 부착된 PTD는 분자가 막을 횡단하는 것, 예를 들어 세포외 공간에서 세포내 공간으로 또는 세포질에서 소기관 내로 이동하는 것을 용이하게 한다. 일부 실시양태에서, PTD는 외인성 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 아미노 말단에 공유적으로 연결된다. 일부 실시양태에서, PTD는 외인성 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 C-말단 또는 N-말단에 공유적으로 연결된다. 일부 실시양태에서, PTD는 핵산 (예를 들어, 가이드 RNA, 가이드 RNA를 코딩하는 폴리뉴클레오티드, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 폴리뉴클레오티드 등)에 공유적으로 연결된다. 예시적인 PTD는 YGRKKRRQRRR을 포함하는 HIV-1 TAT의 잔기 47-57에 상응하는 최소 운데카펩티드 단백질 형질도입 도메인; 세포 내로 직접 진입하기에 충분한 수의 아르기닌 (예를 들어, 3, 4, 5, 6, 7, 8, 9, 10 또는 10-50개의 아르기닌)을 포함하는 폴리아르기닌 서열; VP22 도메인 (문헌 [Zender et al. (2002) Cancer Gene Ther. 9(6):489-96]); 드로소필라 안테나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인 (문헌 [Noguchi et al. (2003) Diabetes 52(7):1732-1737]); 말단절단된 인간 칼시토닌 펩티드 (문헌 [Trehin et al. (2004) Pharm. Research 21:1248-1256]); 폴리리신 (문헌 [Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97:13003-13008])을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, PTD는 활성화가능한 CPP (ACPP)이다 (Aguilera et al. (2009) lntegr Biol (Camb) June; 1(5-6): 371-381). ACPP는 절단가능한 링커를 통해 매칭 다가음이온 (예를 들어, Glu9 또는 "E9")에 연결된 다가양이온성 CPP (예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0으로 감소시킴으로써 세포 내로의 부착 및 흡수를 억제한다. 링커가 절단되면, 다가음이온이 방출되어 폴리아르기닌과 그 고유의 접착성을 국부적으로 벗겨내므로 ACPP를 "활성화"하여 막을 통과시킨다. 일부 실시양태에서, PTD는 PTD의 생체이용률을 증가시키기 위해 화학적으로 변형된다. 예시적인 변형은 문헌 [Expert Opin Drug Deliv. 2009 Nov;6(11):1195-205]에 개시된다.

폴리펩티드 변형

코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 시험관 내에서 또는 진핵 세포에 의해, 원핵 세포에 의해, 또는 시험관 내 전사 및 번역 (IVTT)에 의해 생산될 수 있으며, 이는 관련 기술분야에 공지된 방법을 사용하여 언폴딩, 예를 들어 열 변성, OTT 감소 등에 의해 추가로 프로세싱될 수 있고 추가로 다시 폴딩될 수 있다.

1차 서열을 변경하지 않는 관심 변형은 폴리펩티드의 화학적 유도체화, 예를 들어 아실화, 아세틸화, 카르복실화, 아미드화 등을 포함한다. 또한 글리코실화의 변형, 예를 들어, 합성 및 프로세싱 동안 또는 추가의 프로세싱 단계에서 폴리펩티드의 글리코실화 패턴을 변형시킴으로써 만들어진 것; 예를 들어, 글리코실화에 영향을 미치는 효소, 예컨대 포유동물 글리코실화 또는 탈글리코실화 효소에 폴리펩티드를 노출시킴으로써 만들어진 것이 포함된다. 또한 인산화된 아미노산 잔기를 갖는 서열, 예를 들어 포스포티로신, 포스포세린 또는 포스포트레오닌이 포함된다.

일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 단백질분해적 분해에 대한 저항성을 개선시키거나, 표적 서열 특이성을 변경하거나, 용해도 특성을 최적화하거나, 단백질 활성 (예를 들어, 전사 조정 활성, 효소 활성 등)을 변경하거나 또는 치료제로서 더 적합하게 만들기 위해 통상적인 분자 생물학적 기술 및 합성 화학을 사용하여 변형되었다. 이러한 폴리펩티드의 유사체는 자연적으로 발생하는 L-아미노산 이외의 잔기, 예를 들어 O-아미노산 또는 비자연의 합성 아미노산을 함유하는 것을 포함한다. 아미노산 잔기의 일부 또는 전부가 D-아미노산으로 치환할 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 관련 기술분야에 공지된 바와 같은 통상적인 방법을 사용하여 시험관 내 합성에 의해 제조될 수 있다. 다양한 상업적 합성 장치가 입수가능하며, 예를 들어 어플라이드 바이오시스템즈, 인크.(Applied Biosystems, Inc.), 베크만(Beckman) 등에 의한 자동화 합성기가 있다. 합성기를 사용함으로써, 자연 아미노산을 비자연 아미노산으로 치환할 수 있다. 특정한 제조 순서 및 방식은 편의성, 경제성, 요구되는 순도 등에 따라 결정될 수 있다.

원하는 경우, 합성 동안 또는 발현 동안 다양한 기가 펩티드 내로 도입되어, 다른 분자 또는 표면에 연결될 수 있다. 따라서, 예를 들어 시스테인은 티오에테르를 만드는데 사용될 수 있고, 히스티딘은 금속 이온 착물에 연결하는데 사용되며, 카르복실기는 아미드 또는 에스테르를 형성하는데 사용되고, 아미노기는 아미드를 형성하는데 사용될 수 있다.

재조합 세포

일부 실시양태에서, 본원에 기재된 코돈-최적화된 B-GEn.1 또는 B-GEn.2 시스템은 진핵 세포, 예컨대 포유동물 세포, 예를 들어 인간 세포에서 사용될 수 있다. 임의의 인간 세포는 본원에 개시된 코돈-최적화된 B-GEn.1 또는 B-GEn.2 시스템과 함께 사용하기에 적합하다.

일부 실시양태에서, 생체 외 또는 시험관 내 세포는 하기를 포함한다: (a) 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 세포는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함한다. 일부 실시양태에서, 세포는 gRNA를 포함한다. 일부 실시양태에서, 세포는 gRNA를 코딩하는 핵산을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 세포는 하나 이상의 부가의 gRNA 또는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 포함한다. 일부 실시양태에서, 세포는 공여자 템플릿을 추가로 포함한다.

한 측면에서, 본원에 개시된 일부 실시양태는 본원에 제공된 바와 같은 핵산을 숙주 세포, 예컨대 동물 세포 내로 도입하는 단계, 및 형질전환된 세포를 선택하거나 스크리닝하는 단계를 포함하는, 세포를 형질전환시키는 방법에 관한 것이다. 용어 "숙주 세포" 및 "재조합 숙주 세포"는 본원에서 상호교환가능하게 사용된다. 이러한 용어는 특정한 대상체 세포 뿐만 아니라 그러한 세포의 자손 또는 잠재적 자손을 지칭하는 것으로 이해된다. 특정 변형은 돌연변이 또는 환경 영향으로 인해 다음 세대에서 발생할 수 있으므로, 그러한 자손은 실제로 모 세포와 동일하지 않을 수 있지만 여전히 본원에 사용된 바와 같은 상기 용어의 범위 내에 포함된다. 다양한 상기 언급된 숙주 세포 및 종을 형질전환시키는 기술은 관련 기술분야에 공지되어 있고 기술적 및 과학적 문헌에 기재되어 있다. 따라서, 본원에 개시된 바와 같은 적어도 하나의 재조합 세포를 포함하는 세포 배양물이 또한 본 출원의 범위 내에 있다. 세포 배양물을 생성하고 유지하는데 적합한 방법 및 시스템은 관련 기술분야에 공지되어 있다.

관련 측면에서, 일부 실시양태는 재조합 숙주 세포, 예를 들어 본원에 기재된 핵산을 포함하는 재조합 동물 세포에 관한 것이다. 핵산은 숙주 게놈에 안정하게 통합될 수 있거나, 에피솜적으로 복제될 수 있거나, 안정하거나 일시적인 발현을 위한 미니서클 발현 벡터로서 재조합 숙주 세포에 존재할 수 있다. 따라서, 본원에 개시된 일부 실시양태에서, 핵산은 재조합 숙주 세포에서 에피솜 단위로서 유지되고 복제된다. 일부 실시양태에서, 핵산은 재조합 세포의 게놈 내로 안정적으로 통합된다. 일부 실시양태에서, 핵산은 안정하거나 일시적인 발현을 위한 미니서클 발현 벡터로서 재조합 숙주 세포에 존재한다.

일부 실시양태에서, 숙주 세포는, 예를 들어, 숙주 세포의 게놈의 일부분과 상동인 핵산 서열을 포함하는 상동 재조합을 위한 벡터, 또는 관심 유전자 중 임의의 것 또는 그의 조합의 발현을 위한 발현 벡터일 수 있는 본 출원의 벡터 구축물을 사용하여 유전적으로 조작 (예를 들어, 형질도입 또는 형질전환 또는 형질감염)될 수 있다. 벡터는, 예를 들어, 플라스미드, 바이러스 입자, 파지 등의 형태일 수 있다. 일부 실시양태에서, 관심 폴리펩티드의 발현을 위한 벡터는 또한 예를 들어, 상동 재조합에 의해 숙주로의 통합을 위해 설계될 수 있다.

일부 실시양태에서, 본 개시내용은 유전적으로 변형된 숙주 세포, 예를 들어 단리된 유전적으로 변형된 숙주 세포를 제공하며, 여기서 유전적으로 변형된 숙주 세포는 1) 외인성 가이드 RNA; 2) 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산; 3) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 외인성 핵산; 4) 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산으로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 또는 5) 상기의 임의의 조합을 포함한다. 일부 실시양태에서, 유전적으로 변형된 세포는 숙주 세포를, 예를 들어 하기를 사용하여 유전적으로 변형시킴으로써 생성된다: 1) 외인성 가이드 RNA; 2) 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산; 3) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 외인성 핵산; 4) 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산으로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 또는 5) 상기의 임의의 조합.

상기 논의된 바와 같은 표적 세포가 되기에 적합한 모든 세포는 또한 유전적으로 변형된 숙주 세포가 되기에 적합하다. 예를 들어, 유전적으로 변형된 관심 숙주 세포는 임의의 유기체로부터의 세포, 예를 들어, 박테리아 세포, 고세균 세포, 단일 세포 진핵 유기체의 세포, 식물 세포, 조류 세포 (예를 들어, 보트리오코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르트티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorela pyrenoidosa), 사르가숨 파텐스(Sargassum patens) (씨. 아가르드(C. Agardh)) 등), 진균 세포 (예를 들어, 효모 세포), 동물 세포, 무척추동물 (예를 들어, 초파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추동물 (예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포, 포유동물 (예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비-인간 영장류, 인간 등)로부터의 세포일 수 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간으로부터의 임의의 세포일 수 있다.

일부 실시양태에서, 본 개시내용의 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 유전적으로 변형된 숙주 세포의 DNA는 가이드 RNA (또는 변형될 게놈 위치/서열을 결정하는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 세포 내로 도입함으로써 변형을 위해 표적화될 수 있다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등)에 작동가능하게 연결된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터, 세포 주기 특이적 프로모터)에 작동가능하게 연결된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 구성적 프로모터에 작동가능하게 연결된다.

일부 실시양태에서, 유전적으로 변형된 숙주 세포는 시험관 내에 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 생체 내에 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 원핵 세포이거나 원핵 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 박테리아 세포이거나 박테리아 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 고세균 세포이거나 고세균 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 진핵 세포이거나 진핵 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 식물 세포이거나 식물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 동물 세포이거나 동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 무척추동물 세포이거나 무척추동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 척추동물 세포이거나 척추동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 포유동물 세포이거나 포유동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 설치류 세포이거나 설치류 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간 세포이거나 인간 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간 세포이거나 인간 세포로부터 유래된다.

본 개시내용은 유전적으로 변형된 세포의 자손을 추가로 제공하며, 여기서 자손은 그것이 유래된 유전적으로 변형된 세포와 동일한 외인성 핵산 또는 폴리펩티드를 포함할 수 있다. 본 개시내용은 일부 실시양태에서, 유전적으로 변형된 숙주 세포를 포함하는 조성물을 추가로 제공한다.

일부 실시양태에서, 유전적으로 변형된 숙주 세포는 유전적으로 변형된 줄기 세포 또는 전구 세포이다. 적합한 숙주 세포는, 예를 들어, 줄기 세포 (성체 줄기 세포, 배아 줄기 세포, iPS 세포 등) 및 전구 세포 (예를 들어, 심장 전구 세포, 신경 전구 세포 등)를 포함한다. 다른 적합한 숙주 세포는 포유동물 줄기 세포 및 전구 세포, 예컨대 예를 들어, 설치류 줄기 세포, 설치류 전구 세포, 인간 줄기 세포, 인간 전구 세포 등을 포함한다. 다른 적합한 숙주 세포는 시험관 내 숙주 세포, 예를 들어 단리된 숙주 세포를 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 외인성 가이드 RNA 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 코돈-최적화된 뉴클레오티드 서열로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 1) 가이드 RNA를 코딩하는 뉴클레오티드 서열 및 2) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다.

비-인간 유전적으로 변형된 유기체

일부 실시양태에서, 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 그러한 세포가 진핵 단일 세포 유기체라면, 변형된 세포는 유전적으로 변형된 유기체로 간주될 수 있다. 일부 실시양태에서, 비-인간 유전적으로 변형된 유기체는 B-GEn.1 또는 B-GEn.2 트랜스제닉 다세포 유기체이다.

일부 실시양태에서, 유전적으로 변형된 비-인간 숙주 세포 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형된 세포)는 유전적으로 변형된 비인간 유기체 (예를 들어, 마우스, 어류, 개구리, 파리, 벌레 등)를 생성할 수 있다. 예를 들어, 유전적으로 변형된 숙주 세포가 만능성 줄기 세포 (예를 들어, PSC) 또는 생식 세포 (예를 들어, 정자, 난모세포 등)인 경우, 유전적으로 변형된 유기체 전체가 유전적으로 변형된 숙주 세포로부터 유래될 수 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 유전적으로 변형된 유기체를 생성할 수 있는 생체 내 또는 시험관 내에서 만능성 줄기 세포 (예를 들어, ESC, iPSC, 만능성 식물 줄기 세포 등) 또는 생식 세포 (예를 들어, 정자 세포, 난모세포 등)이다. 일부 실시양태에서 유전적으로 변형된 숙주 세포는 척추동물 PSC (예를 들어, ESC, iPSC 등)이고, 유전적으로 변형된 유기체를 생성하는데 사용된다 (예를 들어, PSC를 배반포에 주입하여 키메라/모자이크 동물을 생산한 후, 교배하여 비-키메라/비-모자이크 유전적으로 변형된 유기체를 생성할 수 있음; 식물의 경우 접목 등에 의함). 본원에 기재된 방법을 포함한, 유전적으로 변형된 유기체를 생산하기 위한 임의의 적합한 방법/프로토콜은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 유전적으로 변형된 숙주 세포를 생산하는데 적합하다. 유전적으로 변형된 유기체를 생산하는 방법은 관련 기술분야에 공지되어 있다. 예를 들어, 문헌 [Cho et al., Curr Protoc Cell Biol. 2009 Mar; Chapter 19:Unit 19.11: Generation of transgenic mice; Gama et al., Brain Struct Funct. 2010 Mar; 214(2-3):91-109. Epub 2009 Nov 25: Animal transgenesis: an overview; Husaini et al., GM Crops. 2011 Jun-Dec;2(3):150-62. Epub 2011 Jun 1: Approaches for gene targeting and targeted gene expression in plants]을 참조한다.

일부 실시양태에서, 유전적으로 변형된 유기체는 본 개시내용의 방법을 위한 표적 세포를 포함하고, 따라서 표적 세포에 대한 공급원으로 간주될 수 있다. 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 유전적으로 변형된 세포를 사용하여 유전적으로 변형된 유기체를 생성하는 경우, 유전적으로 변형된 유기체의 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 이러한 일부 실시양태에서, 유전적으로 변형된 유기체의 세포 또는 세포들의 DNA는 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 세포 또는 세포들 내로 도입함으로써 변형을 위해 표적화될 수 있다. 예를 들어, 유전적으로 변형된 유기체의 세포 서브세트 (예를 들어, 뇌세포, 장 세포, 신장 세포, 폐 세포, 혈액 세포 등) 내로 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA)를 도입하면, 변형을 위해 그러한 세포의 DNA를 표적화할 수 있으며, 그의 게놈 위치는 도입된 가이드 RNA의 DNA-표적화 서열에 따라 달라질 것이다.

일부 실시양태에서, 유전적으로 변형된 유기체는 본 개시내용의 방법을 위한 표적 세포의 공급원이다. 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형된 세포를 포함하는 유전적으로 변형된 유기체는 유전적으로 변형된 세포, 예를 들어 PSC (예를 들어, ESC, iPSC, 정자, 난모세포 등), 뉴런, 전구 세포, 심근세포 등의 공급원을 제공할 수 있다.

일부 실시양태에서, 유전적으로 변형된 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 PSC이다. 따라서, PSC는 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 PSC 내로 도입함으로써 PSC의 DNA가 변형을 위해 표적화될 수 있도록 표적 세포일 수 있고, 변형의 게놈 위치는 도입된 가이드 RNA의 DNA-표적화 서열에 따라 달라질 것이다. 따라서, 일부 실시양태에서, 본원에 기재된 방법은 유전적으로 변형된 유기체로부터 유래된 PSC의 DNA를 변형 (예를 들어, 임의의 원하는 게놈 위치를 결실 및/또는 대체)시키는데 사용될 수 있다. 그런 다음 이러한 변형된 PSC를 사용하여 (i) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산 및 (ii) PSC 내로 도입된 DNA 변형 둘 다를 갖는 유기체를 생성할 수 있다.

일부 실시양태에서, 외인성 핵산은 공지되지 않은 프로모터의 제어 하에 있을 수 있거나 (예를 들어, 작동가능하게 연결됨) (예를 들어, 핵산이 숙주 세포 게놈에 무작위로 통합되는 경우) 또는 공지된 프로모터의 제어 하에 있을 수 있다 (예를 들어, 작동가능하게 연결됨). 적합한 공지된 프로모터는 임의의 공지된 프로모터일 수 있으며 구성적으로 활성인 프로모터 (예를 들어, CMV 프로모터), 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등), 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등) 등을 포함한다.

유전적으로 변형된 유기체 (예를 들어, 세포가 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 유기체)는, 예를 들어, 식물; 조류; 무척추동물 (예를 들어, 자포동물, 극피동물, 벌레, 파리 등); 척추동물 (예를 들어, 어류 (예를 들어, 제브라피쉬, 복어, 금붕어 등), 양서류 (예를 들어, 도롱뇽, 개구리 등), 파충류, 조류, 포유동물 등); 유제류 (예를 들어, 염소, 돼지, 양, 소 등); 설치류 (예를 들어, 마우스, 래트, 햄스터, 기니피그); 토끼목 (예를 들어, 토끼) 등을 포함한 임의의 유기체일 수 있다.

일부 실시양태에서, 활성 부분은 RNase 도메인이다. 일부 실시양태에서, 활성 부분은 DNase 도메인이다.

트랜스제닉 비-인간 동물

상기 기재된 바와 같이, 일부 실시양태에서, 핵산 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열) 또는 재조합 발현 벡터는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 생산하는 트랜스제닉 동물을 생성하기 위한 트랜스진으로서 사용된다. 따라서, 본 개시내용은 트랜스제닉 비-인간 동물을 추가로 제공하며, 이러한 동물은 상기 기재된 바와 같이 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 핵산을 포함하는 트랜스진을 포함한다. 일부 실시양태에서, 트랜스제닉 비-인간 동물의 게놈은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 유전적 변형에 대해 동형접합성이다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 유전적 변형에 대해 이형접합성이다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 척추동물, 예를 들어 어류 (예를 들어, 제브라 피쉬, 금붕어, 복어, 동굴 물고기 등), 양서류 (개구리, 도롱뇽 등), 조류 (예를 들어, 닭, 칠면조 등), 파충류 (예를 들어, 뱀, 도마뱀 등), 포유동물 (예를 들어, 유제류, 예를 들어 돼지, 소, 염소, 양 등; 토끼목 (예를 들어, 토끼); 설치류 (예를 들어, 래트, 마우스); 비인간 영장류 등) 등이다.

일부 실시양태에서, 핵산은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산이다. 일부 실시양태에서, 외인성 핵산은 공지되지 않은 프로모터의 제어 하에 있을 수 있거나 (예를 들어, 작동가능하게 연결됨) (예를 들어, 핵산이 숙주 세포 게놈에 무작위로 통합되는 경우) 또는 공지된 프로모터의 제어 하에 있을 수 있다 (예를 들어, 작동가능하게 연결됨). 적합한 공지된 프로모터는 임의의 공지된 프로모터일 수 있으며 구성적으로 활성인 프로모터 (예를 들어, CMV 프로모터), 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등), 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등) 등을 포함한다.

숙주 세포 내로의 핵산 도입

일부 실시양태에서, 본 개시내용의 방법은 가이드 RNA를 코딩하는 뉴클레오티드 서열 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화 뉴클레오티드 서열을 포함하는 하나 이상의 핵산을 숙주 세포 (또는 숙주 세포 집단) 내로 도입하는 것을 수반한다. 일부 실시양태에서, 표적 DNA를 포함하는 세포는 시험관 내에 있다. 일부 실시양태에서, 표적 DNA를 포함하는 세포는 생체 내에 있다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 유도성 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 구성적 프로모터에 작동가능하게 연결된다.

가이드 RNA, 또는 그를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 널리 공지된 다양한 방법 중 임의의 것에 의해 숙주 세포 내로 도입될 수 있다. 유사하게, 방법이 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포 내로 도입하는 것을 수반하는 경우, 이러한 핵산은 널리 공지된 다양한 방법 중 임의의 것에 의해 숙주 세포 내로 도입될 수 있다. 가이드 폴리뉴클레오티드 (RNA 또는 DNA) 및/또는 B-GEn.1 또는 B-GEn.2 폴리뉴클레오티드 (RNA 또는 DNA)는 관련 기술분야에 공지된 바이러스 또는 비-바이러스 전달 비히클에 의해 전달될 수 있다.

숙주 세포 내로 핵산을 도입하는 방법은 관련 기술분야에 공지되어 있으며, 임의의 공지된 방법을 사용하여 핵산 (예를 들어, 발현 구축물)을 줄기 세포 또는 전구 세포 내로 도입할 수 있다. 적합한 방법은 엑소좀 전달을 포함하나 이에 제한되지는 않는, 예를 들어 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 원형질체 융합, 리포펙션, 전기천공, 인산칼슘 침전, 폴리에틸렌이민 (PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포솜-매개 형질감염, 입자총 기술, 인산칼슘 침전, 직접 마이크로 주사, 나노입자-매개 핵산 전달 (예를 들어, 문헌 [Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: 50169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023] 참조) 등을 포함한다.

폴리뉴클레오티드는 나노입자, 리포솜, 리보핵단백질, 양전하를 띤 펩티드, 소분자 RNA-접합체, 압타머-RNA 키메라, 및 RNA-융합 단백질 복합체를 포함하나 이에 제한되지는 않는 비-바이러스 전달 비히클에 의해 전달될 수 있다. 일부 예시적인 비-바이러스 전달 비히클은 문헌 [Peer and Lieberman, Gene Therapy, 18: 1127-1133 (2011)] (다른 폴리뉴클레오티드의 전달에도 유용한 siRNA를 위한 비-바이러스 전달 비히클에 중점을 두고 있음)에 기재되어 있다.

유전자 편집을 위해 본 개시내용의 핵산 (예를 들어, mRNA 및 sgRNA)을 전달하기 위한 적합한 시스템 및 기술은 지질 나노입자 (LNP)를 포함한다. 본원에 사용된 바와 같은 용어 "지질 나노입자"는 그의 층상도, 모양 또는 구조와 관계없이 리포솜 및 핵산 및/또는 폴리펩티드를 세포 내로 도입하기 위해 기재된 바와 같은 리포플렉스를 포함한다. 이들 지질 나노입자는 생물학적으로 활성인 화합물 (예를 들어, 핵산 및/또는 폴리펩티드)과 복합체를 형성할 수 있으며 생체 내 전달 비히클로서 유용하다. 일반적으로, 관련 기술분야에 공지된 임의의 방법을 적용하여 본 개시내용의 하나 이상의 핵산을 포함하는 지질 나노입자를 제조하고 생물학적으로 활성인 화합물과 상기 지질 나노입자의 복합체를 제조할 수 있다. 그러한 방법의 예는, 예를 들어, 문헌 [Biochim Biophys Acta 1979, 557:9; Biochim et Biophys Acta 1980, 601:559; Liposomes: A practical approach (Oxford University Press, 1990); Pharmaceutica Acta Helvetiae 1995, 70:95; Current Science 1995, 68:715; Pakistan Journal of Pharmaceutical Sciences 1996, 19:65; Methods in Enzymology 2009, 464:343]에 널리 개시되어 있다. 본 개시내용의 하나 이상의 핵산 및/또는 폴리펩티드를 포함하는 LNP 제형을 제조하는데 특히 적합한 시스템 및 기술은 인텔리아(Intellia) (예를 들어, WO2017173054A1 참조), 알닐람(Alnylam) (예를 들어, WO2014008334A1 참조), 모더나TX(Modernatx) (예를 들어, WO2017070622A1 및 WO2017099823A1 참조), 트랜스레이트바이오(TranslateBio), 아쿠이타스(Acuitas) (예를 들어, WO2018081480A1 참조), 제네반트 사이언스(Genevant Sciences), 아르부투스 바이오파르마(Arbutus Biopharma), 테크미라 (Tekmira), 아크투루스(Arcturus), 머크(Merck) (예를 들어, WO2015130584A2 참조), 노바티스(Novartis) (예를 들어, WO2015095340A1 참조), 및 디세르나(Dicerna) (이들 모두는 그 전체 내용이 본원에 참조로 포함됨)에 의해 개발된 것을 포함하나 이에 제한되지는 않는다.

가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 적합한 핵산은 발현 벡터를 포함하며, 여기서 발현 벡터는 가이드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 발현 벡터는 바이러스 구축물, 예를 들어 재조합 아데노-연관 바이러스 구축물 (예를 들어, 미국 특허 번호 7,078,387 참조), 재조합 아데노바이러스 구축물, 재조합 렌티바이러스 구축물, 재조합 레트로바이러스 구축물 등이다. 적합한 발현 벡터는 바이러스 벡터 (예를 들어, 백시니아 바이러스; 폴리오바이러스; 아데노바이러스 (예를 들어, 문헌 [Li et al., Invest Opthalmol Vis Sci 35:2543 2549, 1994; Borras et al., Gene Ther 6:515 524, 1999; Li and Davidson, PNAS 92:7700 7704, 1995; Sakamoto et al., H Gene Ther 5:10881097, 1999]; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655 참조); 아데노-연관 바이러스 (예를 들어, 문헌 [Ali et al., Hum Gene Ther 9:81 86,1998, Flannery et al., PNAS 94:6916 6921, 1997; Bennett et al., Invest Opthalmol Vis Sci 38:2857 2863, 1997; Jomary et al., Gene Ther 4:683-690, 1997, Rolling et al., Hum Gene Ther 10:641 648, 1999; Ali et al., Hum Mol Genet 5:591 594, 1996; Srivastava in WO 93/09239, Samulski et al., J. Vir. (1989) 63:3822-3828; Mendelson et al., Viral. (1988) 166:154-165; 및 Flotte et al., PNAS (1993) 90:10613-10617] 참조); SV40; 단순 포진 바이러스; 인간 면역결핍 바이러스 (예를 들어, 문헌 [Miyoshi et al., PNAS 94:10319 23, 1997; Takahashi et al., J Virol 73:7812 7816, 1999] 참조)에 기반한 바이러스 벡터; 레트로바이러스 벡터 (예를 들어, 뮤린 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 등)을 포함하나 이에 제한되지는 않는다.

아데노 연관 바이러스 ( AAV )

재조합 아데노-연관 바이러스 (AAV) 벡터를 전달에 사용할 수 있다. 관련 기술분야에서 rAAV 입자를 생산하는 것으로 공지된 기술은 2개의 AAV 역위 말단 반복부 (ITR) 사이에 전달될 폴리뉴클레오티드, AAV rep 및 cap 유전자 및 헬퍼 바이러스 기능을 세포에 제공하는 것이다. rAAV를 생산하려면 하기 구성요소가 단일 세포 (본원에서는 패키징 세포로서 표시됨) 내에 존재하는 것을 필요로 한다: 2개의 ITR 사이의 관심 폴리뉴클레오티드, AAV 게놈으로부터 분리된 (즉, AAV 게놈 내에 있지 않은) AAV rep 및 cap 유전자, 및 헬퍼 바이러스 기능. AAV rep 및 cap 유전자는 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형으로부터 유래될 수 있고, AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 및 AAV rh.74를 포함하나 이에 제한되지는 않는, 패키징된 폴리뉴클레오티드 상의 ITR의 것과는 상이한 AAV 혈청형으로부터 유래될 수 있다. 위형화된 rAAV의 생산은, 예를 들어, WO 01/83692에 개시되어 있다.

패키징 세포를 생성하는 방법은 AAV 입자 생산에 필요한 모든 구성요소를 안정적으로 발현하는 세포주를 생성하는 것이다. 예를 들어, AAV ITR 사이의 관심 폴리뉴클레오티드, AAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 및 선택가능한 마커, 예컨대 네오마이신 내성 유전자를 포함하는 플라스미드 (또는 다중 플라스미드)가 세포의 게놈에 통합된다. AAV 게놈은 GC 테일링 (문헌 [Samulski et al., 1982, Proc. Natl. Acad. Sci. USA, 79:2077-2081]), 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 부가 (문헌 [Laughlin et al., 1983, Gene, 23:65-73]) 또는 직접적인 평활 말단 라이게이션 (문헌 [Senapathy & Carter, 1984, J. Bioi. Chem., 259:4661-4666])과 같은 절차에 의해 박테리아 플라스미드 내로 도입되었다. 그런 다음 패키징 세포주를 헬퍼 바이러스, 예컨대 아데노바이러스에 감염시킨다. 이러한 방법의 이점은 세포를 선택할 수 있고 rAAV의 대규모 생산에 적합하다는 것이다. 적합한 방법의 다른 예는 rAAV 게놈 및/또는 rep 및 cap 유전자를 패키징 세포 내로 도입하기 위해 플라스미드보다는 아데노바이러스 또는 배큘로바이러스를 이용한다.

rAAV 생산의 일반 원칙은, 예를 들어, 문헌 [Carter, 1992, Current Opinions in Biotechnology, 1533-539; 및 Muzyczka, 1992, Curr. Topics in Microbial. and lmmunol., 158:97-129]에서 검토된다. 다양한 접근 방식은 문헌 [Ratschin et al., Mol. Cell. Biol. 4:2072 (1984); Hermonat et al., Proc. Natl. Acad. Sci. USA, 81:6466 (1984); Tratschin et al., Mol. Cell. Biol. 5:3251 (1985); Mclaughlin et al., J. Virol., 62:1963 (1988); 및 Lebkowski et al., 1988 Mol. Cell. Biol., 7:349 (1988). Samulski et al. (1989, J. Virol., 63:3822-3828); 미국 특허 번호 5,173,414; WO 95/13365 및 상응하는 미국 특허 번호 5,658.776; WO 95/13392; WO 96/17947; PCT/US98/18600; WO97/09441 (PCT/US96/14423); WO 97/08298 (PCT/US96/13872); WO 97/21825 (PCT/US96/20777); WO 97/06243 (PCT/FR96/01064); WO 99/11764; Perrin et al. (1995) Vaccine 13:1244-1250; Paul et al. (1993) Human Gene Therapy 4:609-615; Clark et al. (1996) Gene Therapy 3:1124-1132; 미국 특허 번호 5,786,211; 미국 특허 번호 5,871,982; 및 미국 특허 번호 6,258,595]에 기재되어 있다.

형질도입에 사용되는 AAV 벡터 혈청형은 표적 세포 유형에 따라 다르다. 예를 들어, 하기 예시적인 세포 유형은 특히, 표시된 AAV 혈청형에 의해 형질도입되는 것으로 공지되어 있다.

다수의 적합한 발현 벡터가 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 다수가 상업적으로 이용가능하다. 하기 벡터가 예시로써 제공된다: 진핵 숙주 세포의 경우: pXT1, pSG5 [스트라타진(Stratagene)], pSVK3, pBPV, pMSG 및 pSVLSV40 (파마시아). 그러나, 숙주 세포와 양립가능한 한 임의의 다른 벡터도 사용될 수 있다.

활용되는 숙주/벡터 시스템에 따라, 구성적 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결인자 등을 포함한, 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에 사용될 수 있다 (예를 들어, 문헌 [Bitter et al. (1987) Methods in Enzymology, 153:516-544] 참조).

일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 RNA로서 제공될 수 있다. 이러한 경우, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 RNA는 직접적인 화학적 합성에 의해 생산될 수 있거나 가이드 RNA를 코딩하는 DNA로부터 시험관 내에서 전사될 수 있다. DNA 템플릿으로부터 RNA를 합성하는 방법은 관련 기술분야에 널리 공지되어 있다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 RNA는 RNA 폴리머라제 효소 (예를 들어, T7 폴리머라제, T3 폴리머라제, SP6 폴리머라제 등)를 사용하여 시험관 내에서 합성될 것이다. 일단 합성되면, RNA는 표적 DNA와 직접적으로 접촉할 수 있거나 핵산을 세포 내로 도입하기 위한 널리 공지된 기술 (예를 들어, 마이크로주사, 전기천공, 형질감염 등) 중 임의의 것에 의해 세포 내로 도입될 수 있다.

가이드 RNA를 코딩하는 뉴클레오티드 (DNA 또는 RNA로서 도입됨) 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 (DNA 또는 RNA로서 도입됨) 및/또는 공여자 폴리뉴클레오티드는 잘 개발된 형질감염 기술을 사용하여 세포에 제공될 수 있으며; 예를 들어, 문헌 [Angel and Yanik (2010) PLoS ONE 5(7): e 11756], 및 퀴아젠(Qiagen)으로부터의 상업적으로 입수가능한 트랜스메신저(TransMessenger®) 시약, 스템젠트(Stemgent)로부터의 스템펙트(Stemfect™) RNA 형질감염 키트, 및 밈스 바이오(Mims Bio)로부터의 트랜시트(TransiT®)-mRNA 형질감염 키트를 참조한다. 또한, 문헌 [Beumer et al. (2008) Efficient gene targeting in Drosophila by direct embryo injection with zinc-finger nucleases. PNAS 105(50):19821-19826]을 참조한다. 추가적으로 또는 대안적으로, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드가 DNA 벡터 상에 제공될 수 있다. 핵산을 표적 세포로 전달하는데 유용한 많은 벡터, 예를 들어, 플라스미드, 코스미드, 미니서클, 파지, 바이러스 등이 이용가능하다. 핵산(들)을 포함하는 벡터는 에피솜적으로, 예를 들어 플라스미드, 미니서클 DNA, 바이러스, 예컨대 시토메갈로바이러스, 아데노바이러스 등으로서 유지될 수 있거나, 또는 상동 재조합 또는 무작위 통합을 통해 표적 세포 게놈에 통합될 수 있다 (예를 들어, 레트로바이러스 유래 벡터, 예컨대 MMLV, HIV-1, ALV 등).

벡터는 세포에 직접적으로 제공될 수 있다. 다시 말해서, 세포는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 포함하는 벡터와 접촉되어, 벡터가 세포에 의해 흡수되도록 한다. 전기천공, 염화칼슘 형질감염, 마이크로주사 및 리포펙션을 포함한, 플라스미드인 핵산 벡터와 세포를 접촉시키는 방법은 관련 기술분야에 널리 공지되어 있다. 바이러스 벡터 전달을 위해, 세포는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 포함하는 바이러스 입자와 접촉된다. 레트로바이러스, 예를 들어 렌티바이러스가 본 개시내용의 방법에 특히 적합하다. 통상적으로 사용되는 레트로바이러스 벡터는 "결함"이 있으며, 예를 들어 생산적 감염에 필요로 하는 바이러스 단백질을 생산할 수 없다. 오히려, 벡터의 복제는 패키징 세포주에서의 성장을 필요로 한다. 관심 핵산을 포함하는 바이러스 입자를 생성하기 위해, 이러한 핵산을 포함하는 레트로바이러스 핵산은 패키징 세포주에 의해 바이러스 캡시드로 패키징된다. 상이한 패키징 세포주는 캡시드에 혼입될 상이한 외피 단백질 (에코트로픽, 양쪽성 또는 이종성)을 제공하며, 이러한 외피 단백질은 세포에 대한 바이러스 입자의 특이성을 결정한다 (뮤린 및 래트의 경우 에코트로픽; 인간, 개 및 마우스를 포함한 대부분의 포유동물 세포 유형의 경우 양쪽성; 및 뮤린 세포를 제외한 대부분의 포유동물 세포 유형의 경우 이종성). 적절한 패키징 세포주를 사용하여, 세포가 패키징된 바이러스 입자에 의해 표적화되도록 할 수 있다. 재프로그래밍 인자를 코딩하는 핵산을 포함하는 레트로바이러스 벡터를 패키징 세포주 내로 도입하고 패키징 세포주에 의해 생성되는 바이러스 입자를 수집하는 방법은 관련 기술분야에 널리 공지되어 있다. 핵산은 또한 직접 마이크로-주사 (예를 들어, 제브라피쉬 배아 내로의 RNA의 주사)을 통해 도입될 수 있다.

가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 세포에 제공하는데 사용되는 벡터는 일반적으로 관심 핵산의 발현, 즉 전사 활성화를 구동시키는데 적합한 프로모터를 포함할 것이다. 다시 말해서, 관심 핵산은 프로모터에 작동가능하게 연결될 것이다. 이는 유비쿼터스 활성 프로모터, 예를 들어, CMV-13-액틴 프로모터, 또는 유도성 프로모터, 예컨대 특정한 세포 집단에서 활성이거나 약물, 예컨대 테트라시클린의 존재에 반응하는 프로모터를 포함할 수 있다. 전사 활성화에 의해, 전사가 적어도 10배, 적어도 100배, 보다 전형적으로 적어도 1000배만큼 표적 세포에서 기본 수준 이상으로 증가될 것으로 의도된다. 또한, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드를 세포에 제공하기 위해 사용되는 벡터는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드를 흡수한 세포를 확인하기 위해 표적 세포에서 선택가능한 마커를 코딩하는 핵산 서열을 포함할 수 있다.

가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 대신, DNA와 접촉하는데 사용되거나 RNA로서 세포 내로 도입될 수 있다. RNA를 세포 내로 도입하는 방법은 관련 기술분야에 공지되어 있으며, 예를 들어 직접 주사, 형질감염, 또는 DNA 도입에 사용되는 임의의 다른 방법을 포함할 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 대신, 폴리펩티드로서 세포에 제공될 수 있다. 이러한 폴리펩티드는 임의로 산물의 용해도를 증가시키는 폴리펩티드 도메인과 융합될 수 있다. 도메인은 규정된 프로테아제 절단 부위, 예를 들어 TEV 프로테아제에 의해 절단되는 TEV 서열을 통해 폴리펩티드에 연결될 수 있다. 링커는 또한 하나 이상의 가요성 서열, 예를 들어 1 내지 10개의 글리신 잔기를 포함할 수 있다. 일부 실시양태에서, 융합 단백질의 절단은 산물의 용해도를 유지하는 완충액에서, 예를 들어 0.5 내지 2 M 우레아의 존재 하에, 용해도를 증가시키는 폴리펩티드 및/또는 폴리뉴클레오티드 등의 존재 하에 수행된다. 관심 도메인은 엔도솜분해 도메인, 예를 들어 인플루엔자 HA 도메인; 및 생산을 돕는 다른 폴리펩티드, 예를 들어 IF2 도메인, GST 도메인, GRPE 도메인 등을 포함한다. 폴리펩티드는 개선된 안정성을 위해 제형화될 수 있다. 예를 들어, 펩티드는 PEG화될 수 있으며, 여기서 폴리에틸렌옥시 기는 혈류 내 향상된 수명을 제공한다.

부가적으로 또는 대안적으로, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 폴리펩티드 침투성 도메인과 융합되어 세포에 의한 흡수를 촉진할 수 있다. 다수의 침투성 도메인이 관련 기술분야에 공지되어 있고, 펩티드, 펩티드 모방체 및 비-펩티드 운반체를 비롯한 본 개시내용의 비-통합 폴리펩티드에 사용될 수 있다. 예를 들어, 침투성 펩티드는 아미노산 서열 RQIKIWFQNRRMKWKK (이러한 서열은 본 특허 출원 하의 개시내용이 아님)을 포함하는, 페네트라틴으로서 지칭되는 드로소필라 멜라노가스테르(Drosophila melanogaster) 전사 인자 안테나피디아(Antennapaedia)의 세 번째 알파 나선으로부터 유래될 수 있다. 또 다른 예로서, 침투성 펩티드는 HIV-1 tat 염기성 영역 아미노산 서열을 포함하며, 이는 예를 들어 자연적으로 발생하는 tat 단백질의 아미노산 49-57을 포함할 수 있다.

다른 침투성 도메인은 폴리-아르기닌 모티프, 예를 들어 HIV-1 rev 단백질의 아미노산 34-56의 영역, 노나-아르기닌, 액타-아르기닌 등을 포함한다 (예를 들어, 문헌 [Futaki et al. (2003) Curr Protein Pept Sci. 2003 Apr; 4(2): 87-9 and 446; 및 Wender et al. (2000) Proc. Natl. Acad. Sci. U.S.A. 2000 Nov. 21; 97(24):13003-8]; 공개된 미국 특허 출원 공개 번호 20030220334; 20030083256; 20030032593; 및 20030022831 참조; 이들 문헌은 전위 펩티드 및 펩토이드의 교시를 위해 본원에 참조로 구체적으로 포함됨). 노나-아르기닌 (R9) 서열은 특징규명된 보다 효율적인 PTD 중 하나이다 (Wender et al. 2000; Uemura et al. 2002). 융합이 이루어지는 부위는 폴리펩티드의 생물학적 활성, 분비 또는 결합 특징을 최적화하기 위해 선택될 수 있다. 최적의 위치는 일상적인 실험을 통해 결정될 수 있다. 일부 실시양태에서, 폴리펩티드 침투성 도메인은 PTD의 생체이용률을 증가시키기 위해 화학적으로 변형된다. 예시적인 변형은 문헌 [Expert Opin Drug Deliv. 2009 Nov;6(11):1195-205]에 개시된다.

일반적으로, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량이 표적 DNA 또는 세포에 제공되어 표적화된 변형을 유도한다. 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량은 음성 대조군, 예를 들어 빈 벡터 또는 관련 없는 폴리펩티드와 접촉된 세포에 비해 gRNA로 관찰된 표적화된 변형의 양에 있어서 2배 이상의 증가를 유도하는 양이다. 즉, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량 또는 용량은 표적 DNA 영역에서 관찰되는 표적 변형의 양에 있어서의 2배 증가, 3배 증가, 4배 증가 또는 그 초과의 증가를 유도할 것이며, 일부 실시양태에서는 관찰된 재조합 양에 있어서의 5배 증가, 6배 증가 또는 그 초과의 증가, 때때로 7배 또는 8배 또는 그 초과의 증가, 예를 들어 10배, 50배 또는 100배 또는 그 초과의 증가, 일부 실시양태에서는 관찰된 재조합 양에 있어서의 200배, 500배, 700배 또는 1000배 또는 그 초과의 증가, 예를 들어 5000배 또는 10,000배의 증가를 유도할 것이다. 표적 변형의 양은 임의의 적합한 방법에 의해 측정될 수 있다. 예를 들어, 재조합될 때 활성 리포터를 코딩하는 핵산을 재구성하게 되는, 상동 서열에 의해 플랭킹된 가이드 RNA의 스페이서에 대한 상보적 서열을 포함하는 분할 리포터 구축물은 세포 내로 공동 형질감염될 수 있으며, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 후, 예를 들어 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 지 2시간, 4시간, 8시간, 12시간, 24시간, 36시간, 48시간, 72시간 또는 그 초과 후에 리포터 단백질의 양을 평가한다. 또 다른 보다 감수성 검정으로서, 예를 들어, 표적 DNA 서열을 포함하는 관심 게놈 DNA 영역에서의 재조합 정도는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 후, 예를 들어 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 지 2시간, 4시간, 8시간, 12시간, 24시간, 36시간, 48시간, 72시간 또는 그 초과 후에 상기 영역의 PCR 또는 서던 혼성화에 의해 평가될 수 있다.

세포를 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉시키는 것은 세포의 생존을 촉진시키는 임의의 배양 배지 및 임의의 배양 조건 하에서 발생할 수 있다. 예를 들어, 세포는 적합한 임의의 적절한 영양 배지, 예컨대 송아지 태아 혈청 또는 열 불활성화 소 태아 혈청 (약 5-10%), L-글루타민, 티올, 특히 2-메르캅토에탄올, 및 항생제, 예를 들어 페니실린 및 스트렙토마이신이 보충된 이스코브의 변형된 DMEM 또는 RPMI1640에 현탁될 수 있다. 배양물은 세포가 반응하는 성장 인자를 함유할 수 있다. 본원에 정의된 바와 같은 성장 인자는 막횡단 수용체에 대한 특이적 효과를 통해, 배양물 또는 무손상 조직에서 세포의 생존, 성장 및/또는 분화를 촉진시킬 수 있는 분자이다. 성장 인자는 폴리펩티드및 비-폴리펩티드 인자를 포함한다. 세포의 생존을 촉진시키는 조건은 일반적으로 비상동 말단 연결 및 상동성-지시된 복구를 허용한다. 폴리뉴클레오티드 서열을 표적 DNA 서열에 삽입하는 것이 바람직한 적용에서는, 삽입될 공여자 서열을 포함하는 폴리뉴클레오티드가 또한 세포에 제공된다. "공여자 서열" 또는 "공여자 폴리뉴클레오티드"는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체에 의해 유도된 절단 부위에 삽입되는 핵산 서열을 의미한다. 공여자 폴리뉴클레오티드는 절단 부위의 플랭킹 게놈 영역과 충분한 서열 상동성을 함유할 것이며, 예를 들어 절단 부위를 플랭킹하는, 예를 들어 절단 부위의 약 50개 이하의 염기 이내, 예를 들어 약 30개 염기 이내, 약 15개 염기 이내, 약 10개 염기 이내, 약 5개 염기 이내, 또는 절단 부위를 바로 플랭킹하는 뉴클레오티드 서열과 70%, 80%, 85%, 90%, 95% 또는 100% 서열 동일성을 함유하여, 그와 상동성을 보유하는 게놈 서열 간의 상동성-지시된 복구를 지원한다. 공여자와 게놈 서열 간의 상동 서열의 대략 25, 50, 100 또는 200개 뉴클레오티드, 또는 200개 초과의 뉴클레오티드 (또는 10개 내지 200개, 또는 그 초과의 뉴클레오티드 사이의 임의의 정수 값)가 상동성-지시된 복구를 지원할 것이다. 공여자 서열은 임의의 길이, 예를 들어 10개 이상의 뉴클레오티드, 50개 이상의 뉴클레오티드, 100개 이상의 뉴클레오티드, 250개 이상의 뉴클레오티드, 500개 이상의 뉴클레오티드, 1000개 이상의 뉴클레오티드, 5000개 이상의 뉴클레오티드 등일 수 있다.

공여자 서열은 일반적으로, 대체되는 게놈 서열과 동일하지 않다. 오히려, 상동성-지시된 복구를 지원하기에 충분한 서열 동일성이 존재하는 한, 공여자 서열은 게놈 서열과 관련하여 적어도 하나 이상의 단일 염기 치환, 삽입, 결실, 역전 또는 재배열을 함유할 수 있다. 일부 실시양태에서, 공여자 서열은 표적 DNA 영역과 상동인 2개의 영역에 의해 플랭킹된 비-상동 서열 (상동성 아암으로서 지칭되기도 함)을 포함하여, 표적 DNA 영역과 2개의 플랭킹 상동성 아암 간의 상동성-지시된 복구로 인해 표적 영역에 비-상동 서열이 삽입된다. 공여자 서열은 또한 관심 DNA 영역과 상동이 아니고 관심 DNA 영역에 삽입되도록 의도되지 않은 서열을 함유하는 벡터 백본을 포함할 수 있다. 일반적으로, 공여자 서열의 상동 영역(들)은 재조합이 요망되는 게놈 서열과 적어도 50%의 서열 동일성을 가질 것이다. 특정 실시양태에서, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 99.9%의 서열 동일성이 존재한다. 공여자 폴리뉴클레오티드의 길이에 따라, 1% 내지 100%의 서열 동일성 사이의 임의의 값이 존재할 수 있다. 공여자 서열은 게놈 서열과 비교 시 특정 서열 차이, 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택가능한 마커 (예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에서 공여자 서열의 성공적인 삽입을 평가하는데 사용될 수 있거나 일부 경우에는 다른 목적으로 사용될 수 있다 (예를 들어, 표적화된 게놈 로커스에서의 발현을 나타내기 위함). 일부 실시양태에서, 코딩 영역에 위치하는 경우, 이러한 뉴클레오티드 서열 차이는 아미노산 서열을 변화시키지 않거나 단백질의 구조 또는 기능에 실질적으로 영향을 미치지 않는 아미노산 변화를 만들 것이다. 대안적으로, 이들 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 플랭킹 재조합 서열, 예컨대 FLP, loxP 서열 등을 포함할 수 있다.

공여자 서열은 단일 가닥 DNA, 단일 가닥 RNA, 이중 가닥 DNA 또는 이중 가닥 RNA로서 세포에 제공될 수 있다. 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 선형 형태로 도입되는 경우, 공여자 서열의 말단은 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 (예를 들어, 엑소뉴클레오리틱 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 부가되고/거나 자기 상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 끝에 라이게이션된다. 예를 들어, 문헌 [Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889]을 참조한다. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 부가의 방법은 말단 아미노기(들)의 부가 및 변형된 뉴클레오티드간 연결, 예컨대 예를 들어 포스포로티오에이트, 포스포르아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하나 이에 제한되지는 않는다. 선형 공여자 서열의 말단을 보호하는 것에 대한 대안으로서, 재조합에 영향을 주지 않고 분해될 수 있는 상동성 아암 외부에 부가 길이의 서열이 포함될 수 있다. 공여자 서열은 부가의 서열, 예컨대 예를 들어 복제 기점, 프로모터 및 항생제 내성을 코딩하는 유전자를 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여자 서열은 네이키드 (예를 들어, 비변형된) 핵산으로서 도입될 수 있거나, 리포솜 또는 폴록사머와 같은 작용제와 복합체를 형성한 핵산으로서 도입될 수 있거나, 또는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드에 대해 상기 기재된 바와 같이, 바이러스 (예를 들어, 아데노바이러스, AAV)에 의해 전달될 수 있다.

상기 기재된 방법에 따라, 관심 DNA 영역을 생체 외에서 절단 및 변형, 예를 들어 "유전적으로 변형"시킬 수 있다. 일부 실시양태에서, 선택가능한 마커가 관심 DNA 영역에 삽입된 경우와 같이, 유전적으로 변형된 세포를 나머지 집단으로부터 분리함으로써 세포 집단에 유전적 변형을 포함하는 세포가 강화될 수 있다. 강화시키기 전에, "유전적으로 변형된" 세포는 세포 집단의 약 1% 이상 (예를 들어, 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 15% 이상, 또는 20% 이상)만을 구성할 수 있다. "유전적으로 변형된" 세포의 분리는 사용된 선택가능한 마커에 적절한 임의의 적합한 분리 기술에 의해 달성될 수 있다. 예를 들어, 형광 마커가 삽입된 경우, 세포는 형광 활성화 세포 분류를 통해 분리될 수 있는 반면, 세포 표면 마커가 삽입된 경우, 세포는 친화성 분리 기술, 예를 들어 자성 분리, 친화성 크로마토그래피, 고체 매트릭스에 부착된 친화성 시약을 사용한 "패닝", 또는 기타 적합한 기술에 의해 이종 집단으로부터 분리될 수 있다. 정확한 분리를 제공하는 기술은 다양한 수준의 정교함을 가질 수 있는 형광 활성화 세포 분류기, 예컨대 다중 색상 채널, 낮은 각도 및 둔한 광 산란 검출 채널, 임피던스 채널 등을 포함한다. 죽은 세포와 연관된 염료 (예를 들어, 아이오딘화프로피듐)를 이용하여 죽은 세포에 대항하여 세포를 선택할 수 있다. 유전적으로 변형된 세포의 생육력에 지나치게 해를 끼치지 않는 임의의 기술이 이용될 수 있다. 변형된 DNA를 포함하는 세포가 고도로 강화된 세포 조성물은 이러한 방식으로 달성된다. "고도로 강화된"이란 유전적으로 변형된 세포가 세포 조성물의 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 예를 들어 세포 조성물의 약 95% 이상 또는 98% 이상일 것임을 의미한다. 다시 말해서, 조성물은 유전적으로 변형된 세포의 실질적으로 순수한 조성물일 수 있다.

본원에 기재된 방법에 의해 생산된 유전적으로 변형된 세포는 즉시 사용될 수 있다. 추가적으로 또는 대안적으로, 세포는 액체 질소 온도에서 동결되어 장기간 동안 저장되고, 해동되어 재사용될 수 있다. 그러한 경우, 세포는 일반적으로 10% 디메틸술폭시드 (DMSO), 50% 혈청, 40% 완충 배지, 또는 그러한 동결 온도에서 세포를 보존하기 위해 관련 기술분야에서 흔히 사용되는 바와 같은 일부 다른 용액에서 동결될 것이며, 동결된 배양 세포를 해동하기 위해 관련 기술분야에서 통상적으로 공지된 바와 같은 방식으로 해동된다.

유전적으로 변형된 세포는 다양한 배양 조건 하에 시험관 내에서 배양될 수 있다. 세포는 배양을 통해 확장될 수 있으며, 예를 들어 증식을 촉진시키는 조건 하에서 성장할 수 있다. 배양 배지는, 예를 들어, 한천, 메틸셀룰로스 등을 함유하는 액체 또는 반고체일 수 있다. 세포 집단은 정상적으로 송아지 태아 혈청 (약 5-10%), L-글루타민, 티올, 특히 2-메르캅토에탄올, 및 항생제, 예를 들어 페니실린과 스트렙토마이신이 보충된 적절한 영양 배지, 예컨대 이스코브의 변형된 DMEM 또는 RPMI 1640에 현탁될 수 있다. 배양물은 각각의 세포가 반응하는 성장 인자를 함유할 수 있다. 본원에 정의된 바와 같은 성장 인자는 막횡단 수용체에 대한 특이적 효과를 통해, 배양물 또는 무손상 조직에서 세포의 생존, 성장 및/또는 분화를 촉진시킬 수 있는 분자이다. 성장 인자는 폴리펩티드 및 비-폴리펩티드 인자를 포함한다. 이러한 방식으로 유전적으로 변형된 세포는, 예를 들어 질환을 치료하기 위한 유전자 요법 등의 목적을 위해, 또는 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 또는 생물학적 연구를 위해 대상체에게 이식될 수 있다. 대상체는 신생아, 청소년 또는 성인일 수 있다. 특히 흥미로운 것은 포유동물 대상체이다. 본 방법으로 치료될 수 있는 포유동물 종은 개 및 고양이; 말; 소; 양 등과 영장류, 특히 인간을 포함한다. 동물 모델, 특히 작은 포유동물 (예를 들어, 마우스, 래트, 기니피그, 햄스터, 토끼목 (예를 들어, 토끼) 등)을 실험 조사에 사용할 수 있다.

세포는, 예를 들어, 이식되는 조직에서의 성장 및/또는 조직을 지원하기 위해 단독으로 또는 적합한 기질 또는 매트릭스와 함께 대상체에게 제공될 수 있다. 일반적으로, 적어도 1x10³개 세포, 예를 들어 5x10³개 세포, 1x10⁴개 세포, 5x10⁴개 세포, 1x10⁵개 세포, 1x10⁶개 세포 또는 그 초과의 세포가 투여될 것이다. 세포는 하기 경로: 비경구, 피하, 정맥내, 두개내, 척수내, 안구내 또는 척수액내 중 임의의 경로를 통해 대상체에게 도입될 수 있다. 세포는 주사, 카테터 등에 의해 도입될 수 있다. 국소 전달, 즉 손상 부위로의 전달 방법의 예는, 예를 들어 옴마야(Ommaya) 저장소를 통해, 예를 들어 척수강내 전달 (예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,222,982 및 5,385,582 참조); 예를 들어 주사기에 의해, 예를 들어 관절 내로의 볼루스 주사에 의해; 연속 주입에 의해, 예를 들어 대류를 이용한 캐뉼라 삽입에 의해 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20070254842 참조); 또는 세포가 가역적으로 부착된 장치를 체내 이식하는 것 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20080081064 및 20090196903 참조)을 포함한다. 트랜스제닉 동물 (예를 들어, 트랜스제닉 마우스)을 생성할 목적으로 세포를 배아 (예를 들어, 배반포) 내로 도입할 수도 있다.

일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 제어 요소, 예를 들어 전사 제어 요소, 예컨대 프로모터에 작동가능하게 연결된다. 전사 제어 요소는 일반적으로 진핵 세포, 예컨대 포유동물 세포 (예를 들어, 인간 세포); 또는 원핵 세포 (예를 들어, 박테리아 또는 고세균 세포)에서 기능적이다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 원핵 세포 및 진핵 세포 둘 다에서 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열의 발현을 허용하는 다중 제어 요소에 작동가능하게 연결된다.

프로모터는 구성적으로 활성인 프로모터 (예를 들어, 구성적으로 활성 "온" 상태인 프로모터)일 수 있고, 이는 유도성 프로모터 (예를 들어, 활성/"온" 또는 불활성/"오프" 상태가 외부 자극, 예를 들어 특정한 온도, 화합물 또는 단백질의 존재에 의해 제어되는 프로모터)일 수 있으며, 이는 공간적으로 제한된 프로모터 (예를 들어, 전사 제어 요소, 인핸서 등) (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 이는 시간적으로 제한된 프로모터 (예를 들어, 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계, 예를 들어 마우스의 모낭 주기 동안 "온" 상태 또는 "오프" 상태에 있음)일 수 있다.

적합한 프로모터는 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로서 지칭될 수 있거나, 원핵 또는 진핵 유기체를 포함한 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터를 사용하여 임의의 RNA 폴리머라제 (예를 들어, pol I, pol II, pol III)에 의한 발현을 구동할 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복부 (LTR) 프로모터; 아데노바이러스 주요 후기 프로모터 (Ad MLP); 단순 포진 바이러스 (HSV) 프로모터, 시토메갈로바이러스 (CMV) 프로모터, 예컨대 CMV 즉시 초기 프로모터 영역 (CMVIE), 라우스 육종 바이러스 (RSV) 프로모터, 인간 U6 소형 핵 프로모터 (U6) (문헌 [Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)]), 향상된 U6 프로모터 (예를 들어, 문헌 [Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)]), 인간 H1 프로모터 (H1) 등을 포함하나 이에 제한되지는 않는다.

유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노시드 (IPTG)-조절된 프로모터, 락토스 유도된 프로모터, 열 충격 프로모터, 테트라시클린-조절된 프로모터 (예를 들어, Tet-ON, Tet-OFF 등), 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 포함하나 이에 제한되지는 않는다. 따라서 유도성 프로모터는 독시시클린; RNA 폴리머라제, 예를 들어 T7 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합 등을 포함하나 이에 제한되지는 않는 분자에 의해 조절될 수 있다.

일부 실시양태에서, 프로모터는 다세포 유기체에서 프로모터가 특이적 세포의 서브세트에서 활성 (예를 들어, "온")이 되도록 공간적으로 제한된 프로모터 (예를 들어, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이다. 공간적으로 제한된 프로모터는 인핸서, 전사 제어 요소, 제어 서열 등으로서 지칭될 수도 있다. 임의의 적합한 공간적으로 제한된 프로모터가 사용될 수 있으며 적합한 프로모터 (예를 들어, 뇌 특이적 프로모터, 뉴런의 서브세트에서의 발현을 구동시키는 프로모터, 생식계열에서의 발현을 구동시키는 프로모터, 폐에서의 발현을 구동시키는 프로모터, 근육에서의 발현을 구동시키는 프로모터, 췌장의 섬 세포에서의 발현을 구동시키는 프로모터 등)의 선택은 유기체에 따라 달라질 것이다. 예를 들어, 식물, 파리, 벌레, 포유동물, 마우스 등에 대한 다양한 공간적으로 제한된 프로모터가 공지되어 있다. 따라서, 공간적으로 제한된 프로모터를 사용하여 유기체에 따라 매우 다양한 상이한 조직 및 세포 유형에서 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산의 발현을 조절할 수 있다. 일부 공간적으로 제한된 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계 (예를 들어, 마우스의 모낭 주기) 동안 프로모터가 "온" 상태 또는 "오프" 상태에 있도록 시간적으로 제한된다.

예시 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하나 이에 제한되지는 않는다. 뉴런-특이적 공간적으로 제한된 프로모터는 뉴런-특이적 엔올라제 (NSE) 프로모터 (예를 들어, EMBL HSEN02, X51956 참조); 방향족 아미노산 데카르복실라제 (AADC) 프로모터; 신경필라멘트 프로모터 (예를 들어, 진뱅크 HUMNFL, L04147 참조); 시냅신 프로모터 (예를 들어, 진뱅크 HUMSYNIB, M55301 참조); thy-1 프로모터 (예를 들어, 문헌 [Chen et al. (1987) Cell 51:7-19; 및 Llewellyn, et al. (2010) Nat. Med. 16(10):1161-1166] 참조); 세로토닌 수용체 프로모터 (예를 들어, 진뱅크 S62283 참조); 티로신 히드록실라제 프로모터 (TH) (예를 들어, 문헌 [Oh et al. (2009) Gene Ther 16:437; Sasaoka et al. (1992) Mol. Brain Res. 16:274; Boundy et al. (1998) J. Neurosci. 18:9989; 및 Kaneda et al. (1991) Neuron 6:583-594] 참조); GnRH 프로모터 (예를 들어, 문헌 [Radovick et al. (1991) Proc. Natl. Acad. Sci. USA 88:3402-3406] 참조); L7 프로모터 (예를 들어, 문헌 [Oberdick et al.(1990) Science 248:223-226] 참조); DNMT 프로모터 (예를 들어, 문헌 [Bartge et al. (1988) Proc. Natl. Acad. Sci. USA 85:3648-3652] 참조); 엔케팔린 프로모터 (예를 들어, 문헌 [Comb et al. (1988) EMBO J. 17:3793-3805] 참조); 미엘린 염기성 단백질 (MBP) 프로모터; Ca2+-칼모듈린-의존성 단백질 키나제 11-알파 (CamKIIa) 프로모터 (예를 들어, 문헌 [Mayford et al. (1996) Proc. Natl. Acad. Sci. USA 93:13250; 및 Casanova et al. (2001) Genesis 31:37] 참조); CMV 인핸서/혈소판 유래 성장 인자-p 프로모터 (예를 들어, 문헌 [Liu et al. (2004) Gene Therapy 11:52-60] 참조) 등을 포함하나 이에 제한되지는 않는다.

지방세포-특이적 공간적으로 제한된 프로모터는 aP2 유전자 프로모터/인핸서, 예를 들어 인간 aP2 유전자의 -5.4 kb 내지 +21 bp의 영역 (예를 들어, 문헌 [Tozzo et al. (1997) Endocrinol. 138:1604; Ross et al. (1990) Proc. Natl. Acad. Sci. USA 87:9590; 및 Pavjani et al. (2005) Nat. Med. 11:797] 참조); 글루코스 수송체-4 (GLUT4) 프로모터 (예를 들어, 문헌 [Knight et al. (2003) Proc. Natl. Acad. Sci. USA 100:14725] 참조); 지방산 트랜스로카제 (FAT/CD36) 프로모터 (예를 들어, 문헌 [Kuriki et al. (2002) Biol. Pharm. Bull. 25:1476; 및 Sato et al. (2002) J. Biol. Chem. 277:15703] 참조); 스테아로일-CoA 불포화효소-1 (SCD1) 프로모터 (문헌 [Taboret al. (1999) J. Biol. Chem. 274:20603]); 렙틴 프로모터 (예를 들어, 문헌 [Mason et al. (1998) Endocrinol. 139:1013; 및 Chen et al. (1999) Biochem. Biophys. Res. Comm. 262:187] 참조); 아디포넥틴 프로모터 (예를 들어, 문헌 [Kita et al. (2005) Biochem. Biophys. Res. Comm. 331:484; 및 Chakrabarti (2010) Endocrinol. 151:2408] 참조); 아디프신 프로모터 (예를 들어, 문헌 [Platt et al. (1989) Proc. Natl. Acad. Sci. USA 86:7490] 참조); 레지스틴 프로모터 (예를 들어, 문헌 [Seo et al. (2003) Malec. Endocrinol. 17:1522] 참조) 등을 포함하나 이에 제한되지는 않는다.

심근세포-특이적 공간적으로 제한된 프로모터는 하기 유전자로부터 유래된 제어 서열을 포함하나 그에 제한되지는 않는다: 미오신 경쇄-2, a-미오신 중쇄, AE3, 심장 트로포닌 C, 심장 액틴 등 (문헌 [Franz et al. (1997) Cardiovasc. Res. 35:560-566; Robbins et al. (1995) Ann. N.Y. Acad. Sci. 752:492-505; Linn et al. (1995) Circ. Res. 76:584591; Parmacek et al. (1994) Mol. Cell. Biol. 14:1870-1885; Hunter et al. (1993) Hypertension 22:608-617; 및 Sartorelli et al. (1992) Proc. Natl. Acad. Sci. USA 89:4047-4051]).

평활근-특이적 공간적으로 제한된 프로모터는 SM22a 프로모터 (예를 들어, 문헌 [Akyilrek et al. (2000) Mol. Med. 6:983]; 및 미국 특허 번호 7,169,874 참조); 스무델린 프로모터 (예를 들어, WO 2001/018048 참조); α-평활근 액틴 프로모터 등을 포함하나 이에 제한되지는 않는다. 예를 들어, 그 내부에 2개의 CArG 요소가 있는 SM22a 프로모터의 0.4 kb 영역은 혈관 평활근 세포-특이적 발현을 매개하는 것으로 나타났다 (예를 들어, 문헌 [Kim, et al. (1997) Mol. Cell. Biol. 17, 2266-2278; Li, et al., (1996) J. Cell Biol. 132, 849-859; 및 Moessler, et al. (1996) Development 122, 2415-2425] 참조).

광수용체-특이적 공간적으로 제한된 프로모터는 로돕신 프로모터; 로돕신 키나제 프로모터 (문헌 [Young et al. (2003) Ophthalmol. Vis. Sci. 44:4076]); 베타 포스포디에스테라제 유전자 프로모터 (문헌 [Nicoud et al. (2007) J. Gene Med. 9:1015]); 색소성 망막염 유전자 프로모터 (상기 문헌 [Nicoud et al. (2007)] 참조); 광수용체간 레티노이드-결합 단백질 (IRBP) 유전자 인핸서 (상기 문헌 [Nicoud et al. (2007)] 참조); IRBP 유전자 프로모터 (문헌 [Yokoyama et al. (1992) Exp Eye Res. 55:225]) 등을 포함하나 이에 제한되지는 않는다.

가이드 RNA를 포함하는 조성물

일부 실시양태에서, 본원에는 가이드 RNA를 포함하는 조성물이 제공된다. 조성물은 가이드 RNA 외에, 하기 중 하나 이상을 포함할 수 있다: 염, 예를 들어 NaCl, MgCl₂, KCl, MgSO₄ 등; 완충제, 예를 들어 트리스 완충액, N-(2-히드록시에틸)피페라진-N'-(2-에탄술폰산) (HEPES), 2-(N-모르폴리노)에탄술폰산 (MES), MES 나트륨 염, 3-(N-모르폴리노)프로판술폰산 (MOPS), N-트리스[히드록시메틸]메틸-3-아미노프로판술폰산 (TAPS) 등; 가용화제; 세제, 예를 들어 비-이온성 세제, 예컨대 Tween-20 등; 뉴클레아제 억제제 등. 예를 들어, 일부 실시양태에서, 조성물은 가이드 RNA 및 핵산을 안정화시키기 위한 완충제를 포함한다.

일부 실시양태에서, 조성물에 존재하는 가이드 RNA는 순수하며, 예를 들어 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 99% 초과하여 순수하며, 여기서 "% 순도"는 가이드 RNA가 가이드 RNA의 생산 동안 존재할 수 있는 다른 거대분자 또는 오염물질이 없는 나열된 퍼센트라는 것을 의미한다.

B- GEn .1 또는 B- GEn .2 폴리펩티드를 포함하는 조성물

일부 실시양태에서, 본원에는 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 조성물이 제공된다. 조성물은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 외에, 하기 중 하나 이상을 포함할 수 있다: 염, 예를 들어, NaCl, MgCl₂, KCl, MgSO₄ 등; 완충제, 예를 들어 트리스 완충액, HEPES, MES, MES 나트륨 염, MOPS, TAPS 등; 가용화제; 세제, 예를 들어, 비-이온성 세제, 예컨대 Tween-20 등; 프로테아제 억제제; 환원제 (예를 들어, 디티오트레이톨) 등.

일부 실시양태에서, 조성물에 존재하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 순수하며, 예를 들어 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 99% 초과하여 순수하며, 여기서 "% 순도"는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 이러한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 생산 동안 존재할 수 있는 다른 단백질, 다른 거대분자 또는 오염물질이 없는 나열된 퍼센트라는 것을 의미한다.

가이드 RNA 및 부위-지시된 변형 폴리펩티드를 포함하는 조성물

일부 실시양태에서, 본원에는 하기를 포함하는 조성물이 제공된다: (i) 가이드 RNA 또는 이러한 가이드 RNA를 코딩하는 폴리뉴클레오티드; 및 ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA를 변형시키는 효소 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 효소 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA로부터의 전사를 조정한다.

일부 실시양태에서, 조성물의 구성요소는 개별적으로 순수하며, 예를 들어, 각각의 구성요소는 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 99% 순수하다. 일부 실시양태에서, 조성물의 개별 구성요소는 조성물에 부가되기 전에 순수하다.

키트

일부 실시양태에서, 본원에 기재된 방법을 수행하기 위한 키트가 제공된다. 키트는 하기 중 하나 이상을 포함할 수 있다: 예를 들어, 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 가이드 RNA; 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산. 키트는 하기 중 2개 이상을 포함하는 복합체를 포함할 수 있다: B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드를 포함하는 핵산; 가이드 RNA; 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산. 일부 실시양태에서, 키트는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 그를 코딩하는 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분은 감소되거나 불활성화된 뉴클레아제 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 B-GEn.1 또는 B-GEn.2 융합 단백질이다.

일부 실시양태에서, 키트는 (a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 포함하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 키트는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함한다. 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함하는 키트는 하나 이상의 부가의 시약을 추가로 포함할 수 있으며, 여기서 이러한 부가의 시약은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 내로 도입하기 위한 완충액; 세척 완충액; 대조군 시약; 대조군 발현 벡터 또는 폴리리보뉴클레오티드; DNA로부터 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 시험관 내 생산하기 위한 시약 등으로부터 선택될 수 있다.

본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, 키트는 sgRNA를 포함한다. 일부 실시양태에서, 키트는 2개 이상의 sgRNA를 포함한다.

본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, gRNA (예를 들어, 2개 이상의 가이드 RNA 포함)가 어레이 (예를 들어, RNA 분자의 어레이, 가이드 RNA(들)를 코딩하는 DNA 분자의 어레이 등)로서 제공될 수 있다. 이러한 키트는, 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 상기 기재된 유전적으로 변형된 숙주 세포와 연계해서 사용하는데 유용할 수 있다.

본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, 키트는 원하는 유전적 변형을 수행하기 위한 공여자 폴리뉴클레오티드를 추가로 포함한다.

키트의 구성요소는 별도의 용기 내에 있을 수 있거나; 또는 단일 용기에서 조합될 수 있다.

본원에 기재된 키트 중 임의의 것은 하나 이상의 부가의 시약을 추가로 포함할 수 있으며, 여기서 이러한 부가의 시약은 희석 완충액; 재구성 용액; 세척 완충액; 대조군 시약; 대조군 발현 벡터 또는 폴리리보뉴클레오티드; DNA로부터 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 시험관 내 생산하기 위한 시약 등으로부터 선택될 수 있다.

상기 언급된 구성요소에 더하여, 키트는 상기 방법을 실행하기 위해 키트의 구성요소를 사용하기 위한 지침을 추가로 포함할 수 있다. 상기 방법을 실행하기 위한 지침은 일반적으로 적합한 기록 매체에 기록된다. 예를 들어, 지침은 기판, 예컨대 종이 또는 플라스틱 등에 인쇄될 수 있다. 따라서, 지침은 키트에 패키지 삽입물로서, 키트 또는 그의 구성요소의 용기의 라벨링 (예를 들어, 패키징 또는 서브패키징과 연관됨) 등에 존재될 수 있다. 일부 실시양태에서, 지침은 적합한 컴퓨터 판독가능 저장 매체, 예를 들어 CD-ROM, 디스켓, 플래시 드라이브 등에 존재하는 전자 저장 데이터 파일로서 존재한다. 또 다른 실시양태에서, 실제 지침은 키트에 존재하지 않지만, 예를 들어 인터넷을 통해 원격 소스로부터 지침을 수득하기 위한 수단이 제공된다. 이러한 실시양태의 예는 지침을 볼 수 있고/거나 그로부터 지침을 다운로드할 수 있는 웹 주소를 포함하는 키트이다. 지침과 마찬가지로, 지침을 수득하기 위한 이러한 수단은 적합한 기판에 기록된다.

본 개시내용의 방법

표적 DNA 및/또는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 방법

일부 실시양태에서, 본원에는 표적 DNA 및/또는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 방법이 제공된다. 일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 1 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 1과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 2 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 2와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 3 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 3과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 4 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 4와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 5 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 5와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 6 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 6과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 7 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 7과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 8 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 8과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 9 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 9와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 133 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 133과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.

일부 실시양태에서, 본원에는 (a) 예를 들어 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 단계를 포함하는, 세포 또는 시험관 내 환경에서의 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 여기서 상기 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 DNA 내의 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 상기 방법은 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드는 서열식별번호: 1 내지 9, 또는 133의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 상기 방법은 gRNA를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 상기 방법은 하나 이상의 부가의 gRNA 또는 표적 DNA를 표적화하는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 템플릿을 세포 또는 시험관 내 환경 내로 도입하는 것을 추가로 포함한다.

일부 실시양태에서, 본원에는 (a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 단계를 포함하는, 세포 또는 시험관 내 환경에서의 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 여기서 상기 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 DNA 내의 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 상기 방법은 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 서열식별번호: 1 내지 9, 또는 133의 아미노산 서열 또는 이들 아미노산 서열과 적어도 95%의 서열 동일성을 갖는 그의 변이체를 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 상기 방법은 하나 이상의 부가의 gRNA 또는 표적 DNA를 표적화하는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 템플릿을 세포 또는 시험관 내 환경 내로 도입하는 것을 추가로 포함한다.

상기 논의된 바와 같이, gRNA 또는 sgRNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 리보핵단백질 복합체를 형성할 수 있다. 가이드 RNA는 표적 DNA의 서열에 상보적인 뉴클레오티드 서열을 포함함으로써 복합체에 표적 특이성을 제공한다. 복합체의 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 엔도뉴클레아제 활성을 제공한다. 일부 실시양태에서, 복합체는 표적 DNA를 변형시켜, 예를 들어 DNA 절단, DNA 메틸화, DNA 손상, DNA 복구 등을 초래한다. 일부 실시양태에서, 복합체는 표적 DNA와 연관된 표적 폴리펩티드 (예를 들어, 히스톤, DNA-결합 단백질 등)를 변형시켜, 예를 들어 히스톤 메틸화, 히스톤 아세틸화, 히스톤 유비퀴틴화 등을 초래한다. 표적 DNA는, 예를 들어, 시험관 내에서 네이키드 (예를 들어, DNA 연관 단백질에 의해 결합되지 않은) DNA, 시험관 내에서 세포 내의 염색체 DNA, 생체 내에서 세포 내의 염색체 DNA 등일 수 있다.

본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성은 표적 DNA를 절단하여 이중 가닥 파손부를 생산할 수 있다. 그런 다음 이러한 파손부는 비-상동 말단 연결 및 상동성-지시된 복구의 2가지 방식 중 한가지에서 세포에 의해 복구된다. 비-상동 말단 연결 (NHEJ)에서, 이중 가닥 파손부는 파손부 끝을 서로 직접 라이게이션함으로써 복구된다. 이러한 프로세스에서, 몇 개의 염기쌍이 절단 부위에 삽입되거나 결실될 수 있다. 상동성-지시된 복구에서는, 절단된 표적 DNA 서열과 상동성을 갖는 공여자 폴리뉴클레오티드가, 절단된 표적 DNA 서열의 복구를 위한 템플릿으로서 사용되어 유전 정보가 공여자 폴리뉴클레오티드에서 표적 DNA로 전달된다. 따라서, 새로운 핵산 물질이 그러한 부위에 삽입/카피될 수 있다. 일부 실시양태에서, 표적 DNA는 공여자 폴리뉴클레오티드와 접촉된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드가 세포 내로 도입된다. NHEJ 및/또는 상동성-지시된 복구로 인한 표적 DNA의 변형은, 예를 들어, 유전자 교정, 유전자 대체, 유전자 태깅, 트랜스진 삽입, 뉴클레오티드 결실, 뉴클레오티드 삽입, 유전자 파괴, 유전자 돌연변이, 서열 대체 등을 초래한다. 따라서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체에 의한 DNA의 절단은 표적 DNA 서열을 절단하고 세포가 외인성으로 제공된 공여자 폴리뉴클레오티드의 부재 하에 서열을 복구할 수 있게 함으로써 표적 DNA 서열로부터 핵산 물질을 결실시키기 위해 (예를 들어, 세포를 감염에 취약하게 만드는 유전자, 예를 들어, T 세포를 HIV 감염에 취약하게 만드는 CCRS 또는 CXCR4 유전자를 파괴하기 위해, 뉴런에서 질환을 유발하는 트리뉴클레오티드 반복 서열을 제거하기 위해, 연구에서 질환 모델로서 유전자 녹아웃 및 돌연변이 생성하기 위해 등) 사용될 수 있다 . 따라서, 상기 방법을 사용하여 유전자를 녹아웃시키거나 (전사/번역이 완전히 결여되거나 전사/번역이 변경됨) 또는 유전 물질을 표적 DNA 내의 선택된 로커스로 녹아웃시키기 위해 사용될 수 있다.

추가적으로 또는 대안적으로, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가, 표적 DNA 서열과 상동성을 갖는 적어도 세그먼트를 포함하는 공여자 폴리뉴클레오티드 서열과 함께 세포에 공동 투여되는 경우, 대상 방법은, 예를 들어, 표적 DNA 서열에 핵산 물질을 부가, 예를 들어 삽입 또는 교체하기 위해 (예를 들어, 단백질, siRNA, miRNA 등을 코딩하는 핵산을 "녹인"하기 위해), 태그 (예를 들어, 6xHis, 형광 단백질 (예를 들어, 녹색 형광 단백질; 황색 형광 단백질 등), 헤마글루티닌 (HA), FLAG 등)를 부가하기 위해, 유전자에 조절 서열 (예를 들어, 프로모터, 폴리아데닐화 신호, 내부 리보솜 진입 서열 (IRES), 2A 펩티드, 시작 코돈, 정지 코돈, 스플라이스 신호, 국재화 신호 등)을 부가하기 위해, 핵산 서열을 변형 (예를 들어, 돌연변이를 도입)시키기 위해 사용될 수 있다. 따라서, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 복합체는, 예를 들어, 질환을 치료하기 위한 유전자 요법에서, 또는 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 치료, 진단 또는 연구 목적을 위해 세포에 의한 단백질의 대규모 생산을 위해, iPS 세포의 유도, 생물학적 연구, 결실 또는 대체를 위한 병원체 유전자의 표적화 등을 위해 사용된 바와 같이, 부위-특이적, 예를 들어 "표적화" 방식으로 DNA를 변형시키는 것이 바람직한 임의의 시험관 내 또는 생체 내 적용, 예를 들어 유전자 녹아웃, 유전자 녹인, 유전자 편집, 유전자 태깅, 서열 교체 등에 유용하다.

일부 실시양태에서, 본원에 기재된 방법은 이종 서열을 포함한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드)를 이용한다. 일부 실시양태에서, 이종 서열은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 세포하 국재화를 제공할 수 있다 (예를 들어, 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호; ER 체류 신호 등). 일부 실시양태에서, 이종 서열은 추적 또는 정제의 용이성을 위한 태그를 제공할 수 있다 (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등). 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다.

일부 실시양태에서, 본원에 기재된 방법은 표적 세포에서 유전자 발현을 차단하기 위한 유도성 시스템으로서 사용되는 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 이용한다. 일부 실시양태에서, 적절한 가이드 RNA 및/또는 적절한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산이 표적 세포의 염색체에 혼입되고 유도성 프로모터의 제어 하에 있다. 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 유도되는 경우, 가이드 RNA와 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 둘 다가 존재하여 복합체를 형성할 때 관심 위치에서 표적 DNA (예를 들어, 별도의 플라스미드 상의 표적 유전자)가 절단 (또는 달리 변형)된다. 따라서, 일부 실시양태에서, 표적 세포는 게놈 내의 적절한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 플라스미드 상의 (예를 들어, 유도성 프로모터의 제어 하의) 적절한 가이드 RNA를 코딩하는 핵산 서열을 포함하도록 조작되어, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 발현을 유도함으로써 임의의 표적화된 유전자의 발현 (균주 내로 도입된 별도의 플라스미드로부터 발현됨)을 제어할 수 있는 실험이 가능해졌다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 이중 가닥 파손부를 도입하는 것 이외의 방식으로 표적 DNA를 변형시키는 효소 활성을 갖는다. 표적 DNA를 변형시키는데 (예를 들어, 효소 활성을 갖는 이종 폴리펩티드를 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합시킴으로써, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 생성하는 것에 의함) 사용될 수 있는 관심 효소 활성은 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 라이가제 활성, 헬리카제 활성, 포토리아제 활성 또는 글리코실라제 활성을 포함하나 이에 제한되지는 않는다. 메틸화 및 탈메틸화는 후성유전학적 유전자 조절의 중요한 방식으로서 관련 기술분야에서 인식되는 반면, DNA 손상의 복구는 세포 생존 및 환경적 스트레스에 반응하는 적당한 게놈 유지에 필수적이다. 따라서, 본원의 방법은 표적 DNA의 후성유전학적 변형에 사용되고, 원하는 서열을 가이드 RNA의 스페이서 영역 내로 도입함으로써 표적 DNA 내의 임의의 위치에서 표적 DNA의 후성유전학적 변형을 제어하는데 이용될 수 있다. 본원의 방법은 또한 표적 DNA 내의 임의의 원하는 위치에서 DNA의 의도적이고 제어된 손상에 사용된다. 본원의 방법은 또한 표적 DNA 내의 임의의 원하는 위치에서 DNA의 서열 특이적이고 제어된 복구에 사용된다. DNA-변형 효소 활동을 표적 DNA 내의 특이적 위치로 표적화하는 방법은 연구 및 임상 적용 둘 다에 사용된다.

일부 실시양태에서, 다중 가이드 RNA는 동일한 표적 DNA 상의 또는 상이한 표적 DNA 상의 상이한 위치를 동시에 변형시키는데 사용된다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 동일한 유전자 또는 전사체 또는 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이한 관련되지 않은 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이하지만 관련된 로커스를 표적화한다.

일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 단백질로서 직접적으로 제공된다. 하나의 비제한적인 예로서, 진균 (예를 들어, 효모)는 스페로플라스트 형질전환을 사용하여 외인성 단백질 및/또는 핵산으로 형질전환될 수 있다 (문헌 [Kawai et al., Bioeng Bugs. 2010 Nov-Dec;1(6):395-403: "Transformation of Saccharomyces cerevisiae and other fungi: methods and possible underlying mechanism"; 및 Tanka et al., Nature. 2004 Mar 18;428(6980):323-8: "Conformational variations in an infectious protein determine prion strain differences"] 참조; 이들 둘 다 그 전체 내용이 본원에 참조로 포함됨). 따라서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 스페로플라스트에 혼입될 수 있고 (가이드 RNA를 코딩하는 핵산이 있거나 없고, 공여자 폴리뉴클레오티드가 있거나 없음), 스페로플라스트는 내용물을 효모 세포 내로 도입하는데 사용될 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 임의의 적합한 방법에 의해 세포 내로 도입 (세포에 제공)될 수 있으며; 이러한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 또 다른 비제한적인 예로서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 세포, 예를 들어 제브라피쉬 배아의 세포, 수정된 마우스 난모세포의 전핵 등에 직접적으로 주입될 수 있다 (예를 들어, 가이드 RNA를 코딩하는 핵산이 있거나 없고, 공여자 폴리뉴클레오티드가 있거나 없음).

전사를 조정하는 방법

일부 실시양태에서, 본원에는 숙주 세포에서 표적 핵산의 전사를 조정하는 방법이 제공된다. 상기 방법은 일반적으로 표적 핵산을 효소적으로 불활성인 B-GEn.1 또는 B-GEn.2 폴리펩티드 및 가이드 RNA와 접촉시키는 것을 수반한다. 상기 방법은, 또한 제공되는 다양한 적용에 유용하다.

본 개시내용의 전사 조정 방법은 RNAi를 수반하는 방법의 단점 중 일부를 극복한다. 본 개시내용의 전사 조정 방법은 연구 적용, 약물 발견 (예를 들어, 높은 처리량 스크리닝), 표적 검증, 산업적 적용 (예를 들어, 작물 공학; 미생물 공학 등), 진단 적용, 치료 적용, 및 영상화 기술을 포함한 매우 다양한 적용에 사용된다.

일부 실시양태에서, 본원에는 숙주 세포, 예를 들어 인간 세포에서 표적 DNA의 전사를 선택적으로 조정하는 방법이 제공된다. 상기 방법은 일반적으로 a) 숙주 세포 내로 i) 가이드 RNA, 또는 이러한 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 및 ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입하는 것을 수반하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 감소된 엔도데옥시리보뉴클레아제 활성을 나타낸다. 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 숙주 세포에서 복합체를 형성하고; 복합체는 숙주 세포에서 표적 DNA의 전사를 선택적으로 조정한다.

일부 실시양태에서, 본원에 기재된 방법은 B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태를 이용한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태는 B-GEn.1 또는 B-GEn.2 단백질의 뉴클레아제 활성을 감소시키는 아미노산 변화 (예를 들어, 결실, 삽입 또는 치환)를 포함한다. 예를 들어, 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태는 상응하는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만을 갖는다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않는다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 실질적인 뉴클레아제 활성을 갖지 않는 B-GEn.1 또는 B-GEn.2 폴리펩티드의 변형된 형태인 경우, 이는 "dB-GEn.1 또는 B-GEn.2"로서 지칭될 수 있다.

일부 실시양태에서, 본원에 기재된 전사 조정 방법은 숙주 세포에서 표적 핵산의 선택적 조정 (예를 들어, 감소 또는 증가)을 허용한다. 예를 들어, 표적 핵산의 전사의 "선택적" 감소는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 표적 핵산의 전사 수준과 비교하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 90% 초과만큼 표적 핵산의 전사를 감소시킨다. 표적 핵산의 전사를 선택적으로 감소시키는 것은 표적 핵산의 전사를 감소시키지만, 비-표적 핵산의 전사를 실질적으로 감소시키지는 못하며, 예를 들어 비-표적 핵산의 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 비-표적 핵산의 전사 수준과 비교하여 10% 미만 만큼만 감소된다.

일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA의 전사를 조정하는 활성을 갖는다 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체의 경우 등). 일부 실시양태에서, 전사를 증가시키거나 감소시킬 수 있는 능력을 나타내는 이종 폴리펩티드 (예를 들어, 전사 활성인자 또는 전사 억제인자 폴리펩티드)를 포함하는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 표적 DNA 내의 특이적 위치에서 표적 DNA의 전사를 증가시키거나 감소시키는데 사용되며, 이는 가이드 RNA의 스페이서에 의해 가이드된다. 전사 조정 활성을 갖는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 제공하기 위한 공급원 폴리펩티드의 예는 광-유도성 전사 조절인자, 소분자/약물 반응성 전사 조절인자, 전사 인자, 전사 억제인자 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 상기 방법은 표적화된 유전자 코딩 RNA (단백질 코딩 mRNA) 및/또는 표적화된 비-코딩 RNA (예를 들어, tRNA, rRNA, snoRNA, siRNA, miRNA, 긴 ncRNA 등)의 전사를 제어하는데 사용된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 DNA와 연관된 폴리펩티드 (예를 들어, 히스톤)를 변형시키는 효소 활성을 갖는다. 일부 실시양태에서, 효소 활성은 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성 (예를 들어, 유비퀴틴화 활성), 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 글리코실화 활성 (예를 들어, GlcNAc 트랜스퍼라제로부터) 또는 탈글리코실화 활성이다. 본원에 열거된 효소 활성은 단백질에 대한 공유 변형을 촉매한다. 이러한 변형은 표적 단백질의 안정성 또는 활성을 변경시키는 것으로 관련 기술분야에 공지되어 있다 (예를 들어, 키나제 활성으로 인한 인산화는 표적 단백질에 따라 단백질 활성을 자극하거나 침묵시킬 수 있음). 단백질 표적으로서 특히 관심을 끄는 것은 히스톤이다. 히스톤 단백질은 DNA와 결합하여 뉴클레오솜으로서 공지된 복합체를 형성하는 것으로 관련 기술분야에 공지되어 있다. 히스톤은 주변 DNA에서의 구조적 변화를 유도하기 위해 변형될 수 있으며 (예를 들어, 메틸화, 아세틸화, 유비퀴틴화, 인산화에 의함), 이에 따라 잠재적으로 큰 부분의 DNA가 상호작용 인자, 예컨대 전사 인자, 폴리머라제 등에 대한 접근성을 제어할 수 있다. 단일 히스톤은 많은 상이한 방법과 많은 상이한 조합으로 변형될 수 있다 (예를 들어, 히스톤 3의 리신 27인 H3K27의 트리메틸화는 억제된 전사의 DNA 영역과 연관되어 있는 반면, 히스톤 3의 리신 4인 H3K4의 트리메틸화는 활성 전사의 DNA 영역과 연관되어 있음). 따라서, 히스톤 변형 활성을 갖는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 염색체 구조의 부위 특이적 제어에 사용되며 표적 DNA의 선택된 영역에서 히스톤 변형 패턴을 변경하는데 사용될 수 있다. 이러한 방법은 연구 및 임상 적용 둘 다에서 사용된다.

증가된 전사

표적 DNA의 "선택적" 증가된 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 표적 DNA로부터의 전사 수준과 비교하여 적어도 1.1배 (예를 들어, 적어도 1.2배, 적어도 1.3배, 적어도 1.4배, 적어도 1.5배, 적어도 1.6배, 적어도 1.7배, 적어도 1.8배, 적어도 1.9배, 적어도 2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 12배, 적어도 15배, 또는 적어도 20배) 만큼 표적 DNA로부터의 전사를 증가시킬 수 있다. 표적 DNA의 전사의 선택적 증가는 표적 DNA로부터의 전사를 증가시키지만, 비-표적 DNA의 전사를 실질적으로 증가시키지는 않으며, 예를 들어, 비-표적 DNA의 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 비-표적화된 DNA의 전사 수준과 비교하여 약 5배 미만 (예를 들어, 약 4배 미만, 약 3배 미만, 약 2배 미만, 약 1.8배 미만, 약 1.6배 미만, 약 1.4배 미만, 약 1.2배 미만, 또는 약 1.1배 미만) 만큼만 증가된다.

비제한적인 예로서, 증가된 전사는 dB-GEn.1 또는 B-GEn.2를 이종 서열과 융합시킴으로써 달성될 수 있다. 적합한 융합 파트너는 표적 DNA에 또는 이러한 표적 DNA와 연관된 폴리펩티드 (예를 들어, 히스톤 또는 기타 DNA-결합 단백질)에 직접적으로 작용함으로써 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않는다. 적합한 융합 파트너는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 크로토닐화, 탈크로토닐화, 프로피오닐화, 탈프로피오닐화, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않는다.

부가의 적합한 융합 파트너는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩티드 (예를 들어, 전사 활성인자 또는 그의 단편, 전사 활성인자를 동원하는 단백질 또는 그의 단편, 소분자/약물 반응성 전사 조절인자 등)를 포함하나 이에 제한되지는 않는다.

원핵생물에서 전사를 증가시키기 위해 dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 비제한적인 예는 박테리아 1-하이브리드 (B1H) 또는 2-하이브리드 (B2H) 시스템의 변형을 포함한다. B1H 시스템에서, DNA 결합 도메인 (BD)은 박테리아 전사 활성화 도메인 (AD, 예를 들어 에스케리키아 콜라이(Escherichia coli) RNA 폴리머라제의 알파 서브유닛 (RNAPa))과 융합된다. 따라서, dB-GEn.1 또는 B-GEn.2는 AD를 포함하는 이종 서열과 융합될 수 있다. dB-GEn.1 또는 B-GEn.2 융합 단백질이 프로모터의 상류 영역 (가이드 RNA에 의해 그곳을 표적화함)에 도착하면, dB-GEn.1 또는 B-GEn.2 융합 단백질의 AD (예를 들어, RNAPa)가 RNAP 홀로엔자임을 동원하여 전사 활성화를 유도한다. B2H 시스템에서는, BD가 AD와 직접적으로 융합되지 않으며; 대신, 이들의 상호작용은 단백질-단백질 상호작용 (예를 들어, GAL11P-GAL4 상호작용)에 의해 매개된다. 상기 방법에 사용하기 위해 이러한 시스템을 변형시키기 위해서는, dB-GEn.1 또는 B-GEn.2가 단백질-단백질 상호작용을 제공하는 제1 단백질 서열 (예를 들어, 효모 GAL11P 및/또는 GAL4 단백질)과 융합될 수 있고, RNAa는 단백질-단백질 상호작용을 완료하는 제2 단백질 서열과 융합될 수 있다 (예를 들어, GAL11P가 dB-GEn.1 또는 B-GEn.2와 융합된 경우에는 GAL4이고, GAL4가 dB-GEn.1 또는 B-GEn.2와 융합된 경우에는 GAL11P임). GAL11P와 GAL4 간의 결합 친화도는 결합 효율과 전사 발사 속도를 증가시킨다.

진핵생물에서 전사를 증가시키기 위해 dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 비제한적인 예는 dB-GEn.1 또는 B-GEn.2를 활성화 도메인 (AD) (예를 들어, GAL4, 헤르페스바이러스 활성화 단백질 VP16 또는 VP64, 인간 핵 인자 NF-KB p65 서브유닛 등)과 융합시키는 것을 포함한다. 시스템을 유도성으로 만들기 위해, dB-GEn.1 또는 B-GEn.2 융합 단백질의 발현은 유도성 프로모터 (예를 들어, Tet-ON, Tet-OFF 등)에 의해 제어될 수 있다. 가이드 RNA는 공지된 전사 반응 요소 (예를 들어, 프로모터, 인핸서 등), 공지된 상류 활성화 서열 (UAS), 표적 DNA의 발현을 제어할 수 있는 것으로 의심되는 공지되지 않았거나 공지된 기능의 서열 등을 표적화하도록 설계될 수 있다.

부가의 융합 파트너

전사 증가 또는 감소를 달성하기 위한 융합 파트너의 비제한적인 예는 전사 활성인자 및 전사 억제인자 도메인 (예를 들어, 크뤼펠 연관 박스 (KRAB 또는 SKD); Mad mSIN3 상호작용 도메인 (SID); ERF 억제인자 도메인 (ERD) 등)을 포함하나 이에 제한되지는 않는다. 일부 이러한 경우, dB-GEn.1 또는 B-GEn.2 융합 단백질은 가이드 RNA에 의해 표적 DNA 내의 특이적 위치 (예를 들어, 서열)로 표적화되고, 로커스-특이적 조절을 발휘하며, 예컨대 프로모터와 결합하는 RNA 폴리머라제를 차단하고/거나 (전사 활성인자 기능을 선택적으로 억제함) 국소 염색질 상태를 변형시킨다 (예를 들어, 표적 DNA를 변형시키거나 표적 DNA와 연관된 폴리펩티드를 변형시키는 융합 서열이 사용되는 경우). 일부 실시양태에서, 변화는 일시적이다 (예를 들어, 전사 억제 또는 활성화). 일부 실시양태에서, 변화는 유전적이다 (예를 들어, 표적 DNA 또는 이러한 표적 DNA와 연관된 단백질, 예를 들어 뉴클레오솜 히스톤에 대한 후성유전학적 변형이 이루어진 경우). 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 C-말단과 융합될 수 있다. 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 N-말단과 융합될 수 있다. 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 내부 부분 (예를 들어, N- 또는 C-말단 이외의 부분)과 융합될 수 있다. dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 생물학적 효과는 임의의 적합한 방법 (예를 들어, 유전자 발현 검정; 염색질-기반 검정, 예를 들어 염색질 면역침전 (ChIP), 염색질 생체 내 검정 (CiA) 등)에 의해 검출될 수 있다.

일부 실시양태에서, 방법은 2개 이상의 상이한 가이드 RNA의 사용을 수반한다. 예를 들어, 2개의 상이한 가이드 RNA가 단일 숙주 세포에서 사용될 수 있으며, 여기서 2개의 상이한 가이드 RNA는 동일한 표적 핵산 내의 2개의 상이한 표적 서열을 표적화한다. 일부 실시양태에서, 동일한 표적 핵산 내의 2개의 상이한 표적화 서열을 표적화하는 2개의 상이한 가이드 RNA의 사용은 표적 핵산의 전사에서 증가된 조정 (예를 들어, 감소 또는 증가)을 제공한다.

또 다른 예로서, 2개의 상이한 가이드 RNA가 단일 숙주 세포에서 사용될 수 있으며, 여기서 2개의 상이한 가이드 RNA는 2개의 상이한 표적 핵산을 표적화한다. 따라서, 예를 들어, 전사 조정 방법은 제2 가이드 RNA, 또는 이러한 제2 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포 내로 도입하는 것을 추가로 포함할 수 있다.

일부 실시양태에서, 핵산 (예를 들어, 가이드 RNA, 예를 들어 단일 분자 가이드 RNA; 공여자 폴리뉴클레오티드; B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 등)은 부가의 바람직한 특색을 제공하는 변형 또는 서열을 포함한다 (예를 들어, 변형된 또는 조절된 안정성; 세포하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위 등). 비제한적인 예는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m 7G)); 3' 폴리아데닐화된 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 또는 압타머 서열 (예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 종결인자 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 변형 또는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여 DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; RNA의 구조를 변경시키는 RNA의 변형, 결과적으로 B-GEn.1 또는 B-GEn.2 리보핵단백질; 및 그의 조합을 포함한다.

다중 동시 가이드 RNA

일부 실시양태에서, 다중 가이드 RNA는 동일한 표적 DNA 상의 또는 상이한 표적 DNA 상의 상이한 위치에서 전사를 동시에 조정하기 위해 동일한 세포에서 동시에 사용된다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 동일한 유전자 또는 전사체 또는 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이한 관련되지 않은 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이하지만 관련된 로커스를 표적화한다.

가이드 RNA는 작고 견고하기 때문에 동일한 발현 벡터에 동시에 존재할 수 있으며 원할 경우 동일한 전사 제어를 받을 수도 있다. 일부 실시양태에서, 2개 이상 (예를 들어, 3개 이상, 4개 이상, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 또는 50개 이상)의 가이드 RNA가 표적 세포에서 동시에 발현된다 (동일하거나 상이한 벡터로부터/동일하거나 다른 프로모터로부터). 일부 실시양태에서, 다중 가이드 RNA는 표적인자 RNA의 자연적으로 발생하는 CRISPR 어레이를 모방하는 어레이에서 코딩될 수 있다. 표적화 세그먼트는 대략 30개 뉴클레오티드 길이의 서열 (약 16 내지 약 100 nt일 수 있음)로서 코딩되며 CRISPR 반복 서열에 의해 분리된다. 어레이는 RNA를 코딩하는 DNA에 의해 또는 RNA로서 세포 내로 도입될 수 있다.

다중 가이드 RNA를 발현하기 위해, Csy4 엔도리보뉴클레아제에 의해 매개되는 인공 RNA 프로세싱 시스템을 사용할 수 있다. 예를 들어, 다중 가이드 RNA는 전구체 전사체 (예를 들어, U6 프로모터로부터 발현됨) 상에서 직렬 어레이로 연결되고, Csy4-특이적 RNA 서열에 의해 분리될 수 있다. 공동 발현된 Csy4 단백질은 전구체 전사체를 다중 가이드 RNA로 절단한다. RNA 프로세싱 시스템을 사용하는 것의 이점은 첫째, 여러 프로모터를 사용할 필요가 없고; 둘째, 모든 가이드 RNA는 전구체 전사체로부터 프로세싱되기 때문에 이들의 농도는 유사한 dB-GEn.1 또는 B-GEn.2 결합에 대해 정규화된다는 것을 포함한다.

Csy4는 박테리아 슈도모나스 아에루기노사(Pseudomonas aeruginosa)로부터 유래된 작은 엔도리보뉴클레아제 (RNase) 단백질이다. Csy4는 최소 17-bp RNA 헤어핀을 특이적으로 인식하고, 신속하고 (<1분) 고도로 효율적인 (>99.9%) RNA 절단을 나타낸다. 대부분의 RNase와는 달리, 절단된 RNA 단편은 안정적이고 기능적으로 활성 상태를 유지한다. Csy4-기반 RNA 절단은 인공 RNA 프로세싱 시스템으로 용도가 변경될 수 있다. 이러한 시스템에서, 17-bp RNA 헤어핀은 단일 프로모터로부터의 전구체 전사체로서 전사되는 다중 RNA 단편 사이에 삽입된다. Csy4의 공동 발현은 개별 RNA 단편을 생성하는데 유효하다.

숙주 세포

일부 실시양태에서, 본 개시내용의 방법은 생체 내 및/또는 생체 외 및/또는 시험관 내 유사분열 또는 유사분열 후 세포에서 전사 조정을 유도하기 위해 이용될 수 있다. 일부 실시양태에서, 본 개시내용의 방법은 생체 내 및/또는 생체 외 및/또는 시험관 내 유사분열 또는 유사분열 후 세포에서 DNA 절단, DNA 변형 및/또는 전사 조정을 유도하는데 이용될 수 있다 (예를 들어, 개체에게 재도입될 수 있는 유전적으로 변형된 세포를 생산하기 위함).

가이드 RNA가 표적 DNA과 혼성화함으로써 특이성을 제공하기 때문에, 유사분열 및/또는 유사분열 후 세포는 다양한 숙주 세포 중 임의의 것일 수 있으며, 여기서 적합한 숙주 세포는 박테리아 세포; 고세균 세포; 단일 세포 진핵 유기체; 식물 세포; 조류 세포, 예를 들어 보트리오코쿠스 브라우니이, 클라미도모나스 레인하르트티이, 나노클로롭시스 가디타나, 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스, 씨. 아가르드 등; 진균 세포; 동물 세포; 무척추 동물 (예를 들어, 곤충, 자포동물, 극피동물, 선충류 등)로부터의 세포; 진핵 기생동물 (예를 들어, 말라리아 기생동물, 예를 들어 플라스모디움 파키파룸(Plasmodium fakiparum); 기생충 등); 척추 동물 (예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포; 포유동물 세포, 예를 들어 설치류 세포, 인간 세포, 비-인간 영장류 세포 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 숙주 세포는 임의의 인간 세포일 수 있다. 적합한 숙주 세포는 자연적으로 발생하는 세포; 유전적으로 변형된 세포 (예를 들어, 실험실에서 예를 들어 "사람의 손"에 의해 유전적으로 변형된 세포); 및 임의의 방식으로 시험관 내에서 조작된 세포를 포함한다. 일부 실시양태에서, 숙주 세포는 단리된다.

임의의 유형의 세포가 관심 대상이 될 수 있다 (예를 들어, 줄기 세포, 예를 들어 배아 줄기 (ES) 세포, 유도 만능성 줄기 (iPS) 세포, 생식 세포; 체세포, 예를 들어 섬유모세포, 조혈 세포, 뉴런, 근육 세포, 뼈 세포, 간세포, 췌장 세포; 임의의 단계의 배아의 시험관 내 또는 생체 내 배아 세포, 예를 들어, 1-세포, 2-세포, 4-세포, 8-세포 등; 단계 제브라피쉬 배아 등). 세포는 확립된 세포주로부터 유래될 수 있거나 1차 세포일 수 있으며, 여기서 "1차 세포", "1차 세포주" 및 "1차 배양물"은 대상체로부터 유래되고 배양물의 제한된 수의 계대, 예를 들어 분할 동안 시험관 내에서 성장하도록 허용된 세포 및 세포 배양물을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 예를 들어, 1차 배양물은 0회, 1회, 2회, 4회, 5회, 10회 또는 15회 계대되었지만 위기 단계를 통과하는 횟수가 충분하지 않은 배양물을 포함한다. 1차 세포주는 시험관 내에서 10회 미만의 계대 동안 유지될 수 있다. 일부 실시양태에서 표적 세포는 단세포 유기체이거나 배양물에서 성장된다.

세포가 1차 세포인 경우, 그러한 세포는 임의의 적합한 방법에 의해 개체로부터 채취될 수 있다. 예를 들어, 백혈구는 성분채집술, 백혈구성분채집술, 밀도 구배 분리 등에 의해 적합하게 채취될 수 있는 반면, 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등의 조직으로부터는 생검으로 세포를 채취하는 것이 가장 적합하다. 채취된 세포의 분산 또는 현탁을 위해 적절한 용액을 사용할 수 있다. 이러한 용액은 일반적으로 낮은 농도, 예를 들어 5-25 mM의 허용되는 완충액과 연계해서, 송아지 태아 혈청 또는 기타 자연적으로 발생하는 인자가 적합하게 보충된 균형 잡힌 염 용액, 예를 들어, 정상 식염수, 포스페이트-완충 식염수 (PBS), 행크 균형 염 용액 등일 것이다. 적합한 완충액은 HEPES, 포스페이트 완충액, 락테이트 완충액 등을 포함한다. 세포는 즉시 사용될 수 있거나, 또는 장기간 동안 저장, 동결된 다음, 해동하여 재사용할 수 있다. 그러한 경우, 세포는 일반적으로 10% 디메틸 술폭시드 (DMSO), 50% 혈청, 40% 완충 배지, 또는 그러한 동결 온도에서 세포를 보존하기 위해 관련 기술분야에서 통상적으로 사용된 바와 같은 일부 다른 용액에서 동결되며, 동결된 배양 세포를 해동하기 위해 관련 기술분야에 통상적으로 공지된 바와 같은 방식으로 해동된다.

용도

본 개시내용에 따른 전사를 조정하는 방법은, 또한 제공되는 다양한 적용에 사용된다. 적용은 연구 적용; 진단 적용; 산업 적용; 및 치료적 적용을 포함한다.

연구 적용은, 예를 들어, 하류 유전자의 발생, 대사, 발현 등에 대한 표적 핵산의 전사를 감소 또는 증가시키는 효과를 결정하는 것 등을 포함한다. 높은 처리량의 게놈 분석은 가이드 RNA의 스페이서만을 변경하면 되는 전사 조정 방법을 사용하여 수행될 수 있지만, 단백질-결합 세그먼트와 전사 종결 세그먼트는 (일부 경우에) 일정하게 유지될 수 있다. 게놈 분석에 사용되는 복수 개의 핵산을 포함하는 라이브러리는 가이드 RNA 코딩 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하며, 여기서 각각의 핵산은 공통 단백질-결합 세그먼트, 상이한 스페이서 및 공통 전사 종결 세그먼트를 포함한다. 칩은 5 x 10⁴개 초과의 고유한 가이드 RNA를 함유할 수 있다. 적용은 대규모 표현형 분석, 유전자-대-기능 매핑, 및 메타-게놈 분석을 포함한다.

본원에 개시된 방법은 대사 공학 분야에 사용된다. 본원에 개시된 바와 같이, 전사 수준은 적절한 가이드 RNA를 설계함으로써 효율적이고 예측가능하게 제어될 수 있기 때문에, 대사 경로 (예를 들어, 생합성 경로)의 활성은 관심 대사 경로 내의 특이적 효소의 수준을 제어함으로써 (예를 들어, 전사 증가 또는 감소를 통해) 정밀하게 제어되고 조정될 수 있다. 관심 대사 경로는 화학 물질 (정밀 화학 물질, 연료, 항생제, 독소, 효능제, 길항제 등) 및/또는 약물 생산에 사용되는 경로를 포함한다.

관심 생합성 경로는 (1) 메발로네이트 경로 (예를 들어, HMG-CoA 리덕타제 경로) (아세틸-GoA를 디메틸알릴 피로포스페이트 (DMAPP) 및 이소펜테닐 피로포스페이트 (IPP)로 전환시키며, 이는 테르페노이드/이소프레노이드를 비롯한 매우 다양한 생체분자의 생합성에 사용됨), (2) 비-메발로네이트 경로 (예를 들어, "2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로스 5-포스페이트 경로" 또는 "MEP/DOXP 경로" 또는 "DXP 경로") (메발로네이트 경로에 대한 대체 경로를 통해 피루베이트와 글리세르알데히드 3-포스페이트를 DMAPP와 IPP로 전환시킴으로써 대신 DMAPP와 IPP를 생산함), (3) 폴리케티드 합성 경로 (다양한 폴리케티드 신타제 효소를 통해 다양한 폴리케티드를 생산한다. 폴리케티드는 화학요법에 사용되는 자연적으로 발생하는 소분자 (예를 들어, 테트라시클린 및 매크롤리드)를 포함하며 산업적으로 중요한 폴리케티드는 라파마이신 (면역억제제), 에리트로마이신 (항생제), 로바스타틴 (항콜레스테롤 약물), 및 에포틸론 B (항암 약물)를 포함함), (4) 지방산 합성 경로, (5) DAHP (3-데옥시-D-아라비노-헵툴로소네이트 7-포스페이트) 합성 경로, (6) 잠재적인 바이오연료 (예컨대 단쇄 알콜 및 알칸, 지방산 메틸 에스테르 및 지방 알콜, 이소프레노이드 등)를 생산하는 경로 등을 포함하나 이에 제한되지는 않는다.

네트워크 및 캐스케이드

본원에 개시된 방법은 제어의 통합 네트워크 (예를 들어, 캐스케이드 또는 캐스케이드들)를 설계하는데 사용될 수 있다. 예를 들어, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 사용하여 또 다른 DNA-표적화 RNA 또는 또 다른 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 발현을 제어 (예를 들어, 조정, 예를 들어 증가, 감소)할 수 있다. 예를 들어, 제1 가이드 RNA는 제1 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 상이한 기능 (예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성 등)을 갖는 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 전사 조정을 표적화하도록 설계될 수 있다. 일부 실시양태에서, 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드는 제1 가이드 RNA와 상호작용하지 않도록 선택될 수 있다. 일부 실시양태에서, 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드는 제1 가이드 RNA와 상호작용하도록 선택될 수 있다. 일부 이러한 경우에, 2개 (또는 그 초과)의 dB-GEn.1 또는 B-GEn.2 단백질의 활성이 경쟁하거나 (예를 들어, 폴리펩티드가 반대 활성을 갖는 경우) 또는 시너지 효과를 발휘할 수 있다 (예를 들어, 폴리펩티드가 유사하거나 상승작용적 활성을 갖는 경우). 마찬가지로, 상기 언급된 바와 같이, 네트워크 내의 복합체 중 임의의 것 (예를 들어, 가이드 RNA/dB-GEn.1 또는 B-GEn.2 폴리펩티드)은 다른 가이드 RNA 또는 dB-GEn.1 또는 B-GEn.2 폴리펩티드를 제어하도록 설계될 수 있다. 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 임의의 원하는 DNA 서열에 표적화될 수 있기 때문에, 본원에 기재된 방법은 임의의 원하는 표적의 발현을 제어하고 조절하는데 사용될 수 있다. 설계될 수 있는 통합 네트워크 (예를 들어, 상호작용의 캐스케이드)는 매우 단순한 것부터 매우 복잡한 것까지 다양하며 제한이 없다.

2개 이상의 구성요소 (예를 들어, 가이드 RNA 및 dB-GEn.1 또는 B-GEn.2 폴리펩티드)가 각각 또 다른 가이드 RNA/dB-GEn.1 또는 B-GEn.2 폴리펩티드 복합체의 조절 제어 하에 있는 네트워크에서, 네트워크의 한 구성요소의 발현 수준은 네트워크의 또 다른 구성요소의 발현 수준에 영향을 미칠 수 있다 (예를 들어, 발현을 증가시키거나 감소시킬 수 있음). 이러한 메커니즘을 통해, 하나의 구성요소의 발현은 동일한 네트워크 내의 상이한 구성요소의 발현에 영향을 미칠 수 있으며, 네트워크는 다른 구성요소의 발현을 증가시키는 구성요소 뿐만 아니라 다른 구성요소의 발현을 감소시키는 구성요소의 혼합물을 포함할 수 있다. 관련 기술분야의 통상의 기술자가 쉽게 이해할 수 있는 바와 같이, 하나의 구성요소의 발현 수준이 하나 이상의 상이한 구성요소(들)의 발현 수준에 영향을 미칠 수 있는 상기 예는 예시 목적을 위한 것이며 제한적이지 않다. 하나 이상의 구성요소가 조작가능하도록 (예를 들어, 실험적 제어, 예를 들어 온도 제어; 약물 제어, 예를 들어 약물 유도성 제어; 빛 제어 등 하에) 변형 (상기 기재된 바와 같음)된 경우 부가의 복잡성 층이 임의로 네트워크 내로 도입될 수 있다.

하나의 비제한적인 예로서, 제1 가이드 RNA는 표적 치료/대사 유전자의 발현을 제어하는 제2 가이드 RNA의 프로모터와 결합할 수 있다. 그러한 경우, 제1 가이드 RNA의 조건부 발현은 치료/대사 유전자를 간접적으로 활성화시킨다. 이러한 유형의 RNA 캐스케이드는, 예를 들어 억제인자를 활성인자로 쉽게 전환시키는데 유용하며, 표적 유전자의 발현의 로직 또는 역학을 제어하는데 사용될 수 있다.

전사 조정 방법은 약물 발견 및 표적 검증에도 사용될 수 있다.

질환 또는 병태를 치료하는 방법

본 개시내용의 일부 측면에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드는, 예를 들어, 질환을 치료하기 위한 유전자 요법 등의 목적을 위해, 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 또는 생물학적 연구를 위해 생체 내에서 세포성 DNA를 변형시키기 위해 이용된다. 이러한 생체 내 실시양태에서, (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소가 개체에게 투여된다. 투여는 대상체에게 펩티드, 소분자 및 핵산을 투여하기 위한 관련 기술분야에 널리 공지된 임의의 방법에 의해 이루어질 수 있다. CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 다양한 제형에 혼입될 수 있다. 보다 특히, 본 개시내용의 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 적절한 제약상 허용되는 담체 또는 희석제와 조합하여 제약 조성물로 제형화될 수 있다.

일부 실시양태에서, 본원에는 제약상 허용되는 비히클에 존재하는 (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소를 포함하는 제약 제제 또는 조성물이 제공된다. "제약상 허용되는 비히클"은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 또는 미국 약전 또는 포유동물, 예컨대 인간에 사용하기 위해 일반적으로 인정되는 기타 약전에 열거된 비히클일 수 있다. 용어 "비히클"은 본 개시내용의 화합물이 포유동물에게 투여하기 위해 함께 제형화되는 희석제, 아주반트, 부형제 또는 담체를 지칭한다. 이러한 제약 비히클은 지질, 예를 들어 리포솜, 예를 들어 리포솜 덴드리머; 액상물, 예컨대 물 및 페크로리움, 동물, 식물성 또는 합성 기원의 것을 포함한 오일, 예컨대 땅콩 오일, 대두 오일, 미네랄 오일, 참깨 오일 등, 식염수; 아카시아검, 젤라틴, 전분 페이스트, 활석, 케라틴, 콜로이드 실리카, 요소 등일 수 있다. 또한, 보조제, 안정제, 증점제, 윤활제 및 착색제가 사용될 수 있다. 제약 조성물은 고체, 반고체, 액체 또는 기체 형태의 제제, 예컨대 정제, 캡슐, 분말, 과립, 연고, 용액, 좌제, 주사제, 흡입제, 겔, 마이크로구체 및 에어로졸로 제형화될 수 있다. 따라서, CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 투여는 경구, 협측, 직장, 비경구, 복강내, 피내, 경피, 기관내, 안구내 등의 투여를 포함한 다양한 방식으로 달성될 수 있다. 활성제는 투여 후 전신적일 수 있거나 국소 투여, 벽내 투여의 사용 또는 체내 이식 부위에서 활성 용량을 유지하는 역할을 하는 체내 이식제의 사용에 의해 국소적일 수 있다. 활성제는 즉각적인 활성을 위해 제형화될 수 있거나 지속 방출을 위해 제형화될 수 있다.

일부 병태, 특히 중추 신경계 병태의 경우, 혈액 뇌 장벽 (BBB)을 통과하는 작용제를 제형화하는 것이 필요할 수 있다. BBB를 통한 약물 전달을 위한 하나의 전략은 삼투압 수단, 예컨대 만니톨 또는 류코트리엔에 의해, 또는 혈관 활성 물질, 예컨대 브라디키닌의 사용에 의해 생화학적으로 BBB를 파괴하는 것을 수반한다. 뇌종양에 대한 특이적 작용제를 표적화하기 위해 BBB 개방을 사용할 가능성도 한 옵션이다. BBB 파괴제는 조성물이 혈관내 주사에 의해 투여되는 경우 본 개시내용의 치료 조성물과 함께 공동 투여될 수 있다. BBB를 통과하기 위한 다른 전략은 카베올린-1 매개 트랜스시토시스, 담체-매개 수송체, 예컨대 글루코스 및 아미노산 담체, 인슐린 또는 트랜스페린에 대한 수용체-매개 트랜스시토시스, 및 활성 유출 수송체, 예컨대 p-당단백질을 포함한, 내인성 수송 시스템의 사용을 수반할 수 있다. 활성 수송 모이어티는 또한 혈관의 내피 벽을 가로지르는 수송을 용이하게 하기 위해 본 개시내용에 사용하기 위한 치료 화합물과 접합될 수 있다. 추가적으로 또는 대안적으로, BBB 뒤에 치료제의 약물 전달은 국소 전달에 의해, 예를 들어 척수강내 전달에 의해, 예를 들어 옴마야 저장소를 통해 (예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,222,982 및 5385582 참조); 볼루스 주사에 의해, 예를 들어 주사기에 의해, 예를 들어 유리체강내 또는 두개내로; 연속 주입에 의해, 예를 들어 대류를 이용한 캐뉼라 삽입에 의해 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20070254842 참조); 또는 작용제가 가역적으로 부착된 장치를 체내 이식함으로써 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20080081064 및 20090196903 참조) 이루어질 수 있다.

일반적으로, (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소의 유효량이 제공된다. 생체 외 방법과 관련하여 상기 논의된 바와 같이, 생체 내 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 유효량 또는 유효 용량은 음성 대조군, 예를 들어 빈 벡터 또는 관련 없는 폴리펩티드와 접촉된 세포에 비해 2개의 상동 서열 간에 관찰되는 재조합의 양에 있어서 2배 이상의 증가를 유도하는 양이다. 재조합의 양은 임의의 적합한 방법, 예를 들어 상기 기재된 바와 같고 관련 기술분야에 공지된 방법에 의해 측정될 수 있다. 투여될 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 유효량 또는 유효 용량의 계산은 관련 기술분야의 통상의 기술자의 기술 내에 있으며, 관련 기술분야의 통상의 기술자에게 일상적일 것이다. 투여될 최종 양은 투여 경로 및 치료될 장애 또는 병태의 성질에 따라 달라질 것이다.

특정한 대상체에게 제공되는 유효량은 다양한 요인에 따라 달라지며, 그 중 몇몇은 대상체마다 상이하다. 유능한 임상의는 필요에 따라 질환 병태의 진행을 중단시키거나 역전시키기 위해 대상체에게 투여할 치료제의 유효량을 결정할 수 있을 것이다. 임상의는 LD50 동물 데이터와 약물에 대해 이용가능한 기타 정보를 활용하여, 투여 경로에 따라 개체의 최대 안전 용량을 결정할 수 있다. 예를 들어, 정맥내로 투여된 용량은, 치료 조성물이 투여되는 유체의 양이 더 많을 경우 척수강내로 투여되는 용량보다 더 많을 수 있다. 유사하게, 신체로부터 빠르게 제거되는 조성물은 치료 농도를 유지하기 위해 더 높은 용량으로 또는 반복 용량으로 투여될 수 있다. 유능한 임상의는 통상적인 기술을 활용하여, 일상적인 임상 시험 과정에서 특정한 치료제의 투여량을 최적화할 수 있다.

의약에 봉입시키기 위해, CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 적합한 상업적 공급원으로부터 수득될 수 있다. 일반적인 제안으로서, 용량당 비경구로 투여되는 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 제약상 유효한 총량은 용량 반응 곡선에 의해 측정될 수 있는 범위 내일 것이다.

치료적 투여를 위해 사용될 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소, 예를 들어 (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드의 제제에 기반한 요법은 멸균되어야만 한다. 멸균은 멸균 여과막 (예를 들어, 0.2 마이크로미터 막)을 통한 여과를 통해 쉽게 달성된다. 치료 조성물은 일반적으로 멸균 접근 포트를 갖는 용기, 예를 들어 피하 주사 바늘로 관통할 수 있는 마개를 갖는 정맥내 용액 봉지 또는 바이알에 넣는다. CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소를 기반으로 하는 요법은 단위 또는 다중 용량 용기, 예를 들어 밀봉된 앰풀 또는 바이알에 수용액 또는 재구성을 위한 동결건조된 제형으로서 저장될 수 있다. 동결건조된 제형의 한 예로서, 10-ml 바이알에 멸균 여과된 1% (w/v) 화합물 수용액 5 ml를 채우고, 그 결과로 생성된 혼합물을 동결건조시킨다. 주입 용액은 정균 주사용수를 사용하여 동결건조된 화합물을 재구성함으로써 제조된다.

제약 조성물은 원하는 제형에 따라 제약상 허용되는 희석제의 비-독성 담체를 포함할 수 있으며, 이는 동물 또는 인간 투여용 제약 조성물을 제형화하는데 통상적으로 사용되는 비히클로서 정의된다. 희석제는 조합물의 생물학적 활성에 영향을 미치지 않도록 선택된다. 이러한 희석제의 예는 증류수, 완충수, 생리 식염수, PBS, 링거 용액, 덱스트로스 용액, 및 행크 용액이다. 또한, 제약 조성물 또는 제형은 다른 담체, 아주반트, 또는 비-독성, 비치료적, 비면역원성 안정제, 부형제 등을 포함할 수 있다. 조성물은 또한 생리학적 조건을 근사화하기 위한 부가의 물질, 예컨대 pH 조정제 및 완충제, 독성 조정제, 습윤제 및 세제를 포함할 수 있다.

조성물은 또한 다양한 안정제 중 임의의 것, 예컨대 항산화제를 포함할 수 있다. 제약 조성물이 폴리펩티드를 포함하는 경우, 폴리펩티드는 이러한 폴리펩티드의 생체 내 안정성을 향상시키거나 그의 약리학적 특성을 달리 향상시키는 (예를 들어, 폴리펩티드의 반감기를 증가시키거나, 그의 독성을 감소시키거나, 용해도 또는 흡수를 향상시키는) 널리 공지된 다양한 화합물과 복합체를 형성할 수 있다. 이러한 변형 또는 복합체 형성제의 예는 술페이트, 글루코네이트, 시트레이트 및 포스페이트를 포함한다. 조성물의 핵산 또는 폴리펩티드는 또한 그들의 생체 내 속성을 향상시키는 분자와 복합체를 형성할 수 있다. 이러한 분자는, 예를 들어, 탄수화물, 폴리아민, 아미노산, 기타 펩티드, 이온 (예를 들어, 나트륨, 칼륨, 칼슘, 마그네슘, 망가니즈) 및 지질을 포함한다.

다양한 유형의 투여에 적합한 제형에 관한 추가 안내는 문헌 [Remington's Pharmaceutical Sciences, Mace Publishing Company, Philadelphia, Pa., 20th ed. (2003) 및 The United States Pharmacopeia: The National Formulary (USP 24 NF19) published in 1999]에서 찾을 수 있다. 약물 전달 방법에 대한 간략한 검토를 위해서는, 문헌 [Langer, Science 249:1527-1533 (1990)]을 참조한다.

제약 조성물은 예방적 및/또는 치료적 치료를 위해 투여될 수 있다. 활성 성분의 독성 및 치료 효능은, 예를 들어, LD50 (집단의 50%에 치사적인 용량) 및 ED50 (집단의 50%에 치료상 유효한 용량)을 결정하는 것을 포함한, 세포 배양 및/또는 실험 동물의 표준 제학 절차에 따라 결정될 수 있다. 독성 효과와 치료 효과 간의 용량 비율이 치료 지수이며 LD50/ED50 비율로서 표현될 수 있다. 큰 치료 지수를 나타내는 요법이 일반적으로 선호된다.

세포 배양 및/또는 동물 연구로부터 수득된 데이터는 인간을 위한 일정 범위의 투여량을 공식화하는데 사용될 수 있다. 활성 성분의 투여량은 일반적으로 독성이 낮은 ED50을 포함하는 순환 농도 범위 내에 있다. 투여량은 이용된 투여 형태 및 활용된 투여 경로에 따라 이러한 범위 내에서 달라질 수 있다. 제약 조성물을 제형화하는데 사용되는 구성요소는 일반적으로 순도가 높고 잠재적으로 유해한 오염물질이 실질적으로 없다 (예를 들어, 적어도 내셔널 푸드 (NF) 등급, 일반적으로 적어도 분석 등급, 보다 전형적으로 적어도 제약 등급). 더욱이, 생체 내 사용을 위해 의도된 조성물은 일반적으로 멸균된다. 주어진 화합물을 사용하기 전에 합성해야만 하는 경우, 그 결과로 생성된 산물은 일반적으로, 임의의 잠재적으로 독성이 있는 물질, 특히 합성 또는 정제 프로세스 동안 존재할 수 있는 임의의 내독소가 실질적으로 없다. 비경구 투여용 조성물은 또한 멸균성이고 실질적으로 등장성이며 GMP 조건 하에서 제조된다.

특정한 대상체에게 제공될 치료 조성물의 유효량은 다양한 요인에 따라 달라질 것이며, 그 중 몇몇은 대상체마다 상이할 것이다. 유능한 임상의는 필요에 따라 질환 병태의 진행을 중단시키거나 역전시키기 위해 대상체에게 투여할 치료제의 유효량을 결정할 수 있을 것이다. 임상의는 LD50 동물 데이터와 약물에 대해 이용가능한 기타 정보를 활용하여, 투여 경로에 따라 개체의 최대 안전 용량을 결정할 수 있다. 예를 들어, 정맥내로 투여된 용량은, 치료 조성물이 투여되는 유체의 양이 더 많을 경우 척수강내로 투여되는 용량보다 더 많을 수 있다. 유사하게, 신체로부터 빠르게 제거되는 조성물은 치료 농도를 유지하기 위해 더 높은 용량으로 또는 반복 용량으로 투여될 수 있다. 유능한 임상의는 통상적인 기술을 활용하여, 일상적인 임상 시험 과정에서 특정한 치료제의 투여량을 최적화할 수 있다.

대상체에 대한 치료 투여 횟수는 다양할 수 있다. 유전적으로 변형된 세포를 대상체 내로 도입하는 것은 일회성 이벤트일 수 있지만; 특정 상황에서는 그러한 치료가 제한된 기간 동안 개선을 유도할 수 있으며 지속적인 반복 치료를 필요로 할 수 있다. 특정 상황에서는, 효과가 관찰되기 전에 유전적으로 변형된 세포의 다수회 투여를 필요로 할 수도 있다. 정확한 프로토콜은 질환 또는 병태, 질환의 단계 및 치료 중인 개별 대상체의 파라미터에 따라 달라진다.

등가물

모든 기술적 특색은 이러한 특색의 가능한 모든 조합으로 개별적으로 조합될 수 있다.

본 발명은 본 발명의 요지 또는 본질적인 특징을 벗어나지 않고서도 다른 특이적 형태로 구체화될 수 있다. 따라서 전술한 실시양태는 모든 면에서 본원에 기재된 발명을 제한하기보다는 예시하는 것으로 간주되어야 한다.

실시예

하기 비제한적인 실시예는 본원에 기재된 본 발명의 실시양태를 추가로 예시한다.

실시예 1:

신규 유형 V 뉴클레아제의 실험적 특징규명

잠재적인 이펙터 서열은 사내 미생물 데이터베이스의 게놈 분석을 통해 확인되었다. B-GEn.1 및 B-GEn.2에 대한 DNA 서열을 합성하고 [트위스트(Twist)], NdeI 및 XhoI를 사용하여 pET29-기반 맞춤형 발현 벡터 (pBLR107)에 클로닝하였다 (서열식별번호: 7은 이러한 벡터 내의 B-GEn.1에 대한 완전한 플라스미드 서열을 나타내고, 그 결과로 생성된 플라스미드는 B-GEn.1_전체_플라스미드_pBLR373으로 명명되며; 서열식별번호: 8은 상기 벡터 내의 B-GEn.2에 대한 완전한 플라스미드 서열을 나타내고, 그 결과로 생성된 플라스미드는 B-GEn.2 플라스미드에 대해 B-GEn.2_전체_플라스미드_pBLR373으로 명명됨). tracr-함유 DNA를 수득하기 위해, 이펙터 ORF를 둘러싸는 유전자내 영역을 연결하고 RNA 분자의 발현을 위해 맞춤형 ColE1-함유 벡터 (임의로 정방향 및 역방향 T7을 수반하며, 각각 pBLR150 및 pBLR151로 일컬어짐)에 클로닝하였다. 플라스미드-기반 스크리닝을 위해, 2개의 합성 스페이서 서열 (PAM 라이브러리 플라스미드와 매칭됨)을 CRISPR 반복 영역에 의해 플랭킹하고 ssDNA 올리고머로서 주문한 후, T7 프로모터의 제어 하에 pBLR107에 클로닝하였다. 이러한 시스템은 또한 도 1에 예시되어 있다.

활성을 스크리닝하기 위해, RTS™ 100 이. 콜라이 HY 키트 [바이오래빗(Biorabbit)]를 사용하여 무세포 발현 시스템에서 플라스미드를 발현시켰다. 간단히 언급하면, 제조업체의 지침에 따라 각각의 플라스미드 250 ng을 열 순환기에서 30℃에서 6시간 동안 20 μl의 총 샘플 용적에서 발현시켰다. 플라스미드 DNA의 PAM 의존성 절단은 2 μl의 발현 샘플과 10 mM Tris pH 7.5, 100 mM NaCl 및 50 mM MgCl₂로 완충된 50 nM PAM-라이브러리 플라스미드를 사용하여 총 용적 10 μl에서 37℃에서 4시간 동안 수행되었다. 이어서, SPRI 비드 [스피드비드(SpeedBeads™) 자성 카르복실레이트 변형된 입자; 시그마(Sigma)]를 사용하여 샘플로부터 플라스미드 DNA를 정제하고 EB (퀴아젠)를 사용하여 10 μl로 용출시켰다. 엇갈리게 커팅된 선형화된 플라스미드의 말단 복구를 위해, 제조업체의 지침에 따라 5 μl의 용출액을 NEB 넥스트 울트르 II 말단 복구/dA-테일링 모듈 [뉴 잉글랜드 바이오랩스(New England Biolabs)]을 사용하여 20℃에서 30분 동안 인큐베이션하였다. 이어서, SPRI 비드 (스피드비드™ 자성 카르복실레이트 변형된 입자; 시그마)를 사용하여 DNA를 다시 정제하고 EB (퀴아젠)를 사용하여 10 μl로 용출시켰다. 마지막으로, 문헌 [Karvelis and colleagues (DOI 10.1186/s13059-015-0818-7)]에 기재된 바와 같이 총 용적 12 μl 1x 블런트 TA 라이가제 마스터맥스 (NEB) 중의 1 μM 이중 어댑터를 사용하여 어댑터 라이게이션을 수행하였다. 절단된 플라스미드 서열을 수득하기 위해, 3 μl의 어댑터 라이게이션 샘플을 1.25 μl의 10 uM 바코드부착된 정방향 및 역방향 프라이머 뿐만 아니라 12.5 ul의 Q5 고 충실도 2x 마스터믹스 (NEB) 및 7.5 ul의 물과 혼합하였다. 증폭을 위해, 하기 설정을 사용하였다: 초기 변성 (98℃에서 30초), 증폭을 위한 30x 주기 (98℃에서 10초, 66℃에서 30초 및 72℃에서 30초) 및 최종 연장 (72℃에서 2분). 5' 단부에 5개의 부가의 뉴클레오티드를 부가함으로써 프라이머에 바코드를 부착하였다. 이어서, 모든 PCR 반응물을 풀링하고 제조업체 지침에 따라 SPRI 비드를 1:1 비율로 사용하여 정제하였다. 차세대 시퀀싱을 위해, 2 ug의 바코드부착되고 정제된 앰플리콘을 라이브러리 프렙을 위한 입력으로서 사용하였다. 앰플리콘 풀을 말단 복구시키고 dA 테일링한 다음 (NEB넥스트 울트라 II 복구/dA-테일링 모듈, NEB), 일루미나(Illumina) 바코드 라이게이션하였다 (블런트/TA 라이가제 마스터 믹스, NEB). 정확한 앰플리콘 크기는 겔 전기영동 [E-겔 EX 2%, 써모피셔(ThermoFisher)]으로 확인되었다. dsDNA HS 키트 (써모피셔)를 사용하여 큐비트(Qubit) (써모피셔) 상에서 라이브러리의 농도를 측정하였다. 5% PhiX 스파이크인이 포함된 10 pM 라이브러리는 MiSeq 300PE v2 화학 (일루미나)을 사용하는 차세대 시퀀싱을 위한 입력으로서 사용되었다.

생물정보학적 분석

PAM 서열을 결정하기 위해, 어댑터 서열로부터의 모티프와 표적 부위 상류의 플라스미드 서열로부터의 모티프 둘 다를 함유하는 모든 NGS 판독값을 분석하였다. 첫째, 두 모티프를 모두 함유하는 모든 판독값에 대해, 두 모티프 사이의 개재 서열의 길이가 결정되었다. 그런 다음, 가장 자주 발생하는 개재 서열 길이를 갖는 판독값의 서브세트를 별도로 분석하였다. 이러한 판독값 서브세트의 경우, 8N-PAM 라이브러리 세그먼트 상에서 관찰된 모든 고유 서열이 판독값 계수와 함께 결정되었다. 가장 자주 발생하는 100개의 서열을 사용하여 서열 모티프를 생성하였다. 그 결과를 사용하여 표 2를 생성하였다.

실시예 2:

포유동물 세포에서 뉴클레아제 활성을 검출하는 스크리닝 방법

세포 배양

HEK 293T 세포 (ATCC® CRL-3216™)를 10% FBS 및 1% Pen/Strep을 함유하는 DMEM에서 배양하였다. 세포를 T75 플라스크에서 배양하고 2일 내지 3일마다 분할하였다.

형질감염

형질감염 하루 전에, 세포를 폴리-D-리신 코팅된 96웰 플레이트 [폴리-D-리신 CELLCOAT®; 그라이너(Greiner)]에 웰당 12,000개 세포의 밀도로 시딩하였다. 그 다음날, 배지를 교체하고 제조업체 지침에 따라 LipoD293™ 인 비트로 DNA 형질감염 시약 [시그나젠(SignaGen)]을 사용하여 세포를 140 ng 뉴클레아제 플라스미드 및 60 ng sgRNA 플라스미드로 형질감염시켰다. 그 다음날 형질감염 혼합물을 교체하고 표준 배양 배지로 교환하였다. 형질감염 3일 후, 세포를 하류 DNA 추출을 위해 채취하였다.

조잡한 DNA 추출 및 증폭

상기 채취된 세포를 100 ul PBS에 재현탁시키고 60 ul를 새로운 96 웰 플레이트에 옮겨 펠렛화하였다. 이어서, 상청액을 제거하고, 25 μg/ml 프로테이나제 K [써모 사이언티픽(Thermo Scientific)]가 보충된 0.05% SDS를 함유한 10 mM Tris, pH 7.0 60 μl를 각각의 웰에 부가하고 철저히 혼합하였다. 조잡한 DNA 샘플을 37℃에서 1시간 동안 인큐베이션한 다음, 80℃에서 30분 동안 가열하였다. 3.5 μl의 조잡한 DNA를 1.25 μl의 10 uM 바코드부착된 정방향 및 역방향 프라이머 뿐만 아니라 12.5 ul의 Q5 고 충실도 2x 마스터 믹스 (NEB) 및 6.5 ul의 물과 혼합하였다. 증폭을 위해, 모든 앰플리콘에 대해 하기 설정이 사용되었다: 초기 변성 (98℃에서 30초), 증폭을 위한 30x 주기 (98℃에서 10초, 66℃에서 30초 및 72℃에서 30초) 및 최종 연장 (72℃에서 2분). 5' 단부에 5개의 부가의 뉴클레오티드를 부가함으로써 프라이머에 바코드를 부착하였다. 이어서, 모든 PCR 반응물을 풀링하고 제조업체 지침에 따라 SPRI 비드를 1:1 비율로 사용하여 정제하였다.

라이브러리 프렙 및 차세대 시퀀싱

2 ug의 바코드부착되고 정제된 앰플리콘을 라이브러리 프렙을 위한 입력으로서 사용하였다. 앰플리콘 풀을 말단 복구시키고 dA 테일링한 다음 (NEB넥스트 울트라 II 복구/dA-테일링 모듈, NEB), 일루미나 바코드 라이게이션하였다 (블런트/TA 라이가제 마스터 믹스, NEB). 정확한 앰플리콘 크기는 겔 전기영동 (E-겔 EX 2%, 써모피셔)으로 확인되었다. dsDNA HS 키트 (써모피셔)를 사용하여 큐비트 (써모피셔) 상에서 라이브러리의 농도를 측정하였다. 5% PhiX 스파이크인이 포함된 10 pM 라이브러리는 MiSeq 300PE v2 화학 (일루미나)을 사용하는 차세대 시퀀싱을 위한 입력으로서 사용되었다.

NGS 분석

원시 fastq 판독값은 최소 품질 점수 Q30으로 cutadapt 버전 1.18 (http://dx.doi.org/10.14806/ej.17.1.200)을 사용하여 품질 트리밍되었다. 필터링된 판독값은 fastq-join 버전 1.3.1 (doi:10.2174/1875036201307010001)을 사용하여 연결되었으며 문헌 [Nat Commun. 2021 Jul 9;12(1):4219. doi: 10.1038/s41467-021-24454-5, Supplementary Material, Section entitled: "Amplicon sequencing (AmpSeq) for on- and off-target analysis and NGS analysis"]에 기재된 바와 같은 사용자 정의 역다중화 스크립트를 사용하여 역다중화되었다. 역다중화된 fastq 파일은 이후 CRISPResso v 1.0.13 (doi: 10.1038/nbt.3583)을 사용하여 분석되었다. 이러한 분석의 결과가 표 4에 제시되어 있다 (반면, 평균 활성은 3개의 개별 실험, 및 B-GEn.1이 포함된 pBLR709 및 B-GEn.2가 포함된 pBLR710으로부터 유래되었음).

표 4

실시예 3:

새로운 sgRNA 설계를 사용하여 포유동물 세포에서 뉴클레아제 활성을 검출하는 스크리닝 방법

서열식별번호: 40-44 및 7에 따른 신규 sgRNA 설계의 활성을 시험하기 위해, 부가의 보다 적은 활성 또는 비-활성 설계 (실시예 2에 따른 실험은 이들 sgRNA 서열을 사용하여 수행되었음). 2개의 상이한 표적 로커스가 이용되었다:

TCRA_가이드1: NCBI 참조 서열: NC_000014.9 REGION: 21724060..21724082 (역 보체는 표적 특이적 가이드 서열을 나타냄).

TCRA_가이드4: NCBI 참조 서열: NC_000014.9 REGION: 21724157..21724179 (역 보체는 표적 특이적 가이드 서열을 나타냄).

둘 다 2022년 6월 8일에 https://www.ncbi.nlm.nih.gov/nuccore/568815584로부터 평가되었다.

결과는 도 2에 나타내어져 있다.

SEQUENCE LISTING <110> Bayer AG <120> BNovel Type V RNA programmable endonuclease systems <130> BHC211037-FC <160> 44 <170> BiSSAP 1.3.6 <210> 1 <211> 1103 <212> PRT <213> other sequences <220> <223> RNA programmable DNA endonuclease B-Gen.1 <400> 1 Met Thr Ile Arg Ser Met Lys Leu Lys Leu Lys Ile Tyr Ser Gly Arg 1 5 10 15 Ser Ala Pro Gln Leu Arg Gln Gly Leu Trp Arg Leu His Arg Leu Leu 20 25 30 Asn Glu Gly Thr Ala Tyr Tyr Met Asp Trp Leu Val His Met Arg Gln 35 40 45 Glu Ala Leu Pro Gly Lys Ser Lys Glu Glu Ile Arg Ala Glu Leu Glu 50 55 60 Arg Arg Val Arg Gln Gln Gln Glu Lys Asn Gly Val Gln Asn Asp Gln 65 70 75 80 Val Pro Met Asp Glu Val Leu Ser Ala Leu Arg Gln Leu Tyr Glu Leu 85 90 95 Leu Val Pro Ser Ala Val Asn Asn Ser Gly Asp Ala Gln Thr Leu Ser 100 105 110 Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly Gly Lys 115 120 125 Gly Thr Ser Asn Ala Gly Ala Lys Pro Gly Trp Arg Lys Lys Gln Glu 130 135 140 Ala Gly Asp Pro Ser Trp Glu Lys Asp Tyr Glu Arg Trp Leu Lys Arg 145 150 155 160 Lys Gln Ala Asp Pro Thr Ala Glu Ile Leu Gly Lys Leu Glu Thr Ala 165 170 175 Gly Leu Lys Pro Leu Phe Pro Leu Tyr Thr Asn Glu Val Lys Asp Ile 180 185 190 Arg Trp Met Pro Leu Thr Ser Lys Gln Tyr Val Arg Asn Trp Asp Arg 195 200 205 Asp Met Phe Gln Gln Ala Ile Glu His Leu Leu Ser Trp Glu Thr Trp 210 215 220 Asn Arg Lys Val Asn Glu Glu Arg Ala Lys Leu Lys Glu Thr Val Arg 225 230 235 240 Arg Phe Glu Glu Gln His Leu Ala Asn Gly Lys Asp Trp Leu Ser Pro 245 250 255 Leu Gln Ala Tyr Glu Ala Asn Arg Glu Gln Ala Leu Arg Asp Met Ala 260 265 270 Ile Ser Pro Ser Asp Arg Phe Arg Ile Thr Arg Arg Gln Ile Lys Gly 275 280 285 Trp Ser Glu Leu Tyr Glu Arg Trp Asn Lys Leu Ala Pro Thr Ala Ser 290 295 300 Val Glu Ala Tyr Met Gln Glu Val Arg His Val Gln Lys Lys Leu Gly 305 310 315 320 Gly Thr Phe Gly Asp Ala Asp Leu Tyr Arg Phe Leu Ala Lys Pro Glu 325 330 335 Asn Val His Ile Trp Arg Asp His Gln Glu Arg Leu His Tyr Tyr Ala 340 345 350 Ala Tyr Asn Asp Leu His Lys Arg Leu Met Ser Ala Lys Glu Gln Ala 355 360 365 Ala Phe Thr Leu Pro Asp Pro Val Ala His Pro Leu Trp Val Arg Phe 370 375 380 Asp Ala Arg Asp Gly Asn Leu Phe Thr Tyr Ile Leu Gln Ala Asp Ser 385 390 395 400 Ser Lys Gln Arg Ser Arg Arg Tyr Val Asn Phe Ser Arg Phe Leu Trp 405 410 415 Pro Val Glu Asp Gly Tyr Phe Glu Glu Thr Glu Asn Val Lys Val Glu 420 425 430 Leu Ala Leu Ser Lys Gln Phe Tyr Arg Gln Val Ile Val His Asp Asn 435 440 445 Pro Thr Gly Lys Gln Lys Ile Thr Phe Gln Asp Tyr Ser Ser Lys Glu 450 455 460 Ile Leu Glu Gly His Leu Gly Gly Ala Lys Leu Gln Leu Asp Arg Asn 465 470 475 480 Phe Leu Arg Lys Ser Gly Arg Asp Phe Glu Thr Gly Asp Phe Gly Pro 485 490 495 Ala Phe Leu Asn Val Val Leu Asp Leu Lys Pro Lys Gln Glu Val Lys 500 505 510 Asn Gly Arg Leu Gln Ser Pro Leu Gly Gln Ala Leu Leu Val Lys Ser 515 520 525 Arg Pro Asn Asp Ile Pro Lys Val Tyr Gly Tyr Lys Pro Asp Ala Leu 530 535 540 Ala Ala Trp Leu Glu Gln Ala Ser Gly Glu Glu Ser Leu Gly Ser Glu 545 550 555 560 Ser Leu Arg Gln Gly Phe Arg Val Met Ser Ile Asp Leu Gly Val Arg 565 570 575 Ser Ala Ala Ala Ile Ser Val Phe Ser Val Lys Gly Glu Lys Thr Arg 580 585 590 Glu Gly Asp Lys Val Cys Tyr Pro Val Gly Glu Thr Gly Leu Phe Ala 595 600 605 Val His Asp Arg Ser Phe Leu Leu Arg Leu Pro Gly Glu Ser Ser Glu 610 615 620 Lys Arg Val Asn Val Glu Arg Asp Lys Arg Lys Thr Glu Arg Met Gln 625 630 635 640 Ile Arg Tyr His Ile Arg Thr Leu Ala Arg Val Leu Arg Leu Ala Asn 645 650 655 Lys Ala Thr Pro Met Asp Arg Ile Lys Ala Val Gln Asp Val Leu Asn 660 665 670 Asp Ile Glu Ser Thr Arg Phe Met Asn Asp His Asp His His Val Tyr 675 680 685 Asn His Ala Leu Glu Thr Leu Arg Thr Tyr Ala Pro Asp His Gln Gly 690 695 700 Ile Trp Glu Glu Gln Val Ile Ala Ala His Arg Gln Leu Glu His His 705 710 715 720 Val Gly Val Ile Val Gly Glu Trp Arg Lys Asn Trp Gly Lys Asp Arg 725 730 735 Arg Gly Thr Val Gly Leu Ser Met Asp Asn Ile Glu Glu Leu Asp Glu 740 745 750 Met Arg Arg Leu Leu Ile Ser Trp Ser Arg Arg Ala Arg Tyr Pro Arg 755 760 765 Glu Ala Lys Pro Phe Gln Val Asn Glu Ser Asn Pro Val His Leu Leu 770 775 780 Arg His Leu Gln Asn Leu Lys Glu Asp Arg Leu Lys Gln Leu Ala Asn 785 790 795 800 Leu Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Ser Lys Glu Lys 805 810 815 Lys Trp Lys Ala Ala Tyr Pro Ala Cys Gln Leu Ile Leu Phe Glu Asp 820 825 830 Leu Gln Arg Tyr Arg Phe His Leu Asp Arg Ser Ala Arg Glu Asn Ser 835 840 845 Gln Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val Trp Met 850 855 860 Gln Gly Glu Pro Tyr Gly Leu Gln Ile Gly Asp Val Trp Ala Gly Phe 865 870 875 880 Thr Ser Arg Tyr His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys Lys 885 890 895 Ala Leu Thr Glu Lys Asp Phe Gln Gln Gly Arg Leu Leu Glu Ser Leu 900 905 910 Val Ala Glu Gly Met Phe Thr Leu Gln Glu Val Gly Thr Leu Lys Pro 915 920 925 Gly Asp Ile Val Pro Ala Glu Gly Gly Glu Leu Phe Val Thr Leu Ala 930 935 940 Asp Asp Ser Gly Asp Arg Ile Val Ile Thr His Ala Asp Ile Asn Ala 945 950 955 960 Ala Gln Asn Val Gln Lys Arg Phe Trp Leu Ala Asn Ser Glu Arg Phe 965 970 975 Arg Val Ala Cys Arg Ser Val Gln Ile Ala Ser Gln Glu Cys Phe Ile 980 985 990 Pro Ser Ser Glu Ser Val Ala Lys Lys Met Gly Lys Gly Val Phe Val 995 1000 1005 Arg Asp Phe Ser Phe His Lys Asp Met Glu Val Tyr His Trp Asn Asn 1010 1015 1020 Gln Val Lys Leu Thr Ala Lys Asn Val Pro Thr Asp His Ser Asp Asp 1025 1030 1035 1040 Leu Gln Asp Leu Gln Asp Tyr Gln Ala Ile Leu Glu Glu Ala Arg Glu 1045 1050 1055 Ser Ser Ser Ser Tyr Lys Thr Leu Phe Arg Asp Pro Ser Gly Phe Phe 1060 1065 1070 Phe Pro Asp Asp Val Trp Val Pro Gln Asn Ile Tyr Trp Arg Glu Val 1075 1080 1085 Lys Lys Thr Ile Thr Ala Leu Leu Arg Lys Arg Ile Met Ser Thr 1090 1095 1100 <210> 2 <211> 1091 <212> PRT <213> other sequences <220> <223> RNA programmable DNA endonuclease B-Gen.2 <400> 2 Met Pro Ile Arg Ser Phe Lys Leu Lys Leu Val Thr His Asn Gly Asp 1 5 10 15 Ser Thr Tyr Met Asp Lys Leu Arg Arg Gly Leu Trp Lys Thr His Val 20 25 30 Ile Ile Asn Arg Gly Ile Ala Tyr Tyr Met Asn Thr Leu Ala Leu Met 35 40 45 Arg Gln Glu Pro Tyr Gly Ser Lys Ser Arg Glu Glu Val Arg Leu Asp 50 55 60 Leu Leu Ser Thr Leu Arg Glu Gln Gln Arg Arg Asn Asn Trp Ser Glu 65 70 75 80 Gln Thr Gly Thr Asp Asp Glu Leu Leu Ser Leu Ser Arg Arg Val Tyr 85 90 95 Glu Leu Leu Val Pro Ser Ala Ile Gly Glu Lys Gly Asp Ala Gln Met 100 105 110 Leu Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly 115 120 125 Gly Arg Gly Thr Ala Lys Ser Gly Arg Lys Pro Arg Trp Lys Lys Met 130 135 140 Met Glu Glu Gly His Pro Asp Trp Glu Lys Glu Lys Glu Lys Asp Ala 145 150 155 160 Ala Lys Lys Ala Glu Asp Pro Thr Ala Ser Ile Leu Ala Asp Leu Glu 165 170 175 Ala Val Gly Leu Leu Pro Leu Phe Pro Leu Phe Ser Asp Glu Gln Lys 180 185 190 Glu Ile Arg Trp Leu Pro Lys Lys Lys Arg Gln Phe Val Arg Thr Trp 195 200 205 Asp Arg Asp Met Phe Gln Gln Ala Leu Glu Arg Met Leu Ser Trp Glu 210 215 220 Ser Trp Asn Arg Arg Val Ala Glu Glu Tyr Leu Lys Leu Gln Ala Gln 225 230 235 240 Arg Asp Glu Val Tyr Ala Lys Tyr Leu Glu Asp Ala Gly Ser Trp Leu 245 250 255 Asn Asp Leu Gln Thr Phe Glu Lys Gln Arg Glu Glu Glu Leu Ala Glu 260 265 270 Val Ser Phe Glu Pro Asn Ser Glu Tyr Leu Ile Thr Arg Arg Gln Ile 275 280 285 Arg Gly Trp Lys Glu Val Tyr Glu Lys Trp Ser Lys Thr Ser Glu Asn 290 295 300 Ala Ser Gln Glu Gln Leu Trp Arg Met Val Ala Asp Val Gln Thr Ala 305 310 315 320 Met Ala Gly Ala Phe Gly Asp Pro Lys Val Tyr Gln Phe Leu Ser Gln 325 330 335 Pro Lys His His His Ile Trp Arg Glu His Pro Asn Arg Leu Phe Tyr 340 345 350 Tyr Ser Lys Tyr Asn Glu Val Arg Glu Lys Leu Asn Arg Ala Lys Lys 355 360 365 Gln Ala Ala Phe Thr Leu Pro Asp Pro Val Glu His Pro Leu Trp Thr 370 375 380 Arg Phe Asp Ala Arg Gly Gly Asn Ile His Asp Tyr Glu Ile Ser Lys 385 390 395 400 Val Gly Lys Gln Tyr His Val Thr Phe Ser Ser Leu Ile Leu Pro Glu 405 410 415 Ala Gln Ser Trp Val Glu Ile Glu Asn Val Thr Val Gly Ile Gly Asn 420 425 430 Ser Leu Gln Leu Lys Arg Gln Ile Arg Leu Asp Gly Tyr Ala Asp Lys 435 440 445 Lys Gln Lys Val Lys Tyr Tyr Asp Tyr Ser Ser Arg Phe Glu Leu Thr 450 455 460 Gly Val Leu Gly Gly Ala Lys Ile Gln Phe Asp Arg Lys His Leu Lys 465 470 475 480 Lys Ala Ala His Arg Leu Ala Glu Gly Glu Thr Gly Pro Ile Phe Leu 485 490 495 Asn Val Val Val Asp Val Glu Pro Phe Leu Glu Val Lys Asn Gly Arg 500 505 510 Leu Arg Thr Pro Leu Gly Gln Val Leu Gln Val Asn Thr Arg Asp Trp 515 520 525 Pro Lys Val Val Asp Tyr Lys Ala Lys Glu Leu Ser Val Leu Met Glu 530 535 540 Asn Thr Gln Ile Gly Asn Glu Asn Gly Val Ser Thr Ile Glu Ala Gly 545 550 555 560 Met Arg Ile Met Ser Ile Asp Leu Gly Gln Arg Thr Ala Ala Ala Val 565 570 575 Ser Ile Phe Glu Val Ile Ser Lys Lys Pro Asp Glu Lys Glu Thr Lys 580 585 590 Leu Phe Tyr Pro Ile Ala Asp Thr Asp Leu Tyr Ala Val His Arg Arg 595 600 605 Ser Leu Leu Leu Arg Leu Pro Gly Glu Glu Ile Ser Ser Lys Lys Met 610 615 620 Ile Glu Lys Arg Lys Glu Arg Ala Arg Ile Arg Ser Leu Val Arg Tyr 625 630 635 640 Gln Ile Arg Leu Leu Ser Glu Val Leu Arg Leu His Thr Gln Gly Thr 645 650 655 Ala Glu Gln Arg Arg Phe Lys Leu Asp Glu Leu Leu Val Ser Ile Gln 660 665 670 Lys Lys Leu Glu Leu Asp Gln Ser Glu Trp Ile Ser Glu Leu Glu Lys 675 680 685 Leu Phe Asp Tyr Ile Asp Glu Ser Ala Glu Lys Trp Lys Glu Ala Leu 690 695 700 Val Val Ala His Arg Thr Leu Glu Pro Ile Val Val Glu Ala Val Arg 705 710 715 720 Asn Trp Lys Lys Ser Leu Ser Lys Glu Asn Lys Asp Arg Arg Arg Ile 725 730 735 Ala Gly Ile Ser Ile Trp Ser Ile Glu Glu Leu Glu Glu Thr Arg Lys 740 745 750 Leu Leu Ile Ala Trp Ser Lys His Ser Arg Glu Pro Gly Ile Pro Lys 755 760 765 Arg Leu Glu Lys Glu Glu Thr Phe Ala Pro Glu His Leu Gln His Ile 770 775 780 Gln Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Phe Val 785 790 795 800 Met Thr Ala Leu Gly Tyr Lys Tyr Asp Glu Gly Asn Lys Arg Trp Val 805 810 815 Glu Ala Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asp Leu Ser Arg 820 825 830 Tyr Arg Phe Ala Leu Asp Arg Pro Arg Arg Glu Asn Asn Arg Leu Met 835 840 845 Lys Trp Ala His Arg Ser Ile Pro Arg Leu Thr Tyr Met Gln Ala Glu 850 855 860 Leu Phe Gly Ile Gln Val Gly Asp Val Tyr Ser Ala Tyr Thr Ser Arg 865 870 875 880 Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His Ala Leu Thr 885 890 895 Glu Ala Asp Leu Gln Ser Asn Ser Tyr Val Val Asn Gln Leu Ile Lys 900 905 910 Asp Lys Phe Ile Gln Asp Asn Gln Thr Glu Ile Leu Lys Ala Gly Gln 915 920 925 Ile Val Pro Trp Gln Gly Gly Glu Leu Phe Val Thr Phe Ala Asp Arg 930 935 940 Ser Gly Ala Ser Leu Ala Val Ile His Ala Asp Ile Asn Ala Ala Gln 945 950 955 960 Asn Leu Gln Lys Arg Phe Trp Gln His Asn Ser Glu Val Phe Arg Val 965 970 975 Pro Cys Lys Val Val Lys Gly Gly Leu Val Pro Val Tyr Glu Lys Met 980 985 990 Arg Lys Leu Phe Gly Lys Gly Leu Phe Val Asn Ile Asp Asp Pro Glu 995 1000 1005 Ser Lys Glu Val Tyr Arg Trp Glu His Ser Thr Lys Met Lys Ser Lys 1010 1015 1020 Thr Thr Pro Val Asp Leu Glu Ser Glu Asp Ile Asp His Glu Glu Leu 1025 1030 1035 1040 Ser Asp Glu Trp Glu Asp Met Gln Glu Gly Tyr Lys Thr Leu Leu Arg 1045 1050 1055 Asp Pro Ser Gly Phe Phe Trp Ser Ser Asp Ser Trp Ile Pro Gln Lys 1060 1065 1070 Asp Phe Trp Ile Arg Val Lys Ser Arg Ile Gly Lys Ser Leu Arg Glu 1075 1080 1085 Gln Ile Arg 1090 <210> 3 <211> 106 <212> RNA <213> other sequences <220> <223> RNA tracr for B-Gen.1 <400> 3 uaauaaauaa uaugaguuac aggcucaugu cauuccgugc gugugcugcg aggcucuuac 60 aacgucucaa ccacgggauc acguuauuuc cacuaaguga uuggac 106 <210> 4 <211> 109 <212> RNA <213> other sequences <220> <223> RNA tracr for B-Gen.2 <400> 4 cuggauauaa uaaagauguu uagcuauagg cuaauaagau aguuguguca agugcuucgg 60 agaccuaaca cgucauccag ucacaacggc uaucuauauu uccacuaac 109 <210> 5 <211> 106 <212> DNA <213> other sequences <220> <223> DNA encoding the RNA tracr for B-Gen.1 <400> 5 taataaataa tatgagttac aggctcatgt cattccgtgc gtgtgctgcg aggctcttac 60 aacgtctcaa ccacgggatc acgttatttc cactaagtga ttggac 106 <210> 6 <211> 109 <212> DNA <213> other sequences <220> <223> DNA encoding the RNA tracr for B-Gen.2 <400> 6 ctggatataa taaagatgtt tagctatagg ctaataagat agttgtgtca agtgcttcgg 60 agacctaaca cgtcatccag tcacaacggc tatctatatt tccactaac 109 <210> 7 <211> 8715 <212> DNA <213> other sequences <220> <223> Plasmid pBLR373 including the insert for B-GEn.1 <400> 7 gctcagtcct aggtataatg ctagctaata cgactcacta taggagagac catggccacc 60 ggtctctgct aaagatatga ggagctcaaa ctggagctgc taacaaagcc cgaaaggaag 120 ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 180 gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 240 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 300 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 360 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 420 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 480 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 540 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 600 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 660 gaattttaac aaaatattaa cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg 720 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgaatta 780 attcttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 840 caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 900 tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 960 aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1020 cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1080 gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1140 attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 1200 tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 1260 gatattcttc taatacctgg aatgctgttt tcccggggat cgcagtggtg agtaaccatg 1320 catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 1380 agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 1440 gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 1500 cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 1560 gcggcctaga gcaagacgtt tcccgttgaa tatggctcat aacacccctt gtattactgt 1620 ttatgtaagc agacagtttt attgttcatg accaaaatcc cttaacgtga gttttcgttc 1680 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1740 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1800 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1860 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1920 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1980 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 2040 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 2100 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 2160 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 2220 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 2280 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 2340 ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 2400 gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 2460 cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg 2520 catctgtgcg gtatttcaca ccgcatatat ggtgcactct cagtacaatc tgctctgatg 2580 ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca tggctgcgcc 2640 ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 2700 ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 2760 accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca 2820 gatgtctgcc tgttcatccg cgtccagctc gttgagtttc tccagaagcg ttaatgtctg 2880 gcttctgata aagcgggcca tgttaagggc ggttttttcc tgtttggtca ctgatgcctc 2940 cgtgtaaggg ggatttctgt tcatgggggt aatgataccg atgaaacgag agaggatgct 3000 cacgatacgg gttactgatg atgaacatgc ccggttactg gaacgttgtg agggtaaaca 3060 actggcggta tggatgcggc gggaccagag aaaaatcact cagggtcaat gccagcgctt 3120 cgttaataca gatgtaggtg ttccacaggg tagccagcag catcctgcga tgcagatccg 3180 gaacataatg gtgcagggcg ctgacttccg cgtttccaga ctttacgaaa cacggaaacc 3240 gaataccatt catgttgttg ctcaggtcgc agacgttttg cagcagcagt cgcttcacgt 3300 tcgctcgcgt atcggtgatt cattctgcta accagtaagg caaccccgcc agcctagccg 3360 ggtcctcaac gacaggagca cgatcatgcg cacccgtggg gccgccatgc cggcgataat 3420 ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt gagcgagggc 3480 gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc agcgaaagcg 3540 gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt gcatgataaa 3600 gaatacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga aggagctgac 3660 tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 3720 tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 3780 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 3840 tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 3900 agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 3960 tggttaacgg cgggatataa catgagctgt attcggtatc gtcgtatccc actaccgaga 4020 tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 4080 gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 4140 gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 4200 tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 4260 ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 4320 gcgtaccgta ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 4380 gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 4440 gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 4500 tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 4560 cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 4620 tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 4680 tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 4740 tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 4800 cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 4860 atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 4920 ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt gagcaccgcc 4980 gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc cacggggcct 5040 gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc 5100 ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgccg 5160 gccacgatgc gtccggcgta gaggatcgag atctcgatcc cgcgaaatta atacgactca 5220 ctatagggga attgtgagcg gataacaatt cccctctaga tttacacttt atgcttccgg 5280 ctcgtatgtt tctagagaat tcaaataatt ttgtttaact ttaagaagga gatttaaata 5340 tgaaaatcga agaaggtaaa ggtcaccacc atcatcacca tatgaccatt cgctcgatga 5400 aattaaaact caagatttac tcaggccgct ctgcgccgca attacgccag ggtctgtggc 5460 gtttacaccg tctgctcaat gaaggcaccg cttattatat ggactggtta gtacacatgc 5520 gtcaagaagc cttaccgggc aaatcgaaag aggagattcg tgcggagctg gaacgccgtg 5580 ttcgccagca gcaagagaag aacggcgttc aaaacgatca agttcccatg gatgaggttc 5640 tgagtgcgct gcgtcagctg tacgaattac tggtgcccag tgcggttaac aacagcggcg 5700 acgcacagac cctcagccgc aagtttctga gcccgctggt cgacccgaac tcggaaggtg 5760 gcaaaggaac cagcaacgcc ggtgcaaaac cgggctggcg caagaagcaa gaagcgggcg 5820 atcctagctg ggaaaaggat tacgaacgtt ggttaaaacg caagcaggcg gatccgacgg 5880 ctgaaatttt aggcaaactg gaaacggcgg gtctgaagcc actgttccct ctgtacacaa 5940 acgaagtgaa agatatccgt tggatgccgt taacctcgaa acagtatgtg cgtaactggg 6000 atcgcgacat gtttcagcag gcgattgaac atctgttaag ctgggaaacc tggaaccgca 6060 aggtgaatga agaacgcgcc aaacttaaag aaacagtacg tcgcttcgaa gaacagcatt 6120 tagcgaatgg taaggattgg ctgagcccac tgcaggcata tgaagcaaac cgcgaacagg 6180 cgctgcgtga tatggcaatt tcgcctagcg accgttttcg catcacccgc cgtcagatta 6240 aaggctggtc ggaactttat gaacgttgga acaagctggc gcccacagcg tcagttgagg 6300 catacatgca agaggtacgt cacgtgcaga agaagctggg cgggacgttt ggtgatgcgg 6360 acttatatcg tttcctggca aagccggaga atgtgcacat ctggcgcgat catcaggaac 6420 gtctgcatta ttacgcagcg tacaacgacc ttcacaaacg ccttatgtcg gccaaagagc 6480 aagcggcctt taccctgccg gatccggtgg cgcatccgct gtgggtccgc ttcgatgcac 6540 gtgatggcaa ccttttcacc tacattctgc aagcggattc atcaaaacag cgctcccgcc 6600 gctatgttaa tttctcccgc tttctttggc cggtcgaaga tggttacttt gaagaaaccg 6660 aaaacgtgaa agtagaattg gcattgtcga agcagtttta tcgccaggtt atcgttcatg 6720 ataaccctac aggcaaacag aaaattacct ttcaagatta ttcgagcaag gaaattctgg 6780 aaggtcattt gggcggagcg aaactgcaac tggatcgcaa tttcctgcgt aagtccggac 6840 gtgattttga aacaggtgat ttcggaccgg cattcttgaa cgttgtatta gacctcaaac 6900 cgaaacaaga ggttaagaac ggacgcctgc aatctcctct gggccaggcg ttactggtga 6960 aaagtcgccc aaacgatatc ccgaaagttt acggctataa gcctgatgcc ctggcggcct 7020 ggttggaaca ggcctcgggt gaggaaagtt tgggcagtga aagcctgcgc cagggcttcc 7080 gtgtgatgag tatcgattta ggcgttcgca gtgccgccgc gattagcgtt ttctctgtga 7140 aaggcgagaa aacccgcgaa ggcgataaag tttgttaccc ggtgggcgaa acgggtctgt 7200 ttgcggtgca cgaccgtagc ttcttattgc gccttccggg agaatcatca gagaaacgtg 7260 tgaacgttga gcgtgataaa cgtaaaaccg aacgcatgca gattcgctat catattcgta 7320 ccctggcacg cgtactgcgt ctggccaata aagcgactcc tatggatcgc atcaaagcgg 7380 tgcaggatgt gctgaacgat attgaaagta cacgttttat gaatgaccac gaccaccatg 7440 tgtacaacca tgcactggaa acgctgcgca cttatgcgcc ggatcatcag ggcatctggg 7500 aagaacaggt cattgcggcc caccgtcaac tggagcatca tgtgggcgtg attgtgggcg 7560 aatggcgtaa gaactggggc aaagatcgtc gtggaaccgt cggcctgtcc atggacaaca 7620 ttgaggaatt agacgaaatg cgccgtctgc tcatctcatg gtcacgtcgc gcgcgttacc 7680 cgcgcgaagc taaaccattt caagtcaacg aaagtaaccc ggtccacctc ttacgtcatt 7740 tgcagaatct caaagaggat cgcttgaaac aattagctaa cttaattgtg atgaccgcgc 7800 ttggctacgt gtatgacagc aaagagaaga aatggaaagc ggcgtatccg gcatgccagc 7860 tgattctgtt tgaggatctg caacgctatc gctttcatct ggatcgtagc gcccgtgaga 7920 acagccaact gatgaaatgg gcgcatcgca gcattccaaa atatgtgtgg atgcaaggcg 7980 aaccgtatgg tctgcagatt ggagatgttt gggccggttt tacctcgcgc taccacgcga 8040 aaaccggtgc ccccggcatt cgttgcaaag cgttgaccga aaaggacttt caacagggtc 8100 gtctgctgga gtcgttggtc gccgaaggta tgttcacgct gcaggaagta ggtactctga 8160 aacctgggga tattgtgccg gcggaaggtg gagaactgtt tgtgaccttg gcggatgaca 8220 gtggggatcg tattgtgatc acccatgcgg atattaacgc agcgcagaat gtacagaaac 8280 gcttttggct cgcgaactcg gagcgctttc gcgtggcctg ccgctcggtg cagattgcca 8340 gccaggagtg cttcattcct agcagtgagt cggttgccaa gaaaatgggg aaaggcgtat 8400 ttgtgcgcga cttctcgttt cataaggata tggaagtgta tcattggaac aatcaagtca 8460 agctgaccgc aaagaatgta ccgaccgatc attctgacga tctgcaggat ctccaggatt 8520 atcaggcgat tcttgaagag gctcgcgaaa gttcatcaag ctacaaaacg ctgtttcgcg 8580 atcctagcgg gttcttcttt ccggatgatg tctgggtgcc ccaaaatatc tattggcgtg 8640 aagtcaagaa aaccattacc gcgttactgc gtaaacgtat tatgagcact taactcgagt 8700 aatgattgac agcta 8715 <210> 8 <211> 8679 <212> DNA <213> other sequences <220> <223> Plasmid pBLR373 including the insert for B-GEn.2 <400> 8 gctcagtcct aggtataatg ctagctaata cgactcacta taggagagac catggccacc 60 ggtctctgct aaagatatga ggagctcaaa ctggagctgc taacaaagcc cgaaaggaag 120 ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 180 gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 240 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 300 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 360 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 420 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 480 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 540 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 600 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 660 gaattttaac aaaatattaa cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg 720 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgaatta 780 attcttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 840 caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 900 tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 960 aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1020 cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1080 gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1140 attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 1200 tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 1260 gatattcttc taatacctgg aatgctgttt tcccggggat cgcagtggtg agtaaccatg 1320 catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 1380 agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 1440 gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 1500 cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 1560 gcggcctaga gcaagacgtt tcccgttgaa tatggctcat aacacccctt gtattactgt 1620 ttatgtaagc agacagtttt attgttcatg accaaaatcc cttaacgtga gttttcgttc 1680 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1740 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1800 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1860 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1920 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1980 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 2040 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 2100 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 2160 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 2220 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 2280 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 2340 ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 2400 gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 2460 cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg 2520 catctgtgcg gtatttcaca ccgcatatat ggtgcactct cagtacaatc tgctctgatg 2580 ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca tggctgcgcc 2640 ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 2700 ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 2760 accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca 2820 gatgtctgcc tgttcatccg cgtccagctc gttgagtttc tccagaagcg ttaatgtctg 2880 gcttctgata aagcgggcca tgttaagggc ggttttttcc tgtttggtca ctgatgcctc 2940 cgtgtaaggg ggatttctgt tcatgggggt aatgataccg atgaaacgag agaggatgct 3000 cacgatacgg gttactgatg atgaacatgc ccggttactg gaacgttgtg agggtaaaca 3060 actggcggta tggatgcggc gggaccagag aaaaatcact cagggtcaat gccagcgctt 3120 cgttaataca gatgtaggtg ttccacaggg tagccagcag catcctgcga tgcagatccg 3180 gaacataatg gtgcagggcg ctgacttccg cgtttccaga ctttacgaaa cacggaaacc 3240 gaataccatt catgttgttg ctcaggtcgc agacgttttg cagcagcagt cgcttcacgt 3300 tcgctcgcgt atcggtgatt cattctgcta accagtaagg caaccccgcc agcctagccg 3360 ggtcctcaac gacaggagca cgatcatgcg cacccgtggg gccgccatgc cggcgataat 3420 ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt gagcgagggc 3480 gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc agcgaaagcg 3540 gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt gcatgataaa 3600 gaatacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga aggagctgac 3660 tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 3720 tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 3780 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 3840 tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 3900 agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 3960 tggttaacgg cgggatataa catgagctgt attcggtatc gtcgtatccc actaccgaga 4020 tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 4080 gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 4140 gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 4200 tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 4260 ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 4320 gcgtaccgta ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 4380 gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 4440 gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 4500 tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 4560 cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 4620 tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 4680 tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 4740 tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 4800 cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 4860 atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 4920 ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt gagcaccgcc 4980 gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc cacggggcct 5040 gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc 5100 ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgccg 5160 gccacgatgc gtccggcgta gaggatcgag atctcgatcc cgcgaaatta atacgactca 5220 ctatagggga attgtgagcg gataacaatt cccctctaga tttacacttt atgcttccgg 5280 ctcgtatgtt tctagagaat tcaaataatt ttgtttaact ttaagaagga gatttaaata 5340 tgaaaatcga agaaggtaaa ggtcaccacc atcatcacca tatgcctatt cgctccttta 5400 aactgaaact ggtgacacat aacggcgata gcacatatat ggataaactt cgtcgcggtc 5460 tgtggaaaac gcacgttatc atcaatcgcg gtatcgccta ttatatgaac accctcgcgc 5520 tgatgcgcca ggaaccgtac ggctcgaaat ctcgtgaaga agtgcgcctg gatttgctct 5580 cgacgttacg tgaacagcaa cgtcgcaata actggtccga gcaaacaggt actgacgatg 5640 agctcctttc gctgagtcgc cgcgtctacg aactcttggt gccctcggca atcggcgaaa 5700 agggcgacgc gcagatgctg agtcgtaaat tcctgagccc gttggttgac ccgaatagcg 5760 aaggcggccg cggaaccgcg aaaagcggtc gcaaaccgcg ttggaagaag atgatggaag 5820 aagggcatcc ggattgggaa aaggagaaag agaaagatgc cgcgaagaag gccgaagatc 5880 cgacagccag tattctcgcg gatctcgaag ccgtaggcct tctgccgctc tttcctttgt 5940 tcagcgacga acagaaagag atccgctggc tccccaagaa gaaacgccag tttgtacgta 6000 cgtgggatcg cgatatgttt cagcaggccc tggaacgtat gctgtcttgg gagagttgga 6060 accgccgtgt tgcggaagag tacctgaaac tgcaggcgca gcgcgatgag gtgtacgcga 6120 agtatctcga agatgccggc tcctggttga acgatttaca gacctttgag aaacagcgtg 6180 aagaggagct cgcagaggtg agttttgaac cgaactccga gtacctcatc actcgtcgcc 6240 agatccgcgg ttggaaagaa gtctatgaga aatggtcgaa aaccagcgaa aatgcctcac 6300 aggaacagct gtggcgtatg gtggcggacg tgcagaccgc gatggcagga gcatttggag 6360 atccaaaagt gtaccagttc ttgagccagc ctaaacacca ccacatctgg cgcgaacacc 6420 cgaaccgtct gttttactat tcgaaataca atgaagtccg tgagaaattg aaccgcgcaa 6480 agaagcaagc cgcatttacg ctcccggacc cggttgaaca tccactttgg acccgctttg 6540 atgcgcgcgg cggtaacatc catgactatg aaatcagcaa agtagggaaa cagtatcatg 6600 ttaccttttc gtcactgatt cttccggaag cacagagctg ggtggaaatc gaaaatgtga 6660 cggtcggcat tggcaattca ctgcaattaa aacgccaaat tcgtttagat ggttacgctg 6720 acaagaaaca gaaagtgaag tattacgact atagcagccg cttcgaactt accggcgtgc 6780 tgggtggtgc gaagattcag tttgatcgta aacatctgaa gaaggcggcg caccgcttag 6840 ctgaaggtga gactggcccg attttcctca acgtggtagt ggacgtggag ccctttcttg 6900 aagtaaagaa cggacgcttg cgtacccctc tgggtcaggt gttacaagtg aatacccgtg 6960 attggccgaa ggttgtcgac tacaaagcga aagaactctc ggtgctgatg gaaaataccc 7020 agatcggtaa cgagaatggc gtatccacaa ttgaagctgg aatgcgtatt atgagcattg 7080 atctgggcca gcgcaccgcg gctgccgtgt ccattttcga agtaatcagc aagaagccgg 7140 acgaaaagga aaccaaatta ttctatccga tcgctgatac cgacctgtac gccgtgcacc 7200 gccgcagttt actgctgcgt ctgccgggag aggaaattag cagtaagaag atgattgaaa 7260 agcgcaaaga acgtgcgcgc atccgtagct tagtgcgcta tcagattcgc ctgctgagtg 7320 aggttctgcg tctgcacacc cagggaacgg cggagcaacg tcgttttaag ctggatgagt 7380 tgctggtcag cattcagaag aagttagaat tggatcaaag tgagtggatt agtgaattag 7440 aaaagttatt cgattatatc gacgaaagcg cggagaagtg gaaggaagca ctggtagtgg 7500 cgcaccgcac cttggaaccg attgtggtag aagccgtgcg taattggaag aagtcacttt 7560 ctaaggaaaa taaagaccgc cgccgtatcg ccggcatttc aatctggagt attgaagaac 7620 ttgaagaaac gcgtaagtta ctgattgctt ggtccaaaca ttcccgtgaa ccaggaatcc 7680 ctaagcgcct ggagaaagag gaaaccttcg cgcctgaaca tctgcaacac atccaaaatg 7740 ttaaggatga tcgtctgaaa cagatggcaa acctgtttgt tatgacagcg ttgggctata 7800 aatatgatga aggcaataag cgctgggttg aggcataccc ggcatgccag gtgattctgt 7860 ttgaggatct cagccgttac cgttttgccc tggaccgtcc gcgccgcgag aataaccgct 7920 taatgaaatg ggcccaccgc agtattccgc gtctgaccta catgcaggcc gagctgtttg 7980 gcattcaagt aggcgatgtt tactcagcct acactagccg cttccatgca aagaccgggg 8040 cgccgggcat ccgctgccac gccctgacag aggcggacct gcaatccaat agctatgtgg 8100 taaaccagtt gattaaggat aaattcatcc aagacaatca gaccgaaatc ctgaaagcgg 8160 gccagatcgt cccgtggcag ggcggcgaac tcttcgtgac gttcgcggat cgcagtggcg 8220 ccagcttggc agtcattcat gccgacatta atgccgcgca gaatcttcag aaacgctttt 8280 ggcaacacaa ctcggaagtg tttcgcgtcc cgtgcaaagt ggtgaaaggt ggcctcgttc 8340 cggtgtacga gaaaatgcgc aaactgttcg ggaaaggatt atttgtcaac atcgacgatc 8400 ccgaaagcaa ggaagtgtac cgttgggaac atagcacgaa aatgaaatca aagacgaccc 8460 ctgtcgattt ggagtcagaa gatatcgatc acgaggaatt aagcgatgag tgggaagata 8520 tgcaggaagg ctacaagacg ctgcttcgcg acccttcggg tttcttttgg tcgagtgact 8580 cttggattcc tcagaaagat ttctggattc gcgtgaaaag ccgcatcggc aaatcgcttc 8640 gcgagcagat tcgttaactc gagtaatgat tgacagcta 8679 <210> 9 <211> 8018 <212> DNA <213> other sequences <220> <223> expression construct containing B-Gen.1 with N-terminal linker, a C-terminal linker, T2A-GFP <400> 9 aaagtagagg aacttcactt cattttgcta gaccggtacc gcgttacata acttacggta 60 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat agtaacgcca 120 atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca 180 gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg 240 cccgcctggc attgtgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc 300 tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg cttcactctc 360 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 420 gcagcgatgg gggcgggggg gggggggcgc gcgccaggtg gggcggggcg gggcgagggg 480 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 540 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 600 gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct ccgccgccgc ctcgcgccgc 660 ccgccccggc tctgactgac cgcgttactc ccacaggtga gcgggcggga cggcccttct 720 cctccgggct gtaattagct gagcaagagg taagggttta agggatggtt ggttggtggg 780 gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggcaac 840 cgcggacacc caagcggccg ccaatgaaga ggcctgccgc cacaaagaag gccggccagg 900 ccaagaagaa gaagggtggc ggtggtagtg gtggcggtgg ttcaggcggt ggcggctcag 960 gctccatgcc tattcgctct tttaagctga aacttgtaac ccataacggc gatagtacgt 1020 acatggataa actgcgccgc ggcctgtgga aaactcatgt gataataaac cgcggcatcg 1080 cgtactacat gaacaccttg gccctcatga ggcaagaacc ctacgggtcc aagagccggg 1140 aagaagtacg gttggatctg ctttccactc tgagagagca gcaacgccgg aacaattggt 1200 cagaacaaac cgggactgat gatgaattgc tttccctgag ccgtcgagtt tacgagcttc 1260 ttgtaccatc cgctataggt gaaaagggcg atgcgcaaat gctgagccgc aaatttctct 1320 cccctctcgt ggacccaaac agtgagggcg ggcgcgggac cgccaaaagt gggagaaagc 1380 cacggtggaa gaagatgatg gaagaaggac accccgactg ggaaaaggag aaggaaaagg 1440 atgcggctaa gaaggcagag gatccaacag catctatatt ggcggatctc gaggcagtgg 1500 gactgttgcc acttttcccg ctgttttctg acgaacagaa agaaatccgc tggctcccca 1560 agaagaagcg tcagtttgtg aggacatggg accgggatat gttccaacag gcccttgaac 1620 gaatgctgag ctgggaaagc tggaatcgca gagttgccga ggaatacttg aagctccagg 1680 cccagcggga cgaggtgtat gccaaatacc ttgaggatgc tggctcctgg cttaatgatc 1740 tgcagacttt cgaaaagcag cgcgaagagg aactggcgga agtaagcttc gaacccaact 1800 ctgagtacct gattactcgc cggcagattc gcgggtggaa ggaagtgtat gaaaagtggt 1860 caaagaccag cgaaaatgcg agccaggagc agttgtggcg gatggtggct gacgtgcaga 1920 ctgccatggc cggcgcgttc ggagatccca aagtgtacca gtttctttct cagcctaagc 1980 accaccatat ttggagagag catccaaata gactgttcta ctacagcaag tacaacgagg 2040 tccgggagaa gctcaacagg gccaagaagc aggcggcctt taccctgcca gatcccgtgg 2100 agcacccact gtggacacgt tttgatgcgc gcggcggcaa tatccatgac tacgagatat 2160 ccaaggtggg caagcaatac cacgtgacgt tcagctctct tatcctgcca gaggcccaga 2220 gttgggtgga gattgagaat gttacagtgg gtatcgggaa cagcctgcag ctgaaacgcc 2280 agattcgctt ggacggttac gcagacaaga agcagaaagt caaatattat gattattcca 2340 gcaggttcga gctcacagga gtactcggcg gagcaaagat ccaattcgat aggaagcatc 2400 ttaagaaggc tgctcacaga ctggctgagg gcgaaacagg gccgatcttc ttgaatgttg 2460 tggtggatgt agaaccattc ttggaagtga agaatggacg tttgcggact ccactcggtc 2520 aagtcctgca ggtgaacact agagattggc ccaaggtcgt cgactacaaa gcaaaggagc 2580 tgtcagtctt gatggaaaac acgcaaattg gcaacgagaa tggggtgtct acaatcgagg 2640 ccggaatgag gattatgtct attgacctgg gacagaggac cgctgctgcc gtgtctattt 2700 tcgaggtcat ttctaagaaa cctgacgaaa aggaaacgaa gctgttttat cccatcgcag 2760 acacagatct gtatgccgtt cacaggcgaa gtctcctgct gagattgccc ggcgaggaga 2820 tctctagtaa gaaaatgatt gagaagcgga aagagcgcgc acgtatccgc tccctggtga 2880 ggtatcagat caggctcctc tcagaagtcc tgcggcttca cacacagggc accgctgaac 2940 agcgtcggtt taagctggac gagctgctcg tgagcatcca gaagaagttg gagcttgacc 3000 agagcgagtg gatttcagaa ctcgagaaac tcttcgacta tatcgatgag tcagctgaga 3060 aatggaaaga ggctctggtc gtggctcaca gaactctgga gcctatcgtg gttgaagccg 3120 tcagaaactg gaagaagtct ctgtccaaag aaaacaagga tagacgcagg attgccggaa 3180 tctccatctg gtctatagag gagctcgagg aaacccgcaa gctgcttatt gcatggtcta 3240 aacactccag agaacctggc attccgaaaa gacttgagaa agaggaaaca tttgctccag 3300 aacacctgca gcacatacag aacgtgaaag acgatcgcct taaacagatg gctaacttgt 3360 ttgtgatgac cgccttgggc tataagtatg atgaaggcaa taagcggtgg gtggaagcgt 3420 atccagcatg ccaggtaatc ctgtttgagg atttgtctag atatcggttc gccctggaca 3480 gacctaggcg ggagaacaat cgattgatga agtgggccca ccgcagtatc ccaaggctca 3540 cctacatgca ggctgaactg tttggaatcc aggtgggcga tgtctattca gcgtacacct 3600 ctagattcca cgccaaaaca ggggcccccg ggatccgctg tcatgcactg acagaagccg 3660 atcttcaatc taatagttac gttgtgaacc agctgataaa ggataaattt attcaagaca 3720 accagactga aatcctcaag gccggccaga tagttccttg gcagggcggt gagttgtttg 3780 ttacctttgc agatagatcc ggcgccagct tggctgttat ccacgccgat attaatgcag 3840 cgcagaacct tcagaaaagg ttttggcagc acaactcaga ggtgttccga gtgccttgta 3900 aggtggtgaa gggcgggttg gtccctgttt atgaaaagat gcgaaagctt ttcggaaaag 3960 gcctctttgt aaatatagac gacccagaat ccaaggaagt ctaccgctgg gaacattcca 4020 ctaagatgaa atccaagact acaccagttg accttgaaag cgaagatatt gatcacgagg 4080 aactcagcga cgagtgggaa gatatgcagg aaggatacaa aacactgctg cgtgaccctt 4140 caggcttctt ctggtcctca gacagttgga tccctcagaa ggatttctgg atcagagtca 4200 agagcagaat cggcaagtct ctgcgggagc agattcgcgg tggaagcgga ggcagcgggg 4260 gatcaggtcc ccctaagaaa aagcggaagg tgggcggtgg cggcggttca catcatcatc 4320 accatcatgg cggtgaagga cgcggctccc ttctgacctg tggtgacgtg gaagagaacc 4380 ccggccctga attcatgtct ggcggcgagg aactgtttgc cggaatcgtg cctgtgctga 4440 tcgagctgga tggggatgtg cacggccaca agtttagcgt cagaggcgaa ggcgaagggg 4500 acgccgatta cggcaagctg gaaatcaagt tcatctgcac caccggaaag ctgcccgtgc 4560 cttggcctac actggtcacc acactgtgct acggcatcca gtgcttcgcc agatatcccg 4620 agcatatgaa gatgaacgac ttcttcaaga gcgccatgcc tgagggctac atccaagagc 4680 ggacaatcca gttccaggac gacggcaagt acaagaccag gggcgaagtg aagttcgagg 4740 gcgacaccct ggtcaacaga atcgagctga agggcaaaga cttcaaagag gacggcaaca 4800 tcctgggcca caagcttgag tacagcttca acagccacaa cgtgtacatc agacccgaca 4860 aggccaacaa cggcctggaa gccaacttca agacccggca caacatcgaa ggtggcggag 4920 tgcagctggc cgatcactac cagacaaatg tgcccctcgg agatggcccc gtgctgatcc 4980 ctatcaacca ctacctgagc acccagacca agatcagcaa ggacagaaac gaggcccggg 5040 accacatggt gctgctggaa agctttagcg cctgctgtca cacccacggc atggacgagc 5100 tgtacagata atgactcgag atcagcctcg actgtgcctt ctagttgcca gccatctgtt 5160 gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 5220 taataaaatg aggaaattgc atccccactt cagaagttcc tatactttct aatgagtgag 5280 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 5340 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 5400 ttgcgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 5460 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 5520 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 5580 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5640 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 5700 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 5760 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 5820 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 5880 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 5940 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 6000 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 6060 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 6120 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 6180 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 6240 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 6300 atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 6360 ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 6420 gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 6480 tgacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 6540 gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 6600 agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 6660 catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 6720 aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 6780 gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 6840 taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 6900 caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 6960 ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 7020 ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 7080 tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 7140 aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 7200 actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 7260 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcatat ttccccgaaa 7320 agtgccacct gacgtcgacg gatcgggaga tctcccgatc ccctatggtg cactctcagt 7380 acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg tgtgttggag 7440 gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt gaccgaacaa 7500 actctttctg tgttgtaaaa cgacggccag tcttaagctc gggccccctg ggcggttctg 7560 ataacgagta atcgttaatc cgcaaataac gtaaaaaccc gcttcggcgg gtttttttat 7620 ggggggagtt tagggaaaga gcatttgtca gaatatttaa gggcgcctgt cactttgctt 7680 gatatatgag aattatttaa ccttataaat gagaaaaaag caacgcactt taaataagat 7740 acgttgcttt ttcgattgat gaacacctat aattaaacta ttcatctatt atttatgatt 7800 ttttgtatat acaatatttc tagtttgtta aagagaatta agaaaataaa tctcgaaaat 7860 aataaaggga aaatcagttt ttgatatcaa aattatacat gtcaacgata atacaaaata 7920 taatacaaac tataagatgt tatcagtatt tattatgcat ttagaataaa ttttgtgtcg 7980 cccttattcg actcactata gaagttccta ttctctag 8018 <210> 10 <211> 8054 <212> DNA <213> other sequences <220> <223> expression construct containing B-Gen.2 with N-terminal linker, a C-terminal linker, T2A-GFP <400> 10 ctctagaaag tagaggaact tcacttcatt ttgctagacc ggtaccgcgt tacataactt 60 acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaatagta 120 acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 180 ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 240 aaatggcccg cctggcattg tgcccagtac atgaccttat gggactttcc tacttggcag 300 tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc 360 actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420 ttttgtgcag cgatgggggc gggggggggg gggcgcgcgc caggtggggc ggggcggggc 480 gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 540 cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 600 cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg 660 cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc 720 ccttctcctc cgggctgtaa ttagctgagc aagaggtaag ggtttaaggg atggttggtt 780 ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 840 ggcaaccgcg gacacccaag cggccgccaa tgaagaggcc tgccgccaca aagaaggccg 900 gccaggccaa gaagaagaag ggtggcggtg gtagtggtgg cggtggttca ggcggtggcg 960 gctcaggctc catgaccatc agaagtatga agctgaagct taaaatctat agcggcaggt 1020 ccgcgcccca actcaggcag ggtctgtggc gtttgcatcg gctgttgaac gagggaacgg 1080 cctattacat ggattggctt gtacatatga gacaagaggc tctcccaggc aaaagcaaag 1140 aagagattag agctgaattg gagagaagag tgagacagca gcaggaaaag aatggtgtgc 1200 aaaatgacca ggtcccgatg gacgaagtcc tcagcgcact taggcaactg tatgagcttc 1260 tggtcccgtc tgccgtaaat aattccggcg acgcacagac gctgtctagg aagttcttgt 1320 ctccattggt ggacccaaac tccgagggtg gaaagggcac gtcaaacgcc ggagccaagc 1380 ctggctggcg gaagaaacaa gaggcagggg acccaagctg ggagaaagac tatgagagat 1440 ggctcaaacg caagcaggct gaccctaccg ctgagatttt gggtaagctg gaaaccgccg 1500 gcctcaaacc cctcttcccc ctgtacacaa atgaagtcaa ggatataagg tggatgccac 1560 tgacgtctaa acaatatgtc cgaaactggg atcgcgatat gttccaacaa gctatcgagc 1620 atctgctcag ttgggaaact tggaatagaa aggtgaatga ggaaagggcg aaactgaagg 1680 aaacagtcag gcgctttgaa gaacagcacc tggccaatgg aaaggattgg ctctccccac 1740 ttcaggccta tgaagccaat cgagaacagg cacttagaga catggccata tctcctagcg 1800 atcgcttcag gatcactagg cgccaaataa agggatggtc tgagctttat gaaaggtgga 1860 acaagctcgc acctaccgct agcgtagagg cgtacatgca ggaagttcgc catgtacaga 1920 agaaactcgg cggtaccttt ggagatgccg acctctaccg gtttctggcc aaacccgaga 1980 acgtgcacat atggcgcgac caccaggagc ggctgcacta ctatgccgca tacaatgatt 2040 tgcataagcg actcatgagc gccaaagagc aggctgcttt tacactcccc gaccctgtgg 2100 cccatccact gtgggtgcgc tttgacgcca gagatggcaa tctgtttact tacatactgc 2160 aggccgactc ttcaaagcag aggtcacgta gatacgtcaa tttctctcgt tttctgtggc 2220 ctgttgaaga tgggtacttt gaggaaacgg agaacgtcaa agttgagctg gctctgtcca 2280 agcaatttta tagacaggtg attgtccacg acaacccaac gggaaagcag aagataacgt 2340 tccaggatta ctccagtaaa gaaatcctcg aagggcatct tggcggggcc aaactgcagc 2400 tcgaccggaa tttccttcgg aaatcagggc gggactttga gacaggcgat tttgggccgg 2460 cttttctgaa cgtggtgttg gacctgaagc caaaacagga agtgaagaat gggcgcttgc 2520 agtcccctct tggccaggcg ttgctcgtta aaagcagacc caacgatatc ccgaaggtgt 2580 acggatacaa accagatgca ttggcagctt ggctggagca agccagtggt gaagagtccc 2640 tggggagcga gtcattgcgt caggggttta gagtaatgtc aattgatctc ggcgtcaggt 2700 ctgccgctgc tatatccgtc tttagtgtga aaggagagaa aacccgtgag ggcgataagg 2760 tgtgctatcc agttggggag acaggcctct tcgccgtcca cgataggtct tttctgctca 2820 gactcccggg tgaatcaagc gagaagcggg tgaatgtgga gcgtgataaa cgtaagacag 2880 agagaatgca gatccgttat cacatcagga ccctggcgcg cgtgttgaga ctcgcaaaca 2940 aggcaacccc aatggaccgg atcaaggccg tgcaggatgt gctgaacgat atcgagtcta 3000 ctaggttcat gaatgaccat gaccaccacg tttacaacca tgctctcgaa accctcagaa 3060 cctacgctcc tgatcaccag gggatctggg aagaacaagt aatcgccgcc catcgccagc 3120 tcgaacacca cgtcggcgtt atcgtagggg agtggcggaa gaactggggt aaagatcgtc 3180 gagggacagt cgggctgagc atggacaaca ttgaagaact cgatgagatg aggagattgc 3240 tgatctcttg gagccgccgg gctcgttacc ctcgcgaggc gaagcctttc caagtgaacg 3300 agtcaaaccc tgtgcacctg ttgcggcatc tgcagaattt gaaagaggac agactgaagc 3360 agcttgccaa cctgattgtg atgaccgccc tgggctatgt gtacgactcc aaggaaaaga 3420 agtggaaagc tgcataccct gcatgccagc tgatcctttt cgaggacctg cagaggtaca 3480 ggttccacct cgaccgtagt gccagggaaa actcacagct gatgaaatgg gcacataggt 3540 caatcccaaa gtatgtgtgg atgcagggtg agccctacgg acttcaaatc ggcgatgtgt 3600 gggcaggctt cacttcccgg taccacgcga aaaccggggc tcccggaatt cggtgtaaag 3660 cactgaccga aaaggatttt cagcagggcc gacttctgga gtcactcgtc gcggaaggca 3720 tgtttaccct gcaggaagtg ggcacgttga aaccagggga catcgttccc gcggaaggcg 3780 gcgaactttt cgtgactctg gccgatgact ctggagacag gatcgtcatc acccacgcag 3840 atattaacgc agctcagaat gtccagaagc gattttggct cgcaaatagc gagaggttcc 3900 gcgttgcatg tcgcagcgtg caaatcgcat cccaggagtg ttttattcct tccagcgagt 3960 ctgtcgccaa gaagatgggc aagggagtct ttgtgcggga cttctccttt cacaaagaca 4020 tggaagtgta ccactggaat aaccaggtca agctcacagc aaagaacgta ccgaccgacc 4080 acagcgatga tctccaggac ctgcaggact accaggctat cctcgaagaa gccagggagt 4140 ctagtagcag ctacaagacg ctgtttaggg atccttctgg gttcttcttc ccagacgatg 4200 tgtgggtccc tcagaatatt tactggcgag aggttaagaa aacaatcacc gctctgctgc 4260 gtaagcgcat catgtccacc ggtggaagcg gaggcagcgg gggatcaggt ccccctaaga 4320 aaaagcggaa ggtgggcggt ggcggcggtt cacatcatca tcaccatcat ggcggtgaag 4380 gacgcggctc ccttctgacc tgtggtgacg tggaagagaa ccccggccct gaattcatgt 4440 ctggcggcga ggaactgttt gccggaatcg tgcctgtgct gatcgagctg gatggggatg 4500 tgcacggcca caagtttagc gtcagaggcg aaggcgaagg ggacgccgat tacggcaagc 4560 tggaaatcaa gttcatctgc accaccggaa agctgcccgt gccttggcct acactggtca 4620 ccacactgtg ctacggcatc cagtgcttcg ccagatatcc cgagcatatg aagatgaacg 4680 acttcttcaa gagcgccatg cctgagggct acatccaaga gcggacaatc cagttccagg 4740 acgacggcaa gtacaagacc aggggcgaag tgaagttcga gggcgacacc ctggtcaaca 4800 gaatcgagct gaagggcaaa gacttcaaag aggacggcaa catcctgggc cacaagcttg 4860 agtacagctt caacagccac aacgtgtaca tcagacccga caaggccaac aacggcctgg 4920 aagccaactt caagacccgg cacaacatcg aaggtggcgg agtgcagctg gccgatcact 4980 accagacaaa tgtgcccctc ggagatggcc ccgtgctgat ccctatcaac cactacctga 5040 gcacccagac caagatcagc aaggacagaa acgaggcccg ggaccacatg gtgctgctgg 5100 aaagctttag cgcctgctgt cacacccacg gcatggacga gctgtacaga taatgactcg 5160 agatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 5220 ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 5280 gcatccccac ttcagaagtt cctatacttt ctaatgagtg agctaactca cattaattgc 5340 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 5400 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttgcgctt cctcgctcac 5460 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5520 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5580 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 5640 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 5700 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 5760 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 5820 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 5880 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 5940 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6000 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6060 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6120 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6180 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6240 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6300 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6360 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6420 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6480 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgtgacccac gctcaccggc 6540 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6600 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 6660 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 6720 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 6780 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 6840 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 6900 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 6960 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 7020 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7080 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7140 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7200 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7260 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7320 gaaaaataaa caaatagggg ttccgcgcat atttccccga aaagtgccac ctgacgtcga 7380 cggatcggga gatctcccga tcccctatgg tgcactctca gtacaatctg ctctgatgcc 7440 gcatagttaa gccagtatct gctccctgct tgtgtgttgg aggtcgctga gtagtgcgcg 7500 agcaaaattt aagctacaac aaggcaaggc ttgaccgaac aaactctttc tgtgttgtaa 7560 aacgacggcc agtcttaagc tcgggccccc tgggcggttc tgataacgag taatcgttaa 7620 tccgcaaata acgtaaaaac ccgcttcggc gggttttttt atggggggag tttagggaaa 7680 gagcatttgt cagaatattt aagggcgcct gtcactttgc ttgatatatg agaattattt 7740 aaccttataa atgagaaaaa agcaacgcac tttaaataag atacgttgct ttttcgattg 7800 atgaacacct ataattaaac tattcatcta ttatttatga ttttttgtat atacaatatt 7860 tctagtttgt taaagagaat taagaaaata aatctcgaaa ataataaagg gaaaatcagt 7920 ttttgatatc aaaattatac atgtcaacga taatacaaaa tataatacaa actataagat 7980 gttatcagta tttattatgc atttagaata aattttgtgt cgcccttatt cgactcacta 8040 tagaagttcc tatt 8054 <210> 11 <211> 164 <212> DNA <213> other sequences <220> <223> ATTA PAM containing guide sequence <400> 11 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctggacaagt agcaagaaat taat 164 <210> 12 <211> 164 <212> DNA <213> other sequences <220> <223> ATTT PAM containing guide sequence <400> 12 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca cgttttcttt agttattaat ttct 164 <210> 13 <211> 164 <212> DNA <213> other sequences <220> <223> ATTC PAM containing guide sequence <400> 13 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ccattaacta gcattataat gcac 164 <210> 14 <211> 164 <212> DNA <213> other sequences <220> <223> ATTG PAM containing guide sequence <400> 14 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctttagtgac tgtaattttc tttt 164 <210> 15 <211> 164 <212> DNA <213> other sequences <220> <223> ATTT PAM containing guide sequence <400> 15 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca cgtgaagtct tacaaggtta tctt 164 <210> 16 <211> 164 <212> DNA <213> other sequences <220> <223> ATTG PAM containing guide sequence <400> 16 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctttagtgac tgtaattttc tttt 164 <210> 17 <211> 164 <212> DNA <213> other sequences <220> <223> ATTC PAM containing guide sequence <400> 17 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca caatcttcaa ccctattctg tgaa 164 <210> 18 <211> 164 <212> DNA <213> other sequences <220> <223> ATTA PAM containing guide sequence <400> 18 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca cataactaaa gaaaacaaat ctta 164 <210> 19 <211> 164 <212> DNA <213> other sequences <220> <223> GTTA PAM containing guide sequence <400> 19 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca cgtacagttt tgctgaaagg ttat 164 <210> 20 <211> 164 <212> DNA <213> other sequences <220> <223> GTTC PAM containing guide sequence <400> 20 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctgcttatta tggacaagta gcaa 164 <210> 21 <211> 164 <212> DNA <213> other sequences <220> <223> GTTT PAM containing guide sequence <400> 21 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctattccatt aactagcatt ataa 164 <210> 22 <211> 164 <212> DNA <213> other sequences <220> <223> GTTT PAM containing guide sequence <400> 22 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ccagtgcgac gccgcgagcc ccga 164 <210> 23 <211> 164 <212> DNA <213> other sequences <220> <223> GTTG PAM containing guide sequence <400> 23 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca cgacgaaaag tttcagtgcg acgc 164 <210> 24 <211> 164 <212> DNA <213> other sequences <220> <223> GTTC PAM containing guide sequence <400> 24 gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60 gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120 ggaaatgtag atggttagca ctcgcttcgg aggagccgtg gtcc 164 <210> 25 <211> 170 <212> DNA <213> other sequences <220> <223> ATTA PAM containing guide sequence <400> 25 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcactgg acaagtagca agaaattaat 170 <210> 26 <211> 170 <212> DNA <213> other sequences <220> <223> ATTT PAM containing guide sequence <400> 26 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacgtt ttctttagtt attaatttct 170 <210> 27 <211> 170 <212> DNA <213> other sequences <220> <223> ATTC PAM containing guide sequence <400> 27 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcaccat taactagcat tataatgcac 170 <210> 28 <211> 170 <212> DNA <213> other sequences <220> <223> ATTG PAM containing guide sequence <400> 28 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacttt agtgactgta attttctttt 170 <210> 29 <211> 170 <212> DNA <213> other sequences <220> <223> ATTT PAM containing guide sequence <400> 29 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacgtg aagtcttaca aggttatctt 170 <210> 30 <211> 170 <212> DNA <213> other sequences <220> <223> ATTG PAM containing guide sequence <400> 30 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacttt agtgactgta attttctttt 170 <210> 31 <211> 170 <212> DNA <213> other sequences <220> <223> ATTC PAM containing guide sequence <400> 31 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacaat cttcaaccct attctgtgaa 170 <210> 32 <211> 170 <212> DNA <213> other sequences <220> <223> ATTA PAM containing guide sequence <400> 32 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacata actaaagaaa acaaatctta 170 <210> 33 <211> 170 <212> DNA <213> other sequences <220> <223> GTTA PAM containing guide sequence <400> 33 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacgta cagttttgct gaaaggttat 170 <210> 34 <211> 170 <212> DNA <213> other sequences <220> <223> GTTC PAM containing guide sequence <400> 34 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcactgc ttattatgga caagtagcaa 170 <210> 35 <211> 170 <212> DNA <213> other sequences <220> <223> GTTT PAM containing guide sequence <400> 35 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcactat tccattaact agcattataa 170 <210> 36 <211> 170 <212> DNA <213> other sequences <220> <223> GTTT PAM containing guide sequence <400> 36 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcaccag tgcgacgccg cgagccccga 170 <210> 37 <211> 170 <212> DNA <213> other sequences <220> <223> GTTG PAM containing guide sequence <400> 37 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcacgac gaaaagtttc agtgcgacgc 170 <210> 38 <211> 170 <212> DNA <213> other sequences <220> <223> GTTC PAM containing guide sequence <400> 38 gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60 caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120 tttagtggaa agtaacgtga ttagcactcg cttcggagga gccgtggtcc 170 <210> 39 <211> 1091 <212> PRT <213> other sequences <220> <223> independently identified variant of B-Gen.1 with three amino acid exchanges <400> 39 Met Pro Ile Arg Ser Phe Lys Leu Lys Leu Val Thr His Asn Gly Asp 1 5 10 15 Ser Thr Tyr Met Asp Lys Leu Arg Arg Gly Leu Trp Lys Thr His Val 20 25 30 Ile Ile Asn Arg Gly Ile Ala Tyr Tyr Met Asn Thr Leu Ala Leu Met 35 40 45 Arg Gln Glu Pro Tyr Gly Ser Lys Ser Arg Glu Glu Val Arg Leu Asp 50 55 60 Leu Leu Ser Thr Leu Arg Glu Gln Gln Arg Arg Asn Asn Trp Ser Glu 65 70 75 80 Gln Thr Gly Thr Asp Asp Glu Leu Leu Ser Leu Ser Arg Arg Val Tyr 85 90 95 Glu Leu Leu Val Pro Ser Ala Ile Gly Glu Lys Gly Asp Ala Gln Met 100 105 110 Leu Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly 115 120 125 Gly Arg Gly Thr Ala Lys Ser Gly Arg Lys Pro Arg Trp Lys Lys Met 130 135 140 Met Glu Glu Gly His Pro Asp Trp Glu Lys Glu Lys Glu Lys Asp Ala 145 150 155 160 Ala Lys Lys Ala Glu Asp Pro Thr Ala Ser Ile Leu Ala Asp Leu Glu 165 170 175 Ala Val Gly Leu Leu Pro Leu Phe Pro Leu Phe Ser Asp Glu Gln Lys 180 185 190 Glu Ile Arg Trp Leu Pro Lys Lys Lys Arg Gln Phe Val Arg Thr Trp 195 200 205 Asp Arg Asp Met Phe Gln Gln Ala Leu Glu Arg Met Leu Ser Trp Glu 210 215 220 Ser Trp Asn Arg Arg Val Ala Glu Glu Tyr Gln Lys Leu Gln Ala Gln 225 230 235 240 Arg Asp Glu Val Tyr Ala Lys Tyr Leu Glu Asp Ala Gly Ser Trp Leu 245 250 255 Asn Asp Leu Gln Thr Phe Glu Lys Gln Arg Glu Glu Glu Leu Ala Glu 260 265 270 Val Ser Phe Glu Pro Asn Ser Glu Tyr Leu Ile Thr Arg Arg Gln Ile 275 280 285 Arg Gly Trp Lys Glu Val Tyr Glu Lys Trp Ser Lys Thr Ser Glu Asn 290 295 300 Ala Ser Gln Glu Gln Leu Trp Arg Met Val Ala Asp Val Gln Thr Ala 305 310 315 320 Met Ala Gly Ala Phe Gly Asp Pro Lys Val Tyr Gln Phe Leu Ser Gln 325 330 335 Pro Lys His His His Ile Trp Arg Glu His Pro Asn Arg Leu Phe Tyr 340 345 350 Tyr Ser Lys Tyr Asn Glu Val Arg Glu Lys Leu Asn Arg Ala Lys Lys 355 360 365 Gln Ala Ala Phe Thr Leu Pro Asp Pro Val Glu His Pro Leu Trp Thr 370 375 380 Arg Phe Asp Ala Arg Gly Gly Asn Ile His Asp Tyr Glu Ile Ser Lys 385 390 395 400 Val Gly Lys Gln Tyr His Val Thr Phe Ser Ser Leu Ile Leu Pro Glu 405 410 415 Ala Gln Ser Trp Val Glu Ile Glu Asn Val Thr Val Gly Ile Gly Asn 420 425 430 Ser Leu Gln Leu Lys Arg Gln Ile Arg Leu Asp Gly Tyr Ala Asp Lys 435 440 445 Lys Gln Lys Val Lys Tyr Tyr Asp Tyr Ser Ser Arg Phe Glu Leu Thr 450 455 460 Gly Val Leu Gly Gly Ala Lys Ile Gln Phe Asp Arg Lys His Leu Lys 465 470 475 480 Lys Ala Ala His Arg Leu Ala Glu Gly Glu Thr Gly Pro Ile Phe Leu 485 490 495 Asn Val Val Val Asp Val Glu Pro Phe Leu Glu Val Lys Asn Gly Arg 500 505 510 Leu Arg Thr Pro Leu Gly Gln Val Leu Gln Val Asn Thr Arg Asp Trp 515 520 525 Pro Lys Val Val Asp Tyr Lys Ala Lys Glu Leu Ser Val Leu Met Glu 530 535 540 Asn Thr Gln Ile Gly Asn Glu Asn Gly Val Ser Thr Ile Glu Ala Gly 545 550 555 560 Met Arg Ile Met Ser Ile Asp Leu Gly Gln Arg Thr Ala Ala Ala Val 565 570 575 Ser Ile Phe Glu Val Ile Ser Lys Lys Pro Asp Glu Lys Glu Thr Lys 580 585 590 Leu Phe Tyr Pro Ile Ala Asp Thr Asp Leu Tyr Ala Val His Arg Arg 595 600 605 Ser Leu Leu Leu Arg Leu Pro Gly Glu Glu Ile Ser Ser Lys Lys Met 610 615 620 Ile Glu Lys Arg Lys Glu Arg Ala Arg Ile Arg Ser Leu Val Arg Tyr 625 630 635 640 Gln Ile Arg Leu Leu Ser Glu Val Leu Arg Leu His Thr Gln Gly Thr 645 650 655 Ala Glu Gln Arg Arg Phe Lys Leu Asp Glu Leu Leu Val Ser Ile Gln 660 665 670 Arg Lys Leu Glu Leu Asp Gln Ser Glu Trp Ile Ser Glu Leu Glu Lys 675 680 685 Leu Phe Asp Tyr Ile Asp Glu Ser Ala Glu Lys Trp Lys Glu Ala Leu 690 695 700 Val Val Ala His Arg Thr Leu Glu Pro Ile Val Val Glu Ala Val Arg 705 710 715 720 Asn Trp Lys Lys Ser Leu Ser Lys Glu Asn Lys Asp Arg Arg Arg Ile 725 730 735 Ala Gly Ile Ser Ile Trp Ser Ile Glu Glu Leu Glu Glu Thr Arg Lys 740 745 750 Leu Leu Ile Ala Trp Ser Lys His Ser Arg Glu Pro Gly Ile Pro Lys 755 760 765 Arg Leu Glu Lys Glu Glu Thr Phe Ala Pro Glu His Leu Gln His Ile 770 775 780 Gln Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Phe Val 785 790 795 800 Met Thr Ala Leu Gly Tyr Lys Tyr Asp Glu Gly Asn Lys Arg Trp Val 805 810 815 Glu Ala Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asp Leu Ser Arg 820 825 830 Tyr Arg Phe Ala Leu Asp Arg Pro Arg Arg Glu Asn Asn Arg Leu Met 835 840 845 Lys Trp Ala His Arg Ser Ile Pro Arg Leu Thr Tyr Met Gln Ala Glu 850 855 860 Leu Phe Gly Ile Gln Val Gly Asp Val Tyr Ser Ala Tyr Thr Ser Arg 865 870 875 880 Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His Ala Leu Thr 885 890 895 Glu Ala Asp Leu Gln Ser Asn Ser Tyr Val Val Asn Gln Leu Ile Lys 900 905 910 Asp Lys Phe Ile Gln Asp Asn Gln Thr Glu Ile Leu Lys Ala Gly Gln 915 920 925 Ile Val Pro Trp Gln Gly Gly Glu Leu Phe Val Thr Phe Ala Asp Arg 930 935 940 Ser Gly Ala Ser Leu Ala Val Ile His Ala Asp Ile Asn Ala Ala Gln 945 950 955 960 Asn Leu Gln Lys Arg Phe Trp Gln His Asn Ser Glu Val Phe Arg Val 965 970 975 Pro Cys Lys Val Val Lys Gly Gly Leu Val Pro Val Tyr Glu Lys Met 980 985 990 Arg Lys Leu Phe Gly Lys Gly Leu Phe Val Asn Ile Asp Asp Pro Glu 995 1000 1005 Ser Lys Glu Val Tyr Arg Trp Glu His Ser Thr Lys Met Lys Ser Lys 1010 1015 1020 Thr Thr Pro Val Asp Leu Glu Ser Glu Asp Ile Glu His Glu Glu Leu 1025 1030 1035 1040 Ser Asp Glu Trp Glu Asp Met Gln Glu Gly Tyr Lys Thr Leu Leu Arg 1045 1050 1055 Asp Pro Ser Gly Phe Phe Trp Ser Ser Asp Ser Trp Ile Pro Gln Lys 1060 1065 1070 Asp Phe Trp Ile Arg Val Lys Ser Arg Ile Gly Lys Ser Leu Arg Glu 1075 1080 1085 Gln Ile Arg 1090 <210> 40 <211> 97 <212> RNA <213> other sequences <220> <223> single guide scaffold with N(23) place holder for a target specific sequence B-GEn.1-sgRNA_v4 <400> 40 guuuagcuau aggcuaauaa gauaguugug ucaagugcuu cggagaccua acacgucauc 60 cagucacaac ggcuaucuaa aaauagaugg uuagcac 97 <210> 41 <211> 87 <212> RNA <213> other sequences <220> <223> single guide scaffold with N(23) place holder for a target specific sequence B-GEn.1-sgRNA_v4.2 <400> 41 uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucaucca 60 gucacaacgg cuaaaaaugg uuagcac 87 <210> 42 <211> 87 <212> RNA <213> other sequences <220> <223> single guide scaffold with N(23) place holder for a target specific sequence B-GEn.1-sgRNA_v4.3 <400> 42 uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucaucca 60 gucacaacgg cuaaaaauag ccagcac 87 <210> 43 <211> 86 <212> RNA <213> other sequences <220> <223> single guide scaffold with N(23) place holder for a target specific sequence B-GEn.1-sgRNA_v4.4 <400> 43 uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucuccag 60 ucacaacggc uaaaaauagc cagcac 86 <210> 44 <211> 86 <212> RNA <213> other sequences <220> <223> single guide scaffold with N(23) place holder for a target specific sequence B-GEn.1-sgRNA_v4.5 <400> 44 uuagcuauag gcuaauaaga uaguugugac aagugcuucg gagaccuaac acgucuccag 60 ucacaacggc uaaaaauagc cagcac 86

Claims

서열식별번호: 1 또는 서열식별번호: 39에 따른 B-GEn.1, 및 서열식별번호: 2에 따른 B-GEn.2의 군으로부터 선택된 폴리펩티드, 상기 중 임의의 것과 적어도 80% 동일한 임의의 폴리펩티드 서열, 또는 그를 코딩하는 임의의 핵산.
제1항에 따른 폴리펩티드 및 서열식별번호: 40, 41, 42, 43, 및 45로부터 선택된 서열을 포함하는 sgRNA를 포함하는 조성물.
하기를 포함하는 조성물:
(i) 제1항에 따른 폴리펩티드, 및
(ii) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)의 계내 생성을 허용하는 DNA(들), 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨.
제2항 또는 제3항에 있어서, 조작된 DNA 표적화 세그먼트가 그의 3' 단부 상에서 표적화된 DNA 세그먼트 상의 PAM 서열에 직접적으로 인접하거나, 또는 이러한 PAM 서열이 5' 부분에서 표적화된 DNA 서열의 일부이며, 여기서 PAM 서열이 서열 모티프 "DTTN"을 포함하고, 이때 "D"가 "A" 또는 "T" 또는 "G"를 나타내고 "N"이 임의의 뉴클레오티드를 나타내는 것인 조성물.
하기 단계를 포함하는, 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법:
(i) 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및
(ii) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)를 코딩하는 DNA(들)를 세포 내로 또는 시험관 내 환경 내로 도입하는 단계로서, 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 하기를 포함하며:
a. RNA를 포함하고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. RNA로 구성된 tracr 메이트 서열, 및
c. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열되는 것인 단계; 및
(iii) 표적 DNA에 하나 이상의 닉 또는 커트 또는 염기 편집을 생성하는 단계로서, 여기서 B-GEn 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 sgRNA에 의해 표적 DNA로 지시되는 것인 단계.
세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도:
i. 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산; 및/또는
ii. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 하기를 포함하며:
a. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. RNA로 구성된 tracr 메이트 서열, 및
c. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨.
하기를 포함하는 세포:
i. 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산; 및
ii. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨.
하기를 포함하는 키트:
I. 제1항에 따른 B-GEn 폴리펩티드를 코딩하는 핵산, 여기서 B-GEn을 코딩하는 핵산은 프로모터에 작동가능하게 연결됨; 및
II. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 각각의 sgRNA는 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨.
서열식별번호: 40-44로부터 선택된 핵산을 포함하는 핵산 또는 임의의 핵산.