KR20220145913A

KR20220145913A - 가공된 표적 특이적 뉴클레아제

Info

Publication number: KR20220145913A
Application number: KR1020227035402A
Authority: KR
Inventors: 제프리 씨. 밀러; 에드워드 제이. 리바
Original assignee: 상가모 테라퓨틱스, 인코포레이티드
Priority date: 2016-08-24
Filing date: 2017-08-24
Publication date: 2022-10-31
Also published as: JP2019528073A; EP3504327A1; US20200340016A1; JP7272948B2; IL264792B1; SG10201913948PA; US11827900B2; AU2017315414A9; EP3504327A4; KR102455249B1; IL300783A; KR20190039955A; IL264792B2; AU2017315414A1; CN110418841A; BR112019003327A2; AU2017315414B2; WO2018039448A9; SG11201901364VA; RU2019108242A3

Abstract

온 표적 특이성이 증가되도록 개열 도메인 (가령, FokI 또는 이의 동족체) 및/또는 DNA 결합 도메인 (아연 핑거 단백질, TALE, 단일 안내 RNA)에서 돌연변이를 포함하는 가공된 뉴클레아제가 본원에서 설명된다.

Description

가공된 표적 특이적 뉴클레아제{ENGINEERED TARGET SPECIFIC NUCLEASES}

관련된 출원에 대한 교차 참조

본 출원은 2016년 8월 24일자 제출된 U.S. 가출원 번호 62/378,978 및 2017년 1월 9일자 제출된 U.S. 가출원 번호 62/443,981에 우선권을 주장하고, 이들의 개시는 본원에서 전체적으로 참조로서 편입된다.

연방 정부의 후원을 받은 연구 하에 이루어진 발명에 관한 권리의 진술

해당 없음.

기술 분야

본 발명은 폴리펩티드와 유전체 가공 및 상동성 재조합의 분야에 관계한다.

배경

인공 뉴클레아제, 예를 들면, 가공된 아연 핑거 뉴클레아제 (ZFN), 전사-활성인자 유사 작동체 뉴클레아제 (TALEN), RNA 보도된 뉴클레아제로서 또한 지칭되는, 가공된 crRNA/tracr RNA ('단일 안내 RNA')를 갖는 CRISPR/Cas 시스템 및/또는 'TtAgo'로서 알려져 있는, 아르고노트 시스템 (가령, 써무스 써모필러스 (T. thermophilus)로부터)에 근거된 뉴클레아제 (Swarts et al (2014) Nature 507(7491): 258-261)는 개열 도메인과 연관되거나 또는 이들에 작동가능하게 연결된 DNA 결합 도메인 (뉴클레오티드 또는 폴리펩티드)을 포함하고, 그리고 유전체 서열의 표적화된 변경에 이용되었다. 가령, 뉴클레아제는 외인성 서열을 삽입하고, 하나 또는 그 이상의 내인성 유전자를 비활성화시키고, 변경된 유전자 발현 패턴을 갖는 생물체 (가령, 작물) 및 세포주를 창출하고, 기타 등등에 이용되었다. 가령, U.S. 특허 번호 9,255,250; 9,200,266; 9,045,763; 9,005,973; 8,956,828; 8,945,868; 8,703,489; 8,586,526; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,067,317; 7,262,054; 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; U.S. 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983, 20130177960 및 20150056705를 참조한다. 가령, 한 쌍의 뉴클레아제 (가령, 아연 핑거 뉴클레아제, TALEN, dCas-Fok 융합)이 유전체 서열을 개열하는데 이용될 수 있다. 상기 쌍의 각 구성원은 일반적으로, 뉴클레아제의 하나 또는 그 이상의 개열 도메인 (또는 절반-도메인)에 연결된 가공된 (비자연발생) DNA-결합 단백질을 포함한다. DNA-결합 단백질이 그들의 표적 부위에 결합할 때, 이들 DNA 결합 단백질에 연결되는 개열 도메인은 유전체의 이합체화 및 차후 개열이 일어날 수 있도록 배치된다.

일반적으로, 분자간 이온쌍 (염 가교)이 많은 DNA-단백질 상호작용에 필수적이다. 종종, 하전된 아미노산 측쇄 (다시 말하면, -NH3+, =NH2+)는 DNA 중추의 음성으로 하전된 인산염 기와 상호작용하여 염 가교를 형성한다. 이들 이온쌍은 상당히 동적일 수 있고, 그리고 이들 두 이온의 직접적인 쌍짓기 및 용매 (가령, 물 분자)가 이들 두 이온 사이에 삽입될 때 '용매-분리된 이온쌍'인 쌍짓기 사이를 왔다 갔다 할 수 있다 (Chen et al (2015) J Phys Chem Lett 6:2733-2737).

아연 핑거 단백질에 대하여, 표적 DNA 서열에 대한 ZFP의 특이성은 아연 핑거 도메인 및 특정한 DNA 염기 사이에 서열 특이적 접촉에 의존한다. 이에 더하여, 아연 핑거 도메인은 또한, DNA 중추의 인산염과의 비특이적 이온쌍 상호작용에 참가하는 아미노산 잔기를 포함한다. Elrod-Erickson et al ((1996) Structure 4:1171)은 아연 핑거 단백질 및 이의 동계 DNA 표적의 공결정화를 통해, 수소 결합의 형성을 통해 DNA 중추 상에서 인산염과 상호작용할 수 있는 특정한 아미노산이 있다는 것을 증명하였다. 널리 공지된 Zif268 중추를 이용하는 아연 핑거 단백질은 전형적으로, β-시트의 그들의 두 번째 가닥의 아미노 말단 잔기로서 아르기닌을 갖는데, 이것은 또한, 두 번째 불변 시스테인의 카르복실 말단으로 두 번째 위치이다 (도면 5a를 참조한다). 이러한 위치는 각 아연 핑거 도메인 내에서 (-5)로서 지칭될 수 있는데, 그 이유는 이것이 α-나선의 시작에 선행하는 5번째 잔기이기 때문이다 (도면 5a). 이러한 위치에서 아르기닌은 측쇄 구아니디늄 기와의 하전된 수소 결합의 형성을 통해, DNA 중추 상에서 인산염과 상호작용할 수 있다. Zif268 중추에서 아연 핑거 단백질은 또한, 빈번하게 첫 번째 불변 시스테인의 아미노 말단으로 4번째 잔기인 위치에서 리신을 갖는다. 이러한 위치는 각 핑거 내에서 (-14)로서 지칭될 수 있는데, 그 이유는 이것이 아연 배위 시스테인 잔기 사이에 2개 잔기를 갖는 아연 핑거에 대한 α-나선의 시작에 선행하는 14번째 잔기이기 때문이다 (도면 5a). 상기 리신은 측쇄 아미노 기와의 물-매개된 하전된 수소 결합의 형성을 통해 DNA 중추 상에서 인산염과 상호작용할 수 있다. 인산염 기가 DNA 중추에 걸쳐 발견되기 때문에, 아연 핑거 및 DNA 분자 사이에 이러한 유형의 상호작용은 일반적으로, 비-서열 특이적인 것으로 고려된다 (J. Miller, Massachusetts Institute of Technology Ph.D. Thesis, 2002).

최근 연구에서 일부 뉴클레아제에서 비특이적 인산염 접촉 측쇄 역시 이들 뉴클레아제의 비특이적 개열 활성을 어느 정도 설명할 수 있는 것으로 가정되었다 (Kleinstiver et al, (2016) Nature 529(7587):490-5; Guilinger et al (2014) Nat Meth: 429-435). 연구자들은 이들 뉴클레아제가 '과잉 DNA-결합 에너지'를 소유할 수 있다고 제안하였는데, 이것은 이들 뉴클레아제가 그들의 DNA 표적에 대해, 표적 부위에 실제적으로 결합하고 이를 개열하는데 필요한 것보다 더욱 큰 친화성을 가질 수 있다는 것을 의미한다. 따라서, 이들 뉴클레아제의 DNA-결합 에너지를 낮추기 위해 TALE DNA 결합 도메인 (Guilinger, 상게서) 또는 Cas9 DNA 결합 도메인 (Kleinstiver, 상게서)에서 양이온성 전하를 감소시키려는 시도가 있었는데, 이들은 시험관내에서 증가된 개열 특이성을 유발하였다. 하지만, 추가 연구 (Sternberg et al (2015) Nature 527(7576):110-113)는 또한, Cas9 DNA 결합 도메인의 Kleinstiver 연구에서 돌연변이되었던 양이온성 아미노산 중에서 일부에 대한, Cas9 뉴클레아제 도메인의 적절한 접힘과 활성화에서 역할을 암시하였다. 따라서, Cas9 활성에서 이들 아미노산의 정확한 역할은 알려져 있지 않다.

서열-선택적 (인공) 뉴클레아제에 의한 최적 개열 특이성을 위해, 온 표적 (on-target) 결합 및 활성이 포화되지 않도록 조건을 마련하는 것이 바람직하다. 포화 조건 하에 - 정의에 의해 - 완전한 온 표적 활성을 달성하는데 필요한 것보다 과잉의 뉴클레아제가 이용된다. 이러한 과잉은 어떤 온 표적 유익성도 제공하지 않고, 오히려 오프 표적 (off-target) 부위에서 증가된 개열을 유발할 수 있다. 단위체성 뉴클레아제의 경우에, 포화 조건은 적정 곡선에서 포화 안정기를 확인하고 방지하기 위한 단순한 용량 반응 연구를 수행함으로써 쉽게 회피될 수 있다. 하지만, 이합체성 뉴클레아제, 예를 들면, ZFN, TALEN 또는 dCas-Fok의 경우에, 개별 단위체의 결합 친화성이 상이하면, 포화 조건을 확인하고 방지하는 것이 더욱 복합적일 수 있다. 이런 경우에, 단순한 1:1 뉴클레아제 비율을 이용한 용량 반응 연구는 단지, 더욱 약한 결합 단위체의 포화점만을 드러낼 것이다. 이런 시나리오 하에, 만약 예로서, 단위체 친화성이 10의 인자로 상이하면, 1:1 적정 연구에서 확인된 포화점에서 더욱 높은 친화성 단위체는 이것이 필요한 농도보다 10-배 높은 농도에서 존재할 것이다. 더욱 높은 친화성 단위체의 결과적인 과잉은 의도된 표적에서 개열에서 어떤 유익한 증가도 제공하지 못하면서 증가된 오프 표적 활성을 차례로 야기하고, 소정의 뉴클레아제 쌍에 대한 전반적으로 감소된 특이성을 잠재적으로 야기할 수 있다.

오프 표적 개열 사건을 감소시키기 위해, 가공된 절대 이형이합체성 개열 절반-도메인이 개발되었다. 가령, U.S. 특허 번호 7,914,796; 8,034,598; 8,961,281 및 8,623,618; U.S. 특허 공개 번호 20080131962 및 20120040398을 참조한다. 이들 절대 이형이합체는 이합체화하고, 그리고 다른 가공된 개열 도메인이 ZFP에 의해 적절한 표적 부위에서 배치될 때에만 그들의 표적을 개열하고, 따라서 단위체성 오프 표적 개열을 감소시키고 및/또는 제거한다.

하지만, 오프 표적 개열 활성을 감소시키기 위해, 가공된 뉴클레아제 개열 시스템에 대한 추가 방법 및 조성물이 여전히 요구된다.

요약

본 발명은 오프 표적 부위로서 또한 알려져 있는 다른 의도하지 않은 개열 부위에 비하여 의도된 표적에 대한 뉴클레아제 (가령, 뉴클레아제 쌍)의 특이성을 증가시키기 위한 방법 및 조성물을 제공한다. 따라서, DNA 결합 도메인 영역 (가령, 아연 핑거 단백질 또는 TALE의 중추) 중에서 하나 또는 그 이상에서 돌연변이 및/또는 FokI 뉴클레아제 개열 도메인 또는 개열 절반 도메인에서 하나 또는 그 이상의 돌연변이를 포함하는 인공 뉴클레아제 (가령, 아연 핑거 뉴클레아제 (ZFN), TALEN, CRISPR/Cas 뉴클레아제)가 본원에서 설명된다. 이들 신규한 뉴클레아제 (가령, ZFN, TALEN 등)을 이용함으로써 및/또는 뉴클레아제 복합체의 가공된 개열 절반-도메인 파트너의 독립된 적정을 통해, 개열 활성의 특이성을 증가시키는 방법이 본원에서 더욱 설명된다. 개별적으로 또는 조합으로 이용될 때, 본 발명의 방법 및 조성물은 오프 표적 개열 활성에서 감소를 통해 표적화 특이성에서 놀랍고 예상치 못한 증가를 제공한다. 본 발명은 또한, 관심 영역에서 세포 염색질의 표적화된 개열 및/또는 세포 내에 미리 결정된 관심 영역에서 표적화된 통합을 통한 도입유전자의 통합을 위해 이들 조성물을 이용하는 방법을 제공한다.

따라서, 한 양상에서, 이들 돌연변이체가 유래되는 부모 (가령, 야생형) 개열 도메인과 비교하여 하나 또는 그 이상의 돌연변이를 포함하는 가공된 뉴클레아제 개열 절반 도메인이 본원에서 설명된다. 일정한 구체예에서, 하나 또는 그 이상의 돌연변이는 서로 및 다른 돌연변이체 (가령, 이합체화 및/또는 촉매 도메인 돌연변이체뿐만 아니라 틈내기효소 돌연변이)와 이들 돌연변이체의 임의의 조합을 비롯하여, 첨부된 표 및 도면 중에서 어느 것에서 도시된 돌연변이 중에서 하나 또는 그 이상이다. 본원에서 설명된 바와 같은 돌연변이는 개열 도메인의 전하를 변화시키는 돌연변이, 예를 들면, 양성으로 하전된 잔기의 비-양성으로 하전된 잔기로의 돌연변이 (가령, K 및 R 잔기 (가령, S로 돌연변이됨); N 잔기 (가령, D로) 및 Q 잔기 (가령, E로)의 돌연변이; 분자 모형화에 근거하여 DNA 중추에 가까울 것으로 예측되고 FokI 동족체에서 변이를 보여주는 잔기로의 돌연변이 (도면 1 및 17); 및/또는 다른 잔기에서 돌연변이를 포함하지만 이들에 한정되지 않는다 (가령, U.S. 특허 번호 8,623,618 및 Guo et al, (2010) J. Mol. Biol. 400(1):96-107).

가장 유망한 돌연변이는 두 번째 규준을 이용하여 밝혀졌다. 초기 유망한 돌연변이는 FokI가 DNA에 결합될 때, DNA 중추에 가까울 것으로 예측되는 양성으로 하전된 잔기이었다. 본원에서 설명된 개열 도메인은 본원에서 설명된 돌연변이 중에서 1개, 2개, 3개, 4개, 5개 또는 그 이상을 포함할 수 있고, 그리고 추가 공지된 돌연변이를 더욱 포함할 수 있다. 이런 이유로, 본 발명의 돌연변이는 단독으로 이용될 때, U.S. 특허 번호 8,623,618에서 개시된 특정한 돌연변이 (가령, N527D, S418P, K448M, Q531R 등)를 포함하지 않는다; 하지만, U.S. 특허 번호 8,623,618의 돌연변이체와 조합으로 이용될 수 있는 신규한 돌연변이체가 여기에서 제공된다. 이합체 쌍 내에 촉매성 뉴클레아제 도메인 중에서 한 가지가 이것을 촉매적으로 비활성이 되도록 만드는 하나 또는 그 이상의 돌연변이를 포함하는 틈내기효소 돌연변이체 (U.S. 특허 번호 8,703,489; 9,200,266; 및 9,631,186을 참조한다) 역시 본원에서 설명된 돌연변이체 중에서 한 가지와 조합으로 이용될 수 있다. 틈내기효소는 ZFN 틈내기효소, TALEN 틈내기효소 및 CRISPR/dCas 시스템일 수 있다.

일정한 구체예에서, 가공된 개열 절반 도메인은 FokI 또는 FokI 동족체로부터 유래되고, 그리고 서열 번호:1에서 도시된 바와 같은 야생형 전장 FokI에 상대적으로 넘버링된 아미노산 잔기 416, 422, 447, 448 및/또는 525, 또는 FokI 동족체에서 상응하는 잔기 중에서 하나 또는 그 이상에서 돌연변이를 포함한다 (도면 17을 참조한다). 다른 구체예에서, FokI로부터 유래된 개열 절반 도메인은 387, 393, 394, 398, 400, 416, 418, 422, 427, 434, 439, 441, 442, 444, 446, 448, 472, 473, 476, 478, 479, 480, 481, 487, 495, 497, 506, 516, 523, 525, 527, 529, 534, 559, 569, 570 및/또는 571 중에서 하나 또는 그 이상을 비롯하여, 아미노산 잔기 414-426, 443-450, 467-488, 501-502 및/또는 521-531 중에서 하나 또는 그 이상에서 돌연변이를 포함한다. 이들 돌연변이는 상응하는 위치에서 FokI에 상동한 자연 제한 효소에서 발견되는 잔기로의 돌연변이를 포함할 수 있다 (도면 17). 일정한 구체예에서, 돌연변이는 치환, 예를 들면, 야생형 잔기의 임의의 상이한 아미노산, 예를 들면, 알라닌 (A), 시스테인 (C), 아스파르트산 (D), 글루타민산 (E), 히스티딘 (H), 페닐알라닌 (F), 글리신 (G), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T)으로 치환이다. 첨부된 표 및 도면에서 도시된 것들을 포함하지만 이들에 한정되지 않는 돌연변이체의 임의의 조합이 예기된다. 일정한 구체예에서, FokI 뉴클레아제 도메인은 416, 422, 447, 479 및/또는 525 (야생형, 서열 번호:1에 상대적으로 넘버링됨) 중에서 하나 또는 그 이상에서 돌연변이를 포함한다. 뉴클레아제 도메인은 또한, ELD, KKR, ELE, KKS를 포함하지만 이들에 한정되지 않는, 위치 418, 432, 441, 448, 476, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및 559에서 하나 또는 그 이상의 돌연변이를 포함할 수 있다. 가령, U.S. 특허 번호 8,623,618을 참조한다. 또 다른 추가의 구체예에서, 개열 도메인은 표 15에서 도시된 잔기 (가령, 419, 420, 425, 446, 447, 470, 471, 472, 475, 478, 480, 492, 500, 502, 521, 523, 526, 530, 536, 540, 545, 573 및/또는 574) 중에서 하나 또는 그 이상에서 돌연변이를 포함한다. 일정한 구체예에서, 본원에서 설명된 변이체 개열 도메인은 뉴클레아제 이합체화 (이합체화 도메인 돌연변이) 및 하나 또는 그 이상의 추가 돌연변이에 관련된 잔기로의 돌연변이; 예를 들면, 인산염 접촉 잔기로의 돌연변이: 가령, 이합체화 도메인의 외부에서 아미노산 위치에서, 예를 들면, 인산염 접촉에 참여할 수 있는 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개 또는 그 이상의 돌연변이와 조합으로 이합체화 돌연변이체 (가령, ELD, KKR, ELE, KKS 등)를 포함한다. 바람직한 구체예에서, 위치 416, 422, 447, 448 및/또는 525에서 돌연변이는 하전되지 않은 또는 음성으로 하전된 아미노산으로 양성으로 하전된 아미노산의 대체를 포함한다. 다른 구체예에서, 위치 446, 472 및/또는 478 (및 임의선택적으로, 예로서 이합체화 또는 촉매 도메인에서 추가 잔기)에서 돌연변이가 만들어진다.

다른 구체예에서, 가공된 개열 절반 도메인은 본원에서 설명된 돌연변이에 더하여, 이합체화 도메인, 예를 들면, 아미노산 잔기 490, 537, 538, 499, 496 및 486에서 돌연변이를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 본원에서 설명된 하나 또는 그 이상의 돌연변이에 더하여, 위치 486에서 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되고, 그리고 위치 496에서 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 폴리펩티드 ("ELD" 또는 "ELE")를 포함한다. 다른 구체예에서, 가공된 개열 절반 도메인은 야생형 FokI 또는 FokI 동족체 개열 절반 도메인으로부터 유래되고, 그리고 아미노산 잔기 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 야생형 FokI (서열 번호:1)에 상대적으로 넘버링된 아미노산 잔기 490, 538 및 537에서 돌연변이를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 본원에서 설명된 하나 또는 그 이상의 돌연변이에 더하여, 위치 490에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되고, 그리고 위치 537에서 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 폴리펩티드 ("KKK" 또는 "KKR")를 포함한다 (본원에서 참조로서 편입되는 U.S. 특허 8,962,281을 참조한다).

다른 구체예에서, 가공된 개열 절반 도메인은 야생형 FokI 개열 절반 도메인 또는 이의 동족체로부터 유래되고, 그리고 아미노산 잔기 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 야생형 FokI에 상대적으로 넘버링된 아미노산 잔기 490 및 538에서 돌연변이를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 490에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 그리고 위치 538에서 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되는 폴리펩티드 ("KK")를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 486에서 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 그리고 위치 499에서 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되는 폴리펩티드 ("EL")를 포함한다 (본원에서 참조로서 편입된 U.S. 특허 8,034,598을 참조한다).

한 양상에서, 본 발명은 융합 분자를 제공하는데, 여기서 가공된 개열 절반-도메인은 FokI 촉매 도메인 내에 위치 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 446, 447, 448, 469, 472, 478, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 중에서 하나 또는 그 이상에서 야생형 아미노산 잔기가 돌연변이되는 폴리펩티드를 포함한다. 일부 구체예에서, 하나 또는 그 이상의 돌연변이는 야생형 아미노산을 양성으로 하전된 잔기로부터 중성 잔기 또는 음성으로 하전된 잔기로 변경한다. 이들 구체예 중에서 한 가지에서, 설명된 돌연변이체는 또한, 하나 또는 그 이상의 추가 돌연변이를 포함하는 FokI 도메인에서 만들어질 수 있다. 바람직한 구체예에서, 이들 추가 돌연변이는 이합체화 도메인 내에, 예를 들면, 위치 499, 496, 486, 490, 538 및 537에서 존재한다. 돌연변이는 하나 또는 그 이상의 아미노산 잔기의 치환, 삽입 및/또는 결실을 포함한다.

또 다른 양상에서, 전술된 가공된 개열 절반 도메인 중에서 한 가지는 예로서, 이들을 아연 핑거 뉴클레아제, TALEN, CRISPR/Cas 뉴클레아제 등을 포함하지만 이들에 한정되지 않는 DNA-결합 도메인과 연관시킴으로써, 인공 뉴클레아제 내로 통합될 수 있다. 아연 핑거 뉴클레아제의 아연 핑거 단백질은 비정준 아연-배위 잔기를 포함할 수 있다 (가령, 정준 C2H2 형상보다는 CCHC, 미국 특허 9,234,187을 참조한다).

다른 양상에서, 인공 뉴클레아제를 생산하는, 본원에서 설명된 바와 같은 DNA 결합 도메인 및 가공된 FokI 또는 이의 동족체 개열 절반-도메인을 포함하는 융합 분자가 제공된다. 일정한 구체예에서, 융합 분자의 DNA-결합 도메인은 아연 핑거 결합 도메인 (가령, 가공된 아연 핑거 결합 도메인)이다. 다른 구체예에서, DNA-결합 도메인은 TALE DNA-결합 도메인이다. 또 다른 추가의 구체예에서, DNA 결합 도메인은 DNA 결합 분자 (가령, 안내 RNA) 및 촉매적으로 비활성 Cas9 또는 Cfp1 단백질 (dCas9 또는 dCfp1)을 포함한다. 일부 구체예에서, 가공된 융합 분자는 이합체성 뉴클레아제가 이중 가닥 DNA 분자의 단지 하나의 가닥만을 개열하여 틈내기효소를 형성할 수 있도록, 촉매적으로 비활성 가공된 개열 절반-도메인과 뉴클레아제 복합체를 형성한다 (U.S. 특허 9,200,266을 참조한다).

본 발명의 방법 및 조성물은 또한, DNA 중추 상에서 인산염과 비특이적으로 상호작용할 수 있는 표적 서열의 뉴클레오티드를 인식하는 잔기 외부에 DNA 결합 도메인 내에서 하나 또는 그 이상의 아미노산에 돌연변이 (가령, 'ZFP 중추' (DNA 인식 나선 영역의 외부) 또는 'TALE 중추' (RVD의 외부)에 하나 또는 그 이상의 돌연변이)를 포함한다. 따라서, 일정한 구체예에서, 본 발명은 뉴클레오티드 표적 특이성을 위해 필요하지 않은, ZFP 중추 내에 양이온성 아미노산 잔기의 돌연변이를 포함한다. 일부 구체예에서, ZFP 중추에서 이들 돌연변이는 양이온성 아미노산 잔기를 중성 또는 음이온성 아미노산 잔기로 돌연변이시키는 것을 포함한다. 일부 구체예에서, ZFP 중추에서 이들 돌연변이는 극성 아미노산 잔기를 중성 또는 비극성 아미노산 잔기로 돌연변이시키는 것을 포함한다. 바람직한 구체예에서, 돌연변이는 DNA 결합 나선에 상대적인 위치 (-5), (-9) 및/또는 위치 (-14)에서 만들어진다. 일부 구체예에서, 아연 핑거는 (-5), (-9) 및/또는 (-14)에서 하나 또는 그 이상의 돌연변이를 포함할 수 있다. 추가 구체예에서, 멀티-핑거 아연 핑거 단백질에서 하나 또는 그 이상의 아연 핑거는 (-5), (-9) 및/또는 (-14)에서 돌연변이를 포함할 수 있다. 일부 구체예에서, (-5), (-9) 및/또는 (-14)에서 아미노산 (가령, 아르기닌 (R) 또는 리신 (K))은 알라닌 (A), 류신 (L), Ser (S), Asp (N), Glu (E), Tyr (Y) 및/또는 글루타민 (Q)으로 돌연변이된다.

다른 양상에서, 본원에서 설명된 바와 같은 가공된 개열 절반-도메인 또는 융합 단백질 중에서 한 가지를 인코딩하는 폴리뉴클레오티드가 제공된다.

또 다른 양상에서, 본원에서 설명된 바와 같은 뉴클레아제, 폴리펩티드 (가령, 융합 분자 또는 융합 폴리펩티드) 및/또는 폴리뉴클레오티드 중에서 한 가지를 포함하는 세포 역시 제공된다. 한 구체예에서, 세포는 한 쌍의 융합 폴리펩티드를 포함하고, 하나의 융합 폴리펩티드는 아미노산 잔기 393, 394, 398, 416, 421, 422, 442, 444, 447, 448, 473, 480, 530 및/또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, ELD 또는 ELE 개열 절반-도메인을 포함하고, 그리고 다른 하나의 융합 폴리펩티드는 잔기 393, 394, 398, 416, 421, 422, 442, 444, 446, 447, 448, 472, 473, 478, 480, 530 및/또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, KKK 또는 KKR 개열 절반-도메인을 포함한다 (U.S. 특허 8,962,281을 참조한다).

본원에서 설명된 이들 융합 폴리펩티드 중에서 한 가지에서, ZFP 파트너는 아연 핑거 DNA 결합 도메인 내에 (-5), (-9) 및/또는 (-14) 위치에서 돌연변이를 더욱 포함할 수 있다. 일부 구체예에서, 위치 -5에서 Arg (R)는 Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q), 또는 Ala (A)로 변화된다. 다른 구체예에서, 위치 (-9)에서 Arg (R)는 Ser (S), Asp (N), 또는 Glu (E)로 대체된다. 추가 구체예에서, 위치 (-14)에서 Arg (R)는 Ser (S) 또는 Gln (Q)으로 대체된다. 다른 구체예에서, 융합 폴리펩티드는 아연 핑거 DNA 결합 도메인에서 돌연변이를 포함할 수 있는데, 여기서 (-5), (-9) 및/또는 (-14) 위치에서 아미노산이 임의의 조합에서 상기 열거된 아미노산 중에서 한 가지로 변화된다.

본 발명의 폴리펩티드 및/또는 폴리뉴클레오티드에 의해 변형된 세포 역시 본원에서 제공된다. 일부 구체예에서, 세포는 도입유전자의 뉴클레아제-매개된 삽입, 또는 유전자의 뉴클레아제-매개된 녹아웃을 포함한다. 변형된 세포, 그리고 이들 변형된 세포로부터 유래된 임의의 세포는 본 발명의 뉴클레아제를 반드시 일시적으로보다 많이 포함하는 것은 아니지만, 이런 뉴클레아제에 의해 매개된 유전체 변형이 남아있다.

또 다른 양상에서, 관심 영역에서 세포 염색질의 표적화된 개열을 위한 방법; 상동성 재조합이 세포에서 일어나도록 유발하는 방법; 감염을 치료하는 방법; 및/또는 질환을 치료하는 방법이 제공된다. 이들 방법은 시험관내, 탈체 또는 생체내 또는 이들의 조합에서 실시될 수 있다. 이들 방법은 본원에서 설명된 바와 같은 한 쌍의 융합 폴리펩티드 (다시 말하면, 어느 한쪽 또는 양쪽 융합 폴리펩티드(들)가 본원에서 설명된 바와 같은 가공된 개열 절반-도메인을 포함하는 한 쌍의 융합 폴리펩티드)를 발현함으로써, 세포 내에 미리 결정된 관심 영역에서 세포 염색질을 개열하는 것을 수반한다. 일정한 구체예에서, 온 표적 부위의 표적화된 개열은 본원에서 설명된 바와 같은 돌연변이가 없는 개열 도메인과 비교하여, 50%-60% (또는 이들 사이에 임의의 값), 60%-70% (또는 이들 사이에 임의의 값), 70%-80% (또는 이들 사이에 임의의 값), 80%-90% (또는 이들 사이에 임의의 값), 90% 내지 200% (또는 이들 사이에 임의의 값)를 비롯하여, 최소한 50 내지 200% (또는 이들 사이에 임의의 값) 또는 그 이상 증가된다. 유사하게, 본원에서 설명된 바와 같은 방법 및 조성물을 이용하여, 오프 표적 부위 개열은 1-50-배 (또는 이들 사이에 임의의 값)를 포함하지만 이들에 한정되지 않는 1-100배 또는 그 이상 감소된다.

본원에서 설명된 가공된 개열 절반 도메인은 관심 영역에서 세포 염색질의 표적화된 개열 및/또는 세포 내에 미리 결정된 관심 영역에서 상동성 재조합을 위한 방법에서 이용될 수 있다. 세포는 배양된 세포, 세포주, 생물체 내에 세포, 세포 및/또는 이들의 후손이 처리 후 생물체로 복귀되는 경우에 처리를 위해 생물체로부터 이전된 세포, 그리고 생물체로부터 이전되고, 본 발명의 융합 분자를 이용하여 변형되고, 이후 치료 방법 (세포 요법)에서 생물체로 복귀된 세포를 포함한다. 세포 염색질 내에 관심 영역은 예로서, 유전체 서열 또는 이의 일부일 수 있다. 조성물은 설명된 바와 같은 DNA 결합 분자 (가령, 가공된 아연 핑거 또는 TALE 결합 도메인 또는 가공된 CRISPR 안내 RNA) 및 개열 절반 도메인을 포함하는 융합 분자, 또는 융합 분자를 인코딩하는 폴리뉴클레오티드를 포함한다.

융합 분자는 예로서, 융합 분자를 폴리펩티드로서 세포에 전달함으로써, 또는 융합 분자를 인코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 세포에서 발현될 수 있는데, 여기서 상기 폴리뉴클레오티드는 DNA이면, 전사되고 번역되어 융합 분자를 산출한다. 게다가, 폴리뉴클레오티드가 융합 분자를 인코딩하는 mRNA이면, 상기 mRNA의 세포로의 전달 이후에, 상기 mRNA는 번역되고, 따라서 융합 분자를 산출한다.

본 발명의 다른 양상에서, 가공된 뉴클레아제 특이성을 증가시키기 위한 방법 및 조성물이 제공된다. 한 양상에서, 오프 표적 개열 활성을 감소시킴으로써 전반적인 온 표적 개열 특이성을 증가시키기 위한 방법이 제공된다. 일부 구체예에서, 가공된 뉴클레아제 복합체의 가공된 개열 절반-도메인 파트너가 세포에 접촉하는데 이용되는데, 여기서 상기 복합체의 각 파트너는 1 대 1 이외에, 다른 파트너에 대한 비율에서 제공된다. 일부 구체예에서, 이들 두 파트너 (절반 개열 도메인)의 비율은 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율, 또는 이들 사이에 임의의 값에서 제공된다. 다른 구체예에서, 이들 두 파트너의 비율은 1:30보다 크다. 다른 구체예에서, 이들 두 파트너는 1:1과 상이하도록 선택되는 비율에서 배치된다. 일부 양상에서, 각 파트너는 mRNA로서 세포로 전달되거나, 또는 바이러스 또는 비바이러스 벡터에 담겨 전달되는데, 여기서 각 파트너를 인코딩하는 상이한 양의 mRNA 또는 벡터가 전달된다. 추가 구체예에서, 뉴클레아제 복합체의 각 파트너는 단일 바이러스 또는 비바이러스 벡터에서 포함될 수 있지만, 한쪽 파트너가 다른 파트너보다 더욱 높은 또는 더욱 낮은 값으로 발현되어, 1 대 1이 아닌 비율의 개열 절반 도메인이 세포로 궁극적으로 전달되도록 신중하게 발현된다. 일부 구체예에서, 각 개열 절반 도메인은 상이한 발현 효율을 갖는 상이한 프로모터를 이용하여 발현된다. 다른 구체예에서, 2개의 개열 도메인은 바이러스 또는 비바이러스 벡터를 이용하여 세포로 전달되는데, 여기서 둘 모두 동일한 개방 해독틀로부터 발현되지만, 이들 두 파트너를 인코딩하는 유전자는 이들 두 파트너의 비율이 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율, 또는 이들 사이에 임의의 값이 되도록, 3' 파트너가 더욱 낮은 비율에서 발현되도록 유발하는 서열 (가령, 자가-개열 2A 서열 또는 IRES)에 의해 분리된다. 다른 구체예에서, 이들 두 파트너는 1:1과 상이하도록 선택되는 비율에서 배치된다.

2개 또는 그 이상의 뉴클레아제 복합체가 이용될 때, 오프 표적 뉴클레아제 활성을 감소시키는 방법 역시 제공된다. 가령, 본 발명은 2개 또는 그 이상의 뉴클레아제 복합체가 이용될 때, DNA 결합 분자의 비율을 변화시키기 위한 방법을 제공한다. 일부 구체예에서, DNA 결합 분자는 폴리펩티드 DNA 결합 도메인 (가령, ZFN, TALEN, dCas-Fok, 메가TAL, 메가뉴클레아제)이고, 반면 다른 구체예에서, DNA 결합 분자는 RNA-안내된 뉴클레아제용 안내 RNA이다. 바람직한 구체예에서, 2개 또는 그 이상의 DNA 결합 분자의 비율은 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율, 또는 이들 사이에 임의의 값이다. 다른 구체예에서, 2개의 DNA 결합 분자는 1:1과 상이하도록 선택되는 비율에서 배치된다. 일부 양상에서, 비-1:1 비율은 세포를 형질감염시키는데 이용된 안내 RNA의 비율을 변경함으로써 달성된다. 다른 양상에서, 상기 비율은 관심되는 세포를 처리하는데 이용된 각 Cas9 단백질-안내 RNA 복합체의 비율을 변화시킴으로써 변경된다. 다른 추가의 양상에서, 변경된 비율은 세포의 처리를 위한 안내 RNA (바이러스 또는 비바이러스)를 인코딩하는 DNA의 다른 비율을 이용함으로써, 또는 세포 내부에서 DNA 결합 분자를 차별적으로 발현하는 상이한 발현 강도를 갖는 프로모터를 이용함으로써 달성된다. 오프 표적 사건은 최소한 10, 50, 60, 70, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000-배 (또는 이들 사이에 임의의 값) 또는 그 이상 감소를 포함하지만 이들에 한정되지 않는 2 내지 1000-배 (또는 이들 사이에 임의의 양) 또는 그 이상 감소될 수 있다.

따라서, 다른 양상에서, 관심 영역에서 세포 염색질을 개열하기 위한 방법은 다음을 포함할 수 있다: (a) 관심 영역에서 첫 번째 서열을 선별하고; (b) 첫 번째 서열에 특이적으로 결합하는 첫 번째 DNA-결합 분자를 가공하고; (c) 첫 번째 융합 분자를 세포에서 발현하고, 상기 첫 번째 융합 분자는 첫 번째 DNA-결합 분자 (가령, 아연 핑거, TALE, sgRNA) 및 개열 도메인 (또는 절반-도메인)을 포함하고; 그리고 (d) 두 번째 융합 단백질을 세포에서 발현하고, 상기 두 번째 융합 분자는 두 번째 DNA-결합 도메인 및 두 번째 개열 도메인 (또는 절반-도메인)을 포함하고, 여기서 이들 융합 분자 중에서 최소한 하나는 본원에서 설명된 바와 같은 링커를 포함하고, 그리고 더 나아가 여기서 첫 번째 융합 분자는 첫 번째 서열에 결합하고 두 번째 융합 분자는 첫 번째 서열로부터 2 및 50개 뉴클레오티드 사이에 위치된 두 번째 서열에 결합하고, 따라서 활성 뉴클레아제 복합체가 형성될 수 있고, 그리고 세포 염색질이 관심 영역에서 개열된다. 일정한 구체예에서, 양쪽 융합 분자는 DNA 결합 도메인 및 촉매성 뉴클레아제 도메인 사이에 본원에서 설명된 바와 같은 링커를 포함한다.

예로서, 표적화된 돌연변이를 도입하기 위해 세포 염색질의 영역을 변경하는 방법 역시 제공된다. 일정한 구체예에서, 세포 염색질을 변경하는 방법은 세포 염색질 내에 미리 결정된 부위에서 이중 가닥 절단을 창출하기 위한 하나 또는 그 이상의 표적화된 뉴클레아제 및 절단의 영역에서 세포 염색질의 뉴클레오티드 서열에 상동성을 갖는 공여자 폴리뉴클레오티드를 세포 내로 도입하는 것을 포함한다. 세포 DNA 수복 과정은 이중 가닥 절단의 존재에 의해 활성화되고, 그리고 공여자 폴리뉴클레오티드는 절단의 수복을 위한 주형으로서 이용되고, 공여자의 뉴클레오티드 서열 중에서 전부 또는 일부의 세포 염색질 내로의 도입을 유발한다. 따라서, 세포 염색질 내에 서열이 변경될 수 있고, 그리고 일정한 구체예에서, 공여자 폴리뉴클레오티드 내에 존재하는 서열로 전환될 수 있다.

표적화된 변경은 점 돌연변이 (다시 말하면, 단일 염기쌍의 상이한 염기쌍으로의 전환), 치환 (다시 말하면, 복수의 염기쌍의 동일한 길이의 상이한 서열로의 전환), 하나 또는 그 이상의 염기쌍의 삽입, 하나 또는 그 이상의 염기쌍의 결실, 그리고 전술한 서열 변경의 임의의 조합을 포함하지만 이들에 한정되지 않는다. 변경은 또한, 인코딩된 아미노산이 변경되도록 코딩 서열의 일부인 염기쌍의 전환을 포함할 수 있다.

공여자 폴리뉴클레오티드는 DNA 또는 RNA일 수 있고, 선형 또는 환상일 수 있고, 그리고 단일 가닥 또는 이중 가닥일 수 있다. 이것은 나신 핵산으로서 세포로 전달되거나, 하나 또는 그 이상의 전달 작용제 (가령, 리포솜, 나노입자, 폴록사머)와의 복합체로서 세포로 전달되거나, 또는 바이러스 전달 수송체, 예를 들면, 예로서, 아데노바이러스, 렌티바이러스 또는 아데노 연관된 바이러스 (AAV)에서 내포될 수 있다. 공여자 서열은 길이에서 10 내지 1,000개 뉴클레오티드 (또는 이들 사이에 뉴클레오티드의 임의의 정수 값) 또는 그 이상의 범위에서 변할 수 있다. 일부 구체예에서, 공여자는 표적화된 개열 부위와 상동성 영역에 의해 측면에서 접하는 전장 유전자를 포함한다. 일부 구체예에서, 공여자는 상동성 영역을 결여하고, 그리고 상동성 독립된 기전 (다시 말하면, NHEJ)을 통해 표적 좌위 내로 통합된다. 다른 구체예에서, 공여자는 세포에서 이용 (다시 말하면, 유전자 교정)을 위해 상동성 영역과 측면에서 접하는 핵산의 더욱 작은 조각을 포함한다. 일부 구체예에서, 공여자는 기능적 또는 구조적 성분, 예를 들면, shRNA, RNAi, miRNA 또는 기타 유사한 것을 인코딩하는 유전자를 포함한다. 다른 구체예에서, 공여자는 관심되는 유전자에 결합하고 및/또는 이의 발현을 조정하는 조절 요소를 인코딩하는 서열을 포함한다. 다른 구체예에서, 공여자는 관심되는 유전자에 결합하고 및/또는 이의 발현을 조정하는 관심되는 조절 단백질 (가령, ZFP TF, TALE TF 또는 CRISPR/Cas TF)이다.

전술한 방법 중에서 한 가지에서, 세포 염색질은 염색체, 에피솜 또는 세포소기관 유전체 내에 있을 수 있다. 세포 염색질은 원핵 및 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유류 세포, 영장류 세포 및 인간 세포를 포함하지만 이들에 한정되지 않는 임의의 유형의 세포 내에 존재할 수 있다.

또 다른 양상에서, 본원에서 설명된 바와 같은 폴리펩티드 (가령, 융합 분자) 및/또는 폴리뉴클레오티드 중에서 한 가지를 포함하는 세포 역시 제공된다. 한 구체예에서, 세포는 한 쌍의 융합 분자를 포함하는데, 이들은 각각 본원에서 개시된 바와 같은 개열 도메인을 포함한다. 세포는 배양된 세포, 생물체 내에 세포, 그리고 세포 및/또는 이들의 후손이 처리 후 생물체로 복귀되는 경우에 처리를 위해 생물체로부터 이전된 세포를 포함한다. 세포 염색질 내에 관심 영역은 예로서, 유전체 서열 또는 이의 일부일 수 있다.

다른 양상에서, 본원에서 설명된 바와 같은 융합 단백질, 또는 본원에서 설명된 바와 같은 하나 또는 그 이상의 아연 핑거 단백질, 개열 도메인 및/또는 융합 단백질을 인코딩하는 폴리뉴클레오티드; 보조적인 시약; 그리고 임의선택적으로 사용설명서 및 적합한 용기를 포함하는 키트가 본원에서 설명된다. 키트는 또한, 하나 또는 그 이상의 뉴클레아제 또는 이런 뉴클레아제를 인코딩하는 폴리뉴클레오티드를 포함할 수 있다.

이런 저런 양상은 전체적인 개시에 비추어 당업자에게 쉽게 명확할 것이다.

도면의 간단한 설명
도면 1은 야생형 FokI 뉴클레아제의 일부의 아미노산 서열 (서열 번호:1) 및 뉴클레오티드 서열 (서열 번호:2)을 묘사한다. 상기 서열은 FokI 촉매성 뉴클레아제 도메인을 보여주고, 그리고 넘버링은 결정 구조 1FOK.pdb 및 2FOK.pdb (Wah 상게서)를 산출하는데 이용된 야생형 FokI 단백질에 상대적이다 (뉴클레아제 도메인의 아미노산 Q는 384에서 시작된다). 상자모양 위치는 가능한 돌연변이 부위를 표시한다.
도면 2a 내지 2c는 DNA 분자와 상호작용하는 FokI 도메인의 모형을 보여주는 계통도이다. 도면 2a는 아미노산 R422, R416 및 K525의 위치를 표시한다. 도면 2b는 아미노산 R447, K448 및 R422의 위치를 표시한다. 도면 2c는 아연 핑거 중추 내에서 1, 2 또는 3개 (각각, 1x, 2x 또는 3x) 돌연변이 (R -> Q 또는 R -> L)를 통합하여 만들어질 수 있는 다양한 유형의 ZFN의 부분집합을 보여주는 도해이다. 흑색 화살표는 이들 돌연변이의 위치를 표시한다.
도면 3a 및 3b는 본원에서 설명된 신규한 FokI 돌연변이를 보유하는 BCL11A-특이적 ZFN의 활성을 보여준다. 도면 3a는 BCL11A 동계 표적 (독특한 '번호판' 식별자 PRJIYLFN, 서열 번호:13으로 표시됨) 및 '번호판' 식별자 NIFMAEVG (서열 번호:14)와 PEVYOHIU (서열 번호:20)에 의해 또한 확인되는 2개의 오프 표적 부위에 대비하여 BCL11A-특이적 ZFN SBS#51857-ELD/SBS#51949-KKR에 대한 CD34+ 세포에서 표적화된 변형을 보여준다. ZFP는 PCT/US2016/032049에서 설명된다. 모든 실험은 뉴클레아제 전달을 위해 2μg의 각 ZFN mRNA로 행위되었고, 그리고 값은 뉴클레아제 활성과 일치하는 삽입 및 결실을 내포하는 서열 리드의 백분율 (% 삽입-결실)을 나타낸다. 도면 3a는 세린 잔기가 어느 한쪽 또는 양쪽 ZFN 내에 FokI 도메인의 위치 416, 422, 447, 448 및 525 내로 치환되었을 때, 결과를 보여준다. 도면 3b는 이형이합체성 이합체화 도메인 FokI 중추가 변경되었다는 점을 제외하고, 유사한 데이터 세트를 보여준다, 다시 말하면, 도면 3a는 쌍 SBS#51857-ELD/SBS#51949-KKR에서 돌연변이를 이용한 결과를 보여주고, 반면 도면 3b는 쌍 SBS#51857-KKR/SBS#51949-ELD에서 돌연변이를 이용한 결과를 보여준다.
도면 4는 다수의 TCRA (TRAC로서 또한 알려져 있는, 표적화된 불변 영역)-특이적 ZFN FokI 변이체에 대한 온 표적 활성 및 오프 표적 활성을 묘사하는 플롯이다 (PCT 공개 WO2017106528). 부모 ZFN 쌍의 2개 복제물을 제외하고, 이들 2가지 ZFN 중에서 한 가지에서 FokI 도메인은 양성으로 하전된 잔기에서 돌연변이를 보유한다. FokI 내에 돌연변이된 잔기의 알파 탄소 및 ZFN-DNA 분자 모형의 DNA 중추 내에 가장 가까운 인산염 산소 사이에 거리 (Miller et al (2007) Nat Biotech 25(7):778-785)가 계산되었고, 그리고 데이터 포인트가 이러한 계산된 거리에 근거하여 컬러-코딩된다 (각각, <10 옹스트롬: 회색; >10 옹스트롬: 흑색). 각 데이터 포인트는 쌍 내에 ZFN 중에서 한 가지에서 FokI 돌연변이를 보유하는 상이한 ZFN 쌍에 대한 온 표적 활성 및 조합된 오프 표적 활성을 나타낸다. 부모 쌍을 나타내는 데이터 포인트가 표시된다.
도면 5a 및 5b는 아연 핑거의 중추 영역을 묘사하는 계통도이다. 도면 5a (서열 번호:3)는 베타 시트 및 알파 나선 구조가 표시되는 Zif268 단백질의 두 번째 핑거에서 아미노산을 보여준다. 특정한 DNA 염기 인식에 관련된 아미노산의 위치 (-1 내지 6) 역시 도시된다. DNA 상에서 인산염 중추와 상호작용하는 잠재력을 갖는 양성으로 하전된 잔기는 사각형에 의해 표시된다. 아연 배위에 관련된 불변 시스테인 잔기는 밑줄 표시된다. 도면 5b는 3차원 상태에서 단일 핑거의 클로즈업 도면이고 (속이 차있는 구체는 배위된 아연 이온을 나타낸다), 그리고 각 아연 핑거의 상이한 영역이 DNA와 어떤 경향으로 상호작용하는 지를 표시한다. DNA는 인산염이 문자 P에 의해 표시되고 DNA 염기가 둥근 모서리를 갖는 상자 내에 도시되는 다이어그램에 의해 나타내진다. 회색 화살표는 상자 내에 표시된 잔기 위치의 근사 위치를 표시하고, 그리고 흑색 화살표는 아연 핑거 단백질 및 DNA 사이의 상호작용을 표시한다.
도면 6 (서열 번호:4-6)은 아연 핑거 내에 각 위치에서 아미노산의 보존을 묘사한다. 첫 번째 라인은 Zif268 및 Sp1로부터 널리 공지된 아연 핑거 (Zif268로부터 핑거 2 (서열 번호:4), Zif268로부터 핑거 3 (서열 번호:5) 및 Sp1의 핑거 2 (서열 번호:6))에서 아미노산 서열의 정렬을 보여준다. 아연 배위 시스테인 및 히스티딘 잔기는 인식 나선이 그러한 것처럼 상자 표시된다. DNA 중추 인산염에 접촉하는 아르기닌 (R) 및 리신 (K) 양성으로 하전된 잔기 역시 상자 내에 표시된다. 첫 3개의 라인 아래의 숫자는 각 위치에서 각 아미노산의 빈도인데, 여기서 4867개의 상이한 자연발생 아연 핑거가 분석되었다. 다이어그램의 왼쪽에 문자는 빈도가 표에서 제공되는 아미노산 잔기에 상응하는 1 문자 코드이다. 3가지 비-하전된 아미노산, 알라닌, 류신 및 글루타민 (타원형으로 표시됨)이 인산염 접촉 위치에서 낮지만 영이 아닌 빈도로 발생하는 것으로 확인되었다.
도면 7a 및 7b (서열 번호:7 및 8)는 6개-핑거 아연 핑거 단백질 (도면 7a, 서열 번호:7) 또는 5개-핑거 아연 핑거 단백질 (도면 7b, 서열 번호:8)의 모듈을 포함하는 ZFP 중추의 도면을 묘사한다. 상자모양 위치 중에서 일부의 위쪽에 문자는 지정된 위치에서 시험되었던 돌연변이를 표시한다. 각 핑거의 정체는 표지 F1 내지 F6에 의해 제공된다. 이들 단백질은 각각, "모듈 A", 모듈 B" 및 "모듈 C"로서 표시된 3개의 상이한 "모듈"로부터 조립된다. 각 모듈 내에 N 말단 핑거의 위치 -14, -9 및 -5에 돌연변이는 어셈블리 과정 동안 이용된 PCR 프라이머의 서열을 변경함으로써 만들어질 수 있다.
도면 8a 내지 8c는 본원에서 발명의 신규한 아연 핑거 중추 돌연변이를 포함하는 TCRA (TRAC)-특이적 ZFN (PCT 공개 WO2017106528)에 대한 온 표적 및 오프 표적 개열 활성을 묘사하는 그래프이다. 상기 TCRA (TRAC)-특이적 ZFN 둘 모두 6개의 아연 핑거 반복을 내포하고, 그리고 위치 -5에서 실험적으로 용이한 돌연변이를 위해, 단지 각 모듈의 N 말단 핑거 (가령, 전장 ZFN에서 F1, F3 또는 F5)에만 도입되었다. 따라서, 각 개별 ZFN은 0, 1, 2 또는 3개 돌연변이를 가질 수 있었고, 그리고 전체 ZFN 쌍은 총 6개까지의 돌연변이 (가령, 0, 1, 2, 3, 4, 5 또는 6개 돌연변이)를 가질 수 있었다. 플로팅된 값은 위치 -5에서 돌연변이의 지시된 숫자와 유형에서, 모든 시험된 ZFN 쌍의 평균을 표시한다. 오차 막대는 평균의 표준 오차를 나타낸다. 각 ZFN 쌍에 대해, 표 3에서 지시된 3개의 오프 표적이 계측되었다; 플로팅된 값을 산출하기 위해 평균화된 오프 표적 값은 각 구조체에 대한 이들 3개 오프 표적 각각에 대한 부모 TCRA (TRAC) ZFN의 활성의 분율을 포함한다. 도면 8a는 부모 TCRA (TRAC) ZFN의 활성의 분율을 도시하는데, 여기서 데이터세트는 쌍 내에 2개의 ZFN 중에서 단지 하나의 아연 핑거 반복 중에서 하나 또는 그 이상에서 위치 -5에서 지정된 아미노산의 치환으로부터 온 표적 (흑색 막대) 또는 오프 표적 (회색 막대) 활성에서 변화를 보여준다. 도면 8b는 지정된 아르기닌- 알라닌 치환을 어느 한쪽 또는 양쪽 ZFN 파트너에서 동시에 만드는 것으로부터 활성의 분율을 도시한다. 도면 8b의 왼쪽 절반은 지정된 숫자의 돌연변이가 쌍 내에 단지 하나의 ZFN에서만 일어나는 ZFN 쌍 (그리고, 도면 8a의 왼쪽 세 번째에 상응한다)을 나타내고, 반면 도면 8b의 오른쪽 절반은 동일한 숫자의 돌연변이가 쌍 내에 양쪽 ZFN에 만들어진 ZFN 쌍 (가령, 2는 쌍 내에 각 ZFN에서 1개의 돌연변이를 나타내고, 4는 쌍 내에 각 ZFN에서 2개의 돌연변이를 나타내고, 그리고 6은 쌍 내에 각 ZFN에서 3개의 돌연변이를 나타낸다)을 나타낸다. 도면 8a 및 8b에서 실험은 실험마다 6 μg의 용량에서 CD34+ 세포로 행위되었다. 도면 8c는 RNA의 용량이 실험마다 2 μg이었던 도면 8a의 오른쪽 2/3까지 유사한 데이터를 보여준다.
도면 9는 본 발명의 신규한 아연 핑거 중추 돌연변이를 포함하는 BCL11A-특이적 ZFN에 대한 오프 표적 부위 NIFMAEVG에서 온 표적 (흑색 막대) 및 오프 표적 (회색 막대) 개열 활성을 묘사하는 그래프이다 (이 경우에 있어서, 3 문자 약어가 이용되고, 그리고 지정된 잔기로 돌연변이되었던 위치 -5에서 아르기닌 잔기의 숫자를 지시한다; 가령, "6 Gln"은 6개 아르기닌 (ZFN당 3개)이 ZFN 쌍에서 6개 글루타민으로 돌연변이되었다는 것을 지시한다). 오차 막대는 표준 오차를 나타낸다. 실험은 실험마다 ZFN당 2 μg mRNA의 용량으로 CD34+ 세포에서 행위되었다.
도면 10은 2A 서열에 의해 연결된 단일 폴리뉴클레오티드 상에서 양쪽 ZFN 파트너를 인코딩하는 mRNA (51857-2a-51949)로 형질감염, 이들 ZFN을 별개로 인코딩하는 mRNA들로 약물 주입; 또는 지정된 용량에서 각 파트너를 인코딩하는 2개 mRNA의 혼합물로 약물 주입 이후에 CD34+ 세포에서 BCL11A-특이적 ZFN 발현의 검출을 위한 웨스턴 블롯을 묘사한다. 이들 단백질은 항-Flag 항체에 의해 검출되었고, 그리고 mRNA 형질감염 이후에 발현된 단백질의 양이 이용된 mRNA의 양에 따른다는 것을 증명한다. 예상한 대로, 2a 구조체는 3'ZFN, SBS#51949와 비교하여 더욱 많은 양의 5' ZFN SBS#51857을 생산하였다.
도면 11은 온 표적 위치 (BCL11A, 왼쪽 패널)에 대비하여 또는 오프 표적 위치 NIFMAEVG (오른쪽 패널)에 대비하여 2개의 BCl11A-특이적 ZFN 파트너 51949 및 51857에 대한 약물 주입의 적정을 묘사한다. 이들 결과는 ZFN 파트너의 비율을 변화시키는 것이 오프 표적 활성을 감소시키면서 온 표적 활성을 보존할 수 있다는 것을 증명한다 (60 μg의 각 mRNA에서 BCL11A 표적 (85.92% 삽입-결실의 온 표적 활성, 또는 86.42%의 60 μg 51949, 6.6 μg 51857 온 표적 활성)을 감소된 오프 표적 (60 μg 51949 및 6.6 μg 51857이 함께 이용될 때 4.21% 삽입-결실과 비교하여, 60 μg의 각 mRNA가 이용될 때 27.34% 오프 표적 활성)과 비교한다).
도면 12는 CD34+ 세포가 전술된 바와 같이 양쪽 ZFN 파트너를 인코딩하는 단일 mRNA (51857/51949 2a)로 처리되거나, 또는 한쪽 파트너 (51949)가 위치 416에서 FokI R -> S 돌연변이를 포함하는 ZFN 파트너의 적정된 용량으로 처리되었을 때, BCL11A-특이적 ZFN에 대한 온 및 오프 표적 개열 활성을 열거하는 표이다. '번호판' 식별자는 실시예 2의 표 1에서 도시된다 (서열 번호:13-53). PRJIYLFN에 상응하는 데이터는 ZFN 활성과 일치하는 삽입-결실을 내포하는 BCL11A 내에 의도된 표적에서 서열 리드의 분율을 나타낸다. 가장 왼쪽 칼럼에서 열거된 모든 다른 '번호판' 식별자에 상응하는 데이터는 51857/51949 ZFN 쌍에 대한 확증된 또는 의심되는 오프 표적 좌위에 상응한다. 오른쪽 칼럼에서 도시된 비율은 지정된 좌위에서 적정된 51857/51949 R416S로 처리된 표본에서 활성에 의해 나눗셈된, 51857/51949 2a로 처리된 표본에서 활성을 지시한다.
도면 13은 2개의 ZFN 쌍을 비교하는 선입견 없는 포획 검정의 결과를 보여준다. 왼쪽 패널 ("부모 ZFN 쌍")은 쌍 SBS51857 및 SBS51949를 이용한 결과를 보여주고, 그리고 오른쪽 패널 ("변이체 ZFN 쌍")은 SBS63014 및 SBS65721을 이용한 결과를 보여주는데, 상기 쌍은 부모 쌍 및 부가적으로, 본원에서 설명된 바와 같은 ZFP 중추 돌연변이뿐만 아니라 SBS65721 구조체 상에 FokI R416S 돌연변이를 포함한다. 특히, 변이체 쌍에서, 상기 쌍의 각 ZFN은 핑거에서 3개의 R->Q 돌연변이를 포함하고, 그리고 SBS65721 구조체는 FokI R416S 돌연변이를 더욱 포함한다. 상기 데이터는 이들 돌연변이가 독특한 포획 사건의 숫자를 부모 쌍에 대한 21개 위치로부터 변이체에서 4개 위치로 감소시킨다는 것을 증명한다. 게다가, ZFN 쌍에서 파트너가 비-동등한 양으로 제공될 때, 포획 사건 역시 감소한다. 부모 쌍의 경우에, 포획 사건은 21개 위치 (동등한 약물 주입)에서 13개 위치 (부등한 약물 주입)로 하락하고 (각각, 28%에서 3.4% 집합적 오프 표적), 그리고 변이체 쌍의 경우에, 포획 사건은 4에서 2로 하락한다 (각각, 0.26%에서 0.08% 집합적 오프 표적 개열). 이들 2가지 접근법의 조합은 부모에서 21개 위치에서 부등한 파트너 농도가 주입된 변이체에서 2개 위치로 전반적인 감소를 유발하고, 부모 쌍에 대한 전체적으로 28% 오프 표적 사건으로부터 변이체에 대한 전체적으로 0.08% 오프 표적 사건으로의 감소를 유발한다.
도면 14는 대규모 제조 조건에서 생산된 본원에서 설명된 바와 같은 ZFN을 이용하여, 감소된 오프 표적 개열 사건을 증명하는 결과를 보여준다. 이용된 ZFN 쌍은 SBS63014 및 SBS65722를 포함하였다.
도면 15a 내지 15d는 본원에서 설명된 바와 같은 ZFN 돌연변이체 (AAVS1에 표적화됨)를 이용하여, 감소된 오프 표적 개열 사건을 증명하는 결과를 보여준다. 도면 15a는 부모 ZFN 30035/30054로부터 활성 결과를 묘사한다. 도면 15b는 FokI 돌연변이체의 3개 세트에 대한 온 표적 및 온 표적/오프 표적 개열 활성의 비율을 묘사한다: 추가 단일 돌연변이를 포함하는 ELD FokI 돌연변이체 (가장 왼쪽 데이터 세트); 추가 단일 돌연변이를 포함하는 KKR FokI 돌연변이체 (중간 데이터 세트); 그리고 동일한 추가 단일 돌연변이를 포함하는 ELD 및 KKR FokI 돌연변이체 둘 모두 (가장 오른쪽 데이터 세트). 도면 15c는 온 표적 활성의 격자를 보여주는데, 여기서 ELD 또는 KKR FokI 도메인은 2개의 돌연변이를 포함하고, 그리고 도면 15d는 도면 15c에서 도시된 데이터에 대한 온 표적/오프 표적 비율을 도시한다.
도면 16a 및 16b는 본원에서 설명된 바와 같은 예시적인 AAVS1-표적화된 ZFN 돌연변이체를 이용하여, 감소된 오프 표적 개열 사건을 증명하는 결과를 보여준다. 도면 16a는 ELD 및 KKR 맥락에서 돌연변이체를 도시하고, 그리고 도면 16b는 ELD-KKR 맥락에서 돌연변이체를 도시한다.
도면 17은 FokI 및 FokI 동족체의 정렬 (서열 번호:54 내지 64)을 도시한다. 명암은 보존의 정도를 표시한다. 넘버링은 야생형 FokI 도메인 (서열 번호:1)에 따른다.
도면 18은 예시적인 돌연변이를 도시하는데, 여기서 위치는 도면 17에서 도시된 FokI 또는 FokI 동족체에 상응한다.

상세한 설명

오프 표적 개열을 차별적으로 감소시킴으로써, 온 표적 가공된 뉴클레아제 개열의 특이성을 증가시키기 위한 방법 및 조성물이 본원에서 개시된다. 이들 방법은 FokI 개열 도메인 및 DNA 사이에 비특이적 상호작용을 감소시키고, 아연 핑거 중추 및 DNA 사이에 비특이적 상호작용을 감소시키고, 그리고 각 절반-개열 도메인 파트너의 상대적 비율을 1:1의 디폴트 비율로부터 멀리 변경하는 것을 수반한다.

일반

방법의 실시뿐만 아니라 본원에서 개시된 조성물의 제조 및 이용은 달리 지시되지 않으면, 당업자의 지식 범위 내에서 분자생물학, 생화학, 염색질 구조 및 분석, 컴퓨터 화학, 세포 배양, 재조합 DNA 및 관련된 분야의 전통적인 기술을 이용한다. 이들 기술은 기존 문헌에서 완전히 설명된다. 가령, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, 제2판, Cold Spring Harbor Laboratory Press, 1989 및 제3판, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 및 주기적 갱신; 시리즈 METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, 제3판, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; 그리고 METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999를 참조한다.

정의

용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 교체가능하게 이용되고, 그리고 선형 또는 환상 입체형태에서, 그리고 단일- 또는 이중 가닥 형태에서 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 발명의 목적으로, 이들 용어는 중합체의 길이에 대하여 한정하는 것으로 해석되지 않는다. 이들 용어는 자연 뉴클레오티드의 공지된 유사체뿐만 아니라 염기, 당 및/또는 인산염 모이어티 (가령, 포스포로티오에이트 중추)에서 변형되는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기 대합 특이성을 갖는다; 다시 말하면, A의 유사체는 T와 염기쌍을 이룰 것이다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 교체가능하게 이용된다. 상기 용어는 또한, 하나 또는 그 이상의 아미노산이 상응하는 자연발생 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.

"결합"은 거대분자 사이에 (가령, 단백질 및 핵산 사이에) 서열-특이적, 비공유 상호작용을 지칭한다. 상호작용이 전체적으로 서열-특이적이기만 하면, 결합 상호작용의 모든 성분이 서열-특이적 (가령, DNA 중추 내에서 인산염 잔기와 접촉)일 필요는 없다. 이런 상호작용은 일반적으로, 10^-6 M^-1 또는 그 이하의 해리 상수 (K_d)에 의해 특징된다. "친화성"은 결합 강도를 지칭한다: 증가된 결합 친화성은 더욱 낮은 K_d와 상관된다. "비특이적 결합"은 표적 서열에 의존하지 않는, 관심되는 임의의 분자 (가령, 가공된 뉴클레아제) 및 거대분자 (가령, DNA) 사이에 발생하는 비공유 상호작용을 지칭한다.

"결합 단백질"은 다른 분자에 비공유적으로 결합할 수 있는 단백질이다. 결합 단백질은 예로서, DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우에, 이것은 그 자체에 결합할 수 있고 (동종이합체, 동형삼합체 등을 형성) 및/또는 이것은 상이한 단백질 또는 단백질들의 하나 또는 그 이상의 분자에 결합할 수 있다. 결합 단백질은 하나 이상의 유형의 결합 활성을 가질 수 있다. 가령, 아연 핑거 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 갖는다. RNA-안내된 뉴클레아제 시스템의 경우에, RNA 안내는 뉴클레아제 성분 (Cas9 또는 Cfp1)에 이종성이고, 그리고 이들 둘 모두 가공될 수 있다.

"DNA 결합 분자"는 DNA에 결합할 수 있는 분자이다. 이런 DNA 결합 분자는 폴리펩티드, 단백질의 도메인, 더욱 큰 단백질 내에 도메인 또는 폴리뉴클레오티드일 수 있다. 일부 구체예에서, 폴리뉴클레오티드는 DNA이고, 반면 다른 구체예에서, 폴리뉴클레오티드는 RNA이다. 일부 구체예에서, DNA 결합 분자는 뉴클레아제의 단백질 도메인 (가령, FokI 도메인)이고, 반면 다른 구체예에서, DNA 결합 분자는 RNA-안내된 뉴클레아제 (가령, Cas9 또는 Cfp1)의 안내 RNA 성분이다.

"DNA 결합 단백질" (또는 결합 도메인)은 예로서, 각각 하나 또는 그 이상의 아연 핑거를 통해, 또는 아연 핑거 단백질 또는 TALE 내에 하나 또는 그 이상의 RVD와의 상호작용을 통해 서열-특이적 방식으로 DNA에 결합하는 단백질, 또는 더욱 큰 단백질 내에 도메인이다. 용어 아연 핑거 DNA 결합 단백질은 종종, 아연 핑거 단백질 또는 ZFP로서 약칭된다.

"아연 핑거 DNA 결합 단백질" (또는 결합 도메인)은 아연 이온의 배위를 통해 구조가 안정되는 결합 도메인 내에 아미노산 서열의 영역인 하나 또는 그 이상의 아연 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는 단백질, 또는 더욱 큰 단백질 내에 도메인이다. 용어 아연 핑거 DNA 결합 단백질은 종종, 아연 핑거 단백질 또는 ZFP로서 약칭된다.

"TALE DNA 결합 도메인" 또는 "TALE"는 하나 또는 그 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 동계 표적 DNA 서열에 TALE의 결합에 관련된다. 단일 "반복 단위" ("반복"으로서 또한 지칭됨)는 전형적으로, 길이에서 33-35개 아미노산이고, 그리고 자연발생 TALE 단백질 내에서 다른 TALE 반복 서열과 최소한 일부 서열 상동성을 전시한다. 가령, 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 번호 8,586,526을 참조한다.

아연 핑거 및 TALE DNA-결합 도메인은 예로서, 자연발생 아연 핑거 단백질의 인식 나선 영역의 가공 (하나 또는 그 이상의 아미노산을 변경)을 통해, 또는 DNA 결합에 관련된 아미노산 ("반복 가변 이중잔기" 또는 RVD 영역)의 가공에 의해, 미리 결정된 뉴클레오티드 서열에 결합하도록 "가공"될 수 있다. 이런 이유로, 가공된 아연 핑거 단백질 또는 TALE 단백질은 비자연발생인 단백질이다. 아연 핑거 단백질 및 TALE를 가공하기 위한 방법의 무제한적 실례는 설계 및 선별이다. 설계된 단백질은 자연에서 발생하지 않는 단백질이고, 이의 설계/조성은 주로 합리적인 규준으로부터 발생한다. 설계에 대한 합리적인 규준은 기존 ZFP 또는 TALE 설계와 결합 데이터에 관한 정보를 저장하는 데이터베이스에서 정보를 처리하기 위한 치환 규칙 및 컴퓨터화 알고리즘의 적용을 포함한다. 가령, U.S. 특허 번호 8,586,526; 6,140,081; 6,453,242; 및 6,534,261을 참조한다; 또한, WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496을 참조한다.

"선별된" 아연 핑거 단백질, TALE 단백질 또는 CRISPR/Cas 시스템은 자연에서 발견되지 않고, 이의 생산은 일차적으로 경험적 과정, 예를 들면, 파지 전시, 상호작용 트랩, 합리적인 설계 또는 하이브리드 선별로부터 발생한다. 가령, US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 및 WO 02/099084를 참조한다.

"TtAgo"는 유전자 침묵에 관련된 것으로 생각되는 원핵 아르고노트 단백질이다. TtAgo는 세균 써무스 써모필러스 (Thermus thermophilus)로부터 유래된다. 가령, Swarts et al, 상게서; G. Sheng et al., (2013) Proc. Natl. Acad. Sci. U.S.A. 111, 652)를 참조한다. "TtAgo 시스템"은 예로서, TtAgo 효소에 의한 개열을 위한 안내 DNA를 비롯한, 필요한 모든 성분을 포함한다.

"재조합"은 비상동성 말단 연결 (NHEJ)에 의한 포획 및 상동성 재조합을 포함하지만 이들에 한정되지 않는, 2개의 폴리뉴클레오티드 사이에 유전 정보의 교환의 과정을 지칭한다. 본 발명의 목적으로, "상동성 재조합 (HR)"은 예로서, 상동성-지향된 수복 기전을 통해 세포에서 이중 가닥 절단의 수복 동안 발생하는, 이런 교환의 특수한 형태를 지칭한다. 이러한 과정은 뉴클레오티드 서열 상동성을 필요로 하고, "표적" 분자 (다시 말하면, 이중 가닥 절단을 경험한 분자)의 주형 수복에 "공여자" 분자를 이용하고, 그리고 "비교차 유전자 전환" 또는 "짧은 트랙 유전자 전환"으로서 다양하게 알려져 있는데, 그 이유는 이것이 공여자로부터 표적으로 유전 정보의 전달을 야기하기 때문이다. 임의의 특정 이론에 한정됨 없이, 이런 전달은 절단된 표적 및 공여자 사이에 형성되는 이형이중나선 DNA의 부정합 교정 및/또는 표적의 일부가 될 유전 정보를 재합성하는데 공여자가 이용되는 "합성-의존성 가닥 어닐링" 및/또는 관련된 과정을 수반할 수 있다. 이런 특수한 HR은 종종, 공여자 폴리뉴클레오티드의 서열 중에서 일부 또는 전부가 표적 폴리뉴클레오티드 내로 통합되도록, 표적 분자의 서열의 변경을 유발한다.

본 발명의 일정한 방법에서, 본원에서 설명된 바와 같은 하나 또는 그 이상의 표적화된 뉴클레아제는 표적 서열 (가령, 세포 염색질) 내에 미리 결정된 부위 (가령, 관심되는 유전자 또는 좌위)에서 이중 가닥 절단 (DSB)을 창출한다. DSB는 본원에서 설명된 바와 같은 구조체 (가령, 공여자)의 통합을 매개한다. 임의선택적으로, 구조체는 절단의 영역 내에 뉴클레오티드 서열에 상동성을 갖는다. 발현 구조체가 물리적으로 통합될 수 있거나, 또는 대안으로, 발현 카세트가 상동성 재조합을 통한 절단의 수복을 위한 주형으로서 이용되어, 발현 카세트 내에 뉴클레오티드 서열 중에서 전부 또는 일부의 세포 염색질 내로의 도입을 유발한다. 따라서, 세포 염색질 내에 첫 번째 서열이 변경될 수 있고, 그리고 일정한 구체예에서, 발현 카세트 내에 존재하는 서열로 전환될 수 있다. 따라서, 용어 "대체한다" 또는 "대체"의 이용은 다른 뉴클레오티드 서열에 의한 한 뉴클레오티드 서열의 대체 (다시 말하면, 정보적 의미에서 서열의 대체)를 나타내는 것으로 이해될 수 있고, 그리고 다른 폴리뉴클레오티드에 의한 한 폴리뉴클레오티드의 물리적 또는 화학적 대체를 반드시 필요로 하는 것은 아니다.

본원에서 설명된 방법 중에서 한 가지에서, 추가 가공된 뉴클레아제가 세포 내에 추가 표적 부위의 추가 이중 가닥 개열에 이용될 수 있다.

세포 염색질 내에 관심 영역에서 서열의 표적화된 재조합 및/또는 대체 및/또는 변경을 위한 방법의 일정한 구체예에서, 염색체 서열은 외인성 "공여자" 뉴클레오티드 서열과의 상동성 재조합에 의해 변경된다. 이런 상동성 재조합은 절단의 영역에 상동한 서열이 존재하면, 세포 염색질 내에 이중 가닥 절단의 존재에 의해 자극된다.

본원에서 설명된 방법 중에서 한 가지에서, 첫 번째 뉴클레오티드 서열 ("공여자 서열")은 관심 영역 내에 유전체 서열과 상동하지만 동일하지 않은 서열을 내포하고, 따라서 상동성 재조합을 자극하여 비동일한 서열을 관심 영역 내에 삽입할 수 있다. 따라서, 일정한 구체예에서, 관심 영역 내에 서열에 상동하는 공여자 서열의 부분은 대체되는 유전체 서열에 약 80 내지 99% (또는 이들 사이에 임의의 정수) 사이의 서열 동일성을 전시한다. 다른 구체예에서, 공여자 및 유전체 서열 사이에 상동성은 예로서, 만약 단지 1개의 뉴클레오티드만 100여개의 연속 염기쌍의 공여자 및 유전체 서열 사이에서 상이하면, 99%보다 높다. 일정한 경우에, 공여자 서열의 비상동성 부분은 새로운 서열이 관심 영역 내로 도입되도록, 관심 영역 내에 존재하지 않는 서열을 내포할 수 있다. 이들 사례에서, 비상동성 서열은 일반적으로, 관심 영역 내에 서열과 상동하거나 또는 동일한 50-1,000개 염기쌍 (또는 이들 사이에 임의의 정수 값) 또는 1,000개보다 많은 숫자의 염기쌍의 서열과 측면에서 접한다. 다른 구체예에서, 공여자 서열은 첫 번째 서열에 비상동하고, 그리고 비상동성 재조합 기전에 의해 유전체 내로 삽입된다.

본원에서 설명된 방법 중에서 한 가지는 공여자 서열의 표적화된 통합에 의해, 또는 표적 서열(들)의 개열, 그 이후에 관심되는 유전자(들)의 발현을 교란하는 오류가 발생하기 쉬운 NHEJ-매개된 수복을 통해, 세포 내에 하나 또는 그 이상의 표적 서열의 부분적인 또는 완전한 비활성화에 이용될 수 있다. 부분적으로 또는 완전하게 비활성화된 유전자를 갖는 세포주 역시 제공된다.

게다가, 본원에서 설명된 바와 같은 표적화된 통합의 방법은 또한, 하나 또는 그 이상의 외인성 서열을 통합하는데 이용될 수 있다. 외인성 핵산 서열은 예로서, 하나 또는 그 이상의 유전자 또는 cDNA 분자, 또는 임의의 유형의 코딩 또는 비코딩 서열뿐만 아니라 하나 또는 그 이상의 제어 요소 (가령, 프로모터)를 포함할 수 있다. 이에 더하여, 외인성 핵산 서열은 하나 또는 그 이상의 RNA 분자 (가령, 작은 헤어핀 RNA (shRNA), 저해성 RNA (RNAi), 마이크로RNA (miRNA) 등)을 생산할 수 있다.

"개열"은 DNA 분자의 공유 중추의 절단을 지칭한다. 개열은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하지만 이들에 한정되지 않는 다양한 방법에 의해 시작될 수 있다. 단일 가닥 개열 및 이중 가닥 개열 둘 모두 가능하고, 그리고 이중 가닥 개열은 2가지 상이한 단일 가닥 개열 사건의 결과로서 발생할 수 있다. DNA 개열은 평활 말단 또는 스태거드 말단의 생산을 유발할 수 있다. 일정한 구체예에서, 융합 폴리펩티드가 표적화된 이중 가닥 DNA 개열에 이용된다.

"개열 절반-도메인"은 두 번째 폴리펩티드 (동일한 또는 상이한)와 함께, 개열 활성 (바람직하게는, 이중 가닥 개열 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "첫 번째와 두 번째 개열 절반-도메인;" "+ 및 - 개열 절반-도메인" 및 "오른쪽 및 왼쪽 개열 절반-도메인"은 이합체화하는 개열 절반-도메인의 쌍을 지칭하는데 교체가능하게 이용된다. 용어 "개열 도메인"은 용어 "개열 절반-도메인"과 교체가능하게 이용된다. 용어 "FokI 개열 도메인"은 서열 번호:1에서 보여 지는 바와 같은 FokI 서열뿐만 아니라 도면 17에서 도시된 서열을 포함하지만 이들에 한정되지 않는 임의의 FokI 동족체를 포함한다.

"가공된 개열 절반-도메인"은 다른 개열 절반-도메인 (가령, 다른 가공된 개열 절반-도메인)과 절대 이형이합체를 형성하도록 변형된 개열 절반-도메인이다.

용어 "서열"은 임의의 길이의 뉴클레오티드 서열을 지칭하는데, 이것은 DNA 또는 RNA일 수 있고; 선형, 환상 또는 분지될 수 있고, 그리고 단일 가닥 또는 이중 가닥일 수 있다. 용어 "도입유전자"는 유전체 내로 삽입되는 뉴클레오티드 서열을 지칭한다. 도입유전자는 임의의 길이, 예를 들면, 길이에서 2 및 100,000,000개 뉴클레오티드 (또는 이들 사이에 또는 이들 초과의 임의의 정수 값) 사이, 바람직하게는 길이에서 약 100 및 100,000개 뉴클레오티드 (또는 이들 사이에 임의의 정수) 사이, 더욱 바람직하게는 길이에서 약 2000 및 20,000개 뉴클레오티드 (또는 이들 사이에 임의의 값) 사이, 그리고 훨씬 바람직하게는, 약 5 및 15 kb (또는 이들 사이에 임의의 값) 사이일 수 있다.

"염색체"는 세포의 유전체 중에서 전부 또는 일부를 포함하는 염색질 복합체이다. 세포의 유전체는 종종, 이의 핵형에 의해 특징되는데, 이것은 세포의 유전체를 구성하는 모든 염색체의 집합이다. 세포의 유전체는 하나 또는 그 이상의 염색체를 포함할 수 있다.

"에피솜"은 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 복제 핵산, 핵단백질 복합체 또는 다른 구조물이다. 에피솜의 실례는 플라스미드, 미니서클 및 일정한 바이러스 유전체를 포함한다. 본원에서 설명된 간 특이적 구조체는 에피솜으로 유지될 수 있거나, 또는 대안으로, 세포 내로 안정되게 통합될 수 있다.

"외인성" 분자는 세포 내에 정상적으로는 존재하지 않지만 하나 또는 그 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내로 도입될 수 있는 분자이다. "세포 내에 정상적인 존재"는 세포의 특정 발달 단계 및 환경 조건에 대하여 결정된다. 따라서, 예로서, 근육의 배아 발달 동안에만 존재하는 분자는 성체 근육 세포에 대하여 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 비-열 충격 세포에 대하여 외인성 분자이다. 외인성 분자는 예로서, 기능부전 내인성 분자의 기능하는 버전 또는 정상적으로-기능하는 내인성 분자의 기능부전 버전을 포함할 수 있다.

외인성 분자는 그 중에서도 특히, 소형 분자, 예를 들면, 조합 화학 과정에 의해 산출된 소형 분자, 또는 거대분자, 예를 들면, 단백질, 핵산, 탄수화물, 지질, 당단백질, 지질단백질, 다당류, 상기 분자의 임의의 변형된 유도체, 또는 상기 분자 중에서 한 가지 또는 그 이상을 포함하는 임의의 복합체일 수 있다. 핵산은 DNA 및 RNA를 포함하고, 단일- 또는 이중 가닥일 수 있고; 선형, 분지된 또는 환상일 수 있고; 그리고 임의의 길이일 수 있다. 핵산은 이중나선을 형성할 수 있는 것들뿐만 아니라 삼중나선-형성 핵산을 포함한다. 가령, U.S. 특허 번호 5,176,996 및 5,422,251을 참조한다. 단백질은 DNA-결합 단백질, 전사 인자, 염색질 재형성 인자, 메틸화된 DNA 결합 단백질, 중합효소, 메틸화효소, 탈메틸효소, 아세틸라아제, 탈아세틸화효소, 키나아제, 포스파타아제, 리가아제, 탈유비퀴티나아제, 인테그라아제, 재조합효소, 리가아제, 국소이성화효소, 자이라아제 및 헬리카아제를 포함하지만 이들에 한정되지 않는다.

외인성 분자, 예를 들면, 외인성 단백질 또는 핵산은 내인성 분자와 동일한 유형의 분자일 수 있다. 가령, 외인성 핵산은 감염성 바이러스 유전체, 세포 내로 도입된 플라스미드 또는 에피솜, 또는 세포 내에 정상적으로는 존재하지 않는 염색체를 포함할 수 있다. 세포 내로 외인성 분자의 도입을 위한 방법은 당업자에게 공지되어 있고, 그리고 지질-매개된 전달 (다시 말하면, 중성 및 양이온성 지질을 포함하는 리포솜), 전기천공, 직접적인 주사, 세포 융합, 입자 충격, 인산칼슘 공동침전, DEAE-덱스트란-매개된 전달 및 바이러스 벡터-매개된 전달을 포함하지만 이들에 한정되지 않는다. 외인성 분자는 또한, 내인성 분자와 동일한 유형의 분자이지만 세포가 유래되는 종과 상이한 종으로부터 유래될 수 있다. 가령, 인간 핵산 서열은 생쥐 또는 햄스터로부터 최초 유래된 세포주 내로 도입될 수 있다. 식물 세포 내로 외인성 분자의 도입을 위한 방법은 당업자에게 공지되어 있고, 그리고 원형질체 형질전환, 실리콘 카바이드 (가령, WHISKERS™), 아그로박테리움 (Agrobacterium)-매개된 형질전환, 지질-매개된 전달 (다시 말하면, 중성 및 양이온성 지질을 포함하는 리포솜), 전기천공, 직접적인 주사, 세포 융합, 입자 충격 (가령, "유전자 총"을 이용), 인산칼슘 공동침전, DEAE-덱스트란-매개된 전달 및 바이러스 벡터-매개된 전달을 포함하지만 이들에 한정되지 않는다.

대조적으로, "내인성" 분자는 특정 환경 조건 하에 특정 발달 단계에서 특정 세포 내에 정상적으로 존재하는 분자이다. 가령, 내인성 핵산은 염색체, 미토콘드리아의 유전체, 엽록체 또는 다른 소기관, 또는 자연발생 에피솜 핵산을 포함할 수 있다. 추가 내인성 분자는 단백질, 예를 들면, 전사 인자 및 효소를 포함할 수 있다.

본원에서 이용된 바와 같이, 용어 "외인성 핵산의 산물"은 폴리뉴클레오티드 및 폴리펩티드 산물 둘 모두, 예를 들면, 전사 산물 (폴리뉴클레오티드, 예를 들면, RNA) 및 번역 산물 (폴리펩티드)를 포함한다.

"융합" 분자는 2개 또는 그 이상의 아단위 분자가 바람직하게는, 공유적으로 연결되는 분자이다. 아단위 분자는 동일한 화학적 유형의 분자일 수 있거나, 또는 상이한 화학적 유형의 분자일 수 있다. 융합 분자의 실례는 융합 단백질 (가령, 단백질 DNA-결합 도메인 및 개열 도메인 사이에 융합), 개열 도메인과 작동가능하게 연관된 폴리뉴클레오티드 DNA-결합 도메인 (가령, sgRNA) 사이에 융합, 그리고 융합 핵산 (가령, 융합 단백질을 인코딩하는 핵산)을 포함하지만 이들에 한정되지 않는다.

세포에서 융합 단백질의 발현은 융합 단백질의 세포로의 전달로부터 또는 융합 단백질을 인코딩하는 폴리뉴클레오티드의 세포로의 전달에 의해 발생할 수 있는데, 여기서 폴리뉴클레오티드가 전사되고, 그리고 전사체가 번역되어 융합 단백질이 산출된다. 트랜스-스플라이싱, 폴리펩티드 개열 및 폴리펩티드 결찰 역시 세포에서 단백질의 발현에 관련될 수 있다. 세포로 폴리뉴클레오티드 및 폴리펩티드 전달을 위한 방법은 본 개시의 다른 곳에서 제시된다.

본 발명의 목적으로, "유전자"는 유전자 산물을 인코딩하는 DNA 영역 (하기 참조)뿐만 아니라 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함하고, 이런 조절 서열이 코딩 및/또는 전사된 서열에 인접하는 지의 여부는 상관이 없다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예를 들면, 리보솜 결합 부위 및 내부 리보솜 유입 부위, 인핸서, 사일런서, 인슐레이터, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 좌위 제어 영역을 포함하지만 이들에 반드시 한정되지는 않는다.

"유전자 발현"은 유전자에서 내포된 정보의 유전자 산물로의 전환을 지칭한다. 유전자 산물은 유전자의 직접적인 전사 산물 (가령, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 임의의 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한, 캡핑, 폴리아데닐화, 메틸화 및 편집과 같은 과정에 의해 변형되는 RNA, 그리고 예로서, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질을 포함한다.

유전자 발현의 "조정"은 유전자의 활성에서 변화를 지칭한다. 발현의 조정은 유전자 활성화 및 유전자 억제를 포함할 수 있지만 이들에 한정되지 않는다. 유전체 편집 (가령, 개열, 변경, 비활성화, 무작위 돌연변이)이 발현을 조정하는데 이용될 수 있다. 유전자 비활성화는 본원에서 설명된 바와 같은 ZFP, TALE 또는 CRISPR/Cas 시스템을 포함하지 않는 세포와 비교하여 유전자 발현에서 임의의 감소를 지칭한다. 따라서, 유전자 비활성화는 부분적이거나 또는 완전할 수 있다.

"관심 영역"은 세포 염색질의 임의의 영역, 예를 들면, 예로서, 유전자, 또는 유전자 내에 또는 유전자에 인접한 비코딩 서열인데, 여기서 이것은 외인성 분자에 결합하는 것이 바람직하다. 결합은 표적화된 DNA 개열 및/또는 표적화된 재조합을 하기 위한 것일 수 있다. 관심 영역은 예로서, 염색체, 에피솜, 세포소기관 유전체 (가령, 미토콘드리아, 엽록체), 또는 감염성 바이러스 유전체 내에 존재할 수 있다. 관심 영역은 유전자의 코딩 영역 내에, 전사된 비코딩 영역, 예를 들면, 예로서, 리더 서열, 트레일러 서열 또는 인트론 내에, 또는 코딩 영역의 상류 또는 하류에서 비전사된 영역 내에 있을 수 있다. 관심 영역은 길이에서 작게는 단일 뉴클레오티드 쌍 또는 2,000개까지의 뉴클레오티드 쌍, 또는 임의의 정수 값의 뉴클레오티드 쌍일 수 있다.

"피난항" 좌위는 숙주 세포에 대한 임의의 유해한 효과 없이, 유전자가 삽입될 수 있는 유전체 내에 좌위이다. 가장 유익한 것은 삽입된 유전자 서열의 발현이 인접한 유전자로부터 임의의 번역 초과 발현에 의해 섭동되지 않는 피난항 좌위이다. 뉴클레아제(들)에 의해 표적화되는 피난항 좌위의 무제한적 실례는 CCR5, HPRT, AAVS1, Rosa 및 알부민을 포함한다. 가령, U.S. 특허 번호 7,951,925; 8,771,985; 8,110,379; 7,951,925; U.S. 공개 번호 20100218264; 20110265198; 20130137104; 20130122591; 20130177983; 20130177960; 20150056705 및 20150159172를 참조한다.

"리포터 유전자" 또는 "리포터 서열"은 바람직하게는, 반드시 그러한 것은 아니지만 일과적인 검정에서 쉽게 계측되는 단백질 산물을 생산하는 임의의 서열을 지칭한다. 적합한 리포터 유전자는 항생제 내성 (가령, 암피실린 내성, 네오마이신 내성, G418 내성, 푸로마이신 내성)을 매개하는 단백질을 인코딩하는 서열, 유색 또는 형광 또는 발광 단백질 (가령, 녹색 형광 단백질, 증강된 녹색 형광 단백질, 적색 형광 단백질, 루시페라아제)을 인코딩하는 서열, 그리고 증강된 세포 성장 및/또는 유전자 증폭을 매개하는 단백질 (가령, 디히드로폴레이트 환원효소)을 포함하지만 이들에 한정되지 않는다. 에피토프 태그는 예로서, FLAG, His, myc, Tap, HA 또는 임의의 검출가능한 아미노산 서열의 하나 또는 그 이상의 사본을 포함한다. "발현 태그"는 관심되는 유전자의 발현을 모니터링하기 위해 원하는 유전자 서열에 작동가능하게 연결될 수 있는 리포터를 인코딩하는 서열을 포함한다.

"진핵" 세포는 줄기 세포 (다능성 및 다분화성)를 비롯하여, 진균 세포 (가령, 효모), 식물 세포, 동물 세포, 포유류 세포 및 인간 세포 (가령, T-세포)를 포함하지만 이들에 한정되지 않는다.

용어 "작동가능한 연쇄" 및 "작동가능하게 연결된" (또는 "작동가능하게 연결된")은 2개 또는 그 이상의 성분 (가령, 서열 요소)의 근접위치에 관하여 교체가능하게 이용되는데, 여기서 이들 성분은 양쪽 성분이 정상적으로 기능하고, 그리고 이들 성분 중에서 최소한 하나가 다른 성분 중에서 최소한 하나에서 발휘되는 기능을 매개할 수 있는 가능성을 허용하도록 배열된다. 실례로서, 전사 조절 서열, 예를 들면, 프로모터는 이러한 전사 조절 서열이 하나 또는 그 이상의 전사 조절 인자의 존재 또는 부재에 대한 응답으로 코딩 서열의 전사 수준을 제어하면, 코딩 서열에 작동가능하게 연결된다. 전사 조절 서열은 일반적으로, 코딩 서열과 시스 (cis)로 작동가능하게 연결되지만, 이것에 직접적으로 인접할 필요는 없다. 가령, 인핸서는 코딩 서열에 작동가능하게 연결되는 전사 조절 서열이긴 하지만, 이들은 인접하지 않는다.

단백질, 폴리펩티드 또는 핵산의 "기능적 단편"은 서열이 전장 단백질, 폴리펩티드 또는 핵산과 동일하지 않지만 전장 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 유지하는 단백질, 폴리펩티드 또는 핵산이다. 기능적 단편은 상응하는 선천적 분자와 비교하여 더욱 많은, 더욱 적은, 또는 동일한 숫자의 잔기를 소유할 수 있고 및/또는 하나 또는 그 이상의 아미노산 또는 뉴클레오티드 치환을 내포할 수 있다. 핵산 또는 단백질의 기능을 결정하기 위한 방법 (가령, 코딩 기능, 다른 핵산에 혼성화하는 능력, 효소 활성 검정)은 당해 분야에서 널리 공지된다.

폴리뉴클레오티드 "벡터" 또는 "구조체"는 유전자 서열을 표적 세포로 이전할 수 있다. 전형적으로, "벡터 구조체," "발현 벡터," "발현 구조체," "발현 카세트," 및 "유전자 전달 벡터"는 관심되는 유전자의 발현을 주도할 수 있고, 그리고 유전자 서열을 표적 세포로 전달할 수 있는 임의의 핵산 구조체를 의미한다. 따라서, 상기 용어는 클로닝 및 발현 수송체뿐만 아니라 통합 벡터를 포함한다.

용어 "개체" 및 "환자"는 교체가능하게 이용되고, 그리고 포유동물, 예를 들면, 인간 환자 및 비인간 영장류뿐만 아니라 실험 동물, 예를 들면, 토끼, 개, 고양이, 쥐, 생쥐, 그리고 다른 동물을 지칭한다. 따라서, 본원에서 이용된 바와 같이, 용어 "개체" 또는 "환자"는 본 발명의 발현 카세트가 투여될 수 있는 임의의 포유류 환자 또는 개체를 의미한다. 본 발명의 개체는 장애를 앓는 개체를 포함한다.

본원에서 이용된 바와 같이, 용어 "치료하는" 및 "치료"는 증상의 심각도 및/또는 빈도에서 감소, 증상 및/또는 근원적인 원인의 제거, 증상 및/또는 이들의 근원적인 원인의 발생의 예방, 그리고 손상의 향상 또는 교정을 지칭한다. 암, 단일유전자 질환 및 이식편 대 숙주 질환은 본원에서 설명된 조성물과 방법을 이용하여 치료될 수 있는 질환의 무제한적 실례이다.

"염색질"은 세포 유전체를 포함하는 핵단백질 구조이다. 세포 염색질은 핵산, 일차적으로 DNA, 그리고 히스톤 및 비-히스톤 염색체 단백질을 비롯한 단백질을 포함한다. 대다수의 진핵 세포 염색질은 뉴클레오솜의 형태에서 존재하는데, 여기서 뉴클레오솜 코어는 히스톤 H2A, H2B, H3 및 H4를 각각 2개씩 포함하는 옥타머와 연관된 대략 150개 염기쌍의 DNA를 포함하고; 그리고 링커 DNA (생물체에 따라 가변적 길이의)가 뉴클레오솜 코어 사이에서 확장된다. 히스톤 H1의 분자는 링커 DNA와 전반적으로 연관된다. 본 발명의 목적으로, 용어 "염색질"은 모든 유형의 세포 핵단백질 (원핵 및 진핵 둘 모두)을 포괄하는 것으로 의미된다. 세포 염색질은 염색체 염색질 및 에피솜 염색질 둘 모두를 포함한다.

"접근가능한 영역"은 핵산 내에 존재하는 표적 부위가 표적 부위를 인식하는 외인성 분자에 의해 결합될 수 있는, 세포 염색질 내에 부위이다. 임의의 특정 이론에 한정됨 없이, 접근가능한 영역은 뉴클레오솜 구조 내로 포장되지 않는 영역인 것으로 생각된다. 접근가능한 영역의 상이한 구조는 종종, 화학적 및 효소적 프로브, 예를 들면, 뉴클레아제에 대한 이의 민감도에 의해 검출될 수 있다.

"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재한다면, 결합 분자가 결합할 핵산의 부분을 규정하는 핵산 서열이다. 가령, 서열 5'-GAATTC-3'은 Eco RI 제한 엔도뉴클레아제에 대한 표적 부위이다. "의도된" 또는 "온 표적" 서열은 결합 분자가 결합하도록 의도되는 서열이고, 그리고 "의도하지 않은" 또는 "오프 표적" 서열은 의도된 표적이 아닌, 결합 분자에 의해 결합된 임의의 서열을 포함한다.

DNA-결합 분자/도메인

관심되는 임의의 유전자 또는 좌위 내에 표적 부위에 특이적으로 결합하는 DNA-결합 분자/도메인을 포함하는 조성물이 본원에서 설명된다. 아연 핑거 DNA-결합 도메인, TALE DNA 결합 도메인, CRISPR/Cas 뉴클레아제의 DNA-결합 부분 (안내 또는 sgRNA), 또는 메가뉴클레아제로부터 DNA-결합 도메인을 포함하지만 이들에 한정되지 않는 임의의 DNA-결합 분자/도메인이 본원에서 개시된 조성물 및 방법에서 이용될 수 있다.

일정한 구체예에서, DNA 결합 도메인은 아연 핑거 단백질을 포함한다. 바람직하게는, 아연 핑거 단백질은 이것이 선택되는 표적 부위에 결합하도록 가공된다는 점에서 비자연발생이다. 가령, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; U.S. 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 U.S. 특허 공개 번호 2005/0064474; 2007/0218528; 2005/0267061을 참조하는데, 이들 모두 본원에서 전체적으로 참조로서 편입된다. 일정한 구체예에서, DNA-결합 도메인은 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 공개 번호 2012/0060230 (가령, 표 1)에서 개시된 아연 핑거 단백질을 포함한다.

가공된 아연 핑거 결합 도메인은 자연발생 아연 핑거 단백질과 비교하여 신규한 결합 특이성을 가질 수 있다. 가공 방법은 합리적인 설계 및 다양한 유형의 선별을 포함하지만 이들에 한정되지 않는다. 합리적인 설계는 예로서, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스를 이용하는 것을 포함하는데, 여기서 각 삼중항 또는 사중항 뉴클레오티드 서열은 특정 삼중항 또는 사중항 서열에 결합하는 아연 핑거의 하나 또는 그 이상의 아미노산 서열과 연관된다. 가령, 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 6,453,242 및 6,534,261을 참조한다.

파지 전시 및 이중 하이브리드 시스템을 비롯한 예시적인 선별 방법은 US 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에서 개시된다. 이에 더하여, 아연 핑거 결합 도메인에 대한 결합 특이성의 증강은 가령, U.S. 특허 번호 6,794,136에서 설명되었다.

이에 더하여, 이런 저런 참고문헌에서 개시된 바와 같이, 아연 핑거 도메인 및/또는 멀티-핑거 아연 핑거 단백질은 예로서, 길이에서 5개 또는 그 이상의 아미노산의 링커를 비롯한 임의의 적합한 링커 서열을 이용하여 함께 연결될 수 있다. 또한, 길이에서 6개 또는 그 이상의 아미노산의 예시적인 링커 서열에 대해 U.S. 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에서 설명된 단백질은 단백질의 개별 아연 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 이에 더하여, 아연 핑거 결합 도메인에 대한 결합 특이성의 증강은 가령, U.S. 특허 번호 6,794,136에서 설명되었다.

표적 부위의 선별; ZFP 및 융합 단백질 (및 이를 인코딩하는 폴리뉴클레오티드)의 설계와 작제를 위한 방법은 당업자에게 공지되어 있고, 그리고 U.S. 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에서 상세하게 설명된다.

이에 더하여, 이런 저런 참고문헌에서 개시된 바와 같이, 아연 핑거 도메인 및/또는 멀티-핑거 아연 핑거 단백질은 예로서, 길이에서 5개 또는 그 이상의 아미노산의 링커를 비롯한 임의의 적합한 링커 서열을 이용하여 함께 연결될 수 있다. 또한, 길이에서 6개 또는 그 이상의 아미노산의 예시적인 링커 서열에 대해 U.S. 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에서 설명된 단백질은 단백질의 개별 아연 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다.

통상적으로, ZFP는 최소한 3개의 핑거를 포함한다. 일정한 ZFP는 4개, 5개 또는 6개 핑거를 포함한다. 3개 핑거를 포함하는 ZFP는 전형적으로, 9 또는 10개 뉴클레오티드를 포함하는 표적 부위를 인식하고; 4개 핑거를 포함하는 ZFP는 전형적으로, 12 내지 14개 뉴클레오티드를 포함하는 표적 부위를 인식하고; 반면 6개 핑거를 갖는 ZFP는 18 내지 21개 뉴클레오티드를 포함하는 표적 부위를 인식할 수 있다. ZFP는 또한, 하나 또는 그 이상의 조절 도메인을 포함하는 융합 단백질일 수 있는데, 이들 도메인은 전사 활성화 또는 억제 도메인일 수 있다.

일부 구체예에서, DNA-결합 도메인은 뉴클레아제로부터 유래될 수 있다. 가령, 귀소 엔도뉴클레아제 및 메가뉴클레아제, 예를 들면, I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII의 인식 서열이 알려져 있다. 또한, U.S. 특허 번호 5,420,032; U.S. 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs 카탈로그를 참조한다. 이에 더하여, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비자연 표적 부위에 결합하도록 가공될 수 있다. 가령, Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; U.S. 특허 공개 번호 20070117128을 참조한다.

일정한 구체예에서, 본원에서 설명된 돌연변이체 개열 도메인과 함께 이용되는 아연 핑거 단백질은 중추 영역 (가령, -1 내지 6으로 넘버링된 7개-아미노산 인식 나선 영역 외부의 영역)에, 예를 들면, 위치 -14, -9 및/또는 -5 중에서 하나 또는 그 이상에서 하나 또는 그 이상의 돌연변이 (치환, 결실 및/또는 삽입)를 포함한다 (가령, 도면 5a를 참조한다). 하나 또는 그 이상의 이들 위치에서 야생형 잔기는 결실되고, 임의의 아미노산 잔기로 대체되고 및/또는 하나 또는 그 이상의 추가 잔기를 포함할 수 있다. 일부 구체예에서, 위치 -5에서 Arg (R)는 Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q), 또는 Ala (A)로 변화된다. 다른 구체예에서, 위치 (-9)에서 Arg (R)는 Ser (S), Asp (N), 또는 Glu (E)로 대체된다. 추가 구체예에서, 위치 (-14)에서 Arg (R)는 Ser (S) 또는 Gln (Q)으로 대체된다. 다른 구체예에서, 융합 폴리펩티드는 아연 핑거 DNA 결합 도메인에서 돌연변이를 포함할 수 있는데, 여기서 (-5), (-9) 및/또는 (-14) 위치에서 아미노산은 임의의 조합에서 상기 열거된 아미노산 중에서 한 가지로 변화된다.

다른 구체예에서, DNA 결합 도메인은 식물 병원체 크산토모나스 (Xanthomonas) (Boch et al, (2009) Science 326: 1509-1512 및 Moscou and Bogdanove, (2009) Science 326: 1501), 그리고 랄스토니아 (Ralstonia) (Heuer et al (2007) Applied and Environmental Microbiology 73(13): 4379-4384; U.S. 특허 공개 번호 20110301073 및 20110145940을 참조한다)로부터 유래된 것들과 유사한 전사 활성인자-유사 (TAL) 작동체 (TALE)로부터 가공된 도메인을 포함한다. 속 크산토모나스 (Xanthomonas)의 식물 병원성 세균은 중요한 작물 식물에서 많은 질병을 유발하는 것으로 알려져 있다. 크산토모나스 (Xanthomonas)의 병원성은 25개보다 많은 상이한 작동체 단백질을 식물 세포 내로 주입하는 보존된 III형 분비 (T3S) 시스템에 의존한다. 이들 주입된 단백질 중에는 식물 전사 활성인자를 모의하고 식물 전사체를 조작하는 전사 활성인자-유사 작동체 (TALE)가 있다 (Kay et al (2007) Science 318:648-651을 참조한다). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 내포한다. 가장 잘 특징화된 TALE 중에서 한 가지는 크산토모나스 캄페스트그리스 pv. 베시카토리아 (Xanthomonas campestgris pv. Vesicatoria)로부터 AvrBs3이다 (Bonas et al (1989) Mol Gen Genet 218: 127-136 및 WO2010079430을 참조한다). TALE는 일렬 반복의 집중 도메인을 내포하고, 각 반복은 대략 34개의 아미노산을 내포하는데, 이들은 이들 단백질의 DNA 결합 특이성에 핵심이다. 이에 더하여, 이들은 핵 국부화 서열 및 산성 전사 활성화 도메인을 내포한다 (리뷰를 위해, Schornack S, et al (2006) J Plant Physiol 163(3): 256-272를 참조한다). 이에 더하여, 식물병원성 세균 랄스토니아 솔라니세아럼 (Ralstonia solanacearum)에서, 랄스토니아 솔라니세아럼 (R. solanacearum) 생물변이형 1 균주 GMI1000에서 및 생물변이형 4 균주 RS1000에서 크산토모나스 (Xanthomonas)의 AvrBs3 패밀리에 상동하는 brg11 및 hpx17로서 지정된 2개의 유전자가 밝혀졌다 (Heuer et al (2007) Appl and Envir Micro 73(13): 4379-4384를 참조한다). 이들 유전자는 뉴클레오티드 서열에서 서로 98.9% 동일하지만, hpx17의 반복 도메인에서 1,575개 염기쌍의 결실에 의해 상이하다. 하지만, 양쪽 유전자 산물은 크산토모나스 (Xanthomonas)의 AvrBs3 패밀리 단백질과 40%보다 적은 서열 동일성을 갖는다.

이들 TAL 작동체의 특이성은 일렬 반복에서 발견되는 서열에 의존한다. 반복된 서열은 대략 102개 염기쌍을 포함하고, 그리고 반복은 전형적으로, 서로 91-100% 상동하다 (Bonas et al, 상게서). 이들 반복의 다형성은 통상적으로, 위치 12 및 13에서 위치되고, 그리고 위치 12 및 13에서 초가변 이중잔기 (반복 가변 이중잔기 또는 RVD 영역)의 정체 및 TAL-작동체의 표적 서열 내에 연속 뉴클레오티드의 정체 사이에는 1 대 1 상응이 있는 것처럼 보인다 (Moscou and Bogdanove, (2009) Science 326:1501 및 Boch et al (2009) Science 326:1509-1512를 참조한다). 실험적으로, 이들 TAL-작동체의 DNA 인식을 위한 자연 코드는 위치 12 및 13에서 HD 서열 (반복 가변 이중잔기 또는 RVD)이 시토신 (C)에 결합을 야기하고, NG가 T, NI 내지 A, C, G 또는 T에 결합하고, NN이 A 또는 G에 결합하고, 그리고 ING가 T에 결합하도록 결정되었다. 이들 DNA 결합 반복은 식물 세포 내에서 새로운 서열과 상호작용하고 비-내인성 리포터 유전자의 발현을 활성화시킬 수 있는 인공 전사 인자를 만들기 위해, 반복의 새로운 조합과 숫자를 갖는 단백질로 조립되었다 (Boch et al, 상게서). 가공된 TAL 단백질은 FokI 개열 절반 도메인에 연결되어, 비정형성 RVD를 갖는 TALEN을 비롯한 TAL 작동체 도메인 뉴클레아제 융합 (TALEN)이 산출되었다. 가령, U.S. 특허 번호 8,586,526을 참조한다.

일부 구체예에서, TALEN은 엔도뉴클레아제 (가령, FokI) 개열 도메인 또는 개열 절반-도메인을 포함한다. 다른 구체예에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 개열 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 개열 도메인은 단위체로서 활성적이고, 그리고 활성을 위해 이합체화를 필요로 하지 않는다. (Boissel et al., (2013) Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224를 참조한다).

또 다른 추가의 구체예에서, 뉴클레아제는 치밀한 TALEN을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 사슬 융합 단백질이다. 융합 단백질은 TALE DNA 결합 도메인이 TevI 뉴클레아제 도메인에 대하여 어디에 위치되는 지에 따라, TALE 영역에 의해 국부화된 틈내기효소로서 작용할 수 있거나, 또는 이중 가닥 절단을 창출할 수 있다 (Beurdeley et al (2013) Nat Comm: 1-8 DOI: 10.1038/ncomms2782를 참조한다). 이에 더하여, 뉴클레아제 도메인은 또한, DNA-결합 기능성을 전시할 수 있다. 임의의 TALEN이 하나 또는 그 이상의 메가-TALE와 함께, 추가 TALEN (가령, 하나 또는 그 이상의 TALEN (cTALEN 또는 FokI-TALEN)와 조합으로 이용될 수 있다.

이에 더하여, 이런 저런 참고문헌에서 개시된 바와 같이, 아연 핑거 도메인 및/또는 멀티-핑거 아연 핑거 단백질 또는 TALE는 예로서, 길이에서 5개 또는 그 이상의 아미노산의 링커를 비롯한 임의의 적합한 링커 서열을 이용하여 함께 연결될 수 있다. 또한, 길이에서 6개 또는 그 이상의 아미노산의 예시적인 링커 서열에 대해 U.S. 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에서 설명된 단백질은 단백질의 개별 아연 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 이에 더하여, 아연 핑거 결합 도메인에 대한 결합 특이성의 증강은 가령, U.S. 특허 번호 6,794,136에서 설명되었다. 일정한 구체예에서, DNA-결합 도메인은 DNA에 결합하는 단일 안내 RNA (sgRNA) DNA 결합 분자를 포함하는 CRISPR/Cas 뉴클레아제 시스템의 일부이다. 가령, U.S. 특허 번호 8,697,359 및 U.S. 특허 공개 번호 20150056705 및 20150159172를 참조한다. 상기 시스템의 RNA 성분을 인코딩하는 CRISPR (일정한 간격으로 분포하는 짧은 회귀성 반복) 좌위, 그리고 단백질을 인코딩하는 cas (CRISPR-연관된) 좌위 (Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: e60)가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주 내에 CRISPR 좌위는 CRISPR-연관된 (Cas) 유전자의 조합뿐만 아니라 CRISPR-매개된 핵산 개열의 특이성을 프로그래밍할 수 있는 비코딩 RNA 요소를 내포한다.

일부 구체예에서, DNA 결합 도메인은 TtAgo 시스템의 일부이다 (참조: Swarts et al, 상게서; Sheng et al, 상게서). 진핵생물에서, 유전자 침묵은 단백질의 아르고노트 (Ago) 패밀리에 의해 매개된다. 이러한 패러다임에서, Ago는 작은 (19-31 nt) RNA에 결합된다. 이러한 단백질-RNA 침묵 복합체는 작은 RNA 및 표적 사이에 왓슨 크릭 염기 대합을 통해 표적 RNA를 인식하고, 그리고 표적 RNA를 엔도뉴클레아제로 개열한다 (Vogel (2014) Science 344:972-973). 대조적으로, 원핵 Ago 단백질은 작은 단일 가닥 DNA 단편에 결합하고, 그리고 아마도 외래 (종종 바이러스) DNA를 검출하고 제거하는 기능을 한다 (Yuan et al., (2005) Mol. Cell 19, 405; Olovnikov, et al. (2013) Mol. Cell 51, 594; Swarts et al., 상게서). 예시적인 원핵 Ago 단백질은 아퀴펙스 에오리쿠스 (Aquifex aeolicus), 로도박터 스패로이데스 (Rhodobacter sphaeroides) 및 써무스 써모필러스 (Thermus thermophilus)로부터 것들을 포함한다.

가장 잘 특징화된 원핵 Ago 단백질 중에서 한 가지는 써무스 써모필러스 (T. thermophilus)로부터 유래된 것이다 (TtAgo; Swarts et al. 상게서). TtAgo는 5' 인산염 기를 갖는 15 nt 또는 13-25 nt 단일 가닥 DNA 단편과 연관된다. TtAgo에 의해 결합된 이러한 "안내 DNA"는 단백질-DNA 복합체를 DNA의 제삼자 분자에서 왓슨 크릭 상보성 DNA 서열에 결합하도록 지향시키는데 역할을 한다. 일단 이들 안내 DNA에서 서열 정보가 표적 DNA의 확인을 허용하면, TtAgo-안내 DNA 복합체는 표적 DNA를 개열한다. 이런 기전은 또한, 표적 DNA에 결합되어 있는 동안, TtAgo-안내 DNA 복합체의 구조에 의해 뒷받침된다 (G. Sheng et al., 상게서). 로도박터 스패로이데스 (Rhodobacter sphaeroides)로부터 Ago (RsAgo)는 유사한 성질을 갖는다 (Olivnikov et al. 상게서).

임의적인 DNA 서열의 외인성 안내 DNA가 TtAgo 단백질 위에 부하될 수 있다 (Swarts et al. 상게서.). TtAgo 개열의 특이성이 안내 DNA에 의해 주도되기 때문에, 외인성, 시험자-특정된 안내 DNA로 형성된 TtAgo-DNA 복합체는 이런 이유로, TtAgo 표적 DNA 개열을 상보성 시험자-특정된 표적 DNA로 지향시킬 것이다. 이러한 방식으로, DNA에서 표적화된 이중 가닥 절단이 창출될 수 있다. TtAgo-안내 DNA 시스템 (또는 다른 생물체로부터 이종상동성 Ago-안내 DNA 시스템)의 이용은 세포 내에서 유전체 DNA의 표적화된 개열을 허용한다. 이런 개열은 단일- 또는 이중 가닥일 수 있다. 포유류 유전체 DNA의 개열을 위해, 포유류 세포에서 발현을 위한 코돈 최적화된 버전의 TtAgo를 이용하는 것이 바람직할 것이다. 게다가, TtAgo 단백질이 세포-투과성 펩티드에 융합되는, 시험관내에서 형성된 TtAgo-DNA 복합체로 세포를 처리하는 것이 바람직할지도 모른다. 게다가, 37℃에서 향상된 활성을 갖도록 돌연변이유발을 통해 변경된 버전의 TtAgo 단백질을 이용하는 것이 바람직할지도 모른다. Ago-RNA-매개된 DNA 개열은 DNA 절단의 활용을 위한 당해 분야에서 기술 표준을 이용하여, 유전자 녹아웃, 표적화된 유전자 부가, 유전자 교정, 표적화된 유전자 결실을 비롯한 결과의 파노폴리에 영향을 주는데 이용될 수 있었다.

따라서, 임의의 DNA-결합 분자/도메인이 이용될 수 있다.

융합 분자

본원에서 설명된 바와 같은 DNA-결합 도메인 (가령, ZFP 또는 TALE, CRISPR/Cas 성분, 예를 들면, 단일 안내 RNA) 및 이종성 조절 (기능적) 도메인 (또는 이의 기능적 단편)을 포함하는 융합 분자 역시 제공된다. 통상적인 도메인은 예로서, 전사 인자 도메인 (활성인자, 억제인자, 보조활성인자, 보조억제인자), 사일런서, 종양유전자 (가령, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 패밀리 구성원 등); DNA 수복 효소 및 이들의 연관된 인자와 조절제; DNA 재배열 효소 및 이들의 연관된 인자와 조절제; 염색질 연관된 단백질 및 이들의 조절제 (가령, 키나아제, 아세틸라아제 및 탈아세틸화효소); 그리고 DNA 변형 효소 (가령, 메틸전달효소, 국소이성화효소, 헬리카아제, 리가아제, 키나아제, 포스파타아제, 중합효소, 엔도뉴클레아제) 및 이들의 연관된 인자와 조절제를 포함한다. DNA-결합 도메인 및 뉴클레아제 개열 도메인의 융합에 관한 상세를 위해, 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 공개 번호 20050064474; 20060188987 및 2007/0218528을 참조한다.

활성화를 달성하는데 적합한 도메인은 HSV VP16 활성화 도메인 (가령, Hagmann et al., J. Virol. 71, 5952-5962 (1997)을 참조한다), 핵 호르몬 수용체 (가령, Torchia et al., Curr. Opin. Cell. Biol. 10:373-383 (1998)을 참조한다); 핵 인자 카파 B의 p65 아단위 (Bitko & Barik, J. Virol. 72:5610-5618 (1998) 및 Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28 (1998)), 또는 인공 키메라 기능적 도메인, 예를 들면, VP64 (Beerli et al., (1998) Proc. Natl. Acad. Sci. USA 95:14623-33), 그리고 데그론 (Molinari et al., (1999) EMBO J. 18, 6439-6447)을 포함한다. 추가 예시적인 활성화 도메인은 Oct 1, Oct-2A, Sp1, AP-2 및 CTF1 (Seipel et al., EMBO J. 11, 4961-4968 (1992)뿐만 아니라 p300, CBP, PCAF, SRC1 PvALF, AtHD2A 및 ERF-2를 포함한다. 가령, Robyr et al. (2000) Mol. Endocrinol. 14:329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3-12; Malik et al. (2000) Trends Biochem. Sci. 25:277-283; 및 Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504를 참조한다. 추가 예시적인 활성화 도메인은 OsGAI, HALF-1, C1, AP1, ARF-5,-6,-7 및 -8, CPRF1, CPRF4, MYC-RP/GP, 그리고 TRAB1을 포함하지만 이들에 한정되지 않는다. 가령, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et al. (1999) Proc. Natl. Acad. Sci. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol. Biol. 41:33-44; 및 Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96:15,348-15,353을 참조한다.

DNA-결합 도메인 및 기능적 도메인 사이에 융합 단백질 (또는 이를 인코딩하는 핵산)의 형성에서, 활성화 도메인 또는 활성화 도메인과 상호작용하는 분자가 기능적 도메인으로서 적합하다는 것은 당업자에게 명백할 것이다. 활성화 복합체 및/또는 활성화 활성 (가령, 예로서, 히스톤 아세틸화)을 표적 유전자에 동원할 수 있는 본질적으로 모든 분자가 융합 단백질의 활성화 도메인으로서 유용하다. 융합 분자에서 기능적 도메인으로서 이용에 적합한 인슐레이터 도메인, 국부화 도메인, 그리고 염색질 재형성 단백질, 예를 들면, ISWI-내포 도메인 및/또는 메틸 결합 도메인 단백질은 가령, U.S. 특허 공보 2002/0115215 및 2003/0082552에서 및 WO 02/44376에서 설명된다.

예시적인 억제 도메인은 KRAB A/B, KOX, TGF-베타-유도성 초기 유전자 (TIEG), v-erbA, SID, MBD2, MBD3, DNMT 패밀리의 구성원 (가령, DNMT1, DNMT3A, DNMT3B), Rb 및 MeCP2를 포함하지만 이들에 한정되지 않는다. 가령, Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; 및 Robertson et al. (2000) Nature Genet. 25:338-342를 참조한다. 추가 예시적인 억제 도메인은 ROM2 및 AtHD2A를 포함하지만 이들에 한정되지 않는다. 가령, Chem et al. (1996) Plant Cell 8:305-321; 및 Wu et al. (2000) Plant J. 22:19-27을 참조한다.

융합 분자는 당업자에게 널리 알려져 있는 클로닝 및 생화학적 접합의 방법에 의해 작제된다. 융합 분자는 DNA-결합 도메인 및 기능적 도메인 (가령, 전사 활성화 또는 억제 도메인)을 포함한다. 융합 분자는 또한, 핵 국부화 신호 (가령, 예로서, SV40 중간 T-항원으로부터 유래된 것) 및 에피토프 태그 (가령, 예로서, FLAG 및 적혈구응집소)를 임의선택적으로 포함한다. 융합 단백질 (및 이들을 인코딩하는 핵산)은 번역 해독틀이 융합의 성분 사이에서 보존되도록 설계된다.

한편으로, 기능적 도메인 (또는 이의 기능적 단편)의 폴리펩티드 성분 및 다른 한편으로, 비단백질 DNA-결합 도메인 (가령, 항생제, 삽입제, 마이너 그루브 결합제, 핵산) 사이에 융합이 당업자에게 공지된 생화학적 접합의 방법에 의해 구축된다. 가령, Pierce Chemical Company (Rockford, IL) 카탈로그를 참조한다. 마이너 그루브 결합제 및 폴리펩티드 사이에 융합을 만들기 위한 방법 및 조성물은 설명되었다. Mapp et al. (2000) Proc. Natl. Acad. Sci. USA 97:3930-3935. 게다가, CRISPR/Cas 시스템의 단일 안내 RNA는 기능적 도메인과 연관되어, 활성 전사 조절인자 및 뉴클레아제를 형성한다.

일정한 구체예에서, 표적 부위는 세포 염색질의 접근가능한 영역 내에 존재한다. 접근가능한 영역은 가령, U.S. 특허 번호 7,217,509 및 7,923,542에서 설명된 바와 같이 결정될 수 있다. 만약 표적 부위가 세포 염색질의 접근가능한 영역 내에 존재하지 않으면, 하나 또는 그 이상의 접근가능한 영역이 U.S. 특허 번호 7,785,792 및 8,071,370에서 설명된 바와 같이 산출될 수 있다. 추가 구체예에서, 융합 분자의 DNA-결합 도메인은 이의 표적 부위가 접근가능한 영역 내에 있는 지의 여부에 상관없이, 세포 염색질에 결합할 수 있다. 가령, 이런 DNA-결합 도메인은 링커 DNA 및/또는 뉴클레오솜 DNA에 결합할 수 있다. 이러한 유형의 "개척자" DNA 결합 도메인의 실례는 일정한 스테로이드 수용체에서 및 간세포 핵 인자 3 (HNF3)에서 발견된다 (Cordingley et al. (1987) Cell 48:261-270; Pina et al. (1990) Cell 60:719-731; 및 Cirillo et al. (1998) EMBO J. 17:244-254).

융합 분자는 당업자에게 공지된 바와 같이, 제약학적으로 허용되는 담체로 조제될 수 있다. 가령, Remington's Pharmaceutical Sciences, 17th ed., 1985; 및 U.S. 특허 번호 6,453,242 및 6,534,261을 참조한다.

융합 분자의 기능적 성분/도메인은 일단 융합 분자가 이의 DNA 결합 도메인을 통해 표적 서열에 결합하면 유전자의 전사에 영향을 줄 수 있는 다양한 상이한 성분 중에서 한 가지에서 선택될 수 있다. 따라서, 기능적 성분은 다양한 전사 인자 도메인, 예를 들면, 활성인자, 억제인자, 보조활성인자, 보조억제인자 및 사일런서를 포함할 수 있지만 이들에 한정되지 않는다.

추가 예시적인 기능적 도메인은 가령, U.S. 특허 번호 6,534,261 및 6,933,113에서 개시된다.

외인성 소형 분자 또는 리간드에 의해 조절되는 기능적 도메인 또한 선별될 수 있다. 가령, RheoSwitch® 기술이 이용될 수 있는데, 여기서 기능적 도메인은 단지, 외부 RheoChem™ 리간드의 존재에서만 활성 입체형태를 취한다 (가령, US 20090136465를 참조한다). 따라서, ZFP는 조절가능 기능적 도메인에 작동가능하게 연결될 수 있고, 여기서 ZFP-TF의 결과적인 활성은 외부 리간드에 의해 제어된다.

뉴클레아제

일정한 구체예에서, 융합 단백질은 DNA-결합 결합 도메인 및 개열 (뉴클레아제) 도메인을 포함한다. 따라서, 유전자 변형이 뉴클레아제, 예를 들면, 가공된 뉴클레아제를 이용하여 달성될 수 있다. 가공된 뉴클레아제 기술은 자연발생 DNA-결합 단백질의 가공에 근거된다. 가령, 맞춤된 DNA-결합 특이성을 갖는 귀소 엔도뉴클레아제의 가공이 설명되었다. Chames et al. (2005) Nucleic Acids Res 33(20):e178; Arnould et al. (2006) J. Mol. Biol. 355:443-458. 이에 더하여, ZFP의 가공 역시 설명되었다. 가령, U.S. 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,979,539; 6,933,113; 7,163,824; 및 7,013,219를 참조한다.

이에 더하여, ZFP 및/또는 TALE는 뉴클레아제 도메인에 융합되어, ZFN 및 TALEN - 가공된 (ZFP 또는 TALE) DNA 결합 도메인을 통해 의도된 핵산 표적을 인식하고, 그리고 상기 DNA가 뉴클레아제 활성을 통해 DNA 결합 부위 인근에서 절단되도록 유발할 수 있는 기능적 실체가 창출되었다. 가령, Kim et al. (1996) Proc Nat'l Acad Sci USA 93(3):1156-1160을 참조한다. 더욱 최근에, 이런 뉴클레아제가 다양한 생물체에서 유전체 변형에 이용되었다. 가령, 미국 특허 공보 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공개 WO 07/014275를 참조한다.

따라서, 본원에서 설명된 방법과 조성물은 광범위하게 적용가능하고, 그리고 관심되는 임의의 뉴클레아제를 수반할 수 있다. 뉴클레아제의 무제한적 실례는 메가뉴클레아제, TALEN 및 아연 핑거 뉴클레아제를 포함한다. 뉴클레아제는 이종성 DNA-결합 및 개열 도메인 (가령, 아연 핑거 뉴클레아제; 이종성 개열 도메인을 갖는 메가뉴클레아제 DNA-결합 도메인)을 포함할 수 있거나, 또는 대안으로, 자연발생 뉴클레아제의 DNA-결합 도메인은 선별된 표적 부위에 결합하도록 변경될 수 있다 (가령, 동계 결합 부위와 상이한 부위에 결합하도록 가공된 메가뉴클레아제).

본원에서 설명된 뉴클레아제 중에서 한 가지에서, 뉴클레아제는 가공된 TALE DNA-결합 도메인 및 TALEN으로서 또한 지칭되는 뉴클레아제 도메인 (가령, 엔도뉴클레아제 및/또는 메가뉴클레아제 도메인)을 포함할 수 있다. 사용자가 선택하는 표적 서열과의 견실한, 부위 특이적 상호작용을 위해 이들 TALEN 단백질을 가공하기 위한 방법 및 조성물이 공개되었다 (U.S. 특허 번호 8,586,526을 참조한다). 일부 구체예에서, TALEN은 엔도뉴클레아제 (가령, FokI) 개열 도메인 또는 개열 절반-도메인을 포함한다. 다른 구체예에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 개열 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 개열 도메인은 단위체로서 활성적이고, 그리고 활성을 위한 이합체화를 필요로 하지 않는다. (Boissel et al., (2013) Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224를 참조한다). 이에 더하여, 뉴클레아제 도메인은 또한, DNA-결합 기능성을 전시할 수 있다.

또 다른 추가의 구체예에서, 뉴클레아제는 치밀한 TALEN (cTALEN)을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 사슬 융합 단백질이다. 융합 단백질은 TALE DNA 결합 도메인이 TevI 뉴클레아제 도메인에 대하여 어디에 위치되는 지에 따라, TALE 영역에 의해 국부화된 틈내기효소로서 작용할 수 있거나, 또는 이중 가닥 절단을 창출할 수 있다 (Beurdeley et al (2013) Nat Comm: 1-8 DOI: 10.1038/ncomms2782를 참조한다). 임의의 TALEN이 추가 TALEN (가령, 하나 또는 그 이상의 메가-TAL과 함께 하나 또는 그 이상의 TALEN (cTALEN 또는 FokI-TALEN) 또는 다른 DNA 개열 효소와 조합으로 이용될 수 있다.

일정한 구체예에서, 뉴클레아제는 메가뉴클레아제 (귀소 엔도뉴클레아제), 또는 개열 활성을 전시하는 이의 부분을 포함한다. 자연발생 메가뉴클레아제는 15-40개 염기쌍 개열 부위를 인식하고, 그리고 통상적으로, 4가지 패밀리: LAGLIDADG 패밀리, GIY-YIG 패밀리, His-Cyst 상자 패밀리 및 HNH 패밀리로 군화된다. 예시적인 귀소 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함한다. 이들의 인식 서열은 알려져 있다. 또한, U.S. 특허 번호 5,420,032; U.S. 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs 카탈로그를 참조한다.

자연발생 메가뉴클레아제로부터, 일차적으로 LAGLIDADG 패밀리로부터 DNA-결합 도메인이 식물, 효모, 초파리 (Drosophila), 포유류 세포 및 생쥐에서 부위 특이적 유전체 변형을 증진하는데 이용되긴 하지만, 이러한 접근법은 메가뉴클레아제 인식 서열을 보존하는 상동성 유전자 (Monet et al. (1999), Biochem. Biophysics. Res. Common. 255: 88-93), 또는 인식 서열이 도입된 미리-가공된 유전체 (Route et al. (1994), Mol. Cell. Biol. 14: 8096-106; Chilton et al. (2003), Plant Physiology. 133: 956-65; Puchta et al. (1996), Proc. Natl. Acad. Sci. USA 93: 5055-60; Rong et al. (2002), Genes Dev. 16: 1568-81; Gouble et al. (2006), J. Gene Med. 8(5):616-622)의 변형에만 한정되었다. 따라서, 의학적으로 또는 생물공학적으로 유관한 부위에서 신규한 결합 특이성을 전시하도록 메가뉴클레아제를 가공하려는 시도가 있었다 (Porteus et al. (2005), Nat. Biotechnol. 23: 967-73; Sussman et al. (2004), J. Mol. Biol. 342: 31-41; Epinat et al. (2003), Nucleic Acids Res. 31: 2952-62; Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; U.S. 특허 공개 번호 20070117128; 20060206949; 20060153826; 20060078552; 및 20040002092). 이에 더하여, 메가뉴클레아제로부터 자연발생 또는 가공된 DNA-결합 도메인은 이종성 뉴클레아제 (가령, FokI)로부터 개열 도메인과 작동가능하게 연결될 수 있고 및/또는 메가뉴클레아제로부터 개열 도메인은 이종성 DNA-결합 도메인 (가령, ZFP 또는 TALE)과 작동가능하게 연결될 수 있다.

다른 구체예에서, 뉴클레아제는 아연 핑거 뉴클레아제 (ZFN) 또는 TALE DNA 결합 도메인-뉴클레아제 융합 (TALEN)이다. ZFN 및 TALEN은 선택되는 유전자 내에 표적 부위에 결합하도록 가공된 DNA 결합 도메인 (아연 핑거 단백질 또는 TALE DNA 결합 도메인), 그리고 개열 도메인 또는 개열 절반-도메인 (가령, 본원에서 설명된 바와 같은 제한 및/또는 메가뉴클레아제로부터)을 포함한다.

상기에서 상세하게 설명된 바와 같이, 아연 핑거 결합 도메인 및 TALE DNA 결합 도메인은 선택되는 서열에 결합하도록 가공될 수 있다. 가령, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416을 참조한다. 가공된 아연 핑거 결합 도메인 또는 TALE 단백질은 자연발생 단백질과 비교하여 신규한 결합 특이성을 가질 수 있다. 가공 방법은 합리적인 설계 및 다양한 유형의 선별을 포함하지만 이들에 한정되지 않는다. 합리적인 설계는 예로서, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 아연 핑거 또는 TALE 아미노산 서열을 포함하는 데이터베이스를 이용하는 것을 포함하는데, 여기서 각 삼중항 또는 사중항 뉴클레오티드 서열은 특정 삼중항 또는 사중항 서열에 결합하는 아연 핑거 또는 TALE 반복 단위의 하나 또는 그 이상의 아미노산 서열과 연관된다. 가령, 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 6,453,242 및 6,534,261을 참조한다.

표적 부위의 선별; 및 융합 단백질 (및 이를 인코딩하는 폴리뉴클레오티드)의 설계와 작제를 위한 방법은 당업자에게 공지되어 있고, 그리고 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 번호 7,888,121 및 8,409,861에서 상세하게 설명된다.

이에 더하여, 이런 저런 참고문헌에서 개시된 바와 같이, 아연 핑거 도메인, TALE 및/또는 멀티-핑거 아연 핑거 단백질은 예로서, 길이에서 5개 또는 그 이상의 아미노산의 링커를 비롯한 임의의 적합한 링커 서열을 이용하여 함께 연결될 수 있다. (가령, TGEKP (서열 번호:9), TGGQRP (서열 번호:10), TGQKP (서열 번호:11) 및/또는 TGSQKP (서열 번호:12). 가령, 길이에서 6개 또는 그 이상의 아미노산의 예시적인 링커 서열에 대해 U.S. 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에서 설명된 단백질은 단백질의 개별 아연 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 또한, U.S. 특허 번호 8,772,453을 참조한다.

따라서, 뉴클레아제, 예를 들면, ZFN, TALEN 및/또는 메가뉴클레아제는 임의의 DNA-결합 도메인 및 임의의 뉴클레아제 (개열) 도메인 (개열 도메인, 개열 절반-도메인)을 포함할 수 있다. 전술한 바와 같이, 개열 도메인은 한 뉴클레아제로부터 DNA-결합 도메인, 예를 들면, 아연 핑거 또는 TAL-작동체 DNA-결합 도메인 및 개열 도메인, 또는 상이한 뉴클레아제로부터 메가뉴클레아제 DNA-결합 도메인 및 개열 도메인에 이종성일 수 있다. 이종성 개열 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 획득될 수 있다. 개열 도메인이 도출될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하지만 이들에 한정되지 않는다. 가령, 2002-2003 카탈로그, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388을 참조한다. DNA를 개열하는 추가 효소는 알려져 있다 (가령, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNA분해효소 I; 미구균 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한, Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993을 참조한다). 이들 효소 (또는 이들의 기능적 단편) 중에서 하나 또는 그 이상이 개열 도메인 및 개열 절반-도메인의 공급원으로서 이용될 수 있다.

유사하게, 개열 절반-도메인은 개열 활성을 위해 이합체화를 필요로 하는, 앞서 진술된 바와 같은 임의의 뉴클레아제 또는 이의 일부로부터 유래될 수 있다. 일반적으로, 만약 융합 단백질이 개열 절반-도메인을 포함하면, 개열을 위해 2개의 융합 단백질이 필요하다. 대안으로, 2개의 개열 절반-도메인을 포함하는 단일 단백질이 이용될 수 있다. 2개의 개열 절반-도메인이 동일한 엔도뉴클레아제 (또는 이들의 기능적 단편)로부터 유래될 수 있거나, 또는 각 개열 절반-도메인이 상이한 엔도뉴클레아제 (또는 이의 기능적 단편)로부터 유래될 수 있다. 이에 더하여, 2개의 융합 단백질에 대한 표적 부위는 바람직하게는, 개별 표적 부위에 이들 2개의 융합 단백질의 결합이 개열 절반 도메인을, 예로서 이합체화에 의해 이들 개열 절반 도메인이 기능적 개열 도메인을 형성하도록 허용하는 서로에 대한 공간적 배향정위에 두도록, 서로에 대하여 배치된다. 따라서, 일정한 구체예에서, 표적 부위의 근접 가장자리는 5-10개 뉴클레오티드에 의해 또는 15-18개 뉴클레오티드에 의해 분리된다. 하지만, 임의의 진정수의 뉴클레오티드 또는 뉴클레오티드 쌍 (가령, 2 내지 50개 뉴클레오티드 쌍 또는 그 이상)이 2개의 표적 부위 사이에 끼어들 수 있다. 일반적으로, 개열 부위는 표적 부위 사이에 있다.

제한 엔도뉴클레아제 (제한 효소)는 많은 종에서 존재하고, 그리고 DNA (인식 부위에서)에 서열-특이적 결합을 할 수 있고 결합 부위에서 또는 이와 가깝게 DNA를 개열할 수 있다. 일정한 제한 효소 (가령, 유형 IIS)는 인식 부위로부터 이전된 부위에서 DNA를 개열하고, 그리고 분리가능한 결합 및 개열 도메인을 갖는다. 가령, 유형 IIS 효소 Fok I는 한쪽 가닥 상에서 인식 부위로부터 9개 뉴클레오티드 및 다른 가닥 상에서 인식 부위로부터 13개 뉴클레오티드에서 DNA의 이중 가닥 개열을 촉매작용한다. 가령, US 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982를 참조한다. 따라서, 한 구체예에서, 융합 단백질은 최소한 하나의 유형 IIS 제한 효소로부터 개열 도메인 (또는 개열 절반-도메인) 및 가공되거나 또는 가공되지 않을 수 있는 하나 또는 그 이상의 아연 핑거 결합 도메인을 포함한다.

개열 도메인이 결합 도메인으로부터 분리가능한 예시적인 유형 IIS 제한 효소는 Fok I이다. 이러한 특정 효소는 이합체로서 활성적이다. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575. 따라서, 본 발명의 목적으로, 개시된 융합 단백질에서 이용되는 Fok I 효소의 일부는 개열 절반-도메인인 것으로 고려된다. 따라서, 아연 핑거-Fok I 융합을 이용한 세포 서열의 표적화된 이중 가닥 개열 및/또는 표적화된 대체를 위해, FokI 개열 절반 도메인을 각각 포함하는 2개의 융합 단백질이 촉매적으로 활성 개열 도메인을 재구성하는데 이용될 수 있다. 대안으로, 아연 핑거 결합 도메인 및 2개의 Fok I 개열 절반-도메인을 내포하는 단일 폴리펩티드 분자 역시 이용될 수 있다. 아연 핑거-Fok I 융합을 이용한 표적화된 개열 및 표적화된 서열 변경에 대한 파라미터는 본 개시의 다른 곳에서 제공된다.

개열 도메인 또는 개열 절반 도메인은 개열 활성을 유지하거나, 또는 다합체화 (가령, 이합체화)하여 기능적 개열 도메인을 형성하는 능력을 유지하는 단백질의 임의의 부분일 수 있다.

예시적인 유형 IIS 제한 효소는 본원에서 전체적으로 편입되는 국제 공개 WO 07/014275에서 설명된다. 추가 제한 효소 역시 분리가능한 결합 및 개열 도메인을 내포하고, 그리고 이들은 본 발명에 의해 예기된다. 가령, Roberts et al. (2003) Nucleic Acids Res. 31:418-420을 참조한다.

일정한 구체예에서, 개열 도메인은 아래에 도시된 서열을 갖는 결정 구조 1FOK.pdb 및 2FOK.pdb (Wah et al (1997) Nature 388:97-100을 참조한다)를 산출하는데 이용되는 FokI 개열 도메인을 포함한다:

야생형 FokI 개열 절반 도메인 (서열 번호:1)

QLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF

FokI로부터 유래된 개열 절반 도메인은 서열 번호:1에서 보여 지는 바와 같은 아미노산 잔기 중에서 하나 또는 그 이상에서 돌연변이를 포함할 수 있다. 돌연변이는 치환 (상이한 잔기에 대한 야생형 아미노산 잔기의), 삽입 (하나 또는 그 이상의 아미노산 잔기의) 및/또는 결실 (하나 또는 그 이상의 아미노산 잔기의)을 포함한다. 일정한 구체예에서, 잔기 414-426, 443-450, 467-488, 501-502 및/또는 521-531 (서열 번호:1 및 도면 17에서 도시된 서열에 상대적으로 넘버링됨) 중에서 하나 또는 그 이상이 돌연변이되는데, 그 이유는 이들 잔기가 Miller et al. ((2007) Nat Biotechnol 25:778-784)에서 설명된 표적 부위에 결합된 ZFN의 분자 모형에서 DNA 중추에 가깝게 위치되기 때문이다. 일정한 구체예에서, 위치 416, 422, 447, 448 및/또는 525에서 하나 또는 그 이상의 잔기가 돌연변이된다. 일정한 구체예에서, 돌연변이는 임의의 상이한 잔기, 예를 들면, 알라닌 (A) 잔기, 시스테인 (C) 잔기, 아스파르트산 (D) 잔기, 글루타민산 (E) 잔기, 히스티딘 (H) 잔기, 페닐알라닌 (F) 잔기, 글리신 (G) 잔기, 아스파라긴 (N) 잔기, 세린 (S) 잔기 또는 트레오닌 (T) 잔기로 야생형 잔기의 치환을 포함한다. 다른 구체예에서, 위치 416, 418, 422, 446, 448, 476, 479, 480, 481 및/또는 525 중에서 하나 또는 그 이상에서 야생형 잔기가 R416D, R416E, S418E, S418D, R422H, S446D, K448A, N476D, I479Q, I479T, G480D, Q481A, Q481E, K525S, K525A, N527D, R416E+R422H, R416D+R422H, R416E+K448A, R416D+R422H, K448A+I479Q, K448A+Q481A, K448A+K525A를 포함하지만 이들에 한정되지 않는 임의의 다른 잔기로 대체된다.

일정한 구체예에서, 개열 도메인은 가령, U.S. 특허 번호 7,914,796; 8,034,598 및 8,623,618; 및 U.S. 특허 공개 번호 20110201055에서 설명된 바와 같이, 동종이합체화를 최소화하거나 또는 예방하는 하나 또는 그 이상의 가공된 개열 절반-도메인 (이합체화 도메인 돌연변이체로서 또한 지칭됨)을 포함하는데, 이들 문헌 모두 본원에서 전체적으로 참조로서 편입된다. Fok I의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538 (서열 번호:1 및 도면 17에서 도시된 서열에 상대적으로 넘버링됨)에서 아미노산 잔기 모두 Fok I 개열 절반-도메인의 이합체화에 영향을 주기 위한 표적이다. 돌연변이는 FokI에 상동한 자연 제한 효소에서 발견되는 잔기로의 돌연변이를 포함할 수 있다. 바람직한 구체예에서, 위치 416, 422, 447, 448 및/또는 525 (서열 번호:1 및 도면 17에서 도시된 서열에 상대적으로 넘버링됨)에서 돌연변이는 양성으로 하전된 아미노산의 하전되지 않은 또는 음성으로 하전된 아미노산으로의 대체를 포함한다. 다른 구체예에서, 가공된 개열 절반 도메인은 하나 또는 그 이상의 아미노산 잔기 416, 422, 447, 448 또는 525에서 돌연변이에 더하여 아미노산 잔기 499, 496 및 486에서 돌연변이를 포함하는데, 이들 모두 서열 번호:1 또는 도면 17에서 도시된 서열에 상대적으로 넘버링된다.

일정한 구체예에서, 본원에서 설명된 조성물은 가령, U.S. 특허 번호 7,914,796; 8,034,598; 8,961,281 및 8,623,618; U.S. 특허 공개 번호 20080131962 및 20120040398에서 설명된 바와 같이, 절대 이형이합체를 형성하는 Fok I의 가공된 개열 절반-도메인을 포함한다. 따라서, 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525 (서열 번호:1 및 도면 17에서 도시된 서열에 상대적으로 넘버링됨)에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 486에서 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되고, 그리고 위치 496에서 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 폴리펩티드 ("ELD" 또는 "ELE")를 포함한다. 다른 구체예에서, 가공된 개열 절반 도메인은 야생형 FokI 개열 절반 도메인으로부터 유래되고, 그리고 아미노산 잔기 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 야생형 FokI (서열 번호:1 및 도면 17에서 도시된 서열)에 상대적으로 넘버링된 아미노산 잔기 490, 538 및 537에서 돌연변이를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 490에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되고, 그리고 위치 537에서 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 폴리펩티드 ("KKK" 또는 "KKR")를 포함한다 (본원에서 참조로서 편입되는 U.S. 8,962,281을 참조한다). 가령, U.S. 특허 번호 7,914,796; 8,034,598 및 8,623,618을 참조하는데, 이들의 개시는 모든 점에서 전체적으로 참조로서 편입된다. 다른 구체예에서, 가공된 개열 절반 도메인은 "샤키 (Sharkey)" 및/또는 "샤키'" 돌연변이를 포함한다 (Guo et al, (2010) J. Mol. Biol. 400(1):96-107을 참조한다).

다른 구체예에서, 가공된 개열 절반 도메인은 야생형 FokI 개열 절반 도메인으로부터 유래되고, 그리고 아미노산 잔기 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 야생형 FokI 또는 FokI 동족체에 상대적으로 넘버링된 아미노산 잔기 490 및 538에서 돌연변이를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 490에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 그리고 위치 538에서 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되는 폴리펩티드 ("KK")를 포함한다. 바람직한 구체예에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 위치 416, 422, 447, 448 또는 525에서 하나 또는 그 이상의 돌연변이에 더하여, 위치 486에서 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 그리고 위치 499에서 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되는 폴리펩티드 ("EL")를 포함한다 (본원에서 참조로서 편입된 U.S. 8,034,598을 참조한다).

한 양상에서, 본 발명은 융합 단백질을 제공하는데, 여기서 가공된 개열 절반-도메인은 FokI 촉매 도메인 내에 위치 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 447, 448, 469, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 중에서 하나 또는 그 이상에서 야생형 아미노산 잔기가 돌연변이되는 폴리펩티드를 포함한다. 첨부된 표 및 도면 중에서 어느 것에서 도시된 바와 같은 하나 또는 그 이상의 돌연변이를 포함하는 뉴클레아제 도메인이 제공된다. 일부 구체예에서, 하나 또는 그 이상의 돌연변이는 야생형 아미노산을 양성으로 하전된 잔기로부터 중성 잔기 또는 음성으로 하전된 잔기로 변경한다. 이들 구체예 중에서 한 가지에서, 설명된 돌연변이체는 또한, 하나 또는 그 이상의 추가 돌연변이를 포함하는 FokI 도메인에서 만들어질 수 있다. 바람직한 구체예에서, 이들 추가 돌연변이는 이합체화 도메인 내에, 예를 들면, 위치 418, 432, 441, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및/또는 559에서 존재한다. 돌연변이의 무제한적 실례는 위치 393, 394, 398, 416, 421, 422, 442, 444, 472, 473, 478, 480, 525 또는 530에서 임의의 개열 도메인 (가령, FokI 또는 FokI의 동족체)의 야생형 잔기의 임의의 아미노산 잔기 (가령, K393X, K394X, R398X, R416S, D421X, R422X, K444X, S472X, G473X, S472, P478X, G480X, K525X 및 A530X)로의 돌연변이 (가령, 치환)를 포함하는데, 여기서 첫 번째 잔기는 야생형을 묘사하고, 그리고 X는 야생형 잔기를 대체하는 임의의 아미노산을 지칭한다). 일부 구체예에서, X는 E, D, H, A, K, S, T, D 또는 N이다. 다른 예시적인 돌연변이는 S418E, S418D, S446D, K448A, I479Q, I479T, Q481A, Q481N, Q481E, A530E 및/또는 A530K를 포함하는데, 여기서 아미노산 잔기는 전장 FokI 야생형 개열 도메인 및 이의 동족체에 상대적으로 넘버링된다 (도면 17). 일정한 구체예에서, 조합은 416과 422, 위치 416과 K448A, K448A와 I479Q, K448A와 Q481A 및/또는 K448A에서 돌연변이, 그리고 위치 525에서 돌연변이를 포함할 수 있다. 한 구체예에서, 위치 416에서 야생형 잔기는 Glu (E) 잔기로 대체될 수 있고 (R416E), 위치 422에서 야생형 잔기는 His (H) 잔기로 대체되고 (R422H), 그리고 위치 525에서 야생형 잔기는 Ala (A) 잔기로 대체된다. 본원에서 설명된 바와 같은 개열 도메인은 위치 432, 441, 483, 486, 487, 490, 496, 499, 527, 537, 538 및/또는 559를 포함하지만 이들에 한정되지 않는 위치에서 추가 돌연변이, 예를 들면, 이합체화 도메인 돌연변이체 (가령, ELD, KKR) 및 또는 틈내기효소 돌연변이체 (촉매 도메인에 돌연변이)를 더욱 포함할 수 있다. 본원에서 설명된 돌연변이를 갖는 개열 절반-도메인은 당해 분야에서 공지된 바와 같은 이형이합체를 형성한다.

대안으로, 뉴클레아제는 이른바 "분할-효소" 기술을 이용하여 핵산 표적 부위에서 생체내에서 조립될 수 있다 (가령, U.S. 특허 공개 번호 20090068164를 참조한다). 이런 분할 효소의 성분은 별개의 발현 구조체에서 발현될 수 있거나, 또는 예로서, 자가-개열 2A 펩티드 또는 IRES 서열에 의해 개별 성분이 분리되는 하나의 개방 해독틀에서 연결될 수 있다. 성분은 개별 아연 핑거 결합 도메인, 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.

뉴클레아제 (가령, ZFN 및/또는 TALEN)는 가령, U.S. 특허 번호 8,563,314에서 설명된 바와 같은 효모-기초된 염색체 시스템에서 이용에 앞서, 활성에 대해 선별검사될 수 있다.

일정한 구체예에서, 뉴클레아제는 CRISPR/Cas 시스템을 포함한다. 상기 시스템의 RNA 성분을 인코딩하는 CRISPR (일정한 간격으로 분포하는 짧은 회귀성 반복) 좌위, 그리고 단백질을 인코딩하는 Cas (CRISPR-연관된) 좌위 (Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: e60)가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주 내에 CRISPR 좌위는 CRISPR-연관된 (Cas) 유전자의 조합뿐만 아니라 CRISPR-매개된 핵산 개열의 특이성을 프로그래밍할 수 있는 비코딩 RNA 요소를 내포한다.

II형 CRISPR은 가장 잘 특징화된 시스템 중에서 한 가지이고, 그리고 4가지 순차적 단계에서 표적화된 DNA 이중 가닥 절단을 실행한다. 첫 번째, 2개의 비코딩 RNA, 프리-crRNA 어레이 및 tracrRNA가 CRISPR 좌위로부터 전사된다. 두 번째, tracrRNA가 프리-crRNA의 반복 영역에 혼성화하고, 그리고 프리-crRNA의 개별 스페이서 서열을 내포하는 성숙 crRNA로의 처리를 매개한다. 세 번째, 성숙 crRNA:tracrRNA 복합체가 crRNA 상에서 스페이서, 그리고 표적 인식을 위한 추가 요건인 프로토스페이서 인접 모티프 (PAM) 바로 옆에 표적 DNA 상에서 프로토스페이서 사이에 왓슨 크릭 염기 대합을 통해, Cas9를 표적 DNA로 지향시킨다. 최종적으로, Cas9가 표적 DNA의 개열을 매개하여 프로토스페이서 내에서 이중 가닥 절단을 창출한다. CRISPR/Cas 시스템의 활성은 3가지 단계를 포함한다: (i) '적응'으로 불리는 과정에서, 장래 공격을 예방하기 위해 CRISPR 어레이 내로 외래 DNA 서열의 삽입, (ii) 유관한 단백질의 발현뿐만 아니라 어레이의 발현과 처리, 그 이후에 (iii) 외래 핵산으로 RNA-매개된 간섭. 따라서, 세균 세포에서, 이른바 'Cas' 단백질 중에서 몇몇은 CRISPR/Cas 시스템의 자연 기능과 관련되고, 그리고 외래 DNA의 삽입 등과 같은 기능에서 역할을 제공한다.

일부 구체예에서, CRISPR-Cpf1 시스템이 이용된다. 프란시셀라 (Francisella) 종에서 확인된 CRISPR-Cpf1 시스템은 인간 세포에서 견실한 DNA 간섭을 매개하는 부류 2 CRISPR-Cas 시스템이다. 비록 기능적으로 보존되긴 하지만, Cpf1 및 Cas9는 그들의 안내 RNA 및 기질 특이성을 비롯한 많은 양상에서 서로 다르다 (Fagerlund et al, (2015) Genom Bio 16:251을 참조한다). Cas9 및 Cpf1 단백질 사이에 주요 차이점은 Cpf1이 tracrRNA를 활용하지 않고, 따라서 단지 crRNA만을 필요로 한다는 것이다. FnCpf1 crRNA는 42-44개 뉴클레오티드 길이 (19개-뉴클레오티드 반복 및 23-25개-뉴클레오티드 스페이서)이고 단일 스템 루프를 내포하는데, 이것은 이차 구조를 유지하는 서열 변화를 용인한다. 이에 더하여, Cpf1 crRNA는 Cas9에 의해 요구되는 ~100개-뉴클레오티드 가공된 sgRNA보다 훨씬 짧고, 그리고 FnCpfl에 대한 PAM 요건은 치환된 가닥 상에서 5′-TTN-3′ 및 5′-CTA-3′이다. 비록 Cas9 및 Cpf1 둘 모두 표적 DNA 내에서 이중 가닥 절단을 만들긴 하지만, Cas9는 RuvC- 및 HNH-유사 도메인을 이용하여 안내 RNA의 종자 서열 내에 평활 말단 절단을 만드는 반면, Cpf1은 RuvC-유사 도메인을 이용하여 종자 서열의 외부에 스태거드 절단을 산출한다. Cpf1이 결정적인 종자 영역으로부터 멀리 떨어진 곳에 스태거드 절단을 만들기 때문에, NHEJ는 표적 부위를 교란하지 않을 것이고, 이런 이유로 원하는 HDR 재조합 사건이 일어날 때까지 Cpf1이 동일한 부위를 계속 절단할 수 있도록 담보한다. 따라서, 본원에서 설명된 방법과 조성물에서, 용어 '"Cas"는 Cas9 및 Cfp1 단백질 둘 모두를 포함하는 것으로 이해된다. 따라서, 본원에서 이용된 바와 같이, "CRISPR/Cas 시스템"은 뉴클레아제 및/또는 전사 인자 시스템 둘 모두를 포함하는 CRISPR/Cas 및/또는 CRISPR/Cfp1 시스템 둘 모두를 지칭한다.

일정한 구체예에서, Cas 단백질은 자연발생 Cas 단백질의 "기능적 유도체"일 수 있다. 선천적 서열 폴리펩티드의 "기능적 유도체"는 선천적 서열 폴리펩티드와 공통으로 정성적 생물학적 성질을 갖는 화합물이다. "기능적 유도체"는 상응하는 선천적 서열 폴리펩티드와 공통으로 생물학적 활성을 갖기만 하면, 선천적 서열의 단편, 그리고 선천적 서열 폴리펩티드 및 이의 단편의 유도체를 포함하지만 이들에 한정되지 않는다. 본원에서 예기된 생물학적 활성은 DNA 기질을 단편으로 가수분해하는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체, 공유 변형, 그리고 이들의 융합, 예를 들면, 유도체 Cas 단백질을 포괄한다. Cas 폴리펩티드 또는 이의 단편의 적합한 유도체는 Cas 단백질 또는 이의 단편의 돌연변이체, 융합, 공유 변형을 포함하지만 이들에 한정되지 않는다. Cas 단백질 또는 이의 단편뿐만 아니라 Cas 단백질 또는 이의 단편의 유도체를 포함하는 Cas 단백질은 세포로부터 획득가능하거나, 또는 화학적으로 합성되거나, 또는 이들 두 절차의 조합에 의할 수 있다. 세포는 Cas 단백질을 자연적으로 생산하는 세포, 또는 Cas 단백질을 자연적으로 생산하고, 그리고 내인성 Cas 단백질을 더욱 높은 발현 수준에서 생산하거나 또는 내인성 Cas와 동일하거나 상이한 Cas를 인코딩하는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전적으로 가공되는 세포일 수 있다. 일부 경우에, 세포는 Cas 단백질을 자연적으로 생산하지 않고 Cas 단백질을 생산하도록 유전적으로 가공된다. 일부 구체예에서, Cas 단백질은 AAV 벡터를 통한 전달을 위한 작은 Cas9 오르소로그이다 (Ran et al (2015) Nature 510, p. 186).

뉴클레아제(들)는 표적 부위 내에서 하나 또는 그 이상의 이중 가닥 및/또는 단일 가닥 절단을 만들 수 있다. 일정한 구체예에서, 뉴클레아제는 촉매적으로 비활성 개열 도메인 (가령, FokI 및/또는 Cas 단백질)을 포함한다. 가령, U.S. 특허 번호 9,200,266; 8,703,489 및 Guillinger et al. (2014) Nature Biotech. 32(6):577-582를 참조한다. 촉매적으로 비활성 개열 도메인은 촉매적으로 활성 도메인과 조합으로, 단일 가닥 절단을 만드는 틈내기효소로서 행동할 수 있다. 이런 이유로, 2개의 틈내기효소가 특정한 영역에서 이중 가닥 절단을 만드는데 조합으로 이용될 수 있다. 추가 틈내기효소 또한 당해 분야, 예를 들면, McCaffery et al. (2016) Nucleic Acids Res. 44(2):e11. doi: 10.1093/nar/gkv878. Epub 2015 Oct 19에서 알려져 있다.

전달

본원에서 설명된 단백질 (가령, 뉴클레아제), 폴리뉴클레오티드 및/또는 이들 단백질 및/또는 폴리뉴클레오티드를 포함하는 조성물은 예로서, 단백질 및/또는 mRNA 성분의 주입을 비롯한 임의의 적절한 수단에 의해 표적 세포로 전달될 수 있다.

적합한 세포는 진핵과 원핵 세포 및/또는 세포주를 포함하지만 이들에 한정되지 않는다. 이런 세포 또는 이런 세포로부터 산출된 세포주의 무제한적 실례는 T-세포, COS, CHO (가령, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (가령, HEK293-F, HEK293-H, HEK293-T) 및 perC6 세포뿐만 아니라 곤충 세포, 예를 들면, 스포도프테라 프루기페르다 (Spodoptera fugiperda) (Sf), 또는 진균 세포, 예를 들면, 사카로미세스 (Saccharomyces), 피치아 (Pichia) 및 쉬조사카로미세스 (Schizosaccharomyces)를 포함한다. 일정한 구체예에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 적합한 세포는 또한, 줄기 세포, 예를 들면, 실례로서, 배아 줄기 세포, 유도된 다능성 줄기 세포 (iPS 세포), 조혈 줄기 세포, 뉴런 줄기 세포 및 중간엽 줄기 세포를 포함한다.

본원에서 설명된 바와 같은 DNA-결합 도메인을 포함하는 단백질을 전달하는 방법은 가령, U.S. 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에서 설명되는데, 이들 발명 모두 본원에서 전체적으로 참조로서 편입된다.

본원에서 설명된 바와 같은 DNA 결합 도메인 및 이들 DNA 결합 도메인을 포함하는 융합 단백질은 또한, DNA-결합 단백질(들) 중에서 하나 또는 그 이상을 인코딩하는 서열을 내포하는 벡터를 이용하여 전달될 수 있다. 추가적으로, 추가 핵산 (가령, 공여자) 또한 이들 벡터를 통해 전달될 수 있다. 플라스미드 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 폭스바이러스 벡터; 헤르페스바이러스 벡터 및 아데노 연관된 바이러스 벡터 등을 포함하지만 이들에 한정되지 않는 임의의 벡터 시스템이 이용될 수 있다. 또한, 본원에서 전체적으로 참조로서 편입되는 U.S. 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824를 참조한다. 게다가, 이들 벡터 중에서 어느 것이든 타당하면, 하나 또는 그 이상의 DNA-결합 단백질-인코딩 서열 및/또는 추가 핵산을 포함할 수 있다는 것은 명백할 것이다. 따라서, 본원에서 설명된 바와 같은 하나 또는 그 이상의 DNA-결합 단백질 및 타당하면, 추가 DNA가 세포 내로 도입될 때, 이들은 동일한 벡터 상에서 또는 상이한 벡터 상에서 운반될 수 있다. 복수 벡터가 이용될 때, 각 벡터는 하나 또는 복수의 DNA-결합 단백질 및 필요에 따라, 추가 핵산을 인코딩하는 서열을 포함할 수 있다.

전통적인 바이러스 및 비바이러스 기초된 유전자 전달 방법이 세포 (가령, 포유류 세포) 및 표적 조직에서, 가공된 DNA-결합 단백질을 인코딩하는 핵산을 도입하고 필요에 따라, 추가 뉴클레오티드 서열을 동시도입하는데 이용될 수 있다. 이런 방법은 또한, 핵산 (가령, DNA-결합 단백질 및/또는 공여자를 인코딩하는)을 시험관내에서 세포에 투여하는데 이용될 수 있다. 일정한 구체예에서, 핵산은 생체내 또는 탈체 유전자 요법 이용을 위해 투여된다. 비바이러스 벡터 전달 시스템은 DNA 플라스미드, 나신 핵산, 그리고 전달 수송체, 예를 들면, 리포솜 또는 폴록사머와 복합화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하는데, 이들은 세포에 전달 후 에피솜 또는 통합된 유전체를 갖는다. 유전자 요법 절차에 관한 리뷰를 위해, Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and B

hm (eds.) (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)을 참조한다.

핵산의 비바이러스 전달의 방법은 전기천공, 리포펙션, 미량주사, 바이오리스틱, 비로솜, 리포솜, 면역리포솜, 다가양이온 또는 지질:핵산 접합체, 나신 DNA, mRNA, 인공 비리온, 그리고 DNA의 작용제-증강된 흡수를 포함한다. 예로서, Sonitron 2000 시스템 (Rich-Mar)을 이용한 초음파천공이 또한, 핵산의 전달에 이용될 수 있다. 바람직한 구체예에서, 하나 또는 그 이상의 핵산은 mRNA로서 전달된다. 번역 효율 및/또는 mRNA 안정성을 증가시키기 위한 캡핑된 mRNA의 이용 역시 바람직하다. ARCA (안티 리버스 캡 유사체) 캡 또는 이들의 변이체가 특히 바람직하다. 본원에서 참조로서 편입되는 U.S. 특허 번호 7,074,596 및 8,153,773을 참조한다.

추가 예시적인 핵산 전달 시스템은 Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, Maryland), BTX Molecular Delivery Systems (Holliston, MA) 및 Copernicus Therapeutics Inc에 의해 제공된 것들을 포함한다 (가령, US6008336을 참조한다). 리포펙션은 가령, US 5,049,386, US 4,946,787; 및 US 4,897,355에서 설명되고, 그리고 리포펙션 시약은 상업적으로 판매된다 (가령, Transfectam™, Lipofectin™ 및 Lipofectamine™ RNAiMAX). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 Felgner, WO 91/17424, WO 91/16024의 것들을 포함한다. 전달은 세포 (탈체 투여) 또는 표적 조직 (생체내 투여)으로 이루어질 수 있다.

표적화된 리포솜, 예를 들면, 면역지질 복합체를 포함하는 지질:핵산 복합체의 제조는 당업자에게 널리 공지된다 (가령, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. 특허 번호 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028 및 4,946,787을 참조한다).

추가 전달 방법은 EnGeneIC 전달 수송체 (EDV) 내로 전달되는 핵산을 포장하는 것의 이용을 포함한다. 이들 EDV는 이중특이적 항체를 이용하여 표적 조직으로 특이적으로 전달되는데, 여기서 상기 항체의 한쪽 팔은 표적 조직에 대한 특이성을 갖고, 그리고 다른 팔은 EDV에 대한 특이성을 갖는다. 상기 항체는 EDV를 표적 세포 표면으로 가져가고, 그리고 이후, EDV가 세포내섭취에 의해 세포 내로 운반된다. 일단 세포에 들어가면, 내용물이 방출된다 (MacDiarmid et al (2009) Nature Biotechnology 27(7) p. 643을 참조한다).

필요에 따라, 가공된 DNA-결합 단백질을 인코딩하는 핵산 및/또는 공여자 (가령, CAR 또는 ACTR)의 전달을 위한 RNA 또는 DNA 바이러스 기초된 시스템의 이용은 바이러스를 체내에서 특정한 세포에 표적화하고 바이러스 유상하중을 핵에 트래피킹하기 위한 고도로 진화된 과정을 이용한다. 바이러스 벡터는 환자 (생체내)에게 직접적으로 투여될 수 있거나, 또는 이들은 시험관내에서 세포를 처리하는데 이용될 수 있고, 그리고 변형된 세포가 환자에게 투여된다 (탈체). 핵산의 전달을 위한 전통적인 바이러스 기초된 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 연관된, 우두 및 단순 헤르페스 바이러스 벡터를 포함하지만 이들에 한정되지 않는다. 숙주 유전체에서 통합은 레트로바이러스, 렌티바이러스 및 아데노 연관된 바이러스 유전자 전달 방법으로 가능하고, 삽입된 도입유전자의 장기간 발현을 종종 유발한다. 추가적으로, 높은 형질도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.

레트로바이러스의 향성은 외래 외피 단백질을 통합하여, 표적 세포의 잠재적인 표적 집단을 확대함으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 또는 감염시키고, 그리고 높은 바이러스 역가를 전형적으로 생산할 수 있는 레트로바이러스 벡터이다. 레트로바이러스 유전자 전달 시스템의 선별은 표적 조직에 의존한다. 레트로바이러스 벡터는 6-10 kb까지의 외래 서열에 대한 포장 능력을 갖는 시스-작용 긴 말단 반복으로 구성된다. 최소 시스-작용 LTR은 벡터를 복제 및 포장하는데 충분한데, 이들 벡터는 이후, 치료적 유전자를 표적 세포 내로 통합하여 영구적인 도입유전자 발현을 제공하는데 이용된다. 폭넓게 이용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스 (MuLV), 긴팔원숭이 유인원 백혈병 바이러스 (GaLV), 유인원 면역결핍 바이러스 (SIV), 인간 면역결핍 바이러스 (HIV), 그리고 이들의 조합에 근거된 것들을 포함한다 (가령, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700을 참조한다).

일시적인 발현이 선호되는 적용에서, 아데노바이러스 기초된 시스템이 이용될 수 있다. 아데노바이러스 기초된 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하고 세포 분열을 필요로 하지 않는다. 이런 벡터를 이용하여, 높은 역가 및 높은 발현 수준이 획득되었다. 이러한 벡터는 상대적으로 단순한 시스템에서 대량으로 생산될 수 있다. 아데노 연관된 바이러스 ("AAV") 벡터 역시 가령, 핵산 및 펩티드의 시험관내 생산에서, 그리고 생체내 및 탈체 유전자 요법 절차를 위해 표적 핵산으로 세포를 형질도입하는데 이용된다 (가령, West et al., Virology 160:38-47 (1987); U.S. 특허 번호 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)을 참조한다. 재조합 AAV 벡터의 작제는 U.S. 특허 번호 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS USA 81:6466-6470 (1984); 및 Samulski et al., J. Virol. 63:03822-3828 (1989)을 비롯한 다수의 간행물에서 설명된다.

최소한 6가지 바이러스 벡터 접근법이 임상 시험 중인 유전자 전달을 위해 현재 가용한데, 이들은 형질도입 작용제를 산출하기 위해 보조 세포주 내로 삽입된 유전자에 의한, 결함성 벡터의 보완을 수반하는 접근법을 활용한다.

pLASN 및 MFG-S는 임상 시험에서 이용되고 있는 레트로바이러스 벡터의 실례이다 (Dunbar et al., Blood 85:3048-305 (1995); Kohn et al., Nat. Med. 1:1017-102 (1995); Malech et al., PNAS USA 94:22 12133-12138 (1997)). PA317/pLASN은 유전자 요법 시험에서 최초로 이용된 치료적 벡터이다. (Blaese et al., Science 270:475-480 (1995)). MFG-S 포장된 벡터의 경우에 50% 또는 그 이상의 형질도입 효율이 관찰되었다. (Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997).

재조합 아데노 연관된 바이러스 벡터 (rAAV)는 결함성 및 비병원성 파보바이러스 아데노 연관된 유형 2 바이러스에 근거된 유망한 대안적 유전자 전달 시스템이다. 모든 벡터는 도입유전자 발현 카세트와 측면에서 접하는 AAV 145 bp 반전된 말단 반복만을 유지하는 플라스미드로부터 유래된다. 형질도입된 세포의 유전체 내로 통합에 기인한 효율적인 유전자 전달 및 안정된 도입유전자 전달은 이러한 벡터 시스템에 대한 핵심 특질이다. (Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther. 9:748-55 (1996)). AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV8.2, AAV9 및 AAVrh10을 비롯한 다른 AAV 혈청형, 그리고 가성유형 AAV, 예를 들면, AAV2/8, AAV2/5 및 AAV2/6 역시 본 발명에 따라서 이용될 수 있다.

복제-결함성 재조합 아데노바이러스 벡터 (Ad)는 높은 역가에서 생산될 수 있고 다수의 상이한 세포 유형을 쉽게 감염시킨다. 대부분의 아데노바이러스 벡터는 도입유전자가 Ad E1a, E1b 및/또는 E3 유전자를 대체하도록 가공된다; 차후에, 복제 결함성 벡터는 결실된 유전자 기능을 트랜스 (trans)에서 제공하는 인간 293 세포에서 증식된다. Ad 벡터는 비분열, 분화된 세포, 예를 들면, 간, 신장 및 근육에서 발견된 것들을 비롯한 복수 유형의 조직을 생체내에서 형질도입할 수 있다. 전통적인 Ad 벡터는 큰 운반 능력을 갖는다. 임상 시험 중인 Ad 벡터의 이용의 실례는 근육내 주사로 항종양 면역화를 위한 폴리뉴클레오티드 요법을 수반하였다 (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)). 임상 시험 중인 유전자 전달을 위한 아데노바이러스 벡터의 이용의 추가 실례는 Rosenecker et al., Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther. 7:1083-1089 (1998)를 포함한다.

포장 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는데 이용된다. 이런 세포는 아데노바이러스를 포장하는 293 세포, 그리고 레트로바이러스를 포장하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 요법에서 이용되는 바이러스 벡터는 통상적으로, 핵산 벡터를 바이러스 입자 내로 포장하는 생산자 세포주에 의해 산출된다. 이들 벡터는 전형적으로, 포장 및 숙주 내로 차후 통합 (적용가능하면)을 위해 필요한 최소 바이러스 서열을 내포하는데, 다른 바이러스 서열은 발현되는 단백질을 인코딩하는 발현 카세트에 의해 대체된다. 누락 바이러스 기능은 포장 세포주에 의해 트랜스에서 제공된다. 가령, 유전자 요법에서 이용도는 AAV 벡터는 전형적으로, 포장 및 숙주 유전체 내로 통합을 위해 필요한, AAV 유전체로부터 반전된 말단 반복 (ITR) 서열만을 소유한다. 바이러스 DNA는 세포주 내에서 포장되는데, 이것은 다른 AAV 유전자, 다시 말하면 렙 (rep) 및 캡 (cap)을 인코딩하지만 ITR 서열을 결여하는 보조 플라스미드를 내포한다. 상기 세포주는 또한, 보조로서 아데노바이러스로 감염된다. 상기 보조 바이러스는 AAV 벡터의 복제 및 보조 플라스미드로부터 AAV 유전자의 발현을 증진한다. 보조 플라스미드는 ITR 서열의 결여로 인해 유의미한 양으로 포장되지 않는다. 아데노바이러스로 오염은 예로서, AAV보다는 아데노바이러스가 더욱 민감한 열 처리에 의해 감소될 수 있다.

많은 유전자 요법 적용에서, 유전자 요법 벡터는 고도의 특이성으로 특정 조직 유형에 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 바이러스의 외측 표면 상에서 바이러스 외피 단백질과의 융합 단백질로서 리간드를 발현함으로써, 소정의 세포 유형에 대한 특이성을 갖도록 변형될 수 있다. 상기 리간드는 관심되는 세포 유형 상에 존재하는 것으로 알려진 수용체에 대한 친화성을 갖도록 선택된다. 가령, Han et al., (Proc. Natl. Acad. Sci. USA 92:9747-9751 (1995))은 몰로니 뮤린 백혈병 바이러스가 gp70에 융합된 인간 헤레굴린을 발현하도록 변형될 수 있고, 그리고 재조합 바이러스가 인간 표피 성장 인자 수용체를 발현하는 일정한 인간 유방암 세포를 감염시킨다고 보고하였다. 이러한 원리는 다른 바이러스-표적 세포 쌍에 까지 확장될 수 있는데, 여기서 표적 세포는 수용체를 발현하고, 그리고 바이러스는 세포 표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 가령, 실모양 파지는 사실상 모든 선택된 세포 수용체에 대한 특이적 결합 친화성을 갖는 항체 단편 (가령, FAB 또는 Fv)을 전시하도록 가공될 수 있다. 비록 상기 설명이 바이러스 벡터에 일차적으로 적용되긴 하지만, 동일한 원리가 비바이러스 벡터에 적용될 수 있다. 이런 벡터는 특정한 표적 세포에 의한 흡수를 선호하는 특정한 흡수 서열을 내포하도록 가공될 수 있다.

CRISPR/Cas 시스템에 대한 전달 방법은 전술된 방법을 포함할 수 있다. 가령, 동물 모형에서, 시험관내 전사된 Cas 인코딩 mRNA 또는 재조합 Cas 단백질을 는 유전체-편집된 동물에서 유리 바늘을 이용하여 단세포 단계 배아 내로 직접적으로 주사될 수 있다. 시험관내에서 세포에서 Cas 및 안내 RNA를 발현하기 위해, 이들을 인코딩하는 플라스미드는 전형적으로, 리포펙션 또는 전기천공을 통해 세포 내로 형질감염된다. 또한, 재조합 Cas 단백질은 시험관내 전사된 안내 RNA와 복합화될 수 있는데, 여기서 Cas-안내 RNA 리보핵산단백질은 관심되는 세포에 의해 흡수된다 (Kim et al (2014) Genome Res 24(6):1012). 치료적 목적으로, Cas 및 안내 RNA는 바이러스 및 비바이러스 기술의 조합에 의해 전달될 수 있다. 가령, Cas를 인코딩하는 mRNA는 나노입자 전달을 통해 전달될 수 있고, 반면 안내 RNA 및 임의의 원하는 도입유전자 또는 수복 주형은 AAV를 통해 전달된다 (Yin et al (2016) Nat Biotechnol 34(3) p. 328).

유전자 요법 벡터는 전형적으로, 아래에 설명된 바와 같은 전신 투여 (가령, 정맥내, 복막내, 근육내, 피하, 또는 두개내 주입) 또는 국소 적용에 의한 개별 환자에게 투여에 의해 생체내에서 전달될 수 있다. 대안으로, 벡터는 탈체에서 세포, 예를 들면, 개별 환자로부터 외식된 세포 (가령, 림프구, 골수 흡인물, 조직 생검) 또는 만능 공여자 조혈 줄기 세포로 전달되고, 그 이후에 이들 세포가 통상적으로, 상기 벡터를 통합한 세포에 대한 선별 후 환자 내로 재이식될 수 있다.

진단, 연구, 이식을 위한, 또는 유전자 요법 (가령, 형질감염된 세포의 숙주 생명체 내로의 재주입을 통한)을 위한 탈체 세포 형질감염은 당업자에게 널리 알려져 있다. 바람직한 구체예에서, 세포는 대상 생물체로부터 단리되고, DNA-결합 단백질 핵산 (유전자 또는 cDNA)으로 형질감염되고, 그리고 대상 생물체 (가령, 환자) 내로 되돌려 재주입된다. 탈체 형질감염에 적합한 다양한 세포 유형은 당업자에게 널리 알려져 있다 (가령, 환자로부터 세포를 어떻게 단리하고 배양하는 지에 관한 논의를 위해, Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994)) 및 그 안에 인용된 참고문헌을 참조한다).

한 구체예에서, 줄기 세포는 세포 형질감염 및 유전자 요법을 위한 탈체 절차에서 이용된다. 줄기 세포를 이용하는 이점은 이들이 시험관내에서 다른 세포 유형으로 분화될 수 있거나, 또는 이들이 골수 내에 이식될 포유동물 (가령, 이들 세포의 공여자) 내로 도입될 수 있다는 것이다. GM-CSF, IFN-γ 및 TNF-α와 같은 사이토킨을 이용하여, CD34+ 세포를 임상적으로 중요한 면역 세포 유형으로 시험관내에서 분화하기 위한 방법은 알려져 있다 (Inaba et al., J. Exp. Med. 176:1693-1702 (1992)를 참조한다).

줄기 세포는 공지된 방법을 이용하여 형질도입 및 분화용으로 단리된다. 가령, 줄기 세포는 골수 세포를, 원치 않는 세포, 예를 들면, CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구) 및 Iad (분화된 항원 제시 세포)에 결합하는 항체로 패닝함으로써, 골수 세포로부터 단리된다 (Inaba et al., J. Exp. Med. 176:1693-1702 (1992)를 참조한다).

일부 구체예에서, 변형된 줄기 세포 역시 이용될 수 있다. 가령, 아폽토시스에 저항하도록 만들어진 뉴런 줄기 세포가 치료 조성물로서 이용될 수 있는데, 여기서 이들 줄기 세포는 또한, 본 발명의 ZFP TF를 내포한다. 아폽토시스에 대한 저항은 예로서, 줄기 세포에서 BAX- 또는 BAK-특이적 ZFN (U.S. 특허 번호 8,597,912를 참조한다)을 이용하여 BAX 및/또는 BAK를 녹아웃하거나, 또는 예로서, 카스파제-6 특정한 ZFN을 다시 한 번 이용하여, 카스파제에서 교란되는 것들을 녹아웃함으로써 발생할 수 있다.

치료적 DNA-결합 단백질 (또는 이들 단백질을 인코딩하는 핵산)을 내포하는 벡터 (가령, 레트로바이러스, 아데노바이러스, 리포솜 등)는 또한, 생체내에서 세포의 형질도입을 위해 생물체에 직접적으로 투여될 수 있다. 대안으로, 나신 DNA가 투여될 수 있다. 투여는 주사, 주입, 국소 적용 및 전기천공을 포함하지만 이들에 한정되지 않는, 분자를 혈액 또는 조직 세포와 궁극적으로 접촉하도록 도입하는데 통상적으로 이용되는 루트 중에서 어느 것에 의한다. 이런 핵산을 투여하는 적합한 방법은 가용하고 당업자에게 널리 공지되고, 그리고 비록 하나 이상의 루트가 특정 조성물을 투여하는데 이용될 수 있긴 하지만, 특정 루트는 종종, 다른 루트보다 더욱 즉각적이고 더욱 효과적인 반응을 제공할 수 있다.

조혈 줄기 세포 내로 DNA의 도입을 위한 방법은 가령, U.S. 특허 번호 5,928,638에서 개시된다. 조혈 줄기 세포, 예를 들면, CD34+ 세포 내로 도입유전자의 도입에 유용한 벡터는 아데노바이러스 유형 35를 포함한다.

면역 세포 (가령, T-세포) 내로 도입유전자의 도입에 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 가령, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222를 참조한다.

제약학적으로 허용되는 담체는 부분적으로, 투여되는 특정 조성물뿐만 아니라 조성물을 투여하는데 이용된 특정 방법에 의해 결정된다. 따라서, 아래에 설명된 바와 같이, 제약학적 조성물의 매우 다양한 적합한 제제가 가용하다 (가령, Remington's Pharmaceutical Sciences, 17th ed., 1989를 참조한다).

전술한 바와 같이, 개시된 방법 및 조성물은 임의의 유형의 T-세포 및 줄기 세포를 비롯하여, 원핵 세포, 진균 세포, 고세균류 세포, 식물 세포, 곤충 세포, 동물 세포, 척추동물 세포, 포유류 세포 및 인간 세포를 포함하지만 이들에 한정되지 않는 임의의 유형의 세포에서 이용될 수 있다. 단백질 발현에 적합한 세포주는 당업자에게 공지되어 있고, 그리고 COS, CHO (가령, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (가령, HEK293-F, HEK293-H, HEK293-T), perC6, 곤충 세포, 예를 들면, 스포도프테라 프루기페르다 (Spodoptera fugiperda) (Sf), 그리고 진균 세포, 예를 들면, 사카로미세스 (Saccharomyces), 피치아 (Pichia) 및 쉬조사카로미세스 (Schizosaccharomyces)를 포함하지만 이들에 한정되지 않는다. 이들 세포주의 자손, 변이체 및 유도체 또한 이용될 수 있다.

적용

질환의 치료 및 예방에서 가공된 뉴클레아제의 이용은 향후 몇 년간 의약에서 가장 유의미한 발달 중에서 한 가지인 것으로 예상된다. 본원에서 설명된 방법과 조성물은 원하는 표적 부위가 개열의 일차 장소가 되도록 담보하기 위해, 이들 신규한 도구의 특이성을 증가시키는데 역할을 한다. 모든 시험관내, 생체내 및 탈체 적용에서 이러한 기술의 완전한 잠재력을 실현하기 위해, 오프 표적 개열을 최소화하거나 또는 제거하는 것이 필요할 것이다.

예시적인 유전 질환은 연골무형성증, 색맹, 산성 말타아제 결핍, 아데노신 탈아미노효소 결핍 (OMIM 번호 102700), 부신백질이영양증, 에카르디 증후군, 알파-1 항트립신 결핍, 알파-지중해빈혈, 안드로겐 불감 증후군, 아페르 증후군, 부정맥유발 우심실, 형성장애, 모세혈관확장성 운동실조증, 바르트 증후군, 베타-지중해빈혈, 청색 고무 수포 모반 증후군, 카나반병, 만성 육아종병 (CGD), 고양이 울음 증후군, 낭포성 섬유증, 델컴병, 외배엽 형성이상, 판코니 빈혈, 진행성 골화성 섬유형성이상, 여린 X 증후군, 갈락토오스혈증, 고셔병, 전신 강글리오시드증 (가령, GM1), 혈색소증, 베타-글로빈의 6번째 코돈에서 헤모글로빈 C 돌연변이 (HbC), 혈우병, 헌팅턴병, 헐러 증후군, 저인산증, 클라인펠터 증후군, 크라베 병, 랑거 기디온 증후군, 백혈구 부착 결핍 (LAD, OMIM 번호 116920), 백질이영양증, 긴 QT 증후군, 마르팡 증후군, 뫼비우스 증후군, 뮤코다당류증 (MPS), 손발톱 슬개골 증후군, 신성 요붕증, 신경섬유종증, 니이만 픽 병, 불완전 골형성, 페닐케톤뇨 (PKU), 포르피린증, 프레더 윌리 증후군, 조로증, 프로테우스 증후군, 망막모세포종, 레트 증후군, 루빈스타인 테이비 증후군, 산필리포 증후군, 중증 복합형 면역 부전증 (SCID), 슈와크만 증후군, 겸상 적혈구병 (겸상 적혈구성 빈혈), 스미스 마제니스 증후군, 스티클러 증후군, 테이 사크스 병, 혈소판감소증 요골 무형성 (TAR) 증후군, 트리처 콜린스 증후군, 삼염색체증, 결절성 경화증, 터너 증후군, 요소 회로 장애, 폰 히펠 린다우 병, 바르덴부르크 증후군, 윌리엄스 증후군, 윌슨병, 비스코트 올드리치 증후군, X 연관 림프구증식 증후군 (XLP, OMIM 번호 308240)을 포함하지만 이들에 한정되지 않는다.

표적화된 DNA 개열 및/또는 상동성 재조합에 의해 치료될 수 있는 추가 예시적인 질환은 후천성 면역결핍, 리소좀 축적병 (가령, 고셔병, GM1, 파브리 병 및 테이 사크스 병), 뮤코다당류증 (가령, 헌터병, 헐러병), 이상혈색소증 (가령, 겸상 적혈구병, HbC, α-지중해빈혈, β-지중해빈혈) 및 혈우병을 포함한다.

이런 방법은 또한, 숙주에서 유전 질환을 치료하기 위한 감염 (바이러스 또는 세균)의 치료 (가령, 바이러스 또는 세균 수용체의 발현을 차단하고, 따라서 숙주 생물체에서 감염 및/또는 확산을 예방함으로써) 허용한다.

감염성 또는 통합된 바이러스 유전체의 표적화된 개열은 숙주에서 바이러스 감염을 치료하는데 이용될 수 있다. 추가적으로, 바이러스에 대한 수용체를 인코딩하는 유전자의 표적화된 개열은 이런 수용체의 발현을 차단하고, 따라서 숙주 생물체에서 바이러스 감염 및/또는 바이러스 확산을 예방하는데 이용될 수 있다. 바이러스 수용체 (가령, HIV의 경우에 CCR5 및 CXCR4 수용체)를 인코딩하는 유전자의 표적화된 돌연변이유발은 이들 수용체가 바이러스에 결합할 수 없게 만들고, 따라서 새로운 감염을 예방하고 현존하는 감염의 확산을 차단하는데 이용될 수 있다. U.S. 특허 공개 번호 2008/015996을 참조한다. 표적화될 수 있는 바이러스 또는 바이러스 수용체의 무제한적 실례는 단순 헤르페스 바이러스 (HSV), 예를 들면, HSV-1 및 HSV-2, 수두 대상포진 바이러스 (VZV), 엡스타인 바르 바이러스 (EBV) 및 시토메갈로바이러스 (CMV), HHV6 및 HHV7을 포함한다. 바이러스의 간염 패밀리는 A형 간염 바이러스 (HAV), B형 간염 바이러스 (HBV), C형 간염 바이러스 (HCV), 델타 간염 바이러스 (HDV), E형 간염 바이러스 (HEV) 및 G형 간염 바이러스 (HGV)를 포함한다. 피코르나바이러스과 (Picornaviridae) (가령, 폴리오바이러스 등); 칼리시바이러스과 (Caliciviridae); 토가바이러스과 (Togaviridae) (가령, 풍진 바이러스, 뎅기 바이러스 등); 플라비바이러스과 (Flaviviridae); 코로나바이러스과 (Coronaviridae); 레오바이러스과 (Reoviridae); 버나바이러스과 (Birnaviridae); 라보도바이러스과 (Rhabodoviridae) (가령, 광견병 바이러스 등); 필로바이러스과 (Filoviridae); 파라믹소바이러스과 (Paramyxoviridae) (가령, 유행성 이하선염 바이러스, 홍역 바이러스, 호흡기 합포체 바이러스 등); 오르토믹소바이러스과 (Orthomyxoviridae) (가령, 인플루엔자 바이러스 유형 A, B 및 C 등); 부니아바이러스과 (Bunyaviridae); 아레나바이러스과 (Arenaviridae); 레트로바이러스과 (Retroviridae); 렌티바이러스 (가령, HTLV-I; HTLV-II; HIV-1 (HTLV-III, LAV, ARV, hTLR 등으로서 또한 알려져 있음) HIV-II); 유인원 면역결핍 바이러스 (SIV), 인간 유두종 바이러스 (HPV), 인플루엔자 바이러스 및 진드기 매개 뇌염 바이러스를 포함하지만 이들에 한정되지 않는 다른 바이러스 또는 이들의 수용체가 표적화될 수 있다. 가령, 이런 저런 바이러스에 관한 설명을 위해 Virology, 제3판 (W. K. Joklik ed. 1988); Fundamental Virology, 제2판 (B. N. Fields and D. M. Knipe, eds. 1991)을 참조한다. HIV에 대한 수용체는 예로서, CCR-5 및 CXCR-4를 포함한다.

따라서, 본원에서 설명된 바와 같은 이형이합체성 개열 도메인 변이체는 유전자 변형 적용에서 ZFN 특이성을 향상시키는데 광범위한 유용성을 제공한다. 이들 변이체 개열 도메인은 임의의 ZFN 이합체의 생체내 특이성을 향상시키기 위해, 특정 부위 돌연변이유발 또는 하위클로닝에 의해 임의의 현존하는 ZFN 내로 쉽게 통합될 수 있다.

전술한 바와 같이, 본원에서 설명된 조성물과 방법은 유전자 변형, 유전자 교정 및 유전자 파괴에 이용될 수 있다. 유전자 변형의 무제한적 실례는 상동성 지향된 수복 (HDR)-기초된 표적화된 통합; HDR-기초된 유전자 교정; HDR-기초된 유전자 변형; HDR-기초된 유전자 파괴; NHEJ-기초된 유전자 파괴 및/또는 HDR, NHEJ 및/또는 단일 가닥 어닐링 (SSA)의 조합을 포함한다. 단일 가닥 어닐링 (SSA)은 2개의 상보성 영역을 노출시키는 5'-3' 엑소뉴클레아제에 의한 DSB의 적출에 의해 동일한 배향정위에서 일어나는, 2개의 반복된 서열 사이에 이중 가닥 절단의 수복을 지칭한다. 2개의 직접 반복을 인코딩하는 단일 가닥은 이후, 서로 어닐링되고, 그리고 어닐링된 중간체는 단일 가닥 꼬리 (어떤 서열에도 어닐링되지 않는 단일 가닥 DNA의 부분)가 소화되어 없어지고, 갭이 DNA 중합효소에 의해 채워지고, 그리고 DNA 단부가 재결합되도록 처리될 수 있다. 이것은 직접 반복 사이에 위치된 서열의 결실을 유발한다.

본원에서 설명된 개열 도메인 (가령, ZFN, TALEN, CRISPR/Cas 시스템)을 포함하는 조성물 및 방법은 또한, 다양한 유전 질환 및/또는 감염성 질환의 치료에서 이용될 수 있다.

이들 조성물과 방법은 또한, 다음을 포함하지만 이들에 한정되지 않는 줄기 세포 기초된 요법에 적용될 수 있다: 단일유전자 유전자 요법을 위한 짧은 패치 유전자 전환 또는 표적화된 통합에 의한 체세포 돌연변이의 교정; 우성 음성 대립형질의 파괴; 세포 내로 병원체의 진입 또는 생산적 감염을 위해 필요한 유전자의 파괴; 예로서, 기능적 조직의 분화 또는 형성을 증진하기 위해 유전자 활성을 변경하고; 및/또는 기능적 조직의 분화 또는 형성을 증진하기 위해 유전자 활성을 교란함으로써 증강된 조직 가공; 예로서, 줄기 세포를 증진하는 분화를 차단하여 특정한 계통 경로를 하향 분화하는 유전자의 파괴, 줄기 세포 분화를 자극할 수 있는 유전자 또는 siRNA 발현 카세트의 표적화된 삽입, 줄기 세포 분화를 차단하고 더욱 우수한 확대 및 다능성 유지를 허용할 수 있는 유전자 또는 siRNA 발현 카세트의 표적화된 삽입 및/또는 줄기 세포의 분화 상태 및 배지에서 변화, 사이토킨, 성장 조건, 유전자의 발현, siRNA, shRNA 또는 miRNA 분자의 발현, 세포 표면 마커에 대한 항체에 노출, 또는 약물이 이러한 상태를 어떻게 변화시키는 지를 기록하기 위한 간단한 마커를 허용할 다능성 또는 분화 상태의 마커인 내인성 유전자와 인프레임으로 리포터 유전자의 표적화된 삽입에 의해 분화를 차단하거나 또는 유도; 체세포 핵 전달, 예를 들면, 환자 자신의 체세포가 단리되고, 의도된 표적 유전자가 적절한 방식으로 변형되고, 세포 클론이 산출되고 (및 품질이 유전체 안전성을 담보하기 위해 제어되고), 그리고 이들 세포로부터 핵이 단리되고 미수정란으로 이전되어, 환자 내로 이식 전에 직접적으로 주사되거나 또는 분화되어 조직 거부를 감소시키거나 또는 제거할 수 있는 환자-특이적 hES 세포가 산출될 수 있다; MHC 수용체를 녹아웃함으로써 범용 줄기 세포 (가령, 축소된 또는 완전히 전폐된 면역학적 동일성의 세포를 산출하기 위해). 이러한 절차를 위한 세포 유형은 T-세포, B 세포, 조혈 줄기 세포 및 배아 줄기 세포를 포함하지만 이들에 한정되지 않는다. 추가적으로, 유도된 다능성 줄기 세포 (iPSC)가 이용될 수 있는데, 이들 또한, 환자 자신의 체세포로부터 산출될 것이다. 이런 이유로, 이들 줄기 세포 또는 이들의 유도체 (분화된 세포 유형 또는 조직)는 그들의 기원 또는 조직적합성과 상관없이, 임의의 개인에게 잠재적으로 이식될 수 있었다.

이들 조성물과 방법은 또한, 체세포 요법에 이용될 수 있고, 따라서 생물학적 성질이 증강되도록 변형된 세포의 스톡의 생산을 허용한다. 이런 세포는 세포의 공여자 공급원 및 수용자에 대한 이들 세포의 조직적합성과 상관없이, 다양한 환자 내로 주입될 수 있다.

치료적 적용에 더하여, 가공된 뉴클레아제에서 이용될 때 본원에서 설명된 변이체에 의해 제공된 증가된 특이성은 작물 가공, 세포주 가공 및 질환 모형의 구축에 이용될 수 있다. 절대 이형이합체 개열 절반-도메인은 뉴클레아제 성질을 향상시키기 위한 단순한 수단을 제공한다.

본원에서 설명된 가공된 개열 절반 도메인은 또한, 개재성 영역을 결실시키거나 또는 2개의 특정한 좌위를 한꺼번에 변경하기 위해, 복수 표적에서 동시적 개열을 필요로 하는 유전자 변형 프로토콜에서 이용될 수 있다. 2개 표적에서 개열은 4개 ZFN 또는 TALEN의 세포 발현을 필요로 할 것인데, 이것은 잠재적으로 10가지의 상이한 활성 ZFN 또는 TALEN 조합을 산출할 수 있었다. 이런 적용의 경우에, 야생형 뉴클레아제 도메인에 대한 이들 신규한 변이체의 치환은 바람직하지 않은 조합의 활성을 제거하고 오프 표적 개열의 기회를 감소시킬 것이다. 만약 일정한 원하는 DNA 표적에서 개열이 뉴클레아제 쌍 A+B의 활성을 필요로 하고, 그리고 두 번째 원하는 DNA 표적에서 동시적 개열이 뉴클레아제 쌍 X+Y의 활성을 필요로 하면, 본원에서 설명된 돌연변이의 이용은 A와 A의 대합, A와 X의 대합, A와 Y의 대합, 기타 등등을 예방할 수 있다. 따라서, 이들 FokI 돌연변이는 "변칙" 쌍 형성에 따른 비특이적 개열 활성을 감소시키고, 그리고 뉴클레아제의 더욱 효율적인 직교 돌연변이체 쌍의 산출을 허용한다 (공유 특허 U.S. 특허 공개 번호 20080131962 및 20090305346을 참조한다).

실시예

실시예 1: ZFN의 제조

BCL11A 및 TCRA (TRAC로서 또한 알려져 있는 표적화된 불변 영역) 유전자 내에 부위에 표적화된 ZFN이 설계되고, 그리고 Urnov et al. (2005) Nature 435(7042):646-651, Perez et al (2008) Nature Biotechnology 26(7): 808-816, 그리고 PCT 특허 공개 번호 WO 2016183298 및 PCT 공개 번호 WO2017106528에서 본질적으로 설명된 바와 같이 플라스미드 벡터 내로 통합되었다. U.S. 공개 번호 20150110762에서 설명된 바와 같은 AAVS1 표적화된 ZFN 역시 이용되었다.

실시예 2: 인산염과의 상호작용을 표적으로 하는 Fok I 잔기에서 돌연변이체

FokI 개열 도메인 (Miller et al (2007) Nat Biotech 25(7):778-85)의 모형을 이용하여, DNA 중추 상에서 인산염과 잠재적으로 상호작용하는 양성으로 하전된 아르기닌 또는 리신 아미노산 잔기가 확인되었다 (도면 1).

FokI 도메인에서 확인된 위치 (아미노산 416, 422, 447, 448 및 525)는 이후, 본래 양성 아미노산 및 DNA 상에서 음성으로 하전된 인산염 사이의 상호작용을 제거하기 위해, 세린 잔기로 특이적으로 변화 (돌연변이)되었다 (도면 2a 및 2b를 참조한다). 양쪽 ZFN 파트너가 이들 돌연변이를 포함할 때, 다수의 상이한 조합이 발생할 수 있다 (도면 2c에서 예시를 참조한다). 이들 새로운 FokI 돌연변이체는 ELD/KKR 이형이합체의 'KKR' FokI 파트너에서 만들어졌고 (U.S. 특허 번호 8,962,281을 참조한다), 그리고 이후, BCL11A 인핸서 영역에 대해 특이적인 ZFN 쌍, SBS#51857 ELD/SBS#51949 KKR 또는 SBS#51857_KKR/SBS#51949_ELD에 연결되었는데, 이들 '부모' 단백질은 도면 3에서 회색으로 강조되었다. 이들 돌연변이는 각 파트너에서 만들어졌고, 그리고 이후, 도면 3에서 도시된 바와 같은 다양한 조합에서 CD34+ T 세포에서 본래 BCL11A 표적에 대한 개열 활성에 대해 검사되었다. 오프 표적 부위는 선입견 없는 포획 분석 (PCT 특허 공개 번호 WO 2016/183298)에 의해 이전에 확인되었다. 오프 표적 부위는 아래의 표 1에서 열거되는데, 여기서 각 부위가 독특하고 무작위로 산출된 '번호판' 문자 식별자로 확인되고, 여기서 번호판 PRJIYLFN이 의도된 표적 BCL11A 서열을 지시하였다. 아래의 표에서, 각 부위의 좌위 역시 표시된다 (좌표는 U.C. Santa Cruz Human Genome Browser sequence database, (Kent et al (2002), Genome Res.12(6):996-1006)의 hg38 어셈블리와 일관되게 열거된다).

표 1: SBS#51857/SBS#51949 확인된 개열 부위

번호판	서열 ID	서열 (5'->3')	염색체: hg38 좌위	유형
PRJIYLFN (의도된 표적)	13	CTAATCAGAGGCCAAACCCTTCCTGGAGCCTGTGATAAAAGCAACTGTTAGCTTGCACTAGACTAGCTTCAAAGTT	Chr2:60495265	인트론
NIFMAEVG	14	CTTCCTGCGGGGTTTTGTGCAAATAACCCATGCTCGGGAGCGAGGCCCTGGGAAGGAGTATCTCGCTTCTTTGGGT	Chr8:119856440	유전자간
GJZEIYTO	15	CCTACCCCCACCACCTCACCTTCCCTCAGCCTTGTGTTTCAGCCCCAGTTAGCTGCCCTTAGTTGCTGATGTATTG	Chr6:53805960	인트론
RFGIYSHZ	16	AGCACGTTTCTCCAGTTTCCAGCCTGGGGCCTGGCTATAAAGCAAATGCTCAGTCCAGCATTGCGGAATGCAAGGG	Chr2:23702834	인트론
RFTBCWPJ	17	ACAGCACCGTGCTGCACGGCGTCCTCCGGCCTTGCTGCCTGGCAATGGGTAGCCACCTGGCGTCTGTCTCAGAATA	Chr13:75549354	5' UTR
XCVJFHOB	18	TTCCCAGAAGGCGATTGAACCTGAAGCTGCGCCTGGCGCGTGAGCCTGTGGGGGGGACGCGGCTGAGGGGCTTTGA	Chr10:132654830	인트론
ZMIYSTJN	19	TATCCCTTCCCCAAGTGCAACCAACAGTTGCTCTAAAGCTAGGCTGGTGGAGTTGGGGAAAGGGCCAGCAAGTGAG	Chr10:69571178	유전자간
PEVYOHIU	20	TCCTCCATGCTCAGAAAGCCTTTCTTGGAGCCAGGCACACAGGAAATGTTAGCTAGTTAGCATTGGCTCTAATACT	Chr2:62164811	유전자간
QRMXFJNY	21	TAGCTGGGGAGAGATTGCCTCTCTCAGGGCCTAGCCAGTTCCTAGAAATAGCAAGGGCTCAGCTGAGAGCATGCTT	Chr14:67422067	유전자간
QBFUYVGW	22	TCCCCCGGAAGTGTCCGCACCTCCTAGAGCCCAGCGAGCGAGCGTTTGTGCTTTTGTCCTTTGAACCGGGTGTGGT	Chr1:29182166	유전자간
ZJCRPAXW	23	GACTCATTCATCCACTCATTCTGAGCACTTGCTGCACACTAGGCCCTGGGCTGGGGCTTCAGCCCAGGAGTTCACT	Chr1:54506813	유전자간
LXAFJWRI	24	ATGTAGTCTGACGGCCGCGACTGGTTCGTAGCTTTTGAGTGAGGCGGCGGGAAGGGAGCGAGGGAAGAGCGGCAGT	Chr2:84459584	유전자간
EMQNZDWX	25	TCATGTTATGGAAGTGGCTTCTTTCCTTAAGCCTTATGAATAAGCCTCTGCTAGCTTCAAACTTTGTGTGCAGCTT	Chr20:37707468	인트론
YJRBCUNZ	26	CATAAAGCACTTACAACAGTGCCTGGCAAATGCCTAGTGCACAGCAAGTGTTAGCTATTGTTAATGACTATCCATT	Chr1:19916857	유전자간
HBXGRVYT	27	ATTTTTGCCCCTGTCTTCTCTTTTCCTCCTTTGCTGCATCCCAGGCTCCAGCCTTTCAGCCCTATTTGCAGTACCC	Chr1:204975770	인트로닉
ZLRCYHDF	28	ACAAGGGGTTCAAGGTTATGAATAACCTGTGCTAATCCCAGAGGCCCCAGGACAGAGTAAGTGGGAACAAACACTG	Chr7:131503657	3' UTR
OTHMRBJL	29	CGGAAGTTAATATGATCATTGCTAACATTTGCTGTGTTTCAGGCACTGTAAGCATGTATATGGGTCCTTAAAGGGA	Chr11:108224087	인트론
RSYQNPLG	30	TGAGCCCAGAAACCCCTTACCCTTCCTCCTGCCTCTTGAGAGGCCAGTGTTAGGTGTTAGCCGGGGTGCAAAGCTC	Chr20:44683649	유전자간
SIJYTMVG	31	AACCTGGTGCGAGCAGCCCGGGCTACAGGGTTGCCTGAGGTGTGGGTCCCAGGATGGAGGAGCCCCAGGCCGGCGG	Chr19:45406704	코딩
BCGJKHUV	32	ACTTCGGTGAAGGAAGTCATCAGTGCAGTTGCCGACAAGCTGGGCTCCGGGGAGGGCCTGATCATAGTCAAGATGA	Chr2:173018748	코딩
RDEWOSIT	33	GGGGCCAGGCAGGAAGAACAGCTAACTCTAGCTCACCTGCAAGGCTCAGCACTGGGTTCATTTGAAGTAGTGTCCT	Chr3:47439806	인트론
YPLXMQCB	34	CTCCTTTGGGTGTGGACGGGACTAACACTTGCTCCATGTCAGGGCTGCAGGACCTCCTGGCTGTTGACAGCAGGCA	Chr16:85317248	유전자간
TPHSLVEM	35	GATGTTTGAAAAGCGCTGAGCCTGGCCTGGCACCTAAACAGCTCAGCAAGTGTTAGCCAGGATCACTAGCAGTAAT	Chr19:45686044	유전자간
WOEIMTLA	36	ACCCTGCCGATTTCCTTCCAGTTGCTCGCTGGGGCAACCGGCTAGGCTGGAGGAAGGGCGAGGACGGTGTCACCCC	ChrX:134914734	인트론
TBUYJIVX	37	GAACATGGTGAGGACAAAATGATGTCCAGGAGCCTTTTCTTTGGCCATTGCTAGCCTGAGACGAAAAGTCAGTGGC	Chr17:40557500	인트론
LPRCNGHU	38	AGTCTGTCAGTCTATCGTCCCTACCTGCAGCCCAAAGCATAAGCAACATCTTGCCCAGCTCAGAGGTGACAACCTC	Chr1:42891189	유전자간
AKRHSGPT	39	CACCGACCCAAGGACCACTCCTTCCAGGAACCTAGCCTAAAGCAAAGGTGCAGACAGCCCGGGGCCACCGCTGACC	Chr17:28854518	유전자간
IRSUAEVF	40	TTGCAAAAGGAAGTTTGAAGCTAGCAGAGGCTGATTCATGAGGTTCAAGGAAAGAAGTCATCTCTGTAACATAAAA	ChrX:30280457	유전자간
ATWDXHSC	41	CGTCCCCCAGAGTCCTGTTTCCTCTCCTTCAGCCCCCAAATGAGCAAAGGTTAGGCCCCACCCCTGCTGAGTCAGC	Chr12:56636086	인트론
QDMBZRWI	42	GTCAGGGGACAGGGTTTCCTAGCATCCGCGAGCCTTACAGAAAGGCAACTGTGCAGTGCTCCAGCTGGCTTTCTCA	Chr10:26734303	인트론
WBEAFQRU	43	ACCATCAGAGAAGCTAACCTTTCCTGAGGCCTAACTACTTTGCAGGTCCTGTATTATGTCCTCTATAGACATTAGG	Chr12:104048818	인트론
RXDOKCGI	44	GATCATTTCAAAGAAAACATTCTGGAACAGTTGCCTATGGGCACGGCAGGGTGACGGTGCTGCTTCTGGGTTTGAC	Chr11:11842581	인트로닉
TXHULGPN	45	GAAGGGCAGAGAACTATAATGACACAGTTGCTTTATTGCTGGACCCAGGACAGTTTATACAGCAGTTCGGAAAGGC	Chr11:33894467	유전자간
DYNFTSUP	46	ACTTATTGTAAGTGACGCATGTGACCAGTTGCCAATTGTTCAGGCTACAGCTTGGATCTGTTAGCATCCTCATTTA	Chr11:102685873	유전자간
XFDECBQY	47	CCCAGGGGCTGTGGGACACTCAGAGAGCCTATGCCTGTGCCCTGGGCTCCGGGAGGGGAGAGGATCTGGGGGCCAG	Chr16:2122341	인트론
ZTIFQRKB	48	CCCCAGGGGCTGTGGGACACTCAGAGAGCCTATGCCTGTGCCCTGGGCTCCGGGAGGGGAGAGGATCTGGGGGCCAG	Chr16:15141541	유전자간
ZFUQTLMTFC	49	AGCTTCCTGCAGCCTCCCTCAAAGCAGATGTTAGCACTATTA	Chr10:73205435	인트로닉
ZCNLWTPH	50	CCTCACCTAGAACCTGGGCCCCTGCAACTGTAACCTGTGGCA	Chr19:1198151	유전자간
QYYPVRQWMN	51	CCAGAGGAAGAACAGTTGCTTGGGTCTAGGCCTCAGGAAGGG	Chr10:101133375	인트론
EKYJXRAHKV	52	CCTGTGCTGGGGCCTGGGAGGCAGGCGGCTGCTAGCCATCCTG	Chr6:89888014	유전자간
ADWZQXZI	53	TGACTTAGGAAGCAGTTGCTACCTGCCAGGCCCCAGGCTAGG	Chr9:128604027	인트로닉

도면 3에서 제시된 데이터는 일정한 돌연변이가 오프 표적 개열 활성에서 비례적 하락으로, 동계 BCL11A 표적 부위에 대한 이들 단백질의 활성을 감소시켰다는 것을 증명하였다 (가령, 51857-ELD/51949-KKR_R447S를 참조한다: 온 표적 활성은 80.59%의 부모와 비교하여 11.60% 삽입-결실로 감소하였다; NIFMAEVG 오프 표적에서 활성 역시 부모에 대한 9.04%의 값과 비교하여 0.05%로 하락하였고, 그리고 PEVYOHIU 오프 표적에서 활성은 부모에 대한 0.65%의 값으로부터 0.03%로 하락하였다 (도면 3a)). 하지만, 다른 돌연변이의 경우에, 온 표적 개열 활성은 견실하게 남아있었고, 반면 양쪽 계측된 오프 표적 부위에서 활성은 실제적으로 감소하였다. 가령, 쌍 51857-ELD/51949-KKR_R416S는 부모 단백질과 매우 유사한 BCL11A에 대한 온 표적 활성을 가졌고 (2 μg 용량 (20μg/mL)에서 부모에 대한 80.59%와 대비하여 돌연변이체 쌍에 대한 80.63% 삽입-결실), 반면 2개의 오프 표적에서 활성은 실제적으로 감소하였다 (오프 표적 부위 NIFMAEVG에서 부모에 대한 9.04%와 대비하여 돌연변이체 쌍에 대한 0.75% 및 오프 표적 부위 PEVYOHIU에서 부모에 대한 0.65%와 대비하여 돌연변이체 쌍에 대한 0.08%) (도면 3a).

돌연변이체 단백질은 또한, 이형이합체성 FokI 도메인을 반대의 방향으로 이용하여 조립되었다, 다시 말하면, 도면 3a는 51857-ELD/51949-KKR에서 결과를 보여주었고, 반면 도면 3b는 51857-KKR/51949-ELD에서 결과를 묘사한다. 다시 한 번, 부모 쌍과 유사한 견실한 온 표적 활성 (각각, 83.02% 대 88.28%)을 유지하지만 (가령, 51857-KKR/51949-ELD_K448S), 오프 표적 위치에서 감소된 활성 (NIFMAEVG의 경우에 1.00% 대 9.26%; PEVYOHIU의 경우에 0.33% 대 0.87%)을 전시하는 일부 쌍이 있었다 (도면 3b).

실험은 또한, 한 쌍의 TCRA (TRAC)-특이적 ZFN: SBS#52742_ELD/SBS#52774_KKR (U.S. 특허 공개 번호 US-2017-0211075-A1)를 이용하여 수행되었다. 이들 실험은 K562 세포에서 실행되었는데, 여기서 이들 세포는 각 ZFN을 인코딩하는 100 또는 400 ng의 mRNA로 처리되었다. ZFN 쌍은 아래의 표 2에서 개시된 바와 같은 하나의 돌연변이된 파트너 및 하나의 비-돌연변이된 파트너로 구성되었다. 이들 실험에서, 도면 1에서 확인된 모든 양성으로 하전된 아미노산은 세린 (S)으로 돌연변이되었다. 간단히 말하면, 2x10e5 세포가 형질감염마다 이용되었는데, 여기서 mRNA는 Amaxa 96-웰 셔틀 시스템의 이용을 통해 세포로 전달되었다. 형질감염된 세포는 형질감염 이후에 3 일자에서 수확되고 표준 방법에 따른 MiSeq (Illumina) 분석을 위해 처리되었다. 데이터는 아래의 표 2에서 도시되고, 그리고 돌연변이 중에서 일부는 견실한 온 표적 활성을 유지하고, 반면 다른 것들 (가령, 도면 1에서 활성 부위 잔기로서 확인된 52742 ELD_K469S)은 개열 활성을 녹아웃한다는 것을 증명하였다.

표 2: Fok I 돌연변이를 갖는 TCRA (TRAC) ZFN에 대한 온 표적 결과

	전체 삽입-결실 %			전체 삽입-결실 %
52742 변이체	400ng	100ng	52774 변이체	400 ng	100 ng
ELD	90.72	71.46	KKR	89.08	70.58
Fok_ELD_K387S	92.31	66.35	Fok_KKR_K387S	89.06	62.70
Fok_ELD_K393S	73.06	23.09	Fok_KKR_K393S	65.89	17.98
Fok_ELD_K394S	71.15	21.86	Fok_KKR_K394S	67.44	25.09
Fok_ELD_R398S	86.23	41.21	Fok_KKR_R398S	84.61	42.28
Fok_ELD_K400S	88.16	63.12	Fok_KKR_K400S	83.15	0.13
Fok_ELD_K402S	84.49	40.64	Fok_KKR_K402S	79.76	0.15
Fok_ELD_R416S	92.91	67.06	Fok_KKR_R416S	87.11	45.48
Fok_ELD_R422S	88.98	47.48	Fok_KKR_R422S	69.98	20.95
Fok_ELD_K427S	75.15	25.24	Fok_KKR_K427S	73.51	25.40
Fok_ELD_K434S	88.65	57.40	Fok_KKR_K434S	88.50	64.84
Fok_ELD_R439S	85.58	56.54	Fok_KKR_R439S	88.38	70.39
Fok_ELD_K441S	88.15	61.13	Fok_KKR_K441S	78.26	72.33
Fok_ELD_R447S	70.26	25.74	Fok_KKR_R447S	36.08	15.06
Fok_ELD_K448S	90.95	68.02	Fok_KKR_K448S	91.39	79.43
Fok_ELD_K469S	0.16	0.12	Fok_KKR_K469S	0.52	0.29
Fok_ELD_R487S	0.45	0.21	Fok_KKR_R487S	0.30	0.18
Fok_ELD_R495S	2.52	0.58	Fok_KKR_R495S	5.71	1.15
Fok_ELD_K497S	87.46	54.80	Fok_KKR_K497S	87.18	59.54
Fok_ELD_K506S	85.54	58.14	Fok_KKR_K506S	86.05	62.42
Fok_ELD_K516S	42.50	12.38	Fok_KKR_K516S	0.16	25.48
Fok_ELD_K525S	91.00	60.36	Fok_KKR_K525S	88.31	46.52
Fok_ELD_K529S	85.01	46.71	Fok_KKR_K529S	88.34	64.13
Fok_ELD_R534S	2.23	0.57	Fok_KKR_R534S	87.46	60.69
Fok_ELD_K559S	86.45	47.69	Fok_KKR_K559S	88.27	58.47
Fok_ELD_R569S	22.45	5.20	Fok_KKR_R569S	64.99	18.87
Fok_ELD_R570S	84.97	46.82	Fok_KKR_R570S	89.58	62.32
Fok_ELD_K571S	84.93	44.61	Fok_KKR_K571S	87.75	70.77

선입견 없는 포획 분석에 의해 결정될 때, 상위 오프 표적 개열 부위를 결정하기 위한 오프 표적 분석이 또한 행위되었다 (PCT 특허 공개 번호 WO 2016/183298). 선입견 없는 포획 검정에 의해 이러한 ZFN 쌍에 대해 확인된 4개의 유전체 좌위 (TCRA (TRAC)에서 의도된 표적 및 3개의 오프 표적)는 아래의 표 3에서 제시된다.

표 3: TCRA (TRAC)-특이적 ZFN에 대한 개열 부위

번호판	서열 ID	서열 (5'->3')	염색체: hg38 좌위	유형
JBSCKVMP (의도된 표적)	54	TCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCG	Chr14: 22550603	코딩
XSKWTVWD	55	CCATATGCAGAAAACAGAAACTGTACCCCTTCCTTACACC	Chr18: 30735897	유전자간
XVFENVRX	56	TGGCCCTTTGCAGAAAAGGTTGTTGAACCCTACCGTAAAC	Chr16:4780553	인트로닉
KXWACMTR	57	CCGGAGAGAAGGCTCCGGTTCAGCACTGAGATCAGGACGG	Chr1:53220206	유전자간

각 ZFN의 400 ng의 mRNA 용량에서 2개 오프 표적 부위 (표 3에서 상기 도시된 OT11 또는 XVFENVRX 및 OT16 또는 XSKWTVWD로서 지칭됨)에서 뉴클레아제 활성이 분석되었는데, 여기서 ZFN 쌍에서 한쪽 파트너는 지시된 돌연변이를 가졌고, 그리고 다른 것은 변형되지 않은 ELD 또는 KKR FokI 도메인을 유지하였다. 도시된 데이터 (표 4)는 400 ng의 각 ZFN 파트너를 이용하여 관찰된 삽입-결실 (활성) 퍼센트를 지시한다. 이들 데이터는 돌연변이 중에서 일부가 거의 동등한 온 표적 활성을 유지하지만 오프 표적 활성에서 감소를 보여준다는 것을 또한 증명하였다. 가령, SBS#52774_KKR_K387S는 400 ng에서 89.06% 삽입-결실의 온 표적 활성 (52774_KKR 부모에 대한 89.08과 비교하여), 그리고 OT11 및 OT16에서 6.39% 삽입-결실의 조합된 오프 표적 활성 (52774_KKR 부모에 대한 15.07%와 비교하여)을 보여주었다. 이들 결과는 BCL11A-특이적 ZFN에서 검사된 FokI 돌연변이를 포함하였는데, 여기서 위치 416, 422, 447, 448 및 525에서 양성 전하의 변경은 오프 표적 활성을 감소시켰다.

표 4: TRAC ZFN Fok I 돌연변이체의 오프 표적 개열

	삽입-결실 %					삽입-결실 %
52742	온 표적	OT16	OT11	OT11 + OT16	52774	온 표적	OT16	OT11	OT11 + OT16
ELD	90.72	7.39	5.82	13.21	KKR	89.08	7.80	7.27	15.07
Fok_ELD_K387S	92.31	13.15	4.32	17.47	Fok_KKR_K387S	89.06	3.12	3.27	6.39
Fok_ELD_K393S	73.06	0.87	0.60	1.47	Fok_KKR_K393S	65.89	1.04	0.71	1.76
Fok_ELD_K394S	71.15	0.79	0.61	1.40	Fok_KKR_K394S	67.44	1.02	0.77	1.79
Fok_ELD_R398S	86.23	2.64	1.86	4.50	Fok_KKR_R398S	84.61	3.10	2.04	5.14
Fok_ELD_K400S	88.16	4.13	2.55	6.68	Fok_KKR_K400S	83.15	2.49	1.60	4.09
Fok_ELD_K402S	84.49	2.10	1.64	3.74	Fok_KKR_K402S	79.76	2.93	1.21	4.13
Fok_ELD_R416S	92.91	6.29	3.08	9.37	Fok_KKR_R416S	87.11	0.74	0.93	1.68
Fok_ELD_R422S	88.98	1.18	1.09	2.27	Fok_KKR_R422S	69.98	0.26	1.07	1.33
Fok_ELD_K427S	75.15	1.18	0.89	2.07	Fok_KKR_K427S	73.51	2.16	1.30	3.46
Fok_ELD_K434S	88.65	5.52	3.50	9.03	Fok_KKR_K434S	88.5	6.76	5.44	12.20
Fok_ELD_R439S	85.58	4.51	2.77	7.29	Fok_KKR_R439S	88.38	7.39	5.62	13.01
Fok_ELD_K441S	88.15	5.96	3.44	9.40	Fok_KKR_K441S	78.26	4.93	3.38	8.30
Fok_ELD_R447S	70.26	0.32	0.14	0.46	Fok_KKR_R447S	36.08	0.11	0.18	0.29
Fok_ELD_K448S	90.95	5.28	1.96	7.24	Fok_KKR_K448S	91.39	2.05	1.12	3.18
Fok_ELD_K469S	0.16	0.18	0.15	0.33	Fok_KKR_K469S	0.52	0.18	0.14	0.32
Fok_ELD_R487S	0.45	0.16	0.12	0.28	Fok_KKR_R487S	0.3	0.17	0.11	0.28
Fok_ELD_R495S	2.52	0.14	0.12	0.26	Fok_KKR_R495S	5.71	0.15	0.13	0.28
Fok_ELD_K497S	87.46	3.56	2.66	6.23	Fok_KKR_K497S	87.18	6.13	6.44	12.57
Fok_ELD_K506S	85.54	4.06	3.05	7.10	Fok_KKR_K506S	86.05	4.22	2.55	6.77
Fok_ELD_K516S	42.5	0.45	0.34	0.79	Fok_KKR_K516S	0.16	0.11	0.15	0.26
Fok_ELD_K525S	91	0.81	2.13	2.94	Fok_KKR_K525S	88.31	0.96	0.79	1.75
Fok_ELD_K529S	85.01	1.99	1.46	3.45	Fok_KKR_K529S	88.34	6.45	4.83	11.27
Fok_ELD_R534S	2.23	0.14	0.15	0.29	Fok_KKR_R534S	87.46	4.44	3.29	7.74
Fok_ELD_K559S	86.45	2.72	1.84	4.56	Fok_KKR_K559S	88.27	4.27	2.61	6.88
Fok_ELD_R569S	22.45	0.25	0.22	0.47	Fok_KKR_R569S	64.99	1.39	1.05	2.45
Fok_ELD_R570S	84.97	2.73	1.96	4.68	Fok_KKR_R570S	89.58	7.98	6.20	14.18
Fok_ELD_K571S	84.93	2.27	1.96	4.23	Fok_KKR_K571S	87.75	8.24	6.11	14.34

상기 데이터는 이후, 온 및 오프 표적 개열 둘 모두에 대한 효과를 조사하기 위해, 돌연변이된 아미노산 잔기 및 DNA 분자 사이에 추정된 거리와 비교되었다 (도면 4). 각 ZFN 쌍의 활성은 단일 포인트로서 도시되고, 그리고 돌연변이가 DNA 분자로부터 10 옹스트롬 이내에 있는 단백질이 가장 바람직한 프로필 (높은 온 표적 활성 및 낮은 오프 표적 활성)을 갖는 단백질이라는 것을 증명하였다 (도면 4). 한쪽 ZFN이 위치 416, 422, 447, 448 또는 525에서 FokI 돌연변이를 보유하는 ZFN 쌍에 상응하는 데이터 포인트는 표시된다.

이들 결과는 잔기 416, 422, 447, 448 또는 525 중에서 하나 또는 그 이상에 돌연변이가 오프 표적 활성을 감소시키면서 온 표적 활성을 증가시킬 수 있다는 것을 증명하였다.

실시예 3: 신규한 가공된 아연 핑거 중추 돌연변이의 설계

이전 연구는 아연 핑거 '중추' (DNA 뉴클레오티드의 부위 특이적 인식에 관련되지 않는 구조의 영역)에서 양성으로 하전된 아미노산 잔기 및 DNA 분자 상에서 인산염 사이에 일부 상호작용이 있을 수 있다고 제안하였다 (Elrod-Erickson et al, 상게서), 도면 5a를 참조한다. 위치 -14, -9 및 -5에서 아미노산 (이들 모두 알파 나선 영역의 전통적인 넘버링에 비하여)은 종종, 양성으로 하전되고, 그리고 DNA 중추 내에 음성으로 하전된 인산염과 상호작용할 수 있다 (도면 5b를 참조한다). 따라서, 4867개 아연 핑거 서열이 핑거 서열 내에 각 위치에서 아미노산 잔기의 존재에 대해 분석되었다 (도면 6을 참조한다). 위치 -5에서, 중성 아미노산 알라닌, 류신 및 글루타민이 낮지만 영이 아닌 빈도에서 관찰되었고, 그리고 따라서, 이들 아미노산이 핑거 중추의 변형에서 이용되었다. 6 및 5 핑거 ZFP에서 위치 역시 잠재적 치환과 함께 확인되었다 (도면 7a 및 7b).

이들 돌연변이는 TCRA (TRAC)-특이적 ZFN 쌍 SBS#52774/SBS#52742에서 만들어졌다 (PCT 공개 WO2017106528을 참조한다). 이들 단백질의 경우에, 총 21개 변이체가 각 파트너 ((F1, F3, F5, F1+F3, F1+F5, F3+F5, F1+F3+F5) x (R->A, R->Q, R->L))로부터 만들어졌다. 데이터의 대표적인 선별 (표 5)은 이들 쌍 중에서 다수가 분석된 3개 오프 표적에 대하여 감소된 오프 표적 활성을 보여준다는 것을 증명하였다. 이러한 표에서, 52774 ZFN은 위치 -5 핑거 1 (F1), 핑거 3 (F3) 및 핑거 5 (F5)에서 지시된 돌연변이를 보유하는 52742 ZFN의 변이체와 조합되었다. 만들어진 돌연변이의 유형 또한 표시되는데, 여기서 이러한 데이터 세트에서 모든 돌연변이체는 아르기닌 (R)에서 글루타민 (Q)으로의 돌연변이체이다. 가령, 52742-F1RQ로 표지화된 단백질은 핑거 1 내에 위치 -5에서 아르기닌이 글루타민으로 변경된 돌연변이체를 지시한다. 상기 표의 위쪽 부분은 활성을 삽입-결실%로서 전시하고, 그리고 상기 표의 아래쪽 절반은 활성을 부모 ZFN 쌍 52774/52742의 2개 복제물의 활성의 평균의 분율로서 보여준다. 이들 실험은 이들 돌연변이가 오프 표적 개열에 영향을 줄 수 있다는 것을 증명하였다. 가령, 52742-F1RQ;F3RQ;F5RQ 돌연변이체의 경우에 온 표적 개열이 견실한 수준에서 유지되었고 (6μg 용량에서 부모 단백질에 대한 62.59% 활성과 비교하여 69.96% 온 표적 활성), 반면 오프 표적 개열이 하락하였다 (OT16은 부모 단백질의 경우에 19.16% 개열 활성 및 삼중 돌연변이체에서 1.43% 활성을 보여주었다).

표 5: 아연 핑거 중추 돌연변이에 대한 예시적인 데이터

TCRA (TRAC)-특이적 부모 ZFN 52742 및 52774로 시작하여, 각 모듈의 첫 번째 핑거에서 아르기닌 (R)이 알라닌 (A), 글루타민 (Q) 또는 류신 (L)으로 대체되었다. 이들 구조체는 CD34+ 세포에서 검사되었는데, 여기서 이들 세포는 각 ZFN 파트너를 인코딩하는 6 μg의 mRNA로 처리되었다 (도면 8a를 참조한다). 이들 데이터 세트의 경우에, 도시된 각 데이터 막대는 각 유형의 모든 돌연변이에 대한 데이터의 평균이고, 그리고 오차 막대는 표준 오차를 나타낸다. 가령, 도면 8a에서 온 표적 활성을 표시하는 가장 왼쪽 흑색 막대의 경우에, 이러한 값은 단일 돌연변이를 가질 수 있었던 ZFN 쌍 내에 6가지 돌연변이체 모두에 대한 온 표적의 평균이다. 도면 7에서 다이어그램을 참조하면, 이들은 따라서, 52742의 핑거 모듈 A (전장 단백질에서 F1)의 N 말단에서 단일 돌연변이, 52742의 핑거 모듈 B (전장 단백질에서 F3)의 N 말단에서 단일 돌연변이, 52742의 핑거 모듈 C (전장 단백질에서 F5)의 N 말단에서 단일 돌연변이 및 파트너 52774 단백질에서 돌연변이의 유사한 세트를 포함한다. 두 번째 흑색 막대 (온 표적 활성을 표지)의 경우에, 온 표적 풀은 2가지 돌연변이 단백질 모두의 평균 (6가지 가능성의 한 세트, 여기서 이들 돌연변이는 단일 파트너 ZFN에서 만들어진다), 그리고 세 번째 흑색 막대의 경우에, 온 표적 풀은 돌연변이된 왼쪽 또는 오른쪽 ZFN 중에서 어느 하나에서 3개 모듈 모두를 갖는 2가지 가능성의 평균이다. 회색 막대에 의해 도시된 오프 표적 데이터의 경우에, 오프 표적 데이터 세트에서 단일 또는 이중 돌연변이에 대한 풀이 각각 18개 데이터 포인트를 포함하고 3개 돌연변이에 대한 풀이 6개 데이터 포인트를 포함하도록, 3개 오프 표적 부위로부터 데이터가 조합되었다는 점을 제외하고 유사한 풀이 만들어졌다. 이들 돌연변이는 오프 표적 활성에서 4.8 배까지 감소를 유발하였다.

ZFN 쌍의 양쪽 파트너가 유사한 방식으로 돌연변이되는 실험이 또한 실행되었다 (도면 8b의 오른쪽 절반). 가령, 모듈 A에서 N 말단 핑거가 알라닌으로 변경되면 (52742-F1RA), 파트너 단백질 역시 ZFN 이합체에서 총 2개의 돌연변이를 위해 모듈 A에서 N 말단 핑거에서 돌연변이될 것이다 (52774-F1RA). 단지 알라닌 치환만 이합체 내에 양쪽 ZFN에서 동시에 검사되었고, 그리고 이러한 데이터는 도면 8b의 오른쪽 절반에서 도시된다 (2, 4 또는 6으로 표시됨). 도면 8a의 왼쪽 세 번째로부터 이합체 내에 단지 하나의 ZFN에만 만들어진 R->A 돌연변이 (1, 2 또는 3에 의해 표시됨)가 비교 목적을 위해 도면 8b의 왼쪽 절반에서 또한 도시된다. 도면 8c는 단지 2 μg (20 μg/mL)의 RNA만 이용되었다는 점을 제외하고, 도면 8a의 오른쪽 부분과 유사하다. 이들 실험은 총 6개 돌연변이가 이합체 내에 양쪽 ZFN에서 일어날 때, 이들 돌연변이가 오프 표적 활성에서 27-배 감소를 산출할 수 있다는 것을 증명하였다.

이들 실험은 또한, 전술된 BCL11A-특이적 ZFN 쌍 51857-ELD/51949-KKR로 수행되었다. 실험 설계는 TCRA (TRAC)-특이적 ZFN 쌍에 대해 설명된 것과 유사하였고, 그리고 결과는 도면 9a에서 도시된다. 제시된 데이터는 2 μg (20 μg/mL)에서 약물 주입된, R ->Q (Gln) 또는 R->L (Leu) 돌연변이를 포함하는 쌍에 대한 결과를 보여주는데, 여기서 묘사된 오프 표적 결과는 단지 하나의 오프 표적 부위에 대한 것이다 (NIFMAEVG, 표 1을 참조한다).

-5 위치에서 추가 아미노산 변이체는 R을 E, N, Y, A 또는 L로 대체함으로써 만들어졌다. -5 위치에서 아미노산을 변경하는 것에 더하여, 일련의 돌연변이가 BCL11A-특이적 ZFN 쌍 51857/51949의 핑거 1 내에 위치 -9 및 -14에서 만들어졌다. 이들은 단독으로 및 핑거 2-6 내에 -5 변경과 조합으로, 전술된 바와 같이 온 및 오프 표적 활성에 대해 검사되었다. 데이터는 아래의 표 6에서 도시된다. 각 단백질은 상기 부모 단백질에 대해 설명된 바와 같은 동일한 DNA-특이성 나선 영역을 가졌지만, ZFP 중추 돌연변이를 반영하기 위해 새로운 SBS 식별자 번호가 제공되었다. 간단히 말하면, 이들 단백질의 성명은 핑거에서 열거된 변이체를 반영한다. 따라서, 성명의 "cR" 부분은 2-핑거 모듈의 C 말단 핑거에서 만들어진 변화를 지칭하고 (도면 7을 참조한다), 그리고 "nR"은 2-핑거 모듈의 N 말단 핑거에서 만들어진 변화를 지칭한다. 설명 "rQa"는 변경이 A 모듈 내에 -5 위치에서 만들어졌다는 것을 의미하고, 그리고 이것이 만들어진 핑거는 cR 또는 nR에 의해 규정된다. 따라서, SBS#65461 (성명 51857-NELD-cR-5Qa)은 변경이 C 말단 핑거 내에 -5 위치에서 만들어진 SBS#51857 유도체인데, 여기서 Q가 모듈 A에서 R을 대체한다. 이것은 상기 표에서도 목격될 수 있는데, 여기서 Q는 F2, -5 칼럼에서 표시된다. SBS#65459 (성명 51857-NELD-nR-14Q-5Qabc)에 관해 말하자면, 변화가 -14 위치에 만들어질 때, 이렇게 표시된다. 따라서, SBS#65459는 SBS#51857 유도체인데, 여기서 모듈 내에 N 말단 핑거에 변화가 만들어지고, 여기서 핑거 1의 -14가 R에서 Q로 변화되었고, 그리고 모듈 A, B 및 C의 N 말단 핑거에서 -5 위치가 R에서 Q로 변화되었다. SBS#65460의 경우에, 핑거 1의 -14가 R에서 S로 변화되었다. 이번에도, 이것은 상기 표로부터 결정될 수 있다. 표시 "NELD" 및 "CKKR"은 FokI 뉴클레아제 도메인의 유형 ("ELD" 또는 "KKR" FokI 도메인 변이체), 그리고 벡터의 다른 양상을 지시한다 (PCT 공개 번호 WO 2017/136049를 참조한다). 표 6A는 SBS#51949 파트너, 또는 모듈 A, B 및 C 내에 N 말단 핑거에서 위치 -5에서 Q를 삽입한 변경을 포함하는 SBS#51949 파트너와 함께 SBS#51857 유도체 파트너에서 만들어진 돌연변이의 대합을 보여주는데, 여기서 이러한 파트너는 FokI 도메인에서 R416S 돌연변이를 더욱 포함하고, 여기서 실험은 각 ZFN을 인코딩하는 2 μg의 mRNA를 이용하여 실행되었다. 이들 실험은 또한, SBS#51949 단백질에서 돌연변이를 이용하여 행위되었는데 (표 6B를 참조한다), 여기서 FokI 도메인의 인산염 상호작용 아미노산에서 돌연변이가 중추 돌연변이와 조합으로 또한 검사되었다. 이들 데이터는 추가 변경이 ZFN 쌍의 특이성에 영향을 줄 수 있다는 것을 지시하였다.

^* 63022-R416S는 SBS#65721로서 또한 알려져 있다.

^** 63022-K525S는 SBS#65722로서 또한 알려져 있다.

실험은 CD34+ 세포를 이용하여 반복되었는데, 여기서 RNA는 제조업체의 사용설명서에 따른 최적화된 조건을 이용한 BTX 형질감염 시스템을 이용하여 세포로 전달되었다. 3가지 농도의 RNA가 이용되었다: 60, 20 및 5 μg/mL 최종 농도. 데이터는 아래의 표 6C에서 도시되고, 그리고 오프 표적 개열이 실제적으로 감소될 만큼 (>100x) 심지어 매우 낮은 수준의 ZFN mRNA에서도 견실한 온 표적 개열이 검출될 수 있다는 것을 증명한다. 돌연변이는 도면 2c에서 도시된 명명법에서 표시된다. 실험은 결과의 견고성을 결정하기 위해, 바로 아래의 표 6C으로부터 부모 및 3x(R->Q)/3x(R->Q) 쌍을 이용하여 반복되었다. 표 6D에서 목격되는 바와 같이, 결과는 고도로 반복적이었다.

괄호 안에 숫자는 뉴클레아제 개열의 증거가 발견되지 않은 값을 표시한다. ^*는 오른쪽 ZFN이 FokI 뉴클레아제 도메인에서 추가 R416S 돌연변이를 더욱 포함했다는 것을 지시한다.

^*는 오른쪽 ZFN이 FokI 뉴클레아제 도메인에서 추가 R416S 돌연변이를 더욱 포함했다는 것을 지시한다.

실시예 4: 최적 온 표적 활성을 위한 ZFN 파트너의 적정

ZFN 쌍의 각 파트너를 개별적으로 적정하는 것은 각 ZFN 파트너의 최적 농도를 결정하는 것을 허용하고, 그리고 따라서, 오프 표적 변형을 최소화하면서 상기 쌍에 의한 최대 온 표적 변형을 확보할 수 있다. 각 개별 ZFN 절반 도메인은 동계 DNA 표적에 결합의 자체 동역학을 가질 수 있고, 따라서 각각의 별개 적정을 통해, 최적 활성이 달성될 수 있다. 따라서, BCL11A 특이적 쌍 SBS#51949/SBS#51857이 mRNA로서 도입된 ZFN을 이용하는, CD34+ 세포에서 적정 연구에 이용되었는데, 여기서 이들 ZFN의 높은 농도가 오프 표적 개열의 검출을 허용하는데 이용되었다. 이들 실험 (아래의 표 7)은 SBS#51857 파트너를 적정하는 것이 견실한 온 표적 개열을 유지하면서 오프 표적 개열에서 감소 (거의 8-배)를 유발한다는 것을 발견하였다. 가령, 60 μg/mL의 51949 mRNA가 6.6 μg/mL의 51857 mRNA와 조합으로 이용될 때, 온 표적 변형은 60 μg/mL의 각 ZFN이 이용될 때와 거의 동일하게 남아있었고 (각각 60 μg/mL가 이용될 때 76.1% 삽입-결실, 60 μg/mL의 51949가 6.6 μg/mL의 51857과 조합으로 이용될 때 78.3% 삽입-결실), 반면 집합적 오프 표적은 32.4% 삽입-결실에서 4.0%로 하락하였다. 주목할 것은 양쪽 ZFN에 대한 mRNA 입력을 동등하게 감소시키는 것은 온 표적 변형에서 점진적인 하락을 야기하는 반면, 오프 표적 변형은 온 표적 변형이 감소될 때에만 실제적으로 감소되었다는 점이다.

표 7: 단일 ZFN 적정

μg/mL RNA		각 좌위에서 삽입-결실 %
51949	51857	BCL11A	NIFMAEVG OT1	GJZEIYTO OT2	PEVYOHIU OT3	ZJCRPAXW OT4	TXHULGPN OT5	집합적 오프 표적
60.0	60.0	76.1	24.6	2.81	3.06	1.12	0.79	32.4
40.0	40.0	76.5	14.6	1.69	1.77	0.80	0.43	19.3
20.0	20.0	71.5	4.9	0.62	0.36	0.35	0.08	6.3
10.0	10.0	62.0	1.3	0.10	0.14	0.26	0.08	1.9

60.0	20.0	78.3	11.8	1.38	1.32	0.58	0.40	15.5
60.0	6.6	78.9	2.8	0.27	0.36	0.40	0.19	4.0
60.0	2.2	73.7	0.9	0.15	0.29	0.28	0.10	1.8

각 ZFN 파트너의 발현이 전달되는 ZFN-인코딩 mRNA의 양과 상관한다는 것을 증명하기 위해 웨스턴 분석이 또한 수행되었다 (도면 10). 이러한 실험에서, CD34+ 세포는 지시된 ZFN으로 형질감염되었고, 그리고 24 시간 후 ZFN 단백질의 발현이 항-Flag 항체 (이들 발현 구조체는 인코딩된 Flag 태그를 포함하였다)를 이용하여 검출되었다. 이들 ZFN이 2a 자가-개열 펩티드 서열에 의해 분리된 단일 RNA로서 동시도입될 때, 이들 두 단백질의 발현이 또한 분석되었다 (도면 10에서 레인 2를 참조한다).

온 또는 오프 표적 개열 활성 둘 모두에 대한 임의의 효과가 있는 지를 확인하기 위해, 양쪽 ZFN을 독립적으로 변화시키면서 적정이 반복되었다. 결과 (도면 11)는 양쪽 파트너의 하향 적정이 오프 표적 개열을 감소시키지만, 이러한 영향이 SBS#51857에 대해 가장 강하다는 것을 증명하였다. 도면 11에서 BCL11A 온 표적 차트에서 상자는 6.6 또는 60 μg의 SBS#51857 mRNA와 함께 60 μg의 SBS#51949 mRNA를 이용하면 의도된 BCL11A 표적에 대한 개열 활성은 유지되고, 반면 부위 NIFMAEVG에서 오프 표적 활성은 SBS#51857의 상기 감소된 용량에서 27에서 4% 삽입-결실로 하락하였다는 것을 지시한다.

실시예 5: ZFN 파트너 적정 및 Fok I-인산염 접촉 돌연변이의 조합

그 다음, 예시적인 FokI 돌연변이와 조합된 ZFN 파트너 적정의 활성을 계측하기 위한 분석이 실행되었다. Fok 돌연변이를 포함하는 BCL11A-특이적 ZFN은 오프 표적 절단을 감소시키면서 온 표적 활성을 보존하기 위해 상기 도시된 비율에서 이용되었다. 실험은 CD34+ 세포에서 실행되었는데, 여기서 이들 세포는 상기 ZFN을 인코딩하는 mRNA로 형질감염되었다. 데이터는 아래의 표 8에서 제시된다. "온/오프 비율"은 지정된 표본에 대해 조합된 온 표적 대 모든 오프 표적 활성의 비율을 표시한다. 6.6 μg/mL의 SBS#51857 및 60μg/mL SBS#51949-R416S FokI 돌연변이체의 조합은 5개의 모니터링된 오프 표적 부위 모두에서 활성을 극적으로 낮추고 온 표적/오프 표적 비율에서 32-배 향상 (60μg/mL의 각 부모 ZFN에 대해 89.52 대 2.76)을 산출하면서, 유사한 수준의 온 표적 활성 (60 μg의 양쪽 부모 ZFN에 대해 84.85% 대 78.17%)을 산출하였다.

표 8: Fok I 돌연변이체 및 ZFN 파트너의 감소된 적정의 조합:

% NHEJ 활성

mRNA1	μg/mL	mRNA2	μg/mL	BCL11A	NIFMAEVG OT1	GJZEIYTO OT2	PEVYOHIU OT3	ZJCRPAXW OT4	TXHULGPN OT5	온/오프 비율
51857	60	51949	60	78.17	21.96	2.09	2.92	0.73	0.61	2.76
51857	60	51949 R416S	60	84.87	6.11	0.31	1.08	0.65	0.12	10.27
51857	60	51949 K448S	60	81.03	8.90	0.72	4.40	1.29	0.64	5.08
51857	60	51949 K525S	60	80.17	0.89	0.09	0.13	0.20	0.04	59.47
51857	6.6	51949	60	85.21	3.39	0.38	0.49	0.14	0.10	18.98
51857	6.6	51949 R416S	60	84.85	0.68	0.06	0.11	0.08	0.03	89.52
51857	6.6	51949 K448S	60	83.46	1.01	0.09	0.34	0.22	0.06	48.55
51857	6.6	51949 K525S	60	67.92	0.14	0.01	0.02	0.04	0.01	292.27

표 1에서 앞서 열거된 모든 오프 표적 부위는 적정 및 FokI 돌연변이체 접근법을 조합함으로써 오프 표적 활성에 대한 효과에 대해 조사되었다 (도면 12를 참조한다).

데이터는 오프 표적 활성에서 거의 30-배의 집합적 감소를 보여주었다.

데이터는 또한, 개열 이후에 전술된 선입견 없는 포획 검정에 의해 검출된 포획 사건의 횟수의 측면에서 분석되었다. 표 6D에서 전술된 BCL11A-특이적 쌍, 부모 쌍 (SBS51857/SBS51949) 및 변이체 쌍 (SBS63014/SBS65721) 둘 모두 이용되었고, 그리고 오프 표적 포획 사건의 횟수가 검정되었다. 이러한 실험에서, 이들 ZFN은 CD34+ 세포에 동등한 양 (60 μg/mL 최종 농도)으로, 또는 부모 쌍의 경우에 6.6 μg과 60 μg 최종 농도 및 변이체의 경우에 20 μg과 60 μg 최종 농도로 제공되었다.

결과는 도면 13에서 도시되고, 그리고 상기 부모와 변이체가 양쪽 농도 조건에서 견실한 개열 활성 (>80% 삽입-결실)을 나타내지만, 특히 변이체 쌍의 경우에 비-동등한 용량으로 전달될 때 오프 표적 포획 사건이 크게 감소되었다는 것을 증명한다. ZFN FokI 돌연변이 및 비-동등한 농도의 ZFN 파트너의 조합은 개열 특이성에서 350-배 증가를 유발하였다.

실시예 6: ZFP 중추 돌연변이 및 Fok I 인산염 접촉 돌연변이의 조합

우리는 또한, 실시예 2에서 설명된 FokI 인산염 접촉 돌연변이와 함께, 실시예 3에서 설명된 아연 핑거 중추 돌연변이를 포함하는 ZFN을 산출하였다. 이러한 조합은 2가지 용량: 6μg 또는 2μg에서 CD34+ 세포에서 BCL11A-특이적 ZFN 쌍으로 검사되었다. 결과는 아래의 표 9에서 제시되고, 그리고 이들 2가지 유형의 접근법을 조합하는 것이 오프 표적 활성의 양에 유의미하게 영향을 줄 수 있다는 것을 증명한다. 이러한 표에서, 중추 돌연변이는 모듈 (A, B 및/또는 C, 도면 7 참조)마다 돌연변이의 유형으로서 도시된다. 가령, 51949 LeuABC R416S로 표지화된 표본에서, 단백질은 핑거 1 (모듈 A), 3 (모듈 B) 및 5 (모듈 C)에서 R->L 중추 치환을 포함하고, 그리고 R416S FokI 돌연변이를 또한 보유하였다. 여러 실례에서, 완전한 온 표적 활성을 유지하면서, 검출가능한 오프 표적 활성을 갖지 않는 ZFN 쌍이 있었다. 이들 실례는 표 9에서 상자로 표시된다.

표 9: ZFN 중추 및 Fok I 인산염 접촉 돌연변이를 포함하는 ZFN에 대한 활성 (% NHEJ).

ND: 활성 검출되지 않음

실시예 7: 파트너 적정, ZFP 중추 및 Fok I 인산염 접촉 돌연변이의 조합

활성 계측이 또한 행위되는데, 여기서 최적 파트너링 적정이 ZFP 중추 돌연변이 및 ZFN FokI 돌연변이를 포함하는 ZFN과 조합된다. 이들 ZFN은 CD34+ 세포에서 전술된 바와 같이 검사되고, 그리고 오프 표적 활성의 감소된 수준을 통해 ZFN 쌍의 증가된 특이성을 보여준다.

실시예 8: 임상적 규모에서 CD34+ 세포에서 ZFN의 특이성

BCL11A 변이체 쌍 SBS63014/SBS65722의 특이성은 또한, 임상 시험용 세포 물질을 산출하는데 적합한 대규모 절차에서 검사되었다. 간단히 말하면, 로트당 거의 95-130 백만 개의 CD34+ 세포가 제조업체의 명세서에 따라서 Maxcyte 장치를 이용하여 형질도입되었다. 80 μg/mL의 SBS63014 mRNA 및 20 μg/mL의 SBS#65722 mRNA가 이용되었고, 그리고 2 일 후, 이들 세포는 선입견 없는 포획 검정을 이용하여 오프 표적 개열에 대해 검정되었다.

결과는 47개의 상이한 잠재적 포획 좌위가 PCR에 의해 분석될 때 (도면 14를 참조한다), 79.54% 삽입-결실이 확인된 표적 위치를 제외하고, 어떤 유의미한 변형도 검출되지 않는다는 것을 보여주었다. 이러한 데이터는 본원에서 설명된 바와 같은 이들 뉴클레아제가 심지어 대규모 제조 절차에서 이용될 때에도 고도로 특이적이라는 것을 증명한다.

실시예 9: 추가 특이성 연구

특이성 연구가 또한, 전술된 바와 같은 다양한 돌연변이를 갖는 AAVS1-표적화된 ZFN을 이용하여 수행되었다. 특히, U.S. 공개 번호 20150110762에서 설명된 바와 같은 ZFN SBS#30035 및 SBS#30054가 전술된 바와 같은 활성 검정에서 이합체화 돌연변이체 (가령, ELD, KKR 및 추가 돌연변이체), 다른 돌연변이 (가령, 샤키)뿐만 아니라 인산염 접촉 돌연변이체를 비롯한 다양한 돌연변이체의 연구에 이용되었다.

다음의 표에서 결과를 위해, 지정된 FokI 돌연변이체(들)가 SBS 30035의 ELD FokI 도메인 (ELD_X로 표지화됨, 여기서 X는 FokI 돌연변이이다), SBS 30054의 KKR FokI 도메인 (KKR_X로 표지화됨, 여기서 X는 FokI 돌연변이이다), 또는 양쪽 구조체의 FokI 도메인 (ELD_KKR_X로 표지화됨, 여기서 X는 ELD 및 KKR FokI 도메인 둘 모두 내로 도입된 동일한 FokI 돌연변이이다) 내로 도입되었다. 변형되지 않은 "부모 구조체" 30035 및 30054의 조합에 대한 결과는 "부모", "부모들", "부모 ZFN", 또는 기타 유사한 것으로서 표지화된다. 더욱 낮은 용량의 각 부모 구조체는 종종, "절반 용량"으로 표지화된다. 뉴클레아제가 없는 음성 대조는 통상적으로, "GFP"로 표지화된다. 소정의 실험에서 계측된 모든 오프 표적에서 삽입-결실%의 합계에 의해 나눗셈된, 의도된 좌위 (종종, "AAVS1"로서 표지화됨)에서 삽입-결실%의 비율은 종종, "비율", "온/오프 비율" 등으로서 표지화된다.

AAVS1 표적 및 오프 표적의 위치는 아래에 도시되는데, 여기서 'hg38'은 UCSC 유전체 브라우저 데이터베이스, 빌드 hg38에 따른 조립된 유전체 데이터를 표시한다:

표 10A-10C는 2개의 상이한 실험 온 표적 (AAVS1) 및 3개의 오프 표적 (OT1, OT2, OT3)으로부터 개열 결과뿐만 아니라 R416 또는 K525에서 추가 치환 돌연변이 (야생형에 대한 모든 아미노산)를 갖는 이합체화 돌연변이체 ELD, KKR 및 ELD-KKR의 온 대 오프 표적의 비율을 보여준다. 또한, ELD_S418D, ELD_N476D, ELD_I479T, ELD_Q481E, ELD_N527D 및 ELD_Q531R 돌연변이체에서 결과가 도시된다.

표 11A-11C는 2개의 상이한 실험 온 표적 (AAVS1) 및 3개의 오프 표적 (OT1, OT2, OT3)으로부터 개열 결과뿐만 아니라 이합체화 돌연변이체 ELD 및/또는 KKR과 조합으로 418, 422 및 525에서 치환 돌연변이체를 비롯한 지시된 돌연변이체의 온 대 오프 표적의 비율을 보여준다.

표 12A-12C는 2개의 상이한 실험 온 표적 (AAVS1) 및 3개의 오프 표적 (OT1, OT2, OT3)으로부터 개열 결과뿐만 아니라 지시된 돌연변이체의 온 대 오프 표적의 비율을 보여준다.

표 13A 내지 13C는 지시된 돌연변이 (ELD, KKR, ELD/KKR 및 지시된 추가 돌연변이)를 갖는 AAVS1 표적화된 ZFN을 이용한 온 및 오프 표적 개열 사건을 보여준다.

표 14A-14C는 지시된 돌연변이체에서 결과를 보여준다.

표 15A 내지 15C는 지시된 돌연변이체에서 중복 실험의 결과를 보여준다.

표 17A 내지 17C는 예시적인 이중 변이체를 비롯한 지시된 예시적인 돌연변이체에서 결과를 보여준다.

표 18A 내지 18C는 지시된 개열 도메인 돌연변이체를 이용한 결과를 보여준다.

도면 15 및 16은 또한, 지시된 돌연변이체에서 선별된 결과의 요약을 보여준다.

이들 결과는 본원에서 설명된 돌연변이체에서 고도로 특이적인 개열을 증명한다.

본원에서 언급된 모든 특허, 특허 출원 및 간행물은 본원에서 전체적으로 참조로서 편입된다.

비록 이해의 명료함을 위해 예시 및 실례에 의하여 일부 상세하게 개시되긴 했지만, 상기 개시의 사상 또는 범위로부터 벗어나지 않으면서 다양한 변화 및 변형이 실시될 수 있다는 것은 당업자에게 명확할 것이다. 따라서, 전술한 설명 및 실례는 제한하는 것으로 해석되지 않아야 한다.

SEQUENCE LISTING <110> SANGAMO THERAPEUTICS, INC. <120> ENGINEERED TARGET SPECIFIC NUCLEASES <130> 8325-0156.40 <140> PCT/US2017/048409 <141> 2017-08-24 <150> 62/443,981 <151> 2017-01-09 <150> 62/378,978 <151> 2016-08-24 <160> 72 <170> PatentIn version 3.5 <210> 1 <211> 196 <212> PRT <213> Unknown <220> <223> Description of Unknown: Wild type FokI cleavage half domain <400> 1 Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His 1 5 10 15 Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala 20 25 30 Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe 35 40 45 Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg 50 55 60 Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly 65 70 75 80 Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile 85 90 95 Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg 100 105 110 Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser 115 120 125 Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn 130 135 140 Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly 145 150 155 160 Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys 165 170 175 Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly 180 185 190 Glu Ile Asn Phe 195 <210> 2 <211> 588 <212> DNA <213> Unknown <220> <223> Description of Unknown: Wild type FokI cleavage half domain <400> 2 cagctggtga agagcgagct ggaggagaag aagtccgagc tgcggcacaa gctgaagtac 60 gtgccccacg agtacatcga gctgatcgag atcgccagga acagcaccca ggaccgcatc 120 ctggagatga aggtgatgga gttcttcatg aaggtgtacg gctacagggg aaagcacctg 180 ggcggaagca gaaagcctga cggcgccatc tatacagtgg gcagccccat cgattacggc 240 gtgatcgtgg acacaaaggc ctacagcggc ggctacaatc tgcctatcgg ccaggccgac 300 gagatgcaga gatacgtgga ggagaaccag acccggaata agcacatcaa ccccaacgag 360 tggtggaagg tgtaccctag cagcgtgacc gagttcaagt tcctgttcgt gagcggccac 420 ttcaagggca actacaaggc ccagctgacc aggctgaacc acatcaccaa ctgcaatggc 480 gccgtgctga gcgtggagga gctgctgatc ggcggcgaga tgatcaaagc cggcaccctg 540 acactggagg aggtgcggcg caagttcaac aacggcgaga tcaacttc 588 <210> 3 <211> 28 <212> PRT <213> Unknown <220> <223> Description of Unknown: Zinc finger protein <400> 3 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp 1 5 10 15 His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu 20 25 <210> 4 <211> 23 <212> PRT <213> Unknown <220> <223> Description of Unknown: Zinc finger protein <400> 4 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu 1 5 10 15 Thr Thr His Ile Arg Thr His 20 <210> 5 <211> 23 <212> PRT <213> Unknown <220> <223> Description of Unknown: Zinc finger protein <400> 5 Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg 1 5 10 15 Lys Arg His Thr Lys Ile His 20 <210> 6 <211> 23 <212> PRT <213> Unknown <220> <223> Description of Unknown: Zinc finger protein <400> 6 Phe Ala Cys Pro Glu Cys Pro Lys Arg Phe Met Arg Ser Asp His Leu 1 5 10 15 Ser Lys His Ile Lys Thr His 20 <210> 7 <211> 179 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (8)..(8) <223> Q, S, or R <220> <221> MOD_RES <222> (13)..(13) <223> E, N, S, or R <220> <221> MOD_RES <222> (17)..(17) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (21)..(27) <223> Any amino acid <220> <221> MOD_RES <222> (45)..(45) <223> A, Q, L, or R <220> <221> MOD_RES <222> (49)..(55) <223> Any amino acid <220> <221> MOD_RES <222> (70)..(70) <223> E, N, S, or R <220> <221> MOD_RES <222> (74)..(74) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (78)..(84) <223> Any amino acid <220> <221> MOD_RES <222> (102)..(102) <223> A, Q, L, or R <220> <221> MOD_RES <222> (106)..(112) <223> Any amino acid <220> <221> MOD_RES <222> (127)..(127) <223> E, N, S, or R <220> <221> MOD_RES <222> (131)..(131) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (135)..(141) <223> Any amino acid <220> <221> MOD_RES <222> (159)..(159) <223> A, Q, L, or R <220> <221> MOD_RES <222> (163)..(169) <223> Any amino acid <400> 7 Val Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys Met 1 5 10 15 Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr His 20 25 30 Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe Ala 35 40 45 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser Gln 50 55 60 Lys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa 65 70 75 80 Xaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala 85 90 95 Cys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa 100 105 110 His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Xaa Ile 115 120 125 Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg 130 135 140 Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys 145 150 155 160 Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Thr Lys Ile His Leu 165 170 175 Arg Gly Ser <210> 8 <211> 151 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (8)..(8) <223> Q, S, or R <220> <221> MOD_RES <222> (13)..(13) <223> E, N, S, or R <220> <221> MOD_RES <222> (17)..(17) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (21)..(27) <223> Any amino acid <220> <221> MOD_RES <222> (42)..(42) <223> E, N, S, or R <220> <221> MOD_RES <222> (46)..(46) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (50)..(56) <223> Any amino acid <220> <221> MOD_RES <222> (74)..(74) <223> A, Q, L, or R <220> <221> MOD_RES <222> (78)..(84) <223> Any amino acid <220> <221> MOD_RES <222> (99)..(99) <223> E, N, S, or R <220> <221> MOD_RES <222> (103)..(103) <223> A, Q, L, E, N, Y, or R <220> <221> MOD_RES <222> (107)..(113) <223> Any amino acid <220> <221> MOD_RES <222> (131)..(131) <223> A, Q, L, or R <220> <221> MOD_RES <222> (135)..(141) <223> Any amino acid <400> 8 Val Pro Ala Ala Met Ala Glu Xaa Pro Phe Gln Cys Xaa Ile Cys Met 1 5 10 15 Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Lys Ile His 20 25 30 Thr Gly Ser Gln Lys Pro Phe Gln Cys Xaa Ile Cys Met Xaa Asn Phe 35 40 45 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Ile Arg Thr His Thr Gly Glu 50 55 60 Lys Pro Phe Ala Cys Asp Ile Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa 65 70 75 80 Xaa Xaa Xaa Xaa His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe 85 90 95 Gln Cys Xaa Ile Cys Met Xaa Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa 100 105 110 Xaa His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile 115 120 125 Cys Gly Xaa Lys Phe Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr His Thr 130 135 140 Lys Ile His Leu Arg Gly Ser 145 150 <210> 9 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Thr Gly Glu Lys Pro 1 5 <210> 10 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Thr Gly Gly Gln Arg Pro 1 5 <210> 11 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Thr Gly Gln Lys Pro 1 5 <210> 12 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Thr Gly Ser Gln Lys Pro 1 5 <210> 13 <211> 76 <212> DNA <213> Homo sapiens <400> 13 ctaatcagag gccaaaccct tcctggagcc tgtgataaaa gcaactgtta gcttgcacta 60 gactagcttc aaagtt 76 <210> 14 <211> 76 <212> DNA <213> Homo sapiens <400> 14 cttcctgcgg ggttttgtgc aaataaccca tgctcgggag cgaggccctg ggaaggagta 60 tctcgcttct ttgggt 76 <210> 15 <211> 76 <212> DNA <213> Homo sapiens <400> 15 cctaccccca ccacctcacc ttccctcagc cttgtgtttc agccccagtt agctgccctt 60 agttgctgat gtattg 76 <210> 16 <211> 76 <212> DNA <213> Homo sapiens <400> 16 agcacgtttc tccagtttcc agcctggggc ctggctataa agcaaatgct cagtccagca 60 ttgcggaatg caaggg 76 <210> 17 <211> 76 <212> DNA <213> Homo sapiens <400> 17 acagcaccgt gctgcacggc gtcctccggc cttgctgcct ggcaatgggt agccacctgg 60 cgtctgtctc agaata 76 <210> 18 <211> 76 <212> DNA <213> Homo sapiens <400> 18 ttcccagaag gcgattgaac ctgaagctgc gcctggcgcg tgagcctgtg ggggggacgc 60 ggctgagggg ctttga 76 <210> 19 <211> 76 <212> DNA <213> Homo sapiens <400> 19 tatcccttcc ccaagtgcaa ccaacagttg ctctaaagct aggctggtgg agttggggaa 60 agggccagca agtgag 76 <210> 20 <211> 76 <212> DNA <213> Homo sapiens <400> 20 tcctccatgc tcagaaagcc tttcttggag ccaggcacac aggaaatgtt agctagttag 60 cattggctct aatact 76 <210> 21 <211> 76 <212> DNA <213> Homo sapiens <400> 21 tagctgggga gagattgcct ctctcagggc ctagccagtt cctagaaata gcaagggctc 60 agctgagagc atgctt 76 <210> 22 <211> 76 <212> DNA <213> Homo sapiens <400> 22 tcccccggaa gtgtccgcac ctcctagagc ccagcgagcg agcgtttgtg cttttgtcct 60 ttgaaccggg tgtggt 76 <210> 23 <211> 76 <212> DNA <213> Homo sapiens <400> 23 gactcattca tccactcatt ctgagcactt gctgcacact aggccctggg ctggggcttc 60 agcccaggag ttcact 76 <210> 24 <211> 76 <212> DNA <213> Homo sapiens <400> 24 atgtagtctg acggccgcga ctggttcgta gcttttgagt gaggcggcgg gaagggagcg 60 agggaagagc ggcagt 76 <210> 25 <211> 76 <212> DNA <213> Homo sapiens <400> 25 tcatgttatg gaagtggctt ctttccttaa gccttatgaa taagcctctg ctagcttcaa 60 actttgtgtg cagctt 76 <210> 26 <211> 76 <212> DNA <213> Homo sapiens <400> 26 cataaagcac ttacaacagt gcctggcaaa tgcctagtgc acagcaagtg ttagctattg 60 ttaatgacta tccatt 76 <210> 27 <211> 76 <212> DNA <213> Homo sapiens <400> 27 atttttgccc ctgtcttctc ttttcctcct ttgctgcatc ccaggctcca gcctttcagc 60 cctatttgca gtaccc 76 <210> 28 <211> 76 <212> DNA <213> Homo sapiens <400> 28 acaaggggtt caaggttatg aataacctgt gctaatccca gaggccccag gacagagtaa 60 gtgggaacaa acactg 76 <210> 29 <211> 76 <212> DNA <213> Homo sapiens <400> 29 cggaagttaa tatgatcatt gctaacattt gctgtgtttc aggcactgta agcatgtata 60 tgggtcctta aaggga 76 <210> 30 <211> 76 <212> DNA <213> Homo sapiens <400> 30 tgagcccaga aaccccttac ccttcctcct gcctcttgag aggccagtgt taggtgttag 60 ccggggtgca aagctc 76 <210> 31 <211> 76 <212> DNA <213> Homo sapiens <400> 31 aacctggtgc gagcagcccg ggctacaggg ttgcctgagg tgtgggtccc aggatggagg 60 agccccaggc cggcgg 76 <210> 32 <211> 76 <212> DNA <213> Homo sapiens <400> 32 acttcggtga aggaagtcat cagtgcagtt gccgacaagc tgggctccgg ggagggcctg 60 atcatagtca agatga 76 <210> 33 <211> 76 <212> DNA <213> Homo sapiens <400> 33 ggggccaggc aggaagaaca gctaactcta gctcacctgc aaggctcagc actgggttca 60 tttgaagtag tgtcct 76 <210> 34 <211> 76 <212> DNA <213> Homo sapiens <400> 34 ctcctttggg tgtggacggg actaacactt gctccatgtc agggctgcag gacctcctgg 60 ctgttgacag caggca 76 <210> 35 <211> 76 <212> DNA <213> Homo sapiens <400> 35 gatgtttgaa aagcgctgag cctggcctgg cacctaaaca gctcagcaag tgttagccag 60 gatcactagc agtaat 76 <210> 36 <211> 76 <212> DNA <213> Homo sapiens <400> 36 accctgccga tttccttcca gttgctcgct ggggcaaccg gctaggctgg aggaagggcg 60 aggacggtgt cacccc 76 <210> 37 <211> 76 <212> DNA <213> Homo sapiens <400> 37 gaacatggtg aggacaaaat gatgtccagg agccttttct ttggccattg ctagcctgag 60 acgaaaagtc agtggc 76 <210> 38 <211> 76 <212> DNA <213> Homo sapiens <400> 38 agtctgtcag tctatcgtcc ctacctgcag cccaaagcat aagcaacatc ttgcccagct 60 cagaggtgac aacctc 76 <210> 39 <211> 76 <212> DNA <213> Homo sapiens <400> 39 caccgaccca aggaccactc cttccaggaa cctagcctaa agcaaaggtg cagacagccc 60 ggggccaccg ctgacc 76 <210> 40 <211> 76 <212> DNA <213> Homo sapiens <400> 40 ttgcaaaagg aagtttgaag ctagcagagg ctgattcatg aggttcaagg aaagaagtca 60 tctctgtaac ataaaa 76 <210> 41 <211> 76 <212> DNA <213> Homo sapiens <400> 41 cgtcccccag agtcctgttt cctctccttc agcccccaaa tgagcaaagg ttaggcccca 60 cccctgctga gtcagc 76 <210> 42 <211> 76 <212> DNA <213> Homo sapiens <400> 42 gtcaggggac agggtttcct agcatccgcg agccttacag aaaggcaact gtgcagtgct 60 ccagctggct ttctca 76 <210> 43 <211> 76 <212> DNA <213> Homo sapiens <400> 43 accatcagag aagctaacct ttcctgaggc ctaactactt tgcaggtcct gtattatgtc 60 ctctatagac attagg 76 <210> 44 <211> 76 <212> DNA <213> Homo sapiens <400> 44 gatcatttca aagaaaacat tctggaacag ttgcctatgg gcacggcagg gtgacggtgc 60 tgcttctggg tttgac 76 <210> 45 <211> 76 <212> DNA <213> Homo sapiens <400> 45 gaagggcaga gaactataat gacacagttg ctttattgct ggacccagga cagtttatac 60 agcagttcgg aaaggc 76 <210> 46 <211> 76 <212> DNA <213> Homo sapiens <400> 46 acttattgta agtgacgcat gtgaccagtt gccaattgtt caggctacag cttggatctg 60 ttagcatcct cattta 76 <210> 47 <211> 76 <212> DNA <213> Homo sapiens <400> 47 cccaggggct gtgggacact cagagagcct atgcctgtgc cctgggctcc gggaggggag 60 aggatctggg ggccag 76 <210> 48 <211> 77 <212> DNA <213> Homo sapiens <400> 48 ccccaggggc tgtgggacac tcagagagcc tatgcctgtg ccctgggctc cgggagggga 60 gaggatctgg gggccag 77 <210> 49 <211> 42 <212> DNA <213> Homo sapiens <400> 49 agcttcctgc agcctccctc aaagcagatg ttagcactat ta 42 <210> 50 <211> 42 <212> DNA <213> Homo sapiens <400> 50 cctcacctag aacctgggcc cctgcaactg taacctgtgg ca 42 <210> 51 <211> 42 <212> DNA <213> Homo sapiens <400> 51 ccagaggaag aacagttgct tgggtctagg cctcaggaag gg 42 <210> 52 <211> 43 <212> DNA <213> Homo sapiens <400> 52 cctgtgctgg ggcctgggag gcaggcggct gctagccatc ctg 43 <210> 53 <211> 42 <212> DNA <213> Homo sapiens <400> 53 tgacttagga agcagttgct acctgccagg ccccaggcta gg 42 <210> 54 <211> 40 <212> DNA <213> Homo sapiens <400> 54 tcagtgattg ggttccgaat cctcctcctg aaagtggccg 40 <210> 55 <211> 40 <212> DNA <213> Homo sapiens <400> 55 ccatatgcag aaaacagaaa ctgtacccct tccttacacc 40 <210> 56 <211> 40 <212> DNA <213> Homo sapiens <400> 56 tggccctttg cagaaaaggt tgttgaaccc taccgtaaac 40 <210> 57 <211> 40 <212> DNA <213> Homo sapiens <400> 57 ccggagagaa ggctccggtt cagcactgag atcaggacgg 40 <210> 58 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Leu Val Lys Gly Glu Met Glu Lys Lys Lys Ser Asp Leu Arg His Lys 1 5 10 15 Leu Lys His Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Gln 20 25 30 Asp Ser Lys Gln Asn Arg Leu Phe Glu Phe Lys Val Val Glu Phe Leu 35 40 45 Lys Glu Val Tyr Asp Tyr Asn Gly Lys His Leu Gly Gly Ser Arg Lys 50 55 60 Pro Asp Gly Ala Leu Tyr Thr Asn Gly Leu Lys Thr Asp Tyr Gly Ile 65 70 75 80 Ile Leu Asp Thr Lys Ala Tyr Lys Asp Gly Tyr Ser Leu Pro Ile Ser 85 90 95 Gln Ala Asp Glu Met Gln Arg Tyr Val Asp Glu Asn Asn Asn Arg Asn 100 105 110 Ala Ile Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Asn Ser Ile 115 120 125 Leu Asp Phe Lys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asp Tyr 130 135 140 Lys Lys Gln Leu Ala Arg Val Ser Asn Leu Thr Lys Arg Lys Gly Ala 145 150 155 160 Val Leu Ser Val Glu Gln Leu Leu Leu Gly Gly Glu Lys Ile Lys Asp 165 170 175 Gly Ser Leu Thr Leu Glu Asp Val Gly Asp Lys Phe Asn Asn Asp Glu 180 185 190 Ile Ile Phe 195 <210> 59 <211> 192 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 59 Gln Ile Val Lys Ser Ser Ile Glu Met Ser Lys Ala Asn Met Arg Asp 1 5 10 15 Asn Leu Gln Met Leu Pro His Asp Tyr Ile Glu Leu Ile Glu Ile Ser 20 25 30 Gln Asp Pro Tyr Gln Asn Arg Ile Phe Glu Met Lys Val Met Asp Leu 35 40 45 Phe Ile Asn Glu Tyr Gly Phe Ser Gly Ser His Leu Gly Gly Ser Arg 50 55 60 Lys Pro Asp Gly Ala Met Tyr Ala His Gly Phe Gly Val Ile Val Asp 65 70 75 80 Thr Lys Ala Tyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala Asp 85 90 95 Glu Met Glu Arg Tyr Val Arg Glu Asn Ile Asp Arg Asn Glu His Val 100 105 110 Asn Ser Asn Arg Trp Trp Asn Ile Phe Pro Glu Asp Thr Asn Glu Tyr 115 120 125 Lys Phe Leu Phe Val Ser Gly Phe Phe Lys Gly Asn Phe Glu Lys Gln 130 135 140 Leu Glu Arg Ile Ser Ile Asp Thr Gly Val Gln Gly Gly Ala Leu Ser 145 150 155 160 Val Glu His Leu Leu Leu Gly Ala Glu Tyr Ile Lys Arg Gly Ile Leu 165 170 175 Thr Leu Tyr Asp Phe Lys Asn Ser Phe Leu Asn Lys Glu Ile Gln Phe 180 185 190 <210> 60 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 60 Lys Ser Ser Thr Glu Glu Leu Lys Ala Gln Leu Arg Thr Gln Leu Thr 1 5 10 15 Asn Ile Ser Leu Asp Tyr Leu Gln Leu Val Asp Ile Ser Thr Asp Ser 20 25 30 Lys Gln Asn Arg Leu Phe Glu Met Lys Val Met Asp Leu Phe Ile Asn 35 40 45 Glu Leu Asp Phe Lys Gly Ser His Leu Gly Gly Gly Arg Lys Pro Asp 50 55 60 Gly Ala Val Tyr Thr Thr Asn Tyr Gly Ile Ile Val Asp Thr Lys Ala 65 70 75 80 Tyr Lys Asp Gly Tyr Asn Leu Pro Ile Ser Gln Ala Asp Glu Met Glu 85 90 95 Arg Tyr Val Arg Glu Asn Ile Asp Arg Asn Lys Gly Ile Asn Pro Asn 100 105 110 Glu Trp Trp Thr Ile Phe Pro Ser Ser Ile Asn Asp Phe Thr Phe Leu 115 120 125 Phe Val Ser Gly Tyr Phe Lys Gly Asn Phe Glu Gly Gln Leu Gln Arg 130 135 140 Ile Ser Met Ser Thr Gly Ile Lys Gly Gly Ala Ile Gly Val Glu His 145 150 155 160 Leu Leu Leu Cys Ala Glu Tyr Tyr Lys Arg Gly Ile Leu Ser His Gln 165 170 175 Asp Ile Arg Asp Ser Phe Lys Asn Ala Glu Ile Glu Phe 180 185 <210> 61 <211> 192 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 61 Ile Lys Ser Asn Ile Ser Leu Leu Lys Asp Glu Leu Arg Gly Gln Ile 1 5 10 15 Ser His Ile Ser His Glu Tyr Leu Ser Leu Ile Asp Leu Ala Phe Asp 20 25 30 Ser Lys Gln Asn Arg Leu Phe Glu Met Lys Val Leu Glu Leu Leu Val 35 40 45 Asn Glu Tyr Gly Phe Lys Gly Arg His Leu Gly Gly Ser Arg Lys Pro 50 55 60 Asp Gly Ile Val Tyr Ser Thr Thr Leu Glu Asp Asn Phe Gly Ile Ile 65 70 75 80 Val Asp Thr Lys Ala Tyr Ser Glu Gly Tyr Ser Leu Pro Ile Ser Gln 85 90 95 Ala Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Ser Asn Arg Asp Glu 100 105 110 Glu Val Asn Pro Asn Lys Trp Trp Glu Asn Phe Ser Glu Glu Val Lys 115 120 125 Lys Tyr Tyr Phe Val Phe Ile Ser Gly Ser Phe Lys Gly Lys Phe Glu 130 135 140 Glu Gln Leu Arg Arg Leu Ser Met Thr Thr Gly Val Asn Gly Ser Ala 145 150 155 160 Val Asn Val Val Asn Leu Leu Leu Gly Ala Glu Lys Ile Arg Ser Gly 165 170 175 Glu Met Thr Ile Glu Glu Leu Glu Arg Ala Met Phe Asn Asn Ser Glu 180 185 190 <210> 62 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 62 Lys Leu Ala Lys Ser Ser Gln Ser Glu Thr Lys Glu Lys Leu Arg Glu 1 5 10 15 Lys Leu Arg Asn Leu Pro His Glu Tyr Leu Ser Leu Val Asp Leu Ala 20 25 30 Tyr Asp Ser Lys Gln Asn Arg Leu Phe Glu Met Lys Val Ile Glu Leu 35 40 45 Leu Thr Glu Glu Cys Gly Phe Gln Gly Leu His Leu Gly Gly Ser Arg 50 55 60 Arg Pro Asp Gly Val Leu Tyr Thr Ala Gly Leu Thr Asp Asn Tyr Gly 65 70 75 80 Ile Ile Leu Asp Thr Lys Ala Tyr Ser Ser Gly Tyr Ser Leu Pro Ile 85 90 95 Ala Gln Ala Asp Glu Met Glu Arg Tyr Val Arg Glu Asn Gln Thr Arg 100 105 110 Asp Glu Leu Val Asn Pro Asn Gln Trp Trp Glu Asn Phe Glu Asn Gly 115 120 125 Leu Gly Thr Phe Tyr Phe Leu Phe Val Ala Gly His Phe Asn Gly Asn 130 135 140 Val Gln Ala Gln Leu Glu Arg Ile Ser Arg Asn Thr Gly Val Leu Gly 145 150 155 160 Ala Ala Ala Ser Ile Ser Gln Leu Leu Leu Leu Ala Asp Ala Ile Arg 165 170 175 Gly Gly Arg Met Asp Arg Glu Arg Leu Arg 180 185 <210> 63 <211> 190 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 63 Lys Ile Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Lys Val Arg Asp 1 5 10 15 Lys Leu Lys Tyr Val Asp His Arg Tyr Leu Ala Leu Ile Asp Leu Ala 20 25 30 Tyr Asp Gly Thr Ala Asn Arg Asp Phe Glu Ile Gln Thr Ile Asp Leu 35 40 45 Leu Ile Asn Glu Leu Lys Phe Lys Gly Val Arg Leu Gly Glu Ser Arg 50 55 60 Lys Pro Asp Gly Ile Ile Ser Tyr Asn Ile Asn Gly Val Ile Ile Asp 65 70 75 80 Asn Lys Ala Tyr Ser Thr Gly Tyr Asn Leu Pro Ile Asn Gln Ala Asp 85 90 95 Glu Met Ile Arg Tyr Ile Glu Glu Asn Gln Thr Arg Asp Glu Lys Ile 100 105 110 Asn Ser Asn Lys Trp Trp Glu Ser Phe Asp Glu Lys Val Lys Asp Phe 115 120 125 Asn Tyr Leu Phe Val Ser Ser Phe Phe Lys Gly Asn Phe Lys Asn Asn 130 135 140 Leu Lys His Ile Ala Asn Arg Thr Gly Val Asn Gly Gly Ala Ile Asn 145 150 155 160 Val Glu Asn Leu Leu Tyr Phe Ala Glu Glu Leu Lys Ala Gly Arg Ile 165 170 175 Ser Tyr Leu Asp Ser Phe Lys Met Tyr Asn Asn Asp Glu Ile 180 185 190 <210> 64 <211> 190 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 64 Val Lys Ser Glu Val Ser Val Phe Lys Asp Tyr Leu Arg Thr His Leu 1 5 10 15 Thr His Val Asp His Arg Tyr Leu Ile Leu Val Asp Leu Gly Phe Asp 20 25 30 Gly Ser Ser Asp Arg Asp Tyr Glu Met Lys Thr Ala Glu Leu Phe Thr 35 40 45 Ala Glu Leu Gly Phe Met Gly Ala Arg Leu Gly Asp Thr Arg Lys Pro 50 55 60 Asp Val Cys Val Tyr His Gly Ala Asn Gly Leu Ile Ile Asp Asn Lys 65 70 75 80 Ala Tyr Gly Lys Gly Tyr Ser Leu Pro Ile Lys Gln Ala Asp Glu Ile 85 90 95 Tyr Arg Tyr Ile Glu Glu Asn Lys Glu Arg Asp Ala Arg Leu Asn Pro 100 105 110 Asn Gln Trp Trp Lys Val Phe Asp Glu Ser Val Thr His Phe Arg Phe 115 120 125 Ala Phe Ile Ser Gly Ser Phe Thr Gly Gly Phe Lys Asp Arg Ile Glu 130 135 140 Leu Ile Ser Met Arg Ser Gly Ile Cys Gly Ala Ala Val Asn Ser Val 145 150 155 160 Asn Leu Leu Leu Met Ala Glu Glu Leu Lys Ser Gly Arg Leu Asp Tyr 165 170 175 Glu Glu Trp Phe Gln Tyr Phe Asp Asn Asp Glu Ile Ser Phe 180 185 190 <210> 65 <211> 192 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 65 Gln Glu Leu Lys Asp Glu Gln Ala Glu Lys Arg Lys Ala Lys Phe Leu 1 5 10 15 Lys Glu Thr Asn Leu Pro Met Lys Tyr Ile Glu Leu Leu Asp Ile Ala 20 25 30 Tyr Asp Gly Lys Arg Asn Arg Asp Phe Glu Ile Val Thr Met Glu Leu 35 40 45 Phe Arg Asn Val Tyr Arg Leu His Ser Lys Leu Leu Gly Gly Gly Arg 50 55 60 Lys Pro Asp Gly Leu Leu Tyr Gln Asp Arg Phe Gly Val Ile Val Asp 65 70 75 80 Thr Lys Ala Tyr Gly Lys Gly Tyr Ser Lys Ser Ile Asn Gln Ala Asp 85 90 95 Glu Met Ile Arg Tyr Ile Glu Asp Asn Lys Arg Arg Asp Glu Asn Arg 100 105 110 Asn Pro Ile Lys Trp Trp Glu Ala Phe Pro Asp Thr Ile Pro Glu Phe 115 120 125 Tyr Phe Met Trp Val Ser Ser Lys Phe Ile Gly Lys Phe Gln Glu Gln 130 135 140 Leu Asp Tyr Thr Ser Asn Glu Thr Gln Ile Lys Gly Ala Ala Leu Asn 145 150 155 160 Val Glu Gln Leu Leu Leu Gly Ala Asp Leu Val Leu Lys Gly Gln Leu 165 170 175 His Ile Ser Asp Leu Pro Ser Tyr Phe Gln Asn Lys Glu Ile Glu Phe 180 185 190 <210> 66 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 66 Lys Val Ser Lys Thr Asn Ile Leu Glu Leu Lys Asp Asn Thr Arg Glu 1 5 10 15 Lys Leu Val Tyr Leu Asp His Arg Tyr Leu Ser Leu Phe Asp Leu Ala 20 25 30 Tyr Asp Asp Lys Ala Ser Arg Asp Phe Glu Ile Gln Thr Ile Asp Leu 35 40 45 Leu Ile Asn Glu Leu Gln Phe Lys Gly Leu Arg Leu Gly Glu Arg Arg 50 55 60 Lys Pro Asp Gly Ile Ile Tyr Gly Val Asn Gly Val Ile Ile Asp Asn 65 70 75 80 Lys Ala Tyr Ser Lys Gly Tyr Asn Leu Pro Ile Arg Gln Ala Asp Glu 85 90 95 Met Ile Arg Tyr Ile Gln Glu Asn Gln Ser Arg Asp Glu Lys Leu Asn 100 105 110 Pro Asn Lys Trp Trp Glu Asn Phe Glu Glu Glu Thr Ser Lys Phe Asn 115 120 125 Tyr Leu Phe Ile Ser Ser Lys Phe Ile Ser Gly Phe Lys Lys Asn Leu 130 135 140 Gln Tyr Ile Ala Asp Arg Thr Gly Val Asn Gly Gly Ala Ile Asn Val 145 150 155 160 Glu Asn Leu Leu Cys Phe Ala Glu Met Leu Lys Ser Gly Lys Leu Glu 165 170 175 Tyr Asn Asp Phe Phe Asn Gln Tyr Asn Asn Asp Glu Ile 180 185 <210> 67 <211> 185 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 67 Ile Glu Glu Gln Lys Ala Ile Phe Leu Gln Lys Thr Lys Leu Pro Leu 1 5 10 15 Ser Tyr Ile Glu Leu Leu Glu Ile Ala Arg Asp Gly Lys Arg Ser Arg 20 25 30 Asp Phe Glu Phe Ile Thr Met Glu Leu Phe Lys Asn Ile Tyr Lys Ile 35 40 45 Asn Ala Arg Ile Leu Gly Gly Ala Arg Lys Pro Asp Gly Val Leu Tyr 50 55 60 Met Pro Glu Phe Gly Val Ile Val Asp Thr Lys Ala Tyr Ala Asp Gly 65 70 75 80 Tyr Ser Lys Ser Ile Ala Gln Ala Asp Glu Met Ile Arg Tyr Ile Glu 85 90 95 Asp Asn Lys Arg Arg Asp Pro Ser Arg Asn Ser Thr Lys Trp Trp Glu 100 105 110 His Phe Pro Thr Ser Ile Asn Asn Phe Tyr Phe Leu Trp Val Ser Ser 115 120 125 Val Phe Val Asn Lys Phe His Glu Gln Leu Ser Tyr Thr Ala Gln Glu 130 135 140 Thr Gln Thr Val Gly Ala Ala Leu Ser Val Glu Gln Leu Leu Leu Gly 145 150 155 160 Ala Asp Ser Val Leu Lys Gly Asn Leu Thr Thr Glu Lys Phe Ile Asp 165 170 175 Ser Phe Lys Asn Gln Glu Ile Val Phe 180 185 <210> 68 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: "LAGLIDADG" family peptide motif sequence <400> 68 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 69 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 69 Asn Glu Leu Asp 1 <210> 70 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 70 Cys Lys Lys Arg 1 <210> 71 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 tgtcaggatt gggttccg 18 <210> 72 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 ctcctgaaag tggccggg 18

Claims

3 내지 6개의 아연 핑거 DNA-결합 도메인을 포함하는 아연 핑거 단백질이며, 여기서 각각의 아연 핑거 DNA-결합 도메인이 2개의 베타 시트, 알파 나선, 뉴클레오티드 서열에 결합하는 인식 나선 영역을 포함하고, 추가로 아연 핑거 DNA-결합 도메인 중 하나 또는 그 이상이 알파 나선 영역의 시작에 상대적으로 넘버링된 아미노산 잔기 (-5), (-9) 및/또는 (-14)에서 돌연변이를 포함하는 것인 아연 핑거 단백질.
제1항에 있어서, (-5), (-9) 및/또는 (-14)에서의 아미노산이 알라닌 (A), 류신 (L), 세린 (S), 아스파르트산 (D), 글루타민산 (E), 티로신 (Y) 및/또는 글루타민 (Q) 잔기로 돌연변이되는 것인 아연 핑거 단백질.
제1항에 있어서, 위치 -5에서 Arg (R)이 Tyr (Y), Asp (D), Glu (E), Leu (L), Gln (Q) 또는 Ala (A) 잔기로 변화되고/거나; 위치 (-9)에서 Arg (R)이 Ser (S), Asp (D), 또는 Glu (E)로 대체되고/거나; 위치 (-14)에서 Arg (R)이 Ser (S) 또는 Gln (Q) 잔기로 대체되는 것인 아연 핑거 단백질.
제1항의 아연 핑거 단백질 및 개열 도메인을 포함하는 아연 핑거 뉴클레아제.
제4항에 있어서, 개열 도메인이 가공된 FokI 개열 도메인을 포함하는 것인 아연 핑거 뉴클레아제.
제5항에 있어서, 가공된 개열 도메인이 이합체화 도메인에서 하나 또는 그 이상의 돌연변이를 포함하는 것인 아연 핑거 뉴클레아제.
제5항에 있어서, 가공된 개열 도메인이 하기와 같은 하나 또는 그 이상의 치환 돌연변이를 포함하고:
(i) 위치 481에서 야생형 Gln (Q) 잔기가 Ala (A), Cys (C), Asp (D), Glu (E) 또는 Ser (S) 잔기로 대체됨 (Q481A, Q481C, Q481D, Q481E 또는 Q481S);
(ii) 위치 418에서 야생형 Ser (S) 잔기가 Glu (E) 또는 Asp (D) 잔기로 대체됨 (S418E 또는 S418D);
(iii) 위치 479에서 야생형 Ile (I) 잔기가 Gln (Q) 또는 Thr (T) 잔기로 대체됨 (I479Q 또는 I479T);
(iv) 위치 478에서 야생형 Pro (P) 잔기가 Asp (D) 잔기로 대체됨 (P478D);
(v) 위치 525에서 야생형 Lys (K) 잔기가 Ala (A), Cys (C), Glu (E), Ile (I), Ser (S), Thr (T) 또는 Val (V) 잔기로 대체됨 (K525A, K525C, K525E, K525I, K525S, K525T 또는 K525V);
(vi) 위치 416에서 야생형 Arg (R) 잔기가 Asp (D), Glu (E), His (H) 또는 Asn (N) 잔기로 대체됨 (R416D, R416E, R416H 또는 R416N);
(vii) 위치 480에서 야생형 Gly (G) 잔기가 Asp (D) 잔기로 대체됨 (G480D);
(viii) 위치 472에서 야생형 Ser (S) 잔기가 Asp (D) 잔기로 대체됨 (S472D);
(ix) 위치 476에서 야생형 Asn (N) 잔기가 Glu (E) 또는 Gly (G) 잔기로 대체됨 (N476E 또는 N476G);
(x) 위치 527에서 야생형 Asn (N) 잔기가 Asp (D) 잔기로 대체됨 (N527D);
(xi) 위치 531에서 야생형 Gln (Q) 잔기가 Arg (R) 또는 Thr (T) 잔기로 대체됨 (Q531R 또는 Q531T);
(xii) 위치 422에서 야생형 Arg (R) 잔기가 His (H) 잔기로 대체됨 (R422H);
(xiii) 위치 446에서 야생형 Ser (S) 잔기가 Asp (D) 잔기로 대체됨 (S446D);
(xiv) 위치 448에서 야생형 잔기가 Ala (A) 잔기로 대체됨 (K448A);
(xv) 위치 523에서 야생형 His (H) 잔기가 Glu (E) 잔기로 대체됨 (H523E);
(xvi) 위치 424에서 야생형 Leu (L) 잔기가 Phe (F) 잔기로 대체됨 (L424F); 그리고
(xvi) 위치 542에서 야생형 Asn (N) 잔기가 Asp (D) 잔기로 대체됨 (N542D),
여기서 아미노산 잔기는 서열 번호:1에서 도시된 바와 같은 전장 FokI 야생형 개열 도메인에 상대적으로 넘버링되며, 서열 번호:1은 전장 FokI 단백질의 아미노산 잔기 384에서 시작되는 것인 아연 핑거 뉴클레아제.
제5항에 있어서, 가공된 FokI 개열 도메인에서 위치 481에서 야생형 Gln (Q) 잔기가 Ala (A) 잔기로 대체되는 것인 아연 핑거 뉴클레아제.
제5항에 있어서, 가공된 FokI 개열 도메인이 하기와 같은 치환 돌연변이를 포함하는 것인 아연 핑거 뉴클레아제:
R416D, R416E, R416H, 또는 R416N 돌연변이 및 R422H 돌연변이;
R416D, R416E, R416H, 또는 R416N 돌연변이 및 K448A 돌연변이;
K448A 및 I479Q 돌연변이;
K448A 및 Q481A 돌연변이; 및/또는
K448A 돌연변이 및 K525A, K525C, K525E, K525I, K525S, K525T 또는 K525V 돌연변이.
제4항에 있어서, 개열 도메인이 위치 432, 441, 483, 486, 487, 490, 496, 499, 527, 537, 538 및 559 중 하나 또는 그 이상에서 아미노산 돌연변이를 추가로 포함하는 FokI 개열 도메인인 아연 핑거 뉴클레아제.
제4항에 따른 첫 번째 아연 핑거 뉴클레아제 및 두 번째 아연 핑거 뉴클레아제를 포함하는 아연 핑거 뉴클레아제.
제1항 내지 제3항 중 어느 한 항의 아연 핑거 단백질 또는 제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드.
제1항 내지 제3항 중 어느 한 항의 아연 핑거 단백질;
제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제; 및
제1항 내지 제3항 중 어느 한 항의 아연 핑거 단백질 또는 제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드
로 이루어진 군으로부터 선택된 최소한 하나를 포함하는 단리된 세포.
질환의 치료 또는 예방에서 사용하기 위한 제1항 내지 제3항 중 어느 한 항의 아연 핑거 단백질을 포함하는 제약학적 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제를 포함하는 제약학적 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제12항의 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 제약학적 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제13항의 단리된 세포를 포함하는 제약학적 조성물.
제11항에 따른 아연 핑거 뉴클레아제; 또는
제1항 내지 제3항 중 어느 한 항의 아연 핑거 단백질 또는 제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드
를 세포에서 발현하는 것을 포함하고, 여기서 아연 핑거 뉴클레아제가 세포에서 발현되어 유전체 세포 염색질의 관심 영역에서 뉴클레오티드 서열을 부위 특이적으로 개열하는 것인, 관심 영역에서 유전체 세포 염색질을 개열하기 위한 시험관내 방법.
제18항에 있어서, 세포를 공여자 폴리뉴클레오티드와 접촉시키는 것을 추가로 포함하고; 여기서 세포 염색질의 개열이 공여자 폴리펩티드 및 세포 염색질 사이에 상동성 재조합을 조장하는 것인 시험관내 방법.
세포를 한 쌍의 제1항 내지 제3항 중 어느 한 항에 따른 아연 핑거 단백질을 포함하는 뉴클레아제 또는 한 쌍의 제4항 내지 제11항 중 어느 한 항에 따른 아연 핑거 뉴클레아제를 포함하는 가공된 뉴클레아제 복합체와 접촉시키는 것을 포함하고, 여기서 상기 쌍의 비율이 1 대 1이 아니고, 임의로는 여기서
i) 상기 비율이 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20, 또는 이들 사이의 임의의 값인,
가공된 뉴클레아제 개열 특이성을 증가시키기 위한 시험관내 방법.
제12항의 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 조성물이며, 여기서 하나 또는 그 이상의 폴리뉴클레오티드가 이합체화 첫 번째 및 두 번째 아연 핑거 뉴클레아제를 인코딩하고, 첫 번째 및 두 번째 아연 핑거 뉴클레아제의 비율이 1 대 1이 아니고, 임의로는 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10, 1:20 또는 1:30 비율의 비율인, 조성물.
T 세포 수용체 불변 영역 유전자 (TRAC) 유전자를 개열하는 아연 핑거 뉴클레아제이며, 여기서 아연 핑거 뉴클레아제가 하기를 포함하고:
첫 번째 가공된 FokI 개열 도메인 및 TRAC 유전자 내의 표적 부위에 결합하는 첫 번째 아연 핑거 DNA-결합 도메인을 포함하는 첫 번째 아연 핑거 뉴클레아제이며, 여기서 첫 번째 가공된 FokI 개열 도메인이 위치 486에서 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되고, 위치 496에서 야생형 Asn (N) 잔기가 Asp (D) 잔기로 대체된 폴리펩티드 (ELD)를 포함하는 것인, 첫 번째 아연 핑거 뉴클레아제 및
두 번째 가공된 FokI 개열 도메인 및 두 번째 아연 핑거 DNA-결합 도메인을 포함하는 두 번째 아연 핑거 뉴클레아제이며, 여기서 두 번째 가공된 FokI 개열 도메인이 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되고, 위치 537에서의 야생형 His (H) 잔기가 Arg (R) 잔기로 대체된 폴리펩티드 (KKR)를 포함하는 것인 두 번째 아연 핑거 뉴클레아제;
추가로
(i) 첫 번째 또는 두 번째 가공된 FokI 개열 도메인 중 최소한 하나가 FokI 개열 도메인에서 야생형 FokI에 상대적으로 넘버링된 K393S, K394S, R398S, K400S, K402S, R416S, R422S, K427S, K434S, R439S, K441S, R447S, K448S, K469S, R487S, R495S, K497S, K506S, K516S, K525S, K529S, R534S, K559S, R569S, 및 R570S로 이루어진 군에서 선택된 돌연변이를 추가로 포함하고/거나;
(ii) 첫 번째 및 두 번째 아연 핑거 DNA-결합 도메인 중 최소한 하나가 알파 나선 영역의 시작에 상대적으로 넘버링된 아미노산 잔기 (-5), (-9) 및/또는 (-14)에서 하나 또는 그 이상의 돌연변이를 포함하는 것인
아연 핑거 뉴클레아제.
제22항에 있어서, ELD 및/또는 KKR FokI 개열 도메인에서의 돌연변이가 R416S, R422S, R447S, K448S 또는 K525S 돌연변이인 아연 핑거 뉴클레아제.
제22항에 있어서, 1개, 2개, 또는 3개의 핑거에서 위치 -5에서의 아미노산 잔기가 돌연변이되는 것인 아연 핑거 뉴클레아제.
제22항에 따른 아연 핑거 뉴클레아제를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드.
제25항의 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 단리된 세포.
TRAC 유전자 내에 제22항 내지 제24항 중 어느 한 항의 아연 핑거 뉴클레아제에 의해 만들어진 최소한 하나의 부위 특이적 유전체 변형을 포함하는 단리된 세포를 포함하는 조성물.
제22항 내지 제24항 중 어느 한 항에 따른 아연 핑거 뉴클레아제 또는 제25항에 따른 하나 또는 그 이상의 폴리뉴클레오티드를 세포에서 발현시키는 것을 포함하고, 여기서 아연 핑거 뉴클레아제가 세포에서 발현되어 TCR 알파 (TRAC) 유전자에서 뉴클레오티드 서열을 부위 특이적으로 개열하는 것인, 포유류 세포에서 TRAC 유전자를 개열하기 위한 시험관내 방법.
제28항에 있어서, 세포를 공여자 폴리뉴클레오티드와 접촉시키는 것을 추가로 포함하고; 여기서 세포 염색질의 개열이 공여자 폴리펩티드 및 세포 염색질 사이에 상동성 재조합을 조장하는 것인 방법.
제25항의 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 조성물이며, 여기서 첫 번째 및 두 번째 아연 핑거 뉴클레아제의 비율이 1 대 1이 아니고, 임의로는 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10, 1:20 또는 1:30 비율의 비율인 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제22항 내지 제24항 중 어느 한 항의 아연 핑거 뉴클레아제를 포함하는 제약학적 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제25항의 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 제약학적 조성물.
질환의 치료 또는 예방에서 사용하기 위한 제26항의 단리된 세포를 포함하는 제약학적 조성물.
제27항에 있어서, 질환의 치료 또는 예방에서 사용하기 위한 조성물.