KR102431079B1

KR102431079B1 - 헌팅턴병을 치료하기 위한 방법 및 조성물

Info

Publication number: KR102431079B1
Application number: KR1020167015301A
Authority: KR
Inventors: 에이치. 스티브 장
Original assignee: 상가모 테라퓨틱스, 인코포레이티드
Priority date: 2013-11-11
Filing date: 2014-11-11
Publication date: 2022-08-11
Also published as: CA2929179A1; AU2014346424A1; US10369201B2; BR112016010175A2; RU2693891C1; WO2015070212A1; RU2016123086A; EP3068905A4; US20160296605A1; KR20160077208A; NZ719477A; JP2016537341A; AU2014346424B2; MX2016006106A; CN105934524A; EP3068905A1; JP2019116502A

Abstract

본원에 헌팅턴병을 치료하기 위한 조성물 및 방법이 개시된다. 특히, 본원에 헌팅턴병을 치료하기 위하여 HD Htt 대립유전자를 변형시키는 (예컨대 발현을 조절하는) 방법 및 조성물이 제공된다. 또한 헌팅턴병의 동물 모델을 제조하기 위한 방법 및 조성물이 제공된다. 그러므로, 한 측면으로, HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 (비-자연적 발생의) DNA 결합 도메인 (예컨대 징크 핑거 단백질, TAL 이펙터 (TALE) 단백질 또는 CRISPR/dCas-TF)이 제공된다.

Description

헌팅턴병을 치료하기 위한 방법 및 조성물{METHODS AND COMPOSITIONS FOR TREATING HUNTINGTON'S DISEASE}

관련 출원에 대한 교차 -참조

본 출원은 2013년 11원 11일에 출원된 미국 임시 출원 번호 61/902,704호의 유익을 주장하며, 상기 출원의 개시내용은 그것의 전체 내용이 본원에 참조로 포함된다.

기술분야

본 발명은 유전자 발현 및 게놈 편집 분야에 있다.

헌팅턴 무도병으로도 알려져 있는 헌팅턴병 (Huntington's Disease (HD))은 운동, 인지 및 정신과적 동요의 점진적 장애이다. 이 질병이 개시되는 평균 연령은 35 내지 44세이지만, 사례의 약 10%에서 병의 시작은 21세 전에 발생하고, 질병의 진단 후 평균 수명은 15 내지 18년이다. 유병률은 서유럽 혈통의 100,000명 중 약 3 내지 7명이다.

헌팅턴병은 1990년대 초기에 트라이뉴클레오티드 반복 확장 (repeat expansion) 장애가 처음으로 특성화되었던 사례이다 (Di Prospero and Fischbeck (2005) Nature Reviews Genetics 6:756-765 참조). 이들 장애는 반복이 연장되거나, 독성 기능이 획득되거나 또는 둘 다인 불안정한 반복의 국소화된 확장을 포함한다. 트라이뉴클레오티드 반복은 비-코딩 및 코딩 유전자 영역을 포함하여, 유전자의 어느 부분에서든 위치할 수 있다. 코딩 영역 내에 위치한 반복은 전형적으로 반복된 글루타민 코드화 트리플렛 (CAG) 또는 알라닌 코드화 트리플렛 (CGA)을 포함한다. 비-코딩 영역 내에서 확장된 반복 영역은 유전자의 일탈적인 발현을 유도할 수 있는 한편, 코딩 영역 내에서 확장된 반복 (또한 코돈 반복 장애로도 알려져 있음)은 잘못된-접힘 및 단백질 응집을 유발할 수 있다. 일탈 단백질과 관련된 병리생리학의 정확한 원인은 그리 알려져 있지 않다. 전형적으로, 트라이뉴클레오티드가 확장된 야생형 유전자에서, 이들 영역은 정상적인 집단에서는 가변적인 수의 반복 서열을 함유하지만, 병에 걸린 집단에서는, 반복의 수는 반복의 수의 2배수로부터 로그 차순 증가까지 증가할 수 있다. HD에서, 반복은 큰 시토졸 단백질 헌팅틴 (Htt)의 N 말단 코딩 영역 내에 삽입된다. 정상적인 Htt 대립유전자는 15 내지 20개의 CAG 반복을 함유하는 한편, 35개 이상의 반복을 함유하는 대립유전자는 잠재적으로 HD 유발 대립유전자로 간주될 수 있고 질병의 발생 위험을 부여한다. 36 내지 39개의 반복을 함유하는 대립유전자는 불완전하게 침투하는 것으로 여겨지고, 이들 대립유전자를 은닉하고 있는 개인들은 질병을 발생시킬 수도 있고 그렇지 않을 수도 있는 (또는 생의 후기에 증상들을 나타낼 수 있음) 한편, 40개 이상의 반복을 함유하는 대립유전자는 완전하게 침투성인 것으로 간주된다. 실제로, 이런 많은 반복을 가지는 HD 대립유전자를 함유하고 있는 무증상 개인은 없는 것으로 보고되었다. 청소년기에 (<21세) HD가 시작되는 개인은 자주 60개 이상의 CAG 반복을 가지는 것으로 발견된다. CAG 반복의 증가에 더불어, HD는 반복 서열 내에 +1 및 +2 프레임쉬프트를 포함할 수 있어서 영역은 폴리-글루타민보다는 폴리-세린 폴리펩티드 (+1 프레임쉬프트의 경우에 AGC 반복에 의해 코드화됨)를 코드화할 것으로 또한 밝혀졌다 (Davies and Rubinsztein (2006) Journal of Medical Genetics 43: 893-896).

HD에서, 돌연변이 Htt 대립유전자는 통상 한쪽 부모로부터 우성 형질로서 유전된다. HD 환자로부터 태어나는 어떠한 어린이든지 만약 다른쪽 부모가 그 장애에 걸리지 않았다면 그 질병을 발병할 가능성이 50%이다. 어떤 경우에, 부모는 중간 HD 대립유전자를 가지며 무증상일 수 있는 한편, 반복 확장으로 인해, 어린이는 질병을 나타낸다. 또한, HD 대립유전자는 또한 증가하는 심각성 또는 발병의 연령 강하가 정자 형성중에 반복 영역의 불안정한 성질로 인해 여러 세대에 걸쳐 관찰되는 예측으로서 알려져있는 현상을 나타낼 수 있다.

나아가, Htt에서의 트라이뉴클레오티드 확장은 선조체에서 중간 가시 (medium spiny) 감마-아미노부티르산 (GABA) 돌출 뉴런의 뉴런 손실을 유발하고, 이때 뉴런 손실은 또한 신피질에서도 발생한다. 엔케팔린을 함유하고 외부의 담창구로 돌출되는 (소위 "간접 경로"로) 중간 가시 뉴런 (MSN)은 물질 P를 함유하고 내부 담창구로 돌출되는 ("직접" 경로로) 뉴런들보다 많이 포함되지만, 두 유형의 MSN 모두 영향을 받는다. HD의 MSN은 다른 비정상적인 변경 (htt의 비정상적인 응집 및 포함, 생체 에너지 결함, 뉴로트로핀 결핍, 축삭 수송 및 흥분 독성)과 함께 전사적 조절장애를 나타낸다. 전사체학적 효과에 대한 메커니즘은 가용성 DNA-결합 전사 인자의 활성의 변화, 크로마틴 생화학 및 조직화의 비정상 및 응집체-유도된 핵 전사 인자 격리에 관련될 수 있다 (Runne et al (2008) J Neurosci 28(39):9723-9731 참조).

헌팅턴병에 걸린 사람에게서 크게 영향을 받는 다른 뇌 구역은 흑색질, 피층 3, 5 및 6, 해마의 CA1 영역, 두정엽의 각회 (angular gyrus), 소뇌의 푸르키니에 세포, 시상하부의 측 융기핵 및 시상의 중심정중핵 다발옆핵 복합체를 포함한다 (Walker (2007) Lancet 369:218-228).

정상적인 Htt 단백질의 역할은 잘 알려지지 않았지만, 신경 발생, 아폽토시스성 세포 사멸 및 소포 왕래 (vesicle trafficking)에 포함될 수 있다. 또한 야생형 Htt가 선조체 뉴런에 대한 생존-전 인자인 뇌-유도된 신경 영양 인자 (BDNF)의 생성을 자극한다는 증거가 있다. HD의 진행은 HD의 마우스 모델에서 BDNF의 감소와 관련이 있고 (Zuccato et al (2005) Pharmacological Research 52(2):133-139), 아데노-관련 바이러스 (AAV) 벡터-중재된 유전자 전달을 통한 BDNF 또는 교질 셀라인-유도된 신경 영양 인자 (GDNF) 중 어느 하나의 전달이 HD의 마우스 모델에서 선조체 뉴런을 보호할 수 있는 것으로 밝혀졌다 (Kells et al, (2004) Molecular Therapy 9(5):682-688).

HD에 대한 치료 옵션은 현재 매우 한정되어 있다. 샤페로닌의 과잉발현 또는 화합물 겔다나마이신을 사용한 열 충격 반응의 유도와 같은 연장된 폴리-글루타민 트랙트 (tract)를 통해 발생하는 단백질 응집과 관련된 독성을 방지하기 위해 디자인된 일부 잠재적 방법론은 시험관 내 모델에서 이들 독성의 감소를 나타냈다. 다른 치료는 질병의 임상적 징후에서 아폽토시스의 역할을 표적으로 한다. 예를 들어 질병 증상의 둔화는 한 쪽 부모가 HD 대립유전자를 함유하였고 다른 쪽 부모는 카스파제 1에 대한 우성 음성 대립유전자를 가지고 있는 경우에 마우스들의 짝짓기의 새끼에서의 동물 모델에서 카스파제 활성의 차단을 통해 나타났다. 추가로, 카스파제에 의한 돌연변이 Htt의 절단은 질병의 병원성 (pathogenicity)에서 역할을 할 수 있다. 카스파제-6 내성 돌연변이 Htt를 은닉하고 있는 유전자도입 마우스는 정상적인 뉴런 기능을 유지하는 것으로 나타났고 비-카스파제 내성 돌연변이 Htt 대립유전자를 받은 마우스들에 비교하여 선조체 신경변성을 나타내지 않았다 (Graham et al (2006) Cell 125: 1179-1191 참조). 아폽토시스 경로의 구성원들을 표적으로 하는 분자들 또한 증상학에 대해 둔화 효과를 나타내는 것으로 밝혀졌다. 예를 들어, 화합물 zVAD-fmk 및 미노사이클린은 둘 다 카스파제 활성을 억제하는데, 마우스에서 질병 징후를 둔화시키는 것으로 밝혀졌다. 약물 레마세미드 또한 작은 HD 인간 실험에 사용되었는데, 그 화합물이 신경 세포에 대한 독성 효과의 발휘를 방지하기 위해 NDMA 수용체에의 돌연변이 Htt의 결합을 방지하는 것으로 여겨졌기 때문이다. 그러나, 이들 실험에서 뉴런 기능에서 통계학적으로 유의미한 개선은 관찰되지 않았다. 또한, 헌팅턴 스터디 그룹 (Huntington Study Group)은 코엔자임 Q를 사용하여 무작위 이중-맹검 연구를 수행하였다. 비록 동향은 코엔자임 Q10으로 치료된 환자들 중에서 더 느린 질병 진전을 향하고는 있지만, 총 기능성 용량의 감소 속도에서 유의할만한 변화는 없었다 (Di Prospero and Fischbeck, 상기 동일). 미국 특허 공보 2011/0082093 및 20130253040은 Htt에 표적화된 뉴클레아제를 개시한다.

게놈 DNA의 표적화된 절단을 위한 다양한 방법 및 조성물이 기술되어 있다. 그런 표적화된 절단 사건들은 예를 들면 표적화된 돌연변이생성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 예정된 염색체 유전자좌에서의 표적화된 재조합을 용이하게 하기 위해 사용될 수 있다. 예컨대 미국 특허 번호 8,623,618; 8,034,598; 8,586,526; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,067,317; 7,262,054; 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 미국 특허 공보 번호 20030232410; 20050208489; 20050026157; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 및 20130177960 및 미국 출원 번호 14/278,903 참조 ( 이것들의 개시내용은 모든 목적에 대해 그것들의 실재에 참조에 의해 포함된다). 이들 방법은 자주 이중 가닥 파괴 (DSB) 또는 표적 DNA 서열에 닉 (nick)을 유도하여서 비-상동성 단부 연합 (NHEJ)과 같은 오류 파생 과정에 의한 파괴의 수복 또는 수복 주형을 사용한 수복 (상동성 지시된 수복 또는 HDR)이 유전자의 녹아웃 또는 관심의 서열의 삽입 (표적화된 통합)이 유발될 수 있도록 하기 위해 엔지니어링된 절단 시스템의 사용을 포함한다. 이 기법은 또한 게놈 영역의 특이적 결실 또는 점 돌연변이 또는 국소화된 변경 (유전자 교정으로서도 알려져 있음)의 도입을 포함하여, 공여 올리고뉴클레오티드의 사용을 통해 부위 특이적 변화를 게놈 서열에 도입하기 위해 사용될 수 있다. 절단은 엔지니어링된 징크 핑거 (zinc finger) 뉴클레아제 (ZFN), 전사-활성화제 유사 이펙터 뉴클레아제 (TALEN)와 같은 특이적인 뉴클레아제의 사용을 통해 또는 엔지니어링된 crRNA/트레이서 RNA ('단일 가이드 RNA')를 가지는 CRISPR/Cas 시스템을 사용하여 일어날 수 있다. 나아가, 표적화된 뉴클레아제가, 게놈 편집 및 유전자 치료법에 사용하기 위한 가능성을 가질 수 있는 Argonaute 시스템 (예컨대 T. thermophilus로부터 유래함, 'TtAgo'로도 알려져 있음, Swarts et al (2014) Nature 507(7491):258-261 참조)을 기초로 개발되고 있다.

엔지니어링된 융합 단백질들이 또한 표적화된 유전자의 발현을 조절하기 위해 개발되었다. 그런 단백질들은 예를 들면 원하는 유전자의 발현을 증강시키거나 억압 (repression)하기 위해 사용될 수 있다 (예컨대 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 7,013,219; 7,220,719; 8,268,618; 7,985,778; 8,586,526; 미국 특허 출원 20120294838 참조, 상기의 개시는 모든 목적에 대해 전체 내용이 참조로 포함됨).

그러므로, 헌팅턴병의 치료 및 예방을 위해 이들 전도유망한 기법으로부터 유발될 수 있는 조성물 및 방법에 대한 요구가 존재한다.

발명의 요약

본원에는 헌팅턴병을 치료하기 위한 방법 및 조성물이 개시된다. 특히, 본원에는 헌팅턴병을 치료하기 위하여 HD Htt 대립유전자를 변형 (예컨대 그것의 발현의 조절)시키기 위한 방법 및 조성물이 제공된다. 또한 헌팅턴병의 동물 모델을 제조하기 위한 방법 및 조성물이 제공된다.

그러므로, 한 측면으로, HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 DNA 결합 도메인 (예컨대 징크 핑거 단백질, TAL 이펙터 (TALE) 단백질 또는 CRISPR/dCas-TF)이 제공된다. 엔지니어링된 징크 핑거 단백질 또는 TALE는 비-자연적 발생 징크 핑거 또는 그것의 DNA 결합 도메인 (예컨대 인식 나선 또는 RVD)이 사전-선택된 표적 부위에 결합하기 위해 변경되어 있는 (예컨대 선택 및/또는 이론적 디자인에 의해) TALE 단백질이다. 본원에 기술된 징크 핑거 단백질들 중 어느 것이든 1, 2, 3, 4, 5, 6 또는 그 이상의 징크 핑거를 포함할 수 있고, 이때 각각의 징크 핑거는 선택된 서열 (예컨대 유전자(들))에 표적 하위부위에 결합하는 인식 나선을 가지고 있다. 유사하게, 본원에 기술된 TALE 단백질들 중 어느 것이든 어떠한 수의 TALE RVD를 포함할 수 있다. 일부 구체예에서, 적어도 하나의 RVD는 비-특이적 DNA 결합을 가진다. 일부 구체예에서, 적어도 하나의 인식 나선 (또는 RVD)는 비-자연적으로 발생한다. 특정 구체예에서, 징크 핑거 단백질들은 표 1A 및 1B에 나타낸 인식 나선들을 가진다. 다른 구체예에서, 징크 핑거 단백질들은 표 2A 및 2B에 나타낸 표적 서열들에 결합한다. 일부 구체예에서, 징크 핑거 단백질들은 표 2C의 인식 나선들을 포함한다. 특정 구체예에서, 징크 핑거 단백질들은 예를 들면 대상으로의 투여를 위해 약학 조성물로 제형된다.

HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 (비-자연적으로 발생하는) CRISPR/Cas 시스템이 또한 제공된다. Cas9 뉴클레아제 도메인은 DNA 절단 활성 ("dCAS")을 잃어버리도록 특이적으로 엔지니어링될 수 있고, 유전자 발현을 조절할 수 있는 기능성 도메인에 융합되어 (Perez-Pimera (2013) Nat Method 10(10):973-976 참조) dCas-TF를 형성한다. dCas-TF에 Htt-특이적 가이드 RNA가 첨가될 때 시스템은 Htt 유전자 발현을 조절한다.

한 측면으로, 전체적으로 또는 부분적으로 Htt의 CAG 반복 영역 밖에 있는 서열들에 결합하는 억제제들 (ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF)이 제공된다. 다른 측면으로, Htt의 CAG 반복 영역 내에 있는 서열들에 결합하는 ZFP, Cas 또는 TALE 억제제들 (ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF)이 제공된다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas 또는 TALE-TF는 우선적으로 야생형 길이의 반복 트랙트에 대해 확장된 트라이뉴클레오티드 트랙트에 결합하고, 그로써 확장된 대립유전자의 바람직한 억압을 이룬다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 DNA에 결합될 때 다량체화를 허용하는 단백질 상호작용 도메인 (또는 "이량체화 도메인")을 포함한다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas-Ts 또는 TALE TF는 반복 서열에 대해 협조적인 DNA 결합을 이룸으로써 확장된 대립유전자가 야생형 대립유전자보다 더 많은 수의 ZFP, dCas 또는 TALE 단백질들에 의해 효율적으로 결합되어 돌연변이 대립유전자의 바람직한 억압이 가능해진다. 이들 협조적인 결합 ZFP-TF, CRISPR/dCas-TFs 또는 TALE TF는 DNA에 결합될 때 다량체화를 허용하는 단백질 상호작용 도메인을 추가로 함유하거나 함유하지 않을 수 있다. 일부 구체예에서, ZFP TF, CRISPR/dCas-TF 또는 TALE TF는 주어진 크기의 다량체들의 안정한 복합체를 형성하고, 그러므로 특정 최소 크기 이상의 야생형 CAG 트랙트와 바람직하게 상호작용할 수 있으며, 이때 그 최소 크기는 야생형 CAG 트랙트의 길이보다 크다.

특정 구체예에서, 본원에 기술된 ZFP, CRISPR/dCas-TF 또는 TALE 단백질들 (예컨대 양손의, 다량체화하는 등)은 우선적으로 돌연변이 Htt 대립유전자의 발현을 변형시킨다. 일부 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 확장된 트랙트가 폴리-글루타민을 코드화하는 돌연변이 Htt 대립유전자에 특이적으로 결합하는 한편, 다른 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 확장된 트랙트가 폴리-세린을 코드화하는 돌연변이 Htt 대립유전자에 특이적으로 결합한다. 그러므로 일부 구체예에서, ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 Htt 대립유전자의 야생형 및 돌연변이 형태 둘 다를 조절한다. 특정 구체예에서, ZFP, CRISPR/dCas-TF 또는TALE는 야생형 Htt 대립유전자만을 조절한다. 다른 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 Htt의 돌연변이 형태만을 조절한다.

다른 구체예에서, 확장된 HD Htt 대립유전자와 관련된 공지의 SNP에 우선적으로 결합하는 억압 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF가 제공된다. 이 방법에서, ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 SNP를 함유하는 돌연변이 Htt 대립유전자에 대해 특이적이어서 돌연변이 Htt 대립유전자의 특이적인 억압을 허용한다. 다른 측면으로, 야생형 대립유전자와 관련된 SNP와 상호작용함으로써 야생형 Htt 대립유전자를 특이적으로 활성화시키는 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF가 제공된다. 이 방법에서는 야생형 Htt 대립유전자만이 활성화된다.

특정 구체예에서, 본원에 기술된 징크 핑거 단백질 (ZFP), dCas 또는 TALE 단백질들은 융합 단백질의 일부로서 조절 도메인 (또는 기능성 도메인)과 작동가능한 연쇄에 위치할 수 있다. 기능성 도메인은 예를 들면, 전사 활성화 도메인, 전사 억압 도메인 및/또는 뉴클레아제 (절단) 도메인일 수 있다. ZFP, dCas 또는 TALE와의 융합을 위한 활성화 도메인 또는 억압 도메인 중 어느 하나를 선택함으로써, 그런 융합 단백질은 유전자 발현을 활성화시키거나 억압하기 위해 사용될 수 있다. 일부 구체예에서, 돌연변이 Htt 발현을 하향-조절하기 위해 사용될 수 있는 전사 억압 도메인에 융합된, 본원에서 기술된 돌연변이 Htt에 대해 표적화된 ZFP, dCas 또는 TALE를 포함하는 융합 단백질이 제공된다. 일부 구체예에서, 야생형 Htt 대립유전자를 상향-조절할 수 있는 전사 활성화 도메인에 융합된 야생형 Htt 대립유전자에 대해 표적화된 ZFP, dCas 또는 TALE를 포함하는 융합 단백질이 제공된다. 특정 구체예에서, 조절 도메인의 활성은 내인성 작은 분자 또는 리간드에 의해 조절되어서 세포의 전사 기구 (machinery)와의 상호작용은 외인성 리간드의 부재시에는 일어나지 않을 것이다. 그런 외부 리간드는 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF의 전사 기구와의 상호작용 정도를 제어한다. 조절 도메인(들)은 하나 또는 그 이상의 ZFP, dCas 또는 TALE 및 그것들의 어떠한 조합의 외부에서, 하나 또는 그 이상의 ZFP, dCas 또는 TALE 사이를 포함하여, ZFP, dCas 또는 TALE 중 하나 또는 그 이상의 어떠한 부분(들)에 작용가능하게 연결될 수 있다. 본원에 기술된 융합 단백질 중 어느 것이든지 약학 조성물로 제형될 수 있다.

일부 구체예에서, 본원에 기술된 엔지니어링된 DNA 결합 도메인들은 융합 단백질의 일부로서 뉴클레아제 (절단) 도메인과의 작동할 수 있는 연쇄에 위치할 수 있다. 일부 구체예에서, 뉴클레아제는 Ttago 뉴클레아제를 포함한다. 다른 구체예에서, CRISPR/Cas 시스템과 같은 뉴클레아제 시스템은 DNA에서 표적 위치에 뉴클레아제를 표적화하기 위해 특이적인 단일 가이드 RNA와 함께 활용될 수 있다. 특정 구체예에서, 그런 뉴클레아제 및 뉴클레아제 융합은 유도된 다능 줄기 세포 (iPSC), 인간 배아 줄기 세포 (hESC), 간엽성 줄기 세포 (MSC) 또는 뉴런성 줄기 세포와 같은 줄기 세포들에 돌연변이 Htt 대립유전자를 표적화하기 위해 활용될 수 있고, 이때 뉴클레아제 융합의 활성은 야생형 수의 CAG 반복을 함유하고 있는 Htt 대립유전자를 초래할 것이다. 특정 구체예에서, 변형된 줄기 세포를 포함하는 약학 조성물이 제공된다.

또 다른 측면으로, 본원에 기술된 DNA 결합 단백질들 중 어느 것을 코드화하는 폴리뉴클레오티드가 제공된다. 또 다른 측면으로, CRIPSR/Cas 뉴클레아제 및 단일 가이드 RNA를 코드화하는 폴리뉴클레오티드들이 제공된다. 그런 폴리뉴클레오티드들은 헌팅턴병을 치료하는 것이 바람직한 대상에게 투여될 수 있다.

또 다른 측면으로, 발명은 헌팅턴병의 연구를 위한 특이적인 모델 시스템의 생성을 위한 방법 및 조성물을 제공한다. 특정 구체예에서, 본원에는 특이한 길이 (예를 들면 50, 80, 109 및 180 CAG 반복)의 트라이뉴클레오티드 확장 트랙트가 징크 핑거 뉴클레아제 (ZFN), TALE-뉴클레아제 (TALEN), Ttago 또는 CRISPR/Cas 뉴클레아제 구동된(drived) 표적화된 통합을 사용하여 야생형 Htt 대립유전자에 삽입되어 있는 세포 및 동물 라인을 생성하기 위해 돌연변이 Htt 대립유전자가 배아 줄기 세포를 사용하여 생성되는 모델이 제공된다. 특정 구체예에서, 모델 시스템은 시험관 내 셀라인을 포함하는 한편, 다른 구체예에서 모델 시스템은 유전자 도입 동물들을 포함한다. 본원에 기술된 어떠한 동물 모델에서, 동물은 예를 들면 설치류 (예컨대 래트, 마우스), 영장류 (예컨대 비-인간 영장류) 또는 토끼일 수 있다. 그러므로, 발명은 또한 HD에 관련된 내인성 유전자가 예를 들면 세포의 유전자의 야생형 서열에 비교하여 변형되어 있는 세포 또는 셀라인을 포함한다. 그 세포 또는 셀라인은 변형에 대해 이형접합성이거나 동형접합성일 수 있다. 변형은 삽입, 결실 및/또는 그것의 조합을 포함할 수 있다. 특정 구체예에서, 유전자 (예컨대 Htt)는 뉴클레아제 (예컨대 ZFN, TALEN, CRISPR/Cas 시스템, Ttago 시스템 등)에 의해 변형된다. 특정 구체예에서, 변형은 예를 들면 절단 부위(들)의 상류 또는 하류로 1 내지 300 염기쌍 내에서 뉴클레아제(들) 결합 및/또는 절단 부위(들)에서 또는 가까이에서, 보다 바람직하게 결합 및/또는 절단 부위(들)의 어느 한쪽의 1 내지 100 염기쌍 (또는 그 사이의 어떠한 값) 내에서, 보다 더 바람직하게 결합 및/또는 절단 부위(들)의 어느 한쪽의 1 내지 50 염기쌍 (또는 그 사이의 어떠한 값) 내에서 일어난다.

다른 측면으로, 발명은 공여자 핵산의 표적 세포로의 전달을 포함한다. 공여자는 핵산이 뉴클레아제(들)을 코드화하기 전에, 후에 또는 뉴클레아제(들)을 코드화하는 핵산과 함께 전달될 수 있다. 공여자 핵산은 세포의 게놈 안으로 통합될 외인성 서열 (이식유전자), 예를 들면 외인성 유전자좌를 포함할 수 있다. 일부 구체예에서, 공여자는 표적화된 절단 부위와의 상동성 영역이 양옆에 있는 전 길이 유전자 또는 그것의 단편을 포함할 수 있다. 일부 구체예에서, 공여자는 상동성 영역이 없고 상동성과 무관한 메커니즘 (즉 NHEJ)을 통해 표적 유전자좌 안으로 통합된다. 공여자는 어떠한 핵산 서열, 예를 들면 뉴클레아제-유도된 이중-가닥 파괴의 상동성-지시된 수복에 대한 기질로서 사용될 때 내인성 염색체 유전자좌에서 공여자-특이적인 결실이 생성되도록 유도하거나, 다르게는 (또는 또한) 내인성 유전자좌의 신규한 대립유전자 형태 (예컨대 전사 인자 결합 부위를 제거하는 점 돌연변이)가 생성되도록 유도하는 핵산을 포함할 수 있다. 일부 구체예에서, 공여자 핵산은 통합이 유전자 교정 사건 또는 표적화된 결실을 유도하는 올리고뉴클레오티드이다.

일부 구체예에서, DNA 결합 단백질을 코드화하는 폴리뉴클레오티드는 mRNA이다. 일부 측면으로, mRNA는 화학적으로 변형될 수 있다 (예컨대 Kormann et al, (2011) Nature Biotechnology 29(2):154-157 참조). 다른 측면으로, mRNA는 ARCA cap을 포함할 수 있다 (미국 특허 번호 7,074,596 및 8,153,773 참조). 추가의 구체예에서, mRNA는 미변형 뉴클레오티드와 변형된 뉴클레오티드의 혼합물을 포함할 수 있다 (미국 특허 공보 2012-0195936).

또 다른 측면으로, 본원에 기술된 폴리뉴크레오티드들 중 어느 것이든 포함하는 유전자 전달 벡터가 제공된다. 특정 구체예에서, 벡터는 아데노바이러스 벡터 (예컨대 Ad5/F35 벡터), 통합 경합 또는 통합-결함 렌티바이러스 벡터를 포함하는 렌티바이러스 벡터 (LV) 또는 아데노바이러스 관련 바이러스 벡터 (AAV)이다. 특정 구체예에서, AAV 벡터는 AAV6 벡터이다. 그러므로, 또한 본원에는 적어도 하나의 뉴클레아제 (ZFN 또는 TALEN) 및/또는 표적 유전자 안으로의 표적화된 통합에 대한 공여자 서열을 코드화하는 서열을 포함하는 아데노바이러스 (Ad) 벡터, LV 또는 아데노바이러스 관련 바이러스 벡터 (AAV)가 제공된다. 특정 구체예에서, Ad 벡터는 키메라 Ad 벡터, 예를 들면 Ad5/F35 벡터이다. 특정 구체예에서, 렌티바이러스 벡터는 통합-결함 렌티바이러스 벡터 (IDLV) 또는 통합 경합 렌티바이러스 벡터이다. 특정 구체예에서 벡터는 VSV-G 외피 또는 다른 외피로 위(pseudo)-유형화된다.

일부 구체예에서, 표적 대립유전자 (예컨대 돌연변이 Htt)가 발현 마커로 태그되어 있는 헌팅턴병에 대한 모델 시스템이 제공된다. 특정 구체예에서, 돌연변이 대립유전자 (예컨대 돌연변이 Htt)가 태그된다. 일부 구체예에서, 야생형 대립유전자 (예컨대 야생형 Htt)가 태그되고, 추가의 구체예에서, 야생형과 돌연변이 대립유전자 둘 다 별도의 발현 마커로 태그된다. 특정 구체예에서, 모델 시스템은 시험관 내 셀라인을 포함하는 한편 다른 구체예에서, 모델 시스템은 유전자도입 동물을 포함한다.

추가로, 핵산 및/또는 단백질 (예컨대 ZFP, Cas 또는 TALE 또는 ZFP, Cas 또는 TALE를 포함하는 융합 단백질)을 포함하는 약학 조성물이 또한 제공된다. 예를 들어, 특정 조성물은 약학적으로 허용되는 담체 또는 희석제와 조합된, 조절 서열에 작용가능하게 연결되어 있는, 본원에 기술된 ZFP, Cas 또는 TALE 중 하나를 코드화하는 서열을 포함하는 핵산을 포함하고, 이때 조절 서열은 세포에서 핵산의 발현을 허용한다. 특정 구체예에서, 코드화된 ZFP, CRISPR/Cas 또는 TALE는 HD Htt 대립유전자에 대해 특이적이다. 일부 구체예에서, 약학 조성물은 HD Htt 대립유전자를 조절하는 ZFP, CRISPR/Cas 또는 TALE 및 신경 영양 인자를 조절하는 ZFP, CRISPR/Cas 또는 TALE를 포함한다. 단백질 기초 조성물은 본원에 기술된 하나 또는 그 이상의 ZFP, CRISPR/Cas 또는 TALE 및 약학적으로 허용되는 담체 또는 희석제를 포함한다.

또 다른 측면으로 또한 본원에 기술된 단백질, 폴리뉴클레오티드 및/또는 조성물 중 어느 것을 포함하는 분리된 세포가 제공된다.

다른 측면으로, 본원에는 본원에 기술된 방법 및 조성물을 사용하여 헌팅턴병을 치료하거나 및/또는 예방하기 위한 방법이 제공된다. 일부 구체예에서, 폴리뉴클레오티드 및/또는 단백질이 바이러스 벡터, 비-바이러스 벡터 (예컨대 플라스미드) 및/또는 그것들의 조합을 사용하여 전달될 수 있는 조성물을 포함한다. 일부 구체예에서, 방법은 ZFP 또는 TALE을 포함하는, 또는 발명의 ZFN, TALEN, Ttago 또는 CRISPR/Cas 뉴클레아제 시스템으로 변경된 줄기 세포 집단을 포함하는 조성물을 포함한다.

일부 구체예에서, 발명의 방법 및 조성물은 중간 가시 뉴런에서 특정 유전자들의 발현을 정상화하거나 및/또는 변형시키기 위하여 사용된다. 예를 들어, 일부 구체예에서, 방법은 헌팅턴병에 걸린 대상의 치료 또는 예방을 위해 그것들에 한정되는 것은 아니지만 DARPP-32A, PDE10a, Drd1 및/또는 Drd2를 포함하여 HD에 관련된 하나 또는 그 이상의 생체마커의 발현을 변경시키는 유전자 리프레서의 사용을 포함하거나 및/또는 조성물은 그런 유전자 리프레서이다. 일부 구체예에서, 유전자 리프레서는 헌팅틴 단백질의 발현을 억제하는 작은 분자, 핵산 또는 단백질이다. 일부 구체예에서, 유전자 리프레서는 게놈 DNA 또는 예컨대 mRNA와 같은 전사물 형태의 헌팅틴 유전자에 특이적으로 결합한다. 일부 구체예에서, 유전자 리프레서는 외인성이고 및/또는 자연적으로 발생하지 않는 화학적 변형 및/또는 서열 변형을 포함한다. 특정 구체예에서, 유전자 리프레서는 게놈의 다른 유전자들에의 결합에 비해 헌팅틴 유전자의 코딩 및/또는 비-코팅 부분에 특이적으로 결합하는 ZFP, TALE 또는 Cas DNA 결합 도메인이다. 다른 특정 구체예에서, 유전자 리프레서는 전사물 형태, 예컨대 mRNA 형태의 헌팅틴 유전자의 코딩 및/또는 비-코팅 부분에 상응하는 서열에 대해 100%, 또는 적어도 90%, 또는 적어도 80%, 또는 적어도 70%, 또는 적어도 60% 동일한 서열을 포함하는 안티센스 핵산이다. 유전자 리프레서에 특이적으로 결합하는 헌팅틴 유전자의 부분은 적어도 8, 적어도 10, 적어도 12, 적어도 15, 적어도 18, 적어도 20, 적어도 22, 적어도 25, 적어도 30, 적어도 35 및/또는 적어도 40 뉴클레오티드 또는 그 이상의 길이일 수 있다.

본원에 기술된 일부 구체예에서, 예컨대 대상의 치료를 위한 또는 유전자 리프레서의 시험을 위한 유전자 리프레서의 사용은 미처리 대조표준에 비해 DARPP-32A, PDE10a, Drd1 및/또는 Drd2 중 하나 또는 그 이상의 증가된 발현을 초래한다. 미처리 대조표준은 유전자 리프레서를 수용하지 않는데, 예를 들면 미처리 대상 또는 미처리 대조 세포, 예컨대 MSN이다. 일부 측면으로, DARPP-32의 발현은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비해 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 다른 측면으로, PDE10a의 수준은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 또 추가의 측면으로, 도파민 수용체 Drd1 및/또는 Drd2의 수준은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 일부 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2의 어떠한 조합, 예를 들면 둘 또는 그 이상의 조합의 수준은 두 가지가 DARP32A 및 PDE10a, 또는 DARP32A 및 Drd1인 경우에 또는 어떠한 그런 조합인 경우에 증가된다. 다른 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2 중 어떠한 3가지의 수준은 증가되는 한편, 다른 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2의 수준은 모두 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 증가된다.

일부 구체예에서, 발명의 방법 및 조성물은 HD에 걸린 대상 (예컨대 동물 모델)에서 움켜쥐기 행동을 정상화하기 위해 사용된다. 예를 들어, 일부 측면으로, 예컨대 대상의 치료를 위한 또는 유전자 리프레서의 시험을 위한 유전자 리프레서의 사용은 미처리 대상에 비해 처리된 대상 또는 동물 모델에서 감소된 움켜쥐기를 초래할 수 있다. 일부 측면에서, 모델은 HD R6/2 마우스 모델이다. 일부 측면으로, 움켜쥐는 행동은 10% 이상 감소되거나, 20% 이상 감소되거나, 30% 이상 감소되거나, 40% 이상 감소되거나, 50% 이상 감소되거나, 60% 이상 감소되거나, 70% 이상 감소되거나, 80% 이상 감소되거나, 90% 이상 감소되거나 또는 100% 이상 감소되거나, 또는 그 사이에 있는 어떠한 값만큼 감소된다. 일부 측면으로, 움켜쥐기 감소는 동물 출생 후 7주 이내, 8주 이내, 9주 이내, 10주 이내, 11주 이내 또는 12주 이내에 있거나 및/또는 유전자 리프레서로 처리하고 2주 이내, 3주 이내, 4주 이내, 5주 이내, 6주 이내 또는 7주 이내에 있는 동물을 시험하고 30초 이내에 관찰될 수 있다.

이들 및 다른 측면들은 전체적인 개시 내용에서 숙련자에게 쉽게 드러날 것이다.

도 1a 내지 1e는 야생형 및 돌연변이 (헌팅턴병, HD) 헌팅틴 (Htt) 대립유전자 및 그런 대립유전자에 대한 다양한 ZFP-TF 결합을 나타내는 개략도이다. 도 1a는 CAG 반복 밖에서 결합하고, 그러므로 야생형 및 돌연변이 (HD) 대립유전자에 동등하게 결합하는 것으로 예측되는 ZFP 디자인을 도시한다. "KRAB"은 KOX1 유전자로부터의 KRAB 억압 도메인을 나타내고 "ZFP"는 징크 핑거 DNA 결합 단백질을 나타낸다. "표준 ZFP TF"는 징크 핑거 DNA 결합 도메인들이 KRAB 억압 도메인에 연결되어 있는 ZFP 전사 인자 융합 단백질이다. 도 1b는 CAG 영역 내에서 결합하도록 디자인된 ZFP-TF를 도시한다. 도 1c는 징크 핑거 도메인의 두 개의 클러스터가 견고한 단백질 서열에 의해 분리되는 ZFP 전사 인자인 "양손 ZFP TF"를 도시한다. 기능성 (억압) 도메인은 이 도면에서 하나의 ZFP 외부에 있는 것으로 도시되지만, 기능성 도메인은 단백질의 어느 한 쪽에 있는 ZFP들 사이에 또는 ZFP 외부에 있을 수 있다. 도 1d는 다량체화 도메인 (작은 반점들이 있는 박스로 표시됨)을 통해 다량체화할 수 있는 "다량체화 ZFP TF"를 도시한다. 도 1e는 2개의 징크 핑거 DNA 결합 도메인이 가요성 링커에 의해 연결되고 또한 KRAB 도메인에 융합된 ZFP-ZFP-KRAB 형태를 도시한다. 모든 융합 단백질에서, 기능성 도메인은 DNA 결합 도메인의 어느 한 단부상에 있을 수 있다는 것과, DNA 결합 도메인은 광범위한 수의 징크 핑거를 포함할 수 있다는 것이 숙련된 기술자들에게 명백할 것이다. 또한 도 1에는 검은색 다이아몬드가 있는 박스로서 기능성 도메인 (예컨대 활성화, 억압, 절단 도메인)이 되된다. 숙련된 기술자들에게 도면에 제시된 예시적인 모델은 또한 TALE TF에도 적용될 수 있다는 것이 명백할 것이다.
도 2a 내지 2e는 CAG 반복 서열에 결합하지 않는 ZFP TF를 사용하여 도 1a에 기술된 것과 같은 ZFP에 의해 Htt의 둘 다의 대립유전자를 억압하는 것을 도시한다. 도 1a 및 1b에 도시된 것과 같은 ZFP 확인 번호는 막대 아래에 표시된다. 도 2a는 인간 유전자의 5개의 유전자좌에 대해 표적화된 ZFP를 사용하여 HEK293 세포에서의 인간 Htt 대립유전자의 억압을 도시한다. 인간 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위들의 위치가 도시된다. 각각의 ZFP 그룹에 대해, 각각의 막대는 독립적인 트랜스펙션 (transfection)을 나타낸다. 도 2b는 GFP 대조표준 또는 18856 ZFP TF 리프레서 (KOX1의 KRAB 억압 도메인을 포함함)로 트랜스펙션된 HEK293 세포의 Htt 단백질 수준을 보여주는 웨스턴 블롯을 도시하고, 도면에서 NFB p65 수준 ("p65")이 동등한 단백질 로딩을 확인하기 위해 사용되었다. 웨스턴 블롯은 ZFP-TF에 의한 Htt 발현의 억압을 확인한다. 도 2c는 Neuro2A 세포에서 마우스 Htt 특이적 ZFP에 대한 도 2a와 유사한 세트의 데이터를 도시한다. 도 2a에서와 같이, 마우스 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위의 위치가 표시된다. 도 2d 및 2e는 불멸화된 선조 세포에서의 마우스 Htt 유전자 발현 (RNA)의 억압을 증명하는데, 이때 상이한 용량의 ZFP-TF mRNA가 트랜스펙션에 사용되었다. 도 2b를 제외한 모든 경우에, Htt mRNA 수준은 실시간 RT-PCR에 의해 측정되었고 액틴 mRNA의 수준에 대해 표준화되었다.
도 3a 내지 3g는 도 1b에 예시된 것과 같은, CAG 반복 영역 내의 ZFP 결합을 사용함에 의한 돌연변이 Htt의 선택적 억압을 도시한다. 이 모델은 돌연변이 대립유전자의 더 긴 CAG 반복 영역이 CAG-표적화된 ZFP 리프레서 분자의 증가된 결합을 허용하는 것을 예시한다. 도 3a는 HEK293 세포에서 CAG-표적화된 ZFP에 의한 내인성 Htt 유전자 (정상적인 CAG 반복 길이를 가짐)에 대한 상이한 리프레서 활성을 도시한다. 도 3b는 10 내지 47 CAG 반복의 범위인, 달라지는 길이의 CAG 반복을 함유하는 Htt 프로모터/엑손1 단편들에 의해 조절된 루시페라제 리포터의 억압을 도시한다. CAG10 (2개의 표시된 조건의 각각에 대해 좌측-바깥쪽 막대)은 10개의 CAG 반복으로 얻어진 결과를 나타내고; CAG17 (2개의 표시된 조건의 각각에 대해 좌측으로부터 두 번째 막대)은 17개의 CAG 반복으로 얻어진 결과를 나타내며; CAG23 (2개의 표시된 조건의 각각에 대해 우측으로부터 두 번째 막대)은 23개의 CAG 반복으로 얻어진 결과를 나타내고; CAG47 (2개의 표시된 조건의 각각에 대해 우측-바깥쪽 막대)은 47개의 CAG 반복으로 얻어진 결과를 나타낸다. 그래프 위의 개략도는 이 시스템에 사용된 Htt 프로모터, 엑손 1, CAG 반복 및 리포터 루시퍼라제 유전자의 배열을 나타낸다. 데이터는 CAG의 수의 증가가 CAG-표적화된 ZFP에 의한 Htt 프로모터로부터의 발현의 감소를 유도하는 것을 증명한다. 나아가, 도 3c는 상대적으로 약한 CAG-표적화된 ZFP가 강력한 CAG 리프레서뿐 아니라 정상적인 길이의 CAG 반복을 함유하는 루시페라제 리포터를 억압하지 않는 한편으로, 시험된 모든 용량에서 강력한 CAG-표적화된 ZFP로서 확장된 CAG 반복을 함유하는 루시페라제 리포터의 유사한 억압을 유도하는 것을 증명한다. "pRL-Htt-CAG23-인트론 1" (각 쌍의 좌측 막대)은 야생형 대립유전자로부터의 발현에 상응하는 한편, "pRL-HttCAG47-인트론 1" (각 쌍의 우측 막대)은 돌연변이 확장 Htt 대립유전자 (47개의 CAG 반복을 함유함)로부터의 발현과 상관된다. 도 3d는 HdH(Q111/Q7) 녹-인 마우스로부터 유도된 불멸화된 마우스 선조 세포에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt (111개의 CAG)의 억압을 도시하는 그래프이다. 야생형 발현은 각 쌍의 좌측 막대에 도시되고 녹-인 발현은 각 쌍의 우측 막대에 도시된다. KRAB 억압 도메인에 융합된 명시된 ZFP를 포함하고 있는 ZFP-TF는 트랜스펙션에서 ZFP mRNA의 상이한 3가지의 농도를 사용하여 시험되었다. 도 3e는 HD 환자 유도된 섬유하세포 라인 (CAG15/70)에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt 억압을 도시한다. 이 섬유아세포 라인에서, 야생형 Htt 대립유전자는 15개의 CAG 반복 ("099T(CAG15)", 각각의 표시된 조건의 중간 막대)을 포함하고, 돌연변이 확장 Htt 대립유전자는 70개의 CAG 반복 ("099C(CAG70)", 각각의 표시된 조건의 우측 막대)을 포함한다. 도 3f는 4개의 상이한 HD 환자 유도된 섬유아세포 셀라인에서의 돌연변이 Htt 발현의 선택적 억압을 도시한다. 각 그룹 위의 숫자는 야생형 Htt 대립유전자 (예컨대 15 또는 18) 및 돌연변이 대립유전자 (예컨대 70, 67, 45 및 44)에 대한 CAG 반복의 수를 나타내고; 이때 2가지 상이한 용량의 ZFP mRNA가 시험되었다. 각 쌍의 좌측 막대는 야생형 Htt 발현을 나타내고 각 쌍의 우측 막대는 돌연변이 Htt의 발현을 나타낸다. 도 3g는 ZFP-TFs 30640, 32528 및 30657의 존재 하에 웨스턴 블롯 분석에 의해 분석된 HD 유도된 환자 섬유아세포에서의 Htt 발현을 도시한다. 더 느리게 이동하는 단백질 밴드는 확장된 돌연변이 Htt 대립유전자에 의해 생성된 것들이다. 32528은 Htt의 전사 출발 부위 (TSS)에 결합하고 그로써 둘 다의 대립유전자로부터의 발현을 억제하는 한편, 30640 및 30657은 CAG 반복에 결합한다 (CAG).
도 4a 및 4b는 CAG 반복에 대해 표적화된 ZFP의 패널에 의한 HD 환자 유도된 섬유아세포 라인에서의 돌연변이 Htt의 억압을 도시한다. RNA 농도 범위는 0.1 ng 내지 3 μg의 범위로 사용되었다. 도 4a 및 4b에서, 각각의 표시된 조건의 좌측 막대는 총 Htt 발현을 나타내고, 중간 막대는 섬유아세포에서의 Htt의 억압을 나타내며 이때 Htt 대립유전자는 18개의 CAG 반복을 포함하고 ("099T(CAG18)") 돌연변이 확장 Htt 대립유전자는 45개의 CAG 반복을 포함한다(099T (CAG45)).
도 5는 HD 환자-유도된 섬유아세포에서 Htt 및 다른 CAG-함유 유전자의 발현에 미치는 CAG-표적화된 ZFP 리프레서의 효과를 도시한다. 각각의 표시된 조건 아래의 좌측 막대는 30640으로 얻어진 결과를 나타내고; 각각의 표시된 조건 아래의 중간 막대는 30675로 얻어진 결과를 나타내며; 우측 막대는 mock 트랜스펙션을 나타낸다.
도 6a 및 6b는 3개의 CAG-표적화된 ZFP의 게놈-광범위 특이성을 조사하는 실험을 도시한다. 도 6a는 30640, 30645 또는 33074를 사용하여 HD 섬유아세포 (CAG18 (중간 막대)/ CAG45 (우측 막대))의 6개의 생물학적 복제물 (6개의 별도의 트랜스펙션)에 대해 수행된 Htt 억압의 qPCR 분석을 도시한다. 그런 다음 qPCR에 의해 4개의 가장 유사한 복제물이 마이크로어레이 분석을 위해 선택되었고, 데이터는 도 6b에 제공된다.
도 7은 CAG17/69 뉴런 줄기 세포 (NSC)에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다. 각각의 표시된 용량 아래의 좌측 막대는 CAG17 세포에서의 결과를 나타내고, 중간 막대는 야생형 세포에서의 결과를 나타내며, 우측 막대는 CAG69 세포에서의 결과를 나타낸다.
도 8은 ZFP TF로 처리된 HD 배아 줄기 세포 (ESC) (CAG 17/48)로부터 분화된 뉴런에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다.
도 9는 ZFP TF 30640으로의 처리 후에 R6/2 마우스에서의 돌연변이 Htt 이식유전자 발현의 억압을 도시한다.
도 10a 내지 10d는 도 1d에 도시된 것과 같은, 확장된 CAG 반복을 특이적으로 표적화하는 다량체화 도메인을 가지는 ZFP를 도시한다. 도 10a는 4개의 성분: (i) KOX 리프레서 도메인 ("리프레서"로 표시된 타원형); (ii) (CAG)_N 또는 이 서열의 과돌연변이에 결합하는 2 내지 6 핑거의 어레이 (2개가 도시됨, "Z"로 표시된 작은 타원형); 및 (iii) 역평행 형태로 상호작용하는 2개의 이량체화 도메인 ("d1" 및 "d2"로 표시된 사각형)을 가지는 단일 ZFP를 도시한다. 이들 도메인은 CAG 트랙트의 주요 홈 내에서 ZFP가 중합되는 것을 허용한다. 도 10b는 3개의 ZFP의 다량체로 결합 사건이 일어나는 것을 개략적으로 도시한다. 어떠한 수의 다량체이든 사용될 수 있고 기능성 도메인은 하나 또는 그 이상의 개별적인 ZFP상의 어느 곳에든지 위치할 수 있으며 이들 다이아그램은 TALE-TF에도 적용될 수 있다는 것이 명백할 것이다. 도 10c는 이량체화 징크 핑거 (DZ)들 사이의 상호작용을 통해 다량체화하도록 디자인된 4개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 DZ1 (SEQ ID NO:180), DZ2 (SEQ ID NO:181), DZ3 (SEQ ID NO:182) 및 DZ4 (SEQ ID NO:183)로 명명된다. 이량체화 징크 핑거 도메인은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 도 10d는 코일형-코일 (CC) 사이의 상호작용을 통해 다량체화하도록 디자인된 7개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 CC1 (SEQ ID NO:184), CC2 (SEQ ID NO:185), CC3 (SEQ ID NO:186), CC4 (SEQ ID NO:187), CC5 (SEQ ID NO:188), CC6 (SEQ ID NO:189) 및 CC7 (SEQ ID NO:190)로 명명된다. 코일형-코일 서열은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 ZFP 영역의 위치는 "[ZFP]"로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 (DNA-결합) ZFP 영역의 위치는 "[ZFP]"로 표시된다.
도 11a 및 11b는 이량체화 도메인을 가지는 ZFP-TF의 활성을 도시한다. 도 11a에서, "코일형 코일" (CC) 도메인을 가지는 ZFP-TF는 루시페라제 리포터로 시험되었다. pRL-Htt CAG17 (각 쌍의 좌측 막대)은 17개의 CAG를 가지는 인간 Htt 프로모터/엑소1 단편에 의해 제어된 레닐라 루시페라제 리포터를 나타내고; pGL3-Htt-CAG47 (각 쌍의 우측 막대)은 47개의 CAG 반복을 가지는 인간 Htt 프로모터/엑손1 단편에 의해 제어된 반딧불이 루시페라제 리포터를 나타낸다. 다양한 이량체화 도메인의 설명에 대해서는 실시예 10을 참조한다. 도 11b에서, 이량체화 징크 핑거 "DZ" 도메인을 가지는 ZFP는 동일한 루시페라제 리포터로 시험되었고, 일부 ZFP-TF 이량체화 도메인으로 억압이 증가되는 것이 증명된다. 각 이중체 (doublet)에서 좌측 막대는 17CAG 반복 Htt 대립유전자로부터의 발현을 나타내는 한편 우측 막대는 47CAG 반복 Htt 대립유전자로부터의 발현을 나타낸다.
도 12a 및 12b는 ZFP-ZFP-KOX 단백질에 의한 Htt의 억압을 도시한다. 도 12a는 단일 33088 및 33084 ZFP-TF에 의한 Htt 억압 및 야생형 (좌측 막대), CAG18 (중간 막대) 및 CAG45 (우측 막대) (도 12a) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX 단백질에 의한 억압을 도시하고; 도 12b는 야생형 (좌측 막대), CAG20 (중간 막대) 및 CAG41 (우측 막대) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX에 의한 Htt 억압을 도시한다.
도 13a 내지 13e는 마우스 Htt의 활성화를 도시한다. 도 13a는 p65 활성화 도메인에 융합된 ZFP를 사용하여 Neuro2A 세포의 RNA 수준에서 마우스 Htt 유전자들의 ZFP-TF-구동된 상향 조절을 증명한다. 이중 막대는 이중 트랜스펙션을 가리킨다. 도 13b는 ZFP에 의해 구동된 증가된 Htt 단백질 생성을 증명하는 웨스턴 블롯을 도시하다. 도 13c는 야생형 마우스 Htt 대립유전자와 "녹 인" Htt 대립유전자를 도시하는데, 이때 마우스 서열 (엑손1의 대부분 및 인트론 1의 일부, 야생형 대립유전자 개략도 위의 선)은 CAG 확장을 가지는 상응하는 인간 서열 (녹-인 대립유전자 개략도 위의 선)로 대체되었다. 도 13d는 상응하는 인간 서열 (SEQ ID NO:192)로 대체됨으로써 녹-인 대립유전자가 ZFP (a 및 b에 나타냄)가 마우스 서열에 특이적으로 결합하도록 디자인되는 것을 허용하기에 충분한 서열 다양성을 가지게 된 마우스 서열 (SEQ ID NO:191)과 인간 서열 사이의 배열을 도시한다. 도 13d는 HdhQ111/Q7 녹-인 마우스로부터 유도된 불멸화된 선조 세포에서의 야생형 마우스 Htt 대립유전자의 특이적인 활성화를 도시한다. 좌측 막대는 야생형 세포의 결과를 나타내고 우측 막대는 녹-인 돌연변이 대립유전자 세포의 결과를 나타낸다.
도 14a 및 14b는 Htt 특이적 ZFN 쌍으로의 K562 세포의 처리 후에 Cel-I 미스매치 분석 (Surveyor^TM, Transgenomics)의 결과를 도시한다. 활성 ZFN에 대한 퍼센트 NHEJ 활성 (삽입-결실)은 상응하는 레인의 하부에 나타낸다. "GFP"는 GFP 코드화 플라스미드로 트랜스펙션된 세포를 나타낸다. 도 14a는 초기 Htt 엑손을 절단하는 ZFN으로부터의 결과를 도시하는 한편 도 14b는 중지 코돈 가까이에서 절단하는 ZFN으로부터의 결과를 도시한다. 비활성 ZFN 쌍이 또한 관찰되었다 (레인들은 삽입-결실 백분율로 주석을 달지 않음).
도 15는 여러 후보 TALE-TF 단백질에 대한 Htt 억압 결과의 그래프를 도시한다. TALE-TF는 HD 환자 유도된 섬유아세포 (CAG 20/41)에서 시험되었다. 결과들은 TALE TF의 일부가 전체적인 Htt 발현을 억압하는 데 있어 활성이었던 한편, 다른 것들은 돌연변이 Htt-우선적 억압을 나타냈음을 증명한다.
도 16은 움켜쥐기 행동을 나타내는 두 개의 사진을 도시한다 (Mangiarini et al (1996) Cell 87:493-605). 시험은 시험 마우스를 꼬리로 들어올리는 것을 포함하는데, 이때 동물이 표면으로부터 약 12인치 정도 위에서 흔들릴 때까지 관찰자가 매끄럽게 움직이면서 앞뒤로 부드럽게 마우스를 잡아당긴다. 그런 다음 동물을 30초 동안 점수를 매긴다. HD 마우스는 우측의 사진에서 나타난 것과 같이 '움켜쥐기' 행동을 하는 반면, 정상적인 대조 마우스는 좌측에서 나타난 것과 같이 보다 개방적인 행동을 나타낸다.
도 17은 HD의 마우스 모델 (R6/2)에서 움켜쥐기 행동을 보여주는 그래프이다. 마우스들은 30초 동안 흔들렸고 시간 경과에 따라 움켜쥐기 행동의 유형과 길이에 대해 점수가 매겨진다. 관찰될 수 있는 것과 같이, ZFP 처리된 마우스들은 12주 기간에 걸쳐 모든 시점에서 움켜쥐기 행동의 감소를 나타냈다.
도 18은 ZFP로 처리된 R6/2 마우스의 뇌로부터 유도된 중간 가시 뉴런에 대한 4가지 생체마커의 발현의 변화를 나타낸 그래프이다. 분석된 4가지 생체마커, DARPP-32, PDE10a, DRD1 및 DRD2는 모두 GFP 발현 벡터로 처리되었던 R6/2 마우스의 뇌로부터의 신호에 비례하는 발현의 증가를 나타냈다.

본원에는 헌팅턴병 (HD)을 치료하기 위한 조성물 및 방법이 개시된다. 특히, 징크 핑거 단백질 (ZFP TF) 또는 TALE (TALE-TF)을 포함하는 Htt-조절 전사 인자들 및 그런 단백질을 활용하는 방법들이 헌팅턴병을 치료하거나 예방하는데 사용하기 위해 제공된다. 예를 들어, 돌연변이 Htt 대립유전자의 발현을 억압하거나 야생형 Htt 대립유전자의 발현을 활성화하는 ZFP-TF 또는 TALE-TF가 제공된다. 또한, HD와 관련된 유전자들의 게놈 구조를 변형시키는 징크 핑거 뉴클레아제 (ZFN), TALE 뉴틀레아제 (TALEN), Ttago 시스템 또는 CRISPR/Cas 뉴클레아제 시스템이 제공된다. 예를 들어, Htt의 돌연변이 형태의 일부를 특이적으로 변경시킬 수 있는 ZFN, TALEN 또는 CRISPR/Cas 뉴클레아제 시스템이 제공된다. 이것들은 엔지니어링된 징크 핑거 단백질 또는 엔지니어링된 TALE 단백질, 즉 예정된 핵산 표적 서열에 결합하는 비-자연 발생 단백질을 사용하는 조성물 및 방법을 포함한다.

그러므로, 본원에 기술된 방법 및 조성물은 헌팅턴병의 치료 및 예방을 위한 방법을 제공하고, 이들 방법 및 조성물은 Htt를 변형 또는 편집할 수 있는 엔지니어링된 징크 핑거 및 TALE 뉴클레아제, Ttago 및 CRISPR/Cas 뉴클레아제 시스템뿐 아니라 표적 유전자를 조절할 수 있는 징크 핑거 전사 인자들 또는 TALE 전사 인자들을 포함할 수 있다.

일반적

방법의 실시, 뿐만 아니라 본원에 개시된 조성물의 제조 및 사용은 다른 언급이 없는 한, 분자 생물학, 생화학, 크로마틴 구조 및 분석, 컴퓨터 화학, 세포 구조, 재조합 DNA 및 관련 분야에서의 종래 기법들을 기술분야의 숙련도 내에서 사용한다. 이들 기법은 문헌에 전체적으로 설명되어 있다. 예를 들면 Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999 참조.

정의

용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며 선형 또는 원형 형태의, 및 단일- 또는 이중-가닥 형태 중 어느 하나의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 말한다. 본 개시의 목적에 대해 이들 용어는 중합체의 길에 관한 제한으로서 해석되어서는 안된다. 용어는 천연 뉴클레오티드의 공지된 유사체뿐 아니라 염기, 당 및/또는 포스페이트 부분 (예컨대 포스포로티오에이트 골격)에서 변형된 뉴클레오티드들을 포함할 수 있다. 일반적으로 특정 뉴클레오티드의 유사체는 동일한 염기쌍 특이성을 가진다; 즉 A의 유사체는 T와 염기쌍일 것이다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 나타내기 위해 상호교환적으로 사용된다. 그 용어는 또한 하나 또는 그 이상의 아미노산이 상응하는 자연-발생 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에도 적용된다.

"결합"은 마크로분자들 사이의 (예컨대 단백질과 핵산 사이의) 서열-특이적인 비-공유 상호작용을 말한다. 결합 상호작용의 모든 성분들은 상호작용이 전체로서 서열-특이적인 한 서열-특이적일 (예컨대 DNA 골격의 포스페이트 잔기와 접촉할) 필요는 없다. 그런 상호작용은 일반적으로 10^-6　M^-1 또는 그 이하의 해리 상수 (K_d)를 특징으로 한다. "친화성"은 결합의 길이를 나타낸다: 증가된 결합 친화성은 더 낮은 K_d와 상관된다.

"결합 단백질"은 다른 분자에 비-공유적으로 결합할 수 있는 단백질이다. 결합 단백질은 예를 들면 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우에, 그것은 자체에 결합할 수 있고 (단일이량체, 이종이량체 등을 형성함) 및/또는 상이한 단백질 또는 단백질들의 하나 또는 그 이상의 분자에 결합할 수 있다. 결합 단백질은 한 가지 이상의 유형의 결합 활성을 가질 수 있다. 예를 들어, 징크 핑거 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 가진다.

"징크 핑거 DNA 결합 단백질" (또는 결합 도메인)은 하나 또는 그 이상의 징크 핑거를 통해서 서열-특이적 방식으로 DNA에 결합하는 단백질 또는 더 큰 단백질 내의 도메인이고, 그것은 구조가 아연 이온의 배위를 통해 안정화된 결합 도메인 내의 아미노산 서열의 영역이다. 징크 핑거 DNA 결합 단백질이란 용어는 자주 ZFP의 징크 핑거 단백질로서 약칭된다.

"TALE DNA 결합 도메인" 또는 "TALE"은 하나 또는 그 이상의 TALE 반복 도메인/유닛을 포함하는 폴리펩티드이다. 반복 도메인은 그것의 동족 표적 DNA 서열에 대한 TALE의 결합에 포함된다. 단일 "반복 유닛" (또한 "반복"으로도 언급됨)은 전형적으로 33 내지 35 아미노산 길이이며 자연 발생 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 일부의 서열 상동성을 나타낸다. 예컨대 미국 특허 번호 8,586,526 참조.

징크 핑거 결합 도메인 또는 TALE DNA 결합 도메인은 예를 들면 자연 발생 징크 핑거 단백질의 인식 나선 영역의 엔지니어링 (하나 또는 그 이상의 아미노산의 변경)을 통해 또는 TALE 단백질의 RVD의 엔지니어링에 의해, 예정된 뉴클레오티드 서열에 결합하기 위해 "엔지니어링"될 수 있다. 그러므로, 엔지니어링된 징크 핑거 단백질 또는 TALE은 비-자연 발생적인 단백질이다. 징크 핑거 단백질 또는 TALE을 엔지니어링하기 위한 방법들의 비-제한적 실례는 디자인 및 선택이다. 디자인된 징크 핑거 단백질 또는 TALE은 디자인/조성물이 원칙적으로는 합리적인 기준으로부터 유래하는 자연적으로 발생하지 않는 단백질이다. 디자인에 대한 합리적인 기준은 기존의 ZFP 디자인 및 결합 데이터의 정보를 저장하는 데이터베이스에서 정보를 처리하기 위한 치환 규칙 및 컴퓨터화된 알고리즘의 적용을 포함한다. 예를 들면 미국 특허 번호 8,586,526; 6,140,081; 6,453,242; 및 6,534,261; 또한 WO　98/53058; WO　98/53059; WO　98/53060; WO　02/016536 및 WO　03/016496 참조.

"선택된" 징크 핑거 단백질 또는 TALE는 그것의 생성이 파지 디스플레이, 상호작용 트랩 또는 하이브리드 선택과 같은 실험 과정으로부터 주로 유발되는, 자연계에서 발견되지 않는 단백질이다. 예컨대 8,586,526;　　5,789,538; US 5,925,523; US　6,007,988; US　6,013,453; US 6,200,759; WO　95/19431; WO　96/06166; WO　98/53057; WO　98/54311; WO　00/27878; WO　01/60970 WO　01/88197, WO　02/099084 참조.

"TtAgo"는 유전자 침묵에 포함되는 것으로 여겨진 원핵세포 아르고노트 (Argonaute) 단백질이다. TtAgo는 박테리아 Thermus thermophilus로부터 유도된다. 예컨대 Swarts et al, ibid, G. Sheng et al., (2013) Proc . Natl . Acad . Sci . U.S.A. 111, 652) 참조. "TtAgo 시스템"은 예를 들면 TtAgo 시스템에 의한 절단에 대한 가이드 DNA를 포함하여 요구되는 모든 성분이다.

"재조합"은 두 개의 폴리뉴클레오티드 사이의 유전자 정보의 교환 과정을 말한다. 본 개시의 목적에 대해, "상동 재조합 (HR)"은 예를 들면 세포에서 상동성-지시된 수복 메커니즘을 통해 이중-가닥 파괴의 수복 중에 일어나는 그런 교환의 특수한 형태를 말한다. 이 과정은 뉴클레오티드 서열 상동성을 필요로 하고, "표적" 분자 (즉 이중-가닥 파괴를 경험하게 되는 분자)의 수복을 형판으로 하기 위해 "공여자" 분자를 사용하며, 그것이 유전자 정보가 공여자로부터 표적으로 전달되는 것을 유도하기 때문에 "비-교차 유전자 전환" 또는 "짧은 트랙트 유전자 전환"으로서 다양하게 알려져 있다. 어떠한 특정 이론에 결합되는 것을 바라지 않지만, 그런 전달은 깨진 표적과 공여자 사이에서 형성되는 이종이중나선 DNA의 미스매치 교정, 및/또는 공여자가 표적의 일부가 될 유전자 정보를 재합성하기 위해 사용되는 "합성-의존성 가닥 아닐링" 및/또는 관련된 과정을 포함할 수 있다. 그런 특수화된 HR은 자주 표적 분자의 서열의 변경을 초래하여서 공여자 폴리뉴클레오티드의 서열의 부분 또는 전부가 표적 폴리뉴클레오티드 안으로 통합된다.

개시된 방법에서, 본원에 기술된 하나 또는 그 이상의 표적화된 뉴클레아제는 예정된 부위에서 표적 서열 (예컨대 세포성 크로마틴)의 이중-가닥의 파괴를 생성하고, 파괴 영역의 뉴클레오티드 서열에 대한 상동성을 가지는 "공여자" 폴리뉴클레오티드가 세포 안으로 도입될 수 있다. 이중-가닥 파괴의 존재는 공여자 서열의 통합을 용이하게 하는 것으로 밝혀졌다. 공여자 서열은 물리적으로 통합될 수 있거나, 다르게는, 공여자 폴리뉴클레오티드는 상동 재조합을 통해 파괴의 수복을 위한 주형으로서 사용되어 세포성 크로마틴 안으로의 공여자에서처럼 뉴클레오티드 서열의 전부 또는 일부의 도입을 초래한다. 그러므로, 세포성 크로마틴의 제 1 서열은 변경될 수 있고, 특정 구체예에서, 공여자 폴리뉴클레오티드에 존재하는 서열로 전환될 수 있다. 그러므로, 용어 "대체한다" 또는 "대체"의 사용은 한 뉴클레오티드 서열의 다른 것에 의한 대체 (즉 정보적인 의미에서 서열의 대체)를 나타내는 것으로 인지될 수 있고, 한 폴리뉴클레오티드의 다른 것에 의한 물리적 또는 화학적 대체를 반드시 필요로 하지 않는다.

본원에 기술된 방법들 중 어느 것에서, 징크-핑거 또는 TALE 단백질의 추가의 쌍들이 세포 내에서 추가의 표적 부위의 추가의 이중-가닥 절단을 위해 사용될 수 있다.

세포성 크로마틴에서 관심의 영역의 서열의 표적화된 재조합 및/또는 대체 및/또는 변경에 대한 방법들의 특정 구체예에서, 염색체 서열은 외인성 "공여자" 뉴클레오티드 서열을 사용하는 상동 재조합에 의해 변경된다. 그런 상동 재조합은, 만약 파괴 영역에 상동하는 서열들이 존재한다면, 세포성 크로마틴에서 이중-가닥 파괴의 존재에 의해 자극된다.

본원에 기술된 방법들 중 어느 것에서, 제 1 뉴클레오티드 서열 ("공여자 서열")은 관심의 영역에서 게놈 서열에 대해 동일하지는 않지만 상동하는 서열을 함유할 수 있고, 그로써 관심의 영역에서 비-동일한 서열을 삽입하기 위해 상동 재조합을 자극한다. 그러므로 특정 구체예에서, 관심의 영역의 서열들에 상동하는 공여자 서열의 부분들은 대체되는 게놈 서열에 대해 약 80 내지 99% (또는 그 사이의 어떠한 정수)의 서열 동일성을 나타낸다. 다른 구체예에서, 공여자와 게놈 서열 사이의 상동성은 99%보다 높은데, 예를 들면 공여자와 100개 이상의 연속적인 염기쌍의 게놈 서열 사이에서와 같이 단지 하나의 뉴클레오티드가 상이하다. 특정 경우에, 공여자 서열의 비-상동성 부분은 관심의 영역에 존재하지 않는 서열을 함유할 수 있어서, 새로운 서열들은 관심의 영역들에 도입된다. 이들 경우에, 비-상동성 서열은 일반적으로 관심의 영역의 서열에 대해 상동성이거나 동일한 50 내지 1,000 염기쌍 (또는 그 사이의 어떠한 적분 값) 또는 1,000보다 더 큰 어떠한 수의 염기쌍의 서열이 양옆에 있다. 다른 구체예에서, 공여자 서열은 제 1 서열에 대해 비-상동성이고, 비-상동 재조합 메커니즘에 의해 게놈 안에 삽입된다.

본원에 기술된 방법들 중 어느 것이든지 관심의 유전자(들)의 발현을 파괴하는 공여자 서열의 표적화된 통합에 의해 세포에서의 하나 또는 그 이상의 표적 서열의 부분적 또는 완전한 비활성화에 대해 사용될 수 있다. 부분적으로 또는 완전하게 비활성화된 유전자들을 가지는 셀라인들이 또한 제공된다.

나아가, 본원에 기술된 것과 같은 표적화된 통합 방법들은 또한 하나 또는 그 이상의 외인성 서열을 통합하기 위해 사용될 수 있다. 외인성 핵산 서열은 예를 들면 하나 또는 그 이상의 유전자 또는 cDNA 분자, 또는 어떠한 유형의 코딩 또는 비코딩 서열뿐 아니라, 하나 또는 그 이상의 대조 요소들 (예컨대 프로모터)을 포함할 수 있다. 또한, 외인성 핵산 서열은 하나 또는 그 이상의 RNA 분자들 (예컨대 작은 헤어핀 RNA (shRNA), 억제 RNA (RNAi), 마이크로RNA (miRNA) 등)을 생성할 수 있다.

"절단"은 DNA 분자의 공유 골격의 파괴를 말한다. 절단은 그것들에 한정되는 것은 아니지만, 포스포다이에스테르 결합의 효소적 또는 화학적 가수분해를 포함하는 다양한 방법에 의해 개시될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단은 둘 다 가능하고, 이중-가닥의 절단은 2개의 구별되는 단일-가닥의 절단 사건의 결과로서 발생할 수 있다. DNA 절단은 블런트 단부 또는 엇갈리는 (staggered) 단부 중 어느 하나의 생성을 초래할 수 있다. 특정 구체예에서, 융합 폴리펩티드는 표적화된 이중-가닥의 DNA 절단에 대해 사용된다.

"절단 하프-도메인"은 제 2 폴리펩티드 (동일하거나 상이한)와 함께 절단 활성 (바람직하게 이중-가닥 절단 활성)을 가지는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제 1 및 제 2 절단 하프-도메인", "+ 및 - 절단 하프-도메인" 및 "우측 및 좌측 절단 하프-도메인"은 이량체화하는 절단 하프-도메인의 쌍들을 나타내기 위해 상호교환적으로 사용된다.

"엔지니어링된 절단 하프-도메인"은 다른 절단 하프-도메인과의 필수 이종이량체를 형성하기 위해 변형된 절단 하프-도메인이다 (예컨대 다른 엔지니어링된 절단 하프-도메인). 또한 미국 특허 공보 번호 2005/0064474, 20070218528, 2008/0131962 및 2011/0201055 (전체 내용이 참조로 본원에 포함됨) 참조.

용어 "서열"은 DNA 또는 RNA일 수 있는 어떠한 길이의 뉴클레오티드 서열을 말하고; 선형, 원형 또는 분지형일 수 있으며 단일-가닥 또는 이중-가닥 중 어느 하나일 수 있다. 용어 "공여자 서열"은 게놈에 삽입되는 뉴클레오티드 서열을 말한다. 공여자 서열은 어떠한 길이의 것일 수 있으며, 예를 들면 2 내지 10,000 뉴클레오티드 길이 (또는 그 사이의 또는 그 이상의 어떠한 정수 값), 바람직하게 약 100 내지 1,000 뉴클레오티드 길이 (또는 그 사이의 어떠한 정수), 보다 바람직하게 약 200 내지 500 뉴클레오티드 길이일 수 있다.

"크로마틴"은 세포의 게놈을 포함하는 핵단백질 구조이다. 세포성 크로마틴은 히스톤 및 비-히스톤 염색체 단백질을 포함하여 핵산, 주로 DNA 및 단백질을 포함한다. 진핵세포 크로마틴의 대부분은 뉴클레오좀의 형태로 존재하며, 이때 뉴클레오좀 코어는 각각 히스톤 H2A, H2B, H3 및 H4의 2개; 및 뉴클레오좀 코어 사이에 뻗어 있는 링커 DNA (유기체에 따라 길이가 가변적임)를 포함하는 8량체와 관련된 대략 150 염기쌍의 DNA를 포함한다. 히스톤 H1의 분자는 일반적으로 링커 DNA와 관련된다. 본 개시의 목적에 대해, 용어 "크로마틴"은 원핵세포 및 진핵세포 둘 다의, 세포 핵단백질의 모든 형태를 포함하는 것을 의미한다. 세포성 크로마틴은 염색체 및 에피솜성 크로마틴 둘 다를 포함한다.

"염색체"는 세포의 게놈의 전부 또는 일부를 포함하는 크로마틴 복합체이다. 세포의 게놈은 자주, 세포의 게놈을 포함하는 모든 염색체의 집합인, 그것의 핵형을 특징으로 한다. 세포의 게놈은 하나 또는 그 이상의 염색체를 포함할 수 있다.

"에피솜"은 복제하는 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 실례는 플라스미드와 특정 바이러스 게놈을 포함한다.

"표적 부위" 또는 "표적 서열"은 결합에 대한 충분한 조건이 존재한다면, 결합 분자가 결합할 핵산의 부분을 규정하는 핵산 서열이다.

"외인성" 분자는 정상적으로 세포에 존재하지 않지만, 하나 또는 그 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 안에 도입될 수 있는 분자이다. "세포에서의 정상적인 존재"는 세포의 특정 발달 단계 및 환경 조건에 관련하여 측정된다. 그러므로, 예를 들어 근육의 배아 발생 중에만 존재하는 분자는 성인 근육 세포에 대해 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 비-열-충격 세포에 대해서 외인성 분자이다. 외인성 분자는, 예를 들면 기능부전 외인성 분자의 기능화 버전 또는 정상적으로 기능하는 내인성 분자의 기능부전 버전을 포함할 수 있다.

외인성 분자는 다른 것들 중에서도, 예컨대 조합된 화학 방법에 의해 생성된 작은 분자, 마크로분자, 예컨대 단백질, 핵산, 탄수화물, 지질, 당단백질, 리포단백질, 다당, 상기 분자들의 어떠한 변형된 유도체 또는 상기 분자들 중 하나 또는 그 이상을 포함하는 어떠한 복합체일 수 있다. 핵산은 DNA 및 RNA를 포함하고, 단일- 또는 이중-가닥일 수 있으며; 선형, 분지된 또는 원형일 수 있고; 어떠한 길이의 것일 수 있다. 핵산은 이중나선을 형성할 수 있는 것들뿐 아니라 삼중나선-형성 핵산을 포함한다. 예를 들면 미국 특허 번호 5,176,996 및 5,422,251 참조. 단백질은 그것들에 한정되는 것은 아니지만, DNA-결합 단백질, 전사 인자, 크로마틴 리모델링 인자, 메틸화된 DNA 결합 단백질, 중합효소, 메틸화제, 탈메틸화제, 아세틸화제, 탈아세틸화제, 키나아제, 포스파타제, 통합효소, 재조합효소, 리가아제, 토포아이소메라제, 기라아제 및 헬라카아제를 포함한다.

외인성 분자는 내인성 분자와 동일한 유형의 분자, 예컨대 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 세포 안에 도입된 감염성 바이러스 게놈, 플라스미드 또는 에피솜 또는 세포에 자연적으로 존재하지 않는 염색체를 포함할 수 있다. 외인성 분자를 세포 안에 도입시키기 위한 방법들은 기술분야의 숙련자들에게 공지되어 있고, 그것들에 한정되는 것은 아니지만, 지질-중재된 전달 (즉 중성 및 양이온성 지질을 포함하여 리포솜), 일렉트로포레이션, 직접 주입, 세포 융합, 입자 폭발, 칼슘 포스페이트 공-침전, DEAE-덱스트란-중재된 전달 및 바이러스 벡터-중재된 전달을 포함한다. 외인성 분자는 또한 외인성 분자와 동일한 유형의 분자일 수 있지만 세포가 유도되는 것과 상이한 종으로부터 유도될 수 있다. 예를 들어, 인간 핵산 서열은 원래 마우스 또는 햄스터로부터 유도된 셀라인으로 도입될 수 있다.

대조적으로, "외인성" 분자는 특정 환경 조건하에서 특정 발달 단계에 있는 특정 세포에 정상적으로 존재하는 것이다. 예를 들어 외인성 핵산은 염색체, 미토콘드리아의 게놈, 엽록체 또는 다른 기관, 또는 자연-발생적인 에피솜성 핵산을 포함할 수 있다. 추가의 외인성 분자는 단백질, 예를 들면 전사 인자 및 효소들을 포함할 수 있다.

용어 "유전자 리프레서"는 하나 또는 그 이상의 유전자의 발현을 어떤 정도로 감소시키는 어떠한 분자를 말한다. 억제될 수 있는 유전자들의 비-제한적인 실례는 HD에 관련된 생체마커들을 포함한다 (예컨대 DARPP-32A, PDE10a, Drd1 및/또는 Drd2). 그런 유전자 억압은 대상의 헌팅턴병의 치료 및/또는 예방을 초래할 수 있다. 유전자 리프레서는 어떠한 분자, 이를테면 그것들에 한정되는 것은 아니지만, 유전자 (예컨대 헌팅틴 유전자)의 발현을 억제하는 작은 분자, 핵산 및/또는 단백질 (예컨대 징크 핑거 단백질, CRISRP/Cas 또는 TALE 도메인과 같은 비-자연 발생적인 DNA-결합 도메인을 포함하는 단백질)일 수 있다. 유전자 리프레서 단백질은 융합 분자, 예를 들면 DNA-결합 도메인과 전사 조절 도메인을 포함하는 융합 단백질 전사 인자들 (예컨대 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF) 또는 DNA-결합 도메인 및 뉴클레아제 도메인을 포함하는 뉴클레아제들 (예컨대 ZFN, TALEN, CRISPR/Cas 및/또는 Ttago 뉴클레아제 시스템)을 포함할 수 있다. 일부 구체예에서, 유전자 리프레서는 그것의 게놈 DNA 또는 전사물 형태, 예컨대 mRNA의 헌팅틴 유전자에 특이적으로 결합한다.

"융합" 분자는 둘 또는 그 이상의 하위유닛 분자들이, 바람직하게 공유적으로 연결되어 있는 분자이다. 하위유닛 분자들은 동일한 화학적 유형의 분자이거나, 상이한 화학적 유형의 분자들일 수 있다. 제 1 유형의 융합 분자의 실례는, 그것들에 한정되는 것은 아니지만, 융합 단백질 (예를 들면 ZFP 또는 TALE DNA-결합 도메인과 하나 또는 그 이상의 활성화 도메인 사이의 융합) 및 융합 핵산 (예를 들면 상기에서 기술된 융합 단백질을 코드화하는 핵산)을 포함한다. 제 2 유형의 융합 분자의 실례는, 그것들에 한정되는 것은 아니지만, 삼중나선-형성 핵산과 폴리펩티드 사이의 융합, 및 소수의 홈 결합제와 핵산 사이의 융합을 포함한다.

세포에서 융합 단백질의 발현은 융합 단백질의 세포에의 전달로부터 또는 융합 단백질을 코드화하는 폴리뉴클레오티드의 세포에의 전달에 의해 유발될 수 있ㄴ는데, 이때 폴리뉴클레오티드는 전사되고, 그 전사물은 번역되어 융합 단백질이 생성된다. 트랜스-스플라이싱, 폴리펩티드 절단 및 폴리펩티드 결찰이 또한 세포에서 단백질의 발현에 포함될 수 있다. 폴리뉴클레오티드 및 폴리펩티드를 세포에 전달하기 위한 방법들은 본 개시의 다른 곳에서 제공된다.

"다량체화 도메인" (또한 "이량체화 도메인" 또는 "단백질 상호작용 도메인"으로서 언급됨)은 ZFP TF 또는 TALE TF의 아미노, 카르복시 또는 아미노 및 카르복시 말단 영역에서 통합되는 도메인이다. 이들 도메인은 다수의 ZFP TF 또는 TALE TF의 다량체화를 허용함으로써 트라이뉴클레오티드 반복 도메인의 더 큰 트랙트들이 야생형 길이 수를 가지는 더 짧은 트랙트에 비하여 다량체화된 ZFP TF 또는 TALE TF에 의해 우선적으로 결합된다. 다량체화 도메인의 실례는 로이신 지퍼를 포함한다. 다량체화 도메인은 또한 작은 분자들에 의해서도 조절될 수 있는데, 이때 다량체화 도메인은 적절한 형태를 가정하여 작은 분자 또는 외부 리간드의 존재하에서만 다른 다량체화 도메인과의 상호작용이 허용된다. 이런 방식으로, 외인성 리간드는 이들 도메인의 활성을 조절하기 위해 사용될 수 있다.

본 개시의 목적에 대해 "유전자"는 유전자 생성물을 코드화하는 DNA 영역 (하기 참조)뿐 아니라, 조절 서열이 코딩 및/또는 전사된 서열에 인접한지의 여부와 관계없이, 유전자 생성물의 생성을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 그것에 반드시 한정되는 것은 아니지만, 프로모터 서열, 터미네이터, 전사 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 유입 부위, 인핸서, 침묵자, 인슐레이터, 경계선 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함한다.

"유전자 발현"은 유전자에 함유된 정보의, 유전자 생성물로의 전환을 말한다. 유전자 생성물은 유전자의 직접적인 전사 생성물 (예컨대 mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 어떠한 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생성된 단백질일 수 있다. 유전자 생성물은 또한 캡핑, 폴리아데닐화, 메틸화 및 편집과 같은 과정들에 의해 변형된 RNA, 및 예를 들면 메틸화, 아세틸화, 포스포릴화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질들을 포함한다.

유전자 발현의 "변조"는 유전자의 활성의 변화를 말한다. 발현의 변조는 그것들에 한정되는 것은 아니지만, 유전화 활성화 및 유전자 억압을 포함할 수 있다. 게놈 편집 (예컨대 절단, 변경, 비활성화, 무작위 돌연변이)은 발현을 변조시키기 위해 사용될 수 있다. 유전자 비활성화는 본원에 기술된 ZFP 또는 TALE 단백질을 포함하지 않는 세포에 비교하여 유전자 발현에 어떠한 감소를 말한다. 그러므로 유전자 비활성화는 부분적이거나 완전할 수 있다.

"관심의 영역"은 세포성 크로마틴의 어떠한 영역, 예컨대 예를 들면 유전자 내의 또는 유전자에 인접한 유전자 또는 비-코딩 서열이고, 이때 외인성 분자에 결합하는 것이 바람직하다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합의 목적에 대한 것일 수 있다. 관심의 영역은 염색체, 에피솜, 소기관 게놈 (예컨대 미토콘드리아성, 엽록체성), 또는 예를 들면 감염성 바이러스 게놈에 존재할 수 있다. 관심의 영역은 유전자의 코딩 영역 내에, 예를 들면 리더 서열, 트레일러 서열 또는 인트론과 같은 전사딘 비-코딩 영역 내에, 또는 코딩 영역의 상류나 하류에 있는 비-전사 영역 내에 있을 수 있다. 관심의 영역은 단일 뉴클레오티드 쌍처럼 작거나 길이가 최대 2,000 뉴클레오티드 쌍이거나, 또는 뉴클레오티드 쌍의 어떠한 적분 값일 수 있다.

"진핵" 세포는 그것에 한정되는 것은 아니지만, 진균 세포 (예컨대 효모), 식물 세포, 동물 세포, 포유류 세포 및 인간 세포 (예컨대 T-세포)를 포함한다.

용어 "작동성 연쇄" 및 "작용가능하게 연결된" (또는 "작동가능하게 연결된")은 둘 또는 그 이상의 성분들 (예컨대 서열 요소들)의 병렬과 관련하여 상호교환적으로 사용되며, 이때 성분들은 두 가지 성분이 정상적으로 기능하고 성분들 중 적어도 하나가 다른 성분들 중 적어도 하나에 대해 발휘되는 기능을 중재할 수 있는 가능성을 허용하도록 배열되어 있다. 예를 들면, 전사 조절 서열, 예컨대 프로모터는 만약 전사 조절 서열이 하나 또는 그 이상의 전사 조절 인자의 존재 또는 부재에 대한 반응으로 코딩 서열의 전사 수준을 제어한다면 코딩 서열에 작용가능하게 연결된 것이다. 전사 조절 서열은 일반적으로 코딩 서열과 인 시스로 (in cis) 작용가능하게 연결되지만, 직접 그것에 인접할 필요는 없다. 예를 들어, 인핸서는 연속적이지는 않지만, 코딩 서열에 작용가능하게 연결되어있는 전사 조절 서열이다.

융합 폴리펩티드와 관련하여, 용어 "작용가능하게 연결된"은 각각의 성분이 다른 성분과 연합하여 그것이 마치 그렇게 연결되지 않았을 때와 동일한 기능을 수행하는 사실을 나타낼 수 있다. 예를 들어 ZFP 또는 TALE DNA-결합 도메인이 활성화 도메인에 융합되어 있는 융합 폴리펩티드에 관련하여, ZFP 또는 TALE DNA-결합 도메인 및 활성화 도메인은 만약 융합 폴리펩티드에서, ZFP 또는 TALE DNA-결합 도메인 부분이 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 활성화 도메인이 유전자 발현을 상향조절할 수 있다면 작용가능하게 연쇄된 것이다. 유전자 발현을 조절할 수 있는 도메인들에 융합된 ZFP는 포괄적으로 "ZFP-TF" 또는 "징크 핑거 전사 인자"로서 언급되는 한편, 유전자 발현을 조절할 수 있는 도메인들에 융합된 TALE는 "TALE-TF" 또는 "TALE 전사 인자"로서 포괄적으로 언급된다. ZFP DNA-결합 도메인이 절단 도메인 ("ZFN" 또는 "징크 핑거 뉴클레아제"), ZFP DNA-결합 도메인 및 절단 도메인에 융합되어 있는 융합 폴리펩티드가 만약 융합 폴리펩티드에서 작용가능한 연쇄에 있을 때, ZFP DNA-결합 도메인 부분은 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 절단 도메인은 표적 부위에 근접한 곳에서 DNA를 절단할 수 있다. TALE DNA-결합 도메인이 절단 도메인 ("TALEN" 또는 "TALE 뉴클레아제"), TALE DNA-결합 도메인 및 절단 도메인에 융합되어 있는 융합 폴리펩티드가 만약 융합 폴리펩티드에서 작용가능한 연쇄에 있을 때, TALE DNA-결합 도메인 부분은 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 절단 도메인은 표적 부위에 근접한 곳에서 DNA를 절단할 수 있다.

단백질, 폴리펩티드 또는 핵산의 "기능성 단편"은 그것의 서열이 전-길이 단백질, 폴리펩티드 또는 핵산에 동일하지 않지만, 아직은 전-길이 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 보유하는 단백질, 폴리펩티드 또는 핵산이다. 기능성 단편은 상응하는 천연 분자보다 많거나, 더 적거나 또는 동일한 수의 잔기를 가질 수 있고, 및/또는 하나 또는 그 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산의 기능 (예컨대 코딩 기능, 다른 핵산에 혼성화하는 능력)을 측정하기 위한 방법들은 기술분야에 잘 알려져 있다. 유사하게, 단백질 기능을 측정하기 위한 방법들은 잘 알려져 있다. 예를 들어 폴리펩티드의 DNA-결합 기능은 필터-결합, 전기영동적 이동성-변동 또는 면역침전 분석에 의해 측정될 수 있다. DNA 절단은 겔 전기영동에 의해 분석될 수 있다. Ausubel et al., 상기 동일 참조. 다른 단백질과 상호작용하는 한 단백질의 능력은 예를 들면 공-면역침전, 둘 다 유전적이고 생화학적인 2-하이브리드 분석 또는 보상에 의해 측정될 수 있다. 예를 들면 Fields et al. (1989) Nature 340:245-246; 미국 특허 번호 5,585,245 및 PCT WO 98/44350 참조.

"벡터"는 표적 세포에 유전자 서열을 전달할 수 있다. 전형적으로 "벡터 구성물", "발현 벡터" 및 "유전자 전달 벡터"는 관심의 유전자의 발현을 지시할 수 있고 유전자 서열을 표적 세포에 전달할 수 있는 어떠한 핵산 구성물을 의미한다. 그러므로 용어는 클로닝, 및 발현 비히클뿐 아니라 통합 벡터를 포함한다.

"리포터 유전자" 또는 "리포터 서열"은 쉽게 측정되는, 바람직하게는 비록 본질적으로 기본적인 분석으로가 아니어도 측정되는 단백질 생성물을 생성하는 어떠한 서열을 말한다. 적합한 리포터 유전자는, 그것들에 한정되는 것은 아니지만, 항생물질 내성 (예컨대 암피실린 내성, 네오마이신 내성, G418 내성, 퓨로마이신 내성)을 중재하는 단백질을 코드화하는 서열, 착색된 또는 형광 또는 발광 단백질 (예컨대 녹색 형광 단백질, 증강된 녹색 형광 단백질, 적색 형광 단백질, 루시페라제)을 코드화하는 서열 및 증강된 세포 성장 및/또는 유전자 증폭을 중재하는 단백질 (예컨대 다이하이드로폴레이트 환원효소)을 포함한다. 에피토프 태그는 예를 들면 FLAG, His, myc, Tap, HA 또는 어떠한 검출가능한 아미노산 서열의 하나 또는 그 이상의 복사물을 포함한다. "발현 태그"는 관심의 유전자의 발현을 모니터링하기 위하여 원하는 유전자 서열에 작동가능하게 연결될 수 있는 리포터를 코드화하는 서열을 포함한다.

헌팅턴병의 생체마커

중간 가시 뉴런들은 HD에 고도로 민감하다. 엔케팔린을 함유하고 외부 담창구로 돌출된 (소위 "간접 경로"로) MSN은 물질 P를 함유하고 내부 담창구로 돌출된 ("직접" 경로로) 뉴런보다 많이 포함되지만, 두 유형의 MSN 둘 다 영향을 받는다. HD의 MSN은 비정상적인 응집 및 htt, 생체에너지학적 결함, 뉴로토핀 결핍, 전사 조절장애, 엑손 수송의 장애 및 흥분성 독성의 포함을 나타낸다.

예를 들어 DARPP-32 (도파민- 및 -cAMP-조절된 인단백질, Mr 32 kDa)는 선조체에서 도파민 및 단백질 키나아제 A에 대한 주요 표적이고, DARP-32가 Thr34에서 인산화될 때 단백질 포스파타제 1 (PP-1)의 억제제로서 작용할 수 있고, Thr75에서 인산화될 때 PKA의 억제제로서 작용할 수 있다는 점에서 인산화의 상태 및 위치에 따라 이중-기능 단백질로서 작용한다 (Svenningsson et al, (2004) Annu Rev Pharmacol Toxicol 44:269-96). 그것은 MSN의 97%에서, 여러 피층에서 및 소뇌의 푸르킨p 세포에서 발현된다. 그러나 HD의 마우스 모델에서, 그것의 mRNA 발현은 MSN에서 피질에서의 그것보다 큰 정도로 하향 조절된다 (Ehrlich (2012) Neurotherapeutics 9(2):270-284 참조).

선조체-특이적 고리형 뉴클레오티드 포스포다이에스테라제 PDE10A는 효소적 가수분해를 통해 고리형 뉴클레오티드 신호화를 제한하기 위해 선조체에서 작용한다. 그것은 간접 및 직접 MSN 둘 다에서 고수준으로 발현되고 (Kleiman et al, 2011 J of Pharma and Exp Thera 336(1):64-78 참조) HD에서 하향 조절되는 이중 기질 PDE이다.

선조체의 도파민 신호화는 부분적으로 도파민 수용체에 의해 조절되고 간접 MSN은 D1 및 D2 도파민 수용체를 발현한다 (각각 Drd1 및 Drd2). 흑질 부분에 돌출되는 직접 경로의 D1 발현 세포들은 망상을 이루는 한편, 중간 담창구로 돌출되는 간접 경로의 D2 수용체 발현 MSN, 및 기초적인 강글리아 기능화의 고전적 모델은 이동의 제어시 도파민의 차등 작용을 선택하는 선조체의 능력은 D1 및 D2 수용체의 MSN의 두 그룹으로의 분리에 기인하는 것을 시사한다 (Gerfen et al (1990) Science 250:1429-1432 참조). 그러므로, 두 Drd1 및 Drd2 유전자의 발현은 MSN의 본질적인 기능이고 발현의 불균형 또는 결함은 HD에서 관찰된 운동 기능의 파괴를 유도할 수 있다.

인간 HD 꼬리 (caudate)에서 관찰된 것들을 개괄하는 것으로 나타난 HD에서의 MSN 기능의 다른 생체마커들은 PENK (프로엔케팔린), RGS4 (G-단백질 신호화 4의 조절자), 전사 인자 NGFi-A, 칼슘/칼모듈린-의존성 3',5'-고리형 뉴클레오티드 포스포다이에스테라제 1B PDE1B 및 CNR1 (칸나비노이드 CB₁ 수용체)의 감소를 포함한다 (Runne et al, 상기 동일). 추가로, 돌연변이 htt 유전자의 발현 또한 직접적으로 분석될 수 있다.

마우스 모델에서 움켜쥐기 행동은 질병을 나타낸다. 상대적으로 공격적인 R6/2 마우스 모델에서, 인간 Htt 프로모터 및 확장된 CAG 반복을 함유하는 엑손 1 단편은 이소성으로 (ectopically) 발현된다 (Mangiarini et al. 상기 동일). 이들 마우스는 선조체의 중간 가시 뉴런 (MSN)의 손실뿐 아니라 HD의 특징인 HD-유사 행동의 변화를 나타낸다. 사망시 연령은 일반적으로 10주 내지 13주 사이이고 (그것보다 빠르게 또는 나중에 사망할 수도 있음), 마우스는 점진적인 신경학적 표현형을 나타낸다. 첫 번째 증상들 중 허나는 꼬리를 잡혔을 때 사지의 운동장애이다. 이것은 마우스가 그들의 발을 꼬리를 잡힌 직후에 함께 움켜쥐었다가 더 이상 자세를 바꿀 수 없을 때까지 번갈아 발을 함께 움켜쥐고 놓아버리는 것으로 진행된다. 그러므로 움켜쥐기 행동은 HD 표현형 행동의 정도의 척도로서 점수가 매겨질 수 있다.

HD에서 표현형 개선은 처리된 동물과 미처리 동물을 비교함으로써 측정될 수 있다. 모델은 움켜쥐기 행동 및 희생 후 생체마커의 변화를 측정함으로써 평가될 수 있다. 예를 들어 Rodriguez-Lebron 등은 (Rodriguez-Lebron et al (2005, Mol Ther 12(4):618-633) 움켜쥐기 행동과 DARPP-32 및 PENK 발현의 변화의 분석을 사용하여 htt에 대한 shRNA의 효능을 측정하였다.

DBA-결합 도메인

본원에는 그것에 한정되는 것은 아니지만 Htt를 포함하여 트라이뉴클레오티드 반복을 포함하고 있는 어떠한 유전자에서 표적 서열에 특이적으로 결합하는 DNA-결합 도메인을 포함하고 있는 조성물이 기술된다. 어떠한 DNA-결합 도메인이든지 본원에 개시된 조성물 및 방법에 사용될 수 있다.

특정 구체예에서, DNA 결합 도메인은 징크 핑거 단백질을 포함한다. 바람직하게, 징크 핑거 단백질은 그것이 선택된 표적 부위에 결합하기 위해 엔지니어링되는 점에서 비-자연적으로 발생한다. 예를 들면 Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem . 70:313-340; Isalan et al. (2001) Nature Biotechnol . 19:656-660; Segal et al. (2001) Curr . Opin . Biotechnol . 12:632-637; Choo et al. (2000) Curr . Opin . Struct . Biol . 10:411-416; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,03 0,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공보 번호 2005/0064474; 2007/0218528; 2005/0267061 참조, 모두 본원에 전체 내용이 참조로 포함됨.

엔지니어링된 징크 핑거 결합 도메인은 자연-발생 징크 핑거 단백질에 비교하여 신규한 결합 특이성을 가질 수 있다. 엔지니어링 방법은, 그것들에 한정되는 것은 아니지만 합리적인 디자인 및 다양한 유형의 선택을 포함한다. 합리적인 디자인은, 예를 들면 트리플렛 (또는 콰드러플렛) 뉴클레오티드 서열 및 개별적인 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하는데, 이때 각각의 트리플렛 또는 콰드러플렛 뉴클레오티드 서열은 특정 트리플렛 또는 콰드러플렛 서열이 결합하는 징크 핑거의 하나 또는 그 이상의 아미노산 서열과 관련된다. 예를 들면 공동 소유의 미국 특허 번호 6,453,242 및 6,534,261 참조 (본원에 전체 내용이 참조로 포함됨).

파지 디스플레이 및 2-하이브리드 시스템을 포함하여, 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO　98/37186; WO　98/53057; WO　00/27878; WO　01/88197 및 GB 2,338,237에 개시된다.

또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한 길이가 6 또는 그 이상의 아미노산인 예시적인 링커에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커의 어떠한 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인들에 대한 결합 특이성의 증강은 예를 들면 공동 소유의 WO　02/077227에서 기술되었다.

표적 부위의 선택; 융합 단백질 (및 그것을 코드화하는 폴리뉴클레오티드)의 디자인 및 구성을 위한 ZFP 및 방법들은 기술분야의 숙련자들에게 알려져 있고 미국 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO　95/19431; WO　96/06166; WO　98/53057; WO　98/54311; WO　00/27878; WO　01/60970; WO　01/88197; WO　02/099084; WO　98/53058; WO　98/53059; WO　98/53060; WO　02/016536 및 WO　03/016496에 상세하게 기술되어 있다.

또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한 길이가 6 또는 그 이상의 아미노산인 예시적인 링커에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커의 어떠한 조합을 포함할 수 있다.

특정 구체예에서, DNA 결합 도메인은 Htt에서 표적 부위에 결합하고 (서열-특이적 방식으로) Htt의 발현을 변조하는 엔지니어링된 징크 핑거 단백질이다. ZFP는 돌연변이 Htt 대립유전자 또는 야생형 Htt 서열 중 어느 하나에 선택적으로 결합할 수 있다. Htt 표적 부위는 전형적으로 적어도 하나의 징크 핑거를 포함하지만 다수의 징크 핑거 (예컨대 2, 3, 4, 5, 6 또는 그 이상의 핑거)를 포함할 수 있다. 통상적으로 ZFP는 적어도 3개의 핑거를 포함한다. 어떤 ZFP는 4, 5 또는 6개의 핑거를 포함하는 한편, 일부 ZFP는 8, 9, 10, 11 또는 12개의 핑거를 포함한다. 3개의 핑거를 포함하는 ZFP는 전형적으로 9 또는 10개의 뉴클레오티드를 포함하는 표적 부위를 인식하고; 4개의 핑거를 포함하는 ZFP는 전형적으로 12 내지 14개의 뉴클레오티드를 포함하는 표적 부위를 인식하는 한편; 6개의 핑거를 가지는 ZFP는 18 내지 21개의 뉴클레오티드를 포함하는 표적 부위를 인식한다. ZFP는 또한 하나 또는 그 이상의 조절 도메인을 포함하는 융합 단백질일 수 있고, 그 도메인은 전사 활성화 또는 억압 도메인일 수 있다. 일부 구체예에서, 융합 단백질은 함께 연결되어 있는 2개의 ZFP DNA 결합 도메인을 포함한다. 그러므로 이들 징크 핑거 단백질은 8, 9, 10, 11, 12 또는 그 이상의 핑거를 포함할 수 있다. 일부 구체예에서, 2개의 DNA 결합 도메인은 확장가능한 가용성 링커를 통해 연결되어서 하나의 DNA 결합 도메인은 4, 5 또는 6개의 징크 핑거를 포함하고 제 2 DNA 결합 도메인은 추가의 4, 5 또는 6개의 징크 핑거를 포함한다. 일부 구체예에서, 링커는 표준 핑거-내 링커여서 핑거 어레이는 8, 9, 10, 11 또는 12 또는 그 이상의 핑거를 VHG마하는 하나의 DNA 결합 도메인을 포함한다. 다른 구체예에서, 링커는 가요성 링커와 같은 비정형 링커이다. DNA 결합 도메인은 적어도 하나의 조절 도메인에 융합되고 'ZFP-ZFP-TF' 구조인 것으로 여겨질 수 있다. 이들 구체예의 구체적인 실례는 가요성 링커로 연결되고 KOX 리프레서에 융합되어 있는 2개의 DNA 결합 도메인을 포함하는 "ZFP-ZFP-KOX" 로서, 및 2개의 ZFP-KOX 융합 단백질이 링커를 통해 함께 융합되는 "ZFP-KOX-ZFP-KOX"로서 언급될 수 있다.

다르게는, DNA-결합 도메인은 뉴클레아제로부터 유도될 수 있다. 예를 들어, 귀소성 (homing) 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열들, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII은 알려져 있다. 또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol . Biol . 263:163-180; Argast et al. (1998) J. Mol . Biol. 280:345-353 및 New England Biolabs 카탈로그 참조. 또한, 귀소성 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비-천연 표적 부위에 결합하기 위해 엔지니어링될 수 있다. 예를 들어 Chevalier et al. (2002) Molec . Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 20070117128 참조.

"양손" 징크 핑거 단백질은 징크 핑거 DNA 결합 도메인의 두 개의 클러스터가 개재된 아미노산에 의해 분리되어서 2개의 징크 핑거 도메인이 2개의 불연속 표적 부위에 결합되는 그런 단백질이다. 징크 핑거 결합 단백질의 양손 유형의 실례는 SIPI이고, 이때 4개의 징크 핑거의 클러스터는 단백질의 아미노 말단에 위치하고 3개의 핑거의 클러스터는 카르복실 말단에 위치한다 (Remacle et al, (1999) EMBO Journal 18 (18): 5073-5084 참조). 이들 단백질의 징크 핑거의 각각의 클러스터는 독특한 표적 서열에 결합할 수 있고 두 개의 표적 서열 사이의 스페이싱은 많은 뉴클레오티드를 포함할 수 있다. 양손 ZFP는 예를 들면 ZFP의 하나 또는 둘 다에 융합된 기능성 도메인을 포함할 수 있다. 그러므로, 기능성 도메인은 하나 또는 둘 다의 ZFP의 외부에 부착될 수 있거나 (도 1c 참조), ZFP 사이에 위치할 수 있다 (둘 다의 ZFP에 부착됨) (도 4 참조).

Htt-표적화된 ZFP의 특이적인 실례는 표 1A 및 1B에 개시된다. 이 표에서 첫 번째 칼럼은 ZFP에 대한 내부 참조 명칭 (번호)이고 표 2A 및 2B의 칼럼 1의 동일한 명칭에 상응한다. "F"는 핑거를 나타내고 "F"에 이어지는 번호는 징크 핑거를 나타낸다 (예컨대 "F1"은 핑거 1을 나타낸다).

이들 단백질의 표적 부위에 대한 서열 및 위치는 표 2A 및 2B에 개시된다. 표 2A 및 2B는 표시된 징크 핑거 단백질에 대한 표적 서열을 나타낸다. ZFP 인식 나선에 의해 접촉된 표적 부위의 뉴클레오티드는 대문자로 표시되고; 비-접촉 뉴클레오티드는 소문자로 표시된다.

특정 구체예에서, DNA-결합 도메인은 자연 발생적인 또는 엔지니어링된 (비-자연적으로 발생하는) TAL 이펙터 (TALE) DNA 결합 도메인을 포함한다. 예컨대 미국 특허 번호 8,586,526 참조, 본원에 전체 내용이 참조로 포함됨. 크산토모나스 속의 식물 병원성 박테리아는 중요한 작물 식물에서 많은 질병을 유발하는 것으로 알려져 있다. 크산토모나스의 병원성은 식물 세포 안으로 25개 이상의 상이한 이펙터 단백질을 주입하는 보존된 유형 III 분비 (T3S) 시스템에 좌우된다. 이들 주입된 단백질 중에는 식물 전사 활성화제를 모방하고 식물 전사체를 조작하는 전사 활성화제-유사 이펙터 (TALE)가 있다 (Kay et al (2007) Science 318:648-651 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 가장 잘 특성화된 TALE 중 하나는 Xanthomonas campestgris pv. Vesicatoria로부터의 AvrBs3이다 (Bonas et al (1989) Mol Gen Genet 218:127-136 및 WO2010079430 참조). TALE은 탠덤 반복의 중심화된 도메인을 함유하고, 각각의 반복은 대략 34 아미노산을 함유하고, 그것은 이들 단백질의 DNA 결합 특이성에 대한 핵심이다. 또한, 그것은 핵 정위 서열 및 산성 전사 활성화 도메인을 함유한다 (개관을 위해 Schornack S, et al (2006) J Plant Physiol 163(3):256-272 참조). 또한, 병원성 박테리아 Ralstonia solanacearum에서 brg11 및 hpx17로 표시된 2개의 유전자는 R. solanacearum biovar 1 균주 GMI1000에서 및 biovar 4 균주 RS1000에서의 크산토모나스의 AvrBs3 패밀리에 상동하는 것으로 밝혀졌다 (Heuer et al (2007) Appl and Envir Micro 73(13):4379-4384 참조). 이들 유전자는 서로에 대해 뉴클레오티드 서열에서 98.9% 동일하지만 hpx17의 반복 도메인에서 1,575 염기쌍의 결실이 다르다. 그러나, 두 가지 유전자 생성물은 크산토모나스의 AvrBs3 패밀리와 40% 미만의 서열 동일성을 가진다.

이들 TALE의 특이성은 탠덤 반복에서 발견되는 서열에 좌우된다. 반복된 서열은 대략 102 염기쌍을 포함하고 반복은 전형적으로 서로와 91 내지 100% 상동한다 (Bonas et al, ibid). 반복의 다형태는 통상 위치 12 및 13에 위치하고 위치 12 및 13에서의 초가변성 2개의 잔기의 동일성과 TALE의 표적 서열의 연속적인 뉴클레오티드의 동일성 사이는 1-대-1로 상응하는 것으로 나타난다 (Moscou and Bogdanove, (2009) Science 326:1501 및 Boch et al (2009) Science 326:1509-1512 참조). 실험적으로, 이들 TALE의 DNA 인식에 대한 코드는 위치 12 및 13에서의 HD 서열이 시토신 (C)에 대한 결합을 유도하고, NG는 T에 결합하며, NI는 A, C, G 또는 T에 결합하고, NN은 A 또는 G에 결합하며, IG는 T에 결합하도록 결정될 수 있다. 이들 DNA 결합 반복은 반복의 새로운 조합 및 수를 가지는 단백질로 조립되어 새로운 서열과 상호작용하고 식물 세포에서 비-내인성 리포터 유전자의 발현을 활성화할 수 있는 인공 전사 인자들이 만들어졌다 (Boch et al, 상기 동일). 엔지니어링된 TAL 단백질은 FokI 절단 하프 도메인에 연결되어 효모 리포터 분석 (플라스미드 기초 표적)에서 활성을 나타내는 TAL 이펙터 도메인 뉴클레아제 융합 (TALEN)이 유발된다. Christian et al ((2010)< Genetics epub 10.1534/genetics.110.120717). 또한 미국 특허 번호 8,586,526 참조 (전체 내용이 참조로 포함됨).

ZFP 또는 TALE 단백질들로 사용될 디자인된 이량체화 도메인의 특이한 실례는 표 3에 열거된다. 2 유형의 도메인, 코일형-코일 (CC) 및 이량체화 징크 핑거 (DZ)의 아미노산 서열들이 열거된다.

디자인 명칭	아미노산 서열
DZ1	TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH ( SEQ ID NO:122 )
	TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:122 )
DZ2	FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAH( SEQ ID NO:123 )
	TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:122 )
DZ3	FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAH( SEQ ID NO:123 )
	HHCQHCDMYFADNILYTIHMGCHGYENPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:124 )
DZ4	HHCQHCDMYFADNILYTIHMGCHSCDDVFKCNMCGEKCDGPVGLFVHMARNAHGEKPTKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH(SEQ ID NO:125 )
	FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAHGEKPFYCEHCEITFRDVVMYSLHKGYHGFRDPFECNICGYHSQDRYEFSSHIVRGEH(SEQ ID NO:126 )
CC1	AQLEKELQALEKKLAQLEWENQALEKELAQ( SEQ ID NO:127 )
	AQLKKKLQANKKELAQLKWKLQALKKKLAQ( SEQ ID NO:128 )
CC2	EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 )
	ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 )
CC3	EQLEKKLQALEKKLAQLEWKNQALEK ( SEQ ID NO:131 )
	ELQANKKELAQLKWELQALKKELAQ ( SEQ ID NO:132 )
CC4	EQLEKKLQALEKKLAQLEWKNQA ( SEQ ID NO:133 )
	QANKKELAQLKWELQALKKELAQ ( SEQ ID NO:134 )
CC5	EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 )
	ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 )
CC6	EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 )
	ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 )
CC7	EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 )
	ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 )

융합 단백질

본원에 기술된 DNA-결합 단백질 (예컨대 ZFP 또는 TALE) 및 이종성 조절 (기능성) 도메인 (또는 그것의 기능성 단편)을 포함하는 융합 단백질이 또한 제공된다. 공통 도메인은 예컨대 전사 인자 도메인 (활성화제, 리프레서, 공-활성화제, 공-억제제), 침묵자 (scilencer), 발암 유전자 (예컨대 myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 패밀리 구성원 등); DNA 수복 효소 및 그것들의 관련된 인자 및 변형제; DNA 재배열 효소 및 그것들의 관련된 인자 및 변형제; 크로마틴 관련 단백질 및 그것들의 변형제 (예컨대 키나아제, 아세틸화제 및 탈아세틸화제); 및 DNA 변형 효소 (예컨대 메틸트란스페라제, 토포아이소메라제, 헬리카아제, 결찰효소, 키나아제, 포스파타제, 중합효소, 엔도뉴클레아제) 및 그것들의 관련 인자 및 변형제들을 포함한다. DNA-결합 도메인과 뉴클레아제 절단 도메인의 융합과 관련된 상세한 설명에 대해서는 미국 특허 번호 7,888,121 및 8,409,861을 참조한다 (전체 내용이 본원에 참조로 포함됨).

활성화를 이루기에 적합한 도메인들은 HSV VP16 활성화 도메인 (예컨대 Hagmann et al., J. Virol. 71, 5952-5962 (1997) 참조), 핵 호르몬 수용체 (예컨대 Torchia et al., Curr . Opin . Cell. Biol. 10:373-383 (1998) 참조); 핵 인자 카파 B의 p65 하위유닛 (Bitko & Barik, J. Virol. 72:5610-5618 (1998) and Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28 (1998)), 또는 인공 키메라 기능성 단백질, 예컨대 VP64 (Beerli et al., (1998) Proc. Natl . Acad . Sci . USA 95:14623-33) 및 데그론 (degron)(Molinari et al., (1999) EMBO J. 18, 6439-6447)을 포함한다. 추가의 예시적인 활성화 도메인은 Oct 1, Oct-2A, Sp1, AP-2 및 CTF1 (Seipel et al., EMBO J. 11, 4961-4968 (1992))과, 뿐만 아니라 p300, CBP, PCAF, SRC1 PvALF, AtHD2A 및 ERF-2를 포함한다. 예를 들면 Robyr et al. (2000) Mol . Endocrinol . 14:329-347; Collingwood et al. (1999) J. Mol . Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim . Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem . Mol . Biol. 69:3-12; Malik et al. (2000) Trends Biochem . Sci . 25:277-283; and Lemon et al. (1999) Curr . Opin . Genet. Dev. 9:499-504 참조. 추가의 예시적인 활성화 도메인은 그것들에 한정되는 것은 아니지만, OsGAI, HALF-1, C1, AP1, ARF-5,-6,-7 및 -8, CPRF1, CPRF4, MYC-RP/GP, 및 TRAB1을 포함한다. 예를 들면 Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol . 40:419-429; Ulmason et al. (1999) Proc . Natl . Acad . Sci . USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol . Biol . 41:33-44; and Hobo et al. (1999) Proc . Natl . Acad . Sci. USA 96:15,348-15,353 참조.

기술분야의 숙련자들에게는, DNA-결합 도메인과 기능성 도메인 사이의 융합 단백질 (또는 그것을 코드화하는 핵산)의 형성에서, 활성화 도메인 또는 활성화 도메인과 상호작용하는 분자 중 어느 하나는 기능성 도메인으로서 적합하다. 본질적으로 표적 유전자에 대한 활성화 복합체 및/또는 활성화 활성 (예컨대, 예를 들면 히스톤 아세틸화)을 충원할 수 있는 어떠한 분자든지 융합 단백질의 활성화 도메인으로서 유용하다. 단절제 (insulator) 도메인, 정위 도메인 및 크로마틴 리모델린 단백질, 예컨대 ISWI-함유 도메인 및/또는 융합 분자에서 기능성 도메인으로서 사용하기에 적합한 메틸 결합 도메인 단백질은 예를 들면 미국 특허 번호 6,919,204 및 7,053,264에 기술된다.

예시적인 억압 도메인은 그것들에 한정되는 것은 아니지만, KRAB A/B, KOX, TGF-베타-유도성 초기 유전자 (TIEG), v-erbA, SID, MBD2, MBD3, DNMT 패밀리의 구성원들 (예컨대 DNMT1, DNMT3A, DNMT3B), Rb 및 MeCP2를 포함한다. 예를 들면 Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; 및 Robertson et al. (2000) Nature Genet. 25:338-342 참조. 추가의 예시적인 억압 도메인은, 그것들에 한정되는 것은 아니지만 ROM2 및 AtHD2A를 포함한다. 예를 들면 Chem et al. (1996) Plant Cell 8:305-321; and Wu et al. (2000) Plant J. 22:19-27 참조.

융합 분자들은 기술분야의 숙련자들에게 잘 알려져 있는 클로닝 및 생화학적 포합의 방법에 의해 구성된다. 융합 분자들은 DNA-결합 도메인 및 기능성 도메인 (예컨대 전사 활성화 또는 억압 도메인)을 포함한다. 융합 분자들은 또한 임의로 핵 정위 신호 (예컨대, 예를 들면 SV40 중간 T-항원으로부터 유래됨) 및 에피토프 태그 (예컨대, 예를 들면 FLAG 및 헤마글루티닌)을 포함한다. 융합 단백질들 (및 그것들을 코드화하는 핵산)은 전사 리딩 프레임이 융합 성분들 중에서 보존되도록 디자인된다.

한편으로 기능성 도메인 (또는 그것의 기능성 단편)의 폴리펩티드 성분과, 다른 한편으로 비-단백질 DNA-결합 도메인 (예컨대 항생물질, 삽입제, 작은 홈 결합제, 핵산) 사이의 융합은 기술분야의 숙련자들에게 공지되어 있는 생화학적 포합 방법에 의해 구성된다. 예를 들어 Pierce Chemical Company (Rockford, IL) Catalogue 참조. 작은 홈 결합제와 폴리펩티드 사이의 융합을 제조하기 위한 방법 및 조성물은 기술되어 있다 (Mapp et al. (2000) Proc . Natl . Acad . Sci . USA 97:3930-3935).

특정 구체예에서, DNA 결합 도메인에 의해 결합된 표적 부위는 세포성 크로마틴의 접근가능한 영역에 존재한다. 접근가능한 영역들은 예를 들면 공동-소유의 국제 공보 WO 01/83732에 기술된 것과 같이 측정될 수 있다. 만약 표적 부위가 세포성 크로마틴의 접근가능 형역에 존재하지 않는다면, 하나 또는 그 이상의 접근가능한 영역들은 공동-소유의 WO 01/83793에 기술된 것과 같이 생성될 수 있다. 추가의 구체예에서, 융합 분자의 DNA-결합 도메인은 그것의 표적 부위가 접근가능한 영역에 있는지 또는 없는지의 여부와 관계없이 세포성 크로마틴에 결합할 수 있다. 예를 들어, 그런 DNA-결합 도메인은 링커 DNA 및/또는 뉴클레오좀 DNA에 결합할 수 있다. 이런 유형의 "선구자" DNA 결합 도메인의 실례는 특정 스테로이드 수용체 및 간세포 핵 인자 3 (HNF3)에서 발견된다. Cordingley et al. (1987) Cell 48:261-270; Pina et al. (1990) Cell 60:719-731; 및 Cirillo et al. (1998) EMBO J. 17:244-254.

융합 분자는 기술분야의 숙련자들에게 알려져 있는 것과 같이, 약학적으로 허용되는 담체로 제형될 수 있다. 예를 들면 Remington's Pharmaceutical Sciences, 17th ed., 1985; 및 공동-소유의 WO 00/42219 참조.

융합 분자의 기능성 성분/도메인은 일단 융합 분자가 그것의 DNA 결합 도메인을 통해 표적 서열에 결합하게 되면 유전자의 전사에 영향을 미칠 수 있는 다양한 상이한 성분들 중 어느 것으로부터 선택될 수 있다. 그러므로, 기능성 성분은 그것에 한정되는 것은 아니지만, 다양한 전사 인자 도메인, 예컨대 활성화제, 리프레서, 공동-활성화제, 공동-억제제 및 침묵자를 포함할 수 있다.

추가의 예시적인 기능성 도메인들은 예를 들면 공동-소유의 미국 특허 번호 6,534,261 및 6,933,113에 개시된다.

외인성 작은 분자들 또는 리간드들에 의해 조절되는 기능성 도메인들이 또한 선택될 수 있다. 예를 들어, 기능성 도메인만이 외부 RheoChem^TM 리간드의 존재하에 그것의 활성 형태를 추정하게 되는 RheoSwitch® 기술이 사용될 수 있다 (예를 들어 US 20090136465 참조). 그러므로, ZFP 또는 TALE는 조절가능한 기능성 도메인에 작동가능하게 연결될 수 있고, ZFP-TF 또는 TALE-TF의 결과적인 활성은 외부 리간드에 의해 제어된다.

뉴클레아제

또한 본원에는 뉴클레아제(들)에 의한 표적의 절단 후에 만들어진 삽입 및/또는 결실을 포함하여, 유전자 변형에 대해 생체 내에서 유용한, 예컨대 ZFN, TALEN, 귀소성 엔도뉴클레아제, CRISPR/Cas 및/또는 Ttago RNA-가이드된 시스템과 같은 뉴클레아제가 기술된다. 특정 구체예에서, 융합 단백질은 DNA-결합 도메인 및 절단 (뉴클레아제) 도메인을 포함한다. 그 자체로서, 유전자 변형은 뉴클레아제, 예를 들면 엔지니어링된 뉴클레아제를 사용하여 이루어질 수 있다. 엔지니어링된 뉴클레아제 기술은 자연적으로 발생하는 DNA-결합 단백질들의 엔지니어링을 기초로 한다. 예를 들면, 꼬리달린 DNA-결합 특이성을 사용한 귀소성 엔도뉴클레아제의 엔지니어링은 기술되어 있다 (Chames et al. (2005) Nucleic Acids Res 33(20):e178; Arnould et al. (2006) J. Mol . Biol . 355:443-458 참조). 또하느 ZFP의 엔지니어링 또한 기술되었다. 예컨대 미국 특허 번호 8,586,526; 6,534,261; 6,607,882; 6,824,978; 6,979,539; 6,933,113; 7,163,824; 및 7,013,219 참조.

또한, ZFP 및 TALE은 뉴클레아제 도메인에 융합되어 그것들의 엔지니어링된 (ZFP 또는 TLAE) DNA 결합 도메인을 통해 그것들의 의도된 핵산을 인식할 수 있고 DNA가 ZFP 또는 TALE DNA 결합 부위 가까이에서 뉴클레아제 활성을 통해 절단되는 것을 유발하는 기능성 부분인 ZFN 및 TALEN이 생성되었다. 예컨대 Kim et al. (1996) Proc Natl Acad Sci USA 93(3):1156-1160 참조. 뉴클레아제 (예컨대 ZFN, TALEN, CRISPR/Cas 및/또는 Ttago 시스템)는 다양한 유기체에서 게놈 변형에 대해 사용되었다. 미국 특허 번호 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 8,586,526; 미국 특허 공보 20030232410; 20050208489; 20050026157; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 및 20130177960 및 ㅁ미믹미국 출원 번호 14/278,903.

그러므로, 본원에 기술된 방법 및 조성물은 광범위하게 적용될 수 있고 관심의 어떠한 뉴클레아제든지 포함할 수 있다. 뉴클레아제의 비-제한적 실례는 CRISPR/Cas 및/또는 Ttago 시스템, 메가뉴클레아제, TALEN 및 징크 핑거 뉴클레아제를 포함한다. 뉴클레아제는 이종성 DNA-결합 및 절단 도메인들 (예컨대 징크 핑거 뉴클레아제; TALEN; 이종성 절단 도메인을 가지는 메가뉴클레아제 DNA-결합 도메인)을 포함할 수 있거나, 또는 다르게는, 자연-발생적인 뉴클레아제의 DNA-결합 도메인은 선택된 표적 부위에 결합하기 위해 변경될 수 있다 (예컨대 동족 결합 부위와 상이한 부위에 결합하도록 엔지니어링된 메가뉴클레아제).

특저 구체예에서, 뉴클레아제는 메가뉴클레아제 (귀소성 엔도뉴클레아제)이다. 자연-발생적인 메가뉴클레아제는 15 내지 40 염기쌍 절단 부위를 인식하고 통상적으로 4개의 패밀리로 그룹화된다: LAGLIDADG 패밀리, IY-YIG 패밀리, His-Cyst 박스 패밀리 및 HNH 패밀리. 예시적인 귀소성 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함한다. 그것들의 인식 서열은 알려져 있다. 또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol . Biol . 263:163-180; Argast et al. (1998) J. Mol . Biol . 280:345-353 및 New England Biolabs 카탈로그 참조.

주로 LAGLIDADG 패밀리로부터 유래하는, 자연-발생적인 메가뉴클레아제로부터의 DNA-결합 도메인은 식물, 효모, 드로조필라, 포유류 세포 및 마우스에서의 부위-특이적 게놈 변형을 촉진하기 위해 사용되었지만, 이 접근법은 메가뉴클레아제 인식 서열을 보존하는 어느 하나의 상동성 유전자의 변형에 (Monet et al. (1999), Biochem. Biophysics. Res. Common. 255:88-93) 또는 인식 부위가 도입되어 있는 사전-엔지니어링된 게놈에 국한되어 왔다 (Route et al. (1994), Mol . Cell. Biol. 14:8096-106; Chilton et al. (2003) Plant Physiology 133:956-65; Puchta et al. (1996), Proc . Natl . Acad . Sci . USA 93: 5055-60; Rong et al. (2002), Genes Dev. 16: 1568-81; Gouble et al. (2006), J. Gene Med . 8(5):616-622). 따라서, 메가뉴클레아제가 의학적으로 또는 생물공학적으로 관련된 부위에서 신규한 결합 특이성을 나타내도록 엔지니어링하기 위한 시도들이 이루어졌다 (Porteus et al. (2005), Nat. Biotechnol. 23:967-73; Sussman et al. (2004), J. Mol . Biol . 342:31-41; Epinat et al. (2003), Nucleic Acids Res. 31:2952-62; Chevalier et al. (2002) Molec . Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 번호 20070117128; 20060206949; 20060153826; 20060078552; 및 20040002092). 또한, 메가뉴클레아제로부터의 자연-발생적인 또는 엔지니어링된 DNA-결합 도메인들은 또한 이종성 뉴클레아제 (예컨대 FokI)로부터의 절단 도메인과 작동가능하게 연결되었다.

다른 구체예에서, 뉴클레아제는 징크 핑거 뉴클레아제 (ZFN)이다. ZFN은 선택된 유전자의 표적 부위에 결합하고 도메인 또는 절단 하프-도메인을 절단하도록 엔지니어링되어 있는 징크 핑거 단백지를 포함한다.

상기에서 상세하게 기술된 것과 같이, 징크 핑거 결합 도메인들은 선택된 서열에 결합하도록 엔지니어링될 수 있다. 예를 들면 Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem . 70:313-340; Isalan et al. (2001) Nature Biotechnol . 19:656-660; Segal et al. (2001) Curr . Opin. Biotechnol . 12:632-637; Choo et al. (2000) Curr . Opin . Struct . Biol . 10:411-416. 엔지니어링된 징크 핑거 결합 도메인은 자연-발생적인 징크 핑거 단백질에 비교하여, 신규한 결합 특이성을 가질 수 있다. 엔지니어링 방법은, 그것들에 한정되는 것은 아니지만, 합리적인 디자인 및 다양한 유형의 선택을 포함한다. 합리적인 디자인은, 예를 들면 트리플렛 (또는 콰드러플렛) 뉴클레오티드 서열 및 개별적인 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하는데, 이때 각각의 트리플렛 또는 콰드러플렛 뉴클레오티드 서열은 특정 트리플렛 또는 콰드러플렛 서열이 결합하는 징크 핑거의 하나 또는 그 이상의 아미노산 서열과 관련된다. 예를 들면 공동 소유의 미국 특허 번호 6,453,242 및 6,534,261 참조 (본원에 전체 내용이 참조로 포함됨).

파지 디스플레이 및 2-하이브리드 시스템을 포함하여, 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO　98/37186; WO　98/53057; WO　00/27878; WO　01/88197 및 GB 2,338,237에 개시된다. 또한, 징크 핑거 결합 도메인들에 대한 결합 특이성의 증강은 예를 들면 공동-소유의 WO 02/077227에 기술되었다.

또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커 (예컨대 TGEKP (SEQ ID NO:135), TGGQRP (SEQ ID NO:136), TGQKP (SEQ ID NO:137), 및/또는 TGSQKP (SEQ ID NO:138))를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 길이가 6 또는 그 이상의 아미노산인 예시적인 링커 서열에 대해 예컨대 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949 참조. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커들의 어떠한 조합을 포함할 수 있다. 또한 미국 임시 특허 공보 번호 20110287512 참조.

CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats, 클러스터를 형성한 규칙적인 내부공간의 짧은 재발성 반복)/Cas (CRISPR Associated) 뉴클레아제 시스템은 게놈 엔지니어링에 대해 사용될 수 있는 박테리아 시스템을 기초로 한 최근에 엔지니어링된 뉴클레아제 시스템이다. 그것은 많은 박테리아와 고세균의 적응성 면역 반응의 일부를 기초로 한다. 바이러스 또는 플라스미드가 박테리아를 침입할 때, 침입자의 DNA의 절편은 '면역' 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이 crRNA는 그런 다음 부분적인 상보성 영역을 통해 tracrRNA로 불리는 다른 유형의 RNA와 결합하여 Cas9 뉴클레아제를 "프로토스페이서 (protospacer)"로 불리는 표적 DNA의 crRNA에 상동하는 영역으로 안내한다. Cas9는 DNA를 절단하여 crRNA 전사물 내에 함유된 20-뉴클레오티드 가이드 서열에 의해 명시된 부위들에서 DSB에 있는 블런트 단부들이 생성된다. Cas9는 부위 특이적 DNA 인식 및 절단을 위해 crRNA와 tracrRNA 둘 다를 필요로 한다. 이 시스템은 현재 엔지니어링되어 crRNA와 tracrRNA는 한 분자 안으로 조합될 수 있고 ("단일 가이드 RNA"), 단일 가이드 RNA의 crRNA 동등한 부분은 Cas9 뉴클레아제가 어떠한 바람직한 서열을 표적화하도록 안내하기 위해 엔지니어링될 수 있다 (Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471, and David Segal, (2013) eLife 2:e00563 참조). 그러므로, CRISPR/Cas 시스템은 게놈의 원하는 표적에서 DSB를 생성하기 위해 엔지니어링될 수 있고, DSB의 수복은 오류 유발 수복의 증가를 유발하기 위하여 수복 억제제의 사용에 의해 영향을 받을 수 있다.

상기에서 주지된 것과 같이, 뉴클레아제의 절단 (뉴클레아제) 도메인은 DNA-결합 도메인, 예를 들면 징크 핑거 DNA-결합 도메인 및 뉴클레아제 또는 메가뉴클레아제 DNA-결합 도메인으로부터의 절단 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 대해 이종성일 수 있다. 이종성 절단 도메인은 어떠한 엔도뉴클레아제 또는 엑소뉴클레아제로부터도 얻어질 수 있다. 절단 도메인이 유도될 수 있는 예시적인 엔도뉴클레아제는 그것들에 한정되는 것은 아니지만, 제한 엔도뉴클레아제 및 귀소성 엔도뉴클레아제를 포함한다. 예를 들면 2002-2003 Catalogue, New England Biolabs, Beverly, MA; and Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388 참조. DNA를 절단하는 추가의 효소들이 알려져 있다 (예컨대 S1 뉴클레아제; 녹두 뉴클레아제; 췌장의 DNase I; 마이크로구균의 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993 참조). 이들 효소 중 하나 또는 그 이상 (또는 그것의 기능성 단편들)은 절단 도메인 및 절단 하프-도메인의 공급원으로서 사용될 수 있다.

유사하게, 절단 하프-도메인은 상기에서 설명한 것과 같이, 절단 활성에 대해 이량체화를 필요로 하는 어떠한 뉴클레아제 또는 그것의 일부로부터 유도될 수 있다. 일반적으로, 만약 융합 단백질이 절단 하프-도메인을 포함한다면 2개의 융합 단백질이 필요하다. 다르게는, 2개의 절단 하프-도메인을 포함하고 있는 단일 단백질이 사용될 수 있다. 2개의 절단 하프-도메인은 동일한 엔도뉴클레아제 (또는 그것의 기능성 단편들)로부터 유도될 수 있거나, 또는 각각의 절단 하프-도메인은 상이한 엔도뉴클레아제 (또는 그것들의 기능성 단편들)로부터 유도될 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게는 서로에 대해 배치되어서, 2개의 융합 단백질의 그것들의 각각의 표적 부위에 대한 결합은 서로에 대해 공간적 방향으로 절단 하프-도메인을 배치시킴으로써 예컨대 이량체화에 의해 절단 하프-도메인이 기능성 절단 도메인을 형성하는 것을 허용한다. 그러므로, 특정 환경에서, 표적 부위들의 모서리 근처는 5 내지 8개의 뉴클레오티드 또는 15 내지 18개의 뉴클레오티드에 의해 분리된다. 그러나, 어떠한 정수의 뉴클레오티드 또는 뉴클레오티드 쌍이든지 (예컨대 2 내지 50 뉴클레오티드 쌍 또는 그 이상) 2개의 표적 부위 사이에 개재될 수 있다. 일반적으로 절단 부위는 표적 부위들 사이에 놓인다.

제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하고 DNA에 서열-특이적으로 결합할 수 있고 (인식 부위에서), 결합 부위에서 또는 근처에서 DNA를 절단할 수 있다. 특정 제한 효소 (예컨대 타입 IIS)는 인식 부위로부터 제거된 부위들에서 DNA를 절단하고 분리가능한 결합 및 절단 도메인들을 가진다. 예를 들어 타입 IIS 효소 Fok　I는 DNA의 이중-가닥 절단을 한 가닥에서는 그것의 인식 부위로부터 9 뉴클레오티드 떨어진 곳에서, 다른 가닥에서는 그것의 인식 부위로부터 13개 뉴클레오티드 떨어진 곳에서 촉매한다. 예를 들어 미국 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 Li et al. (1992) Proc . Natl . Acad . Sci . USA 89:4275-4279; Li et al. (1993) Proc . Natl . Acad . Sci . USA 90:2764-2768; Kim et al. (1994a) Proc . Natl . Acad . Sci . USA 91:883-887; Kim et al. (1994b) J. Biol . Chem . 269:31,978-31,982 참조. 그러므로 한 구체예에서, 융합 단백질은 적어도 하나의 타입 IIS 제한 효소로부터의 절단 도메인 (또는 절단 하프-도메인) 및 하나 또는 그 이상의 징크 핑거 결합 도메인을 포함하며, 그것들은 엔지니어링될 수도 있고 그렇지 않을 수도 있다.

그것의 절단 도메인이 결합 도메인과 분리될 수 있는, 예시적인 타입 IIS 제한 효소는 Fok 　I이다. 이 특별한 효소는 이량체로서 활성이다 (Bitinaite et al. (1998) Proc . Natl . Acad . Sci . USA 95: 10,570-10,575). 따라서, 본 개시의 목적에 대해, 개시된 융합 단백질에 사용된 Fok　I 효소의 부분은 절단 하프-도메인으로 여겨진다. 그러므로, 징크 핑거- 또는 TALE-Fok　I 융합을 사용한 세포 서열의 표적화된 이중-가닥 절단 및/또는 표적화된 대체에 대해, 각각 Fok　I 절단 하프-도메인을 포함하고 있는 2개의 융합 단백질이 촉매적으로 활성인 절단 도메인을 재구성하기 위해 사용될 수 있다. 다르게는, 징크 핑거 결합 도메인 및 2개의 Fok　I 절단 하프-도메인을 함유하고 있는 단일 폴리펩티드 또한 사용될 수 있다. 징크 핑거- 또는 TALE-Fok　I 융합을 사용한 표적화된 절단 및 표적화된 서열 변경에 대한 매개변수들은 본 개시의 다른 곳에서 제공된다.

절단 도메인 또는 절단 하프-도메인은 절단 활성을 보유하거나, 또는 기능성 절단 도메인을 형성하기 위하여 다량체화 (예컨대 이량체화)할 수 있는 능력을 보유한 단백질의 어떠한 부분일 수 있다.

예시적인 타입 IIS 제한 효소들은 본원에 전체 내용이 포함된 국제 공보 WO 07/014275에 기술된다. 추가의 제한 효소들은 또한 분리가능한 결합 및 절단 도메인들을 함유하고, 이것들은 본 개시에 의해 고려된다. 예를 들면 Roberts et al. (2003) Nucleic Acids Res. 31:418-420 참조.

특정 구체예에서, 절단 도메인은 예를 들면 미국 특허 번호 8,772,453; 8,623,618; 8,409,861; 8,034,598; 7,914,796; 및 7,888,121 (모든 특허의 개시는 본원에 전체 내용이 참조로 포함됨)에 기술된 것과 같이, 단일이량체화를 최소화하거나 방지학는 하나 또는 그 이상의 엔지니어링된 절단 하프-도메인 (또한 이량체화 도메인 돌연변이로서 언급됨)을 포함한다. Fok I의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538에 있는 아미노산 잔기들은 모두 Fok I 절단 하프-도메인의 이량체화에 영향을 주기 위한 표적이다. 불가피한 이종이량체를 형성하는 Fok I의 엔지니어링된 절단 하프-도메인의 예를 들면 제 1 절단 하프-도메인이 Fok I의 위치 490 및 538에서 아미노산 잔기의 돌연변이를 포함하고 제 2 절단 하프-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하고 있는 쌍을 포함한다.

그러므로, 한 구체예에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 대체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 대체하며; 486에서의 돌연변이는 Gln (Q)를 Glu (E)로 대체하고; 499에서의 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기술된 엔지니어링된 절단 하프-도메인은 한 절단 하프-도메인에서 위치 490 (E→K) 및 539 (I→K)을 돌연변이시켜서 "E490K:I538K"로 표시된 엔지니어링된 절단 하프-도메인을 생성하고 다른 절단 하프-도메인에서 위치 486 (Q→E) 및 499 (I→L)를 돌연변이시켜서 "Q486E:I499L"로 표시된 엔지니어링된 절단 하프-도메인을 생성함으로써 만들었다. 본원에 기술된 엔지니어링된 절단 하프-도메인은 일탈적인 절단이 최소화되거나 제거되는 불가피한 이종이량체 돌연변이이다. 예를 들면 미국 특허 번호 7,914,796 및 8,034,598 참조 (이것들의 개시는 모든 목적에 대해 전체 내용이 참조로 포함된다). 특정 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 486에 있는 야생형 Gln (Q) 잔기를 Glu (E) 잔기로 대체시키고, 위치 499에 있는 야생형 Iso (I) 잔기를 Leu (L) 잔기로 대체시키며 위치 496에 있는 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체시키는 (또한 각각 "ELD" 및 "ELE" 도메인으로도 언급됨) 돌연변이를 포함한다. 다른 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 490에 있는 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체시키고, 위치 538에 있는 야생형 Iso (I) 잔기를 Lys (K) 잔기로 대체시키며 위치 537에 있는 야생형 His (H) 잔기를 Lys (K) 또는 Arg (R) 잔기로 대체시키는 (또한 각각 "KKK" 및 "KKR" 도메인으로도 언급됨) 돌연변이를 포함한다. 또 다른 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 490 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 490에 있는 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체시키고 위치 537에 있는 야생형 His (H) 잔기를 Lys (K) 또는 Arg (R) 잔기로 대체시키는 (또한 각각 "KIK" 및 "KIR" 도메인으로도 언급됨) 돌연변이를 포함한다. 미국 특허 번호 8,772,453.

본원에 기술된 엔지니어링된 절단 하프-도메인은 어떠한 적합한 방법을 사용하여, 예를 들면 미국 특허 번호 8,772,453; 8,623,618; 8,409,861; 8,034,598; 7,914,796; 및 7,888,121에 기술된 야생형 절단 하프-도메인 (Fok I)의 부위-특정 돌연변이생성에 의해 제조될 수 있다.

다르게는, 뉴클레아제는 소위 "분열-효소" 기술 (예컨대 미국 특허 공보 번호 20090068164 참조)을 사용하여 핵산 표적 부위에서 생체 내에서 조립될 수 있다. 그런 분열 효소들의 성분들은 별도의 발현 구성물 상에서 발현되거나 또는 개별적인 성분들이 예를 들면 자체-절단 2A 펩티드 또는 IRES 서열에 의해 분리되는 하나의 오픈 리딩 프레임에서 연결될 수 있다. 성분들은 개별적인 징크 핑거 결합 도메인이거나 메가뉴클레아제 핵산 결합 도메인의 도메인들일 수 있다.

일부 구체예에서, DNA 결합 도메인은 식물 병원성 크산토모나스 (Boch et al, (2009) Science 326: 1509-1512 and Moscou and Bogdanove, (2009) Science326: 1501 참조) 및 랄스토니아 (Heuer et al (2007) Applied and Environmental Microbiology 73(13):4379-4384 참조)로부터 유도된 것들과 유사한 TAL 이펙터로부터 엔지니어링된 도메인이다. 또한 PCT 공보 WO2010/079430 참조.

뉴클레아제 (예컨대 ZFN 또는 TALEN 등)는 예를 들면 8,563,314에 기술된 효모-기초 염색체 시스템에서 사용 전에, 활성에 대해 스크리닝될 수 있다. 뉴클레아제의 발현은 구성성 프로모터 또는 유도성 프로모터, 예를 들면 라피노오스 및/또는 갈락토오스의 존재시에 활성화되고 (탈-억압) 글루코오스의 존재시에 억압되는 갈락토키나아제 프로모터의 제어하에 있을 수 있다.

전달

본원에 기술된 단백질 (예컨대 ZFP, TALE, CRISPR/Cas, Ttago), 그것들을 코드화하는 폴리뉴클레오티드 및 단백질 및/또는 폴리뉴클레오티드를 포함하는 조성물은 어떠한 적합한 수단, 예를 들면 ZFP-TF, TALE-TF 단백질의 주사에 의해 또는 ZFN 또는 TALEN 코드화 mRNA의 사용에 의해 표적 세포에 전달될 수 있다. 적합한 세포는 그것에 한정되는 것은 아니지만 진핵 및 원핵 세포 및/또는 셀라인을 포함한다. 그런 세포 또는 그런 세포로부터 생성된 셀라인의 비-제한적인 실례는 COS, CHO (예컨대 CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예컨대 HEK293-F, HEK293-H, HEK293-T) 및 perC6 세포, 뿐만 아니라 곤충 세포, 예컨대 스포도프테라 푸기페르다 (Spodoptera fugiperda) (Sf) 또는 진균 세포, 예컨대 사카로마이세스 (Saccharomyces), 피치아 (Pichia) 및 스키조사카로마이세스 (Schizosaccharomyces)를 포함한다. 특정 구체예에서, 셀라인은 CHO-K1, MDCK 또는 HEK293 셀라인이다. 적합한 세포는 또한 예를 들면 배아 줄기 세포, 유도된 다능 줄기 세포, 조혈 줄기 세포, 뉴런 줄기 세포 및 간엽 줄기 세포와 같은 줄기 세포를 포함한다.

본원에 기술된 징크 핑거 단백질을 포함하는 단백질을 전달하는 방법은 예를 들면 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기술되어 있고, 그것들의 개시는 본원에 전체 내용이 참조로 포함된다.

본원에 기술된 징크 핑거, TALE 또는 CRISPR/Cas 단백질은 또한 하나 또는 그 이상의 징크 핑거, TALE 또는 CRISPR/Cas 단백질(들)을 코드화하는 서열을 함유하고 있는 벡터를 사용하여 전달될 수 있다. 어떠한 벡터 시스템이든지, 예를 들면 그것들에 한정되는 것은 아니지만, 플라스미드 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 폭스바이러스 벡터; 헤르페스바이러스 벡터 및 아데노-관련 바이러스 벡터 등이 사용될 수 있다. 또한 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 참조 (이것들 모두 전체 내용이 본원에 참조로 포함됨). 나아가, 이들 벡터 중 어느 것이든지 하나 또는 그 이상의 징크 핑거 또는 TALE 단백질-코드화 서열을 포함할 수 있다. 그러므로, 하나 또는 그 이상의 ZFP, TALE 또는 CRISPR/Cas 단백질이 세포 안에 도입될 때, ZFP, TALE 또는 CRISPR/Cas 단백질을 코드화하는 서열들은 동일한 벡터 상에서 또는 상이한 벡터 상에서 수행될 수 있다. 다중 벡터가 사용될 때, 각각의 벡터는 하나 또는 다수의 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 서열을 포함할 수 있다.

종래의 바이러스 및 비-바이러스 기초 유전자 전달 방법이 엔지니어링된 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산을 세포 (예컨대 포유류 세포) 및 표적 조직에 도입시키기 위해 사용될 수 있다. 그런 방법은 또한 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산을 세포에 시험관 내에서 투여하기 위해 사용될 수 있다. 특정 구체예에서, ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산은 생체 내 또는 생체 외 유전자 치료법 용도에 대해 투여된다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, 네이키드 핵산 및 리포솜 또는 폴록사머와 같은 전달 비히클과 복합체를 형성한 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하는데, 그것들은 세포에 전달된 후에 에피솜성 또는 통합된 게놈 중 어느 하나를 가진다. 유전자 치료법 과정을 개관하기 위해서는 Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and B?hm (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994) 참조함.

핵산의 비-바이러스 전달 방법은 일렉트로포레이션, 리포펙션, 마이크로주사, 유전자총 (bioblastic), 비로좀, 리포솜, 면역리포솜, 다가 양이온 또는 지질:핵산 포합체, 네이키드 DNA, 네이키드 RNA, 인공 비리온 및 DNA의 제제-증강된 흡수를 포함한다. 예컨대 Sonitron 2000 시스템 (Rich-Mar)을 사용한 소노포레이션이 또한 핵산 전달을 위해 사용될 수 있다. 바람직한 구체예에서, 하나 또는 그 이상의 핵산이 mRNA로서 전달된다. 또한 바람직한 것은 번역 효율 및/또는 mRNA 안정성을 증가시키기 위하여 캡핑된 mRNA를 사용하는 것이다. 특히 바람직한 것은 ARCA (안티-반전 캡 유사체) 캡 또는 그것의 변이체이다. 미국 특허 US7074596 및 US8153773 참조 (본원에 참조로 포함됨).

추가의 예시적인 핵산 전달 시스템은 Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, Maryland), BTX 분자 전달 시스템 (Holliston, MA) 및 Copernicus Therapeutics Inc., (see for example US6008336)에 의해 제공되는 것들을 포함한다. 리포펙틴은 예컨대 미국 특허 번호 5,049,386; 4,946,787; 및4,897,355에 기술되어 있고 리포펙틴 시약은 상업적으로 시판된다 (예컨대 Transfectam^TM 및 Lipofectin^TM 및 Lipofectamine^TM RNAiMAX). 폴리뉴클레오티드의 효과적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 Felgner, WO 91/17424, WO 91/16024의 것을 포함한다. 전달은 세포에 (생체 외 투여) 또는 표적 조직에 (생체 내 투여) 이루어질 수 있다.

면역지질 복합체와 같은 표적화된 리포솜을 포함하는 지질:핵산 복합체의 제조는 기술분야의 숙련자에게 잘 알려져 있다 (예컨대 Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther . 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem . 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Pat. Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

추가의 전달 방법은 EnGeneIC 전달 비히클 (EDV)로 전달될 핵산을 패키징하는 것의 사용을 포함한다. 이들 EDV는 항체의 한 쪽 아암은 표적 조직에 대한 특이성을 가지고 다른 아암은 EDV에 대한 특이성을 가지고 있는 이중특이성 항체를 사용하여 표적 조직에 특이적으로 전달된다. 항체는 EDV를 표적 세포 표면으로 가져가고 그런 다음 EDV는 식세포작용에 의해 세포 안으로 들어가게 된다. 일단 세포 안에 들어가면, 내용물이 방출된다 (acDiarmid et al (2009) Nature Biotechnology 27(7):643 참조).

엔지니어링된 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산의 전달을 위한 RNA 또는 DNA 바이러스 기초 시스템의 사용은 신체의 특이적인 세포에 대해 바이러스를 표적화하고 핵에 대해 탑재된 바이러스를 왕래시키기 위한 고도로 진화된 과정의 장점을 가진다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나 (생체 내) 또는 시험관 내에서 세포를 치료하기 위해 사용되거나 변형된 세포들이 환자에게 투여되기도 한다 (생체 외). ZFP, TALE 또는 CRISPR/Cas 시스템을 전달하기 위한 종래의 바이러스 기저 시스템은 그것들에 한정되는 것은 아니지만, 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련, 백시니아 및 헤르페스 심플렉스 바이러스 벡터를 포함한다. 숙주 게놈에서의 통합은 레트로바이러스, 렌티바이러스 및 아데노-관련 바이러스 유전자 전달 방법을 사용하여 가능하며, 자주 삽입된 이식유전자의 장기간 발현을 초래한다. 추가로, 높은 유전자도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.

레트로바이러스의 향성은 외래 외피 단백질을 통합하고, 표적 세포의 잠재적인 표적 집단을 확장시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분할 세포를 형질도입하거나 감염시킬 수 있는 레트로바이러스 벡터이고 전형적으로 고바이러스 역가를 유발한다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 좌우된다. 레트로바이러스 벡터는 6 내지 10 kb까지의 외래 서열에 대한 패키징 능력을 가지는 cis-작용 긴 말단 반복으로 구성된다. 최소 cis-작용 LTR은 벡터의 복제 및 패키징에 충분하며, 그런 다음 그것들은 영구적인 이식유전자 발현을 제공하기 위해 표적 세포 안에 치료 유전자를 통합시키는 데 사용된다. 광범위하게 사용되는 레트로바이러스 벡터로는 마우스 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역결핍 바이러스 (SIV), 인간 면역결핍 바이러스 (HIV) 및 그것들의 조합을 기초로 한 레트로바이러스 벡터들이다 (예컨대 Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol . 66:1635-1640 (1992); Sommerfelt et al., Virol . 176:58-59 (1990); Wilson et al., J. Virol . 63:2374-2378 (1989); Miller et al., J. Virol . 65:2220-2224 (1991); PCT/US94/05700 참조).

일시적인 발현이 바람직한 용도에서, 아데노바이러스 기초 시스템이 사용될 수 있다. 아데노바이러스 기초 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있고 세포 분할을 필요로 하지 않는다. 그런 벡터를 사용하여 고역가 및 고수준의 발현이 얻어질 수 있다. 이 벡터는 상대적으로 단순한 시스템에서 다량으로 생성될 수 있다. 아데노-관련 바이러스 ("AAV") 벡터는 또한 예컨대 핵산 및 펩티드의 시험관 내 제조에서, 및 생체 내 및 생체 외 유전자 요법 과정에서 표적 핵산을 사용하여 세포를 형질전환시키기 위해 사용된다 (예컨대 West et al., Virology 160:38-47 (1987); U.S. Patent No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin . Invest. 94:1351 (1994 참조). 재조합 AAV 벡터의 구성은 많은 공보물에서, 이를테면 미국 특허 번호 5,173,414; Tratschin et al., Mol . Cell. Biol . 5:3251-3260 (1985); Tratschin, et al., Mol . Cell. Biol . 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol . 63:03822-3828 (1989)에서 기술되어 있다.

적어도 6가지의 바이러스 벡터 접근법이 현재 임상 실험에서 유전자 전달에 활용될 수 있는데, 그것들은 형질도입 제제를 생성하기 위해 헬퍼 셀라인에 삽입된 유전자들에 의해 결함 벡터의 보충을 포함하는 접근법들을 활용한다.

pLASN 및 MFG-S가 임상 실험에 사용되어 온 레트로바이러스 벡터의 실례들이다 (Dunbar et al., Blood 85:3048-305 (1995); Kohn et al., Nat. Med. 1:1017-102 (1995); Malech et al., PNAS 94:22 12133-12138 (1997)). PA317/pLASN은 유전자요법 실험에 첫번 째로 사용된 치료용 벡터였다 (Blaese et al., Science 270:475-480 (1995)). MFG-S 패키징된 벡터에 대해 50% 이상의 형질도입 효율이 관찰되었다 (Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997)).

재조합 아데노-관련 바이러스 벡터 (rAAV)는 결함 및 비병원성 파르보바이러스 아데노-관련 유형 2 바이러스를 기초로 한 전도유망한 대체 유전자 전달 시스템이다. 모든 벡터는 이식유전자 발현 카세트 양옆의 AAV 145 염기쌍 반전된 말단 반복만을 보유하는 플라스미드로부터 유도된다. 형질도입된 세포의 게놈 안으로의 통합으로 인한 효과적인 유전자 전달 및 안정한 이식유전자 전달은 이 벡터 시스템에 대한 핵심적인 특징이다 (Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther . 9:748-55 (1996)). 다른 AAV 혈청형, 이를테면 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8AAV 8.2, AAV9 및 AAV rh10 및 위형 AAV, 예컨대 AAV2/8, AAV2/5 및 AAV2/6 또한 본 발명에 따라 사용될 수 있다.

복제-결핍 재조합 아데노바이러스 벡터 (Ad)는 고역가로 생성될 수 있고 많은 상이한 세포 유형을 쉽게 감염시킬 수 있다. 대부분의 아데노바이러스 벡터는 이식유전자가 Ad E1a, E1b 및/또는 E3 유전자를 대체하고; 계속해서 복제 결핍 벡터가 결실된 유전자 기능을 트란스로 공급하는 인간 293 세포에서 증식되도록 엔지니어링된다. Ad 벡터는 생체 내에서 간, 신장 및 근육에서 발견되는 것과 같은 비분할, 분화된 세포를 포함하여 다중 유형의 조직을 형질도입시킬 수 있다. 종래의 Ad 벡터는 커다란 운반 능력을 가진다. Ad 벡터의 임상 실험에서의 사용의 한 실례는 근육내 주사로 항종양 면역화를 하기 위한 폴리뉴클레오티드 치료법을 포함하였다 (Sterman et al., Hum. Gene Ther . 7:1083-9 (1998)). 임상 실험에서 유전자 전달을 위한 아데노바이러스 벡터의 사용의 추가의 실례는 다음을 포함한다: Rosenecker et al., Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther . 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther . 7:1083-1089 (1998).

세포 패키징은 숙주 세포를 감염시킬 수 있는 바이러스 입자들을 형성하기 위해 사용된다. 그런 세포들은 아데노바이러스를 패키징하는 293 세포 및 레트로바이러스를 패키징하는 Ψ2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용된 바이러스 벡터는 보통 바이러스 입자 안으로 핵산 벡터를 패키지하는 생산자 셀라인에 의해 생성된다. 벡터는 전형적으로 숙주 안으로의 패키징 및 후속적인 통합 (적용할 수 있는 경우)에 필요한 최소 바이러스 서열을 함유하고, 다른 바이러스 서열은 발현될 단백질을 코드화하는 발현 카세트에 의해 대체된다. 생략된 바이러스 기능은 패키징 셀라인에 의해 트란스로 공급된다. 예를 들어, 유전자 요법에 사용된 AAV 벡터는 전형적으로 숙주 게놈 안으로의 패키징 및 통합에 필요한 AAV 게놈으로부터의 반전된 말단 반복 (ITR) 서열만을 가진다. 바이러스 DNA는 셀라인에 패키지되고, 그것은 다른 AAV 유전자, 즉 rep 및 cap을 코드화하지만 ITR 서열이 결핍된 헬퍼 플라스미드를 함유한다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열의 결핍으로 인해 상당한 양으로 패키지되지 않는다. 아데노바이러스로의 오염은 예컨대 아데노바이러스가 AAV보다 민감하게 되는 열처리에 의해 감소될 수 있다.

많은 유전자 요법 적용에서, 유전자 요법 벡터가 특정 조직 유형에 대해 고도의 특이성으로 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 바이러스의 외면 상에서 바이러스 코트 단백질과의 융합 단백질로서 리간드를 발현함으로써 주어진 세포 유형에 대한 특이성을 가지도록 변형될 수 있다. 리간드는 관심의 세포 유형 상에 존재하는 것으로 알려져 있는 수용체에 대한 친화성을 가지도록 선택된다. 예를 들어 Han 등은 몰로니 마우스 백혈병 바이러스가 gp70에 융합된 인간 헤레굴린을 발현하도록 변형될 수 있고, 재조합 바이러스는 인간 상피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다고 보고하였다 (Han et al., Proc. Natl . Acad . Sci . USA 92:9747-9751 (1995)). 이 원칙은 다른 바이러스-표적 세포쌍으로 연장될 수 있는데, 그때 표적 세포는 수용체를 발현하고 바이러스는 세포-표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 필라멘트형 파지는 실제로 어떠한 선택된 세포 수용체에 대한 특이적인 결합 친화성을 가지는 항체 단편들 (예컨대 FAB 또는 Fv)을 나타내도록 엔지니어링될 수 있다. 비록 상기 설명이 주로 바이러스 벡터에 적용되긴 하지만, 동일한 원칙이 비바이러스 벡터에도 적용될 수 있다. 그런 벡터는 특이적인 표적 세포에 의한 흡수를 선호하는 특이적인 흡수 서열을 함유하도록 디자인될 수 있다.

유전자 요법 벡터는 개별적인 환자에게 투여됨으로써, 전형적으로 전신성 투여에 의해 (예컨대 정맥 내, 복강 내, 근육 내, 피하 또는 두개 내 주입) 또는 아래에서 기술되는 것과 같이 국소 적용에 의해 생체 내로 전달될 수 있다. 다르게는, 벡터는 생체 외에서 세포, 예컨대 개별적인 환자로부터 이식된 세포 (예컨대 림프구, 골수 흡입, 조직 생검) 또는 보편적인 공여 조혈 줄기 세포에 전달되고, 이어서 통상적으로 그 벡터가 통합될 세포에 대한 선택 후에 그 세포들이 환자에게 재이식될 수 있다.

진단, 연구를 위한 또는 유전자 요법을 위한 생체 외 세포 트랜스펙션 (예컨대 숙주 유기체 안으로의 트랜스펙션된 세포의 재-주입을 통한)은 기술분야의 숙련자들에게 잘 알려져 있다. 바람직한 구체예에서, 세포는 대상 유기체로부터 분리되고, ZFP, TALE 또는 CRISPR/Cas 시스템 핵산 (유전자, cDNA 또는 mRNA)으로 트랜스펙션되며, 대상 유기체 (예컨대 환자) 안으로 다시 재주입된다. 바람직한 구체예에서, 하나 또는 그 이상의 핵산은 mRNA로서 전달된다. 또한 바람직한 것은 번역 효율 및/또는 mRNA 안정성을 증가시키기 위하여 캡핑된 mRNA를 사용하는 것이다. 특히 바람직한 것은 ARCA (안티-반전 캡 유사체) 캡 eh는 그것의 변이체이다. 미국 특허 번호 7,074,596 및 8,153,773 참조 (전체 내용이 본원에 참조로 포함됨). 생체 외 트랜스펙션에 적합한 다양한 세포 유형들은 기술분야의 숙련자들에게 (예컨대 Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) 참조) 및 환자로부터 세포를 분리하고 배양하는 방법의 논의에 대해 본원에 인용된 참고문헌들에 잘 알려져 있다.

한 구체예에서, 줄기 세포는 세포 트랜스펙션 및 유전자 요법에 대해 생체 외 과정에 사용된다. 줄기 세포를 사용하는 것에 대한 장점은 그것이 시험관 내에서 다른 세포 유형으로 분화될 수 있거나 또는 그것이 골수에 이식될 수 있을 포유류 (예컨대 세포의 공여자)안으로 도입될 수 있다는 것이다. CD34+ 세포를 시험관 내에서 GM-CSF, IFN-γ 및 TNF-α와 같은 사이토킨을 사용하여 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법은 알려져 있다 (Inaba et al., J. Exp . Med . 176:1693-1702 (1992) 참조).

줄기 세포는 공지된 방법들을 사용하여 형질도입 및 분화를 위해 분리된다. 예를 들어, 줄기 세포는 골수 세포를 원하지 않는 세포, 예컨대 CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구) 및 Iad (분화된 항원 제공 세포)에 결합하는 항체들로 패닝함으로써 골수 세포로부터 분리된다 (Inaba et al., J. Exp . Med. 176:1693-1702 (1992) 참조).

변형된 줄기 세포는 또한 일부 구체예에서 사용될 수 있다. 예를 들어, 아폽토시스에 대해 내성으로 만들어진 뉴런 줄기 세포는 줄기 세포가 또한 발명의 ZFP TF를 함뉴하는 치료 조성물로서 사용될 수 있다. 아폽토시스에 대한 내성은 예를 들면 줄기 세포에서 BAX- 또는 BAK-특이적 TALEN 또는 ZFN (미국 특허 공보 번호 20100003756 참조), 또는 카스파제가 파괴된 것들을 사용하고, 다시 예를 들면 카스파제-6 특이적 ZFN을 사용하여 BAX 및/또는 BAK를 녹아웃시킴으로써 발생할 수 있다. 이들 세포는 돌연변이 또는 야생형 Htt를 조절하는 것으로 알려져 있는 ZFP TF 또는 TALE TF로 트랜스펙션될 수 있다.

치료적 ZFP 핵산을 함유하고 있는 벡터들 (예컨대 레트로바이러스, 아데노바이러스, 리포솜 등)은 또한 생체 내에서 세포들의 형질도입을 위해 유기체에 직접 투여될 수 있다. 다르게는, 네이키드 DNA가 투여될 수 있다. 투여는 보통 분자를 궁극적으로 혈액 또는 조직 세포와 접촉하도록 도입하기 위해 사용된 경로들, 이를테면 그것들에 한정되는 것은 아니지만 주사, 주입, 국소 적용 및 일렉트로포레이션 중 어느 것에 의해서 이루어진다. 그런 핵산을 투여하는 적합한 방법들이 활용가능하며 기술분야의 숙련자들에게 잘 알려져 있고, 비록 한 가지 이상의 경로가 특정 조성물을 투여하기 위해 사용될 수 있지만, 특정 경로가 자주 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.

DNA의 조혈 줄기 세포 안으로의 도입을 위한 방법들은 예를 들면 미국 특허 번호 5,928,638에 개시된다. 이식유전자의 조혈 줄기 세포, 예컨대 CD34+ 세포 안으로의 도입에 유용한 벡터는 아데노바이러스 타입 35을 포함한다.

이식유전자의 면역 세포 (예컨대 T-세포) 안으로의 도입에 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 예를 들면 Ory et al. (1996) Proc . Natl . Acad. Sci . USA 93:11382-11388; Dull et al. (1998) J. Virol . 72:8463-8471; Zuffery et al. (1998) J. Virol . 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222 참조.

약학적으로 허용되는 담체들이 투여되는 특정 조성물에 의해 부분적으로, 뿐만 아니라 그 조성물을 투여하기 위해 사용된 특정 방법에 의해 측정된다. 따라서, 하기에서 기술되는 것과 같이, 활용될 수 있는 약학 조성물의 적합한 제형은 광범위하다 (예컨대 Remington's Pharmaceutical Sciences, 17th ed., 1989 참조).

상기 주지된 것과 같이, 개시된 방법 및 조성물은 그것들에 한정되는 것은 아니지만 원핵 세포, 진균 세포, 고세균 세포, 식물 세포, 곤충 세포, 동물 세포, 척추동물 세포, 포유류 세포 및 인간 세포를 포함하여 어떠한 유형의 세포에든 사용될 수 있다. 단백질 발현에 적합한 셀라인은 기술분야의 숙련자들에게 알려져 있고, 그것들에 한정되는 것은 아니지만 COS, CHO (예컨대 CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예컨대 HEK293-F, HEK293-H, HEK293-T), perC6, 스포도프테라 푸기페르다 (Sf)와 같은곤충 세포 및 사카로마이세스, 피스키아 및 스키조사카로마이세스와 같은 진균 세포를 포함한다. 이들 셀라인의 자손, 변이체 및 유도체들 또한 사용될 수 있다.

적용

개시된 조성물 및 방법들은 그것들에 한정되는 것은 아니지만 치료 및 연구 용도를 포함하여 Htt 대립유전자를 변조하는 것이 바람직한 어떠한 용도에든지 사용될 수 있다.

Htt를 억압하는 ZFP TF 또는 TALE TF가 치료제로서 사용될 수 있는 질병 및 상태는 그것에 한정되는 것은 아니지만 헌팅턴병을 포함한다. 추가로, Htt의 돌연변이 대립유전자에 대해 특이적인 ZFN 또는 TALEN을 포함하는 방법 및 조성물은 헌팅턴병의 치료를 위한 치료제로서 사용될 수 있다.

HD Htt 대립유전자를 억압하는 ZFP-TF 또는 TALE TF는 또한 그것에 한정되는 것은 아니지만 GDNF 및 BDNF를 포함하여 신경영양 인자를 활성화하는 ZFP-TF 또는 TALE TF와 함께 사용될 수 있다. 이들 ZFP 또는 TALE (또는 이들 ZFP 또는 TALE을 코드화하는 폴리뉴클레오티드)은 동시에 투여되거나 (예컨대 동일한 약학 조성물로) 또는 어떠한 순서로든 차례로 투여될 수 있다.

헌팅턴병을 치료하기 위한 방법 및 조성물은 또한 줄기 세포 내의 Htt 대립유전자의 돌연변이 복사물이 Htt-특이적 ZFN 또는 TALEN을 사용하여 야생형 Htt 대립유전자로 변형되어 있는 줄기 세포 조성물을 포함한다.

발명의 방법 및 조성물은 또한 시험관 내 및 생체 내 모델, 예를 들면 트라이뉴클레오티드 반복 장애의, 이들 장애의 연구를 허용하는 동물 모델의 디자인 및 이식에 유용하다. 적합한 시험관 내 모델의 비-제한적 실례는 섬유아세포를 포함하여, 어떠한 유기체로부터의 세포 또는 셀라인을 포함한다. 동물 모델로서 사용하기에 적합한 동물들의 비-제한적인 실례는 무척추동물 (C. 엘레간스, 드로조필라), 설치류 (예컨대 래트 또는 마우스), 영장류 (예컨대 비-인간 영장류)를 포함한다.

본원에 기술된 조성물 (예컨대 단백질 및/또는 폴리뉴클레오티드)은 단독으로 또는 다른 적합한 성분들 (예컨대 리포솜, 나노입자 또는 기술분야에 공지되어 있는 다른 성분들)과 함께, 흡입을 통해 투여될 에어로솔 제형으로 만들어질 수 있다 (즉 그것들은 "분무"될 수 있다). 에어로솔 제형은 가압된 허용된 추진제, 예컨대 다이클로로다이플루오로메탄, 프로판, 질소 등의 안에 배치될 수 있다. 비경구 투여, 예컨대 예를 들면 정맥 내, 근육 내, 피부 내 및 피하 경로에 의한 투여에 적합한 제형은 항산화제, 완충제, 세균 발육 저지제 및 의도된 수용체의 혈액과 등장성인 제형을 만드는 용질을 함유할 수 있는 수성 및 비-수성, 등장성 멸균 주사 용액, 및 현탁제, 가용화제, 농축제, 안정화제 및 보존제를 포함할 수 있는 수성 및 비-수성 멸균 현탁액을 포함한다. 조성물은 예를 들면 정맥 내 주입에 의해, 경구로, 국소적으로, 복강 내로, 방관 내로 또는 척추강 내로 투여될 수 있다. 화합물의 제형은 단위-용량 또는 다중-용량 밀봉된 용기, 예컨대 앰플 및 바이알로 제공될 수 있다. 주사 용액 및 현탁액은 앞서 기술된 종류의 멸균 분말, 과립 및 정제로부터 제조될 수 있다.

환자에게 투여되는 용량은 시간의 경과에 따라 환자에서 유익한 치료적 반응을 이루기에 충분해야 한다. 용량은 사용된 특정 Htt-결합 분자의 효능 및 K_d, 및 환자의 상태, 뿐만 아리나 치료될 환자의 체중 또는 표면적에 의해 결정된다. 용량의 크기는 또한 특정 환자에서 특정 화합물 또는 벡터의 투여에 수반하는 어떠한 해로운 부작용의 존재, 성질 및 정도에 의해서도 결정된다.

실시예

실시예 1: Htt - 표적화된 징크 핑거 단백질 전사 인자 ( ZFP - TF ) 및 ZFN의 디자인 및 구성

Htt에 대해 표적화된 징크 핑거 단백질을 본질적으로 미국 특허 번호 6,534,261에서 기술한 대로 엔지니어링하였다. 표 1A 및 1B는 예시적인 Htt-표적화된 ZFP의 DNA 결합 도메인의 인식 나선을 나타낸 한편, 표 2A 및 2B는 이들 ZFP의 표적 서열을 나타낸다.

CAG 반복 영역 내의 부위들을 완전히 표적화하기 위하여 하나의 연속적인 징크 핑거 어레이를 가지는 ZFP를 디자인하였다 (도 1b). 그런 ZFP는 더 높은 친화성 및/또는 더 높은 순 점유율 (net occupancy)을 가지는 더 긴 돌연변이 트랙트에 결합할 수 있어서, 돌연변이 대립유전자의 선택적 억압을 이룰 수 있다. 또한 부분적으로 또는 전체적으로 CAG 영역 외부에 배치되고 (도 1a), 따라서 야생형 및 돌연변이 대립유전자에 동등하게 결합하고 둘 다의 대립유전자로부터의 발현을 유사한 효율로 조절할 부위들을 표적화하는 ZFN을 디자인하였다. CAG 영역을 인식하는 징크 핑거 단백질을 디자인할 때, 하나- 및 두-핑거 모듈의 세트를 '믹스 앤드 매치' 조합에 사용할 수 있다. 그런 모듈을 아래의 표 2C에 나타낸다.

다량체화 ZFP TF를 또한 상기에서 기술한 것과 같이 구성하되, 단 벡터는 또한 ZFP TF를 코드화하는 서열에 작동가능하게 연결된 트라이뉴클레오티드 반복의 트랙트를 따라 발현된 단백질의 다량체화를 가능하게 하는 하나 또는 그 이상의 단백질 상호작용 도메인 (또한 이량체화 또는 단백질 상호작용 도메인으로도 불림)을 코드화하는 서열들을 함유한다. 도 1d 및 도 10 참조. 표 3은 CAG 반복 영역에 대해 표적화된 ZFP와 함께 사용되는 이량체와 도메인 디자인을 나타낸다. 도 10c는 이량체화 징크 핑거 (DZ), DZ1 내지 DZ4 사이의 상호작용을 통해 다량체화하도록 디자인된 4개의 ZFP 단량체 스캐폴드의 단백질 서열을 나타낸다. 디자인은 Mol . Syst. Biol. (2006) 2:2006.2011에 기술된 작업을 기초로 한다. 도 10d는 코일형-코일 (CC), CC1 내지 CC7 사이의 상호작용을 통해 다량체화하도록 디자인된 7개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. CC#1의 디자인은 J. Am. Chem . Soc. (2001), 123:3151-3152에 기술된 작업을 기초로 하는 한편, CC#2, CC#3 및 CC#4는 J. Am. Chem . Soc. (2000), 122:5658-5659를 기초로 한다. CC 및 DZ 도메인은 CAG 트랙트의 주요 홈 내에서 ZFP가 중합되는 것을 허용한다 (도 10b에 도시됨). 핑거 어레이 및 적절한 결합 특성을 가지는 이량체화 도메인을 선택함으로써, 효율적인 결합은 질병 대립유전자의 확장된 CAG 트랙트에 대해서만 일어날 것이다.

핵 정위 서열, Htt 대립유전자에 대해 표적화된 엔지니어링된 징크 핑거 DNA-결합 도메인 (표 1A 및 1B), 및 인간 KOX1 단백질로부터의 KRAB 억압 도메인을 포함하고 있는 융합 단백질로서 ZFP-TF를 구성하였다. 도 1a, 1b 및 1d 참조. 디자인된 DNA-결합 도메인들은 9 내지 18 염기쌍 서열을 인식하는, 3 내지 6개의 핑거 모듈을 함유한다 (표 2A 및 2B). ZFP 인식 나선들에 의해 접촉되는 표적 부위의 뉴클레오티드들은 대문자로 표시되고; 비-접촉 뉴클레오티드들은 소문자로 표시된다. 두 개의 ZFP DNA 결합 도메인이 가요성 링커와 융합되고 KRAB 억압 도메인과 융합되어 있는 ZFP-ZFP-TF 분자들을 또한 구성하였다 (도 1e). DNA 결합 도메인들을 표 2A 및 2B로부터 선택하였다.

실시예 2: 인간 및 마우스 세포에서 Htt의 두 대립유전자의 억압

Htt의 두 대립유전자 (비-대립유전자-특이적)를 억압하기 위하여, ZFP를 Htt 프로모터 및 엑손 1 영역에 결합하도록 디자인하였는데, 그때 표적 부위는 완전하게 CAG 반복 내에 있지 않았다. 도 1a 참조. ZFP TF를 억압하는 Htt의 활성을 시험하기 위하여, ZFP TF를 인간 세포 안에 트랜스펙션하였고, Htt의 발현을 실시간 RT-PCR을 사용하여 모니터링하였다.

인간 HEK293 세포 (Graham et al (1977) J Gen Virol 36:59-74)를 10% FBS가 첨가된 DMEM에서 배양하고 1e⁵ 세포를 표시된 ZFP-KOX 융합을 코드화하는 플라스미드 DNA 1 μg을 사용하여 제조자의 지시를 따라 Amaxa Nucleofector®에 의해 트랜스펙션하였다.

트랜스펙션된 세포를 2일 동안 인큐베이션하고, 내인성 인간 헌팅틴 (Htt) 및 표준화 대조 베타-액틴 (ACTB)을 실시간 PCR에 의해 각각 Hs00918176_m1 및 4352935E 프라이머 및 프로브 (Applied Biosystems)를 사용하여 표준 프로토콜을 따라 분석하였다. Htt 수준을 mock-트랜스펙션된 샘플의 그것 (1로서 세팅함)에 대해 표준화된 Htt/ACTB 비율로서 표시하였다.

도 2a에서 알 수 있는 것과 같이, Htt-표적화된 ZFP는 Htt 발현을 억압하였다. 웨스턴 블롯 분석을 표준 프로토콜을 사용하여 수행하여 Htt 단백질 수준의 감소를 확인하였다 (도 2b); p65 단백질을 로딩 대조표준으로서 사용하였다.

마우스 Htt-특이적 ZFP TF 리프레서를 Neuro2A 세포 (Klebe & Ruddle (1969) J. Cell Biol. 43: 69A) 안으로 Lipofectamine® 2000 키트 (Invitrogen)를 사용하여 제조자의 지시를 따라 일시적으로 트랜스펙션하였다. mHtt 및 ACTB mRNA 수준을 트랜스펙션 후 48시간 후에 ABI Taqman® 프라이머/프로브 세트 Mm01213820 m1 및 4352933E를 각각 사용하여 측정하였다. ZFP 트랜스펙션된 샘플에 대한 mHtt/ACTB 비율을 GFP 대조표준의 그것 (1로서 세팅함)에 대해 표준화하였다.

도 2c에서 알 수 있는 것과 같이, ZFP는 마우스 Htt 발현을 억압하였다. 또한, 마우스 Htt-특이적 ZFP-TF 리프레서는 Htt 녹-인 마우스로부터 유도된 불멸화된 선조 세포, STHdh(Q111/Q7)에서 마우스 Htt를 억압할 수 있다 (Trettel et al. (2000) Hum. Mol . Genet 9 : 2799 -2809). 도 2d 및 2e 참조. 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 생성하고, 이들 mRNA의 0.1, 0.5 또는 2 μg을 상기 기술한 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하였다. 세포를 트랜스펙션 후 48시간 후에 상기 기술한 것과 같이 mHtt 및 ACTB 발현 분석을 위해 수확하였다. Neuro2A 세포에서의 그것과 비교하여 선조 세포에서 더 많은 유의미한 억압을 관찰하였고, 그것은 선조 세포에서의 mRNA 트랜스펙션을 통해 이루어진 증강된 트랜스펙션 효율의 결과일 수 있다.

실시예 3: 인간 및 마우스 세포에서 돌연변이 Htt의 선택적 억압

돌연변이 Htt 대립유전자의 선택적 억압을 이루기 위하여, ZFP를 CAG 반복 내에서 결합하도록 디자인하였다. 도 1b는 그런 ZFP의 한 유형을 도시하는데, 억압 도메인 (예컨대 KOX1로부터의 KRAB 도메인)에 연속적인 징크 핑거 어레이가 연결되어 있고; 이들 ZFP는 적절한 친화성으로 디자인될 수 있어서 전사 억압으로부터 요구되는 임계값 점유율이 확장된 CAG 반복에 대해 쉽게 수립될 수 있다. 도 1c, 1d 및 1e는 확장된 CAG 반복에 대해 특이적인 결합을 허용할 수 있는 ZFP 디자인의 3가지의 다른 실례를 도시한다.

도 1b에 예시된 것과 같이 디자인된 ZFP를 HEK293 세포에 도입시키고 Htt 발현을 평가하였다. ZFP-코드화 구성물을 HEK293 세포에 FugeneHD를 사용하여 표준 프로토콜을 사용하여 트랜스펙션하였다. 트랜스펙션 후 72시간 후에 총 RNA를 분리하고 내부 대조 베타-액틴 (ACTB)에 대한 내인성 인간 헌팅틴 (Htt)의 수준을 실시간 PCR에 의해 Hs00918176_m1 및 4352935E 프라이머 및 프로브 (Applied Biosystems)를 각각 사용하여 분석하였다. ZFP 트랜스펙션된 샘플에 대한 Htt/ACTB 비율을 GFP 대조표준의 그것 (1로서 설정함)에 대해 표준화하였다.

도 3a에서 알 수 있는 것과 같이, HEK293 세포에서 상부 또는 하부 가닥 중 어느 하나에 대해 CAG 반복을 결합시키기 위해 디자인된 (도 1b) ZFP 리프레서 (KRAB 억압 도메인과 융합됨)는 Htt 발현을 효과적으로 억압하였다. 도 3a는 발현이 이중 트랜스펙션에서 측정되고 (도면에서 별도의 막대) 다중 실시간 PCR 분석이 완료되는 (오차 막대) 전사의 리프레서를 도시한다. 개별적인 ZFP에 의한 상이한 수준의 억압은 그것들이 CAG 반복 영역에 대해 상이한 친화성을 가지는 것을 시사한다. HEK293 세포에서 Htt 대립유전자가 16 및 17 CAG를 가지기 때문에, 이 결과는 또한 "더 약한" ZFP, 예컨대 30640이 야생형 (예상밖의) CAG 반복 길이를 가지는 Htt 대립유전자를 효과적으로 억압하지 못하는 것을 시사한다.

30640과 같은 ZFP가 확장된 CAG 반복을 가지는 Htt 대립유전자의 전사를 억압할 수 있는지의 여부를 시험하기 위하여, 상이한 CAG 반복 길이를 함유하는 Htt 프로모터/엑손 1 단편에 의해 제어된 루시페라제 리포터를 구성하였다. 먼저, 인간 Htt 프로모터/엑손1 단편을 HEK293 게놈 DNA로부터 다음의 전방 프라이머:

5' GAAGATCTCACTTGGGGTCCTCAGGTCGTGCCGAC (SEQ ID NO:139)

및 다음의 역 프라이머:

5' GTATCCAAGCTTCAGCTTTTCCAGGGTCGCCTAGGCGGTCT (SEQ ID NO:140)를 사용하여 증폭시켰다.

전방 프라이머는 BglII 부위를 도입시키고, 역 프라이머는 Htt의 첫 번째 ATG를 TAG로 변화시켜서 AvrII 부위를 생성하고, 또한 HindIII 부위를 포함한다. PCR 생성물을 BglII 및 HindIII로 소화시키고 동일한 효소로 소화된 pRL-TK 벡터 (Promega)로 결찰시켜서 구성물 pRL-Htt를 제조하였다. 그런 다음 인간 Htt 엑손1 단편 (코딩 서열에서 첫 번째 ATG를 뺌)을 HEK293 게놈 DNA 또는 확장된 CAG 반복을 가지는 HD 환자로부터의 게놈 DNA로부터 다음의 전방 프라이머:

5' GCCTAGGCGACCCTGGAAAAGCTGATGAAGGCC (SEQ ID NO:141)

및 다음의 역 프라이머:

5' GTATCCAAGCTTGAGCTGCAGCGGGCCCAAACTCACG (SEQ ID NO:142)를 사용하여 증폭시켰다.

전방 프라이머는 AvrII 부위를 도입시키고, 역 프라이머는 HindIII 부위를 도입시킨다. PCR 생성물을 AvrII 및 HindIII로 소화시키고 동일한 효소들로 소화시켜 놓은 pRL-Htt 벡터에 결찰시켰다. 10, 17, 23 또는 47 CAG 반복을 가지는 클론 (pRL-Htt-CAG(x))을 서열화에 의해 확인하였다.

pRL-Htt-CAG(x) 리포터 (300 ng) 및 pGL3-프로모터 리포터 (100ng, 표준화 대조표준으로서 사용함, Progema)를 100 ng의 ZFP 30640 발현 벡터를 사용하거나 사용하지 않고 HEK293 세포안으로 트랜스펙션하였다. 반딧불이 (pGL 리포터) 및 레닐라 (pRL 리포터) 루시페라제 활성을 트랜스펙션 후 24시간 후에 측정하였다. 레닐라 루시페라제 수준을 동일한 트랜스펙션 샘플로부터의 반딧불이 루시페라제 수준에 대해 표준화하고, 추가로 "리포터 단독" 샘플의 레닐라/반딧불이 비율에 대해 표준화하였다.

도 3b에서 알 수 있는 것과 같이, ZFP-TF 30640에 의한 루시페라제 리포터의 억압은 CAG 반복의 길이에 따라 증가하고, 그것은 30640의 DNA 결합 친화성에 유사한 DNA 결합 친화성을 가지는 ZFP가 확장된 CAG 반복을 통해 Htt 프로모터 활성을 억압할 수 있고, 억압의 수준은 CAG 반복 길이에 좌우된다는 것을 시사한다.

도 3c는 도 3b에서와 유사한 실험을 보여주는데, 단 "강력한" ZFP-TF 30657을 또한 시험하였고, 30640 및 30657 둘 다 표시된 다중 용량에서 시험하였다. 모든 용량 수준에서 30640은 pRL-Htt-CAG23 리포터보다 pRL-Htt-CAG47 리포터의 더 많은 억압을 제공한 (CAG 반복 길이-의존성 억압) 한편, 30657은 두 리포터를 유사한 수준으로 억압하였다. pRL-Htt-CAG23 리포터에 대해, 30640은 모든 용량 수준에서 30657보다 적은 억압을 제공하였는데, 그것은 정상적인 CAG 반복 길이를 가지는 내인성 Htt 대립유전자에 대한 그것들의 활성의 차이를 개략적으로 나타냈고 (HEK293 세포, 도 3a); 그러나 pRL-Htt-CAG47 리포터에 대해서는, 30640과 30657이 모든 용량 수준에서 유사한 억압을 나타냈는데, 그것은 30640과 같은 "더 약한" ZFP가 확장된 CAG 반복을 통해 Htt 프로모터를 효과적으로 억압할 수 있음을 시사하며, 주로 확장된 CAG 표적만이 그런 ZFP에 의해 수립될 수 있는 억압에 필요한 임계값 점유를 어용할 수 있기 때문으로 보인다.

도 3d는 ZFP-TFs 30640 및 30657 (KOX1의 KRAB 억압 도메인에 융합됨)이 Hdh(Q111/Q7) 녹-인 마우스로부터 유도된 불멸화된 선조 세포에서 녹-인 Htt 대립유전자 (CAG111)을 억압할 수 있음을 나타내고, 그것은 루시페라제 리포터의 CAG 반복 길이-의존성 억압을 구동하는 30640과 같은 ZFP가 또한 확장된 CAG 반복을 가지는 내인성 Htt 대립유전자로부터의 발현을 억압할 수 있음을 증명한다. 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 제조하고, Amaxa 뉴클레오펙터를 사용하여 표시된 용량에서 Hdh(Q111/Q7) 세포에 트랜스펙션하였다. 야생형 마우스 Htt 대립유전자로부터의 발현을 검출하기 위하여, 전방 프라이머 CAGGTCCGGCAGAGGAACC (SEQ ID NO:193) 및 역 프라이머 TTCACACGGTCTTTCTTGGTGG (SEQ ID NO:194)를 실싱간 RT-PCR에 사용하였고; 녹인 Htt 대립유전자로부터의 발현을 검출하기 위하여 전방 프라이머 GCCCGGCTGTGGCTGA (SEQ ID NO:195) 및 역 프라이머 TTCACACGGTCTTTCTTGGTGG (SEQ ID NO:196)를 사용하였다.

도 3e는 정상 및 돌연변이 Htt 대립유전자 상에 각각 15 및 70 CAG를 가지는 HD 환자-유도된 섬유아세포 라인 (GM21756, Coriell)에서 ZFP-TF 30640 및 30657을 시험한 결과를 도시한다. SNP-기초 대립유전자-특이적 실시간 PCR 분석을 야생형 또는 돌연변이 Htt 대립유전자로부터의 특이적 검출을 허용하기 위해 먼저 수립하였다. SNP (rs363099 T/C)의 단계화를 문헌에 기술된 것과 같이 (Carroll et al. (Mol Ther. (2011) 19:2178-85) 측정하였다; "T"는 정상 대립유전자 상에 있고 "C"는 돌연변이 유전자 상에 있다. 돌연변이 대립유전자 (099C)로부터의 Htt 발현을 검출하기 위하여, 섬유아세포로부터의 cDNA를 실시간 PCR (SsoFast EvaGreen Supermix, Bio-Rad)에 의하여 전방 프라이머 099C.F (5'AGTTTGGAGGGTTTCTC, SEQ ID NO:143) 및 역 프라이머 099.R5 (5' TCGACTAAAGCAGGATTTCAGG, SEQ ID NO:144)를 사용하여 증폭시켰다; 아닐링/확장 온도는 55.6℃였다. 야생형 대립유전자 (099T)로부터의 Htt 발현을 검출하기 위하여, 섬유아세포 cDNA의 실시간 PCR을 전방 프라이머 099T.F (5'AGTTTGGAGGGTTTCTT, SEQ ID NO:145), 역 프라이머 099.R5 및 3' 포스포릴화된 차단제 올리고 099T.BL (5'AGGGTTTCTCCGCTCAGC-3'phos, SEQ ID NO:146)을 사용하여 수행하였다; 아닐링/확장 온도는 58.3℃였다. 총 인간 헌팅틴 (hHtt, 야생형 및 돌연변이 대립유전자 둘 다) 수준 및 표준화 대조 베타-액틴 (ACTB) 수준을 실시간 PCR에 의하여 프라이머/프로브 Hs00918176_m1 및 4352935E (Applied Biosystems)를 각각 사용하여 분석하였다. 도 3e에 도시된 실험에 대해, 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 제조하였고, 1 μg의 mRNA를 상기와 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하였다. 세포를 트랜스펙션 후 48시간 후에 수확하였다; 정상 (CAG15, 099T), 돌연변이 (CAG70, 099C) Htt 대립유전자 및 총 Htt (hHtt)로부터의 mRNA 수준을 상기에서 기술한 것과 같이 정량하고 ACRB의 수준에 대해 표준화하였다; 각 샘플에 대한 Htt/ACTB 비율을 추가로 mock-트랜스펙션된 샘플의 그것에 대해 표준화하였다. "강력한" CAG-표적화된 ZFP 30657은 예상했던 것과 같이, 두 가지 대립유전자를 다 억압하였다 HEK293 세포에서의 활성을 기초로 함, 도 3a). 리포터의 CAG 반복 길이-의존성 억압을 보인 ZFP 30640은 야생형 대립유전자의 <10% 억압을 제공한 한편, 돌연변이 대립유전자를 >90% 억압하였다. 각 샘플에서 총 Htt의 수준은 동일한 샘플에서 야생형 (wt) 및 돌연변이 Htt 수준의 그것과 일치하였다.

ZFP-30640을 또한 정상적인 섬유아세포 라인에서뿐 아니라 Htt 유전자에 상이한 CAG 반복 길이를 함유한 다른 HD 섬유아세포 라인에서도 시험하였다 (도 3f 참조). 각 대립유전자로부터의 Htt 발현을 상기에서 기술한 것과 같이 검출하였다. 정상 섬유아세포 라인 ()에서는 Htt 억압을 관찰하지 못하였다. 대조적으로, 우수한 대립유전자 감소가 CAG 15/67 및 CAG15/70 라인에서 높거나 낮은 두 가지 용량의 트랜스펙션된 30640 mRNA에서 관찰되었다; 유사한 결과를 돌연변이 대립유전자 (CAG 18/44 및 CAG 18/45) 상의 중간 CAG 반복 길이를 가지는 두 개의 HD 섬유아세포 라인에 대해 얻었다 - 이때 확장된 대립유전자는 높거나 낮은 두 가지 용량의 30640에서 ~80% 억압되고, CAG18 대립유전자는 아직 영향을 받지 않은채로 남아 있다. 이들 데이터를 함께 고려하면, 30640과 같은 대립유전자-특이적 리프레서가 CAG418/44 및 CAG18/45와 같은 더 우세한 질병 유전형의 맥락에서 강력한 CAG 대립유전자 길이 선택성을 유지할 수 있음을 나타낸다.

웨스턴 블롯 분석을 사용하여 30640과 같은 ZFP가 2명의 환자-유도된 섬유아세포 라인에서 돌연변이 Htt 단백질을 선택적으로 하향-조절하였음을 나타냈고, 그것으로 qPCR 분석에 의해 나타난 대립유전자-특이적 조절이 확인되었다 (도 3g 참조). ZFP를 mRNA 트랜스펙션 (Amaxa 뉴클레오펙션)에 의해 300 ng의 용량으로 1.5e5 세포의 4개의 복제물 안에 전달하였고, 12-웰 플레이트에 플레이팅하기 전에 모았다. 48시간째에, 세포를 세척하고 단백질 추출물 제조를 위해 수확하였다. 대략 2.5 μg의 추출물을 5% 트리스-아세테이트 겔 상에 로딩하고 MAB2166 (Millipore)에 의해 검출하였다. 추가로, 동일한 샘플을 4 내지 15% 트리스-HCl 겔 (Bio-Rad) 상에 로딩하고 로딩 대조표준으로서 항 B-액틴 (1:20,000, Sigma)에 의한 검출을 위해 표준 방법을 사용하여 전달하였다. Htt mRNA를 측정하는 qPCR 연구를 기초로, 30640은 CAG 반복을 표적화하는 대립유전자-특이적 리프레서이고; 32528은 전사 출발 부위 (TSS)를 표적화하는 이중대립유전자 리프레서이며, 30657은 사용된 용량에서 두 가지 Htt 대립유전자를 둘 다 억압하는 CAG-표적화된 리프레서이다. 웨스턴 블롯은 30640이 HD 환자-유도된 두 가지 셀라인에서 모두 돌연변이 Htt의 수준을 특이적으로 감소시킨 (상부 밴드) 한편, 32528 및 30658은 두 대립유전자를 유사하게 억압한 것을 나타냈다.

실시예 4: Htt의 대립유전자 특이적 억압을 구동하는 추가의 CAG - 표적화된 ZFP 디자인

도 4a는 CAG18/45 HD 섬유아세포 라인에서 ZFP-TFs 30640, 30643, 30645 및 33074를 시험한 결과를 도시한다 (모두 CAG 반복을 표적화하고 KRAB 억압 도메인을 사용한다). 상이한 양의 ZFP mRNA를 표시된 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하고, 돌연변이 Htt (우측 막대), 야생형 Htt (중간 막대) 및 총 Htt (둘 다의 대립유전자, 좌측 막대)의 발현을 상기 기술한 것과 같이 트랜스펙션 후 24시간째에 측정하였다. ZFP 30640, 30645 및 33074는 3 μg 내지 10 ng의 ZFP mRNA 용량 범위 전체에 걸쳐 대립유전자-특이적 억압을 구동한 한편; 30643은 30 ng 또는 그 이상의 용량에서 두 대립유전자를 상당히 억압한 것으로 나타나고 10 ng 용량에서는 대립유전자 선택성을 나타내기 시작한다.

도 4b는 CAG15/70 HD 섬유아세포 라인에서 ZFP 30643, 30648, 30657 및 30658을 시험한 결과를 도시한다 (모두 CAG 반복을 표적화하고 KRAB 억압 도메인을 사용한다). 상이한 양의 ZFP mRNA를 표시된 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하고, 돌연변이 Htt (우측 막대), 야생형 Htt (중간 막대) 및 총 Htt (둘 다의 대립유전자, 좌측 막대)의 발현을 상기 기술한 것과 같이 트랜스펙션 후 24시간째에 측정하였다. 이전 도면에서 시험한 ZFP들 (30640, 30645 및 33074)에 비교하여, 이들 ZFP는 더 낮은 용량에서 돌연변이 Htt-특이적 억압을 구동한다. 이들 결과는 생체 내에서 (예컨대 HD 환자의 뇌에서) 이루어질 수 있는 ZFP 발현 수준에 따라 돌연변이 Htt의 대립유전자-특이적 억압이 적절한 ZFP 디자인을 사용하여 이루어질 수 있음을 시사한다.

실시예 5: 대안 CAG -함유 유전자의 억압

실시예 3에서 분리한 RNA (도 3e)를 사용하여, 다른 CAG 반복 함유 유전자의 억압을 분석하였고, 그 결과를 도 5에 도시한다. 다음의 유전자들의 발현 수준을 실시간 PCR을 사용하여 조사하고 액틴의 발현 수준에 대해 표준화하였다: 아탁신 (Ataxin) 2 ("ATXN2"); 다이나민 (Dynamin) ("DNM1"); F-박스 유일 단백질 11 ("FBXO11"), 니트레이트 환원효소 ("NAP"); 기원 인식 복합체 하위유닛 4 ("ORC4"); 포스포키나아제 ("PHK"); OCT3/4 단백질 ("POU3"); THAP 도메인 함유, 아폽토시스 관련 단백질 2 ("THAPII"); TATA 결합 단백질 ("TBP"); 및 스타니오칼신 1("STC1"). 또한, 전사 출발 부위 (TSS)에 관련하여 CAG 반복 서열의 위치를 기록하였고, 도 3f에 "TSS@"로서 표시하는데, 이때 "+"는 TSS의 하류에 있는 CAG 반복의 염기 위치이고, "-"는 TSS의 상류에 있는 CAG 반복의 염기 위치이다. 또한 CAG 반복의 수 ("#CAG")는 각 유전자에 대해 표시한다.

데이터는 30640에 의한 돌연변이 확장된 Htt 대립유전자의 억압이 매우 특이적이며, 그것위 CAG 반복이 상대적으로 그것의 각각의 전사 출발 부위에 가까이 있는 CAG 반복-함유 유전자들의 하위세트가 30640과 같은 ZFP의 억압 표적이 될 수 있음을 증명한다.

실시예 6: Htt의 대립유전자-특이적 ZFP 억압의 전 범위-게놈 특이성

HD 섬유아세포 (CAG18/45)를 트랜스펙션하여 마이크로어레이 분석에 의해 CAG-표적화된 ZFP의 전 범위-게놈 특이성을 연구하였다 (도 6). ZFP를 표시된 용량에서 mRNA 트랜스펙션 (Amaxa 뉴클레오펙션)에 의해 전달하였다 - ZFP 30640, 30645 및 33074를 각각 75 ng, 15 ng 및 15 ng 용량에서 6개 한 조로 트랜스펙션하였다: GFP-Kox mRNA (150 ng)를 대조표준으로서 트랜스펙션하였고, 모든 샘플에서 150 ng의 트랜스펙션된 mRNA의 전체 양을 도입하기 위한 담체로서 사용하였다. CAG18 (099T, 중간 막대) 및 CAG45 (099C, 우측 막대) 대립유전자의 발현을 상기에서 기술한 것과 같이 트랜스펙션 후 24시간째에 대립유전자-특이적 qPCR 시약에 의해 측정하였고, 이때 샘플 (1 내지 6)의 각각은 생물학적 복제물이다 (별도의 트랜스펙션). Htt 수준을 GAPDH의 수준에 대해 표준화하였다. Htt의 돌연변이 대립유전자-특이적 억압을 모든 3개의 ZFP에 대해 관찰하였다. 그런 다음 4개의 가장 유사한 복제물을 마이크로어레이 분석 (Affymetrix HGU133plus2.0)을 위해 다음과 같이 선택하였다: GFP 복제물 1, 3, 4 및 6; 30640 복제물 2, 3, 5 및 6; 30645 복제물 2, 3, 5 및 6; 및 33074 복제물 1, 3, 4 및 5를 마이크로어레이 분석에 사용하였다. 왕성한 멀티-어레이 평균 (RMA)을 사용하여 각 프로브 세트로부터의 원래 신호를 표준화하였다; ZFP-트랜스펙션된 샘플을 GFP-트랜스펙션된 샘플에 T-시험을 사용하여 비교하였다; "변화" 요청을 대조 샘플에 비해 2배보다 큰 차이를 가지고 T-시험 P-값<0.05인 유전자들 (프로브 세트)에 대해 만들었다. 그 기준을 기초로, 30640은 단지 2개의 유전자, 스타니오칼신 1 (STC1) 및 연장된 시냅토타그민-유사 단백질 1 (ESYT1)만을 억압하였고; 30645 및 33074는 각각 하나의 유전자, STC1 및 인터류킨 17 수용체 A (ILR17RA)만을 억압하였다. Htt는 억압된 (>2-배 억압) 유전자로서 검출되지 않았는데, 왜냐하면 어레이 상의 Htt 프로브 세트가 wt 및 돌연변이 Htt mRNA를 둘 다 검출하기 때문이다. 이 실험은 돌연변이 Htt-특이적 ZFP가, Htt의 효과적인 대립유전자-특이적 억업을 구동하는 수준에서 발현될 때, 매우 높은 특이성 전 범위-게놈으로 작동할 수 있음을 증명한다.

실시예 7: HD 신경 줄기 세포 (NSC)에서 대립유전자 특이적 억압

HD iPSC/ESC를 아큐타제 (accutase)로 계대시키고 E8 배지 (Life Technologies)중의 마트리겔 코팅된 플레이트 상에서 배양하였다. 신경 줄기 세포를 StemPro 신경 유도 배지 (Life Technologies)를 사용하여 유도하였다. 간단하게 설명하면, iPSC/ESC를 겔트렉스 코팅되 6 웰 디쉬에 200,000 세포/웰로 시딩하고 10 내지 20%의 집밀도가 되었을 때 배지를 StemPro 신경 유도 배지로 교환하엿다. 배지를 2일마다 교환하고 NSC를 7일에 수확하고 확장시켰다. StemPro NSC SFM 배지 (Life Technologies)를 사용하여 NSC를 배양하였다. HD NSC (CAG17/69, Coriell GM23225 iPSC로부터 유도됨)를 1.5 또는 0.5 μg의 ZFP mRNA로 뉴클레오펙션을 사용하여 트랜스펙션하였다. 트랜스펙션 후 48시간째에 세포를 수확하고 발현을 RT-PCR에 의하여 정량하였다. Htt 발현의 대립유전자-특이적 검출을 SNP (rs1143646)-기저 유전형분석 분석 #4351376 (Applied Biosystems)을 사용하여 수행하였다. 시험한 ZFP 용량에서, 30640은 돌연변이 Htt의 대립유전자-특이적 억압을 제공하였고, 30643은 wt Htt의 ~50% 억압 및 돌연변이 Htt의 ~90% 억압을 제공하였으며, 30648은 두 대립유전자를 모두 억압하였다 (도 7); 이들 ZFP의 행동은 HD 섬유아세포에서의 그것과 일치한다 (도 4). 각 샘플에 대한 총 Htt 수준 (중간 막대)은 돌연변이의 수준 및 wt Htt 수준과 일치한다.

실시예 8: 분화된 HD 뉴런에서의 Htt 억압

HD NSC를 겔트렉스 코팅된 플레이트 상에서 아큐타제를 사용하여 계대시켰다. 배지를 bFGF 및 EGF 없이 StemPRO NSC SFM 배지를 함유하고 있는 신경 분화 배지로 교환함으로써 뉴런 분화를 유도하였다. 배지를 3 내지 4일마다 최대 21일까지 교환하였다. 뉴런을 NSC (CAG17/48, HD ESC로부터 유도됨)로부터 신경 분화 배지에서의 배양에 의해 유도하였다. 신경 유도 후 15일째에 세포를 1.0 또는 0.5 μg의 ZFP mRNA로 뉴클레오펙션을 사용하여 트랜스펙션하였다. 트랜스펙션 후 48시간째에 세포를 수확하고 발현을 RT-PCR에 의하여 정량하였다. 이 환자 라인이 wt 및 돌연변이 Htt의 qPCR-기저 대립유전자-특이적 검출을 허용하는 SNP를 함유하지 않기 때문에, 단지 총 Htt 수준만을 측정할 수 있다. 본 발명자는 306405과 33074가 HD 섬유아세포 및 NSC에서 CAG18 또는 CAG17 대립유전자를 억압하지 않는 것을 보았기 때문에, 30640- 및 33074-처리된 샘플에서 관찰된 총 Htt의 수준은 돌연변이 대립유전자 (CAG48)의 대립유전자-특이적 억압과 일치한다. 시험한 ZFP 용량에서 30643 및 0648에 의한 더욱 강력한 억압은 또한 HD 섬유아세포에서 이들 ZFP의 행동과 일치한다 (도 8).

실시예 9: CAG 표적화된 리프레서는 R6/2 마우스에서 돌연변이 Htt 이식유전자를 억압한다

R6/2 마우스 (~120 CAG 반복을 가지는 돌연변이 인간 Htt 엑손 1의 이식유전자를 운반함, Mangiarini et al, (1996) Cell 15:197 참조)에 CMV 프로모터에 의해 구동된 ZFP 30640-KOX 또는 GFP 중 어느 하나를 코드화하는 재조합 AAV2/6의 3e10 벡터 게놈을 입체공간적, 양방향 선조체 주사로 주었다. 마우스들을 생후 5주째에 주사하였고 8주째에 분자 분석을 위해 희생시켰다. 좌측 및 우측 선조체를 각각의 반구로부터 절개하고 즉시 냉동시켰다. 돌연변이 Htt 이식유전자의 억압을 평가하기 위하여, 총 RNA를 각 선조체로부터 TRIzol Plus (Life Technologies)로 추출하고 이어서 고용량 RT (Life Technologies)를 사용하여 cDNA를 합성하였다. 계속해서, R6/2 이식유전자 발현을 qPCR에 의해 측정하고 앞서 기술된 것과 같이 3개의 참조 유전자 (Atp5b, Eif4a2, UbC)의 기하학적 평균에 대해 표준화하였다 (Benn et al. ((2008) Molecular Neurodegeneration: 3, 17). 본 발명자는 4개의 GFP-처리된 대조 선조체에 비하여 4개의 ZFP-처리된 선조체에서 돌연변이 Htt 이식유전자의 통계학적으로 유의미한 억압 (P <0.001)을 관찰하였다 (도 9). 평균 R6/2 억압은 GFP-처리된 대조표준의 64.9%였다. 선조체의 완전한 범위가 단일한 입체공간적 주사를 사용하여 이루어지지 않았고 AAV2/6이 우선적으로 뉴런 세포를 형질도입하였기 때문에, 관찰된 억압의 배수 (~35%)는 AAV 벡터로 형질도입된 세포에서의 실제 억압보다 적게 추산된 것으로 보인다.

실시예 10: 이량체화 / 다량체화 도메인을 가지는 ZFP를 사용한 돌연변이 Htt 의 선택적 억압

짧은 CAG와 긴 CAG 반복 사이를 더 잘 구별하기 위한 징크 핑거 전사 인자들을 엔지니어링하기 위하여, 본 발명자는 개별적인 징크 핑거 전사 인자들의 DNA-결합 친화성을 감소시키고 또한 CAG 반복 내에서 인접한 하위부위들에 결합된 융합 단백질의 상이한 복사물들 사이의 상호작용 강도를 증가시키고자 하였다. 개별적인 징크 핑거 전사 인자들의 DNA-결합 친화성을 감소시키기 위하여, 본 발명자는 더 적은 징크 핑거를 가지거나 및/또는 최적 친화성보다 적은 친화성으로 DNA에 결합할 것으로 예상되는 아미노산 서열을 가지는 징크 핑거 도메인을 제조하였다. CAG 반복 내에서 인접한 하위부위들에 결합된 융합 단백질의 상이한 복사물들 사이의 상호작용 강도를 증가시키기 위하여, 본 발명자는 다양한 이량체화 도메인을 본 발명의 징크 핑거 전사 인자들에 융합시켰다. 이량체화 도메인은 "병렬" 양식으로 상호작용할 수 있고 그것들을 함유하는 융합 단백질들의 "머리-대-머리" 또는 "꼬리-대-꼬리" 이량체를 생성하였다. 한 가지 잠재적인 이량체화 전략은 "머리-대-꼬리" 방향으로 결합하는 동일한 ZFP-전사 인자 융합의 배열을 필요로 하고 따라서 이 전략은 "반-병렬" 양식으로 상호작용하는 이량체화 도메인 (예컨대 McClain et al. (2001) J. Am. Chem . Soc. 123:3151-3152 참조) 및 이량체화 징크 핑거 펩티드 (Giesecke et al. (2006), Molecular Systems Biology 2:2006.2011)를 필요로 한다.

이량체화 구성물 CC1 및 CC2는 반병렬 코일형 코일들의 쌍을 기저로 하였다 (McClain et al , ibid, Ghosh et al. (2000) J Am Chem Soc 122:5658-5659). 이량체화 구성물 CC3 및 CC4는 각각 CC2의 4개의 잔기 또는 7개의 잔기가 결핍된 절단된 버전이었다. 이량체화 구성물 DZ1, DZ2, DZ3 및 DZ4는 이량체화 징크 핑거 도메인 (Giesecke et al, 상기 동일)의 쌍들을 기저로 하였다. 각각의 경우에, 쌍의 한 구성원을 징크 핑거 DNA 결합 도메인의 N-말단에 융합시켰고 쌍의 다른 구성원을 징크 핑거 DNA 결합 도메인의 C-말단에 융합시켰다. 글리신과 세린 잔기가 풍부한 짧은 링커를 사용하여 이량체화 도메인을 징크 핑거 결합 도메인에 융합시켰다. 발명의 추가의 구체예는 또 다른 길이 및/또는 아미노산 조성을 가지는 링커들을 활용한다. 하나 또는 그 이상의 잔기가 제거되었거나 하나 또는 그 이상의 글리신 또는 세린 잔기가 다른 아미노산 잔기로 교환된 링커들이 이들 링커의 가요성을 감소시킬 것이고 긴 CAG 반복과 짧은 CAG 반복 사이의 향상된 구별을 초래할 수 있다.

돌연변이 Htt 대립유전자의 선택적 억압을 이루기 위하여, ZFP를 도 1d 및 도 10a 및 4b에 예시한 것과 같이 디자인하였다. 도 10c 및 10d는 다량체화 도메인의 서열을 도시한다. 도 11a 및 11b는 각각 CC와 DZ 도메인을 포함하고 있는 ZFP-TF의 그것들의 표적을 억압하는 능력을 측정하기 위해 디자인된 실험 결과를 도시한다. 이들 실험을 위해, 표시된 ZFP 구성물 (50 ng)을 pRL-Htt-CAG17 (200 ng), pGL3-Htt-CAG47 (200 ng) 및 pVax-SEAP (분비된 알칼리성 포스파타제, 10 ng, 표준화 대조표준으로서 사용함)를 사용하여 HEK293 세포에 공동-트랜스펙션하였다. 루시페라제 활성 및 분비된 알칼리성 포스파타제 활성을 트랜스펙션 후 24시간 후에 측정하였다. 각 샘플에 대한 레닐라 루시페라제 (CAG17)/SEAP 및 반딧불이 루시페라제 (CAG47)/SEAP 비율을 리포터-단독 샘플의 비율에 대해 표준화하였다. pGL3-Htt-CAG47 리포터를 pRL-Htt-CAG47 리포터와 동일한 방식으로 (실시예3 참조) 구성하되, 단 pRL-TK 구성물 대신 pGL-프로모터 구성물 (Promega)을 사용하였다.

도 11a에서 알 수 있는 것과 같이, 3개의 ZFP는 하나 또는 그 이상의 CC 도메인-함유 구성물로서 시험될 때, CC 도메인은 없지만 동일한 ZFP를 가지고 있는 구성물과 비교하여 하나 또는 둘 다의 리포터의 억압을 증강시켰다. 도 11b는 DZ1 및 DZ3 도메인이 둘 다의 리포터에 대한 32220의 억압을 증강시켰음을 보여준다.

이들 결과는 CC 및 DZ 도메인이 일반적으로 다량체화돈 ZFP의 친화성을 증가시킬 수 있고 DNA 결합 도메인 및 이량체화 도메인의 디자인이 최적의 CAG-반복 길이 구별을 유발할 수 있음을 시사한다.

실시예 11: ZFP - ZFP - Kox 디자인을 사용한 돌연변이 Htt의 선택적 억압

ZFP-ZFP-KOX 디자인의 것인 ZFP TF를 HD 섬유아세포에서 시험하였다. 이들 실험에서, 두 개의 ZFP DNA 결합 도메인을 가요성 링커 (LRQKDAARGSAAMAERPFQ, SEQ ID NO:179)와 함께 연결시키고 KOX 억압 도메인에 융합시켰다. 링커를 보존된 히스티딘과 시스테인 사이에 배치하였다. 단백질을 상기에서 기술한 것과 같이 표시된 용량의 ZFP mRNA를 사용하여 시험하였다. CAG18/45 (도 12a) 및 CAG20/41 (도 12b) HD 섬유아세포 라인에서의 이들 결과는 이런 양식으로 덜 활성인 ZFP DNA 결합 도메인들을 연결시키는 것이 대립유전자-특이적 억압을 구동시키는 합성 ZFP를 초래할 수 있음을 증명하였다.

실시예 12: 마우스 세포에서 Htt의 활성화

본원에 기술된 ZFP를 또한 그것들의 Htt 발현을 활성화시키는 능력에 대해 평가하였다. 마우스 Htt의 +200 내지 +467 염기쌍 영역 (전사 출발 부위에 비해)을 표적화하는 ZFP를 NFB p65 하위유닛의 전사 활성화 도메인에 융합시켰다. 이 단편이 HD의 다양한 녹-인 마우스 모델에서 인간 Htt로부터의 상응하는 서열 (엑손 1의 대부분과 인트론 1 서열의 일부)에 의해 대체되었고 (Menalled et al. (2003) J. Comp. Neurol 4651:11-26; Wheeler et al. (2000) Hum Mol Genet 8:115-122), 이 표적화 영역을 선택하였고, 따라서 이 영역에 대해 표적화된 ZFP는 그런 동물에서 녹-인 대립유전자가 아닌 야생형 대립유전자를 선택적으로 활성화할 수 있기 때문에, 이 표적화 영역을 선택하였다.

ZFP를 Neuro2A 세포 (이들 세포에서는 Htt 대립유전자들이 둘 다 야생형이다)에 트랜스펙션하고, 마우스 Htt 및 ACTB mRNA 수준을 실시예 2에서 기술한 것과 같이 측정하였다 (중복 트렌스펙션 및 다중 분석).

도 13에서 알 수 있는 것과 같이, mock 트랜스펙션에 비교하여 Htt mRNA 수준의 증가를 두 개의 ZFP-TF를 사용하여 검출하였다. 도 13a 참조. 증가된 Htt 단백질 수준을 웨스턴 블롯에 의해 확인하였다. 도 13b 참조.

녹-인 Htt 대립유전자의 생성을 도 13c에 예시한다; 서열 배열 (도 13d)은 대체된 마우스 서열과 상응하는 인간 서열 사이의 다양성을 보여준다. 도 13e는 그런 ZFP 활성화제가 HdhQ111/Q7 녹-인 마우스로부터 유도된 불멸화된 선조 세포에 트랜스펙션되었을 때 오직 야생형 Htt만이 선택적으로 활성화되었음을 보여준다.

실시예 13: 생체 내 Htt 발현의 조절

Htt-특이적 ZFP TF의 생체 내에서의 효능을 시험하기 위하여, ZFP를 코드화하는 AAV2 벡터를 제조하였다. 그런 다음 이들 AAV2 기저 구성물을 마우스의 뇌에 전달하였다. 인간 Htt-특이적 ZFP TF에 대해, AAV 벡터를 R6/2 마우스 또는 BAC HD 마우스 (C57Bl/6 또는 FVB/N 계통)에 전달하여 인간 이식유전자의 억압과, 뿐만 아리나 HD-유사 표현형의 변화를 평가하였다. 마우스 Htt-특이적 ZFP (활성화제 또는 리프레서)에 대해, AAV 벡터를 야생형 마우스 (C57Bl/6 또는 FVB/N) 또는 인간 Htt 녹-인 마우스 (HdhQ111/Q7, HdhQ140/Q7 또는 HdhQ175/Q7)에 전달하여 내인성 마우스 Htt 발현의 활성화 또는 억압을 평가하였다. CAG-확장된 대립유전자를 우선적으로 표적화하는 ZFP에 대해, AAV 벡터를 R6/2 마우스 또는 인간 Htt 녹-인 마우스 (HdhQ111/Q7, HdhQ140/Q7 또는 HdhQ175/Q7)에 전달하여 wt 대 확장된 Htt 대립유전자의 선택적 억압을 조사하였다. 희생시킨 후에 뇌 조직을 Htt 발현에 대해 Taqman 실시간 RT-PCR에 의해 분석하였고, 그 결과는 Htt 유전자가 ZFP-TF에 의해 변조되는 것을 증명한다.

유전자도입 마우스 라인 R6/2는 확장된 CAG 반복을 함유하는 인간 Htt 프로모터 및 엑손 1 단편이 이소적으로 발현되는 HD의 특성화가 잘 되어 있는 동물 모델이다 (Mangiarini et al. (1996) Cell 87, 493-506). 이들 마우스는 HD의 특징인 선조체 중간 가시 뉴런 (MSN)뿐 아니라 HD-유사 표현형 행동 변화를 나타낸다. MSN 변성과 일관되게, MSN 마커인 DARPP-32 (Bibb et al. 2000, Proc . Natl . Acad . Sci. 97(12):6809-6814), 포스포다이에스테라제 10a (PDE10a) (Hebb et al. 2004 Neuroscience, 123(4):967-81), 도파민 수용체 D1 (DRD1) 및 도파민 수용체 D2 (DRD2) (Cha et al. 1998 Proc . Natl . Acad . Sci. 95(11):6480-6485)의 감소된 발현이 R6/2 마우스에서 보고되었다.

유전자 리프레서인, HD 환자-유도된 섬유아세포 및 뉴런에서 돌연변이 Htt 대립유전자를 특이적으로 억압하는 ZFP-33074의 생체 내 효능을 시험하기 위하여, AAV6-33074 (즉 유전자 리프레서를 포함하고 있는 AAV6)를 생후 5주의 R6/2 마우스의 선조체에 입체공간적 주사를 사용하여 양방향으로 전달하였다. 각각의 선조체에 2 부위에서의 AAV 주사를 주었는데, 전방 및 후방 주입에 대한 좌표는 각각 A/P +1.4, M/L +/-1.7, D/V -3.5 및 A/P +0.2, M/L +/-2.3, D/V -3.2이었다. 전방 부위에는 5 μl의 AAV 벡터를 주었고 후방 부위에는 4 μl의 AAV 벡터를 주었다. AAV6-33074 벡터의 역가는 1x10¹³ 벡터 게놈/ml이었다. 대조 동물에게는 동일한 용량의 AAV6-GFP (즉 녹색 형광 단백질을 포함하고 있는 AAV6)를 선조체의 동일 위치에 주었다.

AAV6-33074 또는 AAV6-GFP를 주사한 R6/2 마우스를 주마다, 이들 동물에 의해 나타나는 잘-수립된 운동 결함인 움켜쥐기 행동에 대해 시험하였다 (Mangiarini et al. 1996 Cell 87, 493-506). 간단히 설명하면, 각각의 마우스를 그것의 집우리로부터 꺼내어 우리의 뚜겅 위에 놓았다. 그런 다음 동물을 관찰자가 매끄럽게 움직이면서 동물이 표면 위로 약 12인치 정도에서 흔들릴 때까지 부드럽게 앞뒤로 잡아당겼다. 그런 다음 동물을 30초 동안 점수를 매긴다. 만약 앞발만의 움켜쥐기가 관찰되면, 동물에게 1의 점수를 매겼다. 만약 뒷발만의 움켜쥐기가 관찰되면 동물에게 2의 점수를 매겼다. 만약 뒷발과 앞발이 움켜쥐기가 관찰되지만, 동시가 아니라면 동물에게 3의 점수를 매겼다. 뒷발과 앞발이 동시에 중심을 단단하게 밀면서 움켜쥠으로써 완전한 움켜쥐기가 관찰되면 동물에게 4의 점수를 매겼다 (도 16). 30-초 흔들기 후에 동물을 집우리에 되돌려 넣었다. 각각의 처리 그룹, 뿐만 아니라 연령-매치된 야생형 한배새끼에 대해, 완전한 움켜쥐기 (4의 점수)를 나타낸 동물의 비율을 관찰한 각각의 주마다 측정하였다. AAV6-GFP-처리된 동물에 비교하여, VVA6-33074-처리된 R6/2 마우스는 생후 7주 및 12주 사이에 (동물을 발현 분석에 대해 희생시킨 때) 감소된 빈도의 움켜쥐기를 나타냈고; 감소는 생후 9주 내지 12주 사이에 통계학적으로 유의미하였다 (카이 제곱 분석, p<0.05)(도 17). 이 결과는 돌연변이 Htt의 유전자 리프레서, ZFP-33074가 R6/2마우스에서 잘 특성화된 운동 결핍인 움켜쥐기 행동을 개선시켰음을 증명한다.

돌연변이 Htt 및 MAN 마커 DARPP-32의 R6/2 마우스의 선조체에서의 발현 수준을 면역조직화학에 의해 측정하였다. AAV-33074 주사 후 7주째에, R6/2 마우스를 펜토바르비탈로 강하게 마취시키고 상행 대동맥을 통해 등장성 식염수와 이어서 250 mL의 0.1 M 포스페이트 완충액, pH 7.4 중의 빙-냉 4% 파라포름알데하이드로 관류하였다. 뇌를 제거하고 밤새 동일한 용액에서 후고정한 후 25% 슈크로오스에 전달하였다가 냉동-단계 마이크로톰 상에서 40 μm로 절단하였다. 슬라이스들을 PBS에 세척하고 4시간 동안 실온에서 0.3% 트리톤 X-100 20% 정상 GoatSerum/PBS (차단 용액)로 차단하였다. 토끼 항-DARPP-32 항체 (세포 신호화) 및 마우스 항-돌연변이 Htt 항체 (Millipore)를 24시간 동안 4℃에서 차단 용액중에서 인큐베이션하였다. 그런 다음 슬라이스들을 PBS로 세척하고, 2시간 동안 Alexa555 당나귀 항 토끼 (Life technologies) 및 Alexa488 염소 항 마우스 (Life technologies)가 첨가된 0.3% 트리톤 X-100/PBS에서 인큐베이션하였다. 마지막으로 슬라이스들을 PBS로 세척하고, 10분 동안 DAPI (Invitrogen)와 함께 인큐베이션하고 형광 현미경 분석을 위해 유리 커버슬립을 덮었다. 감소된 돌연변이 Htt 염색을 AAV-33074-주사된 선조체 영역에서 관찰하였다; 중요한 것은 증가된 DARRP-32 염색이 동일한 영역에서 관찰된 것이고, 그것은 돌연변이 Htt의 유전자 리프레서인 ZFP-33074가 MSN 변성을 하향 조절하여 감소시켰음을 시사한다.

돌연변이 Htt 및 MSN 마커들의 발현 수준을 또한 실시간 PCR (Taqman) 분석을 사용하여 측정하였다. AAV 벡터 (AAV-ZFP 또는 AAV-GFP) 주입 후 7일째에 R6/2 마우스 선조체를 분리하고 전방, 중간 및 후방 구획으로 절개하고 즉시 개별적으로 냉동하였다. 총 RNA를 각각의 선조체 구획으로부터 TRIzolPlus RNA 정제 키트 (Life Technologies)를 사용하여 분리하고, 500 ng의 RNA를 사용하여 고용량 cDNA 역전사 키트 (Life Technologies)를 사용하여 20-ul 반응으로 cDNA를 생성하였다. 그런 다음 100번째의 cDNA를 실시간 PCR에 사용하여 관심의 유전자 (야생형 마우스 Htt, 돌연변이 Htt 이식유전자, DARPP-32, PDE10a, DRD1 및 DRD2)의 수준 및 표준화 유전자 (Atp5b, Eif4a2, UbC)의 수준을 측정하였다; 표준화 유전자는 문헌 (Benn et al (2008) Molecular Neurodegeneration 3:17)을 기초로 선택하였다. 마우스 DARPP-32, PDE10a, Dopamine Receptor D1, Dopamine Receptor D2, Atp5b, Eif4a2 및 UbC에 대한 프라이머/프로브 세트를 IDT로부터 구매하였고; 마우스 Htt에 대한 프라이머/프로브를 Life Technologies로부터 구매하였으며, 돌연변이 Htt 이식유전자에 대한 프라이머/프로브는 Benn 등에 의해 기술된 것과 같았다. 프라이머/프로브 세트의 서열을 표 3에 열거한다. 실시간 PCR 분석을 384-웰 플레이트 방식으로 CFX-384 실시간 PCR 기기 (Bio-Rad) 상에서 제조자의 지시대로 SsoFast Probes Supermix (Bio-Rad)를 사용하여 수행하였다. 발현 분석은 CFX 매니저 소프트웨어 (v3.0)을 사용하여 행하였다. 간단히 설명하면, 관심의 유전자와 표준화 유전자 각각의 발현 수준을 삼중 반응으로 분석하고 125-배 농축 범위 (5-배 희석 시리즈)에 걸쳐 표준 곡선을 사용하여 정량하였다. 관심의 각각의 유전자의 발현 수준을 동일한 샘플로부터의 3가지 표준화 유전자의 평균 수준에 대해 표준화하였고 (관심의 유전자/표준화 유전자 비율); 그런 다음 각 샘플에 대한 이 비율을 모든 AAV-GFP-처리된 샘플의 평균 (1로서 설정함)의 비율로 규모화하고 도표화하였다. 통계학적 유의미성을 2-방향 학생 T-시험을 사용하여 평가하였다. DARRP-32에 대해, 발현은 GFP 대조표준을 받은 마우스에서의 발현의 178 퍼센트였던 반면, PDE10a, Drd1 및 Drd2는 GFP 대조표준에서의 발현의 각각 184%, 189% 및 162%였다. AAV-ZFP-33074-처리된 선조체는 AAV-GFP-처리된 선조체 (P<0.001)에 비하여 돌연변이 Htt의 ~60%의 발현을 보인 한편, 야생형 마우스 Htt의 발현은 변하지 않았다. ZFP-처리된 선조체는 또한 조사한 모든 중간 가시 뉴런 (MSN) 마커 (DARPP-32, PDE10A, DRD1 및 DRD2)에서 통계학적으로 유의미한 증가를 나타냈고, 그것은 돌연변이 Htt의 유전자 리프레서인 ZFP-33074가 R6/2 마우스에서 선조체 MSN 변성을 감소시켰음을 시사한다 (도 17).

실시예 14: 신경영양 인자 및 HD Htt 대립유전자-특이적 ZFP TF의 공동- 트랜스펙션

상기 확인된 Htt-특이적 ZFP TF를 뇌 신경영양 인자에 특이적인 ZFP-TF와 함께 공동-트랜스펙션한다. 사용된 뇌 신경영양 인자에 특이적인 ZFP-TF는 GDNF 또는 BDNF 중 어느 하나에 대해 특이적이다.

실시예 15: Htt - 표적화된 징크 핑거 뉴클레아제 ( ZFN )의 디자인 및 구성

인간 Htt 및 마우스 Htt를 표적화하는 ZFN을 CAG 반복 양옆의 서열, 제 1 코딩 ATG에 가까운 서열, 중지 코돈뿐 아니라 초기 엑손에서도 표적화하도록 디자인하였다. ZFN을 디자인하고 본질적으로 문헌에 기술되어 있는 것과 같이 플라스미드 또는 아데노바이러스 벡터에 통합시켰다 (Urnov et al. (2005) Nature 435(7042):646-651, Perez et al (2008) Nature Biotechnology 26(7):808-816, 및 미국 특허 공보 2008/0131962).

실시예 16: Htt -특이적 ZFN의 절단 활성

절단 활성을 시험하기 위하여, 상기 기술된 인간 Htt-특이적 ZFN의 쌍을 코드화하는 플라스미드를 K562 세포 안에 트랜스펙션하였다. K562 세포를 아메리칸 타입 컬춰 콜렉션으로부터 얻었고 권장받은 대로 10%의 정성된 우태아 혈청 (FCS, Cyclone)이 첨가되어 있는 F-12 배지 (Invitrogen)에서 성장시켰다. 세포를 플라스틱 용기로부터 TrypLE Select^TM 프로테아제 (Invitrogen)를 사용하여 분리하였다. 트랜스펙션을 위해 1백만개의 K562 세포를 2 g의 징크-핑거 뉴클레아제 플라스미드 및 100 μL의 Amaxa 용액 T와 혼합하였다. 세포를 Amaxa Nucleofector II^TM에 프로그램 U-23을 사용하여 트랜스펙션하고 1.4 mL 가온 F-12 배지 + 10% FCS에 회수하였다.

게놈 DNA를 수확하고 의도된 절단 부위를 포함하고 있는 Htt 유전자좌 부분을 PCR 증폭시켰다. InVitrogen으로부터의 Accuprime HiFi 중합효소를 사용한 PCR은 다음과 같이 수행하였다: 처음 3분 동안 94℃에서 변성시킨 후, 30초 동안 94℃에서 변성시킨 후 30초 동안 58℃에서 아닐링하는 단계 후 30초 동안 68℃에서 연장시키는 단계의 PCR을 30회기 수행함. 30회기를 완료한 후에 반응을 68℃에서 7분 동안 인큐베이션한 후 10℃에서 무기한 인큐베이션하였다.

K562 Htt-특이적 ZFN 처리된 세포로부터의 게놈 DNA를 예를 들면 미국 특허 공보 번호 20080015164; 20080131962 및 20080159996에 기술되어 있는 것과 같이, Surveyor^TM 뉴클레아제 (Transgenomic)에 의해 조사하였다.

마우스 Htt-특이적 ZFN의 쌍을 코드화하는 플라스미드를 유사한 방식으로 Neuro-2a 세포에서 시험하였다.

도 14a 및 14b는 ZFN이 Htt 유전자를 앞서 관찰된 삽입결실의 양에 의해 기술된 것과 같이 분석된 바, 8 내지 40%의 유전자 변형 효율로 표적화할 수 있음을 나타낸다.

실시예 17: 다양한 길이의 트라이뉴클레오티드 반복의 표적화된 통합

상기에서 기술된 것과 같이 CAG 반복 양옆에 있는 서열에 대해 가장 큰 절단 활성을 가지는 Htt-특이적 ZFN을 Htt의 야생형 복사물 안으로 다양한 길이의 CAG 반복을 도입시키기 위한 표적화된 통합 전략에 사용한다. 50, 80, 109 및 180 반복 CAG 유닛을 함유하는 공여자들을 구성한다. 그런 다음 이들 공여자를 상기에서 기술한 것과 같이 Htt-특이적 ZFN을 코드화하는 플라스미드를 사용하여 K562 세포안에 트랜스펙션한다. 공여자 통합의 확인은 게놈 DNA 분리, PCR 증폭 (상기에서 기술된 것과 같음) 및 이어서 관심의 영역의 서열화에 의해 이루어진다.

공여자 대립유전자의 Htt 대립유전자 안으로의 표적화된 통합을 초래하는 ㅏ562 세포에서 확인된 ZFN을 사용하여 가변 길이의 공여자 핵산을 인간 배아 줄기 세포 (hESC) 안에 삽입시킨다. 성공적인 공여자 통합을 상기 기술한 것과 같이 게놈 DNA 분리, PCR 및 서열화에 의해 확인한다.

실시예 18: 야생형 및/또는 돌연변이 Htt의 파괴/녹-아웃

초기 엑손에서 절단하는 ZFN은 비-상동성 단부 연합 (NHEJ)의 결과로서 작은 삽입 또는 결실 (삽입-결실)을 초래할 수 있고, 이 과정은 파괴된 Htt의 하나 또는 둘 다의 대립유전자를 가지는 세포 모델을 생성할 수 있다.

표시된 ZFN 쌍을 상기 기술한 대로 제조하고 실시예 8에서 기술한 것과 같이 Cel I 미스매치를 사용하여 절단 활성에 대해 시험하였다. 이들 ZFN 쌍은 인간 Htt의 초기 엑손을 표적으로 하고, 따라서 야생형 또는 돌연변이 Htt 대립유전자 중 어느 하나를 녹-아웃시키기 위해 사용될 수 있다.

도 14a에서 알 수 있는 것과 같이, ZFP 쌍 29627/29628, 29631/29632 (엑손 12) 및 29637/29638 (엑손 18)은 Htt 유전자를 절단하였고 따라서 녹-아웃 셀라인을 생성하기 위하여 활용할 수 있다.

실시예 19: 야생형 및 HD Htt 대립유전자의 발현 태깅

처음 또는 마지막 코딩 엑손에 대한 가장 큰 절단 활성을 가지는 ZFN을 사용하여 야생형 및 돌연변이 Htt 대립유전자를 상이한 리포터 단백질로 태깅한다. 각각의 리포터 (A 및 B)에 대한 공여자 DNA를 리드 ZFN 쌍(들)의 절단 부위를 기초로 하여 디자인함으로써 리포터 유전자의 표적화된 통합이 Htt에 대한 프레임-내 융합을 생성하도록 하였다. 공여자 DNA를 리드 ZFN 쌍(들)과 함께 K562 세포에 공동-트랜스펙션하여 가장 높은 빈도의 통합을 제공하는 공여자 DNA 구성물을 선택하였다.

ZFN 쌍을 상기 기술한 것과 같이 제조하고 실시예 8에 기술한 대로 Cel I 미스매치를 사용하여 절단 활성에 대해 시험하였다. 사용한 ZFN 쌍은 Htt 코딩 서열의 3' 단부를 표적화하고, 따라서 야생형 또는 돌연변이 Htt 대립유전자 중 어느 하나를 표적화하기 위해 사용한다. 도 14b에서 알 수 있는 것과 같이, ZFP 쌍 25917/25916, 25920/25921 및 25923/25922는 Htt 유전자를 절단할 수 있고 따라서 리포터 태그의 도입을 위해 활용할 수 있다.

리포터 A에 대해 선택한 공여자 DNA 구성물을 상응하는 ZFN과 함께 돌연변이 Htt 유전자를 가지고 있는 대상으로부터 유도된 세포 (예컨대 섬유아세포, 유도된 다능 세포)에 전달한다. 클론들을 유도하고 리포터 A의 표적 통합에 대해 스크리닝한다. 이형접합성 사건이 바람직하고 표적화된 대립유전자들은 PCR에 의해 확인한다. 단일 리포터-태깅된 Htt 대립유전자 및 다른 대립유전자상에 미변형 ZFN 표적 서열을 함유하고 있는 클론들을 선택하고; 리포터 B에 대한 공여자 구성물 및 상응하는 ZFN을 트랜스펙션하여 리포터 B를 가지는 제 2 대립유전자를 태깅한다.

그 결과의 마우스 배아 줄기 세포 클론은 각각의 대립유전자로부터의 발현의 추적을 허용하는 두 개의 상이한 마커들로 태깅된 야생형 Htt 대립유전자 및 돌연변이 대립유전자를 함유한다; 이들 세포는 표준 프로토콜을 사용하여 트라이뉴클레오티드 반복의 마우스 모델을 제조하기 위하여 사용한다.

실시예 20: Htt에 대한 활성 TALE- TF 단백질의 구성

TALE DNA 결합 도메인들을 Kox1 단백질 (TALE TF)로부터의 KRAB 억압 도메인에 연결하고 HD 환자 (CAG 20/41)-유도된 섬유아세포에서 Htt 유전자의 억압을 시험하기 위하여 사용한다. TALE 단백질의 구성을 앞서 기술된 것과 같이 수행하였고 (미국 특허 번호 8,586,526 및 미국 특허 공보 번호 20130196373 참조, 둘 다 본원에 참조로 포함됨), 미국 특허 번호 8,586,526에 기술되어 있는 것과 같이, 세 가지 상이한 C- 말단 구조: +63, +231 및 +278로 구성하였다. TALE TF 발현 플라스미드를 구성하기 위하여, 앞서 기술된 TALEN 발현 플라스미드 (미국 특허 번호 8,586,526 참조)를 사용하되, 단 TALEN에 사용된 FokI 도메인을 KRAB 발현 도메인으로 대체하였다. TALE 단백질의 C-말단과 KRAB 도메인의 연쇄를 아래에 나타내는데, KRAB 도메인 서열에 밑줄이 그어져 있다. 굵은 이탤릭체 문자는 트리플 플래그 태그를 나타내며, 굵은 문자는 핵 정위 서열을 나타내고, "[repeat]"는 TALE 반복 유닛 어레이 (전체 반복 플러스 C-말단 하프 반복) 위치를 나타내며, 물결모양의 밑줄 부분은 KRAB 도메인의 서열을 나타낸다:

염기 인식은 원형의 RVD-염기 상응성 ("TALE 코드": A에 대해서 NI, C에 대해 HD, G에 대해 NN (하프 반복에서 NK), T에 대해 NG)을 사용하여 이루어졌다. 일부의 TALE TF에서, 단백질은 DNA의 센스 (5'-3') 가닥에 결합하도록 디자인되는 한편, 다른 것에서는 TALE TF는 안티-센스 (3'-5') 가닥에 결합하도록 디자인된다. 이런 TALE TF 세트를 Htt 유전자의 CAG 반복을 표적화하도록 디자인하였다. TALE DNA 결합 단백질은 자주 표적의 5' 단부에 있는 'T' 뉴클레오티드 염기와 우선적으로 상호작용하고, 표적이 CAG 반복 영역이기 때문에, 안티-센스 DNA 가닥에 결합하는 단백질, 및 따라서 표적의 5'쪽 3번째에 있는 염기 'T'를 가지는 CTG 반복 서열은 더 좋은 결합 친화성 및 특이성을 가질 것이고 따라서 리프레서 활성을 가질 것이다.

시험된 TALE TF에 대한 표적 및 숫자 식별자를 아래의 표 4에 나타낸다. 숫자 식별자는 "SBS#"로 표시하고, 센스 (Sense) 또는 안티센스 (Antisense) 가닥에 대한 특이성이 표시되며 ("S/A"), 또한 표적, 반복 유닛의 수 또는 RVD 및 C-말단 유형이 표시된다.

Htt 특이적 TALE- TF

SBS#	S/A	표적 (5'-3')	SEQ ID NO	RVD	C 말단
102449	S	gcAGCAGCAGCAGCAGCAGca	200	17	+63
102450	S	gcAGCAGCAGCAGCAGca	201	14	+63
102451	S	gcAGCAGCAGCAGca	202	11	+63
102452	S	gcAGCAGCAGca	203	8	+63
102453	A	ctGCTGCTGCTGCTGCTGCtg	204	17	+63
102454	A	ctGCTGCTGCTGCTGCtg	205	14	+63
102455	A	ctGCTGCTGCTGCtg	206	11	+63
102456	A	ctGCTGCTGCtg	207	8	+63
102457	S	gcAGCAGCAGCAGCAGCAGca	200	17	+231
102458	S	gcAGCAGCAGCAGCAGca	201	14	+231
102459	S	gcAGCAGCAGCAGca	202	11	+231
102460	S	gcAGCAGCAGca	203	8	+231
102462	A	ctGCTGCTGCTGCTGCtg	205	14	+231
102463	A	ctGCTGCTGCTGCtg	206	11	+231
102464	A	ctGCTGCTGCtg	207	8	+231
102466	S	gcAGCAGCAGCAGCAGca	201	14	+278
102467	S	gcAGCAGCAGCAGca	202	11	+278
102468	S	gcAGCAGCAGca	203	8	+278
102469	A	ctGCTGCTGCTGCTGCTGCtg	204	17	+278
102470	A	ctGCTGCTGCTGCTGCtg	205	14	+278
102471	A	ctGCTGCTGCTGCtg	206	11	+278
102472	A	ctGCTGCTGCtg	207	8	+278

그런 다음 표의 TALE TF를 HD 환자 (CAG 20/41) 유도된 섬유아세포에서 Htt 억압에 대해 시험하였고, 그 결과를 도 15에 나타낸다. 이 실험에서, 세포를 100, 100 또는 10 ng의 TALE-TF 코드화 mRNA로 트랜스펙션하였다. 분석한 TALE TF 각각에 대한 결과를 3개의 그룹으로 나타내는데, 3가지의 트랜스펙션된 mRNA 양을 나타낸다. 각각의 그룹에는 또한 3가지의 샘플이 있다: 좌측 막대는 총 Htt 발현을 나타내고, 중간 막대는 CAG20 Htt 대립유전자로부터의 발현을 나타내며, 우측 막대는 CAG41 Htt 대립유전자로부터의 발현을 나타낸다. 데이터는 둘 다의 Htt 대립유전자를 억압할 수 있는 일부 TALE TF가 있고 (예를 들면 102454 참조), 한편 다른 TALE TF는 연장된 CAG 반복을 가지는 돌연변이 Htt를 선택적으로 억제할 수 있었음 (예를 들면 102451 및 102472 참조)을 증명한다.

본원에 언급된 모든 특허, 특허 출원 및 공보는 그것들의 전체 내용이 참조로 본원에 포함된다.

비록 개시내용은 이해를 명확하게 할 목적으로 예시 및 실례에 의해 일부 상세하게 제공되었지만, 기술분야의 숙련자들에게는 다양한 변화 및 수정이 개시내용의 사상 또는 범주로부터 벗어나지 않으면서 실시될 수 있다는 것이 드러날 것이다. 따라서, 전술한 설명 및 실례는 한정하는 것으로 해석되어서는 안된다.

SEQUENCE LISTING <110> SANGAMO BIOSCIENCES, INC. <120> METHODS AND COMPOSITIONS FOR TREATING HUNTINGTON'S DISEASE <130> 8325-0095.60 <140> PCT/US2014/064987 <141> 2014-11-11 <150> 61/902,704 <151> 2013-11-11 <160> 286 <170> PatentIn version 3.5 <210> 1 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 1 Arg Ser Asp Asp Leu Ser Arg 1 5 <210> 2 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 2 Arg Asn Asp Asn Arg Thr Lys 1 5 <210> 3 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 3 Arg Ser Asp Asp Leu Thr Arg 1 5 <210> 4 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 4 Arg Ser Asp Asp Arg Lys Thr 1 5 <210> 5 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Arg Ser Ala Asp Leu Thr Arg 1 5 <210> 6 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 Gln Ser Ser Asp Leu Arg Arg 1 5 <210> 7 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Arg Ser Asp Asn Leu Ala Arg 1 5 <210> 8 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Trp Arg Gly Asp Arg Val Lys 1 5 <210> 9 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Asp Arg Ser Asn Leu Ser Arg 1 5 <210> 10 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Thr Ser Gly Ser Leu Thr Arg 1 5 <210> 11 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Glu Arg Gly Thr Leu Ala Arg 1 5 <210> 12 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Arg Ser Asp Ala Leu Ser Arg 1 5 <210> 13 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 Asp Arg Ser His Leu Ala Arg 1 5 <210> 14 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 14 Arg Ser Asp His Leu Ser Arg 1 5 <210> 15 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 15 Gln Ser Ser Asp Leu Thr Arg 1 5 <210> 16 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 16 Thr Ser Gly Asn Leu Thr Arg 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 Gln Ser Gly His Leu Gln Arg 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Gln Ser Gly Asp Leu Thr Arg 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Arg Ser Asp Val Leu Ser Thr 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Val Arg Ser Arg Leu Arg Arg 1 5 <210> 21 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Asp Arg Ser Thr Leu Arg Gln 1 5 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Asp Arg Ser Asp Leu Ser Arg 1 5 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Gln Ser Ser Thr Arg Ala Arg 1 5 <210> 24 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 24 Arg Ser Asp Thr Leu Ser Glu 1 5 <210> 25 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 25 His Arg Arg Ser Arg Trp Gly 1 5 <210> 26 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Arg Arg Asp Thr Leu Arg Ser 1 5 <210> 27 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Arg Ser Asp His Leu Ser Thr 1 5 <210> 28 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 28 Gln Ser Ala His Arg Ile Thr 1 5 <210> 29 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 29 Arg Ser Asp His Leu Ser Glu 1 5 <210> 30 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 30 Gln Asn Ala His Arg Lys Thr 1 5 <210> 31 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 31 Gln Ser Ser Asp Leu Ser Arg 1 5 <210> 32 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 32 His Arg Ser Thr Arg Asn Arg 1 5 <210> 33 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 33 Leu Arg Gln Asp Leu Lys Arg 1 5 <210> 34 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 34 Asp Arg Ser His Leu Thr Arg 1 5 <210> 35 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 35 Asp Arg Ser Asn Leu Thr Arg 1 5 <210> 36 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 36 Leu Lys Gln Met Leu Ala Val 1 5 <210> 37 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 37 Arg Ser Asp Ser Leu Ser Ala 1 5 <210> 38 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 38 Arg Ser Asp Ala Leu Ser Thr 1 5 <210> 39 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 39 Asp Arg Ser Thr Arg Thr Lys 1 5 <210> 40 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 40 Asp Arg Ser Ala Leu Ala Arg 1 5 <210> 41 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 41 Gln Ser Gly His Leu Ser Arg 1 5 <210> 42 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 42 Arg Ser Asp Val Leu Ser Glu 1 5 <210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 43 Thr Ser Gly His Leu Ser Arg 1 5 <210> 44 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 44 Lys Leu Cys Asn Arg Lys Cys 1 5 <210> 45 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 45 His Arg Thr Ser Leu Thr Asp 1 5 <210> 46 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 46 Arg Ser Ala His Leu Ser Arg 1 5 <210> 47 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Gln Ser Gly Asn Leu Ala Arg 1 5 <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 48 Leu Lys His His Leu Thr Asp 1 5 <210> 49 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Tyr Arg Trp Leu Arg Asn Asn 1 5 <210> 50 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 50 Arg Ser Asp His Leu Ser Gln 1 5 <210> 51 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 51 Arg Ser Ala Val Arg Lys Asn 1 5 <210> 52 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 52 Trp Ser Thr Ser Leu Arg Ala 1 5 <210> 53 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 53 Gln Arg Thr His Leu Thr Gln 1 5 <210> 54 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 54 Arg Ser Ser His Leu Ser Arg 1 5 <210> 55 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 55 Thr Ser Gly Ser Leu Ser Arg 1 5 <210> 56 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Thr Arg Gln Asn Arg Asp Thr 1 5 <210> 57 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 57 Asp Gln Ser Thr Leu Arg Asn 1 5 <210> 58 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 58 Arg Ser Ala Ala Leu Ser Arg 1 5 <210> 59 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 59 Arg Ser Asp Ala Leu Ala Arg 1 5 <210> 60 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Arg Ser Asp Asn Leu Ser Glu 1 5 <210> 61 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 61 Lys Arg Cys Asn Leu Arg Cys 1 5 <210> 62 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 62 Trp Arg Ser Cys Arg Ser Ala 1 5 <210> 63 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 63 Gln Trp Ser Thr Arg Lys Arg 1 5 <210> 64 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 64 Arg Arg Trp Thr Leu Val Gly 1 5 <210> 65 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 65 Arg Ser Asp Asn Leu Arg Glu 1 5 <210> 66 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 66 Tyr Arg Trp Leu Leu Arg Ser 1 5 <210> 67 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 67 Arg Lys Asp Ala Leu Val Ala 1 5 <210> 68 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 68 Arg Arg Ala Asp Leu Ser Arg 1 5 <210> 69 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 69 Leu Ala Gln Pro Arg Asn Lys 1 5 <210> 70 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 70 Arg Ser Asp His Leu Ser Ala 1 5 <210> 71 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 71 Arg Ser Ala Asp Arg Thr Arg 1 5 <210> 72 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 72 Thr Ser Ser Asp Arg Lys Lys 1 5 <210> 73 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 73 Arg Ser Ala Asn Leu Ala Arg 1 5 <210> 74 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 74 His His Ser Ala Arg Arg Cys 1 5 <210> 75 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 75 Asp Asn Ser Ser Arg Thr Arg 1 5 <210> 76 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 76 His Lys Gln His Arg Asp Ala 1 5 <210> 77 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 77 Arg Arg Thr Asp Leu Arg Arg 1 5 <210> 78 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 78 Asp Pro Ser Asn Arg Val Gly 1 5 <210> 79 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 79 Arg Ser Ala Asp Leu Ser Arg 1 5 <210> 80 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 80 Arg Asn Asp Asp Arg Lys Lys 1 5 <210> 81 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 81 Gln Lys Val Thr Leu Ala Ala 1 5 <210> 82 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 82 Arg Arg Ser Thr Leu Arg Ser 1 5 <210> 83 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 83 Asp Arg Ser Ala Leu Ser Arg 1 5 <210> 84 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Gln Ser Gly Ser Leu Thr Arg 1 5 <210> 85 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Leu Lys Trp Asn Leu Arg Thr 1 5 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 86 Leu Lys Trp Asp Arg Gln Thr 1 5 <210> 87 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 87 Asp Arg Ser His Leu Ser Arg 1 5 <210> 88 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 88 acgctgcgcc ggcggaggcg gggccgcg 28 <210> 89 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 89 agccggccgt ggactctgag ccgaggtg 28 <210> 90 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 90 gtggcgatgc ggggggcgtg gtgaggta 28 <210> 91 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 91 ccgggacggg tccaagatgg acggccgc 28 <210> 92 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 92 ccgtcccggc agcccccacg gcgccttg 28 <210> 93 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 93 cgggtccaag atggacggcc gctcaggt 28 <210> 94 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 94 ctgctgctgc tgctggaagg acttgagg 28 <210> 95 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 95 tcagatggga cggcgctgac ctggctgg 28 <210> 96 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 96 ctgccatgga cctgaatgat gggaccca 28 <210> 97 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 97 gtggtctggg agctgtcgct gatgggcg 28 <210> 98 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 98 ccgaagggcc tgattcagct gttacccc 28 <210> 99 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 99 aacttgcaag taacagaaga ctcatcct 28 <210> 100 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 100 cttgtacagc tgtgagggtg agcataat 28 <210> 101 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 101 gccatggtgg gagagactgt gaggcggc 28 <210> 102 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 102 ctcagcaggt ggtgaccttg tggacatt 28 <210> 103 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 103 gcgctcagca ggtggtgacc ttgtggac 28 <210> 104 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 104 atggtgggag agactgtgag gcggcagc 28 <210> 105 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 105 tgggagagac tgtgaggcgg cagctggg 28 <210> 106 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 106 atggcgctca gcaggtggtg accttgtg 28 <210> 107 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 107 cagcagcagc agcagcagca gcagcagc 28 <210> 108 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 108 ctgctgctgc tgctgctgct ggaaggac 28 <210> 109 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 109 tgctgctgct gctgctgctg ctggaagg 28 <210> 110 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 110 agcagcagca gcagcagcag cagcagca 28 <210> 111 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 111 tgctgctgct gctgctgctg ctggaagg 28 <210> 112 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 112 ggctggcttt tgcgggaagg ggcggggc 28 <210> 113 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 113 gaattgacag gcggatgcgt cgtcctct 28 <210> 114 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 114 attctgcggg tctggcgtgg cctcgtct 28 <210> 115 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 115 gtgacgtcat gccggcggag acgaggcc 28 <210> 116 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 116 gtgcgtcccg tgacgtcatg ccggcgga 28 <210> 117 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 117 gccgcgaggg ttgccgggac gggcccaa 28 <210> 118 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 118 ccgcgagggt tgccgggacg ggcccaag 28 <210> 119 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 119 catcgggcag gaagccgtca tggcaacc 28 <210> 120 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 120 tcctgcccga tgggacagac cctgaaga 28 <210> 121 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 121 gtactgagca atgctgtagt cagcaatc 28 <210> 122 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 122 Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp Glu Val Met Tyr 1 5 10 15 Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro Phe Glu Cys Asn 20 25 30 Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile 35 40 45 Val Arg Gly Glu His 50 <210> 123 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 123 Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His Val Met Phe 1 5 10 15 Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe Lys Cys Asn 20 25 30 Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met 35 40 45 Ala Arg Asn Ala His 50 <210> 124 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 124 His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn Ile Leu Tyr 1 5 10 15 Thr Ile His Met Gly Cys His Gly Tyr Glu Asn Pro Phe Glu Cys Asn 20 25 30 Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile 35 40 45 Val Arg Gly Glu His 50 <210> 125 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 125 His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn Ile Leu Tyr 1 5 10 15 Thr Ile His Met Gly Cys His Ser Cys Asp Asp Val Phe Lys Cys Asn 20 25 30 Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met 35 40 45 Ala Arg Asn Ala His Gly Glu Lys Pro Thr Lys Cys Val His Cys Gly 50 55 60 Ile Val Phe Leu Asp Glu Val Met Tyr Ala Leu His Met Ser Cys His 65 70 75 80 Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln 85 90 95 Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu His 100 105 110 <210> 126 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 126 Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His Val Met Phe 1 5 10 15 Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe Lys Cys Asn 20 25 30 Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met 35 40 45 Ala Arg Asn Ala His Gly Glu Lys Pro Phe Tyr Cys Glu His Cys Glu 50 55 60 Ile Thr Phe Arg Asp Val Val Met Tyr Ser Leu His Lys Gly Tyr His 65 70 75 80 Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln 85 90 95 Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu His 100 105 110 <210> 127 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 127 Ala Gln Leu Glu Lys Glu Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Glu Asn Gln Ala Leu Glu Lys Glu Leu Ala Gln 20 25 30 <210> 128 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 128 Ala Gln Leu Lys Lys Lys Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln 1 5 10 15 Leu Lys Trp Lys Leu Gln Ala Leu Lys Lys Lys Leu Ala Gln 20 25 30 <210> 129 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 129 Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala Gln 20 25 30 <210> 130 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 130 Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu 1 5 10 15 Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln 20 25 <210> 131 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 131 Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys 20 25 <210> 132 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 132 Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp Glu Leu 1 5 10 15 Gln Ala Leu Lys Lys Glu Leu Ala Gln 20 25 <210> 133 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 133 Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Lys Asn Gln Ala 20 <210> 134 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 134 Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala 1 5 10 15 Leu Lys Lys Glu Leu Ala Gln 20 <210> 135 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 135 Thr Gly Glu Lys Pro 1 5 <210> 136 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 136 Thr Gly Gly Gln Arg Pro 1 5 <210> 137 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 137 Thr Gly Gln Lys Pro 1 5 <210> 138 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 138 Thr Gly Ser Gln Lys Pro 1 5 <210> 139 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 139 gaagatctca cttggggtcc tcaggtcgtg ccgac 35 <210> 140 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 140 gtatccaagc ttcagctttt ccagggtcgc ctaggcggtc t 41 <210> 141 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 141 gcctaggcga ccctggaaaa gctgatgaag gcc 33 <210> 142 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 142 gtatccaagc ttgagctgca gcgggcccaa actcacg 37 <210> 143 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 143 agtttggagg gtttctc 17 <210> 144 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 144 tcgactaaag caggatttca gg 22 <210> 145 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 145 agtttggagg gtttctt 17 <210> 146 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 146 agggtttctc cgctcagc 18 <210> 147 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 147 Gln Ser Gly Ala Leu Ala Arg 1 5 <210> 148 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 148 Arg Ser Ala Val Leu Ser Glu 1 5 <210> 149 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 149 Arg Ser Asp Asp Leu Ser Lys 1 5 <210> 150 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 150 Asp Asn Ser Asn Arg Ile Lys 1 5 <210> 151 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 151 Asp Asp Ser His Arg Lys Asp 1 5 <210> 152 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 152 Arg Ser Asp His Leu Thr Gln 1 5 <210> 153 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 153 Arg Ser Asp Ser Leu Leu Arg 1 5 <210> 154 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 154 Arg Arg Asp Trp Leu Pro Gln 1 5 <210> 155 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 155 cgcactcgcc gcgagggttg ccgggacg 28 <210> 156 <400> 156 000 <210> 157 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 157 agcagcagca gcagcagcag cagcagca 28 <210> 158 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 158 ctgctgctgc tgctgctgct gctggaag 28 <210> 159 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 159 cctgtccaga gggtcgcggt acctccct 28 <210> 160 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 160 tgccggacct ggcagcggcg gtggtggc 28 <210> 161 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 161 Arg Ser Asp Asn Leu Ser Glu Lys Arg Cys Asn Leu Arg Cys 1 5 10 <210> 162 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 162 Arg Ser Asp Asn Leu Ser Glu Lys Pro Tyr Asn Leu Arg Thr 1 5 10 <210> 163 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 163 Arg Ser Asp Asn Leu Ser Glu Arg Leu Trp Asn Arg Lys Gln 1 5 10 <210> 164 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 164 Arg Ser Asp Asn Leu Ser Val Arg Arg Trp Asn Leu Arg Ala 1 5 10 <210> 165 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 165 Arg Ser Asp Asn Leu Ser Val Arg Lys Trp Asn Arg Asp Ser 1 5 10 <210> 166 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 166 Arg Ser Asp Asn Leu Ser Glu Asn Thr Ser Pro Leu Met Leu 1 5 10 <210> 167 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 167 Arg Ser Asp Asn Leu Ser Glu Arg Arg Tyr Asn Leu Val Lys 1 5 10 <210> 168 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 168 Arg Ser Asp Thr Leu Ser Glu Arg Arg Trp Thr Leu Val Gly 1 5 10 <210> 169 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 169 Gln Ser Ser Asp Leu Ser Arg Gln Trp Ser Thr Arg Lys Arg 1 5 10 <210> 170 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 170 Arg Ser Ala His Leu Ser Arg Gln Ser Gly Asp Leu Thr Arg 1 5 10 <210> 171 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 171 Gln Ser Gly Asp Leu Thr Arg Gln Ser Gly Asp Leu Thr Arg 1 5 10 <210> 172 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 172 Gln Ser Gly Asp Leu Thr Arg Gln Ser Ser Asp Leu Arg Arg 1 5 10 <210> 173 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 173 Gln Ser Ser Asp Leu Ser Arg Gln Ser Ser Asp Leu Arg Arg 1 5 10 <210> 174 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 174 Gln Ser Ser Asp Leu Ser Arg His Arg Ser Thr Arg Asn Arg 1 5 10 <210> 175 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 175 Met Ala Cys Cys Arg Tyr Ala 1 5 <210> 176 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 176 Arg Ser Ala Asn Leu Arg Glu 1 5 <210> 177 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 177 Arg Asn Ala Asp Arg Lys Lys 1 5 <210> 178 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 178 Gln Asn Ala Thr Arg Ile Lys 1 5 <210> 179 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 179 Leu Arg Gln Lys Asp Ala Ala Arg Gly Ser Ala Ala Met Ala Glu Arg 1 5 10 15 Pro Phe Gln <210> 180 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 180 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp Glu 20 25 30 Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro Phe 35 40 45 Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser 50 55 60 Ser His Ile Val Arg Gly Glu His Ser Gly Val Pro 65 70 75 <210> 181 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 181 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His 20 25 30 Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe 35 40 45 Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe 50 55 60 Val His Met Ala Arg Asn Ala His Ser Gly Val Pro 65 70 75 <210> 182 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 182 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His 20 25 30 Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe 35 40 45 Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe 50 55 60 Val His Met Ala Arg Asn Ala His Ser Gly Val Pro 65 70 75 <210> 183 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 183 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn 20 25 30 Ile Leu Tyr Thr Ile His Met Gly Cys His Ser Cys Asp Asp Val Phe 35 40 45 Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe 50 55 60 Val His Met Ala Arg Asn Ala His Gly Glu Lys Pro Thr Lys Cys Val 65 70 75 80 His Cys Gly Ile Val Phe Leu Asp Glu Val Met Tyr Ala Leu His Met 85 90 95 Ser Cys His Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr 100 105 110 His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu 115 120 125 His Ser Gly Val Pro 130 <210> 184 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 184 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Gly Gly Ala Gln Leu Glu Lys Glu Leu Gln Ala Leu Glu 20 25 30 Lys Lys Leu Ala Gln Leu Glu Trp Glu Asn Gln Ala Leu Glu Lys Glu 35 40 45 Leu Ala Gln Gly Gly Ser Gly Val Pro 50 55 <210> 185 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 185 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu 20 25 30 Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys 35 40 45 Leu Ala Gln Gly Gly Ser Gly Val Pro 50 55 <210> 186 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 186 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu 20 25 30 Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Gly 35 40 45 Gly Ser Gly Val Pro 50 <210> 187 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 187 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg 1 5 10 15 Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu 20 25 30 Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Gly Gly Ser Gly 35 40 45 Val Pro 50 <210> 188 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 188 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala 1 5 10 15 Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys 20 25 30 Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala 35 40 45 Gln Gly Val Pro 50 <210> 189 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 189 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala 1 5 10 15 Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys 20 25 30 Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala 35 40 45 Gln Gly Gly Ser Gly Val Pro 50 55 <210> 190 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 190 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala 1 5 10 15 Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys 20 25 30 Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala 35 40 45 Gln Gly Val Pro 50 <210> 191 <211> 240 <212> DNA <213> Mus sp. <400> 191 tctgtcccat cgggcaggaa gccgtcatgg caaccctgga aaagctgatg aaggctttcg 60 agtcgctcaa gtcgtttcag cagcaacagc agcagcagcc accgccgcag gcgccgccgc 120 caccgccgcc gccgcctccg cctcaacccc ctcagccgcc gcctcagggg cagccgccgc 180 cgccaccacc gccgctgcca ggtccggcag aggaaccgct gcaccgaccg tgagtccggg 240 <210> 192 <211> 300 <212> DNA <213> Homo sapiens <400> 192 actgccgtgc cgggcgggag accgccatgg cgaccctgga aaagctgatg aaggccttcg 60 agtccctcaa gtccttccag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcaacag ccgccaccgc cgccgccgcc gccgccgcct cctcagcttc 180 ctcagccgcc gccgcaggca cagccgctgc tgcctcagcc gcagccgccc ccgccgccgc 240 ccccgccgcc acccggcccg gctgtggctg aggagccgct gcaccgaccg tgagtttggg 300 <210> 193 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 193 caggtccggc agaggaacc 19 <210> 194 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 194 ttcacacggt ctttcttggt gg 22 <210> 195 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 195 gcccggctgt ggctga 16 <210> 196 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 196 ttcacacggt ctttcttggt gg 22 <210> 197 <211> 175 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 197 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 <210> 198 <211> 175 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 198 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 <210> 199 <211> 175 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 199 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 <210> 200 <211> 21 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 200 gcagcagcag cagcagcagc a 21 <210> 201 <211> 18 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 201 gcagcagcag cagcagca 18 <210> 202 <211> 15 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 202 gcagcagcag cagca 15 <210> 203 <211> 12 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 203 gcagcagcag ca 12 <210> 204 <211> 21 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 204 ctgctgctgc tgctgctgct g 21 <210> 205 <211> 18 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 205 ctgctgctgc tgctgctg 18 <210> 206 <211> 15 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 206 ctgctgctgc tgctg 15 <210> 207 <211> 12 <212> DNA <213> Unknown <220> <223> Description of Unknown: Target sequence <400> 207 ctgctgctgc tg 12 <210> 208 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 208 tgccttcgga gtcatcttcc tctca 25 <210> 209 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 209 ccatccttaa cctctgtgtg a 21 <210> 210 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 210 aagtccatgc tacgctaatc ag 22 <210> 211 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 211 agcatccatt ctccgcctgt tca 23 <210> 212 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 212 tgacagcatc tccatttcca g 21 <210> 213 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 213 tctgcaccgt tatcatgaag t 21 <210> 214 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 214 ttcccctcct tctcctcccc a 21 <210> 215 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 215 ctgttcttgc cacttgacca 20 <210> 216 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 216 gctgtactcg gacctgtttg 20 <210> 217 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 217 aggttcctct ccaggctcac ttagt 25 <210> 218 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 218 ggaaactctg aggaccaagt g 21 <210> 219 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 219 ctgggagata cagggctct 19 <210> 220 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 220 aatgttgagc gagaggagtg gaagc 25 <210> 221 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 221 ctggtgaaga aggaagaatt gac 23 <210> 222 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 222 tcaaagtctc atacaagtca caaag 25 <210> 223 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 223 tcggtgcagg ctatctatgt gcc 23 <210> 224 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 224 agggtcagtc aggtcatca 19 <210> 225 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 225 cacaatgcag gaaaggatca c 21 <210> 226 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 226 ctctgaggcg aaggaccagg tg 22 <210> 227 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 227 cattctctat ggtgtcactg gg 22 <210> 228 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 228 aacatccaga aagagtccac c 21 <210> 229 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 229 cagctccctg tcccggcgg 19 <210> 230 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 230 gctgcaccga ccgtgagt 18 <210> 231 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 231 cgcaggctgc agggttac 18 <210> 232 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(60) <223> This sequence may encompass 15-20 CAG repeats <400> 232 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 233 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 233 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 <210> 234 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(141) <223> This sequence may encompass 10-47 CAG repeats <400> 234 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca g 141 <210> 235 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 235 cagcagcagc agcagcagca gcagcagcag 30 <210> 236 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 236 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 51 <210> 237 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 237 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcag 69 <210> 238 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 238 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca g 141 <210> 239 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 239 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 45 <210> 240 <211> 210 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag 210 <210> 241 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 241 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 54 <210> 242 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 242 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcag 135 <210> 243 <211> 207 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 243 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcag 207 <210> 244 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 244 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcag 144 <210> 245 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 245 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 246 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 246 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cag 123 <210> 247 <211> 29 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 247 ctgctgctgc tgctgctgct gctggaagg 29 <210> 248 <211> 28 <212> DNA <213> Unknown <220> <223> Description of Unknown: Human or mouse target sequence <400> 248 gcggcgagtg cgtcccgtga cgtcatgc 28 <210> 249 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 249 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 250 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 250 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 48 <210> 251 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 251 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300 cagcagcagc agcagcagca gcagcagcag cag 333 <210> 252 <211> 201 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 252 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca g 201 <210> 253 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 253 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc ag 132 <210> 254 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 254 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 360 <210> 255 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 255 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210> 256 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 256 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 <210> 257 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 257 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300 cagcagcagc agcagcagca gcagcag 327 <210> 258 <211> 540 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 258 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 360 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 420 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 480 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 540 <210> 259 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 259 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcag 75 <210> 260 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 260 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 108 <210> 261 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 261 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117 <210> 262 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 262 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc ag 72 <210> 263 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 263 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcag 126 <210> 264 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 264 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcag 87 <210> 265 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 265 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 <210> 266 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 266 gcagcagcag cagcagcagc 20 <210> 267 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 267 Gly Ser Gly Gly Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp 1 5 10 15 Glu Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro 20 25 30 Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe 35 40 45 Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala 50 55 60 Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg 65 70 75 80 Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 85 90 95 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met 100 105 110 Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys 115 120 125 Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val 130 135 140 Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe 145 150 155 160 Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 165 170 <210> 268 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 268 Gly Ser Gly Gly Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp 1 5 10 15 Glu Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro 20 25 30 Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe 35 40 45 Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala 50 55 60 Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg 65 70 75 80 Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 85 90 95 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met 100 105 110 Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys 115 120 125 Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val 130 135 140 Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe 145 150 155 160 Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 165 170 <210> 269 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 269 Gly Ser Gly Gly His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp 1 5 10 15 Asn Ile Leu Tyr Thr Ile His Met Gly Cys His Gly Tyr Glu Asn Pro 20 25 30 Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe 35 40 45 Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala 50 55 60 Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg 65 70 75 80 Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 85 90 95 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met 100 105 110 Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys 115 120 125 Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val 130 135 140 Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe 145 150 155 160 Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 165 170 <210> 270 <211> 231 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 270 Gly Ser Gly Gly Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp 1 5 10 15 His Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro 20 25 30 Phe Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu 35 40 45 Phe Val His Met Ala Arg Asn Ala His Gly Glu Lys Pro Phe Tyr Cys 50 55 60 Glu His Cys Glu Ile Thr Phe Arg Asp Val Val Met Tyr Ser Leu His 65 70 75 80 Lys Gly Tyr His Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly 85 90 95 Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly 100 105 110 Glu His Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp 115 120 125 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 130 135 140 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 145 150 155 160 Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 165 170 175 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 180 185 190 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 195 200 205 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp 210 215 220 Tyr Lys Asp Asp Asp Asp Lys 225 230 <210> 271 <211> 153 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 271 Gly Ser Gly Gly Ala Gln Leu Lys Lys Lys Leu Gln Ala Asn Lys Lys 1 5 10 15 Glu Leu Ala Gln Leu Lys Trp Lys Leu Gln Ala Leu Lys Lys Lys Leu 20 25 30 Ala Gln Gly Gly Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly 35 40 45 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 50 55 60 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 65 70 75 80 Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 85 90 95 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 100 105 110 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 115 120 125 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 130 135 140 Val Asp Tyr Lys Asp Asp Asp Asp Lys 145 150 <210> 272 <211> 152 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 272 Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu 1 5 10 15 Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala 20 25 30 Gln Gly Gly Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met 35 40 45 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 50 55 60 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 65 70 75 80 Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 85 90 95 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 100 105 110 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 115 120 125 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 130 135 140 Asp Tyr Lys Asp Asp Asp Asp Lys 145 150 <210> 273 <211> 148 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 273 Gly Ser Gly Gly Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu 1 5 10 15 Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly Gly Leu 20 25 30 Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp Ala Lys Ser 35 40 45 Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val 50 55 60 Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile 65 70 75 80 Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu 85 90 95 Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly 100 105 110 Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro 115 120 125 Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp 130 135 140 Asp Asp Asp Lys 145 <210> 274 <211> 146 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 274 Gly Ser Gly Gly Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp 1 5 10 15 Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly Gly Leu Arg Gln 20 25 30 Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr 35 40 45 Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe 50 55 60 Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr 65 70 75 80 Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr 85 90 95 Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu 100 105 110 Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser 115 120 125 Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp 130 135 140 Asp Lys 145 <210> 275 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 275 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala 1 5 10 15 Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys 20 25 30 Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala 35 40 45 Gln Gly Gly Ser Gly Val Pro 50 55 <210> 276 <211> 141 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 276 Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu 1 5 10 15 Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala 20 25 30 Gln Gly Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr 35 40 45 Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp 50 55 60 Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu 65 70 75 80 Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro 85 90 95 Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu 100 105 110 Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu 115 120 125 Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 130 135 140 <210> 277 <211> 141 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 277 Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu 1 5 10 15 Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala 20 25 30 Gln Gly Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr 35 40 45 Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp 50 55 60 Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu 65 70 75 80 Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro 85 90 95 Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu 100 105 110 Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu 115 120 125 Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 130 135 140 <210> 278 <211> 139 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 278 Gly Ser Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala 1 5 10 15 Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly 20 25 30 Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val 35 40 45 Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu 50 55 60 Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn 65 70 75 80 Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val 85 90 95 Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu 100 105 110 Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys 115 120 125 Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 130 135 <210> 279 <211> 139 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 279 Gly Ser Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala 1 5 10 15 Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly 20 25 30 Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val 35 40 45 Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu 50 55 60 Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn 65 70 75 80 Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val 85 90 95 Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu 100 105 110 Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys 115 120 125 Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys 130 135 <210> 280 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 280 cagcagcagc agcagcagca g 21 <210> 281 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 281 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300 <210> 282 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 282 Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro 1 5 10 15 Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala 20 25 30 Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro 35 40 45 His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg 50 55 60 Thr Ser His Arg Val Ala Gly Ser Gly Met Asp Ala Lys Ser Leu Thr 65 70 75 80 Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe 85 90 95 Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr 100 105 110 Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr 115 120 125 Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu 130 135 140 Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser 145 150 155 160 Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 165 170 <210> 283 <211> 338 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 283 Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro 1 5 10 15 Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala 20 25 30 Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro 35 40 45 His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg 50 55 60 Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly 65 70 75 80 Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met 85 90 95 Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg 100 105 110 Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala 115 120 125 Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala 130 135 140 Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His 145 150 155 160 Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr 165 170 175 His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser 180 185 190 Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg 195 200 205 Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val 210 215 220 Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Ser 225 230 235 240 Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr 245 250 255 Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu 260 265 270 Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr 275 280 285 Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile 290 295 300 Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile 305 310 315 320 His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser 325 330 335 Ser Val <210> 284 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 284 Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro 1 5 10 15 Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala 20 25 30 Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro 35 40 45 His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg 50 55 60 Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly 65 70 75 80 Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met 85 90 95 Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg 100 105 110 Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala 115 120 125 Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala 130 135 140 Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His 145 150 155 160 Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr 165 170 175 His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser 180 185 190 Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg 195 200 205 Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val 210 215 220 Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Thr Pro 225 230 235 240 Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp 245 250 255 Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu 260 265 270 Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln Gly Ser Gly Met 275 280 285 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 290 295 300 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 305 310 315 320 Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 325 330 335 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 340 345 350 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 355 360 365 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 370 375 380 <210> 285 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 285 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 105 <210> 286 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 286 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117

Claims

인간을 제외한 대상의 중간 가시 뉴런 (MSN)에서 PDE 10a, DARPP-32, DRD1 및 DRD2 수준을 대조표준에 비하여 적어도 30% 증가시키는 방법으로서,
헌팅턴병과 관련된 유전자의 유전자 리프레서를 대상에게 투여하는 것을 포함하고,
상기 유전자 리프레서는 전사 억압 도메인에 융합된 징크 핑거 단백질(ZFP) DNA 결합 도메인을 포함하고,
상기 ZFP는 F1 내지 F6의 순서로 6개의 징크 핑거 도메인을 포함하고,
징크 핑거 도메인은 하기 표에 나타난 바와 같은 인식 나선 영역을 포함하는, 방법:

.
제 1항에 있어서, PDE 10a, DARPP-32, DRD1 및 DRD2 수준에서 선택된 어느 하나 이상의 수준은 대조표준에 비하여 적어도 40% 또는 50% 또는 그 이상 증가되는 것을 특징으로 하는 방법.
제 1항에 있어서, 유전자 리프레서는 헌팅틴 단백질을 코딩하는 핵산을 억제하는 작은 분자, 핵산 또는 단백질인 것을 특징으로 하는 방법.
제 1항에 있어서, 유전자 리프레서는 헌팅틴 단백질을 코딩하는 핵산에 특이적으로 결합하는 것을 특징으로 하는 방법.
제 1항에 있어서, 유전자 리프레서는 엔지니어링된 DNA-결합 도메인을 포함하는 것을 특징으로 하는 방법.
제 1항에 있어서, 유전자 리프레서는 대상의 중추 신경계 (CNS)에 투여되는 것을 특징으로 하는 방법.
제 6항에 있어서, 유전자 리프레서는 선조체에 투여되는 것을 특징으로 하는 방법.
제 1항에 있어서, 유전자 리프레서는 바이러스 또는 비-바이러스 벡터를 사용하여 투여되는 것을 특징으로 하는 방법.
제 8항에 있어서, 바이러스 또는 비-바이러스 벡터는 아데노-관련 바이러스 (AAV) 벡터인 것을 특징으로 하는 방법.
중간 가시 뉴런 (MSN)에서 PDE 10a, DARPP-32, DRD1 및 DRD2 수준을 대조표준에 비하여 적어도 30% 증가시킴으로써 헌팅턴병(HD)에서 운동 기능 결함을 치료하기 위한 약학적 조성물로서,
상기 약학적 조성물은 전사 억압 도메인에 융합된 Htt 유전자에 결합하는 징크 핑거 단백질(ZFP) DNA 결합 도메인을 포함하는 유전자 리프레서를 포함하고,
상기 ZFP는 F1 내지 F6의 순서로 6개의 징크 핑거 도메인을 포함하고,
징크 핑거 도메인은 하기 표에 나타난 바와 같은 인식 나선 영역을 포함하는, 약학적 조성물:

.
제 10항에 있어서, PDE 10a, DARPP-32, DRD1 및 DRD2 수준은 대조표준에 비하여 적어도 100% 또는 그 이상 증가되는 것을 특징으로 하는 약학적 조성물.
제 10항 또는 제 11항에 있어서, 유전자 리프레서는 대상의 중추 신경계 (CNS)에 투여되는 것을 특징으로 하는 약학적 조성물.
제 12항에 있어서, 유전자 리프레서는 선조체에 투여되는 것을 특징으로 하는 약학적 조성물.
제 12항에 있어서, 유전자 리프레서는 바이러스 또는 비-바이러스 벡터를 사용하여 투여되는 것을 특징으로 하는 약학적 조성물.
제 14항에 있어서, 바이러스 또는 비-바이러스 벡터는 아데노-관련 바이러스 (AAV) 벡터인 것을 특징으로 하는 약학적 조성물.
제 15항에 있어서, AAV 벡터는 AAV6 벡터인 것을 특징으로 하는 약학적 조성물.
제 10항에 있어서, 대상에서 HD의 운동 기능 결함이 치료되는 것을 특징으로 하는 약학적 조성물.
제 10항에 있어서, DNA 결합 도메인이 돌연변이 Htt 대립유전자에 결합하는 것을 특징으로 하는 약학적 조성물.