KR20210049124A

KR20210049124A - 조작된 표적 특이적 염기 편집기

Info

Publication number: KR20210049124A
Application number: KR1020217008090A
Authority: KR
Inventors: 프리드리히 파우저; 제프리 씨. 밀러; 에드워드 레바
Original assignee: 상가모 테라퓨틱스, 인코포레이티드
Priority date: 2018-08-23
Filing date: 2019-08-20
Publication date: 2021-05-04
Also published as: IL280951B1; IL280951A; US11834686B2; EP3841204A4; AU2019326408A1; SG11202101801RA; JP2021536229A; EP3841204A1; US20200063114A1; CN112867792A; WO2020041249A1; CA3109592A1

Abstract

본원에는 DNA 편집 복합체, 특히 표적 DNA 서열 내의 단일 염기쌍을 특이적으로 변경시키는 DNA 편집 복합체뿐만 아니라 이러한 DNA 편집 복합체를 만들고 사용하는 방법이 기재되어 있다.

Description

조작된 표적 특이적 염기 편집기

관련 출원에 대한 상호 참조

본 출원은 2018년 8월 23일에 출원된 미국 가출원 번호 62/721,903; 2018년 10월 31일에 출원된 미국 가출원 번호 62/753,696; 2019년 3월 12일에 출원된 미국 가출원 번호 62/817,153; 및 2019년 6월 27일에 출원된 미국 가출원 번호 62/867,565를 우선권 주장하며, 이들 가출원의 개시내용은 그 전체 내용이 본원에 참조로 포함된다.

서열 목록

본 출원은 ASCII 포맷으로 전자적으로 제출되었고 그 전체 내용이 본원에 참조로 포함되는 서열 목록을 함유한다. 2019년 8월 20일에 생성된, 상기 ASCII 카피는 8325-0180-S180-PCT_SL.txt로 명명되고 그 크기가 225,507 바이트이다.

기술분야

본 개시내용은 폴리펩티드 및 게놈 공학 분야에 있다.

인공 뉴클레아제, 예컨대 조작된 징크 핑거 뉴클레아제 (ZFN), 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN), RNA 유도 뉴클레아제로서 지칭되기도 하는 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템, 및/또는 아르고노트(Argonaute) 시스템에 기반한 뉴클레아제가 의학, 생명 공학 및 농업 분야에 혁명을 일으키고 있다. 이들 분자 도구를 사용하면 유기체 내의 게놈을 이전에는 불가능했던 수준으로 유전자 조작 (예를 들어 편집)할 수 있다. 인공 뉴클레아제는 DNA를 절단할 수 있으므로, 이러한 절단 후에 세포는 오류가 발생하기 쉬운 비상동 말단 결합 (NHEJ)에 의해, 또는 절단 부위를 플랭킹하는 영역과의 상동성을 갖는 기질 DNA의 존재하에 상동성 지향 복구 (HDR)를 통해 기질 DNA를 삽입함으로써 그 파손물을 강제로 '치유'한다. 이러한 프로세스 둘 다는 DNA에서의 이중 가닥 파손 (DSB)으로 시작된다.

일부 경우에, 조작된 뉴클레아제는 유전자 편집된 세포의 염색체에서 다수의 DSB의 유도로 인해 발생할 수 있는 원치 않는 결과 (예를 들어, 전위, 반전 및 결실)를 초래할 수 있었다. 예를 들어, 뉴클레아제 처리 후 전위, 반전 및 결실을 포함한 염색체 재배열의 일부 증거가 관찰되었고 (문헌 [Kosicki, et al. (2018) Nat Biotechnol 36:765 및 Shin, et al. (2017) Nat Comm doi:10.1038/ncomms15646]), 보다 최근에는 CRISPR/Cas 시스템을 사용하여 아폽토시스로 이어지는 일부 세포에서의 절단 후 p53 경로의 유도에 관한 우려가 있었다 (Ihry, et al. (2018) Nat Med 24:939-946 및 Haapaniemi, et al. (2018) Nat Med 24:927-930). 또한, HDR은 전형적으로, 대부분의 진핵 생물에서 매우 비효율적이므로, 유전자 교정이 어렵다 (Eid, et al. (2018) Biochem J 475:1955-1964).

또한, Cas9 염기 편집기, 예컨대 AID-dCas9, APOBEC-dCas9 (예를 들어 APOBEC3G 또는 APOBEC1), BE2, BE3 및 BE4 (예를 들어, 문헌 [Komor, et al. (2016) Nature 533:420-424; Komor, et al. (2017) Science Advances 3(8), eaao4774; Kim, et al. (2017) Nat Biotechnol 35(4):371-376] 참조)은 특이성 결여를 나타낼 수 있어 (문헌 [Kim, et al. (2019) Nat Biotechnol 10.1038/s41587-019-0050-1; Zuo, et al. (2019) Science DOI:10.1126/science.aav9973] 참조), 생체 내 및 생체 외 치료 적용을 포함한 다양한 목적에 적합하지 않게 만든다.

따라서, 이중 가닥 파손을 유도하지 않고 높은 특이성으로 게놈 (염기) 편집을 수행할 필요성이 대두된다.

본 개시내용은 표적 DNA (예를 들어, 편집된 게놈)에서 이중 가닥 절단을 하지 않고 편집하는 것 (예를 들어, 단일 염기의 편집)을 포함하여, 세포에서 DNA를 선택적으로 편집하는 방법 및 조성물 (예를 들어, 염기 편집기)을 제공한다. 이러한 염기 편집기는 C:G를 T:A로 변화시키는 시토신 염기 편집기 (CBE) 또는 A:T를 G:C로 변화시키는 아데닌 염기 편집기 (ABE)일 수 있다. 더욱이, 이중 가닥 파손이 유도되지 않기 때문에, 내인성 표적 내에 유리 DNA 말단이 없고 전위가 발생하지 않는다. 본원에 기재된 바와 같은 염기 편집기는 유전자 녹아웃을 위해 (예를 들어, 시토신 염기 편집기를 사용하여 정규 코돈을 정지 코돈으로 변화시키는 것 및/또는 시토신 또는 아데닌 염기 편집기를 사용하여 스플라이스 수용자 부위를 돌연변이시키는 것); 유전자의 제어 요소 (예를 들어, 프로모터 영역) 내로 돌연변이를 도입하기 위해 (예를 들어, 돌연변이를 활성화 또는 억제하기 위함); 질환 유발 돌연변이 (예컨대 점 돌연변이)를 교정 (역전)하기 위해; 및/또는 치료 혜택을 발생시키는 돌연변이를 유도하기 위해 사용될 수 있다. 본원에 기재된 바와 같은 염기 편집기는 폴리펩티드 및/또는 폴리뉴클레오티드 형태에서의 염기 편집을 위해 (시험관 내 또는 생체 외 사용을 위한 세포에 또는 대상체에게 생체 내) 제공될 수 있다. 다른 장점들 중에서, 본 발명의 염기 편집기는 (1) 부가의 DNA 결합 도메인/결합 부위의 길이로 인해 특이성을 증가시키고, 감소된 PAM 요구 사항으로 인해 정밀도 또는 표적화 밀도를 증가시킬 수 있고/있거나; (2) 현재 표적화할 수 없는 부위를 표적화할 수 있도록 PAM 제한을 확장 (완화)할 수 있고/있거나; (3) 성능이 저조한 PAM 부위에서 편집 효율성을 증가시킬 수 있고/있거나; (4) 비 ZFP-고정된 시약으로 표적화할 수 있는 표적 부위에서 효율성을 개선시키므로, 더 낮은 용량을 지원할 수 있으며, 이는 또한 더 낮은 오프 타겟(off-target) 활성을 발생시킨다.

따라서, 본원에는 적어도 하나의 기능적 도메인 (예를 들어, DNA 탈안정화 분자, 예컨대 닉카제, 단백질 및/또는 뉴클레오티드) 및 적어도 하나의 DNA 결합 도메인 (예를 들어, 징크 핑거 단백질)을 포함하는 염기 편집 조성물이 기재된다. 특정 실시양태에서, 염기 편집 조성물은 DNA 내의 아데닌 (A) 또는 시티딘 (C) 염기를 편집하며, 여기서 이러한 조성물은 (1) 적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인; (2) 적어도 하나의 DNA 탈안정화 분자; 및 (3) 적어도 하나의 아데닌 또는 시토신 데아미나제를 포함하고, 상기 조성물은 DNA 내에 이중 가닥 절단을 만들지 않는다.

임의의 DNA 탈안정화 분자는 Cas9 닉카제, 단일 가이드 RNA (sgRNA)에 작동가능하게 연결된 Cas9 단백질 (예를 들어, dCas), 임의의 RNA 프로그래밍가능한 시스템, 징크 핑거 뉴클레아제 닉카제 (ZFN 닉카제), TALEN 닉카제, 하나 이상의 단백질, 예컨대 표 A에 제시된 것, 및/또는 하나 이상의 뉴클레오티드 (예를 들어, 하나 이상의 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))를 포함하나 이에 제한되지는 않는 임의의 조합으로 본원에 기재된 조성물에 사용될 수 있다. 특정 실시양태에서, 염기 편집 조성물은 1개 초과의 DNA 탈안정화 분자, 예를 들어 하나 이상의 단백질 (예를 들어, 표 A, 닉카제 등) 및/또는 하나 이상의 뉴클레오티드를 포함한다. 특정 실시양태에서, 상기 조성물은 ZFN 닉카제 및 하나 이상의 부가의 단백질 및/또는 뉴클레오티드 DNA 탈안정화 분자 (예를 들어, 표 A의 하나 이상의 단백질 및/또는 본원에 기재된 바와 같은 하나 이상의 뉴클레오티드)를 포함한다. 특정 측면에서, 염기 편집 조성물은 Cas9 단백질을 포함하지 않지만, 다른 Cas 단백질 (예를 들어, 비-Cas9 RNA 프로그램가능한 시스템)을 포함할 수 있다. 특정 실시양태에서, DNA 탈안정화 분자는 징크 핑거 뉴클레아제 (ZFN) 닉카제를 포함한다.

염기 편집 조성물의 적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인은 염기 편집 조성물의 다른 성분 중 하나 이상, 예를 들어 DNA 탈안정화 분자 중 하나 이상 (예를 들어, Cas9 닉카제, dCas9 등) 및/또는 적어도 하나의 아데닌 또는 시토신 데아미나제에 작동가능하게 연결될 수 있다. 특정 실시양태에서, 적어도 하나의 ZFP DNA 결합 도메인은 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된다. 다른 실시양태에서, 염기 편집 조성물은 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 여기서 제1 ZFP DNA 결합 도메인은 Cas9 닉카제에 작동가능하게 연결된다. ZFP DNA 결합 도메인은 3, 4, 5, 6개 또는 그 초과의 핑거를 포함할 수 있고, 편집될 표적화된 염기의 어느 한 쪽 (5' 또는 3')에 있는 표적 부위와 결합할 수 있다. 특정 실시양태에서, ZFP는 표적화된 염기의 어느 한 쪽에 있는 1개 내지 100개 (또는 그 사이의 임의의 수) 뉴클레오티드인 표적 부위와 결합한다. 다른 실시양태에서, ZFP는 표적화된 염기의 어느 한 쪽에 있는 1개 내지 50개 (또는 그 사이의 임의의 수) 뉴클레오티드인 표적 부위와 결합한다.

야생형 및/또는 진화된 도메인을 포함한 임의의 아데닌 또는 시토신 데아미나제가 본원에 기재된 조성물에 사용될 수 있다. 특정 실시양태에서, 아데닌 또는 시토신 데아미나제는 이량체화하여 활성 아데닌 또는 시토신 데아미나제를 형성하는 제1 및 제2 불활성 도메인으로 구성된다. 특정 실시양태에서, 아데닌 또는 시토신 데아미나제의 제1 불활성 도메인은 Cas9 닉카제에 작동가능하게 연결되고, 아데닌 또는 시토신 데아미나제의 제2 불활성 도메인은 ZFP DNA 결합 도메인에 작동가능하게 연결된다. 또한 추가 실시양태에서, 아데닌 또는 시토신 데아미나제와 ZFP DNA 결합 도메인은 둘 다 Cas9 닉카제에 작동가능하게 연결된다. 다른 실시양태에서, 염기 편집기는 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 제1 ZFP는 Cas9 닉카제에 작동가능하게 연결되고 제2 ZFP DNA 결합 도메인은 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된다.

본원에 기재된 바와 같은 하나 이상의 염기 편집 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드가 또한 제공된다. 이러한 폴리뉴클레오티드는 바이러스 (예를 들어, AAV, Ad 등) 및/또는 비-바이러스 (예를 들어, 플라스미드, mRNA 등) 벡터 상에서 운반될 수 있다. 더욱이, 본원에 기재된 바와 같은 하나 이상의 조성물 및/또는 하나 이상의 폴리뉴클레오티드를 포함하는 세포 또는 세포 집단뿐만 아니라 이러한 세포의 자손이 또한 제공되며, 여기서 세포는 편집된 염기를 포함한다.

또한 본원에 기재된 바와 같은 조성물 및/또는 폴리뉴클레오티드 중 하나 이상을 사용하여 표적 DNA (예를 들어, DNA 이중 가닥 내인성 유전자 또는 염색체 외 (에피솜) 서열) 내의 염기를 편집하는 방법이 제공된다. 특정 실시양태에서, 이러한 방법은 (i) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 단계이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것인 단계; (ii) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 단계이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것인 단계; 및/또는 (iii) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 단계를 포함한다. 다른 실시양태에서, 세포에서의 편집이 (i) C:G 염기쌍의 T:A 염기쌍으로의 변화; (ii) C:G 염기쌍의 G:C 염기쌍으로의 변화; (iii) A:T 염기쌍의 G:C 염기쌍으로의 변화; (iv) 정지 코돈의 도입; 및/또는 (v) 스플라이싱 서열의 편집 또는 생성을 발생시킨다. 상기 방법은 엑손 또는 인트론을 포함하여 임의의 질환 돌연변이 (예를 들어, 점 돌연변이)를 교정하기 위해 사용될 수 있으며, 여기서 세포 또는 대상체 내의 염색체 또는 염색체 외 에피솜에서의 DNA가 편집된다. 상기 방법은 시험관 내, 생체 외 또는 생체 내에서 수행될 수 있다.

한 측면에서, 본원에는 DNA 편집 조성물 (예를 들어, 본원에서 염기 편집 복합체로서 지칭되기도 한 염기 편집 조성물)을 포함하는 조성물 및 시스템이 기재된다. DNA 편집 복합체는 적어도 하나의 기능적 도메인 및 DNA 결합 도메인을 포함한다. 특정 실시양태에서, DNA 편집 조성물 복합체는 DNA 결합 도메인, 및 또한, 적어도 하나의 DNA 탈안정화 분자, 예컨대 이중 가닥 DNA 내에 단일 가닥 절단을 만드는 닉카제 도메인을 포함하는 융합 분자 (예를 들어, DNA 닉카제)를 포함한다. 다른 실시양태에서, DNA 편집 조성물 (복합체)은 다수의 (2개 이상의) 융합 분자, 예를 들어 제1 DNA 결합 도메인 및 닉카제 도메인을 포함한 닉카제를 포함하는 제1의 촉매적으로 활성인 융합 분자 및 제2 DNA 결합 도메인을 포함하는 제2의 촉매적으로 불활성인 융합 분자, 및 임의로 본원에 기재된 바와 같은 부가의 DNA 결합 도메인 및 하나 이상의 기능적 도메인을 각각 포함하는 하나 이상의 부가의 융합 분자를 포함한다. 특정 실시양태에서, 염기 편집기는 도 1a 내지 1d 중 임의의 것에 도시된 바와 같은 조성물을 포함한다. 특정 실시양태에서, 제1 및 제2 (및 임의로 부가의 DNA 결합 도메인)의 결합은, 예를 들어 촉매적으로 활성인 융합 분자와 촉매적으로 불활성인 융합 분자가 이량체화될 때 염기 편집을 발생시킨다. 일부 실시양태에서, 임의적 부가의 DNA 결합 도메인은 이중 가닥 DNA와 결합하는 반면, 다른 실시양태에서, DNA 결합 도메인은 단일 가닥 DNA와 결합한다. 일부 실시양태에서, DNA 닉카제는 ZFN 닉카제, TALEN 닉카제 또는 CRISPR/Cas 닉카제이며, 여기서 적어도 하나의 기능적 (닉카제) 도메인이 DNA 결합 도메인 (예를 들어, ZFP DNA 결합 도메인, TALE DNA 결합 도메인 및 CRISPR/Cas 시스템과 함께 사용하기 위한 sgRNA)에 작동가능하게 연결된다. 일부 실시양태에서, DNA 닉카제 (예를 들어, 융합 분자)는 닉카제 도메인과 DNA 결합 도메인 사이에 링커 서열을 포함한다. 닉카제 도메인(들)은 융합 분자의 N- 또는 C-말단 측을 포함하여 DNA 결합 도메인의 어느 한 쪽 (DNA 결합 도메인에 대해 N- 및/또는 C-말단)에 위치할 수 있다. 일부 실시양태에서, 링커는 대형 링커 라이브러리 (> 10e8개 구성원)로부터의 박테리아 선택 시스템으로부터 선택된다. 일부 실시양태에서, 링커는 4개 내지 22개 아미노산 잔기의 범위이다. 일부 실시양태에서, 링커는 DNA 결합 도메인에 상대적인 기능적 도메인 (예를 들어 닉카제 도메인)의 특이적 위치 설정 (예를 들어, DNA 결합 도메인의 N- 또는 C-말단 측에 대한 닉카제 도메인의 연결)을 허용한다. 일부 예에서, 링커는 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 선택된다. 염기 편집기 (또는 그의 성분)를 코딩하는 하나 이상의 폴리뉴클레오티드 (예를 들어, 구축물)가 또한 제공된다.

본원에 기재된 바와 같은 DNA 편집 복합체는 하나 이상의 아데닌 데아미나제 도메인, 하나 이상의 시티딘 데아미나제, 및/또는 하나 이상의 우라실 DNA 글리코실라제 억제제를 포함하나 이에 제한되지는 않는 하나 이상의 기능적 도메인을 포함한다. 하나 이상의 기능적 도메인은 본원에 기재된 DNA 편집 복합체의 촉매적으로 활성인 융합 분자 및/또는 촉매적으로 불활성인 융합 분자에 포함될 수 있다. 일부 실시양태에서, 시티딘 데아미나제는 아포지질단백질 B mRNA 편집 복합체 1 (APOBEC1) 도메인이다. 일부 실시양태에서, 시티딘 데아미나제는 활성화 유도 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 아데닌 데아미나제이다. 일부 실시양태에서, 아데닌 데아미나제는 야생형 또는 돌연변이된 (진화된) TadA (tRNA 아데닌 데아미나제)이다 (문헌 [Gaudelli, et al. (2017) Nature 551:464-471] 참조). 일부 실시양태에서, 아데닌 데아미나제는 ABE 7.8, ABE 7.9 또는 ABE 7.10 (Gaudelli, 상기 문헌) 또는 ABEmax (문헌 [Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846])이다. 일부 실시양태에서, 데아미나제 (아데닌 또는 시티딘) 기능적 도메인은 작동가능하게 연결된 징크 핑거 (예를 들어, 분할 효소)를 포함하는 2개의 폴리펩티드로부터 어셈블리되거나 또는 분할 효소의 한 부분에 작동가능하게 연결된 하나 이상의 ZFP 및 분할 효소의 다른 성분에 작동가능하게 연결된 Cas9 닉카제로부터 어셈블리된다 (예를 들어, 도 1b 참조). 일부 실시양태에서, 데아미나제의 어셈블리는 작동가능하게 연결된 징크 핑거를 DNA 표적과 결합시킴으로써 구동되어, 폴리펩티드가 어셈블리를 허용하도록 위치하게 한다. 일부 실시양태에서, 염기 편집기는 우라실 DNA 글리코실라제 억제제 (UGI)를 추가로 포함한다.

한 측면에서, 염기 편집기는 CRISPR 시스템으로부터 유래된 DNA 풀림 (DNA 탈안정화로서 지칭되기도 함) 시스템, 예를 들어 Cas9 (예를 들어, 자연적으로 발생하는 및/또는 조작된 Cas9) 단백질 (예를 들어, 닉카제) 또는 비-Cas9 단백질을 포함한다. 특정 실시양태에서, 염기 편집기는 징크 핑거 단백질 DNA 결합 도메인을 추가로 포함하는 Cas9 염기 편집기이며, 이러한 ZFP는 Cas9 단백질 (예를 들어, 야생형 또는 조작된 닉카제)의 임의의 성분에 임의의 방향으로 작동가능하게 연결될 수 있고, 예를 들어, 염기 편집기는 Cas9 단백질, Cas9 닉카제의 sgRNA 또는 데아미나제 (야생형 또는 조작된 (진화된) ABE 또는 CBE)에 작동가능하게 연결된 ZFP (ZFP 앵커)를 포함한다. 특정 실시양태에서, ZFP는 염기 편집기의 Cas9 도메인에 작동가능하게 연결된다. 특정 실시양태에서, 염기 편집기는 도 3의 Cas9 염기 편집기에 제시된 바와 같은 성분을 포함한다.

또 다른 측면에서, 염기 편집기는 Cas9 단백질로부터 유래된 DNA 풀림 (DNA 탈안정화) 요소를 포함하지 않는다 ("Cas9 무함유"로서 지칭되기도 함). 특정 실시양태에서, 본 발명의 Cas9 무함유 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제, 및 임의로 하나 이상의 DNA 탈안정화 인자를 포함한다. 특정 실시양태에서, DNA 탈안정화 인자는 단백질 (예를 들어, 표 A에 나타낸 바와 같음) 또는 올리고뉴클레오티드 (예를 들어, 하나 이상의 PNA, LNA 및/또는 BNA)이다. 하나 이상의 비-Cas9 DNA 탈안정화 (풀림) 인자(들) (예를 들어, 표 A의 단백질, LNA, PNA, BNA 등)는 염기 편집기의 임의의 성분, 예를 들어 ZFP-데아미나제 융합 단백질의 어느 한 성분 및/또는 ZFN 닉카제의 성분 중 임의의 것에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 염기 편집기는 하나 이상의 단백질 및 하나 이상의 뉴클레오티드 DNA 탈안정화 (풀림) 인자를 포함한다. 또한 추가 실시양태에서, 본원에 기재된 Cas9 무함유 염기 편집기는 CRISPR 시스템으로부터 유래된 하나 이상의 단백질을 포함하며, 이러한 단백질은 Cas9가 아니지만 DNA 탈안정화 (풀림) 특성을 갖는다.

특정 실시양태에서, 염기 편집기는 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용될 수 있는 하나 이상의 뉴클레오티드 서열, 예를 들어 하나 이상의 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함한다. 이는, 예를 들어 이중 나선 침입, 삼중체 침입 또는 테일 클램프(tail-clamp)에 의해 용이하게 할 수 있다 (Quijano, et al. (2017) Yale J. Biol and Med. 90:583-598; Pellestor and Paulasova (2004) European J. Human Genetics 12:694-700; Schleifman, et al. (2011) Chem & Bio. 18:1189-1198). 염기 편집기의 하나 이상의 뉴클레오티드 서열의 구조는 DNA 및/또는 RNA 및/또는 PNA 및/또는 LNA 및/또는 BNA 염기의 길이, 수 및 위치; 포스포로티오에이트 결합; 표적 서열 조성에 따른 이들 올리고뉴클레오티드의 다른 통상적인 변형에 있어서 다양할 것이다.

특정 실시양태에서, 염기 편집기는 하나 이상의 PNA, 예를 들어, 미니PEG 치환과 증강된 결합, 증가된 용해도 및 개선된 전달을 위한 감마 위치를 함유하는 감마 PNA를 포함한다 (Bahal, et al. (2014) Current Gene Ther. 14(5):331-342). 특정 실시양태에서, PNA는 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, PNA는 하기 구조의 하나 이상의 PNA를 포함하나 이에 제한되지는 않는, 도 8b 내지 8e에 도시된 바와 같은 하나 이상의 PNA를 포함한다:

(여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다.

다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 염기 편집기는 하기 구조의 하나 이상의 LNA를 포함하나 이에 제한되지는 않는, 도 8f 또는 8g에 도시된 바와 같은 하나 이상의 LNA를 포함한다:

(여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; Chol-TEG는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다).

본원에 기재된 염기 편집 조성물의 성분은 임의의 조합 (하나 이상의 닉카제 도메인, 하나 이상의 DNA 결합 도메인, 하나 이상의 기능적 도메인 등)으로 포함될 수 있으며, 이들 성분은 서로에 대해 임의의 순서로 위치할 수 있다. 일부 실시양태에서, UGI, 시티딘 및/또는 아데닌 데아미나제는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인의 N-말단 및/또는 DNA 편집 복합체의 촉매적으로 활성인 융합 분자의 닉카제 도메인에 대해 N-말단이다. 일부 실시양태에서, 시티딘 및/또는 아데닌 데아미나제 및/또는 UGI는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인의 C-말단 및/또는 촉매적으로 활성인 융합 분자의 닉카제 도메인에 대해 C-말단이다. 일부 실시양태에서, 하나 이상의 UGI, 시티딘 및/또는 아데닌 데아미나제(들)는 (촉매적으로 활성인 도메인 내의) DNA 결합 도메인과 닉카제 도메인(들) 사이에 위치한다. 일부 실시양태에서, 융합 분자는 시티딘 데아미나제 및 아데닌 데아미나제 도메인 또는 UGI를 포함하며, 여기서 UGI, 시티딘 및 아데닌 데아미나제는 DNA 결합 도메인, 서로 및/또는 닉카제 도메인과 관련하여 임의의 방식으로 위치한다 (예를 들어, 둘 다 임의의 순서로 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 N-말단; 둘 다 임의의 순서로 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 C-말단; 하나는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 N-말단이고, 하나는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 C-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 N-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 C-말단이며; 하나는 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 C-말단이고, 하나는 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 N-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인과 DNA 결합 도메인 사이 등이다). 염기 편집 조성물의 하나 이상의 융합 분자의 입체 배치의 비-제한적인 예는 첨부된 도면 및 실시예에 제시되어 있다. 일부 실시양태에서, UGI, 시티딘 및/또는 아데닌 데아미나제 도메인은 관련 기술분야에 공지된 링커를 사용하여 DNA 편집 복합체의 다른 구성원에 연결된다. 염기 편집기 또는 그의 성분을 코딩하는 하나 이상의 폴리뉴클레오티드가 또한 제공된다.

또한 추가 측면에서, DNA 편집 복합체는 적어도 하나의 우라실 DNA 글리코실라제 억제제 (예를 들어 UGI) 도메인을 포함하는 하나 이상의 기능적 도메인을 포함한다. UGI 도메인(들)은 DNA 편집 복합체가 작동할 수 있도록 임의의 방식으로 DNA 편집 복합체 내로 혼입된다. 일부 실시양태에서, 염기 편집 복합체는 박테리오파지 Gam 단백질을 포함한다. 일부 실시양태에서, 염기 편집 복합체는 데아미나제, 닉카제, UGI 및/또는 GAM 단백질을 포함한다. 일부 실시양태에서, 염기 편집 복합체의 성분은 하나, 둘 또는 그 초과의 융합 단백질을 코딩하는 하나, 둘 또는 그 초과의 유전자 발현 구축물에 제공된다. 일부 실시양태에서, 하나 이상의 우라실 DNA 글리코실라제 억제제 도메인(들)은 상기 기재되고 관련 기술분야에 공지된 링커를 사용하여 복합체의 다른 구성원에 연결된다. 일부 실시양태에서, 링커는 우라실 DNA 글리코실라제 억제제를 복합체의 다른 구성원에 연결하는데 사용되며, 여기서 링커는 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 확인된다.

일부 실시양태에서, DNA 편집 (염기 편집) 복합체는 이중 가닥 DNA 나선을 개방하는 데 도움을 주는 분자를 추가로 포함한다. 일부 실시양태에서, 이러한 분자는 효소를 포함한다. 일부 실시양태에서, 효소는 헬리카제 (예를 들어, RecQ 헬리카제 (WRN, BLM, RecQL4 및 RecQ5 (문헌 [Mo, et al. (2018) Cancer Lett. 413:1-10] 참조), DNA2 (문헌 [Jia, et al. (2017) DNA Repair (Amst). 59:9-19]) 및 임의의 다른 진핵 헬리카제, 예를 들어, FANCJ, XPD, XPB, RTEL1, 및 PIF1 (문헌 [Brosh (2013) Nat Rev Canc 13(8):542-558]))이다. 일부 실시양태에서, 효소는 박테리아 및/또는 바이러스 헬리카제이다. 예시적인 바이러스 헬리카제는 미오비리다에(Myoviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어 gp41, Dda, UvsW, Gene α, 및 Ban); 포도비리다에(Podoviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어 4B); 시포비리다에(Siphoviridae), 바쿨로비리다에(Baculoviridae), 헤르페스비리다에(Herpesviridae), 폴리오마비리다에(Polyomaviridae), 파필로마비리다에(Papillomaviridae) 및 폭스비리다에(Poxviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어, G40P, p143, UL5, UL9, Tag, E1, NPH-I, NPH-II, A18R, 및 VETF), 또는 관련 기술분야에 공지된 임의의 다른 바이러스 헬리카제를 포함한다 (예를 들어 문헌 [Frick and Lam (2006) Curr Pharm Des 12(11):1315-1338] 참조). 일부 실시양태에서, 헬리카제 효소는 박테리아 효소이다. 예시적인 박테리아 헬리카제는 피. 아에루기노사(P. aeruginosa) SF4 DnaB-유사 헬리카제, 또는 박테리아, 예컨대 이. 콜라이(E. coli) 및 에이치. 파일로리(H. pylori)에서 박테리아 RecBCD 복합체의 일부인 RecB 및 RecD 헬리카제를 포함한다 (Shadrick, et al. (2013) J. Biomol Screen 18(7):761-781). 일부 실시양태에서, 다량체성 헬리카제의 조작된 또는 진화된 변이체가 사용되며, 이는 단량체성 헬리카제 활성을 발생시킨다 (예를 들어, 문헌 [Brendza, et al. (2005) PNAS 102(29):10076-70081] 참조). 일부 실시양태에서, 상기 분자는 CRISPR/Cas 복합체를 포함한다. 일부 실시양태에서, CRISPR/Cas 복합체는 가이드 RNA를 포함한다. 일부 실시양태에서, 상기 복합체는 그의 뉴클레아제 도메인에 있어서 촉매적으로 결함이 있는 Cas 효소를 포함한다. 일부 실시양태에서, 상기 복합체는 그의 뉴클레아제 도메인 중 하나에서 촉매적으로 결함이 있는 Cas 효소 (예를 들어 닉카제)를 포함한다. 일부 실시양태에서, Cas 효소는 그의 PAM 인식에 있어서 결함이 있다 (Anders, et al. (2014) Nature 513(7519):569-573). 일부 실시양태에서, Cas 효소는 천연 PAM 서열과 비교 시 완화된 (확장된) PAM 요구 사항을 갖는다 (예를 들어, 문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 참조). 특정 실시양태에서, 본원에 기재된 바와 같은 Cas 염기 편집기는 SpCas9의 NGG PAM 서열과 비교 시 완화된 (확장된) PAM 요구 사항을 나타낸다. 일부 실시양태에서, 상기 분자는 나선 탈안정화 특성을 가지고 있다. 예시적인 나선 탈안정화 분자는 단순 포진 바이러스 유형 I (문헌 [Boehmer and Lehman (1993) J Virol 67(2):711-715]), 푸랄파(Puralpha) (문헌 [Darbinian, et al. (2001) J Cell Biochem 80(4):589-95]) 및 송아지 흉선 DNA 나선 탈안정화 단백질 (문헌 [Kohwi-Shigematsu, et al. (1978) Proc Natl Acad Sci USA 75(10):4689-93])로부터의 ICP8을 포함한다. 일부 실시양태에서, 분자는 전사 및/또는 D 루프 형성/안정화에 관여한다. 이러한 클래스의 예시적인 분자는 Rad51, Rad52, RPA1, RPA2 및 RPA3, Exo1, BLM, 및 HMGB1 및 HMGB2를 포함한다. 활용될 수 있는 다른 단백질은 소 ROA1 및 이. 콜라이 RecA 또는 이. 콜라이 rad51을 포함한다. DNA 나선 탈안정화제로서 작용할 수 있는 다른 단백질 도메인은 Cas9로부터의 RecI 및 Rec II 도메인 또는 그 자체로의 RecII 도메인뿐만 아니라 Cas9로부터의 임의의 다른 나선 탈안정화 영역을 포함한다. 본원에 기재된 염기 편집기에서 사용하기 적합한 단백질 도메인의 다른 비-제한적인 예는 표 A에 제시되어 있다.

일부 실시양태에서, 분자는 올리고뉴클레오티드, PNA, LNA, BNA 등을 포함하나 이에 제한되지는 않는 핵산이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 DNA이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 RNA이다. 일부 실시양태에서, RNA는 변형된다. 일부 실시양태에서, 융합 분자는 이러한 융합 분자의 하나 이상의 도메인 사이에 아미노산 링커 서열을 포함한다. 일부 실시양태에서, 이중 가닥 DNA 나선을 개방하는 데 도움을 주기 위해 사용되는 분자(들)는 상기 기재된 링커를 사용하여 DNA 편집 복합체의 다른 구성원에 연결된다. 일부 실시양태에서, 이중 가닥 DNA 나선을 개방하는 데 도움을 주기 위해 사용되는 분자(들)는 DNA 편집 복합체의 다른 구성원에 연결되고, 이는 공지된 방법을 사용하여 확인된다.

특정 실시양태에서, 핵산은 PNA, 예를 들어 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함하는 PNA를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, 하나 이상의 PNA는 하기를 포함한다:

(여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다 (또한 도 8b 내지 8e 참조).

다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 하나 이상의 LNA는 하기를 포함한다:

(여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다) (또한, 도 8f 및 8g 참조).

이들 분자는 모두 본원에 기재된 염기 편집 시스템 내로 혼입될 수 있으며, 편집 효율성을 증가시키거나, 오프 타겟 염기 편집을 감소시키거나, 염기 편집 창을 조정하거나 또는 표적화된 유형의 핵산 염기를 변경하도록 작용할 수 있다.

일부 실시양태에서, 본원에 기재된 바와 같은 기능적 도메인은 단일 융합 분자에 포함된다. 또 다른 한편으론, 다수의 기능적 도메인을 포함하는 DNA 편집 복합체는 임의의 방식으로 별도의 융합 분자로 분리될 수 있다. 일부 실시양태에서, 하나의 융합 분자는 DNA 결합 도메인, 시티딘 및/또는 아데닌 데아미나제 및 UGI를 포함하는 반면, 제2 융합 분자는 닉카제 또는 절반-닉카제 도메인을 포함한다. 일부 실시양태에서, 하나의 융합 분자는 데아미나제 도메인에 융합된 DNA 결합 도메인에 융합된 촉매적으로 불활성인 (데드) FokI 도메인을 포함하고, 제2 융합 단백질은 절반 FokI 닉카제 단백질, DNA 결합 도메인 및 UGI 도메인을 포함한다. 일부 실시양태에서, 하나의 융합 단백질은 UGI 도메인에 융합된 데아미나제 도메인에 융합된 촉매적으로 불활성인 (데드) FokI 도메인을 포함하는 반면, 제2 융합 분자는 기능적 닉카제 단백질을 포함한다. 일부 실시양태에서, 본원에 개시된 하나 이상의 융합 단백질은 작동가능한 융합 분자 내의 도메인에 임의의 순서로 융합된다. 일부 실시양태에서, 닉카제 도메인은 Cas 닉카제 도메인이고, 일부 실시양태에서, 닉카제 도메인은 TALEN 닉카제 도메인이다. 일부 실시양태에서, 기능적 도메인 중 하나 이상은 상기 기재된 링커를 사용하여 복합체의 하나 이상의 다른 구성원에 연결된다. 일부 실시양태에서, 하나 이상의 기능적 도메인은 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 확인된 링커를 사용하여 복합체의 하나 이상의 다른 구성원에 연결된다.

본원에 기재된 염기 편집기(들)는 하나 이상의 폴리뉴클레오티드에 의해 코딩될 수 있다. 하나 이상의 폴리뉴클레오티드는 바이러스 벡터 (AAV, Ad 등), 비-바이러스 벡터 (플라스미드, mRNA 등) 또는 그의 조합 상에서 운반될 수 있다. 특정 실시양태에서, 하나의 폴리뉴클레오티드는 염기 편집기의 모든 성분을 포함하는 반면, 다른 실시양태에서, 염기 편집기의 성분은 2개 이상의 폴리뉴클레오티드 (예를 들어, 분할 효소 및/또는 ZFP를 운반하는 별도의 폴리뉴클레오티드)에 의해 운반된다.

또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 하나 이상의 DNA 편집 복합체를 사용하여 DNA 분자를 편집 (예를 들어, 유전자 편집)하는 방법이 기재된다. 이와 같이 기재된 방법은 DNA 분자가 편집되도록 하나 이상의 DNA 편집 복합체를 세포에 도입하는 것을 포함한다. 세포는 단리될 수 있거나 또는 (예를 들어, 대상체에게 정맥내 또는 다른 투여를 통해) 살아있는 대상체 내에 있을 수 있다. 일부 실시양태에서, DNA 분자는 세포 내의 염색체 또는 염색체 외 에피솜이다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 본원에 개시된 융합 단백질에 의해 우라실 염기 ("U")로 탈아미노화되는 시티딘 염기 ("C")를 포함한다. 일부 실시양태에서, U는 DNA 복제 동안 티미딘 염기 ("T")로 대체된다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 본원에 개시된 융합 단백질에 의해 이노신 ("I") 염기로 탈아미노화되는 아데닌 염기 ("A")를 포함한다. 일부 실시양태에서, I는 복제 동안 구아닌 염기 ("G")로 대체된다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 CA 또는 AC 디뉴클레오티드가 UI 또는 IU 디뉴클레오티드로 탈아미노화되도록 본원에 개시된 데아미나제에 의해 탈아미노화되는 아데닌 및 시티딘 염기를 포함한다 (예시적인 시스템에 관해서는 도 1 참조).

일부 실시양태에서, 닉카제 도메인은 FokI DNA 절단 도메인으로부터 유래된다 (미국 특허 번호 5,436,150; 8,703,489; 9,200,266; 및 9,631,186 참조). 일부 실시양태에서, FokI 닉카제는 모 FokI 닉카제와 비교 시 하나 이상의 돌연변이를 포함한다. 본원에 기재된 바와 같은 돌연변이는 절단 도메인의 전하를 변화시키는 돌연변이, 예를 들어 양으로 하전된 잔기의 비-양으로 하전된 잔기로의 돌연변이 [예를 들어, K 및 R 잔기의 돌연변이 (예를 들어, S로 돌연변이됨); N 잔기의 돌연변이 (예를 들어, D로 돌연변이됨), 및 Q 잔기의 돌연변이 (예를 들어, E로 돌연변이됨)]; 분자 모델링에 기초하여 DNA 백본에 근접한 것으로 예측되고 FokI 상동체에서의 변이를 나타내는 잔기로의 돌연변이; 및/또는 다른 잔기에서의 돌연변이를 포함하나 이에 제한되지는 않는다 (예를 들어, 미국 특허 번호 8,623,618 및 문헌 [Guo, et al. (2010) J. Mol. Biol. 400(1):96-107]). 닉카제는 ZFN 닉카제, TALEN 닉카제 및 CRISPR/Cas 시스템, 예컨대 Cas 닉카제일 수 있다.

일부 실시양태에서, 염기 편집기는 FokI 또는 FokI 동족체로부터 유래되는 절단 도메인을 포함하는 DNA 결합 도메인 (예를 들어, 조작된 닉카제 도메인)을 포함하고, 서열식별번호: 5에 제시된 바와 같은 야생형 완전한 길이의 FokI를 기준으로 하여 넘버링된 아미노산 잔기 416, 418, 422, 447, 448, 476, 479, 481 및/또는 525 중 하나 이상, 또는 FokI 동족체 내의 상응하는 잔기에서의 돌연변이를 포함한다. 일부 실시양태에서, FokI로부터 유래된 절단 절반 도메인은 387, 393, 394, 398, 400, 416, 418, 422, 427, 434, 439, 441, 442, 444, 446, 448, 472, 473, 476, 478, 479, 480, 481, 487, 495, 497, 506, 516, 523, 525, 527, 529, 534, 559, 569, 570, 및/또는 571 중 하나 이상을 포함하여, 아미노산 잔기 414-426, 443-450, 467-488, 501-502, 및/또는 521-531 중 하나 이상에서의 돌연변이를 포함한다. 돌연변이는 상응하는 위치에서 FokI에 상동인 자연 제한 효소에서 발견되는 잔기에 대한 돌연변이를 포함할 수 있다. 일부 실시양태에서, 돌연변이는 치환, 예를 들어 야생형 잔기를 임의의 상이한 아미노산, 예를 들어 알라닌 (A), 시스테인 (C), 아스파르트산 (D), 글루탐산 (E), 히스티딘 (H), 페닐알라닌 (F), 글리신 (G), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T)으로 치환하는 것이다. 일부 실시양태에서, FokI 뉴클레아제 도메인은 416, 418, 422, 476, 447, 479, 481 및/또는 525 (야생형인 서열식별번호: 5를 기준으로 하여 넘버링됨) 중 하나 이상에서의 돌연변이를 포함한다. 뉴클레아제 도메인은 또한, ELD, KKR, ELE, KKS를 포함하나 이에 제한되지는 않는, 위치 418, 432, 441, 448, 476, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및 559에서의 하나 이상의 돌연변이를 포함할 수 있다 (예를 들어, 미국 특허 번호 8,623,618 참조). 일부 실시양태에서, 절단 도메인은 잔기 419, 420, 425, 446, 447, 470, 471, 472, 475, 478, 480, 492, 500, 502, 521, 523, 526, 530, 536, 540, 545, 573 및/또는 574 중 하나 이상에서의 돌연변이를 포함한다. 특정 실시양태에서, 본원에 기재된 변이체 절단 도메인은 뉴클레아제 이량체화에 관여한 잔기에 대한 돌연변이 (이량체화 도메인 돌연변이), 및 예를 들어, 인산염 접촉에 참여할 수 있는 아미노산 잔기에서, 이량체화 도메인을 벗어난 아미노산 위치에서의 1, 2, 3, 4, 5, 6개 또는 그 초과의 돌연변이와 조합하는 하나 이상의 부가의 돌연변이; 예를 들어, 인산염 접촉 잔기에 대한 돌연변이: 예를 들어 이량체화 돌연변이체 (예컨대 ELD, KKR, ELE, KKS 등)를 포함한다. 일부 실시양태에서, 위치 416, 418, 422, 447, 448, 476, 479, 481 및/또는 525에서의 돌연변이는 양으로 하전된 아미노산을 비하전되거나 또는 음으로 하전된 아미노산으로 대체하는 것을 포함한다. 다른 실시양태에서, 위치 446, 472 및/또는 478 (및 임의로, 예를 들어 이량체화 또는 촉매 도메인 내의 부가의 잔기)에서의 돌연변이가 만들어진다. 일부 실시양태에서, 돌연변이는 I479Q 및/또는 Q481A 돌연변이를 포함한다.

일부 실시양태에서, 조작된 절단 절반 도메인은 본원에 기재된 돌연변이 이외에, 이량체화 도메인에서의 돌연변이, 예를 들어, 아미노산 잔기 490, 537, 538, 499, 496 및 486에서의 돌연변이를 포함한다. 일부 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 본원에 기재된 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되며, 위치 496에서의 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 ("ELD"또는 "ELE") 폴리펩티드를 포함한다. 일부 실시양태에서, 조작된 닉카제 절반 도메인은 야생형 FokI 또는 FokI 동족체 절단 절반 도메인으로부터 유래되고, 아미노산 잔기 416, 418, 422, 447, 448, 476, 479, 481 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI (서열식별번호: 5)를 기준으로 하여 넘버링된 아미노산 잔기 490, 538 및 537에서의 돌연변이를 포함한다. 일부 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 닉카제 절반-도메인은 본원에 기재된 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되며, 위치 537에서의 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 ("KKK" 또는 "KKR") (본원에 참조로 포함된 미국 특허 번호 8,962,281 참조) 폴리펩티드를 포함한다 (미국 특허 공개 번호 2018/0087072 참조).

일부 실시양태에서, DNA 결합 도메인 및 조작된 FokI 또는 그의 동족체, 및 인공 뉴클레아제를 생산하는 본원에 기재된 바와 같은 절단 절반-도메인을 포함하는 융합 분자가 제공된다. 일부 실시양태에서, 융합 분자의 DNA 결합 도메인은 징크 핑거 결합 도메인 (예를 들어, 조작된 징크 핑거 결합 도메인, ZFP)이다. 일부 실시양태에서, 징크 핑거 중 하나 이상은 상기 문헌 ([Paschon, et al.] 참조)에 개시된 방법을 사용하여 확인된 링커를 사용하여 함께 연결된다. 일부 실시양태에서, DNA 결합 도메인은 TALE DNA 결합 도메인 (TALE)이다. 일부 실시양태에서, DNA 결합 도메인은 DNA 결합 분자 (예를 들어 가이드 RNA) 및 촉매적으로 불활성인 Cas 또는 Cpf1 (Cas12a로서 공지되기도 함) 단백질 (예를 들어 dCas9 또는 dCpf1)을 포함한다. 일부 실시양태에서, DNA 결합 도메인은 촉매적으로 불활성인 Cas (dCas) 단백질에 융합된 ZFP를 포함한다. 일부 실시양태에서, ZFP-dCas 융합 단백질은 PAM 특이성을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, ZFP-dCas 단백질은 DNA 서열과 특이적으로 결합하는 PAM 인식에 의존적이지 않다. 일부 실시양태에서, DNA 결합 도메인은 dCas 단백질에 융합된 TALE를 포함한다. 일부 실시양태에서, TALE-dCas 융합 단백질은 PAM 특이성을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, TALE-dCas 단백질은 DNA 서열과 특이적으로 결합하는 PAM 인식에 의존적이지 않다. 상기 실시양태 중 임의의 것에서, DNA 결합 도메인 (예를 들어, ZFP, TALE 또는 가이드 RNA 및 Cas 시스템)을 조작된 FokI 또는 그의 동족체에 연결시키기 위해 사용되는 링커는 관련 기술분야에 공지된 방법을 사용하여 확인된다 (예를 들어, 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133] 참조).

일부 실시양태에서, DNA 편집 복합체는 이중 가닥 DNA 내의 특이적 DNA 염기를 편집한다. 일부 실시양태에서, 편집은 세포 내의 DNA 분자에서 만들어진다. 일부 실시양태에서, DNA는 세포의 염색체 내에 있다. 일부 실시양태에서, 편집은 C:G 염기쌍에서 T:A 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 C:G 염기쌍에서 G:C 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 A:T 염기쌍에서 G:C 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 엑손에서 이루어진다. 일부 실시양태에서, 편집은 정지 코돈 (예를 들어 TAA, TAG, TGA)의 도입을 발생시킨다. 일부 실시양태에서, 염기 편집은 표적화된 유전자의 유전자 발현의 녹아웃을 발생시킨다. 일부 실시양태에서, 편집은 스플라이싱 서열 (예를 들어, 5' 컨센서스 서열이 G T A/G A/C/T G T/G/A/C A/G/T/C (T/C/G/A)₃ (서열식별번호: 73)이고, 3' 컨센서스 서열이 (T/C)₁₀ T/C/A/G C/T A G (서열식별번호: 74)인 U2 스플라이스 서열; 및 5' 컨센서스 서열이 G/A T A T C T T/C이고, 3' 컨센서스 서열이 (T/G/A/G)₂ T/A/C/G (T/C/A/G)₂ C/T A G/C인 U12 스플라이스 서열)을 코딩하는 서열에서 이루어진다 (문헌 [Turunen, et al. (2013) Wiley Interdiscip Rev RNA. 4(1):61-76] 참조). 일부 실시양태에서, 새로운 스플라이싱 서열이 생성된다. 일부 실시양태에서, 스플라이싱 서열은 더 이상 스플라이싱 서열로서 기능하지 않도록 변경된다. 일부 실시양태에서, 스플라이싱 서열의 변경은 엑손 스키핑을 유발한다. 일부 실시양태에서, 희귀 코돈이 생성되도록 서열이 변경된다. 일부 실시양태에서, 염기 편집은 질환과 연관된 유전자가 교정되도록 DNA 서열에서 점 돌연변이의 교정을 유발한다. 질환의 치료 및/또는 예방을 위한 염기 편집의 비-제한적인 예는 V617F 버전이 더 이상 발현되지 않도록 하는 JAK2의 편집 (그에 의해, 비제어된 혈액 세포 생산을 발생시키는 상기 유전자의 활성화가 감소된다); 다른 암 유전자, 예컨대 BCR/ABL을 녹아웃 또는 억제하기 위한 염기 편집; A1AT의 염기 편집 등을 포함한다. 치료될 수 있는 예시적인 질환은 겸상 적혈구병, 혈우병, 낭포성 섬유증, 페닐케톤뇨증, 테이 삭스병(Tay-Sachs), 색맹, 파브리병(Fabry disease), 프리드라이히(Friedreich) 운동실조, 전립선암, 및 다른 많은 것을 포함한다.

일부 실시양태에서, 본원에 개시된 바와 같은 염기 편집 복합체는 RNA 분자 상에서 작용한다. 일부 실시양태에서, 염기 편집기는 RNA 특이적 데아미나제, 예컨대 ADAR2 (RNA 유형 2 상에서 작용하는 아데노신 데아미나제)를 활용한다 (문헌 [Cox, et al. (2017) Science 358(6366):1019-1027] 참조).

또한 본원에는 조성물 중 임의의 것 (염기 편집 조성물 및/또는 이들 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드)을 포함하는 세포뿐만 아니라 본원에 개시된 방법 및 조성물에 의해 변형시킨 이들 세포의 자손인 세포가 개시된다. 일부 실시양태에서, 세포는 박테리아 세포 또는 진핵 세포이다. 일부 실시양태에서, 세포는 염기 편집기 복합체 및 염기 편집기 복합체 유도된 DNA 또는 RNA 변형을 포함한다. 변형된 세포 및 이러한 변형된 세포로부터 유래된 임의의 세포가 본 개시내용의 염기 편집기 복합체를 반드시는 아니지만 일시적 그 이상으로 포함하지만, 이러한 염기 편집기 복합체에 의해 매개되는 게놈 변형은 남아 있다.

또한 또 다른 측면에서, 관심 영역에서 세포 염색질의 표적화된 편집을 위한 방법; 감염을 치료하는 방법; 및/또는 질환을 치료하는 방법이 본원에 개시되어 있다. 이들 방법은 시험관 내, 생체 외 또는 생체 내 또는 그의 조합으로 실시될 수 있다. 상기 방법은 본원에 기재된 바와 같은 염기 편집 복합체 (예를 들어 융합 폴리펩티드 및 임의로, 하나 이상의 융합 폴리펩티드(들)가 본원에 개시된 바와 같은 조작된 닉카제를 포함하는 임의의 관련 핵산)를 발현함으로써 세포 내의 미리 결정된 관심 영역에서 세포 염색질을 편집하는 것을 수반한다. 특정 실시양태에서, 온 타겟(on-target) 부위의 표적화된 편집은 세포의 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%에서 발견된다.

본원에 개시된 바와 같은 염기 편집 복합체는 관심 영역에서 세포 염색질의 표적화된 편집을 위한 방법에 사용될 수 있다. 세포는 배양된 세포, 세포주, 유기체 내의 세포, 세포 및/또는 그 자손이 처리 후 유기체로 되돌아가는 경우 처리를 위해 유기체로부터 제거된 세포, 및 유기체로부터 제거되고, 본 발명의 융합 분자를 사용하여 변형된 다음, 치료 방법 (세포 요법)에서 유기체로 되돌아 가는 세포를 포함한다. 세포 염색질에서의 관심 영역은, 예를 들어, 게놈 서열 또는 그의 일부분일 수 있다.

융합 분자는, 예를 들어, 이러한 융합 분자를 폴리펩티드로서 세포에 전달하거나, 또는 융합 분자를 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 세포에서 발현될 수 있으며, 여기서 폴리뉴클레오티드는 DNA인 경우, 전사되고 번역되어 융합 분자를 생성한다. 추가로, 폴리뉴클레오티드가 융합 분자를 코딩하는 mRNA인 경우, 이러한 mRNA가 세포로 전달된 후, mRNA는 번역되어 융합 분자를 생성한다.

본 발명의 다른 측면에서는 염기 편집 특이성을 증가시키기 위한 방법 및 조성물이 제공된다. 일부 실시양태에서, 오프 타겟 편집 활성을 감소시킴으로써 전반적인 온 타겟 편집 특이성을 증가시키기 위한 방법이 제공된다. 일부 실시양태에서, 염기 편집과 연관된 삽입-결실 [인델(indel)] 형성을 감소시키기 위한 방법이 제공된다. 일부 실시양태에서, 조작된 염기 편집 복합체의 조작된 닉카제 성분 (ZFN 닉카제를 형성하는 닉카제 파트너, 예를 들어 촉매적으로 불활성인 ZFN 파트너 및 촉매적으로 활성인 ZFN 파트너)이 세포와 접촉하는 데 사용되며, 여기서 상기 복합체의 각각의 닉카제 파트너는 다른 파트너와 일 대 일이 아닌 비율로 제공된다. 일부 실시양태에서, 두 파트너의 비율은 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율, 또는 그 사이의 임의의 값으로 제공된다. 다른 실시양태에서, 두 파트너의 비율은 1:30 초과이다. 일부 측면에서, 각각의 파트너는 mRNA로서 세포에 전달되거나 또는 바이러스 또는 비-바이러스 벡터로 전달되며, 여기서 각각의 파트너를 코딩하는 mRNA 또는 벡터의 상이한 수량이 전달된다. 추가 실시양태에서, 뉴클레아제 복합체의 각각의 파트너는 단일 바이러스 또는 비-바이러스 벡터 상에 포함될 수 있지만, 하나의 파트너가 다른 파트너보다 더 높거나 더 낮은 값으로 발현되도록 의도적으로 발현되어, 궁극적으로 일 대 일이 아닌 절단 절반 도메인의 비율로 세포에 전달된다. 일부 실시양태에서, 각각의 절단 절반 도메인은 상이한 발현 효율성을 갖는 상이한 프로모터를 사용하여 발현된다. 일부 실시양태에서, 2개의 절단 도메인은 바이러스 또는 비-바이러스 벡터를 사용하여 세포로 전달되며, 여기서 둘 다는 동일한 오픈 리딩 프레임으로부터 발현되지만, 두 파트너를 코딩하는 유전자는 특정 서열 (예를 들어 자기 절단 2A 서열 또는 IRES)에 의해 분리되어, 3' 파트너가 더 낮은 비율로 발현되므로, 두 파트너의 비율이 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율 또는 그 사이의 임의의 값이 된다. 다른 실시양태에서, 두 파트너는 1:1과 상이하도록 선택되는 비율로 전개된다.

또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 하나 이상의 염기 편집기를 사용하여 생산된 세포 집단이 기재된다. 특정 실시양태에서, 세포의 5% 내지 20% 초과 (또는 그 사이의 임의의 값), 바람직하게 20% 초과, 보다 더 바람직하게 50% 초과, 보다 더 바람직하게 80% 내지 100%가, 표적화된 염기에 대한 변형을 포함한다 (예를 들어, 이는 염기 편집된 세포이다). 또한 추가 실시양태에서, 편집된 세포는 오프 타겟 편집 (게놈의 어느 곳에서나 의도하지 않은 편집) 및/또는 방관자 (매우 근접한 편집 이벤트, 예를 들어 의도된 표적 염기의 어느 한 쪽에 있는, 예를 들어 Cas9의 프로토스페이서 영역 내에 있는 1 내지 20개 (또는 그 사이의 임의의 값) 뉴클레오티드) 돌연변이를 거의 또는 전혀 나타내지 않는다. 본원에 기재된 바와 같은 염기 편집된 세포의 단리된 집단은 대상체에서 질환의 생체 외 치료에 사용될 수 있고/있거나 생체 외 치료로서 사용하기 전에 생체 외에서 (예를 들어, 본원에 기재된 바와 같은 추가 라운드의 염기 편집을 통해) 추가로 조작될 수 있다. 또한, 염기 편집은 생체 내 시행되어, 생체 내에서 질환 관련 돌연변이를 교정한 후 대상체에서 질환 또는 병태가 치료되도록 할 수 있다.

일부 실시양태에서, 닉카제 파트너는 부가의 활성 도메인에 융합된다. 일부 실시양태에서, 부가의 도메인은 하나 이상의 데아미나제 (예를 들어 A 특이적 또는 C 특이적), UGI 도메인, 헬리카제, 및 GAM 도메인으로부터 선택된 하나 이상의 예시적인 도메인을 포함한다. 또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 염기 편집 복합체, 또는 본원에 기재된 바와 같은 하나 이상의 염기 편집 복합체 단백질을 코딩하는 하나 이상의 폴리뉴클레오티드(들); 보조 시약; 및 임의로 지침 및 적합한 용기를 포함하는 키트가 기재된다.

이들 측면 및 다른 측면은 전체로서의 개시내용에 비추어 통상의 기술자에게 쉽게 명백할 것이다.

도 1a 내지 1d는 예시적인 DNA 편집 시스템 및 복합체를 묘사하는 개략도이다. 도 1a는 DNA 결합 도메인 (예를 들어, ZFP, TALE, sgRNA)을 포함하는 하나의 촉매적으로 불활성인 ("X"로서 표시됨) 융합 분자 및 DNA 결합 도메인 (예를 들어, ZFP, TALE, sgRNA)을 또한 포함하는 하나의 촉매적으로 활성인 닉카제 융합 분자 (가위로서 표시됨)를 포함하는 시스템을 도시한다. 촉매적으로 활성인 융합 분자와 촉매적으로 불활성인 융합 분자는 DNA 결합 도메인이 각각의 표적 부위와 결합하면 이량체화되고, 결합 후 표적 DNA를 편집한다 (예를 들어, 염기 편집). 도 1a는 또한 2개의 UGI 도메인을 포함하는 복합체를 도시한다. 도 1b는 염기 편집을 위한 추가의 예시적인 Cas9 및 Cas9 무함유 시스템을 도시한다. 상단 패널은 임의의 아데노신 또는 시토신 데아미나제 도메인의 성분의 이량체화를 통해 기능하는 염기 편집기를 도시한다. 도 1b의 하단 패널은 본원에 기재된 바와 같은 ABE 및 CBE 염기 편집기의 다양한 실시양태를 도시한다. 도 1c는 임의로 ZFP 앵커에 연결된 Cas9 DNA 탈안정화 분자 (예를 들어, sgRNA에 작동가능하게 연결된 dCas9를 포함하는 RNA 프로그램가능한 시스템); ZFP-데아미나제 융합 단백질; 및 ZFN 닉카제를 포함하는 본원에 기재된 바와 같은 염기 편집기의 또 다른 실시양태를 도시한다. 특정 실시양태에서, ZFN 닉카제는 존재하지 않으며 DNA 탈안정화 분자는 임의의 RNA 프로그램가능한 분자를 포함한다. 본 도식은 ZFP-데아미나제 융합 단백질로부터 Cas9 닉카제의 반대 쪽에 있는 ZFN 닉카제를 도시하지만, ZFN 닉카제와 ZFP-데아미나제 둘 다는 Cas9 닉카제에 대해 3' 또는 5'일 수 있다는 것이 분명할 것이다. 도 1d는 추가의 Cas9 무함유 (비-Cas9로서 지칭되기도 함) 염기 편집 시스템을 도시한다. 삼각형은 닉킹이 발생하는 위치를 나타내고 "PNA"는 펩티드 핵산을 지칭하며; "LNA"는 잠금 핵산을 지칭하고 "BNA"는 가교 핵산을 지칭한다. 이들 염기 편집기에서의 뉴클레오티드 (예를 들어, DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))는 표적 부위에서 염기 편집기를 위한 단일 가닥 DNA 기질을 제공할 수 있다.
도 2는 예시적인 아데닌 염기 편집기에 의해 표적화된 DNA를 도시하는 개략도이다. 본 도면은 야생형 mRNA 프로토스페이서 및 PAM이 상단에 정렬된 A1AT Z 돌연변이 근처의 DNA 서열을 도시한다 (서열식별번호: 78). 프로토스페이서의 오른쪽에는 몇 가지 상이한 ZFP의 DNA 표적이 도시된다. 도시된 바와 같이, PAM 서열을 필요로 하는 ABE의 경우, 염기 편집을 위한 표적 (염기 편집 창으로서 지칭되기도 함)은 전형적으로 PAM 서열로부터의 13 내지 16개 뉴클레오티드이며, 그 크기가 3, 4, 5, 6, 7개 또는 그 초과의 뉴클레오티드일 수 있다 (본 도면에는 4개 뉴클레오티드의 염기 편집 창이 도시된다) (서열식별번호: 77).
도 3a 및 3b는 예시적인 ZFP 염기 편집기를 묘사하는 개략도이다. 도 3a는 예시적인 ZFP 아데닌 염기 편집기를 도시한다. 상단 패널은 표시된 성분이 있는 예시적인 편집기를 도시한다. 중간 패널은 2개의 이. 콜라이 tRNA 특이적 아데노신 데아미나제 (tadA)를 사용하는 예시적인 ABE를 도시하며, 여기서 하나는 야생형 서열이고 다른 하나는 진화된 서열이다 (Gaudelli, et al. (2017) Nature 551(7681):464-471). TadA 도메인은 도시된 링커 (서열식별번호: 2)를 사용하여 서로 부착되고 SPCas9 서열에 부착된다. 사용된 SpCas9는 공지된 완화된 PAM 요구 사항을 갖는 VRVRFRR 변이체이다 (문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 참조). 이어서 Cas9 서열은 ZFP DNA 결합 도메인에 연결되며, 여기서 사용된 링커 (서열식별번호: 3)는 2개의 NLS 서열과 3개의 HA 태그를 포함할 수 있다. Cas9VR은 Cas9NG로서 지칭되기도 한다. 도 3b는 본원에 기재된 바와 같은 예시적인 Cas9 및 Cas9 무함유 염기 편집기를 도시한다. 하기 약어가 사용된다: "TadA"는 야생형 아데닌 데아미나제 도메인을 지칭하고; TadA*는 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하며; "7.8" "7.9" "7.10" 및 "MAX"는 문헌 [Gaudelli, et al. (2017) Nature 551(7681):464-471) 및 Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846]에 기재된 바와 같은 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하고; "SpCas9 [PAMs: NGG]"는 문헌 [Jinek, et al. (2012) Science 337(6096):816-21]에 기재된 바와 같은 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9를 지칭하며; "SpXCas9-3.7 [PAMs: NGN, GAA & GAT]"은 문헌 [Hu, et al. (2018) Nature 556(7699):57-63]에 기재된 바와 같은 광범위한 PAM 적합성을 갖는 SpCas9 변이체를 지칭하고; "SpCas9-NG [PAMs: NGN; 시험관 내 NAN]"는 문헌 [Nishimasu, et al. (2018) Science 361(6408):1259-1262]에 기재된 바와 같은 완화된 PAM 요구 사항을 갖는 SpCas9 변이체를 지칭하며; "ScCas9 [PAMs: TGT, …]"는 문헌 [Chatterjee, et al. (2018) Sci Adv 4(10):eaau0766. doi: 10.1126/sciadv.aau0766]에 기재된 바와 같은 최소한의 PAM 특이성을 갖는 SpCas9 오르소로그(ortholog)를 지칭하며; "NO CAS9"는 이러한 도메인이 존재하지 않는다는 것을 의미하고 (Cas9 무함유 염기 편집기); "5F ZFP"는 5개 핑거 ZFP를 지칭하며; "6F ZFP"는 6개 핑거 ZFP를 지칭하고; ">6F ZFP"는 6개 초과의 핑거를 갖는 ZFP를 지칭하며; "ZFP RQ" 및 "(…)"는 문헌 [Miller, et al. (2019) Nature Biotechnology 37(8):945-952]에 기재된 바와 같은 변형된 ZFP를 지칭한다.
도 4는 아데닌 염기 편집기에 의해 표적화를 위해 분석되는 편집 창 (서열식별번호: 4) 내에 있는 아데닌 염기를 묘사하는 개략도이다.
도 5a 내지 5f는 예시적인 시티딘 염기 편집기 구축물을 묘사하는 개략도이다. 도 5a 및 5b는 C 뉴클레오티드를 U로 탈아미노화할 수 있는 APOBEC1 (도 5a) 또는 AID (도 5b) 시티딘 효소를 코딩하는 서열에 추가로 연결된, ZFP DNA 결합 도메인에 연결된 2개의 UGI 단백질을 코딩하는 서열을 포함하는 염기 편집기 구축물을 도시한다. 도 5c 및 5d는 도 5a 및 5b의 구축물의 UGI 도메인이 결여된 2개의 시티딘 염기 편집기 구축물을 도시한다. 도 5e 및 5f는 FokI 닉카제를 코딩하는 서열을 활용하는 2개의 구축물을 도시한다. 이들 구축물은 시티딘 염기 편집기를 코딩하는 서열이 ZFP DNA 결합 도메인에 연결된 다음 FokI 촉매적으로 불활성인 뉴클레아제 도메인에 연결되는 한 쌍으로서 사용될 수 있다. 제2 구축물 (도 5f)은 촉매적으로 활성인 FokI 뉴클레아제 도메인을 코딩하는 서열에 연결되는 ZFP DNA 결합 도메인에 연결된 2개의 UGI 도메인을 코딩하는 서열을 포함한다. 이러한 쌍은 활성 염기 편집기를 만들기 위해 임의의 방식으로 구축될 수 있으며, 여기서 활성 및 불활성 FokI 도메인은 두 파트너 구축물 중 하나에 있을 수 있고, UGI 서열 및 시티딘 염기 편집기 서열은 어느 한 파트너에 있을 수 있다.
도 6a 및 6b는 2개의 예시적인 아데닌 염기 편집기를 도시한다. 도 6a는 ZFP DNA 결합 도메인에 연결된 2개의 TadA 도메인, 즉 1개의 야생형 도메인과 1개의 진화된 도메인을 코딩하는 서열을 포함하는 구축물을 도시한다. 도 6b에 도시된 바와 같이, 일부 변이에서 구축물은 촉매적으로 불활성인 FokI 도메인을 추가로 포함한다.
도 7a 내지 7c는 JAK2 V617F 표적의 염기 편집을 예시한다. 도 7a는 왼쪽에 야생형 DNA 이중 가닥 서열 (서열식별번호: 30)을 도시하며, 코딩된 발린 (V)이 상단에 표시된다. 중간 서열은 돌연변이된 DNA 이중 가닥 서열 (서열식별번호: 31)을 나타내며, 돌연변이체 페닐알라닌 (F)이 상단에 표시된다. 오른쪽에는 2가지 가능한 염기 편집된 결과 (서열식별번호: 32 및 33)가 도시되며, 여기서 편집된 뉴클레오티드는 상단에 세린 (S) 또는 프롤린 (P)에 대한 변화와 함께 볼드체로 표시된다. 도 7b는 JAK2 V617F 돌연변이를 둘러싼 DNA 서열 (서열식별번호: 34)을 도시하며, 2개의 가장 가까운 PAM 부위가 표시된다. 도 7b는 서열식별번호: 79로서의 단백질 서열을 개시한다. 도 7c는 V617F 돌연변이가 없는 K562 세포에서 표시된 염기 편집기를 사용한 예시적인 결과를 도시한다. 염기 편집 창 내의 다른 A:T 쌍은 시험된 염기 편집기의 활성을 평가하기 위해 사용되었다. ABEmax-Cas9NG는 ABEmax에 융합된 Cas9NG 닉카제를 나타낸다. ABEmax-Cas9는 7개의 상이한 ZFP (ZFP 2, ZFP 4, ZFP 6 및 ZFP 7로 제시됨)로 고정되었다. 도 7c는 왼쪽에 3개의 상이한 PAM 부위 (AAT, TAA, AAA; 도 7b 참조)에 대한 결과를 도시한다. 여기에서, ABEmax 발현 구축물 둘 다뿐만 아니라 상응하는 sgRNA가 플라스미드 DNA (각각 600 ng)로서 공급되었다. ZFP 고정된 ABEmax-Cas9NG 구축물은 3개의 PAM 부위 모두에 대해 증가된 효율성을 보여준다 (AAT 및 AAA PAM 부위의 경우 대략 2배이고, TAA PAM 부위의 경우 대략 12배이다). AAT 및 TAA PAM 부위에 대한 염기 편집기는 또한, 더 높은 용량 (800 ng 플라스미드 DNA)에서 시험되었으며 유사한 결과를 보여준다. ZFP 6은 AAT PAM 부위에 대해 대략 2.5배 더 높은 활성을 발생시키고, ZFP 2는 TAA PAM 부위에 대해 대략 17배 더 높은 활성을 발생시킨다.
도 8a 내지 8g는 뉴클레오티드 (예를 들어, 도 1d에 도시된 바와 같은 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용되는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))를 포함하는 예시적인 염기 편집기를 도시하는 개략도이다. 도 8a는 염기 편집기의 뉴클레오티드 함유 단일 가닥 기질과 접촉하기 이전 (왼쪽) 및 이후 (오른쪽) 편집될 표적화된 염기 ("X")를 묘사한다. 도 8b는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#1)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C. 도 8c는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#2)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C. 도 8d는 염기 편집기가 2개의 PNA (서로에 대해 반대 방향으로 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #3 및 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #4)를 포함하는 예시적인 실시양태를 도시한다. 도 8e는 PNA가 구조 N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C (PNA #5)를 포함하는 예시적인 실시양태를 도시한다. 도 8b 내지 8e에서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다. PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다. 도 8f 및 8g는 LNA를 포함하는 염기 편집기의 예시적인 실시양태를 도시한다. 도 8f는 예시적인 LNA (LNA#1) (서열식별번호: 80)를 도시한다. 예시적인 LNA#1 서열은

를 포함한다. 도 8g는 염기 편집기가 서로에 대해 반대 방향으로 도시된 2개의 LNA (LNA#2: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 71) 및 LNA#3: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 72))를 포함하는 예시적인 실시양태를 도시한다. 도 8f 및 8g에서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다.

인공 뉴클레아제, 예컨대 조작된 징크 핑거 뉴클레아제 (ZFN), 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN), RNA 유도 뉴클레아제로서 지칭되기도 하는 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템, 및/또는 아르고노트 시스템에 기반한 뉴클레아제가 의학, 생명 공학 및 농업 분야에 혁명을 일으키고 있다. 이들 분자 도구를 사용하면 유기체 내의 게놈을 이전에는 불가능했던 수준으로 유전자 조작 (예를 들어 편집)할 수 있다. 인공 뉴클레아제는 DNA를 절단할 수 있으므로, 이러한 절단 후에 세포는 오류가 발생하기 쉬운 비상동 말단 결합 (NHEJ)에 의해, 또는 절단 부위를 플랭킹하는 영역과의 상동성을 갖는 기질 DNA의 존재하에 상동성 지향 복구 (HDR)를 통해 기질 DNA를 삽입함으로써 그 파손물을 강제로 '치유'한다. 이러한 프로세스 둘 다는 DNA에서의 이중 가닥 파손 (DSB)으로 시작된다.

본원에는 유전자 변형을 위해 이중 가닥 절단을 사용하지 않는 염기 편집을위한 조성물 (시스템) 및 방법이 기재되어 있다. 염기 편집은 본질적으로, DNA 가닥에서 특이적 염기의 정체를 변경하는 것, 및 편집된 염기의 복구를 피하기 위해 DNA 복구 기구의 조작과 함께 DNA 염기의 관련 부위 특이적 변형에 의존한다. 이는 일반적으로, 단일 가닥 DNA의 영역이 존재하도록 DNA 이중 나선을 개방하는 시스템을 사용함으로써 달성된다. 다음으로, 염기 자체는 뉴클레오시드 구조를 변화시키는 염기 변형 효소, 예컨대 데아미나제에 의해 작용된다. 예를 들어, 활성화 유도 데아미나제 (AID) 및 아포지질단백질 B mRNA 편집 효소 촉매 폴리펩티드-유사 패밀리 단백질 (APOBEC)은 항체 다양화 및 레트로바이러스에 대항한 선천 면역에 중요한 시티딘 데아미나제이다. 이들 효소는 DNA에서 시티딘 (C)을 우라실 (U)로 전환시킨다. 우라실 복구 전에 DNA 복제가 발생하면, 복제 기구는 우라실을 티민 (T)으로서 처리하여, C:G에서 T:A로의 염기쌍 전환이 발생하므로 (문헌 [Yang, et al. (2016) Nat Commun doi 10.1038/ncomms13330]), 시스템은 C에서 T로의 점 돌연변이를 생성하기 위해 사용될 수 있다.

본원에 기재된 바와 같은 염기 편집기 중 임의의 것은 유전자 녹아웃 (예를 들어, 정규 코돈 대신 정지 코돈을 생산하기 위한 염기의 변경; 스플라이스 수용자 부위에서의 염기의 변경); 유전자 발현을 활성화 또는 억제하기 위해 유전자의 제어 (프로모터) 영역에 돌연변이를 도입하는 것; 및/또는 점 돌연변이를 역전시킴으로써 질환 유발 돌연변이를 교정하는 것을 포함하나 이에 제한되지는 않는 임의의 용도를 위한 표적화된 염기 편집에 사용될 수 있다. 염기 편집기 및/또는 염기 편집기에 의해 만들어진 표적화된 변화를 포함하는 (그러나 더 이상 염기 편집기 자체를 포함하지 않음) 세포 및 세포주가 또한 제공된다.

본 발명의 염기 편집기는 현재 사용되고 있는 염기 편집기와 비교 시 예기치 못하게도 우수한 편집 효율성 및/또는 특이성을 제공한다.

총론

본원에 개시된 조성물의 제조 및 사용뿐만 아니라 방법의 실행은 달리 지시되지 않는 한, 분자 생물학, 생화학, 염색질 구조 및 분석, 컴퓨터 화학, 세포 배양, 재조합 DNA 및 관련 분야의 기술 내에 있는 바와 같은 관련 분야에서의 통상적인 기술을 이용한다. 이러한 기술은 문헌에 자세히 설명되어 있다 (예를 들어, 문헌 [Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 및 Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 및 periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; 및 METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999] 참조).

정의

용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호 교환가능하게 사용되며 선형 또는 원형 입체 형태 및 단일 가닥 또는 이중 가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 개시내용의 목적을 위해, 이들 용어는 중합체의 길이에 대해 제한하는 것으로서 해석되서는 안된다. 상기 용어는 자연 뉴클레오티드의 공지된 유사체뿐만 아니라 염기, 당 및/또는 인산염 모이어티 (예를 들어, 포스포로티오에이트 백본)에서 변형되는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특별한 뉴클레오티드의 유사체는 동일한 염기쌍 형성 특이성을 갖는데, 즉 A의 유사체는 T와 염기쌍을 이룰 것이다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 상호 교환가능하게 사용된다. 이러한 용어는 또한, 하나 이상의 아미노산이 상응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.

"결합"은 거대 분자 간의 (예를 들어, 단백질과 핵산 간의)의 서열 특이적, 비-공유 상호작용을 지칭한다. 전체로서의 상호작용이 서열 특이적인 한은, 결합 상호작용의 모든 성분이 서열 특이적 (예를 들어, DNA 백본 내의 인산염 잔기와의 접촉)일 필요는 없다. 이러한 상호작용은 일반적으로 10^-6 M^-1 이하의 해리 상수 (K_d)를 특징으로 한다. "친화도"는 결합 강도를 지칭한다: 증가된 결합 친화도는 더 낮은 K_d와 상관이 있다. "비-특이적 결합"은 온 타겟 서열에 의존적이지 않은 임의의 관심 분자 (예를 들어 조작된 뉴클레아제)와 거대 분자 (예를 들어 DNA) 간에 발생하는 비-공유 상호작용을 지칭한다.

"결합 단백질"은 또 다른 분자와 비공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어, DNA 분자 (DNA 결합 단백질), RNA 분자 (RNA 결합 단백질) 및/또는 단백질 분자 (단백질 결합 단백질)와 결합할 수 있다. 단백질 결합 단백질의 경우, 자체 결합할 수 있고/있거나 (동종 이량체, 동종 삼량체 등을 형성하기 위함) 상이한 단백질(들)의 하나 이상의 분자와 결합할 수 있다. 결합 단백질은 한 가지 초과 유형의 결합 활성을 가질 수 있다. 예를 들어, 징크 핑거 단백질은 DNA 결합, RNA 결합 및 단백질 결합 활성을 가지고 있다. RNA 유도 뉴클레아제 시스템의 경우, RNA 가이드는 뉴클레아제 성분 (Cas9 또는 Cfp1)에 대해 이종이며 둘 다 조작될 수 있다.

"DNA 결합 분자"는 DNA와 결합할 수 있는 분자이다. 이러한 DNA 결합 분자는 폴리펩티드, 단백질의 도메인, 더 큰 단백질 내의 도메인 또는 폴리뉴클레오티드일 수 있다. 일부 실시양태에서, 폴리뉴클레오티드는 DNA인 반면, 다른 실시양태에서, 폴리뉴클레오티드는 RNA이다. 일부 실시양태에서, DNA 결합 분자는 뉴클레아제의 단백질 도메인 (예를 들어, FokI 도메인)인 반면, 다른 실시양태에서 DNA 결합 분자는 RNA 유도 뉴클레아제 (예를 들어 Cas9 또는 Cpf1)의 가이드 RNA 성분이다. DNA 결합 분자는, 예를 들어 하나 이상의 징크 핑거를 통해 또는 징크 핑거 단백질 (ZFP)의 하나 이상의 ZFP 인식 나선 영역 또는 TALE의 RVD와의 상호작용을 통해 서열 특이적 방식으로 DNA와 결합하는 단백질 또는 더 큰 단백질 내의 도메인을 포함할 수 있다. DNA 결합 분자는 또한, CRISPR/Cas 시스템의 단일 가이드 RNA (sgRNA) 및/또는 Ttago 시스템의 DNA 결합 도메인을 포함한다. 용어 징크 핑거 DNA 결합 단백질은 종종 징크 핑거 단백질 또는 ZFP로서 약칭된다.

"징크 핑거 DNA 결합 단백질" (또는 결합 도메인)은 징크 이온의 배위를 통해 그의 구조가 안정화되는 결합 도메인 내의 아미노산 서열의 영역인 하나 이상의 징크 핑거를 통해 서열 특이적 방식으로 DNA와 결합하는 단백질 또는 더 큰 단백질 내의 도메인이다. 용어 징크 핑거 DNA 결합 단백질은 종종 징크 핑거 단백질 또는 ZFP로서 약칭된다.

"TALE DNA 결합 도메인" 또는 "TALE"는 하나 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 TALE와 그의 동족 표적 DNA 서열의 결합에 관여한다. 단일 "반복 단위" ("반복부"로서 지칭되기도 함)는 전형적으로 그 길이가 33개 내지 35개 아미노산이며, 자연적으로 발생하는 TALE 단백질 내에서 다른 TALE 반복 서열과의 적어도 일부 서열 상동성을 나타낸다 (예를 들어, 그 전체 내용이 본원에 참조로 포함된 미국 특허 번호 8,586,526 참조).

DNA 결합 도메인은, 예를 들어 자연적으로 발생하는 징크 핑거 단백질의 인식 나선 영역의 조작 (하나 이상의 아미노산의 변경)을 통해 또는 DNA 결합에 관여한 아미노산 ("반복 가변 2잔기" 또는 RVD 영역)의 조작에 의해, 미리 결정된 뉴클레오티드 서열과 결합하도록 "조작"될 수 있다. 따라서, 조작된 징크 핑거 단백질 또는 TALE 단백질은 비-자연적으로 발생하는 단백질이다. 징크 핑거 단백질 및 TALE를 조작하는 방법의 비-제한적인 예는 설계 및 선택이다. 설계된 단백질은 그의 설계/조성이 주로 합리적 기준으로부터 비롯되는, 자연에서 발생하지 않는 단백질이다. 설계에 대한 합리적 기준은 기존 ZFP 또는 TALE 설계의 정보와 결합 데이터를 저장하는 데이터베이스에서 정보를 처리하기 위한 대체 규칙 및 컴퓨터 알고리즘의 적용을 포함한다 (예를 들어, 미국 특허 번호 8,586,526; 6,140,081; 6,453,242; 및 6,534,261 참조; 또한 국제 특허 공개 번호 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496 참조).

"선택된" 징크 핑거 단백질, TALE 단백질 또는 CRISPR/Cas 시스템은 그의 생산이 주로 실증적 프로세스, 예컨대 파지 디스플레이, 상호작용 트랩, 합리적 설계 또는 하이브리드 선택으로부터 비롯되는, 자연에서는 발견되지 않는 것이다 (예를 들어, 미국 특허 번호 5,789,538; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 및 국제 특허 공개 번호 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; 및 WO 02/099084 참조).

"TtAgo"는 유전자 침묵에 관여하는 것으로 생각되는 원핵 아르고노트 단백질이다. TtAgo는 박테리아 써무스 써모필루스(Thermus thermophilus)로부터 유래된다 (예를 들어, 문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888; G. Sheng, et al. (2013) Proc. Natl. Acad. Sci. U.S.A. 111, 652] 참조). "TtAgo 시스템"은, 예를 들어 TtAgo 효소에 의한 절단을 위한 가이드 DNA를 포함한 필요한 모든 성분이다.

"절단"은 DNA 분자의 공유 백본의 파손을 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단 둘 다가 가능하며, 이중 가닥 절단은 2개의 별개의 단일 가닥 절단 이벤트의 결과로서 발생할 수 있다. DNA 절단은 평활 말단 또는 엇갈린 말단의 생산을 발생시킬 수 있다. 특정 실시양태에서, 융합 폴리펩티드는 표적화된 이중 가닥 DNA 절단에 사용된다.

"절단 절반-도메인"은 제2 폴리펩티드 (동일하거나 상이함)와 연계해서, 절단 활성 (바람직하게 이중 가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제1 및 제2 절단 절반-도메인"; "+ 및 - 절단 절반-도메인" 및 "오른쪽 및 왼쪽 절단 절반-도메인"은 이량체화되는 절단 절반-도메인 쌍을 지칭하기 위해 상호 교환가능하게 사용된다. 용어 "절단 도메인"은 용어 "절단 절반-도메인"과 상호 교환가능하게 사용된다. 용어 "FokI 절단 도메인"은 서열식별번호: 5에 제시된 바와 같은 FokI 서열뿐만 아니라 임의의 FokI 동족체를 포함한다.

"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인 (예를 들어, 또 다른 조작된 절단 절반-도메인)과 함께 절대적인 이종 이량체를 형성하도록 변형된 절단 절반-도메인이다.

본원에 사용된 바와 같은 용어 "편집"은 동일한 위치에서 초기 (예를 들어, 야생형) 염기와 비교 시 뉴클레오티드 염기가 변형되는 프로세스를 지칭한다. 염기 편집 (예를 들어, 표적화된 점 돌연변이)은 편집된 DNA로부터 전사되는 임의의 mRNA에서의 변화를 반드시 재현할 것이다. 아데닌 및 시티딘 데아미나제는 각각의 뉴클레오티드 표적으로부터 아미노 기를 제거하여, 각각 이노신 및 우리딘으로 전환시킨다. DNA 복구 또는 복제 동안, 이노신은 폴리머라제 효소에 의해 구아닌으로서 인식되고 우리딘은 티민으로서 인식되어, 편집된 이중 가닥 DNA에서 A:T 염기쌍이 G:C 염기쌍으로 전환되거나 또는 C:G 염기쌍이 T:A 염기쌍으로 전환된다. "염기 편집 창"은 본원에 기재된 바와 같은 염기 편집기에 의해 편집되어야 하는 임의의 염기를 지칭하며, 전형적으로 표적 DNA에 대한 염기 편집 시스템의 적어도 하나의 성분의 결합 후 접근가능한 영역 내에 있는, 편집 시스템의 임의의 성분으로부터 임의의 거리일 수 있다. PAM 서열을 필요로 하는 염기 편집기 (예를 들어, Cas9 함유 편집기)는 전형적으로 PAM 서열로부터 13개 내지 16개 이상의 뉴클레오티드일 수 있는 3, 4, 5, 6, 7개 또는 그 초과의 뉴클레오티드의 염기 편집 창을 갖는다. 본원에 기재된 바와 같은 염기 편집기는 유전자 녹아웃 (예를 들어, 정규 코돈 대신 정지 코돈을 생산하기 위한 염기의 변경; 스플라이스 수용자 부위에서의 염기의 변경); 유전자 발현을 활성화 또는 억제하기 위해 유전자의 제어 (프로모터) 영역에 돌연변이를 도입하는 것; 및/또는 점 돌연변이를 역전시킴으로써 질환 유발 돌연변이를 교정하는 것을 포함하나 이에 제한되지는 않는 임의의 용도를 위한 표적화된 염기 편집에 사용될 수 있다. 염기 편집기 및/또는 염기 편집기에 의해 만들어진 표적화된 변화를 포함하는 (그러나 더 이상 염기 편집기 자체를 포함하지 않음) 세포주가 또한 제공된다.

용어 "서열"은 DNA 또는 RNA일 수 있고; 선형, 원형 또는 분지형일 수 있으며 단일 가닥 또는 이중 가닥일 수 있는 임의의 길이의 뉴클레오티드 서열을 지칭한다. 용어 "트랜스진(transgene)"은 게놈에 삽입되는 뉴클레오티드 서열을 지칭한다. 트랜스진은 임의의 길이, 예를 들어 2개 내지 100,000,000개 뉴클레오티드 길이 (또는 그 사이 또는 그 이상의 임의의 정수 값), 바람직하게 약 100개 내지 100,000개 뉴클레오티드 길이 (또는 그 사이의 임의의 정수), 보다 바람직하게 약 2000개 내지 20,000개 뉴클레오티드 길이 (또는 그 사이의 임의의 값), 보다 더 바람직하게 약 5 내지 15 kb (또는 그 사이의 임의의 값)일 수 있다.

"염색체"는 세포의 게놈의 전부 또는 일부분을 포함하는 염색질 복합체이다. 세포의 게놈은 종종, 세포의 게놈을 포함하는 모든 염색체의 모음인 그의 핵형으로서 특징지을 수 있다. 세포의 게놈은 하나 이상의 염색체를 포함할 수 있다.

"에피솜"은 복제 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 예는 플라스미드, 미니서클 및 특정 바이러스 게놈을 포함한다. 본원에 기재된 간 특이적 구축물은 에피솜으로 유지될 수 있거나, 또는 또 다른 한편으론, 세포에 안정적으로 통합될 수 있다.

"외인성" 분자는 정상적으로는 세포에 존재하지 않지만 하나 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내로 도입될 수 있는 분자이다. "세포에서의 정상적인 존재"는 세포의 특별한 발달 단계 및 환경 조건과 관련하여 결정된다. 따라서, 예를 들어, 근육의 배아 발달 동안에만 존재하는 분자는 성체 근육 세포에 대한 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 열 충격을 받지 않은 세포에 대한 외인성 분자이다. 외인성 분자는, 예를 들어, 기능 장애 내인성 분자의 기능 버전 또는 정상적으로 기능하는 내인성 분자의 기능 장애 버전을 포함할 수 있다.

외인성 분자는 무엇보다도, 작은 분자, 예컨대 조합 화학 프로세스에 의해 생성되는 것, 또는 거대 분자, 예컨대 단백질, 핵산, 탄수화물, 지질, 당단백질, 지단백질, 폴리사카라이드, 상기 분자의 임의의 변형된 유도체, 또는 상기 분자 중 하나 이상을 포함하는 임의의 복합체일 수 있다. 핵산은 단일 또는 이중 가닥일 수 있고; 선형, 분지형 또는 원형일 수 있으며; 임의의 길이의 것일 수 있는 DNA 및 RNA를 포함한다. 핵산은 이중 나선을 형성할 수 있는 것뿐만 아니라 삼중체 형성 핵산을 포함한다 (예를 들어, 미국 특허 번호 5,176,996 및 5,422,251 참조). 단백질은 DNA 결합 단백질, 전사 인자, 염색질 리모델링 인자, 메틸화된 DNA 결합 단백질, 폴리머라제, 메틸라제, 데메틸라제, 아세틸라제, 데아세틸라제, 키나제, 포스파타제, 라이가제, 데유비퀴티나제, 인테그라제, 리콤비나제, 라이가제, 토포이소머라제, 자이라제 및 헬리카제를 포함하나, 이에 제한되지는 않는다.

외인성 분자는 내인성 분자와 동일한 유형의 분자, 예를 들어 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 감염 바이러스 게놈, 세포 내로 도입된 플라스미드 또는 에피솜, 또는 세포에 정상적으로 존재하지 않는 염색체를 포함할 수 있다. 세포 내로 외인성 분자를 도입하는 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 지질 매개 전달 (즉, 중성 및 양이온성 지질을 포함한 리포좀), 전기천공, 직접 주사, 세포 융합, 입자 충격, 인산칼슘 공동 침전, DEAE-덱스트란 매개 전달 및 바이러스 벡터 매개 전달을 포함하나, 이에 제한되지는 않는다. 외인성 분자는 또한 내인성 분자와 동일한 유형의 분자일 수 있지만, 세포가 유래되는 것과는 상이한 종으로부터 유래된다. 예를 들어, 인간 핵산 서열은 원래 마우스 또는 햄스터로부터 유래된 세포주 내로 도입될 수 있다. 외인성 분자를 식물 세포 내로 도입하는 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 원형질체 형질전환, 탄화 규소 (예를 들어, WHISKERS™), 아그로박테리움(Agrobacterium) 매개 형질전환, 지질 매개 전달 (즉, 중성 및 양이온성 지질을 포함한 리포좀), 전기천공, 직접 주사, 세포 융합, 입자 충격 (예를 들어, "유전자 총"을 사용함), 인산칼슘 공동 침전, DEAE-덱스트란 매개 전달 및 바이러스 벡터 매개 전달을 포함하나, 이에 제한되지는 않는다.

대조적으로, "내인성" 분자는 특별한 환경 조건 하의 특별한 발달 단계에서 특별한 세포에 정상적으로 존재하는 분자이다. 예를 들어, 내인성 핵산은 염색체, 미토콘드리아의 게놈, 엽록체 또는 다른 소기관, 또는 자연적으로 발생하는 에피솜 핵산을 포함할 수 있다. 부가의 내인성 분자는 단백질, 예를 들어, 전사 인자 및 효소를 포함할 수 있다.

본원에 사용된 바와 같은, 용어 "외인성 핵산의 산물"은 폴리뉴클레오티드 및 폴리펩티드 산물, 예를 들어 전사 산물 (폴리뉴클레오티드, 예컨대 RNA) 및 번역 산물 (폴리펩티드)을 모두 포함한다.

"융합" 분자는 2개 이상의 서브유닛 분자가 바람직하게 공유적으로 연결되는 분자이다. 서브유닛 분자는 동일한 화학적 유형의 분자일 수 있거나 또는 상이한 화학적 유형의 분자일 수 있다. 융합 분자의 예는 융합 단백질 (예를 들어, 단백질 DNA 결합 도메인과 절단 도메인 간의 융합물), 절단 도메인과 작동적으로 연합된 폴리뉴클레오티드 DNA 결합 도메인 (예를 들어, sgRNA) 간의 융합물, 및 융합 핵산 (예를 들어, 융합 단백질을 코딩하는 핵산)을 포함하나, 이에 제한되지는 않는다.

세포에서의 융합 단백질의 발현은 융합 단백질을 세포로 전달하거나 또는 융합 단백질을 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 발생할 수 있으며, 여기서 폴리뉴클레오티드가 전사되고 전사체가 번역되어 융합 단백질을 생성한다. 트랜스-스플라이싱, 폴리펩티드 절단 및 폴리펩티드 라이게이션은 또한 세포에서 단백질의 발현에 관여할 수 있다. 폴리뉴클레오티드 및 폴리펩티드를 세포로 전달하는 방법은 본 개시내용의 다른 곳에서 제시된다.

"분할 효소"는 2개 이상의 불활성 폴리펩티드 쇄로 분할된 후 작동가능한 효소로 재어셈블리된 효소이다. 분할 효소를 활성 단백질로 어셈블리하는 것은 종종 근접성에 의해 구동되며, 여기서 각각의 불활성 폴리펩티드 쇄는, 불활성 쇄를 물리적으로 결합할 수 있는 다른 분자에 융합되어 이들을 어셈블리할 수 있으므로, 단편화의 엔트로피 비용을 극복할 수 있다. 융합된 분자는 서로 상호작용하는 다른 단백질일 수 있거나, 또는 서로 상호작용하거나 또는 공통 리간드와 상호작용하는 임의의 유형의 분자일 수 있으므로, 그러한 상호작용이 분할 효소를 구성하는 폴리펩티드의 어셈블리를 야기한다 (예를 들어, 문헌 [Shekhawat and Ghosh (2011) Curr Opin Chem Biol 15(6):789-797] 참조).

본 개시내용의 목적을 위한 "유전자"는 유전자 산물을 코딩하는 DNA 영역 (하기 참조) 뿐만 아니라 이러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지의 여부에 관계없이 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 침묵인자, 인슐레이터, 경계 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함하나, 반드시 이에 제한되지는 않는다.

"유전자 발현"은 특정 유전자에 함유된 정보를 유전자 산물로 전환하는 것을 지칭한다. 유전자 산물은 유전자의 직접 전사 산물 (예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 임의의 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한, 프로세스, 예컨대 캡핑, 폴리아데닐화, 메틸화 및 편집에 의해 변형되는 RNA, 및 예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질을 포함한다.

유전자 발현의 "조정"은 유전자의 활성에 있어서의 변화를 지칭한다. 발현의 조정은 유전자 활성화 및 유전자 억제를 포함할 수 있으나, 이에 제한되지는 않는다. 게놈 편집 (예를 들어, 절단, 변경, 불활성화, 무작위 돌연변이)을 사용하여 발현을 조정할 수 있다. 유전자 불활성화는 본원에 기재된 바와 같은 ZFP, TALE 또는 CRISPR/Cas 시스템을 포함하지 않는 세포와 비교 시 유전자 발현에 있어서의 임의의 감소를 지칭한다. 따라서, 유전자 불활성화는 부분적이거나 완전할 수 있다.

"관심 영역"은 세포 염색질의 임의의 영역, 예컨대 예를 들어, 외인성 분자와 결합하는 것이 바람직한 유전자 또는 유전자 내부 또는 유전자에 인접한 비-코딩 서열이다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합의 목적을 위한 것일 수 있다. 관심 영역은, 예를 들어, 염색체, 에피솜, 소기관 게놈 (예를 들어, 미토콘드리아, 엽록체) 또는 감염 바이러스 게놈에 존재할 수 있다. 관심 영역은 유전자의 코딩 영역 내에, 전사된 비-코딩 영역 내에, 예컨대 예를 들어, 리더 서열, 트레일러 서열 또는 인트론, 또는 코딩 영역의 상류 또는 하류에 있는 비-전사된 영역 내에 있을 수 있다. 관심 영역은 단일 뉴클레오티드 쌍 또는 2,000개 이하의 뉴클레오티드 쌍 길이, 또는 임의의 정수 값의 뉴클레오티드 쌍만큼 작을 수 있다.

"진핵" 세포는 진균 세포 (예컨대 효모), 식물 세포, 동물 세포, 포유 동물 세포, 및 줄기 세포 (다능성 및 다분화능)를 포함한 인간 세포 (예를 들어, T-세포)를 포함하나, 이에 제한되지는 않는다.

용어 "작동적 연결" 및 "작동적으로 연결된" (또는 "작동가능하게 연결된")은 둘 이상의 성분 (예컨대 서열 요소)의 병치와 관련하여 상호 교환가능하게 사용되며, 여기서 상기 성분은 두 성분이 정상적으로 기능하도록 배열되고, 이들 성분 중 적어도 하나가 다른 성분 중 적어도 하나에 발휘되는 기능을 매개할 수 있는 가능성을 허용한다. 예로서, 전사 조절 서열이 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어하는 경우, 이러한 전사 조절 서열, 예컨대 프로모터가 코딩 서열에 작동적으로 연결된다. 전사 조절 서열은 일반적으로, 코딩 서열과 시스로 작동적으로 연결되지만, 바로 인접할 필요는 없다. 예를 들어, 인핸서는 인접하지 않더라도 코딩 서열에 작동적으로 연결되는 전사 조절 서열이다.

단백질, 폴리펩티드 또는 핵산의 "기능적 단편"은 그의 서열이 완전한 길이의 단백질, 폴리펩티드 또는 핵산과 동일하지 않지만 완전한 길이의 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 보유하는 단백질, 폴리펩티드 또는 핵산이다. 기능적 단편은 상응하는 천연 분자보다 더 많이, 더 적게 또는 동일한 수의 잔기를 보유할 수 있고/있거나 하나 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산 또는 단백질의 기능을 결정하는 방법 (예를 들어, 코딩 기능, 또 다른 핵산과 혼성화할 수 있는 능력, 효소 활성 검정)은 관련 기술분야에 널리 공지되어 있다.

폴리뉴클레오티드 "벡터" 또는 "구축물"은 유전자 서열을 표적 세포로 전달할 수 있다. 전형적으로, "벡터 구축물", "발현 벡터", "발현 구축물", "발현 카세트" 및 "유전자 전달 벡터"는 관심 유전자의 발현을 지시할 수 있고 유전자 서열을 표적 세포로 전달할 수 있는 임의의 핵산 구축물을 의미한다. 따라서, 상기 용어는 클로닝 및 발현 비히클뿐만 아니라 통합 벡터를 포함한다.

용어 "대상체" 및 "환자"는 상호 교환가능하게 사용되며 포유 동물, 예컨대 인간 환자 및 비-인간 영장류뿐만 아니라 실험 동물, 예컨대 토끼, 개, 고양이, 래트, 마우스 및 다른 동물을 지칭한다. 따라서, 본원에 사용된 바와 같은 용어 "대상체" 또는 "환자"는 본 발명의 발현 카세트가 투여될 수 있는 임의의 포유 동물 환자 또는 대상체를 의미한다. 본 발명의 대상체는 장애가 있는 대상체를 포함한다.

본원에 사용된 바와 같은 용어 "치료하는 것" 및 "치료"는 증상의 중증도 및/또는 빈도에 있어서의 감소, 증상 및/또는 근본 원인의 제거, 증상 및/또는 그의 근본 원인의 발생 예방, 및 손상의 개선 또는 교정을 지칭한다. 암, 일원성 질환 및 이식편 대 숙주 질환은 본원에 기재된 조성물 및 방법을 사용하여 치료될 수 있는 병태의 비-제한적인 예이다.

"염색질"은 세포 게놈을 포함하는 핵단백질 구조이다. 세포 염색질은 핵산, 주로 DNA, 및 히스톤 및 비-히스톤 염색체 단백질을 포함한 단백질을 포함한다. 대부분의 진핵 세포 염색질은 뉴클레오솜의 형태로 존재하며, 여기서 뉴클레오솜 코어는 히스톤 H2A, H2B, H3 및 H4 중 각각 2개를 포함하는 옥타머와 연합된 대략 150개 염기쌍의 DNA를 포함하고; 링커 DNA (유기체에 따라 가변적 길이)는 뉴클레오솜 코어 사이에서 연장된다. 히스톤 H1 분자는 일반적으로, 링커 DNA와 연합된다. 본 개시내용의 목적을 위해, 용어 "염색질"은 원핵과 진핵 둘 다의 모든 유형의 세포 핵단백질을 포괄하는 것을 의미한다. 세포 염색질은 염색체 및 에피솜 염색질 둘 다를 포함한다.

"접근가능한 영역"은 핵산에 존재하는 표적 부위가 표적 부위를 인식하는 외인성 분자에 의해 결합될 수 있는 세포 염색질 내의 부위이다. 임의의 특별한 이론에 얽매이고자 한 것은 아니지만, 접근가능한 영역은 뉴클레오솜 구조로 패키징되지 않은 영역인 것으로 여겨진다. 접근가능한 영역의 뚜렷한 구조는 화학적 및 효소적 프로브, 예를 들어, 뉴클레아제에 대한 그의 감도에 의해 종종 검출될 수 있다.

"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재하는 경우 결합 분자가 결합할 핵산의 일부분을 규정하는 핵산 서열이다. 예를 들어, 서열 5'-GAATTC-3'은 Eco RI 제한 엔도뉴클레아제에 대한 표적 부위이다. "의도된" 또는 "온 타겟" 서열은 결합 분자가 결합하고자 하는 서열이고, "의도하지 않은" 또는 "오프 타겟" 서열은 의도된 표적이 아닌 결합 분자에 의해 결합된 임의의 서열을 포함한다.

용어 "DNA 탈안정화 분자" 및 "DNA 풀림 분자"는 염기 편집기에 의해 표적화된 염기의 접근성 (예를 들어, 노출에 의해)을 증가시키는 것을 도와주는 임의의 분자 (예를 들어, 단백질, 뉴클레오티드, 작은 분자 등)를 지칭하기 위해 상호 교환가능하게 사용된다. 상기 용어는 닉카제, 올리고뉴클레오티드 (LNA, PNA, BNA 등), RNA 프로그램가능한 시스템 (예를 들어, sgRNA에 작동가능하게 연결된 Cas 단백질), 및 다른 단백질 (예를 들어, 표 A)을 포함하나, 이에 제한되지는 않는다.

염기 편집기

본원에 기재된 염기 편집 조성물 (시스템)은 이중 가닥 파손을 유도하지 않고 개별 DNA 염기쌍의 정체를 직접 변화시킬 수 있다. 따라서, 염기 편집기는 표적 세포에 대한 DNA 복구 경로 선호도에 의존하지 않는다. 더욱이, 표적 DNA에는 이중 가닥 파손이 없기 때문에, 유리 DNA 말단이 없으므로, 전위가 없다.

본원에 기재된 염기 편집기는 C:G 쌍을 T:A 쌍으로 변화시키는 시토신 염기 편집기 (CBE), 또는 A:T 쌍을 G:C 쌍으로 변화시키는 아데닌 염기 편집기 (ABE)일 수 있다. 이들 염기 편집기는, 예를 들어 정규 코돈을 정지 코돈으로 전환 (예를 들어, 시토신 염기 편집기를 사용함)시키고/시키거나 시토신 또는 아데닌 염기 편집기를 사용하여 스플라이스 수용자 부위를 돌연변이시킴으로써 불활성화 (유전자 녹아웃)에 사용될 수 있다. 또한, 본원에 기재된 바와 같은 염기 편집기는 유전자의 발현을 활성화 또는 억제하기 위해 유전자의 제어 (예를 들어, 프로모터 영역)를 변경하는 데 사용될 수 있다. 더욱이, 염기 편집은 돌연변이, 특히 질환 유발 돌연변이를 교정하는 데 사용될 수 있다.

제1 APOBEC-dCas9 염기 편집기의 개발에 이어, 우라실 DNA 글리코실라제 (UGI)가 부가된, BE2라고 하는 제2 염기 편집기가 개발되었다. 염기 절제 복구는 G:U 미스매치에 대한 세포의 1차 반응이며 우라실 N-글리코실라제 (UNG)에 의한 우라실의 절제에 의해 시작된다. 편집된 G:U 중간체를 UNG에 의한 절제로부터 보호하기 위한 일환으로, 83-아미노산 우라실 글리코실라제 억제제 (UGI)를, 촉매적으로 데드 Cas9 (dCas9)의 C 말단에 직접 부가하여 효율성을 증가시켰다 (Komor, et al. (2017) Science Advances 3(8):eaao4774). 염기 편집기의 초기 버전에서는, 전형적으로 데드 Cas9를 사용하여, 편집된 염기 반대편에 있는 뉴클레오티드 염기의 최종 전환을 수행하기 위해 DNA 복제 기구를 사용하도록 하였다. 또한, Cas 닉카제는 편집된 염기를 포함하는 가닥의 반대편 가닥에 닉을 생성하는 데 사용되었다. 닉의 생성은 DNA 복구 기구를 끌어들여, 닉의 하류 영역이 절제되고 편집된 가닥을 주형으로서 사용하여 대체되도록 한다. 시티딘 염기 편집기 BE3는 닉카제인 Cas, Cas9 D10A를 사용하여 효율성을 또한 증가시켰다 (Kim, et al. (2017) Nat Biotechnol 35(4):371-376). 또한 또 다른 변이체에서, BE4 시스템은 훨씬 더 높은 효율성을 위해 복합체의 N- 및 C-말단 단부 둘 다에서 2개의 UGI 도메인을 사용한다. 또 다른 시티딘 데아미나제 시스템은 닉카제 Cas9와 조합하여 활성화 유도 시티딘 데아미나제 (AID)에 의존한다 ("표적-AID").

염기 편집기가 DNA와 상호작용할 때, Cas 기반 편집기는 상호작용할 PAM 서열을 필요로 하며, 활성을 위한 창 (염기 편집 창)은 전형적으로 PAM 서열의 5'말단으로부터 13 내지 16개 염기이다 (또한 도 2 참조). 상기 기재된 상이한 편집 시스템의 활성 창은 다양하다. 표적-AID 시스템은 PAM 서열로부터 더 멀리 떨어진염기를 편집하는 반면, BE4 시스템은 PAM에 더 가까운 염기를 편집한다. 염기 편집기는 또한, Cpf1 CRISPR 시스템을 기반으로 구축되었다 (상기 문헌 [Eid, et al.]). 또한, 염기 편집기의 BE4 입체 배치는 에스. 피오게네스(S. pyogenes) 및 에스. 아우레우스(S. aureus) 유래 CRISPR 시스템 둘 다를 사용하여 개발되었다 (각각 BE4 및 SaBE4). 따라서, Cas9 염기 편집 시스템은 표적 부위로부터 적절한 간격을 두고 있는 PAM 서열의 가용성에 의해 제한 (거리가 염기 편집기의 효율성 및/또는 특이성에 상당한 영향을 미칠 수 있기 때문이다)되고/되거나 염기 편집 창으로부터의 PAM 서열의 거리 (도 2에 도시된 바와 같이, 표적 염기 (예를 들어, A)와 NGG PAM의 5' 단부 사이의 13 내지 16개 염기)에 의해 제한된다.

따라서, 본 발명 이전에, Cas9 염기 편집기는 게놈 전반에서의 오프 타겟 효과뿐만 아니라 방관자 효과 (표적화된 염기 근처에서 의도하지 않은 편집)를 유도하는 것으로 공지되어 있다 (예를 들어, 문헌 [Zuo, et al. (2019) Science 364(6437):289-292; Jin, et al. (2019) Science 364(6437):292-295; Gruenewald, et al. (2019) Nature 569(7756):433-437] 참조).

부가의 염기 편집기 입체 배치는 박테리오파지 뮤로부터의 GAM 단백질의 사용을 포함하였다. 일부 경우에, 일부 유형의 염기 편집의 결과로서 인델 (삽입 및 결실)이 관찰되었다. 일부 염기 편집기는 U 반대편 가닥을 닉킹하기 때문에, UNG에 의한 글리코시드 결합의 절단에 이어, 그 결과로 생성된 아퓨린 또는 아피리미딘 부위의 AP 리아제에 의한 프로세싱이 이중 가닥 DNA 파손 (DSB)을 발생시켜, 잠재적으로 인델 형성을 발생시킬 수 있다. 박테리오파지 뮤의 Gam 단백질은 DSB의 말단과 결합하고 분해로부터 보호하므로, DSB의 유리 말단과 결합하는 Gam을 사용하면, 염기 편집의 프로세스 동안 인델 형성을 감소시킬 수 있다 (Komor, et al. (2016) Nature 533:420-424; Komor, et al. (2017) Science Advances 3(8)). 시티딘 데아미나제 편집기 이외에, 아데닌 염기를 이노신으로 전환시키는 합성 아데노신 데아미나제를 사용하는 염기 편집기가 개발되었다 (아데닌 염기 편집기: "ABE"; 문헌 [Gaudelli, et al. (2017) Nature 551(7681):464-471] 참조). 이노신은 시티딘과 염기쌍을 형성하고, 이후 구아닌으로 교정되어 A가 G로 전환되거나, 또는 A:T가 G:C로 전환될 수 있다.

상기 기재된 바와 같이, 본원에 기재된 바와 같은 염기 편집기는 DNA의 단일 가닥 영역 내에 있는 표적화된 염기를 노출시키기 위해 DNA 나선을 "개방"하는 분자를 추가로 포함할 수 있다. 이를 달성할 수 있는 것으로 통상적으로 공지된 분자는 DNA 헬리카제, 나선 탈안정화 분자 및 박테리아 DnaA 단백질, 단일 가닥 DNA 결합 단백질, 삼중체 형성 올리고뉴클레오티드 또는 올리고뉴클레오티드를 포함하나 이에 제한되지는 않는다.

특정 실시양태에서, 염기 편집기는 편집을 위해 표적화된 염기를 노출하기 위해 DNA 나선의 풀림 (개방)을 도와주는 단백질 도메인을 포함한다. 적합한 단백질의 비-제한적인 예가 표 A에 제시된다.

<표 A>

특정 실시양태에서, 염기 편집기 (예를 들어, Cas 무함유 염기 편집기)는 하나 이상의 DNA 올리고뉴클레오티드, 하나 이상의 RNA 올리고뉴클레오티드 및/또는 하나 이상의 펩티드 핵산 (PNA), 하나 이상의 잠금 핵산 (LNA) 및/또는 하나 이상의 가교 핵산 (BNA)을 포함한 하나 이상의 합성 올리고뉴클레오티드를 포함한다 (예를 들어, 도 1d 참조). 예를 들어, PNA에 관해서는 문헌 [Nielsen, et al. (1991) Science 254:1497-1500 및 Bahal, et al. (2014) Curr Gene Ther. 14(5):331-342]을 참조하고; LNA에 관해서는 문헌 [Moreno, et al. (2013) Nucleic Acid Res. 41(5):3257-3273 및 Geny, et al. (2016) Nucleic Acid Res. 44(5):2007-2019]을 참조하며; BNA에 관해서는 문헌 [Rahman, et al. (2007) Nucleosides Nucleotides Nucleic Acids 26(10-12):1625-1628]을 참조한다.

특정 실시양태에서, 본 발명의 Cas9 무함유 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제, 및 임의로 하나 이상의 DNA 탈안정화 인자를 포함한다. 특정 실시양태에서, DNA 탈안정화 인자는 단백질 (예를 들어, 표 A에 제시된 바와 같음) 또는 올리고뉴클레오티드 (예를 들어, LNA, PNA 또는 BNA)이다. 다른 실시양태에서, Cas9 무함유 염기 편집기는 임의의 Cas9 등가물, 예컨대 Cas12a (완전한 길이의 또는 말단절단된 Cas12 단백질 포함)를 포함한, DNA 탈안정화 (풀림) 특성을 가진 비-Cas9 CRISPR 단백질을 포함한다. 다른 실시양태에서, Cas9 무함유 염기 편집기는 CRISPR 시스템으로부터의 임의의 요소를 포함하지 않는다. 하나 이상의 비-Cas9 DNA 탈안정화 (풀림) 인자(들) (예를 들어, 표 A의 단백질, LNA, PNA, BNA 등)는 염기 편집기의 임의의 성분, 예를 들어 ZFP-데아미나제 융합 단백질의 한 성분 및/또는 ZFN 닉카제의 성분 중 임의의 것에 작동가능하게 연결될 수 있다.

특정 실시양태에서, 염기 편집기는 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용될 수 있는 하나 이상의 뉴클레오티드 서열, 예를 들어 하나 이상의 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함한다. 이는, 예를 들어 이중 나선 침입, 삼중체 침입 또는 테일 클램프에 의해 용이하게 할 수 있다 (Quijano, et al. (2017) Yale J. Biol and Med. 90:583-598; Pellestor and Paulasova (2004) European J. Human Genetics 12:694-700; Schleifman, et al. (2011) Chem & Bio. 18:1189-1198). 염기 편집기의 하나 이상의 뉴클레오티드 서열의 구조는 DNA 및/또는 RNA 및/또는 PNA 및/또는 LNA 및/또는 BNA 염기의 길이, 수 및 위치; 포스포로티오에이트 결합; 표적 서열 조성에 따른 이들 올리고뉴클레오티드의 다른 통상적인 변형에 있어서 다양할 것이다.

특정 실시양태에서, 염기 편집기는 하나 이상의 PNA, 예를 들어, 미니PEG 치환과 증강된 결합, 증가된 용해도 및 개선된 전달을 위한 감마 위치를 함유하는 감마 PNA를 포함한다 (Bahal, et al. (2014) Current Gene Ther. 14(5):331-342). 특정 실시양태에서, PNA는 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, 하나 이상의 PNA는 하기 구조를 갖는다:

(여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다. 특정 실시양태에서, 하나 이상의 PNA는 도 8b 내지 8e에 도시된 바와 같은 하나 이상의 PNA를 포함한다.

다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 하나 이상의 LNA는 하기 구조를 갖는다:

(여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다) (예를 들어, 문헌 [Bijsterbosch, et al. (2000) Nucleic Acids Res. 28:2717-2725; Bijsterbosch, et al. (2002) J. Pharmacol. Exp. Ther. 302:619-626; Manoharan (2002) Antisense Nucleic Acid Drug Dev 12:103-28; M. Manoharan (2004) Curr Opin Chem Biol. 8:570-9] 참조). 특정 실시양태에서, 염기 편집기는 도 8f 또는 도 8g에 도시된 바와 같은 하나 이상의 LNA를 포함한다.

하나 이상의 DNA 탈안정화 인자는 염기 편집기 (예를 들어, ABE 및/또는 CBE) 및/또는 닉카제와 독립적으로 및/또는 함께 제공될 수 있다. 특정 실시양태에서, DNA 탈안정화 인자(들)는 임의의 방향 (예를 들어, N- 및/또는 C-말단)으로 ZFP 및/또는 ZFN 닉카제에 융합된다. DNA 탈안정화 인자(들)는 염기 편집기 표적 부위의 1 kb 창 내에서 결합할 수 있다.

특정 실시양태에서, 본원에는 염기 편집기 (예를 들어, Cas9 아데닌 또는 시토신 염기 편집기) 및 염기 편집기 근처의 표적 부위 (RANGE)와 특이적으로 결합하는 하나 이상의 부가의 DNA 결합 도메인 (예를 들어, ZFP, TALE, 부가의 sgRNA)을 포함하는 염기 편집 시스템이 기재된다. 특정 실시양태에서, Cas9 함유 염기 편집 시스템은 Cas9 닉카제 및 다른 성분과 관련하여 Cas9 닉카제를 고정하고/하거나 염기 편집기의 하나 이상의 성분을 위치시키는 역할을 함으로써, 염기 편집의 특이성 및/또는 효율성을 증가시키는 하나 이상의 DNA 결합 분자 (예를 들어, ZFP)를 포함한다. 하나 이상의 DNA 결합 분자 (예를 들어, ZFP 앵커(들))는 전형적으로, 염기 편집기 (예를 들어, Cas9 또는 Cas9 무함유 염기 편집기) 및/또는 표적화된 염기의 1 내지 50개 (또는 그 사이의 임의의 값) 뉴클레오티드 내의 표적 부위와 결합한다. DNA 결합 분자는 염기 편집기 및/또는 표적화된 염기에 대한 5' 및/또는 3'와 결합할 수 있다. 특정 실시양태에서, 본원에 기재된 바와 같은 Cas9 염기 편집기는 2개 이상의 ZFP 도메인, 예를 들어 데아미나제 도메인 또는 그의 성분에 작동가능하게 연결된 ZFP 도메인 및 ZFP 앵커 도메인을 포함한다 (예를 들어, 도 1b 참조). 특정 실시양태에서, 적어도 하나의 DNA 결합 도메인은, 임의로 염기 편집기에 의해 결합된 것과 동일하거나 상이한 가닥 상에서, 염기 편집기의 표적 부위 5'와 결합한다. 예를 들어, 하나 이상의 부가의 ZFP 앵커가 사용되고 시스템의 염기 편집기의 표적 부위 5'와 염기 편집기에 의해 결합된 것과 동일한 가닥 상에서 특이적으로 결합하는 예시적인 실시양태에 관해서는, 도 1b, 오른쪽 하단 도식; 도 3; 및 도 7a를 참조한다. 하나 이상의 ZFP 앵커를 포함하면 염기 편집기의 효율성 및/또는 특이성이 증가할 수 있으며, 예를 들어 일부 경우에는, ZFP 앵커를 포함하지 않는 염기 편집기와 비교 시 2배 내지 5배 (또는 그 사이의 임의의 값), 10배 내지 100배 (또는 그 사이의 임의의 값) 또는 100배 초과한다.

다른 실시양태에서, 본원에는 (1) Cas9 닉카제 (예를 들어, 아데노신 데아미나제의 촉매적으로 불활성인 단량체를 포함함); (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 앵커 DNA 결합 도메인 (예를 들어, ZFP); 및 (3) 아데노신 데아미나제의 촉매적으로 불활성인 단량체 및 Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 결합하는 DNA 결합 도메인 (예를 들어, ZFP)을 포함하는 비-Cas9 닉카제 (예를 들어, ZFP-닉카제)를 포함하는 염기 편집 시스템이 기재된다. Cas9 닉카제 및 비-Cas9 닉카제 (예를 들어, ZFN 닉카제)의 A 데아미나제 단량체의 이량체화 시 이량체화되어 기능적 데아미나제가 형성된다. 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 표적의 동일하거나 상이한 가닥 및/또는 Cas9 닉카제의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 Cas9 닉카제의 반대 쪽에 있는 반대 가닥과 결합한다 (예를 들어, 도 1b, 상단 도식 참조).

다른 실시양태에서, 본원에는 (1) Cas9 닉카제; (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 앵커 DNA 결합 도메인 (예를 들어, ZFP); 및 (3) A 또는 C 데아미나제를 포함하는 비-Cas9 닉카제 (예를 들어, ZFP-닉카제)를 포함하는 염기 편집 시스템이 기재된다. 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 표적의 동일하거나 상이한 가닥 및/또는 Cas9 닉카제의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, 앵커 DNA 결합 도메인 및 비-Cas9 닉카제 염기 편집기는 Cas9 닉카제의 반대 쪽에 있는 반대 가닥과 결합한다 (예를 들어, 도 1b, 하단 중간 도식 참조).

다른 실시양태에서, 본원에는 (1) sgRNA에 작동가능하게 연결된 Cas9 단백질 (예를 들어, dCas9); (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 앵커 DNA 결합 도메인 (예를 들어, ZFP 앵커); (3) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 융합 단백질이며, 여기서 융합 단백질은 Cas9 단백질에 대해 3' 또는 5'인 융합 단백질; 및 (4) Cas9 단백질 및/또는 ZFP의 3' 또는 5'와 결합하는 ZFN 닉카제를 포함하는 염기 편집 시스템이 기재된다. 앵커 DNA 결합 도메인 및 비-Cas9 단백질은 표적의 동일하거나 상이한 가닥 및/또는 Cas9 단백질의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, ZFP-데아미나제 융합 단백질의 ZFP 및 임의적 앵커 ZFP는 반대 가닥과 결합한다 (예를 들어, 도 1c 참조). 추가 실시양태에서, 염기 편집기는 ZFN 닉카제를 포함하지 않는다.

본원에 기재된 Cas9 염기 편집기는 sgRNA를 포함하는 염기 편집기에 대해 이용가능한 PAM 서열을 확장 (완화)하는 것을 포함하여, 효율적이고 표적화된 염기 편집에 사용될 수 있는 PAM 서열의 관점에서 놀랍고도 예상치 못한 이점을 제공한다.

또한 본원에는 Cas9 염기 편집기를 포함하지 않는 (예를 들어, Cas9 닉카제 또는 Cas9 단백질이 결여되는) 염기 편집기 (ABE 또는 CBE)가 기재된다 (예를 들어, 도 1a 내지 도 1d 참조).

특정 실시양태에서, 염기 편집기는 (1) 비-Cas9 닉카제, 예를 들어 한 쌍의 ZFN (뉴클레아제 도메인에 작동가능하게 연결된 ZFP)을 포함하는 ZFN 닉카제이며, 여기서 상기 쌍의 뉴클레아제 도메인 중 하나가 촉매적으로 불활성인 것인 ZFN 닉카제 (예를 들어, 미국 특허 번호 8,703,489; 9,200,266; 9,631,186; 및 10,113,207 참조); 및 (2) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 ZFP 염기 편집기를 포함한다 (예를 들어, 도 1b, 하단 왼쪽 도식 참조).

다른 실시양태에서, 염기 편집기는 임의의 RNA 프로그램가능한 분자를 포함하는 DNA 탈안정화 분자를 포함한다. 특정 실시양태에서, DNA 탈안정화 분자는 Cas9 단백질 (예를 들어, dCas9) 및 sgRNA를 포함하는 RNA 프로그램가능한 분자를 포함한다. 다른 실시양태에서, RNA 프로그램가능한 분자는 Cas9 단백질 (예를 들어, Cpf1 (Cas12a로서 공지되기도 함), C2c1, C2c2 (Cas13a로서 공지되기도 함), C2c3, Cas1, Cas2, Cas4, CasX 및 CasY); 및 아데노신 또는 시토신 데아미나제가 아니다. 임의로, 염기 편집기는 적어도 하나의 ZFP DNA 결합 도메인 (예를 들어, 아데노신 또는 시토신 데아미나제에 작동가능하게 연결된 ZFP DNA 결합 도메인; DNA 탈안정화 분자의 어느 한 쪽에 있는 ZFP 앵커; 및/또는 ZFN 닉카제의 임의의 조합)을 추가로 포함한다.

다른 실시양태에서, Cas9 무함유 염기 편집기는 ZFN 닉카제, 및 ABE 또는 CBE (예를 들어, ZFP에 작동가능하게 연결됨) 및 표적 염기에 접근할 수 있게 하는 (예를 들어, DNA를 풀리게 하는) 하나 이상의 DNA 탈안정화 분자를 포함한다 (예를 들어, 도 1d 참조). DNA 탈안정화 (풀림) 분자의 비-제한적인 예는 표 A에 제시된 바와 같은 단백질 도메인과, 도 8에 도시된 바와 같은 LNA 및/또는 PNA를 포함한 핵산을 포함한다. ZFN 닉카제는 촉매적으로 활성이고/이거나 촉매적으로 불활성인 FokI 도메인에서의 하나 이상의 돌연변이 및/또는 ZFP 백본에 대한 하나 이상의 돌연변이를 포함할 수 있다 (예를 들어, 미국 특허 공개 번호 2018/0087072 참조). 특정 실시양태에서, 본원에 기재된 바와 같은 염기 편집기는 Cas9 무함유일 수 있지만 비-Cas9 CRISPR 단백질을 포함할 수 있다.

Cas9 무함유 (예를 들어, ZFP) 염기 편집기 중 임의의 것은, 예를 들어 DNA의 추가 풀림이 표적의 접근성을 증가시킴으로써 염기 편집기 기능을 증대시키는 경우에, 하나 이상의 부가의 DNA 탈안정화 인자 (예를 들어, DNA 헬리카제, 나선 탈안정화 분자 및 박테리아 DnaA 단백질, 단일 가닥 DNA 결합 단백질, 올리고뉴클레오티드 등)를 추가로 포함(또는 동원)할 수 있다. 하나 이상의 DNA 탈안정화 인자는 닉카제 및/또는 A 또는 C 데아미나제 함유 분자와 연합될 수 있다. 특정 실시양태에서, DNA 탈안정화 인자 (예를 들어, DNA 올리고)는 도 1d에 도시된 바와 같이 ZFN 닉카제와 연합된다.

다른 실시양태에서, 본원에는 (1) 적어도 하나의 DNA 탈안정화 분자 (예를 들어, 비-Cas9 단백질); (2) DNA 탈안정화 분자에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 DNA 결합 도메인 (예를 들어, ZFN 앵커); 및 (3) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 융합 단백질이며, 여기서 융합 단백질은 DNA 탈안정화 분자에 대해 3' 또는 5'인 것인 융합 단백질을 포함하는 염기 편집 시스템이 기재된다.

Cas9 무함유 염기 편집기는 Cas9 염기 편집기에 비해, 하기를 포함하나 그에 제한되지는 않는 몇 가지 놀랍고 예상치 못한 이점을 제공한다: (i) 본 발명자들은 99% 이상의 절단 효율로 ZFN을 구축할 수 있기 때문에 Cas9 의존적 오프 타겟 효과가 없고 (오프 타겟 효과가 없음); (ii) ZFP가 본질적으로 인간 게놈 내의 임의의 서열을 표적으로 할 수 있으므로 PAM 제한을 제거하고; (iii) 현재의 Cas9 염기 편집기에 널리 퍼진 (예를 들어, 표적 창 내에서의) 방관자 돌연변이를 감소 및/또는 제거하고/하거나; (iv) 감소된 구축물 크기로 인해 AAV 전달 (생체 내에서 기능적인 것으로 공지됨)을 촉진시킨다.

따라서, cas9 무함유 염기 편집기는 통상적인 Cas9 염기 편집기에 비해, 하기를 포함하나 그에 제한되지는 않는 상당한 이점을 제공한다: 표적 특이성; 다양성; 방관자 돌연변이의 제어 또는 제거; 및 전달의 용이성. 표적 특이성의 관점에서, Cas9 무함유 ZFP 염기 편집기는 오프 타겟 효과가 거의 또는 전혀 없이 편집 시 99% 효율적으로 설계될 수 있는 반면, Cas9 염기 편집기는 더 높은 비율의 오프 타겟 효과를 나타낸다. 유사하게, 비-Cas9 ZFP 염기 편집기는 Cas9 염기 편집기의 경우에 관찰될 수 있는 바와 같은 방관자 돌연변이를 제어 (감소)하거나 제거한다. 더욱이, 비-Cas9 ZFP 염기 편집기의 표적 부위의 선택은 PAM 요구 사항에 의해 제한되는 반면, Cas9 무함유 ZFP 염기 편집기는 본질적으로 임의의 표적 서열을 표적으로 할 수 있다. 또한, 비-Cas9 염기 편집기의 감소된 구축물 크기로 인해, AAV 벡터를 사용하여 전달할 수 있으므로, 치료적 (생체 내) 용도를 크게 확장할 수 있다.

특정 실시양태에서, 본원에 기재된 염기 편집기 (염기 편집 시스템)는 (1) 염기 편집 창 및/또는 (2) 염기 편집 창과 PAM 서열 개재의 5' 단부 사이의 염기 내에서 변화될 단일 염기 (표적 염기)를 포함한다 (또한 도 2 참조). DNA 편집 창이 개방되면, 다른 비-표적 염기 (아데닌 및/또는 시토신)가 염기 편집기에 의한 잠재적인 변형을 위해 열려 있다. 이는 표적이 PAM 서열의 5' 단부로부터 떨어져 있는 13 내지 16개의 뉴클레오티드일 수 있지만, 이들 개재 뉴클레오티드 및/또는 염기 편집 창에 존재하는 표적화된 염기 (예를 들어, 아데닌 또는 시토신)도 또한 변경될 수 있다는 것을 의미한다. "방관자" 돌연변이로서 지칭되기도 하는 이러한 비-표적화된 돌연변이는 염기 편집 프로세스에서 바람직하지 않을 수 있다. 일부 상황에서는, 편집 창에서 표적화될 염기 (아데닌 염기 편집기의 경우 아데닌 또는 시티딘 염기 편집기의 경우 시티딘)를 포함하지 않는 PAM 서열을 선택함으로써 방관자 돌연변이를 피할 수 있다. 또 다른 한편으론, 및/또는 PAM 서열의 선택 이외에, 본 발명은 ZFN 닉카제 기능적 도메인과 쌍을 이룬 ZFP 앵커를 포함하는 본원에 기재된 바와 같은 염기 편집기를 사용하고, PAM 요구 사항을 제거하며, 사용자가 편집기를 임의의 최적의 위치에 배치할 수 있음으로써 방관자 돌연변이를 감소 또는 제거한다.

일부 실시양태에서, 본원에는 다양한 융합 단백질을 포함하는 복합체 (시스템)이 개시된다. 일부 실시양태에서, Cas 단백질은 DNA에 대한 융합 단백질의 결합 특이성을 증가시키기 위해 대체 DNA 결합 도메인에 융합될 수 있다 (문헌 [Bolukbashi, et al. (2015) Nat Methods 12(12):1150-1156] 참조). 예를 들어, ZFP, TtAgo 및 TALE DNA 결합 도메인이 dCas에 융합될 수 있다. 일부 실시양태에서, dCas는 PAM 특이성을 변경시키는 돌연변이 (문헌 [Gao, et al. (2017) Nature Biotechnology 35:789-792; Virginijus Siksnys (2016) Mol Cell 61:793] 참조) 또는 PAM 인식에 대한 요구 사항을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, 염기 편집기는 Cas 뉴클레아제가 결여된다.

이러한 접근법의 잠재적인 표적은 많다. 치료될 수 있는 예시적인 질환에 관여한 유전자의 질환 편집의 치료 및/또는 예방을 위한 염기 편집의 비-제한적인 예는 겸상 적혈구병, 혈우병, 낭포성 섬유증, 페닐케톤뇨증, 테이 삭스병, 색맹, 파브리병, 프리드라이히 운동실조, 전립선암 및 다른 많은 것을 포함한다.

따라서, 본원에 기재된 바와 같은 염기 편집 시스템은 임의의 질환 관련 유전자의 발현을 변경하는 데 사용될 수 있다. 특정 실시양태에서, 유전자는 암, 예를 들어 JAK2 V617F 돌연변이와 연관된다. 이러한 돌연변이는 골수 증식성 신생물의 확장에 있어 중요한 역할을 한다. JAK2는 전사 인자의 STAT 패밀리의 인산화를 통해 막 결합된 수용체로부터 시토카인 및 성장 인자 신호를 변환시킨다. V617F 돌연변이는 구성적 티로신 인산화 활성을 유도하고 시토카인 과민성 (문헌 [James, et al. (2005) Nature 434:1144-1148]) 및 시토카인의 부재 하에 세포가 증식하도록 구동시킬 수 있는 능력을 촉진한다 (Zhao, et al. (2005) J. Biol Chem 280 (24):22788-22792). 일부 JAK2 V617F 장애 (예를 들어, 원발성 골수 섬유증)의 경우, 유일한 치료법은 조혈 세포 이식이지만, 현재의 접근법은 종종 질환 재발 및 이식편 대 숙주 질환과 연관이 있다 (Byrne, et al. (2018) Ther Avd Hematol 9(9):251-259). 돌연변이를 제거하기 위해 대상체의 조혈 줄기 세포/전구 세포 (HSC/PC)를 편집하면, 이들 질환을 성공적으로 치료할 수 있다.

특정 실시양태에서, 염기는 알파-1 항트립신 (SERPINA 유전자좌 내)을 표적으로 한다. A1AT 단백질에서 상염색체 열성 결핍을 유발시키는 유전자좌에서의 돌연변이는 간 및 폐 질환 둘 다와 연관이 있다. 북유럽 혈통의 사람들에게 가장 흔한 결핍 대립 유전자 중 하나인 PiZ 돌연변이는 A1AT 단백질의 약 10 내지 20%만 생산되도록 한다. 이러한 돌연변이는 엑손 5에서의 단일 돌연변이에 의해 야기되어, 아미노산 위치 342에서의 리신이 글루타민으로 치환되며, 여기서 DNA 내의 위치 1096에 있는 G는 돌연변이된 유전자 서열에서의 A이다 (문헌 [Fregonese and Stolk (2008) Orphanet J Rare Dis 3:16]에서 검토됨).

DNA 결합 분자/도메인

본원에는 임의의 관심 유전자 또는 유전자좌에서의 표적 부위와 특이적으로 결합하는 하나 이상의 DNA 결합 분자/도메인을 포함하는 조성물이 기재된다. 징크 핑거 DNA 결합 도메인, TALE DNA 결합 도메인, CRISPR/Cas 뉴클레아제의 DNA 결합 부분 (가이드 또는 sgRNA), 및/또는 메가뉴클레아제로부터의 DNA 결합 도메인을 포함하나 이에 제한되지는 않는 임의의 DNA 결합 분자/도메인이 본원에 개시된 조성물 및 방법에 사용될 수 있다.

특정 실시양태에서, 본원에 기재된 염기 편집기는 징크 핑거 단백질 DNA 결합 도메인을 포함한다. 바람직하게, 징크 핑거 단백질은 선택한 표적 부위와 결합하도록 조작된다는 점에서 비-자연적으로 발생한다 (예를 들어, 문헌 [Beerli, et al. (2002) Nature Biotechnol. 20:135-141; Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan, et al. (2001) Nature Biotechnol. 19:656-660; Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 및 7,253,273; 및 미국 특허 공개 번호 2005/0064474; 2007/0218528; 및 2005/0267061 참조; 모두는 그 전체 내용이 본원에 참조로 포함된다). 특정 실시양태에서, DNA 결합 도메인은 미국 특허 공개 번호 2012/0060230 (그 전체 내용이 본원에 참조로 포함됨)에 개시된 징크 핑거 단백질을 포함한다.

조작된 징크 핑거 결합 도메인은 자연적으로 발생하는 징크 핑거 단백질과 비교하여 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계와 다양한 유형의 선택을 포함하나 이에 제한되지는 않는다. 합리적 설계는, 예를 들어, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하며, 여기서 각각의 삼중항 또는 사중항 뉴클레오티드 서열은 특별한 삼중항 또는 사중항 서열과 결합하는 징크 핑거의 하나 이상의 아미노산 서열과 연합된다 (예를 들어, 미국 특허 번호 6,453,242 및 6,534,261 참조; 그 전체 내용이 본원에 참조로 포함된다).

파지 디스플레이 및 2-하이브리드 시스템을 포함한 예시적인 선택 방법이 미국 특허 번호 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 국제 특허 공개 번호 WO 98/37186; WO 98/53057; WO 00/27878; 및 WO 01/88197 및 GB 2,338,237에 개시되어 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.

또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.

표적 부위의 선택; ZFP 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 미국 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 및 국제 특허 공개 번호 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496에 상세하게 기재되어 있다.

또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다.

통상적으로, ZFP는 적어도 3개의 핑거를 포함한다. 특정의 ZFP는 4개, 5개, 6개 또는 그 초과의 핑거를 포함한다. 3개의 핑거를 포함하는 ZFP는 전형적으로, 9개 또는 10개의 뉴클레오티드를 포함하는 표적 부위를 인식하고; 4개의 핑거를 포함하는 ZFP는 전형적으로, 12개 내지 14개의 뉴클레오티드를 포함하는 표적 부위를 인식하는 반면; 6개의 핑거를 갖는 ZFP는 18개 내지 21개의 뉴클레오티드를 포함하는 표적 부위를 인식할 수 있다. ZFP는 또한 하나 이상의 조절 도메인을 포함하는 융합 단백질일 수 있으며, 이러한 도메인은 전사 활성화 또는 억제 도메인일 수 있다.

일부 실시양태에서, DNA 결합 도메인은 뉴클레아제로부터 유래될 수 있다. 예를 들어, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII가 공지되어 있다 (또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon, et al. (1989) Gene 82:115-118; Perler, et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble, et al. (1996) J. Mol. Biol. 263:163-180; Argast, et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue] 참조). 또한, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA 결합 특이성은 비-자연 표적 부위와 결합하도록 조작될 수 있다 (예를 들어, 문헌 [Chevalier, et al. (2002) Molec. Cell 10:895-905; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth, et al. (2006) Nature 441:656-659; Paques, et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 번호 2007/0117128 참조).

특정 실시양태에서, 본원에 기재된 돌연변이체 절단 도메인과 함께 사용되는 징크 핑거 단백질은, 예를 들어 위치 -14, -9 및/또는 -5 중 하나 이상에서 백본 영역 (예를 들어, -1 내지 6으로 넘버링된 7-아미노산 인식 나선 영역의 외부 영역)에 대한 하나 이상의 돌연변이 (치환, 결실 및/또는 삽입)를 포함한다. 하나 이상의 이들 위치에서 야생형 잔기는 결실될 수 있고, 임의의 아미노산 잔기로 대체될 수 있고/있거나 하나 이상의 부가의 잔기를 포함할 수 있다. 일부 실시양태에서, 위치 -5에서의 Arg (R)는 Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q) 또는 Ala (A)로 변화된다. 다른 실시양태에서, 위치 (-9)에서의 Arg (R)는 Ser (S), Asp (N) 또는 Glu (E)로 대체된다. 추가 실시양태에서, 위치 (-14)에서의 Arg (R)는 Ser (S) 또는 Gln (Q)으로 대체된다. 다른 실시양태에서, 융합 폴리펩티드는 징크 핑거 DNA 결합 도메인 내에 돌연변이를 포함할 수 있으며, 여기서 (-5), (-9) 및/또는 (-14) 위치에서의 아미노산이 임의의 조합으로 상기 열거된 아미노산 중 임의의 것으로 변화된다.

다른 실시양태에서, DNA 결합 도메인은 식물 병원균 크산토모나스(Xanthomonas) (문헌 [Boch, et al. (2009) Science 326:1509-1512 및 Moscou and Bogdanove (2009) Science 326:1501] 참조) 및 랄스토니아(Ralstonia) (문헌 [Heuer, et al. (2007) Applied and Environmental Microbiology 73(13):4379-4384]; 미국 특허 공개 번호 2011/0301073 및 2011/0145940 참조)로부터 유래된 것과 유사한 전사 활성화제 유사 (TAL) 이펙터 (TALE)로부터의 조작된 도메인을 포함한다. 크산토모나스 속의 식물 병원성 박테리아는 중요한 작물에서 많은 질병을 일으키는 것으로 공지되어 있다. 크산토모나스의 병원성은 식물 세포에 25개 초과의 상이한 이펙터 단백질을 주입하는 보존된 유형 III 분비 (T3S) 시스템에 의존한다. 이러한 주입된 단백질 중에는 식물 전사 활성화제를 모방하고 식물 전사체를 조작하는 전사 활성화제 유사 이펙터 (TALE)가 있다 (문헌 [Kay, et al. (2007) Science 318:648-651] 참조). 이들 단백질은 DNA 결합 도메인과 전사 활성화 도메인을 함유한다. 가장 널리 특징 규명된 TALE 중 하나는 크산토모나스 캄페스트리스 pv. 베시카토리아(Xanthomonas campestris pv. Vesicatoria)로부터의 AvrBs3이다 (문헌 [Bonas, et al. (1989) Mol Gen Genet 218:127-136] 및 국제 특허 공개 번호 WO 2010/079430 참조). TALE는 탠덤 반복부의 중앙 집중식 도메인을 함유하며, 각각의 반복부는 대략 34개의 아미노산을 함유하며, 이는 이들 단백질의 DNA 결합 특이성에 중요하다. 또한, 그들은 핵 국재화 서열 및 산성 전사 활성화 도메인을 함유한다 (검토를 위해, 문헌 [Schornack S., et al. (2006) J Plant Physiol 163(3): 256-272] 참조). 또한, 식물 병원성 박테리아인 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, 알. 솔라나세아룸(R. solanacearum) 생물변이형 1 균주 GMI1000 및 생물변이형 4 균주 RS1000에서 크산토모나스의 AvrBs3 패밀리와 상동인, brg11 및 hpx17로 지명된 2개의 유전자가 발견되었다 (문헌 [Heuer, et al. (2007) Appl and Envir Micro 73(13):4379-4384] 참조). 이들 유전자는 뉴클레오티드 서열이 서로 98.9% 동일하지만, hpx17의 반복 도메인에서 1,575개 염기쌍이 결실된다는 점에서 상이하다. 그러나, 두 유전자 산물은 크산토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다.

이들 TAL 이펙터의 특이성은 탠덤 반복부에서 발견되는 서열에 의존한다. 반복된 서열은 대략 102개의 염기쌍을 포함하고 반복부는 전형적으로 서로 91 내지 100% 상동이다 (상기 문헌 [Bonas, et al.]). 반복부의 다형성은 통상적으로, 위치 12 및 13에 위치하며, 위치 12 및 13에서의 초가변 2잔기 (반복 가변 2잔기 또는 RVD 영역)의 정체와 TAL 이펙터의 표적 서열에 있는 연속되는 뉴클레오티드의 정체 간에 일 대 일 일치가 있는 것처럼 여겨진다 (문헌 [Moscou and Bogdanove (2009) Science 326:1501 및 Boch, et al. (2009) Science 326:1509-1512] 참조). 실험적으로, 이러한 TAL 이펙터의 DNA 인식을 위한 자연 코드는 위치 12 및 13에서의 HD 서열 (반복 가변 2잔기 또는 RVD)이 시토신 (C)과 결합하고, NG가 T와 결합하고, NI가 A, C, G 또는 T와 결합하고, NN이 A 또는 G와 결합하며, ING가 T와 결합하도록 결정되었다. 이러한 DNA 결합 반복부는 새로운 서열과 상호작용할 수 있고 식물 세포에서 비-내인성 리포터 유전자의 발현을 활성화할 수 있는 인공 전사 인자를 만들기 위해, 반복부의 새로운 조합과 수를 갖는 단백질로 어셈블리되었다 (상기 문헌 [Boch, et al.]). 조작된 TAL 단백질은 FokI 절단 절반 도메인에 연결되어, 비정형 RVD를 갖는 TALEN을 포함한 TAL 이펙터 도메인 뉴클레아제 융합 (TALEN)을 산출하였다 (예를 들어, 미국 특허 번호 8,586,526 참조).

일부 실시양태에서, TALEN은 엔도뉴클레아제 (예를 들어, FokI) 절단 도메인 또는 절단 절반-도메인을 포함한다. 다른 실시양태에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 절단 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 절단 도메인은 단량체로서 활성이며 활성을 위해 이량체화를 필요로 하지 않는다 (문헌 [Boissel et al. (2013) Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224] 참조).

또한 추가 실시양태에서, 뉴클레아제는 컴팩트 TALEN을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 쇄 융합 단백질이다. 융합 단백질은 TevI 뉴클레아제 도메인과 관련하여 TALE DNA 결합 도메인이 위치하는 곳에 따라, TALE 영역에 의해 국한된 닉카제로서 작용할 수 있거나 또는 이중 가닥 파손을 생성할 수 있다 (문헌 [Beurdeley, et al. (2013) Nat Comm: 1-8 DOI:10.1038/ncomms2782] 참조). 또한, 뉴클레아제 도메인은 또한 DNA 결합 기능성을 나타낼 수 있다. 임의의 TALEN은 부가의 TALEN (예를 들어, 하나 이상의 메가-TALE가 있는 하나 이상의 TALEN (cTALEN 또는 FokI-TALEN))과 조합하여 사용될 수 있다.

또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질 또는 TALE는, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.

특정 실시양태에서, 염기 편집기는 DNA와 결합하는 단일 가이드 RNA (sgRNA) DNA 결합 분자를 포함한 CRISPR/Cas 뉴클레아제 시스템의 일부인 DNA 결합 도메인을 포함한다 (예를 들어, 미국 특허 번호 8,697,359 및 미국 특허 공개 번호 2015/0056705 및 2015/0159172 참조). 상기 시스템의 RNA 성분을 코딩하는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 유전자좌와, 단백질을 코딩하는 cas (CRISPR 관련) 유전자좌 (문헌 [Jansen, et al. (2002) Mol. Microbiol. 43:1565-1575; Makarova, et al. (2002) Nucleic Acids Res. 30:482-496; Makarova, et al. (2006) Biol. Direct 1:7; Haft, et al. (2005) PLoS Comput. Biol. 1:e60])가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주에서 CRISPR 유전자좌는 CRISPR 매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소뿐만 아니라 CRISPR 관련 (Cas) 유전자의 조합을 함유한다.

일부 실시양태에서, DNA 결합 도메인은 TtAgo 시스템의 일부이다 (문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888; Sheng, et al., 상기 문헌] 참조). 진핵 생물에서, 유전자 침묵은 아르고노트 (Ago) 패밀리의 단백질에 의해 매개된다. 이러한 패러다임에서, Ago는 작은 (19-31 nt) RNA와 결합된다. 이러한 단백질-RNA 침묵 복합체는 작은 RNA와 표적 간의 왓슨 크릭(Watson-Crick) 염기쌍 형성을 통해 표적 RNA를 인식하고, 표적 RNA를 엔도뉴클레아제로 절단한다 (Vogel (2014) Science 344:972-973). 대조적으로, 원핵 Ago 단백질은 작은 단일 가닥 DNA 단편과 결합하며 외래 (종종 바이러스) DNA를 검출하고 이를 제거하는 기능을 하는 것으로 예상된다 (Yuan, et al. (2005) Mol. Cell 19:405; Olovnikov, et al. (2013) Mol. Cell 51, 594; Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888). 예시적인 원핵 Ago 단백질은 아퀴펙스 아에올리쿠스(Aquifex aeolicus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 및 써무스 써모필루스로부터의 것을 포함한다.

가장 널리 특징 규명된 원핵 Ago 단백질 중 하나는 티. 써모필루스(T. thermophilus)로부터의 것이다 (TtAgo; 문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888]). TtAgo는 5' 인산염 기가 있는 15 nt 또는 13-25 nt 단일 가닥 DNA 단편과 연합된다. TtAgo에 의해 결합된 이러한 "가이드 DNA"는 단백질-DNA 복합체가 DNA의 제3자 분자에 있는 왓슨 크릭 상보적 DNA 서열과 결합하도록 지시하는 역할을 한다. 일단 이들 가이드 DNA에서의 서열 정보가 표적 DNA를 확인시켜 줄 수 있으면, TtAgo-가이드 DNA 복합체가 표적 DNA를 절단한다. 이러한 메커니즘은 또한, 그의 표적 DNA와 결합되는 동안 TtAgo-가이드 DNA 복합체의 구조에 의해 뒷받침된다 (상기 문헌 [G. Sheng, et al.]). 로도박터 스파에로이데스로부터의 Ago (RsAgo)는 유사한 특성을 가지고 있다 (상기 문헌 [Olovnikov, et al.]).

임의의 DNA 서열의 외인성 가이드 DNA를 TtAgo 단백질 상에 부하할 수 있다 (Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888). TtAgo 절단의 특이성은 가이드 DNA에 의해 지시되기 때문에, 외인성 조사자 지정 가이드 DNA와 형성된 TtAgo-DNA 복합체는 따라서, TtAgo 표적 DNA 절단이 상보적 조사자 지정 표적 DNA를 향하게 할 것이다. 이러한 방식으로, DNA에서 표적화된 이중 가닥 파손을 생성할 수 있다. TtAgo-가이드 DNA 시스템 (또는 다른 유기체로부터의 오르소로고스 Ago-가이드 DNA 시스템)을 사용하면, 세포 내에서 게놈 DNA의 표적화된 절단이 가능하다. 이러한 절단은 단일 가닥 또는 이중 가닥일 수 있다. 포유 동물 게놈 DNA의 절단을 위해, 포유 동물 세포에서의 발현을 위해 최적화된 TtAgo 코돈 버전을 사용하는 것이 바람직할 것이다. 추가로, TtAgo 단백질이 세포 침투 펩티드에 융합되는 시험관 내에서 형성된 TtAgo-DNA 복합체로 세포를 처리하는 것이 바람직할 수 있다. 추가로, 돌연변이 유발을 통해 변경된 TtAgo 단백질 버전을 사용하여 37℃에서의 개선된 활성을 갖는 것이 바람직 할 수 있다. Ago-RNA 매개 DNA 절단은 유전자 녹아웃, 표적화된 유전자 부가, 유전자 교정, DNA 파손의 이용을 위해 관련 기술분야에서의 기술 표준을 사용하는 표적화된 유전자 결실을 포함한 결과 전체에 영향을 미치는 데 사용될 수 있었다.

따라서, 임의의 DNA 결합 분자/도메인을 사용할 수 있다. 특정 실시양태에서, 본원에 기재된 염기 편집기는 sgRNA DNA 결합 도메인 (예를 들어, Cas9 닉카제의 일부로서) 및 임의로 하나 이상의 ZFP DNA 결합 도메인 ("ZFP 앵커로서 지칭됨)을 포함하는 Cas9 염기 편집기이며, ZFP(들)는 염기 편집 효율성 및/또는 특이성을 증가시킬 수 있다. ZFP 앵커를 포함한 Cas9 염기 편집기의 비-제한적인 예는 도 1b 및 도 3에 도시되어 있다.

융합 분자

본원에 기재된 DNA 편집 복합체는 본원에 기재된 바와 같은 DNA 결합 도메인 (예를 들어, ZFP 또는 TALE, CRISPR/Cas 성분, 예컨대 단일 가이드 RNA)을 포함하는 하나 이상의 융합 분자를 포함할 수 있고, 이종 (기능적) 도메인 (또는 그의 기능적 단편)이 또한 제공된다.

통상의 도메인은, 예를 들어, 전사 인자 도메인 (활성화제, 억제인자, 공동 활성화제, 공동 억제인자), 침묵인자, 종양 유전자 (예를 들어, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 패밀리 구성원 등); DNA 복구 효소 및 그의 관련 인자 및 변형인자; 헬리카제, 이중 가닥 DNA 결합 단백질, DNA 재배열 효소 및 그의 관련 인자 및 변형인자; 염색질 관련 단백질 및 그의 변형인자 (예를 들어 키나제, 아세틸라제 및 데아세틸라제); 및 DNA 변형 효소 (예를 들어, 메틸트랜스퍼라제, 토포이소머라제, 헬리카제, 라이가제, 키나제, 포스파타제, 데아미나제, 폴리머라제, 엔도뉴클레아제) 및 그의 관련 인자 및 변형인자를 포함한다. 미국 특허 공개 번호 2005/0064474; 2006/0188987; 및 2007/0218528은 DNA 결합 도메인과 뉴클레아제 절단 도메인의 융합에 관한 세부 사항에 대해 설명하며, 그 전체 내용이 본원에 참조로 포함된다.

융합 분자는 관련 기술분야의 통상의 기술자에게 널리 공지된 클로닝 및 생화학적 접합 방법에 의해 구축된다. 융합 분자는 DNA 결합 도메인 및 기능적 도메인 (예를 들어, 헬리카제 및/또는 데아미나제 및/또는 GUI 및/또는 GAM)을 포함한다. 융합 분자는 또한 임의로, 핵 국재화 신호 (예컨대 예를 들어, SV40 배지 T-항원으로부터의 것) 및 에피토프 태그 (예컨대 예를 들어, FLAG 및 혈구 응집소)를 포함한다. 융합 단백질 (및 이를 코딩하는 핵산)은 번역 리딩 프레임이 융합물의 성분 사이에서 보존되도록 설계된다.

한편으로는 기능적 도메인 (또는 그의 기능적 단편)의 폴리펩티드 성분과 다른 한편으로는 비-단백질 DNA 결합 도메인 (예를 들어, 항생제, 삽입제, 작은 홈 결합제, 핵산) 간의 융합물이, 관련 기술분야의 통상의 기술자에게 공지된 생화학적 접합 방법에 의해 구축된다 (예를 들어, 문헌 [Pierce Chemical Company (Rockford, IL) Catalogue] 참조). 작은 홈 결합제와 폴리펩티드 간의 융합물을 제조하는 방법 및 조성물이 문헌 [Mapp, et al. (2000) Proc. Natl. Acad. Sci. USA 97:3930-3935]에 기재되었다. 더욱이, CRISPR/Cas 시스템의 단일 가이드 RNA는 기능적 도메인과 연합하여 활성 전사 조절인자 및 뉴클레아제를 형성한다.

특정 실시양태에서, DNA 결합 도메인에 대한 표적 부위는 세포 염색질의 접근가능한 영역에 존재한다. 접근가능한 영역은, 예를 들어 미국 특허 번호 7,217,509 및 7,923,542에 기재된 바와 같이 결정될 수 있다. 표적 부위가 세포 염색질의 접근가능한 영역에 존재하지 않는 경우, 미국 특허 번호 7,785,792 및 8,071,370에 기재된 바와 같이 하나 이상의 접근가능한 영역이 생성될 수 있다. 부가의 실시양태에서, 융합 분자의 DNA 결합 도메인은 그의 표적 부위가 접근가능한 영역에 있는지의 여부에 관계없이 세포 염색질과 결합할 수 있다. 예를 들어, 이러한 DNA 결합 도메인은 링커 DNA 및/또는 뉴클레오솜 DNA와 결합할 수 있다. 이러한 유형의 "선구자" DNA 결합 도메인의 예는 특정 스테로이드 수용체와 간세포 핵 인자 3 (HNF3)에서 발견된다 (Cordingley, et al. (1987) Cell 48:261-270; Pina, et al. (1990) Cell 60:719-731; 및 Cirillo, et al. (1998) EMBO J. 17:244-254).

융합 분자는 관련 기술분야의 통상의 기술자에게 공지된 바와 같이, 제약상 허용되는 담체와 제형화될 수 있다 (예를 들어, 문헌 [Remington's Pharmaceutical Sciences, 17th ed., 1985]; 및 미국 특허 번호 6,453,242 및 6,534,261 참조).

융합 분자의 기능적 성분(들)/도메인(들)은 일단 융합 분자가 그의 DNA 결합 도메인을 통해 표적 서열과 결합하면, 유전자의 서열에 영향을 미칠 수 있는 다양한 상이한 성분 중 임의의 것으로부터 선택될 수 있다. 따라서, 기능적 성분은 다양한 데아미나제, UGI, GAM, 헬리카제 등을 포함할 수 있으나, 이에 제한되지는 않는다. 특정 실시양태에서, 기능적 도메인은 하나 이상의 시티딘 데아미나제 (예를 들어, 아포지질단백질 B mRNA 편집 복합체 1 (APOBEC1) 도메인 및/또는 활성화 유도 데아미나제 (AID))를 포함한다. 다른 실시양태에서, 기능적 도메인은 하나 이상의 아데닌 데아미나제 (예를 들어, 돌연변이된 TadA (tRNA 아데닌 데아미나제 (문헌 [Gaudelli, et al. (2017) Nature 551:464-471] 참조))를 포함한다. 또한 추가 실시양태에서, 기능적 도메인은 적어도 하나의 우라실 DNA 글리코실라제 억제제 (예를 들어 UGI) 도메인을 포함한다. 일부 실시양태에서, 염기 편집 복합체는 데아미나제, 닉카제, UGI 및/또는 GAM 단백질을 포함한다. 기능적 도메인(들)은 DNA 결합 도메인 (및/또는 촉매적으로 활성인 융합 분자에 포함될 때 닉카제)와 관련하여 N-말단 (다수의 기능적 도메인이 존재하는 경우 임의의 순서로), C-말단 (다수의 기능적 도메인이 존재하는 경우 임의의 순서로) 등을 포함하나 이에 제한되지는 않는 임의의 방식으로 위치될 수 있다.

일부 실시양태에서, DNA 편집 (염기 편집) 복합체는 이중 가닥 DNA 나선을 개방하거나 또는 탈안정화하는 데 도움을 주는 분자를 추가로 포함한다. 일부 실시양태에서, 이러한 분자는 효소를 포함한다. 일부 실시양태에서, 효소는 헬리카제 (예를 들어, RecQ 헬리카제 (WRN, BLM, RecQL4 및 RecQ5 (문헌 [Mo, et al. (2018) Cancer Lett. 413:1-10] 참조), DNA2 (문헌 [Jia, et al. (2017) DNA Repair (Amst). 59:9-19]) 및 임의의 다른 진핵 헬리카제, 예를 들어, FANCJ, XPD, XPB, RTEL1, 및 PIF1 (문헌 [Brosh (2013) Nat Rev Canc 13(8):542-558]))이다. 일부 실시양태에서, 효소는 박테리아 및/또는 바이러스 헬리카제이다. 예시적인 바이러스 헬리카제는 미오비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어 gp41, Dda, UvsW, Gene α, 및 Ban); 포도비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어 4B); 시포비리다에, 바쿨로비리다에, 헤르페스비리다에, 폴리오마비리다에, 파필로마비리다에 및 폭스비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어, G40P, p143, UL5, UL9, Tag, E1, NPH-I, NPH-II, A18R, 및 VETF), 또는 관련 기술분야에 공지된 임의의 다른 바이러스 헬리카제를 포함한다 (예를 들어 문헌 [Frick and Lam (2006) Curr Pharm Des 12(11):1315-1338] 참조). 일부 실시양태에서, 헬리카제 효소는 박테리아 효소이다. 예시적인 박테리아 헬리카제는 피. 아에루기노사 SF4 DnaB-유사 헬리카제, 또는 박테리아, 예컨대 이. 콜라이 및 에이치. 파일로리에서 박테리아 RecBCD 복합체의 일부인 RecB 및 RecD 헬리카제를 포함한다 (Shadrick, et al. (2013) J. Biomol Screen 18(7):761-781). 일부 실시양태에서, 상기 분자는 CRISPR/Cas 복합체를 포함한다. 일부 실시양태에서, CRISPR/Cas 복합체는 가이드 RNA를 포함한다. 일부 실시양태에서, 복합체는 뉴클레아제 도메인 중 하나에서 촉매적으로 결함이 있는 Cas 효소를 포함한다. 일부 실시양태에서, Cas 효소는 그의 PAM 인식에 있어서 결함이 있다 (Anders, et al. (2014) Nature 513(7519):569-573). 일부 실시양태에서, 상기 분자는 나선 탈안정화 특성을 갖는다. 예시적인 나선 탈안정화 분자는 단순 포진 바이러스 유형 I (문헌 [Boehmer and Lehman (1993) J Virol 67(2):711-715]), 푸랄파 (문헌 [Darbinian, et al. (2001) J Cell Biochem 80(4):589-95]) 및 송아지 흉선 DNA 나선 탈안정화 단백질 (문헌 [Kohwi-Shigematsu, et al. (1978) Proc Natl Acad Sci USA 75(10):4689-93])로부터의 ICP8을 포함한다. 일부 실시양태에서, 상기 분자는 핵산이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 DNA이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 RNA이다. 일부 실시양태에서, RNA는 변형된다. 일부 실시양태에서, 융합 분자는 이러한 융합 분자의 하나 이상의 도메인 사이에 아미노산 링커 서열을 포함한다.

본원에 기재된 DNA 편집 복합체는 본원에 기재된 바와 같은 1, 2, 3, 4개 또는 그 초과의 융합 분자를 포함할 수 있다. 특정 실시양태에서, DNA 편집 복합체는 2개의 융합 분자: DNA 결합 도메인 및 닉카제 도메인을 포함하는 촉매적으로 활성인 닉카제 (촉매적으로 활성)인 제1 융합 분자 및 DNA 결합 도메인 및 하나 이상의 기능적 도메인 (시티딘 데아미나제, 아데닌 데아미나제, 및/또는 UGI 등)을 포함하는 제2의 촉매적으로 불활성인 융합 분자를 포함한다. 전형적으로, 융합 분자는 2개의 DNA 결합 도메인이 표적 부위와 결합하여 2개의 융합 분자가 이량체화되어 DNA 편집을 수행한다는 점에서 "파트너"이다. 다른 실시양태에서, DNA 편집 복합체는 3개 이상의 융합 분자: DNA 결합 도메인 및 닉카제 도메인을 포함하는 촉매적으로 활성인 닉카제인 제1 융합 분자; DNA 결합 도메인을 포함하는 제2의 촉매적으로 불활성인 융합 분자 (예를 들어, 제1 융합 분자와 파트너이고 이량체화된다); 및 본원에 기재된 바와 같은 DNA 결합 도메인 및 하나 이상의 기능적 도메인을 포함하는 제3 융합 분자를 포함한다.

닉카제 도메인

특정 실시양태에서, 융합 단백질은 DNA 결합 도메인 및 절단 (뉴클레아제) 도메인, 바람직하게 닉카제 도메인을 포함한다. 따라서, 유전자 편집은 뉴클레아제, 예를 들어 조작된 닉카제를 사용하여 달성될 수 있다. 조작된 뉴클레아제 기술은 자연적으로 발생하는 DNA 결합 단백질의 조작을 기반으로 한다. 예를 들어, 맞춤형 DNA 결합 특이성을 갖는 귀소 엔도뉴클레아제를 조작하는 것이 기재되었다 (Chames, et al. (2005) Nucleic Acids Res 33(20):e178; Arnould, et al. (2006) J. Mol. Biol. 355:443-458). 또한, ZFP를 조작하는 것이 또한 기재되었다 (예를 들어, 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,979,539; 6,933,113; 7,163,824; 및 7,013,219 참조).

또한, ZFP 및/또는 TALE는 뉴클레아제 도메인에 융합되어 ZFN 및 TALEN을 생성하였으며, 이는 그의 조작된 (ZFP 또는 TALE) DNA 결합 도메인을 통해 의도된 핵산 표적을 인식할 수 있고 DNA가 뉴클레아제 활성을 통해 DNA 결합 부위 근처를 절단할 수 있게 하는 기능적 실체이다 (예를 들어, 문헌 [Kim, et al. (1996) Proc Nat'l Acad Sci USA 93(3):1156-1160] 참조). 보다 최근에는, 이러한 뉴클레아제가 다양한 유기체에서 게놈 변형을 위해 사용되었다 (예를 들어, 미국 특허 번호 9,255,250; 9,200,266; 9,045,763; 9,005,973; 8,956,828; 8,945,868; 8,703,489; 8,586,526; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,067,317; 7,262,054; 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 미국 특허 공개 번호 2003/0232410; 2005/0208489; 2005/0026157; 2005/0064474; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/0265198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0177960; 및 2015/0056705 참조).

따라서, 본원에 기재된 방법 및 조성물은 광범위하게 적용가능하고 임의의 관심 뉴클레아제를 수반할 수 있다. 뉴클레아제의 비-제한적인 예는 메가뉴클레아제, TALEN 및 징크 핑거 뉴클레아제를 포함한다. 뉴클레아제는 이종 DNA 결합 및 절단 도메인을 포함할 수 있거나 (예를 들어, 징크 핑거 뉴클레아제; 이종 절단 도메인을 갖는 메가뉴클레아제 DNA 결합 도메인), 또는 또 다른 한편으론, 자연적으로 발생하는 뉴클레아제의 DNA 결합 도메인은 선택된 표적 부위와 결합하도록 변경될 수 있다 (예를 들어, 동족 결합 부위와 상이한 부위와 결합하도록 조작된 메가뉴클레아제).

본원에 기재된 뉴클레아제 중 임의의 것에서, 뉴클레아제는 TALEN으로서 지칭되기도 한, 조작된 TALE DNA 결합 도메인 및 뉴클레아제 도메인 (예를 들어, 엔도뉴클레아제 및/또는 메가뉴클레아제 도메인)을 포함할 수 있다. 사용자가 선택한 표적 서열과의 강력한 부위 특이적 상호작용을 위해 이들 TALEN 단백질을 조작하는 방법 및 조성물이 공개되었다 (미국 특허 번호 8,586,526 참조). 일부 실시양태에서, TALEN은 엔도뉴클레아제 (예를 들어, FokI) 절단 도메인 또는 절단 절반-도메인을 포함한다. 다른 실시양태에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 절단 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 절단 도메인은 단량체로서 활성이며 활성을 위해 이량체화를 필요로 하지 않는다 (문헌 [Boissel, et al. (2013) Nucl Acid Res 1-13, doi:10.1093/nar/gkt1224] 참조). 또한, 뉴클레아제 도메인은 또한, DNA 결합 기능성을 나타낼 수 있다.

또한 추가 실시양태에서, 뉴클레아제는 컴팩트 TALEN (cTALEN)을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 쇄 융합 단백질이다. 융합 단백질은 TevI 뉴클레아제 도메인과 관련하여 TALE DNA 결합 도메인이 위치하는 곳에 따라, TALE 영역에 의해 국한된 닉카제로서 작용할 수 있거나 또는 이중 가닥 파손을 생성할 수 있다 (문헌 [Beurdeley, et al. (2013) Nat Comm: 1-8 DOI:10.1038/ncomms2782] 참조). 임의의 TALEN은 부가의 TALEN (예를 들어, 하나 이상의 메가-TAL이 있는 하나 이상의 TALEN (cTALEN 또는 FokI-TALEN)) 또는 다른 DNA 절단 효소와 조합하여 사용될 수 있다.

특정 실시양태에서, 뉴클레아제는 메가뉴클레아제 (귀소 엔도뉴클레아제) 또는 절단 활성을 나타내는 그의 일부분을 포함한다. 자연적으로 발생하는 메가뉴클레아제는 15 내지 40개의 염기쌍 절단 부위를 인식하고, 통상적으로 4가지 패밀리: LAGLIDADG 패밀리 (서열식별번호: 75로서 개시된 "LAGLIDADG"), GIY-YIG 패밀리, His-Cyst 박스 패밀리 및 HNH 패밀리로 분류된다. 예시적인 귀소 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII를 포함한다. 그들의 인식 서열은 공지되어 있다 (또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon, et al. (1989) Gene 82:115-118; Perler, et al. (1994) Nucleic Acids Res. 22:1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble, et al. (1996) J. Mol. Biol. 263:163-180; Argast, et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue] 참조).

자연적으로 발생하는 메가뉴클레아제, 주로 LAGLIDADG 패밀리 (서열식별번호: 75로서 개시된 "LAGLIDADG")로부터의 DNA 결합 도메인은 식물, 효모, 드로소필라(Drosophila), 포유 동물 세포 및 마우스에서 부위 특이적 게놈 변형을 촉진하는 데 사용되었지만, 이러한 접근법은 메가뉴클레아제 인식 서열을 보존하는 상동 유전자의 변형으로 제한되었거나 (문헌 [Monet, et al. (1999) Biochem. Biophysics. Res. Common 255:88-93) 또는 인식 서열이 도입된 미리 조작된 게놈으로 제한되었다 (Route, et al. (1994) Mol. Cell. Biol. 14:8096-106; Chilton, et al. (2003) Plant Physiology 133:956-65; Puchta, et al. (1996) Proc. Natl. Acad. Sci. USA 93:5055-60; Rong, et al. (2002) Genes Dev. 16:1568-81; Gouble, et al. (2006) J. Gene Med. 8(5):616-622). 따라서, 메가뉴클레아제를 조작하여 의학적으로 또는 생명공학적으로 관련된 부위에서 새로운 결합 특이성을 나타내려는 시도가 있었다 (Porteus, et al. (2005) Nat. Biotechnol. 23:967-73; Sussman, et al. (2004) J. Mol. Biol. 342:31-41; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-62; Chevalier, et al. (2002) Molec. Cell 10:895-905; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth, et al. (2006) Nature 441:656-659; Paques, et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공개 번호 2007/0117128; 2006/0206949; 2006/0153826; 2006/0078552; 및 2004/0002092). 또한, 메가뉴클레아제로부터의 자연적으로 발생하는 또는 조작된 DNA 결합 도메인은 이종 뉴클레아제 (예를 들어, FokI)로부터의 절단 도메인과 작동가능하게 연결될 수 있고/있거나 메가뉴클레아제로부터의 절단 도메인은 이종 DNA 결합 도메인 (예를 들어, ZFP 또는 TALE)과 작동가능하게 연결될 수 있다.

다른 실시양태에서, 뉴클레아제는 징크 핑거 뉴클레아제 (ZFN) 또는 TALE DNA 결합 도메인-뉴클레아제 융합 (TALEN)이다. ZFN 및 TALEN은 선택되는 유전자 내의 표적 부위와 결합하도록 조작된 DNA 결합 도메인 (징크 핑거 단백질 또는 TALE DNA 결합 도메인) 및 절단 도메인 또는 절단 절반-도메인 (예를 들어, 본원에 기재된 바와 같은 제한 및/또는 메가뉴클레아제로부터의 것)을 포함한다.

상기 상세히 기재된 바와 같이, 징크 핑거 결합 도메인 및 TALE DNA 결합 도메인은 선택되는 서열과 결합하도록 조작될 수 있다 (예를 들어, 문헌 [Beerli, et al. (2002) Nature Biotechnol. 20:135-141; Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan, et al. (2001) Nature Biotechnol. 19:656-660; Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416] 참조). 조작된 징크 핑거 결합 도메인 또는 TALE 단백질은 자연적으로 발생하는 단백질과 비교해서 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계와 다양한 유형의 선택을 포함하나 이에 제한되지는 않는다. 합리적 설계는, 예를 들어, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 징크 핑거 또는 TALE 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하며, 여기서 각각의 삼중항 또는 사중항 뉴클레오티드 서열은 특별한 삼중항 또는 사중항 서열과 결합하는 징크 핑거 또는 TALE 반복 단위의 하나 이상의 아미노산 서열과 연합된다 (예를 들어, 미국 특허 번호 6,453,242 및 6,534,261 참조; 그 전체 내용이 본원에 참조로 포함된다).

표적 부위의 선택; 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 미국 특허 번호 7,888,121 및 8,409,861 (그의 전체 내용이 본원에 참조로 포함됨)에 상세히 기재되어 있다.

또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인, TALE 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 예를 들어, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다 (또한 미국 특허 번호 8,772,453 참조).

따라서, 뉴클레아제, 예컨대 ZFN, TALEN 및/또는 메가뉴클레아제는 임의의 DNA 결합 도메인 및 임의의 뉴클레아제 (절단) 도메인 (절단 도메인, 절단 절반-도메인)을 포함할 수 있다. 상기 언급된 바와 같이, 절단 도메인은 DNA 결합 도메인, 예를 들어 징크 핑거 또는 TAL-이펙터 DNA 결합 도메인 및 뉴클레아제 또는 메가뉴클레아제 DNA 결합 도메인으로부터의 절단 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 대해 이종일 수 있다. 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하나, 이에 제한되지는 않는다 (예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388] 참조). DNA를 절단하는 부가의 효소가 공지되어 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 문헌 [Linn, et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993] 참조). 이들 효소 (또는 그의 기능적 단편) 중 하나 이상은 절단 도메인 및 절단 절반-도메인의 공급원으로 사용될 수 있다.

유사하게, 절단 절반-도메인은 절단 활성을 위해 이량체화를 필요로 하는, 상기에 제시된 바와 같이 임의의 뉴클레아제 또는 그의 일부분으로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우에는, 절단을 위해 2개의 융합 단백질이 필요하다. 또 다른 한편으론, 2개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 절반-도메인은 동일한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있거나, 또는 각각의 절단 절반-도메인은 상이한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게, 서로에 대해 배치되어, 2개의 융합 단백질이 그들 각각의 표적 부위와 결합하면 절단 절반-도메인이 서로 공간적 방향으로 배치되어, 절단 절반-도메인이, 예를 들어, 이량체화에 의해 기능적 절단 도메인을 형성할 수 있도록 한다. 따라서, 특정 실시양태에서, 표적 부위의 가까운 가장자리는 5 내지 10개 뉴클레오티드 또는 15 내지 18개 뉴클레오티드만큼 분리된다. 그러나, 임의의 정수의 뉴클레오티드 또는 뉴클레오티드 쌍은 두 표적 부위 사이에 개입할 수 있다 (예를 들어, 2개 내지 50개 뉴클레오티드 쌍 또는 그 초과). 일반적으로, 절단 부위는 표적 부위 사이에 있다.

제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하며 DNA (인식 부위에서)와 서열 특이적으로 결합할 수 있으며, 결합 부위에서 또는 그 근처에서 DNA를 절단할 수 있다. 특정 제한 효소 (예를 들어, 유형 IIS)는 인식 부위로부터 제거된 부위에서 DNA를 절단하고, 분리가능한 결합 및 절단 도메인을 가지고 있다. 예를 들어, 유형 IIS 효소 FokI는 한 가닥에 있는 그의 인식 부위로부터의 9개 뉴클레오티드에서, 및 다른 가닥에 있는 그의 인식 부위로부터의 13개 뉴클레오티드에서 DNA의 이중 가닥 절단을 촉매한다 (예를 들어, 미국 특허 번호 5,356,802; 5,436,150; 및 5,487,994; 뿐만 아니라 문헌 [Li, et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li, et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim, et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim, et al. (1994b) J. Biol. Chem. 269:31,978-31,982] 참조). 따라서, 한 실시양태에서, 융합 단백질은 조작될 수 있거나 조작되지 않을 수 있는, 적어도 하나의 유형 IIS 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인) 및 하나 이상의 징크 핑거 결합 도메인을 포함한다.

그의 절단 도메인이 결합 도메인으로부터 분리될 수 있는 예시적인 유형 IIS 제한 효소는 FokI이다. 이러한 특별한 효소는 이량체로서 활성이다 (Bitinaite, et al. (1998) Proc. Natl. Acad. Sci. USA 95:10,570-10,575). 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에 사용되는 FokI 효소의 일부분이 절단 절반-도메인으로 간주된다. 따라서, 징크 핑거-FokI 융합물을 사용한 세포 서열의 표적화된 이중 가닥 절단 및/또는 표적화된 대체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질을 사용하여 촉매적으로 활성인 절단 도메인을 재구성할 수 있다. 또 다른 한편으론, 징크 핑거 결합 도메인 및 2개의 FokI 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다. 징크 핑거-FokI 융합물을 사용한 표적화된 절단 및 표적화된 서열 변경을 위한 파라미터는 본 개시내용의 다른 곳에서 제공된다.

절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)할 수 있는 능력을 보유하는 단백질의 임의의 부분일 수 있다.

예시적인 유형 IIS 제한 효소는 국제 특허 공개 번호 WO 07/014275 (그 전체 내용이 본원에 참조로 포함됨)에 기재되어 있다. 부가의 제한 효소는 또한 분리가능한 결합 및 절단 도메인을 함유하고, 이들은 본 개시내용에 의해 고려된다 (예를 들어, 문헌 [Roberts, et al. (2003) Nucleic Acids Res. 31:418-420] 참조).

특정 실시양태에서, 절단 도메인은 FokI 절단 도메인이다. 완전한 길이의 FokI 서열은 하기에 제시된다. 절단 도메인은 이탤릭체와 밑줄로 표시되어 있으며 (완전한 길이의 단백질의 위치 384 내지 579), 여기서 홀로(holo) 단백질 서열이 하기에 기재되어 있다 (서열식별번호: 5):

FokI로부터 유래된 절단 절반 도메인은 서열식별번호: 5에 제시된 바와 같은 아미노산 잔기 중 하나 이상에서의 돌연변이를 포함할 수 있다. 돌연변이는 (상이한 잔기에 대한 야생형 아미노산 잔기의) 치환, (하나 이상의 아미노산 잔기의) 삽입 및/또는 (하나 이상의 아미노산 잔기의) 결실을 포함한다. 특정 실시양태에서, 잔기 414-426, 443-450, 467-488, 501-502, 및/또는 521-531 (서열식별번호: 5를 기준으로 하여 넘버링됨) 중 하나 이상이 돌연변이되는데, 이는 이들 잔기가 문헌 [Miller, et al. (2007) Nat Biotechnol 25:778-784]에 기재된 그의 표적 부위와 결합된 ZFN의 분자 모델에서 DNA 백본에 가깝게 위치하기 때문이다. 특정 실시양태에서, 위치 416, 422, 447, 448, 및/또는 525에서의 하나 이상의 잔기가 돌연변이된다. 특정 실시양태에서, 돌연변이는 야생형 잔기를 임의의 상이한 잔기, 예를 들어 알라닌 (A) 잔기, 시스테인 (C) 잔기, 아스파르트산 (D) 잔기, 글루탐산 (E) 잔기, 히스티딘 (H) 잔기, 페닐알라닌 (F) 잔기, 글리신 (G) 잔기, 아스파라긴 (N) 잔기, 세린 (S) 잔기 또는 트레오닌 (T) 잔기로 치환하는 것을 포함한다. 다른 실시양태에서, 위치 416, 418, 422, 446, 448, 476, 479, 480, 481, 및/또는 525 중의 하나 이상에서의 야생형 잔기가 임의의 다른 잔기로 대체되며, 이는 R416D, R416E, S418E, S418D, R422H, S446D, K448A, N476D, I479Q, I479T, G480D, Q481A, Q481E, K525S, K525A, N527D, R416E+R422H, R416D+R422H, R416E+K448A, R416D+R422H, K448A+I479Q, K448A+Q481A. K448A+K525A를 포함하나 이에 제한되지는 않는다.

특정 실시양태에서, 절단 도메인은, 예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 및 8,623,618; 및 미국 특허 공개 번호 2011/0201055 (이들 모두의 개시내용은 그 전체 내용이 본원에 참조로 포함된다)에 기재된 바와 같이, 동종이량체화를 최소화하거나 또는 방지하는 하나 이상의 조작된 절단 절반-도메인 (이량체화 도메인 돌연변이체로서 지칭되기도 함)을 포함한다. FokI의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 아미노산 잔기는 FokI 절단 절반-도메인의 이량체화에 영향을 미치는 모든 표적이다. 돌연변이는 FokI에 상동인 자연 제한 효소에서 발견되는 잔기에 대한 돌연변이를 포함할 수 있다. 바람직한 실시양태에서, 위치 416, 422, 447, 448 및/또는 525 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 돌연변이는 양으로 하전된 아미노산을 비하전되거나 또는 음으로 하전된 아미노산으로 대체하는 것을 포함한다. 또 다른 실시양태에서, 조작된 절단 절반 도메인은 하나 이상의 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 돌연변이 이외에, 아미노산 잔기 499, 496 및 486에서의 돌연변이를 포함한다 (모두 서열식별번호: 5를 기준으로 하여 넘버링됨).

임의의 닉카제 도메인이 본원에 기재된 DNA 편집 복합체에 사용될 수 있다. 닉카제는 뉴클레아제가 완전한 이중 가닥 파손을 만들 수 없도록 하지만, 대신 이중 가닥 DNA의 "닉킹"인 부분 절단을 발생시키는 촉매 도메인에서의 돌연변이를 포함한다. 표적을 닉킹하기 위해 2개 이상의 절단 도메인이 필요한 실시양태에서, 전형적으로 절단 도메인 (예를 들어, 절단 절반-도메인) 중 적어도 하나는 그의 촉매 도메인에 대한 하나 이상의 돌연변이를 포함하며, 이는 뉴클레아제를 불활성으로 만든다 (예를 들어, 촉매적으로 불활성인 절반 도메인). 닉카제를 생산하기 위한 촉매적으로 불활성인 절단 도메인은 돌연변이된 FokI 및/또는 dCas 단백질을 포함하나 이에 제한되지는 않는다 (예를 들어, 미국 특허 번호 9,522,936; 9,631,186; 9,200,266; 및 8,703,489 및 문헌 [Guillinger, et al. (2014) Nature Biotech. 32(6):577-582; Cho, et al. (2014) Genome Res. 24(1):132-141] 참조). 이들 촉매적으로 불활성인 절단 도메인은 촉매적으로 활성인 도메인과 조합하여 닉카제로서 작용하여, 단일 가닥 절단을 만들 수 있다. 부가의 닉카제가 또한 관련 기술분야, 예를 들어, 문헌 [McCaffery, et al. (2016) Nucleic Acids Res. 44(2):e11. doi:10.1093/nar/gkv878. Epub 2015 Oct 19]에 공지되어 있다.

특정 실시양태에서, 닉카제는 촉매적으로 불활성인 FokI 절단 도메인을 포함하는 뉴클레아제 닉카제, 예를 들어 징크 핑거 뉴클레아제 (ZFN) 닉카제 또는 TAL-이펙터 도메인 (TALEN) 닉카제를 포함한다. FokI의 촉매 도메인에서 돌연변이될 수 있는 아미노산의 비-제한적인 예는 아미노산 잔기 450, 467 및/또는 469 (야생형을 기준으로 하여 결정된 바와 같음)를 포함한다. 특정 실시양태에서, 하나 이상의 점 돌연변이는 절단 절반-도메인의 촉매 활성을 불활성화하기 위해 절대적인 이종 이량체의 한 구성원의 촉매 도메인에서 만들어진다. 예를 들어, 위치 450은 D에서 N으로 돌연변이될 수 있고, 위치 467은 D에서 A로 돌연변이될 수 있으며; 위치 469는 K에서 A로 돌연변이될 수 있다. 다른 아미노산은 이들 또는 다른 위치에서 치환될 수 있다 (예를 들어, 미국 특허 번호 9,522,936; 9,631,186; 8,703,489 및 9,200,266 및 문헌 [Guillinger, et al. (2014) Nature Biotech. 32(6):577-582; Cho, et al. (2014) Genome Res. 24(1):132-141] 참조). 촉매적으로 불활성인 절단 도메인은 촉매적으로 활성인 도메인과 조합하여 닉카제로서 작용하여, 단일 가닥 절단을 만들 수 있다. 부가의 닉카제가 또한 관련 기술분야, 예를 들어, 문헌 [McCaffery, et al. (2016) Nucleic Acids Res. 44(2):e11. doi:10.1093/nar/gkv878. Epub 2015 Oct 19]에 공지되어 있다. 임의의 뉴클레아제 (예를 들어, ZFN 또는 TALEN 또는 CRISPR/Cas 뉴클레아제)는 이중 가닥 절단을 만드는 뉴클레아제 내의 절단 도메인 대신 단일 가닥 절단을 만드는 절단 도메인을 사용함으로써 닉카제가 될 수 있다.

FokI 도메인은 또한 하나 이상의 부가의 돌연변이를 포함할 수 있다. 특정 실시양태에서, 본원에 기재된 조성물은, 예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 8,961,281; 및 8,623,618; 미국 특허 공개 번호 2008/0131962 및 2012/0040398에 기재된 바와 같은 절대적인 이종 이량체를 형성하는 FokI의 조작된 절단 절반-도메인을 포함한다. 따라서, 한 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되고, 위치 496에서의 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 ("ELD"또는 "ELE") 폴리펩티드를 포함한다. 또 다른 실시양태에서, 조작된 절단 절반 도메인은 야생형 FokI 절단 절반 도메인으로부터 유래되고, 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI (서열식별번호: 5)를 기준으로 하여 넘버링된 아미노산 잔기 490, 538 및 537에서의 돌연변이를 포함한다. 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되며, 위치 537에서의 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 ("KKK" 또는 "KKR") 폴리펩티드를 포함한다 (본원에 참조로 포함되는 U.S. 8,962,281 참조) (예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 및 8,623,618 참조; 그의 개시내용은 모든 목적을 위해 그 전체 내용이 참조로 포함된다). 다른 실시양태에서, 조작된 절단 절반 도메인은 "샤키(Sharkey)" 및/또는 "샤키 돌연변이"를 포함한다 (문헌 [Guo, et al. (2010) J. Mol. Biol. 400(1):96-107] 참조).

다른 실시양태에서, 본원에 기재된 바와 같은 닉카제는 야생형 FokI 절단 절반 도메인으로부터 유래된 조작된 절단 절반 도메인을 포함하고, 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI 또는 FokI 동족체를 기준으로 하여 넘버링된 아미노산 잔기 490, 및 538에서의 돌연변이를 포함한다. 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되는 ("KK") 폴리펩티드를 포함한다. 다른 바람직한 실시양태에서, 본 설명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되는 ("EL") 폴리펩티드를 포함한다 (본원에 참조로 포함되는 미국 특허 번호 8,034,598 참조).

일부 측면에서, 본 설명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 FokI 촉매 도메인 내의 위치 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 447, 448, 469, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 중 하나 이상에서의 야생형 아미노산 잔기가 돌연변이되는 폴리펩티드를 포함한다. 일부 실시양태에서, 하나 이상의 돌연변이는 야생형 아미노산을 양으로 하전된 잔기에서 중성 잔기 또는 음으로 하전된 잔기로 변경시킨다. 이들 실시양태 중 임의의 것에서, 기재된 돌연변이체는 또한, 하나 이상의 부가의 돌연변이를 포함하는 FokI 도메인에서 만들어질 수 있다. 바람직한 실시양태에서, 이들 부가의 돌연변이는 이량체화 도메인 내에, 예를 들어 위치 418, 432, 441, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및/또는 559에 있다. 돌연변이의 비-제한적인 예는 위치 393, 394, 398, 416, 421, 422, 442, 444, 472, 473, 478, 480, 525 또는 530에서의 임의의 절단 도메인 (예를 들어, FokI 또는 FokI의 동족체)의 야생형 잔기를 임의의 아미노산 잔기로 돌연변이 (예를 들어, 치환)시킨 것 (예를 들어, K393X, K394X, R398X, R416S, D421X, R422X, K444X, S472X, G473X, S472, P478X, G480X, K525X, 및 A530X, 여기서 제1 잔기는 야생형을 나타내고, X는 야생형 잔기를 대체하는 임의의 아미노산을 지칭한다)을 포함한다. 일부 실시양태에서, X는 E, D, H, A, K, S, T, D 또는 N이다. 다른 예시적인 돌연변이는 S418E, S418D, S446D, K448A, I479Q, I479T, Q481A, Q481N, Q481E, A530E 및/또는 A530K를 포함하며, 여기서 아미노산 잔기는 완전한 길이의 FokI 야생형 절단 도메인 및 그의 동족체를 기준으로 하여 넘버링된다. 특정 실시양태에서, 조합은 416과 422, 위치 416에서의 돌연변이와 K448A, K448A와 I479Q, K448A와 Q481A 및/또는 K448A와 위치 525에서의 돌연변이를 포함할 수 있다. 한 실시양태에서, 위치 416에서의 야생형 잔기는 Glu (E) 잔기로 대체될 수 있고 (R416E), 위치 422에서의 야생형 잔기는 His (H) 잔기로 대체되며 (R422H), 위치 525에서의 야생형 잔기는 Ala (A) 잔기로 대체된다. 본원에 기재된 바와 같은 절단 도메인은 위치 432, 441, 483, 486, 487, 490, 496, 499, 527, 537, 538 및/또는 559에서, 예를 들어 이량체화 도메인 돌연변이체 (예를 들어, ELD, KKR) 및/또는 닉카제 돌연변이체 (촉매 도메인에 대한 돌연변이)를 포함하나 이에 제한되지는 않는 부가의 돌연변이를 추가로 포함할 수 있다. 본원에 기재된 돌연변이를 갖는 절단 절반-도메인은 관련 기술분야에 공지된 바와 같은 이종 이량체를 형성한다.

뉴클레아제는 소위 "분할 효소" 기술을 사용하여 핵산 표적 부위에서 생체 내 어셈블리될 수 있다 (예를 들어, 미국 특허 공개 번호 2009/0068164 참조). 이러한 분할 효소의 성분은 별도의 발현 구축물 상에서 발현될 수 있거나, 또는 예를 들어, 자기 절단 2A 펩티드 또는 IRES 서열에 의해 개별 성분이 분리되는 하나의 오픈 리딩 프레임에서 연결될 수 있다. 성분은 개별 징크 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.

뉴클레아제 (예를 들어, ZFN 및/또는 TALEN)는, 예를 들어 미국 특허 번호 8,563,314에 기재된 바와 같이 효모 기반 염색체 시스템에서 사용 전에 활성에 대해 스크리닝될 수 있다.

ZFN 또는 TALEN 닉카제 이외에 또는 그 대신, DNA 편집 복합체는 CRISPR/Cas 닉카제를 포함할 수 있다. CRISPR/Cas 닉카제의 비-제한적인 예가 미국 특허 번호 9,840,713; 9,770,489; 9,567,604; 8,932,814; 8,889,356; 8,697,359; 8,771,945; 8,795,965; 8,865,406; 8,871,445; 8,889,356; 8,895,308; 8.906,616; 8,932,814; 8,945,839; 8,945,839; 8,999,641; 10,000,772 등에 기재되어 있다.

상기 시스템의 RNA 성분을 코딩하는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 유전자좌와, 단백질을 코딩하는 Cas (CRISPR 관련) 유전자좌 (문헌 [Jansen, et al. (2002) Mol. Microbiol. 43:1565-1575; Makarova, et al. (2002) Nucleic Acids Res. 30:482-496; Makarova, et al. (2006) Biol. Direct 1:7; Haft, et al. (2005) PLoS Comput. Biol. 1:e60])가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주에서 CRISPR 유전자좌는 CRISPR 매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소뿐만 아니라 CRISPR 관련 (Cas) 유전자의 조합을 함유한다.

유형 II CRISPR은 가장 널리 특징 규명된 시스템 중 하나이며 4가지 순차적 단계로 표적화된 DNA 이중 가닥 파손을 수행한다. 첫째, 2개의 비-코딩 RNA인 프리-crRNA 어레이와 tracrRNA가 CRISPR 유전자좌로부터 전사된다. 둘째, tracrRNA는 프리-crRNA의 반복 영역과 혼성화하고, 프리-crRNA를 개별 스페이서 서열을 함유하는 성숙한 crRNA로 프로세싱하는 것을 매개한다. 셋째, 성숙한 crRNA:tracrRNA 복합체는 표적 인식에 대한 부가의 요구 사항인, crRNA 상의 스페이서와 프로토스페이서 인접 모티프 (PAM) 옆에 있는 표적 DNA 상의 프로토스페이서 간의 왓슨 크릭 염기쌍 형성을 통해 Cas9를 표적 DNA로 유도한다. 마지막으로, Cas9는 표적 DNA의 절단을 매개하여 프로토스페이서 내에서 이중 가닥 파손을 생성한다. CRISPR/Cas 시스템의 활성은 하기 3가지 단계를 포함한다: (i) '적응'이라는 프로세스에서 향후 공격을 방지하기 위해 외래 DNA 서열을 CRISPR 어레이에 삽입하는 단계, (ii) 관련 단백질의 발현뿐만 아니라 어레이의 발현 및 프로세싱 단계에 이어 (iii) 외래 핵산에 대한 RNA 매개 간섭 단계. 따라서, 박테리아 세포에서는, 소위 'Cas' 단백질 중 몇 가지가 CRISPR/Cas 시스템의 자연적 기능과 관련되어 있으며 기능, 예컨대 외래 DNA의 삽입 등에서 역할을 한다.

초기에는, Cas가 가이드 RNA의 리보스-인산염 백본과 광범위하게 접촉하여, 초기 DNA 질문에 필요한 10-nt RNA 시드 서열을 미리 배열한다. 미리 배열된 시드 서열 이외에, 5'-NGG-3' PAM 인식을 담당하고 가이드가 결여된 apo 구조에서 무질서한 Cas 단백질 R1333 및 R1335의 PAM 상호작용 부위는 표적 DNA와의 접촉 전에 사전 배치되며, 이는 sgRNA 부하를 통해 Cas가 DNA 인식 적격 구조를 형성할 수 있다는 것을 나타낸다. 일단 Cas가 그의 가이드 RNA와 결합하면, 복합체는 상보적인 표적 DNA 부위를 검색할 준비가 된다. 표적 검색 및 인식에는 표적 DNA 내의 20-nt 스페이서 서열과 프로토스페이서 간의 상보적 염기쌍 형성뿐만 아니라 표적 부위에 인접한 보존된 PAM 서열의 존재 모두가 필요하다. PAM 서열은 자기 서열과 비-자기 서열 간을 구별하는 데 중요하다. 단일 분자 실험은 잠재적인 가이드 RNA 상보성을 위해 플랭킹 DNA를 조사하기 전에 적당한 PAM 서열을 프로빙함으로써 Cas가 표적 DNA 검색 프로세스를 시작한다는 것을 입증해 주었다. 표적 인식은 적절한 PAM 서열을 함유하지 않는 DNA로부터 Cas가 신속하게 해리되는 3차원 충돌을 통해 발생하며, 체류 시간은 적당한 PAM이 존재할 때 가이드 RNA와 인접 DNA 간의 상보성에 따라 달라진다. 일단 Cas가 적절한 PAM이 있는 표적 부위를 찾으면, 이는 PAM 인접 핵 형성 부위에서 국소 DNA 용융을 촉발시킨 다음, RNA 가닥 침입을 촉발시켜 RNA-DNA 혼성체 및 PAM 근위 말단에서 PAM 원위 말단으로 변위된 DNA 가닥 (R-루프라고 함)을 형성한다. PAM 이중 나선은 보존된 HNH를 함유하는 뉴클레아제 (NUC) 로브인 알파 나선 인식 (REC) 로브와 분할 RuvC 뉴클레아제 도메인 사이의 양으로 하전된 홈에 자리 잡고 있으며, PAM 함유 비-표적 가닥은 주로 C-말단 도메인 (CTD)에 있다. N으로 표시되는 PAM 서열 내의 제1 염기는 그의 대응물과 염기쌍을 유지하지만 Cas와 상호작용하지 않는다. 보존된 PAM GG 디뉴클레오티드는 CTD의 β-헤어핀에 위치하는 2개의 아르기닌 잔기 (R1333 및 R1335)와 염기 특이적 수소 결합 상호작용에 의해 주요 홈에서 직접 판독된다. GG 디뉴클레오티드와의 염기 특이적 접촉 이외에, Cas의 CTD는 PAM 함유 비-표적 DNA 가닥의 데옥시리보스-인산염 백본과 수많은 수소 결합 상호작용을 한다. 그러나, Cas와 PAM에 상보적인 표적 가닥 뉴클레오티드 간에는 직접적인 접촉이 관찰되지 않았다 (Jiang and Doudna (2017) Annual Review of Biophysics 46:505-529). 일부 실시양태에서, 본 발명의 방법 및 조성물에 개시된 Cas는 PAM과 무관하다. 일부 실시양태에서, 상기 개시된 바와 같은 위치 R1333 및 R1335는 PAM 인식을 변경시키는 돌연변이를 포함한다 (Anders, et al. (2014) Nature 513(7519):569-573).

일부 실시양태에서, CRISPR-Cpf1 시스템이 사용된다. 프란시셀라 종( Francisella spp.)에서 확인된 CRISPR-Cpf1 시스템은 인간 세포에서 강력한 DNA 간섭을 매개하는 클래스 2 CRISPR-Cas 시스템이다. 기능적으로 보존되어 있지만, Cpf1 및 Cas9는 가이드 RNA 및 기질 특이성을 포함한 많은 측면에서 상이하다 (문헌 [Fagerlund, et al. (2015) Genom Bio 16:251] 참조). Cas9와 Cpf1 단백질 간의 주요 차이점은 Cpf1은 tracrRNA를 활용하지 않으므로 crRNA만 필요하다는 것이다. FnCpf1 crRNA는 42-44개 뉴클레오티드 길이 (19개 뉴클레오티드 반복부 및 23-25개 뉴클레오티드 스페이서)이며, 2차 구조를 유지하는 서열 변화를 허용하는 단일 스템-루프를 함유한다. 또한, Cpf1 crRNA는 Cas9에 의해 요구되는 약 100개 뉴클레오티드 조작된 sgRNA보다 상당히 더 짧으며, FnCpfl에 대한 PAM 요구 사항은 변위된 가닥에 있는 5'-TTN-3' 및 5'-CTA-3'이다. Cas9와 Cpf1 둘 다가 표적 DNA에서 이중 가닥 파손을 만들긴 하지만, Cas9는 그의 RuvC 유사 및 HNH 유사 도메인을 사용하여 가이드 RNA의 시드 서열 내에서 평활 말단 절단을 만드는 반면, Cpf1은 RuvC 유사 도메인을 사용하여 시드의 외부에 엇갈린 절단을 생산한다. Cpf1은 중요한 시드 영역으로부터 멀리 떨어져 엇갈린 절단을 하기 때문에, NHEJ는 표적 부위를 방해하지 않을 것이므로, 원하는 HDR 재결합 이벤트가 발생할 때까지 Cpf1이 동일한 부위를 계속 절단할 수 있다. 따라서, 본원에 기재된 방법 및 조성물에서, 용어 "Cas"는 Cas9 단백질과 Cfp1 단백질 둘 다를 포함하는 것으로 이해된다. 따라서, 본원에 사용된 바와 같은, "CRISPR/Cas 시스템"은 뉴클레아제, 닉카제 및/또는 전사 인자 시스템을 모두 포함한, CRISPR/Cas 및/또는 CRISPR/Cfp1 시스템 둘 다를 지칭한다.

일부 실시양태에서, 다른 Cas 단백질이 사용될 수 있다. 일부 예시적인 Cas 단백질은 Cas9, Cpf1 (Cas12a로서 공지되기도 함), C2c1, C2c2 (Cas13a로서 공지되기도 함), C2c3, Cas1, Cas2, Cas4, CasX 및 CasY를 포함하고; 그의 조작된 및 자연 변이체 (문헌 [Burstein, et al. (2017) Nature 542:237-241]), 예를 들어 HF1/spCas9 (문헌 [Kleinstiver, et al. (2016) Nature 529:490-495; Cebrian-Serrano and Davies (2017) Mamm Genome 28(7):247-261]); 분할 Cas9 시스템 (문헌 [Zetsche, et al. (2015) Nat Biotechnol 33(2):139-142]), 인테인-익스테인 시스템을 기반으로 하는 트랜스 스플라이스된 Cas9 (문헌 [Troung, et al. (2015) Nucl Acid Res 43(13):6450-8]); 미니-SaCas9 (문헌 [Ma, et al. (2018) ACS Synth Biol 7(4):978-985])를 포함한다. 따라서, 본원에 기재된 방법 및 조성물에서, 용어 "Cas"는 자연 및 조작된 모든 Cas 변이체 단백질을 포함하는 것으로 이해된다. 따라서, 본원에서 사용된 바와 같은, "CRISPR/Cas 시스템"은 뉴클레아제, 닉카제 및/또는 전사 인자 시스템 모두를 포함한 임의의 CRISPR/Cas 시스템을 지칭한다.

특정 실시양태에서, Cas 단백질은 자연적으로 발생하는 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통되는 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 천연 서열의 단편 및 천연 서열 폴리펩티드 및 그의 단편의 유도체를 포함하나, 이에 제한되지는 않으며, 단 이들은 상응하는 천연 서열 폴리펩티드와 공통적인 생물학적 활성을 갖는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편으로 가수 분해할 수 있는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체, 공유 변형물 및 그의 융합물, 예컨대 유도체 Cas 단백질을 모두 포괄한다. Cas 폴리펩티드 또는 그의 단편의 적합한 유도체는 Cas 단백질 또는 그의 단편의 돌연변이체, 융합물, 공유 변형물을 포함하나 이에 제한되지는 않는다. Cas 단백질 또는 그의 단편을 포함하는 Cas 단백질뿐만 아니라 Cas 단백질 또는 그의 단편의 유도체는 세포로부터 수득될 수 있거나 또는 화학적으로 합성될 수 있거나 또는 이들 두 절차의 조합에 의해 합성될 수 있다. 세포는 Cas 단백질을 자연적으로 생산하는 세포이거나, 또는 Cas 단백질을 자연적으로 생산하고 더 높은 발현 수준에서 내인성 Cas 단백질을 생산하도록 유전자 조작되거나 또는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전자 조작되는 세포일 수 있으며, 상기 핵산은 내인성 Cas와 동일하거나 상이한 Cas를 코딩한다. 일부 경우에는, 세포가 Cas 단백질을 자연적으로 생산하지 않고 Cas 단백질을 생산하도록 유전자 조작된다. 일부 실시양태에서, Cas 단백질은 AAV 벡터를 통한 전달을 위한 작은 Cas9 오르소로그이다 (Ran, et al. (2015) Nature 510:186).

전달

본원에 기재된 DNA 편집 복합체 (또는 그의 성분 분자)는, 예를 들어 단백질 및/또는 mRNA 성분의 주입에 의한 것을 포함한 임의의 적합한 수단에 의해 표적 세포로 전달될 수 있다. 전달은 단리된 세포 (이는 결국, 생체 외 세포 요법을 위해 살아있는 대상체에게 투여될 수 있다) 또는 임의의 적합한 수단을 통해 살아있는 대상체에게 이루어질 수 있다. 유전자 편집 분자를 세포 및 대상체에게 전달하는 것은 관련 기술분야에 공지되어 있다.

적합한 세포는 진핵 및 원핵 세포 및/또는 세포주를 포함하나 이에 제한되지는 않는다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비-제한적인 예는 T-세포, COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포뿐만 아니라 곤충 세포, 예컨대 스포도프테라 푸기페르다(Spodoptera fugiperda) (Sf), 또는 진균 세포, 예컨대 사카로마이세스(Saccharomyces), 피치아(Pichia) 및 쉬조사카로마이세스(Schizosaccharomyces)를 포함한다. 특정 실시양태에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 적합한 세포는 또한, 줄기 세포, 예컨대 예로서, 배아 줄기 세포, 유도 다능성 줄기 세포 (iPS 세포), 조혈 줄기 세포, 신경 줄기 세포 및 중간엽 줄기 세포를 포함한다.

본원에 기재된 바와 같은 단백질 전달 방법은, 예를 들어, 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 (이들 모두의 개시내용은 그 전체 내용이 본원에 참조로 포함된다)에 기재되어 있다.

본원에 기재된 바와 같은 DNA 편집 복합체는 또한 하나 이상의 성분 (예를 들어, 융합 분자)을 코딩하는 서열을 함유하는 벡터를 사용하여 전달될 수 있다. 부가적으로, 부가의 핵산 (예를 들어, 공여자)이 또한 이러한 벡터를 통해 전달될 수 있다. 플라스미드 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 폭스바이러스 벡터; 헤르페스바이러스 벡터 및 아데노 관련 바이러스 벡터 등을 포함하나 이에 제한되지는 않는 임의의 벡터 시스템이 사용될 수 있다 (또한 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 참조) (그 전체 내용이 본원에 참조로 포함된다). 더욱이, 이들 벡터 중 임의의 것이 하나 이상의 DNA 결합 단백질 코딩 서열 및/또는 부가의 핵산을 적절하게 포함할 수 있다는 것이 명백할 것이다. 따라서, 본원에 기재된 바와 같은 하나 이상의 DNA 결합 단백질이 세포 및 적절하게 부가의 DNA에 도입될 때, 이들은 동일한 벡터 또는 상이한 벡터 상에서 운반될 수 있다. 다수의 벡터가 사용되는 경우, 각각의 벡터는 원하는 대로 하나 또는 다수의 DNA 결합 단백질을 코딩하는 서열 및 부가의 핵산을 포함할 수 있다. 통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법은 세포 (예를 들어, 포유 동물 세포) 및 표적 조직에서 조작된 DNA 결합 단백질을 코딩하는 핵산을 도입하고 원하는 대로 부가의 뉴클레오티드 서열을 공동 도입하기 위해 사용될 수 있다. 이러한 방법은 또한 핵산 (예를 들어, DNA 결합 단백질 및/또는 공여자를 코딩함)을 시험관 내 세포에 투여하기 위해 사용될 수 있다. 특정 실시양태에서, 핵산은 생체 내 또는 생체 외 유전자 요법 용도를 위해 투여된다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, 있는 그대로의 핵산, 및 전달 비히클, 예컨대 리포솜 또는 폴록사머와 복합체 형성된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이러한 바이러스는 세포로 전달된 후 에피솜 또는 통합된 게놈을 가지고 있다. 유전자 요법 절차의 검토를 위해, 문헌 [Anderson (1992) Science 256:808-813; Nabel & Felgner (1993) TIBTECH 11:211-217; Mitani & Caskey (1993) TIBTECH 11:162-166; Dillon (1993) TIBTECH 11:167-175; Miller (1992) Nature 357:455-460; Van Brunt (1988) Biotechnology 6(10):1149-1154; Vigne (1995) Restorative Neurology and Neuroscience 8:35-36; Kremer & Perricaudet (1995) British Medical Bulletin 51(1):31-44; Haddada, et al., in Current Topics in Microbiology and Immunology Doerfler and Boehm (eds.) (1995); 및 Yu, et al. (1994) Gene Therapy 1:13-26]을 참조한다.

핵산의 비-바이러스 전달 방법은 전기천공, 리포펙션, 미세 주입, 바이오리 스틱스, 비로좀, 리포좀, 면역 리포좀, 폴리양이온 또는 지질:핵산 접합체, 있는 그대로의 DNA, mRNA, 인공 비리온 및 DNA의 작용제 증강 흡수를 포함한다. 예를 들어, 소니트론(Sonitron) 2000 시스템 [리치-마르(Rich-Mar)]을 사용한 소노포레이션이 또한 핵산의 전달에 사용될 수 있다. 바람직한 실시양태에서, 하나 이상의 핵산이 mRNA로서 전달된다. 번역 효율성 및/또는 mRNA 안정성을 증가시키기 위해 캡핑된 mRNA를 사용하는 것이 또한 바람직하다. 특히 바람직한 것은 ARCA (항-역전 캡 유사체) 캡 또는 그의 변이체이다 (본원에 참조로 포함된 미국 특허 번호 7,074,596 및 8,153,773 참조).

부가의 예시적인 핵산 전달 시스템은 아맥사 바이오시스템즈 (Amaxa Biosystems; 독일 쾰른), 맥스사이트, 인크. (Maxcyte, Inc.; 미국 메릴랜드주 록빌), BTX 분자 전달 시스템 (BTX Molecular Delivery Systems; 미국 매사추세츠주 홀리스턴) 및 코페르니쿠스 테라퓨틱스 인크.(Copernicus Therapeutics Inc.)에 의해 제공된 것을 포함한다 (예를 들어 미국 특허 번호 6,008,336 참조). 리포펙션은, 예를 들어, 미국 특허 번호 5,049,386; 4,946,787; 및 4,897,355에 기재되어 있고, 리포펙션 시약은 상업적으로 판매된다 [예를 들어, 트랜스펙탐(Transfectam™), 리포펙틴(Lipofectin™), 및 리포펙타민(Lipofectamine™) RNAiMAX]. 폴리뉴클레오티드의 효율적인 수용체 인식 리포펙션에 적합한 양이온성 및 중성 지질은 펠그너(Felgner), 국제 특허 공개 번호 WO 91/17424 및 WO 91/16024의 것을 포함한다. 전달은 세포 (생체 외 투여) 또는 표적 조직 (생체 내 투여)에 대한 것일 수 있다.

표적화된 리포좀을 포함한 지질:핵산 복합체, 예컨대 면역 지질 복합체의 제조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 [Crystal (1995) Science 270:404-410; Blaese, et al. (1995) Cancer Gene Ther. 2:291-297; Behr, et al. (1994) Bioconjugate Chem. 5:382-389; Remy, et al. (1994) Bioconjugate Chem. 5:647-654; Gao, et al. (1995) Gene Therapy 2:710-722; Ahmad, et al. (1992) Cancer Res. 52:4817-4820]; 미국 특허 번호 4,186,183; 4,217,344; 4,235,871; 4,261,975; 4,485,054; 4,501,728; 4,774,085; 4,837,028; 및 4,946,787 참조).

부가의 전달 방법은 엔제네익(EnGeneIC) 전달 비히클 (EDV)에 전달될 핵산을 패키징하는 것의 사용을 포함한다. 이들 EDV는 항체의 하나의 아암(arm)이 표적 조직에 대한 특이성을 가지며 다른 아암이 EDV에 대한 특이성을 갖는 이중 특이적 항체를 사용하여 표적 조직에 특이적으로 전달된다. 항체는 EDV를 표적 세포 표면으로 가져오고, 이어서 EDV는 세포내 이입에 의해 세포로 이동된다. 일단 세포에 들어가면, 그 내용물이 방출된다 (문헌 [MacDiarmid, et al. (2009) Nature Biotechnology 27(7):643] 참조).

원하는 대로 조작된 DNA 결합 단백질 및/또는 공여자 (예를 들어 CAR 또는 ACTR)를 코딩하는 핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 신체의 특이적 세포로 표적화하고 바이러스 페이로드를 핵으로 트래피킹하는 데에 고도로 진화된 프로세스를 활용한다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나 (생체 내) 또는 세포를 시험관 내에서 처리하는 데 사용될 수 있으며 변형된 세포는 환자에게 투여된다 (생체 외). 핵산의 전달을 위한 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 관련, 백시니아 및 단순 포진 바이러스 벡터를 포함하나 이에 제한되지는 않는다. 숙주 게놈에서의 통합은 레트로바이러스, 렌티바이러스 및 아데노 관련 바이러스 유전자 전달 방법으로 가능하며, 종종 삽입된 트랜스진의 장기간 발현을 발생시킨다. 부가적으로, 많은 상이한 세포 유형 및 표적 조직에서 높은 형질도입 효율이 관찰되었다.

레트로바이러스의 지향성은 외래 외피 단백질을 혼입함으로써 변경될 수 있으며, 표적 세포의 잠재적 표적 집단을 확장할 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염시킬 수 있고 전형적으로 높은 바이러스 역가를 생산할 수 있는 레트로바이러스 벡터이다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 다르다. 레트로바이러스 벡터는 6 내지 10 kb 이하의 외래 서열에 대한 패키징 용량을 가진 시스-작용성 긴 말단 반복부로 구성된다. 최소 시스-작용성 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 치료 유전자를 표적 세포에 통합하여 영구적인 트랜스진 발현을 제공하는 데 사용된다. 광범위하게 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역 결핍 바이러스 (SIV), 인간 면역 결핍 바이러스 (HIV) 및 그의 조합을 기반으로 하는 벡터를 포함한다 (예를 들어, 문헌 [Buchscher, et al. (1992) J. Virol. 66:2731-2739; Johann, et al. (1992) J. Virol. 66:1635-1640; Sommerfelt, et al. (1990) Virol. 176:58-59; Wilson, et al. (1989) J. Virol. 63:2374-2378; Miller, et al. (1991) J. Virol. 65:2220-2224]; 국제 특허 공개 번호 WO 94/26877 참조).

일시적 발현이 선호되는 적용에서는, 아데노바이러스 기반 시스템을 사용할 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하며 세포 분열을 필요로 하지 않는다. 이러한 벡터를 이용하여, 높은 역가 및 높은 수준의 발현이 수득되었다. 이러한 벡터는 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 아데노 관련 바이러스 ("AAV") 벡터는 또한, 예를 들어, 핵산 및 펩티드의 시험관 내 생산에서, 및 생체 내 및 생체 외 유전자 요법 절차를 위해, 표적 핵산으로 세포를 형질도입하는 데 사용된다 (예를 들어, 문헌 [West, et al. (1987) Virology 160:38-47]; 미국 특허 번호 4,797,368; 국제 특허 공개 번호 WO 93/24641; 문헌 [Kotin (1994) Human Gene Therapy 5:793-801; Muzyczka (1994) J. Clin. Invest. 94:1351] 참조). 재조합 AAV 벡터의 구축은 미국 특허 번호 5,173,414; 문헌 [Tratschin, et al. (1985) Mol. Cell. Biol. 5:3251-3260; Tratschin, et al. (1984) Mol. Cell. Biol. 4:2072-2081; Hermonat & Muzyczka (1984) PNAS USA 81:6466-6470; 및 Samulski, et al. (1989) J. Virol. 63:03822-3828]을 포함한 수많은 공보에 기재되어 있다.

적어도 6개의 바이러스 벡터 접근법이 현재 임상 시험에서 유전자 전달을 위해 이용가능하며, 이는 형질도입제를 생성하기 위해 헬퍼 세포주에 삽입된 유전자에 의한 결함 벡터의 상보성을 수반하는 접근법을 활용한다.

pLASN 및 MFG-S는 임상 시험에 사용된 레트로바이러스 벡터의 예이다 (Dunbar, et al. (1995) Blood 85:3048-305; Kohn, et al. (1995) Nat. Med. 1:1017-102; Malech, et al. (1997) PNAS USA 94(22):12133-12138). PA317/pLASN이 유전자 요법 시험에 사용된 첫 번째 치료용 벡터였다 (Blaese, et al. (1995) Science 270:475-480). MFG-S 패키지 벡터에 대해 50% 이상의 형질도입 효율이 관찰되었다 (Ellem, et al. (1997) Immunol Immunother. 44(1):10-20; Dranoff, et al. (1997) Hum. Gene Ther. 1:111-2).

재조합 아데노 관련 바이러스 벡터 (rAAV)는 결함이 있고 비병원성인 파보바이러스 아데노 관련 유형 2 바이러스를 기반으로 하는 유망한 대체 유전자 전달 시스템이다. 모든 벡터는 트랜스진 발현 카세트를 플랭킹하는 AAV 145 bp 역위 말단 반복부만을 보유하는 플라스미드로부터 유래된다. 형질도입된 세포의 게놈으로의 통합으로 인한 효율적인 유전자 전달과 안정적인 트랜스진 전달이, 이러한 벡터 시스템에 대한 주요 특징이다 (Wagner, et al. (1998) Lancet 351(9117):1702-3, Kearns, et al. (1996) Gene Ther. 9:748-55). AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV8.2, AAV9 및 AAVrh10을 포함한 다른 AAV 혈청형 및 위형화된 AAV, 예컨대 AAV2/8, AAV2/5 및 AAV2/6이 또한 본 발명에 따라 사용될 수 있다. 복제 결핍성 재조합 아데노바이러스 벡터 (Ad)는 높은 역가로 생산될 수 있으며 많은 상이한 세포 유형을 쉽게 감염시킬 수 있다. 대부분의 아데노바이러스 벡터는 트랜스진이 Ad E1a, E1b 및/또는 E3 유전자를 대체하도록 조작되며; 이어서 복제 결함 벡터는 트랜스에서 결실된 유전자 기능을 공급하는 인간 293 세포에서 증식될 수 있다. Ad 벡터는 분열되지 않은 분화된 세포, 예컨대 간, 신장 및 근육에서 발견되는 것을 포함하여, 생체 내에서 여러 유형의 조직을 형질도입할 수 있다. 기존의 Ad 벡터는 큰 운반 능력을 가지고 있다. 임상 시험에서 Ad 벡터 사용의 예는 근육내 주사를 통한 항종양 면역화를 위한 폴리뉴클레오티드 요법을 수반하였다 (Sterman et al. (1998) Hum. Gene Ther. 7:1083-1089). 임상 시험에서 유전자 전달을 위한 아데노바이러스 벡터의 사용의 부가의 예는 하기 문헌을 포함한다 (Rosenecker, et al. (1996) Infection 24(1):5-10; Sterman, et al. (1998) Hum. Gene Ther. 9(7):1083-1089; Welsh, et al. (1995) Hum. Gene Ther. 2:205-218; Alvarez, et al. (1997) Hum. Gene Ther. 5:597-613; Topf, et al. (1998) Gene Ther. 5:507-513; Sterman, et al. (1998) Hum. Gene Ther. 7:1083-1089).

패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 통상적으로 핵산 벡터를 바이러스 입자로 패키징하는 생산자 세포주에 의해 생성된다. 벡터는 전형적으로 패키징 및 숙주로의 후속 통합에 필요한 최소 바이러스 서열을 함유하고 (적용가능한 경우), 다른 바이러스 서열은 발현될 단백질을 코딩하는 발현 카세트로 대체된다. 누락된 바이러스 기능은 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 요법에 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈으로부터의 역위 말단 반복부 (ITR) 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자, 즉 rep 및 cap을 코딩하는 헬퍼 플라스미드를 함유하지만 ITR 서열이 결여된 세포주에 패키징된다. 세포주는 또한 헬퍼로서 아데노바이러스에 감염된다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 상당한 양으로 패키징되지 않는다. 예를 들어, 아데노바이러스가 AAV보다 더 감수성인 열처리를 통해 아데노바이러스에 의한 오염을 감소시킬 수 있다.

많은 유전자 요법 적용에서, 유전자 요법 벡터는 특별한 조직 유형에 대해 높은 정도의 특이성으로 전달되는 것이 바람직하다. 따라서, 바이러스의 외부 표면 상의 바이러스 코트 단백질과의 융합 단백질로서 리간드를 발현함으로써 주어진 세포 유형에 대한 특이성을 갖도록 바이러스 벡터를 변형시킬 수 있다. 리간드는 관심 세포 유형에 존재하는 것으로 공지된 수용체에 대한 친화성을 갖도록 선택된다. 예를 들어, 문헌 [Han, et al. (1995) Proc. Natl. Acad. Sci. USA 92:9747-9751]에는 몰로니(Moloney) 뮤린 백혈병 바이러스가 gp70에 융합된 인간 헤레굴린을 발현하도록 변형될 수 있으며, 재조합 바이러스가 인간 표피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다고 보고되었다. 이러한 원리는 다른 바이러스-표적 세포 쌍으로 확장될 수 있는데, 여기서 표적 세포는 수용체를 발현하고 바이러스는 세포 표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 사상 파지(filamentous phage)는 사실상 임의의 선택된 세포 수용체에 대한 특이적 결합 친화성을 갖는 항체 단편 (예를 들어, FAB 또는 Fv)을 표시하도록 조작될 수 있다. 상기 설명이 주로 바이러스 벡터에 적용되긴 하지만, 동일한 원리가 비-바이러스 벡터에도 적용될 수 있다. 이러한 벡터는 특이적 표적 세포에 의한 흡수를 선호하는 특이적 흡수 서열을 함유하도록 조작될 수 있다.

CRISPR/Cas 시스템에 대한 전달 방법은 상기 기재된 방법을 포함할 수 있다. 예를 들어, 동물 모델에서, 시험관 내 전사된 Cas 코딩 mRNA 또는 재조합 Cas 단백질은 유리 바늘을 사용하여 게놈 편집된 동물에게 직접 1-세포 단계 배아에 주입될 수 있다. Cas를 발현하고 시험관 내 세포에서 RNA를 가이드하기 위해, 전형적으로 이를 코딩하는 플라스미드를 리포펙션 또는 전기천공을 통해 세포로 형질감염시킨다. 또한 재조합 Cas 단백질은 시험관 내 전사된 가이드 RNA와 복합체를 형성할 수 있으며, 여기서 Cas-가이드 RNA 리보핵단백질이 관심 세포에 의해 흡수된다 (Kim, et al. (2014) Genome Res 24(6):1012). 치료 목적으로, Cas 및 가이드 RNA는 바이러스 기술과 비-바이러스 기술의 조합에 의해 전달될 수 있다. 예를 들어, Cas를 코딩하는 mRNA는 나노 입자 전달을 통해 전달될 수 있는 반면, 가이드 RNA 및 임의의 원하는 트랜스진 또는 복구 주형은 AAV를 통해 전달된다 (Yin, et al. (2016) Nat Biotechnol 34(3):328).

유전자 요법 벡터는 전형적으로 하기 기재되는 바와 같이, 전신 투여 (예를 들어, 정맥 내, 복강 내, 근육 내, 피하 또는 두개 내 주입) 또는 국소 적용에 의해 개별 환자 (대상체)에게 투여함으로써 생체 내 전달될 수 있다. 또 다른 한편으론, 벡터는 생체 외 세포, 예컨대 개별 환자로부터 체외 이식된 세포 (예를 들어, 림프구, 골수 흡인물, 조직 생검) 또는 범용 공여자 조혈 줄기 세포에 전달될 수 있으며, 이어서 통상적으로 벡터를 혼입시킨 세포에 대한 선별 후에, 환자에게 세포를 다시 체내 이식할 수 있다.

진단, 연구, 이식 또는 유전자 요법을 위한 생체 외 세포 형질감염 (예를 들어, 숙주 유기체에 형질감염된 세포의 재주입을 통함)은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 바람직한 실시양태에서, 세포는 대상 유기체로부터 단리되고, DNA 결합 단백질 핵산 (유전자 또는 cDNA)으로 형질감염되고, 대상 유기체 (예를 들어, 환자)로 다시 주입된다. 생체 외 형질감염에 적합한 다양한 세포 유형은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 [Freshney, et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994)] 및 환자로부터 세포를 단리하고 배양하는 방법의 논의에 대해 상기 문헌에 인용된 참고 문헌 참조).

한 실시양태에서, 줄기 세포는 세포 형질감염 및 유전자 요법을 위한 생체 외 절차에 사용된다. 줄기 세포를 사용하는 이점은 시험관 내에서 다른 세포 유형으로 분화될 수 있거나, 또는 골수에 생착될 포유 동물 (예컨대, 세포의 공여자)에 도입될 수 있다는 것이다. 시토카인, 예컨대 GM-CSF, IFN-γ 및 TNF-α를 사용하여 시험관 내에서 CD34+ 세포를 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법이 공지되어 있다 (문헌 [Inaba, et al. (1992) J. Exp. Med. 176:1693-1702] 참조).

줄기 세포는 공지된 방법을 사용하여 형질도입 및 분화를 위해 단리된다. 예를 들어, 줄기 세포는 원치 않는 세포와 결합하는 항체, 예컨대 CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구), 및 Iad (분화된 항원 제시 세포)로 골수 세포를 패닝함으로써 골수 세포로부터 단리된다 (문헌 [Inaba, et al. (1992) J. Exp. Med. 176:1693-1702] 참조).

변형된 줄기 세포가 또한 일부 실시양태에서 사용될 수 있다. 예를 들어, 아폽토시스에 대해 내성이 있는 신경 줄기 세포가 치료 조성물로서 사용될 수 있으며, 여기서 줄기 세포는 또한 본 발명의 ZFP TF를 함유한다. 아폽토시스에 대한 내성은, 예를 들어, 줄기 세포에서 BAX 또는 BAK 특이적 ZFN (미국 특허 번호 8,597,912 참조)을 사용하여 BAX 및/또는 BAK를 녹아웃시키거나, 또는 예를 들어 카스파제-6 특이적 ZFN을 다시 사용하여, 카스파제에서 붕괴된 것들에 의해 발생할 수 있다.

치료용 DNA 결합 단백질 (또는 이들 단백질을 코딩하는 핵산)을 함유하는 벡터 (예를 들어, 레트로바이러스, 아데노바이러스, 리포좀 등)는 생체 내에서 세포의 형질도입을 위해 유기체에 직접 투여될 수도 있다. 또 다른 한편으론, 있는 그대로의 DNA를 투여할 수 있다. 투여는 주사, 주입, 국소 적용 및 전기천공을 포함 하나 이에 제한되지는 않는, 혈액 또는 조직 세포와의 궁극적인 접촉에 분자를 도입하기 위해 정상적으로 사용되는 경로 중 임의의 것에 의해 이루어진다. 이러한 핵산을 투여하는 적합한 방법이 이용가능하고 관련 기술분야의 통상의 기술자에게 널리 공지되어 있으며, 특별한 조성물을 투여하기 위해 한 가지 초과의 경로가 사용될 수 있지만, 특별한 경로는 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.

조혈 줄기 세포에 DNA를 도입하는 방법은, 예를 들어, 미국 특허 번호 5,928,638에 개시되어 있다. 조혈 줄기 세포, 예를 들어, CD34+ 세포로의 트랜스진의 도입에 유용한 벡터는 아데노바이러스 유형 35를 포함한다.

트랜스진을 면역 세포 (예를 들어, T 세포)로 도입하는 데 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다 (예를 들어, 문헌 [Ory, et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull, et al. (1998) J. Virol. 72:8463-8471; Zuffery, et al. (1998) J. Virol. 72:9873-9880; Follenzi, et al. (2000) Nature Genetics 25:217-222] 참조).

제약상 허용되는 담체는 부분적으로, 투여되는 특별한 조성물뿐만 아니라 조성물을 투여하는 데 사용되는 특별한 방법에 의해 결정된다. 따라서, 하기에 기재되는 바와 같이, 이용가능한 제약 조성물의 광범위한 적합한 제형이 있다 (예를 들어, 문헌 [Remington's Pharmaceutical Sciences, 17th ed., 1989] 참조).

상기 언급된 바와 같이, 개시된 방법 및 조성물은 원핵 세포, 진균 세포, 고세균 세포, 식물 세포, 곤충 세포, 동물 세포, 척추 동물 세포, 포유 동물 세포, 및 T-세포 및 임의의 유형의 줄기 세포를 포함한 인간 세포를 포함하나 이에 제한되지는 않는 임의의 유형의 세포에서 사용될 수 있다. 단백질 발현에 적합한 세포주는 관련 기술분야의 통상의 기술자에게 공지되어 있고, COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), perC6, 곤충 세포, 예컨대 스포도프테라 푸기페르다 (Sf), 및 진균 세포, 예컨대 사카로마이세스, 피치아 및 쉬조사카로마이세스를 포함하나, 이에 제한되지는 않는다. 이들 세포주의 자손, 변이체 및 유도체가 또한 사용될 수 있다.

적용

질환의 치료 및 예방에 조작된 DNA 염기 편집기 복합체를 사용하면 의학 분야에 있어서 상당한 발전이 제공된다. 본원에 기재된 방법 및 조성물은 원하는 표적 부위가 편집의 주요 장소가 되도록 보장하기 위해 이러한 신규 도구의 특이성을 증가시키는 역할을 한다.

본원에 기재된 조성물 및 방법에 의해 치료 및/또는 예방될 수 있는 예시적인 유전 질환은 연골 무형성증, 완전 색맹, 산성 말타제 결핍, 아데노신 데아미나제 결핍 (OMIM 번호 102700), 부신 백질 형성 장애증, 에카르디 증후군, 알파-1 항트립신 결핍, 알파-지중해 빈혈, 안드로겐 불감성 증후군, 아페르(apert) 증후군, 부정맥유발성 우심실 이형성증, 모세혈관 확장성 운동 실조증, 바르트(barth) 증후군, 베타-지중해 빈혈, 청색 고무 수포 모반 증후군, 캐너번(canavan)병, 만성 육아종성 질환 (CGD), 고양이 울음 증후군, 낭포성 섬유증, 더컴(dercum)병, 외배엽 형성 이상, 판코니 빈혈, 진행성 골화성 섬유이형성증, 취약 X 증후군, 갈락토스혈증, 고셔(Gaucher)병, 전신성 강글리오시드증 (예를 들어, GM1), 혈색소 침착증, 베타-글로빈의 6번째 코돈에서의 헤모글로빈 C 돌연변이 (HbC), 혈우병, 헌팅턴병, 후를러(Hurler) 증후군, 저인산증, 클라인펠터(Klinefelter) 증후군, 크라베(Krabbes)병, 랑거-기디온(Langer-Giedion) 증후군, 백혈구 유착 결핍 (LAD, OMIM 번호 116920), 백질 이영양증, 긴 QT 증후군, 마르판 증후군, 뫼비우스 증후군, 점액 다당류증 (MPS), 손발톱 슬개골 증후군, 신성 요붕증, 신경 섬유종증, 니만-피크(Niemann-Pick)병, 불완전 골형성증, 페닐케톤뇨증 (PKU), 포르피린증, 프라더-윌리(Prader-Willi) 증후군, 조로증, 프로테우스(Proteus) 증후군, 망막 모세포종, 레트(Rett) 증후군, 루빈스타인-타이비(Rubinstein-Taybi) 증후군, 산필리포(Sanfilippo) 증후군, 중증 복합 면역 결핍증 (SCID), 슈와크만(Shwachman) 증후군, 겸상 적혈구병 (겸상 적혈구 빈혈), 스미스 마제니스(Smith-Magenis) 증후군, 스티클러(Stickler) 증후군, 테이 삭스병, 저혈소판 요골 무형성 (TAR) 증후군, 트리처 콜린스(Treacher Collins) 증후군, 삼염색체증, 결절성 경화증, 터너(Turner) 증후군, 요소 회로 장애, 폰 히펠 란다우(von Hippel-Landau)병, 바르덴부르크(Waardenburg) 증후군, 윌리암스(Williams) 증후군, 윌슨(Wilson)병, 비스코트-알드리치(Wiskott-Aldrich) 증후군, X 연관 림프 증식성 증후군 (XLP, OMIM 번호 308240)을 포함하나, 이에 제한되지는 않는다.

표적화된 DNA 염기 편집에 의해 치료될 수 있는 부가의 예시적인 질환은 후천성 면역 결핍증, 리소좀 저장 질환 (예를 들어, 고셔병, GM1, 파브리병 및 테이 삭스병), 점액 다당류증 (예를 들어, 헌터병, 후를러병), 혈색소병증 (예를 들어, 겸상 적혈구병, HbC, α-지중해 빈혈, β-지중해 빈혈) 및 혈우병을 포함한다.

이러한 방법은 또한 숙주에서 감염 (바이러스성 또는 박테리아성)을 치료 (예를 들어, 바이러스 또는 박테리아 수용체의 발현을 차단함으로써, 숙주 유기체에서의 감염 및/또는 확산을 예방함으로써 이루어진다)를 허용하여 유전 질환을 치료할 수 있다.

표적화된 염기 편집은 또한 숙주에서 바이러스성 감염을 치료하기 위해 사용될 수 있다. 부가적으로, 바이러스에 대한 수용체를 코딩하는 유전자의 표적화된 절단은 이러한 수용체의 발현을 차단함으로써, 숙주 유기체에서의 바이러스성 감염 및/또는 바이러스성 확산을 방지하는 데 사용될 수 있다. 바이러스 수용체 (예를 들어, HIV에 대한 CCR5 및 CXCR4 수용체)를 코딩하는 유전자의 표적화된 돌연변이 유발은 수용체가 바이러스와 결합할 수 없도록 만들어, 그에 의해 새로운 감염을 예방하고 기존 감염의 확산을 차단하는 데 사용될 수 있다 (미국 특허 공개 번호 2008/015996 참조). 표적화될 수 있는 바이러스 또는 바이러스 수용체의 비-제한적인 예는 단순 포진 바이러스 (HSV), 예컨대 HSV-1 및 HSV-2, 수두 대상 포진 바이러스 (VZV), 엡스타인-바 바이러스 (EBV) 및 시토메갈로바이러스 (CMV), HHV6 및 HHV7을 포함한다. 바이러스의 간염 패밀리는 A형 간염 바이러스 (HAV), B형 간염 바이러스 (HBV), C형 간염 바이러스 (HCV), 델타 간염 바이러스 (HDV), E형 간염 바이러스 (HEV) 및 G형 간염 바이러스 (HGV)를 포함한다. 피코르나비리다에(Picornaviridae) (예를 들어, 폴리오바이러스 등); 칼리시비리다에(Caliciviridae); 토가비리다에(Togaviridae) (예를 들어, 풍진 바이러스, 뎅기 바이러스 등); 플라비비리다에(Flaviviridae); 코로나비리다에(Coronaviridae); 레오비리다에(Reoviridae); 비르나비리다에(Birnaviridae); 라보도비리다에(Rhabodoviridae) (예를 들어, 광견병 바이러스 등); 필로비리다에(Filoviridae); 파라믹소비리다에(Paramyxoviridae) (예를 들어, 유행성 이하선염 바이러스, 홍역 바이러스, 호흡기 세포 융합 바이러스 등); 오르토믹소비리다에(Orthomyxoviridae) (예를 들어, 인플루엔자 바이러스 유형 A, B 및 C 등); 분야비리다에(Bunyaviridae); 아레나비리다에(Arenaviridae); 레트로비리다에(Retroviridae); 렌티바이러스 (예를 들어, HTLV-I; HTLV-II; HIV-1 (HTLV-III, LAV, ARV, hTLR 등으로서 공지되기도 함) HIV-II); 유인원 면역 결핍 바이러스 (SIV), 인간 유두종 바이러스 (HPV), 인플루엔자 바이러스 및 진드기 매개 뇌염 바이러스를 포함하나 이에 제한되지는 않는 다른 바이러스 또는 그의 수용체가 표적화될 수 있다. 이들 및 다른 바이러스의 설명에 관해서는, 예를 들어 문헌 [Virology, 3rd Edition (W. K. Joklik ed. 1988); Fundamental Virology, 2nd Edition (B. N. Fields and D. M. Knipe, eds. 1991)]을 참조한다. 예를 들어, HIV에 대한 수용체는 CCR-5 및 CXCR-4를 포함한다. 상기 언급된 바와 같이, 본원에 기재된 조성물 및 방법은 유전자 변형, 유전자 교정 및 유전자 붕괴에 사용될 수 있다.

본원에 기재된 조성물 및 방법은 또한 하기를 발생시키는 편집을 포함하나 그에 제한되지는 않는 줄기 세포 기반 요법에 적용될 수 있다: 체세포 돌연변이의 교정; 우성 음성 대립 유전자의 붕괴; 병원체가 세포로 유입되거나 생산적으로 감염되는 데 필요한 유전자의 붕괴; 예를 들어, 기능적 조직의 분화 또는 형성을 촉진하기 위해 유전자 활성을 편집하고/하거나 기능적 조직의 분화 또는 형성을 촉진하기 위해 유전자 활성을 방해함으로써 증강된 조직 조작; 예를 들어, 분화를 차단하는 유전자를 편집함으로써 분화를 차단 또는 유도하여 줄기 세포가 특이적 계통 경로로 분화되는 것을 촉진시키는 것. 이러한 절차를 위한 세포 유형은 T 세포, B 세포, 조혈 줄기 세포 및 배아 줄기 세포를 포함하나 이에 제한되지는 않는다. 부가적으로, 유도 다능성 줄기 세포 (iPSC)가 사용될 수 있으며, 이는 환자 자신의 체세포로부터 생성될 수도 있다. 따라서, 이들 줄기 세포 또는 그의 유도체 (분화된 세포 유형 또는 조직)는 그의 기원이나 조직 적합성에 관계 없이 임의의 사람에게 잠재적으로 생착될 수 있었다.

상기 조성물 및 방법은 또한 체세포 요법에 사용될 수 있으며, 이에 의해 생물학적 특성을 증강시키기 위해 변형된 세포의 스톡을 생산할 수 있다. 이러한 세포는 세포의 공여자 공급원 및 수용자에 대한 조직 적합성에 관계 없이 다양한 환자에게 주입될 수 있다.

치료적 적용 이외에, 본원에 기재된 DNA 편집 복합체는 작물 조작, 세포주 조작 및 질환 모델의 구축에 사용될 수 있다. 절대적인 이종 이량체 절단 절반 도메인은 뉴클레아제 특성을 개선하기 위한 직접적인 수단을 제공한다.

본원에 기재된 조작된 DNA 편집 복합체는 한 번에 다수의 표적에서 동시 절단을 필요로 하는 유전자 변형 프로토콜에서도 사용될 수 있다. 2개의 표적에서의 편집은 2개의 DNA 편집 복합체의 세포 발현을 필요로 하며, 이는 다른 복합체에서의 절단 도메인과 상호작용 (이량체화)하지 않는 각각의 복합체 내의 절단 도메인을 포함하는 닉카제를 사용하여 달성되는 것이 바람직하다.

실시예

실시예 1: ZFP의 제조

문헌 [Urnov, et al. (2005) Nature 435(7042):646-651, Perez, et al. (2008) Nature Biotechnology 26(7): 808-816], 및 국제 특허 공개 번호 WO 2016/183298 및 WO 2017/106528에 본질적으로 기재된 바와 같이, 특이적 표적 부위를 표적으로 하는 ZFP가 설계되고 플라스미드 벡터 내로 혼입된다. 미국 특허 번호 8,586,526 및 9,873,894에 기재된 바와 같이, 특이적 부위에 대한 TALE 및 sgRNA가 또한 개발된다.

염기 편집을 위한 한 가지 예시적인 표적은 알파-1 항트립신 (A1AT)을 코딩하는 SERPINA 유전자좌이다. A1AT 단백질에서 상염색체 열성 결핍을 유발시키는 유전자좌에서의 돌연변이는 간 및 폐 질환 둘 다와 연관이 있다. 북유럽 혈통의 사람들에게 가장 흔한 결핍 대립 유전자 중 하나인 PiZ 돌연변이는 A1AT 단백질의 약 10-20%만 생산되도록 한다. 이러한 돌연변이는 엑손 5에서의 단일 돌연변이에 의해 야기되어, 아미노산 위치 342에서의 리신이 글루타민으로 치환되며, 여기서 DNA 내의 위치 1096에 있는 G가 돌연변이된 유전자 서열에서의 A이다 (문헌 [Fregonese and Stolk (2008) Orphanet J Rare Dis 3:16]에서 검토됨).

또 다른 예시적인 표적은 JAK2 V617F 돌연변이이다. V617F를 편집하여 또 다른 돌연변이를 형성하면, JAK2를 덜 활성화시킬 수 있다. 예를 들어, V617L, V617P 및 V617S 돌연변이는 V617F보다 덜 활성화되는 것으로 나타났다 (Dusa, et al. (2008) J Biol Chem 283(19):12941-12948).

따라서, A1AT에서의 돌연변이 근처 영역을 표적으로 하는 몇 가지 징크 핑거 단백질 (ZFP)이 만들어졌다 (도 2 참조). ZFP의 설계는 하기 표 1A (A1AT) 및 표 1B (JAK2)에 제시되어 있다.

<표 1A>

<표 1B>

몇 가지 상이한 조합을 포함하는 염기 편집기는 표준 프로토콜을 사용하여 구축된다. 상이한 조합은 하나 이상의 데아미나제, 헬리카제, 선택된 DNA 결합 도메인 (ZFP, TALE, sgRNA), dCas, 닉카제 (ZFN, TALEN, CRISPR/Cas) 복합체, UGI, GAM 등을 포함하는 편집기를 포함한다. 상기 조합은 순차적으로 융합된 선택된 도메인을 포함하는 복합체를 포함하거나, 또는 상기 조합이 별도의 융합 단백질로서 공급된다. 임의의 링커가 도메인 사이에 사용된다.

조합은 세포로의 형질감염을 위해 또는 시험관 내 mRNA의 생산에 사용하기 위해 발현 구축물로 어셈블리된다. 이어서, 이들 mRNA는 관련 기술분야에 공지된 방법 (예를 들어, 전기천공)에 의해 세포에 도입될 수 있다. 표적화된 돌연변이가 없는 세포가 대조군으로서 사용된다.

실시예 2: 아데닌 염기 편집기

아데닌 염기 편집기는 분자의 C-말단 측에 있는 돌연변이된 A1AT PiZ 돌연변이를 표적으로 한 ZFP DNA 결합 도메인에 연결된, PAM 요구 사항이 완화된 Cas9 변이체 (SpCas9VRVRFRR_D10A; 문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 또는 xCas9; 문헌 [Hu, et al. (2018) Nature 556:57-63] 참조)를 사용하여 구축되었다. 인접한 DNA 영역과 결합하도록 설계된 일련의 ZFP DNA 결합 도메인 (실시예 1 참조)을 염기 편집기에 혼입하였다 (도 2 및 7 참조). ZFP는 3개의 HA 펩티드와 2개의 뉴클레아제 국재화 서열 (NLS)을 포함하는 링커를 사용하여 Cas9에 부착되었다. 링커의 서열은 하기와 같다: GTGGPKKKRKVYPYDVPDYAGYPYDVPDYAGSYPYDVPDYAGSAAPAAKKKKLDFESE (서열식별번호: 3) (문헌 [Bolukbasi, et al. (2015) Nat Methods 12(12):1150-1156] 참조). 이어서, Cas9는 N 말단 측에 있는 2개의 이. 콜라이 TadA 아데닌 데아미나제 ("ecTadA"; 문헌 [Kim, et al. (2006) Biochemistry 45:6407-6416])에 연결되었다. 이러한 구축물에서, TadA 단백질 중 하나는 야생형 단백질이었고 다른 하나는 진화된 버전이었다 (Gaudelli, et al. (2017) Nature 551:464). 세린-글리신이 풍부한 링커는 Cas9와 TadA 서브유닛 사이에 2회 사용되었고, 하기 서열을 포함하였다: SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 2). 아데닌 염기 편집기 (ABE)의 개략도가 도 3a에 도시되어 있다. 일부 경우에는, 다른 유형의 아데닌 데아미나제가 사용된다. 예를 들어, 일부 구축물에서, ABE7.10 데아미나제 또는 ABEmax 아데닌 데아미나제 (문헌 [Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846])가 사용된다.

JAK2 V617F 돌연변이를 표적으로 하기 위해, 돌연변이 부위 근처의 JAK2 유전자를 표적으로 하는 Cas9NG 아데닌 염기 편집기는 돌연변이 부위의 상류에 위치한 TAA 또는 AAT 또는 AAA PAM 부위를 사용하여 만들어진다 (도 7a 내지 7c 참조). ZFP DNA 결합 도메인은 상기 기재된 바와 같은 염기 편집기에 융합되고, HSC/PC를 편집하는 데 사용된다. ZFP 서열에 표 1B에 제시된다. 임의의 링커가 핑거 사이 및/또는 ZFP와 염기 편집기 사이에 사용될 수 있다.

그 결과는 표적 유전자좌에서의 성공적인 편집을 보여준다. 도 7a는 아미노산 서열에서 세린 (S) 또는 프롤린 (P)으로의 변화를 야기시키는 염기 편집을 도시한다. 이들 변이체 둘 다는 페닐알라닌 돌연변이체 (F)보다 덜 활성화되는 것으로 나타났다 (문헌 [Dusa, et al. (2008) J Biol Chem 283(19):12941-8] 참조).

세포 (예를 들어, K562 세포)는 염기 편집기를 포함하는 발현 벡터 (예를 들어, 플라스미드 또는 바이러스 벡터)로 형질감염되거나, 또는 세포는 상기 기재된 바와 같은 염기 편집기를 코딩하는 mRNA를 사용하여 전기천공된다. 형질감염된 세포를 수거하고 게놈 DNA를 단리한다. 온 타겟 관심 게놈 영역 및 오프 타겟 관심 게놈 영역은 관련 기술분야의 표준 방법에 따라 PCR 증폭에 의해 증폭된다. 서열은 염기 편집 및 인델의 존재에 대해 평가된다.

아데닌 염기 편집기 (ABE)는 K562 세포 상에서 상기 기재된 바와 같이 A1AT 유전자좌에서 시험되었으며, 여기서 200,000개 세포 당 염기 편집기를 코딩하는 800 ng의 플라스미드 DNA가 사용되었다. 실험은 또한 Z가 없는 K562 세포에서 수행되었으며 질환 유발 돌연변이에 매우 근접한 A 뉴클레오티드가 활성 측정을 위한 프록시로서 사용되었다. 아맥사(Amaxa) 장치를 사용한 형질감염 (제조업체의 프로토콜에 따름) 후 72시간에, 세포를 수거하고 Miseq 분석 [일루미나(Illumina)]을 수행하여, 발생했을 수 있는 임의의 편집을 분석하였다. 도 4는 복합체의 편집 창 내에서 표적화될 수 있는 A 염기를 예시하며, 여기서 이들 위치에 G가 존재하는 것은 A 염기 편집이 발생했다는 것을 나타낼 것이다.

변이체 ZFP 도메인을 포함하는 각각의 구축물의 3가지 상이한 클론이 시험되었다. 그 결과가 하기 표 2에 제시되어 있다 (용어 "Cas9VRVRFRR", "Cas9VR" 및 "Cas9NG"는 상호 교환가능하게 사용되는 것에 주목해야 한다):

<표 2>

A1AT 유전자좌에서의 아데닌 염기 편집

"sgRNA_단독"으로 표지된 행은 가이드 RNA만을 포함하는 행이고, "ABE_Cas9VR_D10A"는 ZFP DNA 결합 도메인이 결여된 복합체이다. 데이터로부터 알 수 있는 바와 같이, 위치 A5에서의 아데닌의 표적화된 편집은 ZFP 도메인이 결여된 편집 복합체와 비교 시 ZFP DNA 결합 도메인의 일부 존재 하에 증가되었다. ZFP가 없는 천연 ABE-Cas9 융합 구축물은 약 0.5% 염기 편집을 발생시킨 반면, ABE-Cas9-ZFP 융합 구축물은 이러한 데이터 세트에서 적어도 7배 더 높은 염기 편집 효율성을 보여주었다.

이들 실험에서는, ABEmax 또는 ABE7.10 아데닌 데아미나제에 연결된 xCas 또는 Cas9NG 단백질을 사용하여 연구를 수행하였다. 사용된 가이드 RNA는 TGT PAM 또는 AGT PAM이다. 결과는 ZFP DNA 결합 도메인 (ZFP 앵커)이 결여된 염기 편집기와 비교 시 5배 내지 10배 이상의 염기 편집 효율성을 보여주었다.

ABE 7.9 및 ABE 7.8의 사용을 포함하여 대체 버전의 아데닌 데아미나제를 사용하여 추가 실험을 수행하였으며, 거의 동등한 수준의 결과를 보여주었다.

JAK2 V617F 돌연변이체의 염기 편집을 위해, V617F 돌연변이가 없는 K562 세포에서 수행된 실험을 포함하여 실험 조건은 상기 기재된 바와 동일하였지만, 질환 유발 돌연변이에 매우 근접한 A 뉴클레오티드가 활성 측정을 위한 프록시로서 사용되었다. 표적화된 PAM 서열 도 7b에 도시되어 있다. ABEmax에 연결된 xCas 또는 Cas9NG 단백질의 다양한 조합을 사용하여 연구를 수행하였다 (예를 들어, 도 3b 참조).

결과는 ZFP 앵커의 존재가 AAT 및 TAA PAM 서열에서의 활동을 보여주는 것을 포함하여, 편집을 개선하고 PAM 요구 사항을 완화하였다는 것을 보여주었다. 특히, TAA PAM 서열을 사용하는 염기 편집기는 ZFP 도메인 없이 이러한 부위에서 불활성이다. 예를 들어, 도 7c에 도시된 바와 같은 예시적인 결과를 참조한다.

부가의 질환 관련 점 돌연변이에 대해 부가의 실험이 수행되고, ZFP 앵커 도메인의 존재하에 더 높은 염기 편집 특이성 및/또는 활성이 달성된다. 더욱이, 편집될 표적화된 염기에 따라, NAN (예를 들어, TAA), AAT, NGG (TGG), NGT (예를 들어, TGT 또는 AGT)를 포함하나 이에 제한되지는 않는 임의의 PAM 서열이 사용될 수 있다.

실시예 3: 시티딘 염기 편집기

C 뉴클레오티드를 U로 전환시키기 위한 시티딘 염기 편집기는 아포지질단백질 B mRNA 편집 효소, 촉매 폴리펩티드 유사 (APOBEC) 단백질을 사용하여 구축된다 (Yang, et al. (2017) J Genet Genomics 44(9):423-437). 특히, 시티딘 염기 편집기는 시티딘 데아미나제, 예컨대 아포지질단백질 B mRNA 편집 효소, 촉매 폴리펩티드 1 또는 APOBEC-1을 사용하여 만들어진다. AICDA 유전자에 의해 코딩된, AICDA 및 AID로서 공지되기도 한 활성화 유도 시티딘 데아미나제가 또한 본원에 기재된 바와 같은 시티딘 데아미나제 염기 편집기에 포함될 수 있다.

U:G 이종 이중 나선 DNA에 대한 세포 복구 반응은 DNA로부터의 U의 제거를 촉매하고 U:G 쌍에서 C:G 쌍으로의 역전과 함께 염기 절제 복구를 시작하는 우라실 DNA 글리코실라제 (UDG)의 활성을 유발하여, 염기 편집의 효율성을 저하시키는 것으로 생각된다. 따라서, 시티딘 염기 편집기는 내인성 UDG 활성을 차단하기 위해 편집기에 융합된 우라실 글리코실라제 억제제 (UGI)를 가질 수 있다 (Komor, et al. (2016) Nature 533(7603):420-424). 시티딘 염기 편집기는 APOBEC1 또는 B 세포 특이적 활성화 유도 시티딘 데아미나제 (AID) 효소에 연결된 ZFP DNA 결합 도메인을 사용하여 구축된다 (Kescu and Adli (2016) Nat Methods 13(12):983). 시티딘 염기 편집기는 DNA 결합 도메인, 예컨대 ZFP에 부착된다.

일부 실시양태에서, 편집기는 UGI 이량체를 추가로 포함한다 (도 5a 내지 5f 참조). UGI 이량체는 링커, 예컨대 L0 (LRGS, 서열식별번호: 76) 또는 N7a (SGTPHEVGVYTL, 서열식별번호: 28; 미국 특허 공개 번호 2017/0218349 참조)를 사용하여 ZFP DNA 결합 도메인에 부착된다. AID 또는 APOBEC1은 링커, 예컨대 L0 또는 서열, 예컨대 SGGGLGST (서열식별번호: 29; 문헌 [Yang, et al. (2016) Nat Commun DOI:10.1038/ncomms13330])를 통해 ZFP에 부착된다.

시티딘 염기 편집기는 또한 UGI 도메인 없이 구축된다. 일부 편집기는 하나의 파트너가 촉매적으로 불활성인 FokI 닉카제 도메인에 연결된 ZFP에 연결된 시티딘 편집기를 포함하는 쌍으로서 사용되도록 구축된다. 제2 파트너는 활성 FokI 도메인을 포함하여, 2개의 FokI 절반 도메인이 쌍을 형성하여 닉을 생성하는 데 작용할 수 있다. 시티딘 편집기 도메인은 UGI 이량체 어셈블리처럼 어느 한 절반에 있을 수 있다.

실시예 4: 부가의 염기 편집기

부가의 ABE 및/또는 CBE를 구축하고 시험한다.

특히, 실험은 (1) 임의로 ZFP 앵커에 작동가능하게 연결된 Cas9 닉카제; 및 (2) ABE 도메인 (예를 들어, 진화된 ABE 도메인)에 작동가능하게 연결된 ZFP를 포함하는 아데닌 염기 편집기를 사용하여 수행된다 (예를 들어, 도 1b, 하단 중간 패널 참조).

결과는 이들 염기 편집기가 질환 관련 돌연변이의 표적화된 편집에 효과적이라는 것을 보여주었다.

또한, 실험은 (1) 임의로 ZFP 앵커에 작동가능하게 연결된, 단일 가이드 RNA에 작동가능하게 연결된 dCas9 단백질; (2) ABE 도메인 (예를 들어, 진화된 ABE 도메인)에 작동가능하게 연결된 ZFP; 및 (3) ZFN 닉카제를 포함하는 ABE 염기 편집기를 사용하여 수행된다 (예를 들어, 도 1c 참조).

결과는 ZFN 닉카제를 포함한 염기 편집기가 dCas9 염기 편집기와 비교 시 염기 편집 효율성을 증가시킨 것으로 나타났다.

실시예 5: Cas9 무함유 염기 편집기

Cas9 무함유 염기 편집기를 또한 구축하고 평가한다. 구축물은 상기 기재된 바와 같이 사용되는 2개의 TadA 도메인이 있는 염기 편집기를 포함하며, 임의로 여기서 하나는 야생형이고 다른 하나는 진화된 것이며, 이들은 ZFP DNA 결합 도메인에 연결될 수 있다. 이러한 어셈블리는 단독으로 사용되거나, 또는 촉매적으로 불활성인 FokI 닉카제 도메인에 연결될 수 있다. 활성 FokI 도메인을 포함하는 또 다른 벡터와 조합하여 사용되는 경우, 아데닌 염기 편집기는 염기 편집의 교정을 방지하는 닉킹 활성을 갖는다. 만들어진 다른 비-Cas 염기 편집기가 도 1d에 도시되어 있다.

DNA 탈안정화 또는 풀림 인자를 포함하는 비-Cas 염기 편집기가 상기 구축되고 시험된다. DNA 탈안정화 인자는 ZFP 및/또는 ZFN 닉카제의 N-말단 또는 C-말단에 융합되거나 (도 1d 참조) 또는 ZFP 및/또는 닉카제와 독립적으로 도입된다.

특히, 도 1d에 도시된 바와 같은 염기 편집기가 생성된다. 이들 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제를 포함한다. 또한, 이들 편집기는 그의 3' 단부 또는 5' 단부에 의해 ZFN 닉카제의 ZFP에 임의로 연결된 DNA 탈안정화 인자를 포함한다.

특히, 표 A에 제시된 바와 같이 하나 이상의 단백질 DNA 탈안정화 인자 [예를 들어, 헬리카제; DSB 복구 동안 D-루프 형성에 관여하는 인자 (예를 들어 Rad51, Rad52, RPA1, RPA2, RPA3 등); 및/또는 하나 이상의 CRISPR 단백질 (예를 들어, 비-Cas9 단백질)을 수반하거나 수반하지 않는 나선 탈안정화 단백질 (예를 들어 ICP8, 푸랄파 또는 송아지 흉선 DNA 나선 탈안정화 단백질)]를 포함하는 염기 편집기가 구축된다.

또 다른 한편으론, 또는 DNA 탈안정화 단백질 이외에, 하나 이상의 펩티드 핵산 (PNA); 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함하는 염기 편집기가 구축된다. 특히, 하나 이상의 뉴클레오티드를 포함하는 염기 편집기가 구축되고 시험된다. PNA 및/또는 LNA를 포함하는 염기 편집기가 본원에 기재된 바와 같이 구축된다 (또한, 도 1d 및 도 8 참조).

결과에 따르면 Cas9 무함유 염기 편집기는 그의 표적 부위를 편집한다.

본원에 언급된 모든 특허, 특허 출원 및 간행물은 그 전체 내용이 본원에 참조로 포함된다.

본 개시내용은 이해의 명료함을 위해 예시 및 예로서 일부 상세하게 제공되었지만, 본 개시내용의 요지 또는 범위를 벗어나지 않고서도 다양한 변화 및 변형이 실시될 수 있다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 따라서, 전술한 설명 및 예는 제한적인 것으로 해석되서는 안된다.

SEQUENCE LISTING <110> SANGAMO THERAPEUTICS, INC. <120> ENGINEERED TARGET SPECIFIC BASE EDITORS <130> 8325-0180/S180-PCT <140> <141> <150> 62/867,565 <151> 2019-06-27 <150> 62/817,153 <151> 2019-03-12 <150> 62/753,696 <151> 2018-10-31 <150> 62/721,903 <151> 2018-08-23 <160> 92 <170> PatentIn version 3.5 <210> 1 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21)..(49) <223> a, c, t, g, unknown or other <400> 1 nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49 <210> 2 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 <210> 3 <211> 58 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Gly Thr Gly Gly Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val 1 5 10 15 Pro Asp Tyr Ala Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser 20 25 30 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser Ala Ala Pro Ala Ala 35 40 45 Lys Lys Lys Lys Leu Asp Phe Glu Ser Glu 50 55 <210> 4 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 4 gtgctgacca tcgacgagaa agggactgaa gct 33 <210> 5 <211> 579 <212> PRT <213> Unknown <220> <223> Description of Unknown: FokI polypeptide <400> 5 Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln Asn Pro Gly Lys 1 5 10 15 Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp Arg Asn Ser Lys 20 25 30 Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr Leu Val Lys Glu 35 40 45 Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn Gln His Asp Leu 50 55 60 Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr Ser Ile Arg Ser 65 70 75 80 Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile Ala Asp Gln Gly 85 90 95 Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp Gly Phe Leu Arg 100 105 110 Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn Lys Ser Asp Ser 115 120 125 Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys Ser Ala Asp Gly 130 135 140 Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile Ser Ser Tyr Pro 145 150 155 160 Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly Gln His Leu Thr 165 170 175 Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly Glu Ser Gly Phe 180 185 190 Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu Ala Asn Ala Met 195 200 205 Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu Gly Ser Ser Asp 210 215 220 Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys Leu Gly Leu Val 225 230 235 240 Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu Gly Lys Pro Asp 245 250 255 Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr Gly Glu Gly Leu 260 265 270 Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe Thr Arg Val Pro 275 280 285 Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu Thr Asp Lys Glu 290 295 300 Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile Leu Ile Lys Ala 305 310 315 320 Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu Lys Lys Leu Gly 325 330 335 Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile Lys Gly Leu Ile 340 345 350 Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe Tyr Gln Leu Lys 355 360 365 Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly Val Thr Lys Gln 370 375 380 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 385 390 395 400 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg 405 410 415 Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe 420 425 430 Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys 435 440 445 Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val 450 455 460 Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly 465 470 475 480 Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn 485 490 495 Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val 500 505 510 Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr 515 520 525 Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala 530 535 540 Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala 545 550 555 560 Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu 565 570 575 Ile Asn Phe <210> 6 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 6 atgtttttag aggccatacc catgtcta 28 <210> 7 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 gccatgtttt tagaggccat acccatgt 28 <210> 8 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 gggccatgtt tttagaggcc atacccat 28 <210> 9 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 ggggccatgt ttttagaggc cataccca 28 <210> 10 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 ctggggccat gtttttagag gccatacc 28 <210> 11 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Thr Gln Ala Thr Leu Gly Val 1 5 <210> 12 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Asp Arg Ser His Leu Ala Arg 1 5 <210> 13 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 Gln Ser Ala His Arg Lys Asn 1 5 <210> 14 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 14 Ser Thr Ala Ala Leu Ser Tyr 1 5 <210> 15 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 15 Thr Ser Gly Ser Leu Thr Arg 1 5 <210> 16 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 16 Ser Asn Gln Asn Leu Thr Thr 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 Thr Ser Gly Ser Leu Ser Arg 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 His Ser Ala Thr Leu Lys Tyr 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Gln Asn Ala His Arg Lys Thr 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Thr Ser Ser Asn Arg Ala Val 1 5 <210> 21 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Arg Ser Asp Ala Leu Ser Thr 1 5 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Asp Arg Ser Thr Arg Thr Lys 1 5 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Asp Ser Ser His Arg Thr Arg 1 5 <210> 24 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 24 Asp Arg Ser Asp Leu Ser Arg 1 5 <210> 25 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 25 Arg Ser Thr His Leu Val Arg 1 5 <210> 26 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Glu Arg Gly Thr Leu Ala Arg 1 5 <210> 27 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Arg Ser Asp His Leu Ser Arg 1 5 <210> 28 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 28 Ser Gly Thr Pro His Glu Val Gly Val Tyr Thr Leu 1 5 10 <210> 29 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 29 Ser Gly Gly Gly Leu Gly Ser Thr 1 5 <210> 30 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 tgtgtctgt 9 <210> 31 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 tgtttctgt 9 <210> 32 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 tgttcctgt 9 <210> 33 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 tgtccctgt 9 <210> 34 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 tttaaattat ggagtatgtt tctgtgga 28 <210> 35 <211> 320 <212> PRT <213> Bos sp. <400> 35 Met Ser Lys Ser Glu Ser Pro Lys Glu Pro Glu Gln Leu Arg Lys Leu 1 5 10 15 Phe Ile Gly Gly Leu Ser Phe Glu Thr Thr Asp Glu Ser Leu Arg Ser 20 25 30 His Phe Glu Gln Trp Gly Thr Leu Thr Asp Cys Val Val Met Arg Asp 35 40 45 Pro Asn Thr Lys Arg Ser Arg Gly Phe Gly Phe Val Thr Tyr Ala Thr 50 55 60 Val Glu Glu Val Asp Ala Ala Met Asn Ala Arg Pro His Lys Val Asp 65 70 75 80 Gly Arg Val Val Glu Pro Lys Arg Ala Val Ser Arg Glu Asp Ser Gln 85 90 95 Arg Pro Gly Ala His Leu Thr Val Lys Lys Ile Phe Val Gly Gly Ile 100 105 110 Lys Glu Asp Thr Glu Glu His His Leu Arg Asp Tyr Phe Glu Gln Tyr 115 120 125 Gly Lys Ile Glu Val Ile Glu Ile Met Thr Asp Arg Gly Ser Gly Lys 130 135 140 Lys Arg Gly Phe Ala Phe Val Thr Phe Asp Asp His Asp Ser Val Asp 145 150 155 160 Lys Ile Val Ile Gln Lys Tyr His Thr Val Asn Gly His Asn Cys Glu 165 170 175 Val Arg Lys Ala Leu Ser Lys Gln Glu Met Ala Ser Ala Ser Ser Ser 180 185 190 Gln Arg Gly Arg Ser Gly Ser Gly Asn Phe Gly Gly Gly Arg Gly Gly 195 200 205 Gly Phe Gly Gly Asn Asp Asn Phe Gly Arg Gly Gly Asn Phe Ser Gly 210 215 220 Arg Gly Gly Phe Gly Gly Ser Arg Gly Gly Gly Gly Tyr Gly Gly Ser 225 230 235 240 Gly Asp Gly Tyr Asn Gly Phe Gly Asn Asp Gly Ser Asn Phe Gly Gly 245 250 255 Gly Gly Ser Tyr Asn Asp Phe Gly Asn Tyr Asn Asn Gln Ser Ser Asn 260 265 270 Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly Arg Ser Ser Gly Pro 275 280 285 Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro Arg Asn Gln Gly Gly 290 295 300 Tyr Gly Gly Ser Ser Ser Ser Ser Ser Tyr Gly Ser Gly Arg Arg Phe 305 310 315 320 <210> 36 <211> 587 <212> PRT <213> Unknown <220> <223> Description of Unknown: BPT4 sequence <400> 36 Met Asp Ile Lys Val His Phe His Asp Phe Ser His Val Arg Ile Asp 1 5 10 15 Cys Glu Glu Ser Thr Phe His Glu Leu Arg Asp Phe Phe Ser Phe Glu 20 25 30 Ala Asp Gly Tyr Arg Phe Asn Pro Arg Phe Arg Tyr Gly Asn Trp Asp 35 40 45 Gly Arg Ile Arg Leu Leu Asp Tyr Asn Arg Leu Leu Pro Phe Gly Leu 50 55 60 Val Gly Gln Ile Lys Lys Phe Cys Asp Asn Phe Gly Tyr Lys Ala Trp 65 70 75 80 Ile Asp Pro Gln Ile Asn Glu Lys Glu Glu Leu Ser Arg Lys Asp Phe 85 90 95 Asp Glu Trp Leu Ser Lys Leu Glu Ile Tyr Ser Gly Asn Lys Arg Ile 100 105 110 Glu Pro His Trp Tyr Gln Lys Asp Ala Val Phe Glu Gly Leu Val Asn 115 120 125 Arg Arg Arg Ile Leu Asn Leu Pro Thr Ser Ala Gly Lys Ser Leu Ile 130 135 140 Gln Ala Leu Leu Ala Arg Tyr Tyr Leu Glu Asn Tyr Glu Gly Lys Ile 145 150 155 160 Leu Ile Ile Val Pro Thr Thr Ala Leu Thr Thr Gln Met Ala Asp Asp 165 170 175 Phe Val Asp Tyr Arg Leu Phe Ser His Ala Met Ile Lys Lys Ile Gly 180 185 190 Gly Gly Ala Ser Lys Asp Asp Lys Tyr Lys Asn Asp Ala Pro Val Val 195 200 205 Val Gly Thr Trp Gln Thr Val Val Lys Gln Pro Lys Glu Trp Phe Ser 210 215 220 Gln Phe Gly Met Met Met Asn Asp Glu Cys His Leu Ala Thr Gly Lys 225 230 235 240 Ser Ile Ser Ser Ile Ile Ser Gly Leu Asn Asn Cys Met Phe Lys Phe 245 250 255 Gly Leu Ser Gly Ser Leu Arg Asp Gly Lys Ala Asn Ile Met Gln Tyr 260 265 270 Val Gly Met Phe Gly Glu Ile Phe Lys Pro Val Thr Thr Ser Lys Leu 275 280 285 Met Glu Asp Gly Gln Val Thr Glu Leu Lys Ile Asn Ser Ile Phe Leu 290 295 300 Arg Tyr Pro Asp Glu Phe Thr Thr Lys Leu Lys Gly Lys Thr Tyr Gln 305 310 315 320 Glu Glu Ile Lys Ile Ile Thr Gly Leu Ser Lys Arg Asn Lys Trp Ile 325 330 335 Ala Lys Leu Ala Ile Lys Leu Ala Gln Lys Asp Glu Asn Ala Phe Val 340 345 350 Met Phe Lys His Val Ser His Gly Lys Ala Ile Phe Asp Leu Ile Lys 355 360 365 Asn Glu Tyr Asp Lys Val Tyr Tyr Val Ser Gly Glu Val Asp Thr Glu 370 375 380 Thr Arg Asn Ile Met Lys Thr Leu Ala Glu Asn Gly Lys Gly Ile Ile 385 390 395 400 Ile Val Ala Ser Tyr Gly Val Phe Ser Thr Gly Ile Ser Val Lys Asn 405 410 415 Leu His His Val Val Leu Ala His Gly Val Lys Ser Lys Ile Ile Val 420 425 430 Leu Gln Thr Ile Gly Arg Val Leu Arg Lys His Gly Ser Lys Thr Ile 435 440 445 Ala Thr Val Trp Asp Leu Ile Asp Ser Ala Gly Val Lys Pro Lys Ser 450 455 460 Ala Asn Thr Lys Lys Lys Tyr Val His Leu Asn Tyr Leu Leu Lys His 465 470 475 480 Gly Ile Asp Arg Ile Gln Arg Tyr Ala Asp Glu Lys Phe Asn Tyr Val 485 490 495 Met Lys Thr Val Asn Leu Ile Ser Phe Gly Pro Leu Glu Lys Lys Met 500 505 510 Leu Leu Glu Phe Lys Gln Phe Leu Tyr Glu Ala Ser Ile Asp Glu Phe 515 520 525 Met Gly Lys Ile Ala Ser Cys Gln Thr Leu Glu Gly Leu Glu Glu Leu 530 535 540 Glu Ala Tyr Tyr Lys Lys Arg Val Lys Glu Thr Glu Leu Lys Asp Thr 545 550 555 560 Asp Asp Ile Ser Val Arg Asp Ala Leu Ala Gly Lys Arg Ala Glu Leu 565 570 575 Glu Asp Ser Asp Asp Glu Val Glu Glu Ser Phe 580 585 <210> 37 <211> 715 <212> PRT <213> Deinococcus radiodurans <400> 37 Met Ser Ala Ala Leu Pro Ala Glu Pro Phe Arg Val Ser Gly Gly Val 1 5 10 15 Asn Lys Val Arg Phe Arg Ser Asp Thr Gly Phe Thr Val Met Ser Ala 20 25 30 Thr Leu Arg Asn Glu Gln Gly Glu Asp Pro Asp Ala Thr Val Ile Gly 35 40 45 Val Met Pro Pro Leu Asp Val Gly Asp Thr Phe Ser Ala Glu Val Leu 50 55 60 Met Glu Glu His Arg Glu Tyr Gly Tyr Gln Tyr Arg Val Val Asn Met 65 70 75 80 Val Leu Glu Ala Met Pro Ala Asp Leu Ser Glu Glu Gly Val Ala Ala 85 90 95 Tyr Phe Glu Ala Arg Val Gly Gly Val Gly Lys Val Leu Ala Gly Arg 100 105 110 Ile Ala Lys Thr Phe Gly Ala Ala Ala Phe Asp Leu Leu Glu Asp Asp 115 120 125 Pro Gln Lys Phe Leu Gln Val Pro Gly Ile Thr Glu Ser Thr Leu His 130 135 140 Lys Met Val Ser Ser Trp Ser Gln Gln Gly Leu Glu Arg Arg Leu Leu 145 150 155 160 Ala Gly Leu Gln Gly Leu Gly Leu Thr Ile Asn Gln Ala Gln Arg Ala 165 170 175 Val Lys His Phe Gly Ala Asp Ala Leu Asp Arg Leu Glu Lys Asp Leu 180 185 190 Phe Thr Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala Asp Lys 195 200 205 Leu Trp Gln Ala Arg Gly Gly Ala Leu Asp Asp Pro Arg Arg Leu Thr 210 215 220 Ala Ala Ala Val Tyr Ala Leu Gln Leu Ala Gly Thr Gln Ala Gly His 225 230 235 240 Ser Phe Leu Pro Arg Ser Arg Ala Glu Lys Gly Val Val His Tyr Thr 245 250 255 Arg Val Thr Pro Gly Gln Ala Arg Leu Ala Val Glu Thr Ala Val Glu 260 265 270 Leu Gly Arg Leu Ser Glu Asp Asp Ser Pro Leu Phe Ala Ala Glu Ala 275 280 285 Ala Ala Thr Gly Glu Gly Arg Ile Tyr Leu Pro His Val Leu Arg Ala 290 295 300 Glu Lys Lys Leu Ala Ser Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro 305 310 315 320 Ala Asp Gly Ala Gly Asn Asp Asp Trp Ala Val Pro Lys Lys Ala Arg 325 330 335 Lys Gly Leu Ser Glu Glu Gln Ala Ser Val Leu Asp Gln Leu Ala Gly 340 345 350 His Arg Leu Val Val Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr 355 360 365 Thr Thr Lys Ala Val Ala Asp Leu Ala Glu Ser Leu Gly Leu Glu Val 370 375 380 Gly Leu Cys Ala Pro Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val 385 390 395 400 Thr Gly Arg Thr Ala Ser Thr Val His Arg Leu Leu Gly Tyr Gly Pro 405 410 415 Gln Gly Phe Arg His Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu 420 425 430 Ile Val Asp Glu Val Ser Met Met Gly Asp Ala Leu Met Leu Ser Leu 435 440 445 Leu Ala Ala Val Pro Pro Gly Ala Arg Val Leu Leu Val Gly Asp Thr 450 455 460 Asp Gln Leu Pro Pro Val Asp Ala Gly Leu Pro Leu Leu Ala Leu Ala 465 470 475 480 Gln Ala Ala Pro Thr Ile Lys Leu Thr Gln Val Tyr Arg Gln Ala Ala 485 490 495 Lys Asn Pro Ile Ile Gln Ala Ala His Gly Leu Leu His Gly Glu Ala 500 505 510 Pro Ala Trp Gly Asp Lys Arg Leu Asn Leu Thr Glu Ile Glu Pro Asp 515 520 525 Gly Gly Ala Arg Arg Val Ala Leu Met Val Arg Glu Leu Gly Gly Pro 530 535 540 Gly Ala Val Gln Val Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Met 545 550 555 560 Asp His Leu Asn Tyr His Leu Gln Ala Leu Phe Asn Pro Gly Glu Gly 565 570 575 Gly Val Arg Ile Ala Glu Gly Glu Ala Arg Pro Gly Asp Thr Val Val 580 585 590 Gln Thr Lys Asn Asp Tyr Asn Asn Glu Ile Phe Asn Gly Thr Leu Gly 595 600 605 Met Val Leu Lys Ala Glu Gly Ala Arg Leu Thr Val Asp Phe Asp Gly 610 615 620 Asn Val Val Glu Leu Thr Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly 625 630 635 640 Tyr Ala Leu Thr Val His Arg Ala Gln Gly Ser Glu Trp Gly Thr Val 645 650 655 Leu Gly Val Leu His Glu Ala His Met Pro Met Leu Ser Arg Asn Leu 660 665 670 Val Tyr Thr Ala Leu Thr Arg Ala Arg Asp Arg Phe Phe Ser Ala Gly 675 680 685 Ser Ala Ser Ala Trp Gln Ile Ala Ala Ala Arg Gln Arg Glu Ala Arg 690 695 700 Asn Thr Ala Leu Leu Glu Arg Ile Arg Ala His 705 710 715 <210> 38 <211> 353 <212> PRT <213> Escherichia coli <400> 38 Met Ala Ile Asp Glu Asn Lys Gln Lys Ala Leu Ala Ala Ala Leu Gly 1 5 10 15 Gln Ile Glu Lys Gln Phe Gly Lys Gly Ser Ile Met Arg Leu Gly Glu 20 25 30 Asp Arg Ser Met Asp Val Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu 35 40 45 Asp Ile Ala Leu Gly Ala Gly Gly Leu Pro Met Gly Arg Ile Val Glu 50 55 60 Ile Tyr Gly Pro Glu Ser Ser Gly Lys Thr Thr Leu Thr Leu Gln Val 65 70 75 80 Ile Ala Ala Ala Gln Arg Glu Gly Lys Thr Cys Ala Phe Ile Asp Ala 85 90 95 Glu His Ala Leu Asp Pro Ile Tyr Ala Arg Lys Leu Gly Val Asp Ile 100 105 110 Asp Asn Leu Leu Cys Ser Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu 115 120 125 Ile Cys Asp Ala Leu Ala Arg Ser Gly Ala Val Asp Val Ile Val Val 130 135 140 Asp Ser Val Ala Ala Leu Thr Pro Lys Ala Glu Ile Glu Gly Glu Ile 145 150 155 160 Gly Asp Ser His Met Gly Leu Ala Ala Arg Met Met Ser Gln Ala Met 165 170 175 Arg Lys Leu Ala Gly Asn Leu Lys Gln Ser Asn Thr Leu Leu Ile Phe 180 185 190 Ile Asn Gln Ile Arg Met Lys Ile Gly Val Met Phe Gly Asn Pro Glu 195 200 205 Thr Thr Thr Gly Gly Asn Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu 210 215 220 Asp Ile Arg Arg Ile Gly Ala Val Lys Glu Gly Glu Asn Val Val Gly 225 230 235 240 Ser Glu Thr Arg Val Lys Val Val Lys Asn Lys Ile Ala Ala Pro Phe 245 250 255 Lys Gln Ala Glu Phe Gln Ile Leu Tyr Gly Glu Gly Ile Asn Phe Tyr 260 265 270 Gly Glu Leu Val Asp Leu Gly Val Lys Glu Lys Leu Ile Glu Lys Ala 275 280 285 Gly Ala Trp Tyr Ser Tyr Lys Gly Glu Lys Ile Gly Gln Gly Lys Ala 290 295 300 Asn Ala Thr Ala Trp Leu Lys Asp Asn Pro Glu Thr Ala Lys Glu Ile 305 310 315 320 Glu Lys Lys Val Arg Glu Leu Leu Leu Ser Asn Pro Asn Ser Thr Pro 325 330 335 Asp Phe Ser Val Asp Asp Ser Glu Gly Val Ala Glu Thr Asn Glu Asp 340 345 350 Phe <210> 39 <211> 1180 <212> PRT <213> Escherichia coli <400> 39 Met Ser Asp Val Ala Glu Thr Leu Asp Pro Leu Arg Leu Pro Leu Gln 1 5 10 15 Gly Glu Arg Leu Ile Glu Ala Ser Ala Gly Thr Gly Lys Thr Phe Thr 20 25 30 Ile Ala Ala Leu Tyr Leu Arg Leu Leu Leu Gly Leu Gly Gly Ser Ala 35 40 45 Ala Phe Pro Arg Pro Leu Thr Val Glu Glu Leu Leu Val Val Thr Phe 50 55 60 Thr Glu Ala Ala Thr Ala Glu Leu Arg Gly Arg Ile Arg Ser Asn Ile 65 70 75 80 His Glu Leu Arg Ile Ala Cys Leu Arg Glu Thr Thr Asp Asn Pro Leu 85 90 95 Tyr Glu Arg Leu Leu Glu Glu Ile Asp Asp Lys Ala Gln Ala Ala Gln 100 105 110 Trp Leu Leu Leu Ala Glu Arg Gln Met Asp Glu Ala Ala Val Phe Thr 115 120 125 Ile His Gly Phe Cys Gln Arg Met Leu Asn Leu Asn Ala Phe Glu Ser 130 135 140 Gly Met Leu Phe Glu Gln Gln Leu Ile Glu Asp Glu Ser Leu Leu Arg 145 150 155 160 Tyr Gln Ala Cys Ala Asp Phe Trp Arg Arg His Cys Tyr Pro Leu Pro 165 170 175 Arg Glu Ile Ala Gln Val Val Phe Glu Thr Trp Lys Gly Pro Gln Ala 180 185 190 Leu Leu Arg Asp Ile Asn Arg Tyr Leu Gln Gly Glu Ala Pro Val Ile 195 200 205 Lys Ala Pro Pro Pro Asp Asp Glu Thr Leu Ala Ser Arg His Ala Gln 210 215 220 Ile Val Ala Arg Ile Asp Thr Val Lys Gln Gln Trp Arg Asp Ala Val 225 230 235 240 Gly Glu Leu Asp Ala Leu Ile Glu Ser Ser Gly Ile Asp Arg Arg Lys 245 250 255 Phe Asn Arg Ser Asn Gln Ala Lys Trp Ile Asp Lys Ile Ser Ala Trp 260 265 270 Ala Glu Glu Glu Thr Asn Ser Tyr Gln Leu Pro Glu Ser Leu Glu Lys 275 280 285 Phe Ser Gln Arg Phe Leu Glu Asp Arg Thr Lys Ala Gly Gly Glu Thr 290 295 300 Pro Arg His Pro Leu Phe Glu Ala Ile Asp Gln Leu Leu Ala Glu Pro 305 310 315 320 Leu Ser Ile Arg Asp Leu Val Ile Thr Arg Ala Leu Ala Glu Ile Arg 325 330 335 Glu Thr Val Ala Arg Glu Lys Arg Arg Arg Gly Glu Leu Gly Phe Asp 340 345 350 Asp Met Leu Ser Arg Leu Asp Ser Ala Leu Arg Ser Glu Ser Gly Glu 355 360 365 Val Leu Ala Ala Ala Ile Arg Thr Arg Phe Pro Val Ala Met Ile Asp 370 375 380 Glu Phe Gln Asp Thr Asp Pro Gln Gln Tyr Arg Ile Phe Arg Arg Ile 385 390 395 400 Trp His His Gln Pro Glu Thr Ala Leu Leu Leu Ile Gly Asp Pro Lys 405 410 415 Gln Ala Ile Tyr Ala Phe Arg Gly Ala Asp Ile Phe Thr Tyr Met Lys 420 425 430 Ala Arg Ser Glu Val His Ala His Tyr Thr Leu Asp Thr Asn Trp Arg 435 440 445 Ser Ala Pro Gly Met Val Asn Ser Val Asn Lys Leu Phe Ser Gln Thr 450 455 460 Asp Asp Ala Phe Met Phe Arg Glu Ile Pro Phe Ile Pro Val Lys Ser 465 470 475 480 Ala Gly Lys Asn Gln Ala Leu Arg Phe Val Phe Lys Gly Glu Thr Gln 485 490 495 Pro Ala Met Lys Met Trp Leu Met Glu Gly Glu Ser Cys Gly Val Gly 500 505 510 Asp Tyr Gln Ser Thr Met Ala Gln Val Cys Ala Ala Gln Ile Arg Asp 515 520 525 Trp Leu Gln Ala Gly Gln Arg Gly Glu Ala Leu Leu Met Asn Gly Asp 530 535 540 Asp Ala Arg Pro Val Arg Ala Ser Asp Ile Ser Val Leu Val Arg Ser 545 550 555 560 Arg Gln Glu Ala Ala Gln Val Arg Asp Ala Leu Thr Leu Leu Glu Ile 565 570 575 Pro Ser Val Tyr Leu Ser Asn Arg Asp Ser Val Phe Glu Thr Leu Glu 580 585 590 Ala Gln Glu Met Leu Trp Leu Leu Gln Ala Val Met Thr Pro Glu Arg 595 600 605 Glu Asn Thr Leu Arg Ser Ala Leu Ala Thr Ser Met Met Gly Leu Asn 610 615 620 Ala Leu Asp Ile Glu Thr Leu Asn Asn Asp Glu His Ala Trp Asp Val 625 630 635 640 Val Val Glu Glu Phe Asp Gly Tyr Arg Gln Ile Trp Arg Lys Arg Gly 645 650 655 Val Met Pro Met Leu Arg Ala Leu Met Ser Ala Arg Asn Ile Ala Glu 660 665 670 Asn Leu Leu Ala Thr Ala Gly Gly Glu Arg Arg Leu Thr Asp Ile Leu 675 680 685 His Ile Ser Glu Leu Leu Gln Glu Ala Gly Thr Gln Leu Glu Ser Glu 690 695 700 His Ala Leu Val Arg Trp Leu Ser Gln His Ile Leu Glu Pro Asp Ser 705 710 715 720 Asn Ala Ser Ser Gln Gln Met Arg Leu Glu Ser Asp Lys His Leu Val 725 730 735 Gln Ile Val Thr Ile His Lys Ser Lys Gly Leu Glu Tyr Pro Leu Val 740 745 750 Trp Leu Pro Phe Ile Thr Asn Phe Arg Val Gln Glu Gln Ala Phe Tyr 755 760 765 His Asp Arg His Ser Phe Glu Ala Val Leu Asp Leu Asn Ala Ala Pro 770 775 780 Glu Ser Val Asp Leu Ala Glu Ala Glu Arg Leu Ala Glu Asp Leu Arg 785 790 795 800 Leu Leu Tyr Val Ala Leu Thr Arg Ser Val Trp His Cys Ser Leu Gly 805 810 815 Val Ala Pro Leu Val Arg Arg Arg Gly Asp Lys Lys Gly Asp Thr Asp 820 825 830 Val His Gln Ser Ala Leu Gly Arg Leu Leu Gln Lys Gly Glu Pro Gln 835 840 845 Asp Ala Ala Gly Leu Arg Thr Cys Ile Glu Ala Leu Cys Asp Asp Asp 850 855 860 Ile Ala Trp Gln Thr Ala Gln Thr Gly Asp Asn Gln Pro Trp Gln Val 865 870 875 880 Asn Asp Val Ser Thr Ala Glu Leu Asn Ala Lys Thr Leu Gln Arg Leu 885 890 895 Pro Gly Asp Asn Trp Arg Val Thr Ser Tyr Ser Gly Leu Gln Gln Arg 900 905 910 Gly His Gly Ile Ala Gln Asp Leu Met Pro Arg Leu Asp Val Asp Ala 915 920 925 Ala Gly Val Ala Ser Val Val Glu Glu Pro Thr Leu Thr Pro His Gln 930 935 940 Phe Pro Arg Gly Ala Ser Pro Gly Thr Phe Leu His Ser Leu Phe Glu 945 950 955 960 Asp Leu Asp Phe Thr Gln Pro Val Asp Pro Asn Trp Val Arg Glu Lys 965 970 975 Leu Glu Leu Gly Gly Phe Glu Ser Gln Trp Glu Pro Val Leu Thr Glu 980 985 990 Trp Ile Thr Ala Val Leu Gln Ala Pro Leu Asn Glu Thr Gly Val Ser 995 1000 1005 Leu Ser Gln Leu Ser Ala Arg Asn Lys Gln Val Glu Met Glu Phe 1010 1015 1020 Tyr Leu Pro Ile Ser Glu Pro Leu Ile Ala Ser Gln Leu Asp Thr 1025 1030 1035 Leu Ile Arg Gln Phe Asp Pro Leu Ser Ala Gly Cys Pro Pro Leu 1040 1045 1050 Glu Phe Met Gln Val Arg Gly Met Leu Lys Gly Phe Ile Asp Leu 1055 1060 1065 Val Phe Arg His Glu Gly Arg Tyr Tyr Leu Leu Asp Tyr Lys Ser 1070 1075 1080 Asn Trp Leu Gly Glu Asp Ser Ser Ala Tyr Thr Gln Gln Ala Met 1085 1090 1095 Ala Ala Ala Met Gln Ala His Arg Tyr Asp Leu Gln Tyr Gln Leu 1100 1105 1110 Tyr Thr Leu Ala Leu His Arg Tyr Leu Arg His Arg Ile Ala Asp 1115 1120 1125 Tyr Asp Tyr Glu His His Phe Gly Gly Val Ile Tyr Leu Phe Leu 1130 1135 1140 Arg Gly Val Asp Lys Glu His Pro Gln Gln Gly Ile Tyr Thr Thr 1145 1150 1155 Arg Pro Asn Ala Gly Leu Ile Ala Leu Met Asp Glu Met Phe Ala 1160 1165 1170 Gly Met Thr Leu Glu Glu Ala 1175 1180 <210> 40 <211> 1122 <212> PRT <213> Escherichia coli <400> 40 Met Leu Arg Val Tyr His Ser Asn Arg Leu Asp Val Leu Glu Ala Leu 1 5 10 15 Met Glu Phe Ile Val Glu Arg Glu Arg Leu Asp Asp Pro Phe Glu Pro 20 25 30 Glu Met Ile Leu Val Gln Ser Thr Gly Met Ala Gln Trp Leu Gln Met 35 40 45 Thr Leu Ser Gln Lys Phe Gly Ile Ala Ala Asn Ile Asp Phe Pro Leu 50 55 60 Pro Ala Ser Phe Ile Trp Asp Met Phe Val Arg Val Leu Pro Glu Ile 65 70 75 80 Pro Lys Glu Ser Ala Phe Asn Lys Gln Ser Met Ser Trp Lys Leu Met 85 90 95 Thr Leu Leu Pro Gln Leu Leu Glu Arg Glu Asp Phe Thr Leu Leu Arg 100 105 110 His Tyr Leu Thr Asp Asp Ser Asp Lys Arg Lys Leu Phe Gln Leu Ser 115 120 125 Ser Lys Ala Ala Asp Leu Phe Asp Gln Tyr Leu Val Tyr Arg Pro Asp 130 135 140 Trp Leu Ala Gln Trp Glu Thr Gly His Leu Val Glu Gly Leu Gly Glu 145 150 155 160 Ala Gln Ala Trp Gln Ala Pro Leu Trp Lys Ala Leu Val Glu Tyr Thr 165 170 175 His Gln Leu Gly Gln Pro Arg Trp His Arg Ala Asn Leu Tyr Gln Arg 180 185 190 Phe Ile Glu Thr Leu Glu Ser Ala Thr Thr Cys Pro Pro Gly Leu Pro 195 200 205 Ser Arg Val Phe Ile Cys Gly Ile Ser Ala Leu Pro Pro Val Tyr Leu 210 215 220 Gln Ala Leu Gln Ala Leu Gly Lys His Ile Glu Ile His Leu Leu Phe 225 230 235 240 Thr Asn Pro Cys Arg Tyr Tyr Trp Gly Asp Ile Lys Asp Pro Ala Tyr 245 250 255 Leu Ala Lys Leu Leu Thr Arg Gln Arg Arg His Ser Phe Glu Asp Arg 260 265 270 Glu Leu Pro Leu Phe Arg Asp Ser Glu Asn Ala Gly Gln Leu Phe Asn 275 280 285 Ser Asp Gly Glu Gln Asp Val Gly Asn Pro Leu Leu Ala Ser Trp Gly 290 295 300 Lys Leu Gly Arg Asp Tyr Ile Tyr Leu Leu Ser Asp Leu Glu Ser Ser 305 310 315 320 Gln Glu Leu Asp Ala Phe Val Asp Val Thr Pro Asp Asn Leu Leu His 325 330 335 Asn Ile Gln Ser Asp Ile Leu Glu Leu Glu Asn Arg Ala Val Ala Gly 340 345 350 Val Asn Ile Glu Glu Phe Ser Arg Ser Asp Asn Lys Arg Pro Leu Asp 355 360 365 Pro Leu Asp Ser Ser Ile Thr Phe His Val Cys His Ser Pro Gln Arg 370 375 380 Glu Val Glu Val Leu His Asp Arg Leu Leu Ala Met Leu Glu Glu Asp 385 390 395 400 Pro Thr Leu Thr Pro Arg Asp Ile Ile Val Met Val Ala Asp Ile Asp 405 410 415 Ser Tyr Ser Pro Phe Ile Gln Ala Val Phe Gly Ser Ala Pro Ala Asp 420 425 430 Arg Tyr Leu Pro Tyr Ala Ile Ser Asp Arg Arg Ala Arg Gln Ser His 435 440 445 Pro Val Leu Glu Ala Phe Ile Ser Leu Leu Ser Leu Pro Asp Ser Arg 450 455 460 Phe Val Ser Glu Asp Val Leu Ala Leu Leu Asp Val Pro Val Leu Ala 465 470 475 480 Ala Arg Phe Asp Ile Thr Glu Glu Gly Leu Arg Tyr Leu Arg Gln Trp 485 490 495 Val Asn Glu Ser Gly Ile Arg Trp Gly Ile Asp Asp Asp Asn Val Arg 500 505 510 Glu Leu Glu Leu Pro Ala Thr Gly Gln His Thr Trp Arg Phe Gly Leu 515 520 525 Thr Arg Met Leu Leu Gly Tyr Ala Met Glu Ser Ala Gln Gly Glu Trp 530 535 540 Gln Ser Val Leu Pro Tyr Asp Glu Ser Ser Gly Leu Ile Ala Glu Leu 545 550 555 560 Val Gly His Leu Ala Ser Leu Leu Met Gln Leu Asn Ile Trp Arg Arg 565 570 575 Gly Leu Ala Gln Glu Arg Pro Leu Glu Glu Trp Leu Pro Val Cys Arg 580 585 590 Asp Met Leu Asn Ala Phe Phe Leu Pro Asp Ala Glu Thr Glu Ala Ala 595 600 605 Met Thr Leu Ile Glu Gln Gln Trp Gln Ala Ile Ile Ala Glu Gly Leu 610 615 620 Gly Ala Gln Tyr Gly Asp Ala Val Pro Leu Ser Leu Leu Arg Asp Glu 625 630 635 640 Leu Ala Gln Arg Leu Asp Gln Glu Arg Ile Ser Gln Arg Phe Leu Ala 645 650 655 Gly Pro Val Asn Ile Cys Thr Leu Met Pro Met Arg Ser Ile Pro Phe 660 665 670 Lys Val Val Cys Leu Leu Gly Met Asn Asp Gly Val Tyr Pro Arg Gln 675 680 685 Leu Ala Pro Leu Gly Phe Asp Leu Met Ser Gln Lys Pro Lys Arg Gly 690 695 700 Asp Arg Ser Arg Arg Asp Asp Asp Arg Tyr Leu Phe Leu Glu Ala Leu 705 710 715 720 Ile Ser Ala Gln Gln Lys Leu Tyr Ile Ser Tyr Ile Gly Arg Ser Ile 725 730 735 Gln Asp Asn Ser Glu Arg Phe Pro Ser Val Leu Val Gln Glu Leu Ile 740 745 750 Asp Tyr Ile Gly Gln Ser His Tyr Leu Pro Gly Asp Glu Ala Leu Asn 755 760 765 Cys Asp Glu Ser Glu Ala Arg Val Lys Ala His Leu Thr Cys Leu His 770 775 780 Thr Arg Met Pro Phe Asp Pro Gln Asn Tyr Gln Pro Gly Glu Arg Gln 785 790 795 800 Ser Tyr Ala Arg Glu Trp Leu Pro Ala Ala Ser Gln Ala Gly Lys Ala 805 810 815 His Ser Glu Phe Val Gln Pro Leu Pro Phe Thr Leu Pro Glu Thr Val 820 825 830 Pro Leu Glu Thr Leu Gln Arg Phe Trp Ala His Pro Val Arg Ala Phe 835 840 845 Phe Gln Met Arg Leu Gln Val Asn Phe Arg Thr Glu Asp Ser Glu Ile 850 855 860 Pro Asp Thr Glu Pro Phe Ile Leu Glu Gly Leu Ser Arg Tyr Gln Ile 865 870 875 880 Asn Gln Gln Leu Leu Asn Ala Leu Val Glu Gln Asp Asp Ala Glu Arg 885 890 895 Leu Phe Arg Arg Phe Arg Ala Ala Gly Asp Leu Pro Tyr Gly Ala Phe 900 905 910 Gly Glu Ile Phe Trp Glu Thr Gln Cys Gln Glu Met Gln Gln Leu Ala 915 920 925 Asp Arg Val Ile Ala Cys Arg Gln Pro Gly Gln Ser Met Glu Ile Asp 930 935 940 Leu Ala Cys Asn Gly Val Gln Ile Thr Gly Trp Leu Pro Gln Val Gln 945 950 955 960 Pro Asp Gly Leu Leu Arg Trp Arg Pro Ser Leu Leu Ser Val Ala Gln 965 970 975 Gly Met Gln Leu Trp Leu Glu His Leu Val Tyr Cys Ala Ser Gly Gly 980 985 990 Asn Gly Glu Ser Arg Leu Phe Leu Arg Lys Asp Gly Glu Trp Arg Phe 995 1000 1005 Pro Pro Leu Ala Ala Glu Gln Ala Leu His Tyr Leu Ser Gln Leu 1010 1015 1020 Ile Glu Gly Tyr Arg Glu Gly Met Ser Ala Pro Leu Leu Val Leu 1025 1030 1035 Pro Glu Ser Gly Gly Ala Trp Leu Lys Thr Cys Tyr Asp Ala Gln 1040 1045 1050 Asn Asp Ala Met Leu Asp Asp Asp Ser Thr Leu Gln Lys Ala Arg 1055 1060 1065 Thr Lys Phe Leu Gln Ala Tyr Glu Gly Asn Met Met Val Arg Gly 1070 1075 1080 Glu Gly Asp Asp Ile Trp Tyr Gln Arg Leu Trp Arg Gln Leu Thr 1085 1090 1095 Pro Glu Thr Met Glu Ala Ile Val Glu Gln Ser Gln Arg Phe Leu 1100 1105 1110 Leu Pro Leu Phe Arg Phe Asn Gln Ser 1115 1120 <210> 41 <211> 608 <212> PRT <213> Escherichia coli <400> 41 Met Lys Leu Gln Lys Gln Leu Leu Glu Ala Val Glu His Lys Gln Leu 1 5 10 15 Arg Pro Leu Asp Val Gln Phe Ala Leu Thr Val Ala Gly Asp Glu His 20 25 30 Pro Ala Val Thr Leu Ala Ala Ala Leu Leu Ser His Asp Ala Gly Glu 35 40 45 Gly His Val Cys Leu Pro Leu Ser Arg Leu Glu Asn Asn Glu Ala Ser 50 55 60 His Pro Leu Leu Ala Thr Cys Val Ser Glu Ile Gly Glu Leu Gln Asn 65 70 75 80 Trp Glu Glu Cys Leu Leu Ala Ser Gln Ala Val Ser Arg Gly Asp Glu 85 90 95 Pro Thr Pro Met Ile Leu Cys Gly Asp Arg Leu Tyr Leu Asn Arg Met 100 105 110 Trp Cys Asn Glu Arg Thr Val Ala Arg Phe Phe Asn Glu Val Asn His 115 120 125 Ala Ile Glu Val Asp Glu Ala Leu Leu Ala Gln Thr Leu Asp Lys Leu 130 135 140 Phe Pro Val Ser Asp Glu Ile Asn Trp Gln Lys Val Ala Ala Ala Val 145 150 155 160 Ala Leu Thr Arg Arg Ile Ser Val Ile Ser Gly Gly Pro Gly Thr Gly 165 170 175 Lys Thr Thr Thr Val Ala Lys Leu Leu Ala Ala Leu Ile Gln Met Ala 180 185 190 Asp Gly Glu Arg Cys Arg Ile Arg Leu Ala Ala Pro Thr Gly Lys Ala 195 200 205 Ala Ala Arg Leu Thr Glu Ser Leu Gly Lys Ala Leu Arg Gln Leu Pro 210 215 220 Leu Thr Asp Glu Gln Lys Lys Arg Ile Pro Glu Asp Ala Ser Thr Leu 225 230 235 240 His Arg Leu Leu Gly Ala Gln Pro Gly Ser Gln Arg Leu Arg His His 245 250 255 Ala Gly Asn Pro Leu His Leu Asp Val Leu Val Val Asp Glu Ala Ser 260 265 270 Met Ile Asp Leu Pro Met Met Ser Arg Leu Ile Asp Ala Leu Pro Asp 275 280 285 His Ala Arg Val Ile Phe Leu Gly Asp Arg Asp Gln Leu Ala Ser Val 290 295 300 Glu Ala Gly Ala Val Leu Gly Asp Ile Cys Ala Tyr Ala Asn Ala Gly 305 310 315 320 Phe Thr Ala Glu Arg Ala Arg Gln Leu Ser Arg Leu Thr Gly Thr His 325 330 335 Val Pro Ala Gly Thr Gly Thr Glu Ala Ala Ser Leu Arg Asp Ser Leu 340 345 350 Cys Leu Leu Gln Lys Ser Tyr Arg Phe Gly Ser Asp Ser Gly Ile Gly 355 360 365 Gln Leu Ala Ala Ala Ile Asn Arg Gly Asp Lys Thr Ala Val Lys Thr 370 375 380 Val Phe Gln Gln Asp Phe Thr Asp Ile Glu Lys Arg Leu Leu Gln Ser 385 390 395 400 Gly Glu Asp Tyr Ile Ala Met Leu Glu Glu Ala Leu Ala Gly Tyr Gly 405 410 415 Arg Tyr Leu Asp Leu Leu Gln Ala Arg Ala Glu Pro Asp Leu Ile Ile 420 425 430 Gln Ala Phe Asn Glu Tyr Gln Leu Leu Cys Ala Leu Arg Glu Gly Pro 435 440 445 Phe Gly Val Ala Gly Leu Asn Glu Arg Ile Glu Gln Phe Met Gln Gln 450 455 460 Lys Arg Lys Ile His Arg His Pro His Ser Arg Trp Tyr Glu Gly Arg 465 470 475 480 Pro Val Met Ile Ala Arg Asn Asp Ser Ala Leu Gly Leu Phe Asn Gly 485 490 495 Asp Ile Gly Ile Ala Leu Asp Arg Gly Gln Gly Thr Arg Val Trp Phe 500 505 510 Ala Met Pro Asp Gly Asn Ile Lys Ser Val Gln Pro Ser Arg Leu Pro 515 520 525 Glu His Glu Thr Thr Trp Ala Met Thr Val His Lys Ser Gln Gly Ser 530 535 540 Glu Phe Asp His Ala Ala Leu Ile Leu Pro Ser Gln Arg Thr Pro Val 545 550 555 560 Val Thr Arg Glu Leu Val Tyr Thr Ala Val Thr Arg Ala Arg Arg Arg 565 570 575 Leu Ser Leu Tyr Ala Asp Glu Arg Ile Leu Ser Ala Ala Ile Ala Thr 580 585 590 Arg Thr Glu Arg Arg Ser Gly Leu Ala Ala Leu Phe Ser Ser Arg Glu 595 600 605 <210> 42 <211> 609 <212> PRT <213> Escherichia coli <400> 42 Met Ala Gln Ala Glu Val Leu Asn Leu Glu Ser Gly Ala Lys Gln Val 1 5 10 15 Leu Gln Glu Thr Phe Gly Tyr Gln Gln Phe Arg Pro Gly Gln Glu Glu 20 25 30 Ile Ile Asp Thr Val Leu Ser Gly Arg Asp Cys Leu Val Val Met Pro 35 40 45 Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Ile Pro Ala Leu Leu Leu 50 55 60 Asn Gly Leu Thr Val Val Val Ser Pro Leu Ile Ser Leu Met Lys Asp 65 70 75 80 Gln Val Asp Gln Leu Gln Ala Asn Gly Val Ala Ala Ala Cys Leu Asn 85 90 95 Ser Thr Gln Thr Arg Glu Gln Gln Leu Glu Val Met Thr Gly Cys Arg 100 105 110 Thr Gly Gln Ile Arg Leu Leu Tyr Ile Ala Pro Glu Arg Leu Met Leu 115 120 125 Asp Asn Phe Leu Glu His Leu Ala His Trp Asn Pro Val Leu Leu Ala 130 135 140 Val Asp Glu Ala His Cys Ile Ser Gln Trp Gly His Asp Phe Arg Pro 145 150 155 160 Glu Tyr Ala Ala Leu Gly Gln Leu Arg Gln Arg Phe Pro Thr Leu Pro 165 170 175 Phe Met Ala Leu Thr Ala Thr Ala Asp Asp Thr Thr Arg Gln Asp Ile 180 185 190 Val Arg Leu Leu Gly Leu Asn Asp Pro Leu Ile Gln Ile Ser Ser Phe 195 200 205 Asp Arg Pro Asn Ile Arg Tyr Met Leu Met Glu Lys Phe Lys Pro Leu 210 215 220 Asp Gln Leu Met Arg Tyr Val Gln Glu Gln Arg Gly Lys Ser Gly Ile 225 230 235 240 Ile Tyr Cys Asn Ser Arg Ala Lys Val Glu Asp Thr Ala Ala Arg Leu 245 250 255 Gln Ser Lys Gly Ile Ser Ala Ala Ala Tyr His Ala Gly Leu Glu Asn 260 265 270 Asn Val Arg Ala Asp Val Gln Glu Lys Phe Gln Arg Asp Asp Leu Gln 275 280 285 Ile Val Val Ala Thr Val Ala Phe Gly Met Gly Ile Asn Lys Pro Asn 290 295 300 Val Arg Phe Val Val His Phe Asp Ile Pro Arg Asn Ile Glu Ser Tyr 305 310 315 320 Tyr Gln Glu Thr Gly Arg Ala Gly Arg Asp Gly Leu Pro Ala Glu Ala 325 330 335 Met Leu Phe Tyr Asp Pro Ala Asp Met Ala Trp Leu Arg Arg Cys Leu 340 345 350 Glu Glu Lys Pro Gln Gly Gln Leu Gln Asp Ile Glu Arg His Lys Leu 355 360 365 Asn Ala Met Gly Ala Phe Ala Glu Ala Gln Thr Cys Arg Arg Leu Val 370 375 380 Leu Leu Asn Tyr Phe Gly Glu Gly Arg Gln Glu Pro Cys Gly Asn Cys 385 390 395 400 Asp Ile Cys Leu Asp Pro Pro Lys Gln Tyr Asp Gly Ser Thr Asp Ala 405 410 415 Gln Ile Ala Leu Ser Thr Ile Gly Arg Val Asn Gln Arg Phe Gly Met 420 425 430 Gly Tyr Val Val Glu Val Ile Arg Gly Ala Asn Asn Gln Arg Ile Arg 435 440 445 Asp Tyr Gly His Asp Lys Leu Lys Val Tyr Gly Met Gly Arg Asp Lys 450 455 460 Ser His Glu His Trp Val Ser Val Ile Arg Gln Leu Ile His Leu Gly 465 470 475 480 Leu Val Thr Gln Asn Ile Ala Gln His Ser Ala Leu Gln Leu Thr Glu 485 490 495 Ala Ala Arg Pro Val Leu Arg Gly Glu Ser Ser Leu Gln Leu Ala Val 500 505 510 Pro Arg Ile Val Ala Leu Lys Pro Lys Ala Met Gln Lys Ser Phe Gly 515 520 525 Gly Asn Tyr Asp Arg Lys Leu Phe Ala Lys Leu Arg Lys Leu Arg Lys 530 535 540 Ser Ile Ala Asp Glu Ser Asn Val Pro Pro Tyr Val Val Phe Asn Asp 545 550 555 560 Ala Thr Leu Ile Glu Met Ala Glu Gln Met Pro Ile Thr Ala Ser Glu 565 570 575 Met Leu Ser Val Asn Gly Val Gly Met Arg Lys Leu Glu Arg Phe Gly 580 585 590 Lys Pro Phe Met Ala Leu Ile Arg Ala His Val Asp Gly Asp Asp Glu 595 600 605 Glu <210> 43 <211> 508 <212> PRT <213> Escherichia coli <400> 43 Met Arg Leu Asn Pro Gly Gln Gln Gln Ala Val Glu Phe Val Thr Gly 1 5 10 15 Pro Cys Leu Val Leu Ala Gly Ala Gly Ser Gly Lys Thr Arg Val Ile 20 25 30 Thr Asn Lys Ile Ala His Leu Ile Arg Gly Cys Gly Tyr Gln Ala Arg 35 40 45 His Ile Ala Ala Val Thr Phe Thr Asn Lys Ala Ala Arg Glu Met Lys 50 55 60 Glu Arg Val Gly Gln Thr Leu Gly Arg Lys Glu Ala Arg Gly Leu Met 65 70 75 80 Ile Ser Thr Phe His Thr Leu Gly Leu Asp Ile Ile Lys Arg Glu Tyr 85 90 95 Ala Ala Leu Gly Met Lys Ala Asn Phe Ser Leu Phe Asp Asp Thr Asp 100 105 110 Gln Leu Ala Leu Leu Lys Glu Leu Thr Glu Gly Leu Ile Glu Asp Asp 115 120 125 Lys Val Leu Leu Gln Gln Leu Ile Ser Thr Ile Ser Asn Trp Lys Asn 130 135 140 Asp Leu Lys Thr Pro Ala Gln Ala Ala Ala Glu Ala Lys Gly Glu Arg 145 150 155 160 Asp Arg Ile Phe Ala His Cys Tyr Gly Leu Tyr Asp Ala His Leu Lys 165 170 175 Ala Cys Asn Val Leu Asp Phe Asp Asp Leu Ile Leu Leu Pro Thr Leu 180 185 190 Leu Leu Gln Arg Asn Glu Glu Val Arg Glu Arg Trp Gln Asn Lys Ile 195 200 205 Arg Tyr Leu Leu Val Asp Glu Tyr Gln Asp Thr Asn Thr Ser Gln Tyr 210 215 220 Glu Leu Val Lys Leu Leu Val Gly Ser Arg Ala Arg Phe Thr Val Val 225 230 235 240 Gly Asp Asp Asp Gln Ser Ile Tyr Ser Trp Arg Gly Ala Arg Pro Gln 245 250 255 Asn Leu Val Leu Leu Ser Gln Asp Phe Pro Ala Leu Lys Val Ile Lys 260 265 270 Leu Glu Gln Asn Tyr Arg Ser Ser Gly Arg Ile Leu Lys Ala Ala Asn 275 280 285 Ile Leu Ile Ala Asn Asn Pro His Val Phe Glu Lys Arg Leu Phe Ser 290 295 300 Glu Leu Gly Tyr Gly Thr Glu Leu Lys Val Leu Ser Ala Asn Asn Glu 305 310 315 320 Glu His Glu Ala Glu Arg Val Thr Gly Glu Leu Ile Ala His His Phe 325 330 335 Val Asn Lys Thr Gln Tyr Lys Asp Tyr Ala Ile Leu Tyr Arg Gly Asn 340 345 350 His Gln Ser Arg Val Phe Glu Lys Phe Leu Met Gln Asn Arg Ile Pro 355 360 365 Tyr Lys Ile Ser Gly Gly Gly Gly Gly Gly Glu Ser Glu Glu Glu Leu 370 375 380 Asp Gln Val Gln Leu Met Thr Leu His Ala Ser Lys Gly Leu Glu Phe 385 390 395 400 Pro Tyr Val Tyr Met Val Gly Met Glu Glu Gly Phe Leu Pro His Gln 405 410 415 Ser Ser Ile Asp Glu Asp Asn Ile Asp Glu Glu Arg Arg Leu Ala Tyr 420 425 430 Val Gly Ile Thr Arg Ala Gln Lys Glu Leu Thr Phe Thr Leu Cys Lys 435 440 445 Glu Arg Arg Gln Tyr Gly Glu Leu Val Arg Pro Glu Pro Ser Arg Phe 450 455 460 Leu Leu Glu Leu Pro Gln Asp Asp Leu Ile Trp Glu Gln Glu Arg Lys 465 470 475 480 Val Val Ser Ala Glu Glu Arg Met Gln Lys Gly Gln Ser His Leu Ala 485 490 495 Asn Leu Lys Ala Met Met Ala Ala Lys Arg Gly Lys 500 505 <210> 44 <211> 720 <212> PRT <213> Escherichia coli <400> 44 Met Asp Val Ser Tyr Leu Leu Asp Ser Leu Asn Asp Lys Gln Arg Glu 1 5 10 15 Ala Val Ala Ala Pro Arg Ser Asn Leu Leu Val Leu Ala Gly Ala Gly 20 25 30 Ser Gly Lys Thr Arg Val Leu Val His Arg Ile Ala Trp Leu Met Ser 35 40 45 Val Glu Asn Cys Ser Pro Tyr Ser Ile Met Ala Val Thr Phe Thr Asn 50 55 60 Lys Ala Ala Ala Glu Met Arg His Arg Ile Gly Gln Leu Met Gly Thr 65 70 75 80 Ser Gln Gly Gly Met Trp Val Gly Thr Phe His Gly Leu Ala His Arg 85 90 95 Leu Leu Arg Ala His His Met Asp Ala Asn Leu Pro Gln Asp Phe Gln 100 105 110 Ile Leu Asp Ser Glu Asp Gln Leu Arg Leu Leu Lys Arg Leu Ile Lys 115 120 125 Ala Met Asn Leu Asp Glu Lys Gln Trp Pro Pro Arg Gln Ala Met Trp 130 135 140 Tyr Ile Asn Ser Gln Lys Asp Glu Gly Leu Arg Pro His His Ile Gln 145 150 155 160 Ser Tyr Gly Asn Pro Val Glu Gln Thr Trp Gln Lys Val Tyr Gln Ala 165 170 175 Tyr Gln Glu Ala Cys Asp Arg Ala Gly Leu Val Asp Phe Ala Glu Leu 180 185 190 Leu Leu Arg Ala His Glu Leu Trp Leu Asn Lys Pro His Ile Leu Gln 195 200 205 His Tyr Arg Glu Arg Phe Thr Asn Ile Leu Val Asp Glu Phe Gln Asp 210 215 220 Thr Asn Asn Ile Gln Tyr Ala Trp Ile Arg Leu Leu Ala Gly Asp Thr 225 230 235 240 Gly Lys Val Met Ile Val Gly Asp Asp Asp Gln Ser Ile Tyr Gly Trp 245 250 255 Arg Gly Ala Gln Val Glu Asn Ile Gln Arg Phe Leu Asn Asp Phe Pro 260 265 270 Gly Ala Glu Thr Ile Arg Leu Glu Gln Asn Tyr Arg Ser Thr Ser Asn 275 280 285 Ile Leu Ser Ala Ala Asn Ala Leu Ile Glu Asn Asn Asn Gly Arg Leu 290 295 300 Gly Lys Lys Leu Trp Thr Asp Gly Ala Asp Gly Glu Pro Ile Ser Leu 305 310 315 320 Tyr Cys Ala Phe Asn Glu Leu Asp Glu Ala Arg Phe Val Val Asn Arg 325 330 335 Ile Lys Thr Trp Gln Asp Asn Gly Gly Ala Leu Ala Glu Cys Ala Ile 340 345 350 Leu Tyr Arg Ser Asn Ala Gln Ser Arg Val Leu Glu Glu Ala Leu Leu 355 360 365 Gln Ala Ser Met Pro Tyr Arg Ile Tyr Gly Gly Met Arg Phe Phe Glu 370 375 380 Arg Gln Glu Ile Lys Asp Ala Leu Ser Tyr Leu Arg Leu Ile Ala Asn 385 390 395 400 Arg Asn Asp Asp Ala Ala Phe Glu Arg Val Val Asn Thr Pro Thr Arg 405 410 415 Gly Ile Gly Asp Arg Thr Leu Asp Val Val Arg Gln Thr Ser Arg Asp 420 425 430 Arg Gln Leu Thr Leu Trp Gln Ala Cys Arg Glu Leu Leu Gln Glu Lys 435 440 445 Ala Leu Ala Gly Arg Ala Ala Ser Ala Leu Gln Arg Phe Met Glu Leu 450 455 460 Ile Asp Ala Leu Ala Gln Glu Thr Ala Asp Met Pro Leu His Val Gln 465 470 475 480 Thr Asp Arg Val Ile Lys Asp Ser Gly Leu Arg Thr Met Tyr Glu Gln 485 490 495 Glu Lys Gly Glu Lys Gly Gln Thr Arg Ile Glu Asn Leu Glu Glu Leu 500 505 510 Val Thr Ala Thr Arg Gln Phe Ser Tyr Asn Glu Glu Asp Glu Asp Leu 515 520 525 Met Pro Leu Gln Ala Phe Leu Ser His Ala Ala Leu Glu Ala Gly Glu 530 535 540 Gly Gln Ala Asp Thr Trp Gln Asp Ala Val Gln Leu Met Thr Leu His 545 550 555 560 Ser Ala Lys Gly Leu Glu Phe Pro Gln Val Phe Ile Val Gly Met Glu 565 570 575 Glu Gly Met Phe Pro Ser Gln Met Ser Leu Asp Glu Gly Gly Arg Leu 580 585 590 Glu Glu Glu Arg Arg Leu Ala Tyr Val Gly Val Thr Arg Ala Met Gln 595 600 605 Lys Leu Thr Leu Thr Tyr Ala Glu Thr Arg Arg Leu Tyr Gly Lys Glu 610 615 620 Val Tyr His Arg Pro Ser Arg Phe Ile Gly Glu Leu Pro Glu Glu Cys 625 630 635 640 Val Glu Glu Val Arg Leu Arg Ala Thr Val Ser Arg Pro Val Ser His 645 650 655 Gln Arg Met Gly Thr Pro Met Val Glu Asn Asp Ser Gly Tyr Lys Leu 660 665 670 Gly Gln Arg Val Arg His Ala Lys Phe Gly Glu Gly Thr Ile Val Asn 675 680 685 Met Glu Gly Ser Gly Glu His Ser Arg Leu Gln Val Ala Phe Gln Gly 690 695 700 Gln Gly Ile Lys Trp Leu Val Ala Ala Tyr Ala Arg Leu Glu Ser Val 705 710 715 720 <210> 45 <211> 968 <212> PRT <213> Escherichia coli <400> 45 Met Pro Phe Thr Leu Gly Gln Arg Trp Ile Ser Asp Thr Glu Ser Glu 1 5 10 15 Leu Gly Leu Gly Thr Val Val Ala Val Asp Ala Arg Thr Val Thr Leu 20 25 30 Leu Phe Pro Ser Thr Gly Glu Asn Arg Leu Tyr Ala Arg Ser Asp Ser 35 40 45 Pro Val Thr Arg Val Met Phe Asn Pro Gly Asp Thr Ile Thr Ser His 50 55 60 Asp Gly Trp Gln Met Gln Val Glu Glu Val Lys Glu Glu Asn Gly Leu 65 70 75 80 Leu Thr Tyr Ile Gly Thr Arg Leu Asp Thr Glu Glu Ser Gly Val Ala 85 90 95 Leu Arg Glu Val Phe Leu Asp Ser Lys Leu Val Phe Ser Lys Pro Gln 100 105 110 Asp Arg Leu Phe Ala Gly Gln Ile Asp Arg Met Asp Arg Phe Ala Leu 115 120 125 Arg Tyr Arg Ala Arg Lys Tyr Ser Ser Glu Gln Phe Arg Met Pro Tyr 130 135 140 Ser Gly Leu Arg Gly Gln Arg Thr Ser Leu Ile Pro His Gln Leu Asn 145 150 155 160 Ile Ala His Asp Val Gly Arg Arg His Ala Pro Arg Val Leu Leu Ala 165 170 175 Asp Glu Val Gly Leu Gly Lys Thr Ile Glu Ala Gly Met Ile Leu His 180 185 190 Gln Gln Leu Leu Ser Gly Ala Ala Glu Arg Val Leu Ile Ile Val Pro 195 200 205 Glu Thr Leu Gln His Gln Trp Leu Val Glu Met Leu Arg Arg Phe Asn 210 215 220 Leu Arg Phe Ala Leu Phe Asp Asp Glu Arg Tyr Ala Glu Ala Gln His 225 230 235 240 Asp Ala Tyr Asn Pro Phe Asp Thr Glu Gln Leu Val Ile Cys Ser Leu 245 250 255 Asp Phe Ala Arg Arg Ser Lys Gln Arg Leu Glu His Leu Cys Glu Ala 260 265 270 Glu Trp Asp Leu Leu Val Val Asp Glu Ala His His Leu Val Trp Ser 275 280 285 Glu Asp Ala Pro Ser Arg Glu Tyr Gln Ala Ile Glu Gln Leu Ala Glu 290 295 300 His Val Pro Gly Val Leu Leu Leu Thr Ala Thr Pro Glu Gln Leu Gly 305 310 315 320 Met Glu Ser His Phe Ala Arg Leu Arg Leu Leu Asp Pro Asn Arg Phe 325 330 335 His Asp Phe Ala Gln Phe Val Glu Glu Gln Lys Asn Tyr Arg Pro Val 340 345 350 Ala Asp Ala Val Ala Met Leu Leu Ala Gly Asn Lys Leu Ser Asn Asp 355 360 365 Glu Leu Asn Met Leu Gly Glu Met Ile Gly Glu Gln Asp Ile Glu Pro 370 375 380 Leu Leu Gln Ala Ala Asn Ser Asp Ser Glu Asp Ala Gln Ser Ala Arg 385 390 395 400 Gln Glu Leu Val Ser Met Leu Met Asp Arg His Gly Thr Ser Arg Val 405 410 415 Leu Phe Arg Asn Thr Arg Asn Gly Val Lys Gly Phe Pro Lys Arg Glu 420 425 430 Leu His Thr Ile Lys Leu Pro Leu Pro Thr Gln Tyr Gln Thr Ala Ile 435 440 445 Lys Val Ser Gly Ile Met Gly Ala Arg Lys Ser Ala Glu Asp Arg Ala 450 455 460 Arg Asp Met Leu Tyr Pro Glu Arg Ile Tyr Gln Glu Phe Glu Gly Asp 465 470 475 480 Asn Ala Thr Trp Trp Asn Phe Asp Pro Arg Val Glu Trp Leu Met Gly 485 490 495 Tyr Leu Thr Ser His Arg Ser Gln Lys Val Leu Val Ile Cys Ala Lys 500 505 510 Ala Ala Thr Ala Leu Gln Leu Glu Gln Val Leu Arg Glu Arg Glu Gly 515 520 525 Ile Arg Ala Ala Val Phe His Glu Gly Met Ser Ile Ile Glu Arg Asp 530 535 540 Arg Ala Ala Ala Trp Phe Ala Glu Glu Asp Thr Gly Ala Gln Val Leu 545 550 555 560 Leu Cys Ser Glu Ile Gly Ser Glu Gly Arg Asn Phe Gln Phe Ala Ser 565 570 575 His Met Val Met Phe Asp Leu Pro Phe Asn Pro Asp Leu Leu Glu Gln 580 585 590 Arg Ile Gly Arg Leu Asp Arg Ile Gly Gln Ala His Asp Ile Gln Ile 595 600 605 His Val Pro Tyr Leu Glu Lys Thr Ala Gln Ser Val Leu Val Arg Trp 610 615 620 Tyr His Glu Gly Leu Asp Ala Phe Glu His Thr Cys Pro Thr Gly Arg 625 630 635 640 Thr Ile Tyr Asp Ser Val Tyr Asn Asp Leu Ile Asn Tyr Leu Ala Ser 645 650 655 Pro Asp Gln Thr Glu Gly Phe Asp Asp Leu Ile Lys Asn Cys Arg Glu 660 665 670 Gln His Glu Ala Leu Lys Ala Gln Leu Glu Gln Gly Arg Asp Arg Leu 675 680 685 Leu Glu Ile His Ser Asn Gly Gly Glu Lys Ala Gln Ala Leu Ala Glu 690 695 700 Ser Ile Glu Glu Gln Asp Asp Asp Thr Asn Leu Ile Ala Phe Ala Met 705 710 715 720 Asn Leu Phe Asp Ile Ile Gly Ile Asn Gln Asp Asp Arg Gly Asp Asn 725 730 735 Met Ile Val Leu Thr Pro Ser Asp His Met Leu Val Pro Asp Phe Pro 740 745 750 Gly Leu Ser Glu Asp Gly Ile Thr Ile Thr Phe Asp Arg Glu Val Ala 755 760 765 Leu Ala Arg Glu Asp Ala Gln Phe Ile Thr Trp Glu His Pro Leu Ile 770 775 780 Arg Asn Gly Leu Asp Leu Ile Leu Ser Gly Asp Thr Gly Ser Ser Thr 785 790 795 800 Ile Ser Leu Leu Lys Asn Lys Ala Leu Pro Val Gly Thr Leu Leu Val 805 810 815 Glu Leu Ile Tyr Val Val Glu Ala Gln Ala Pro Lys Gln Leu Gln Leu 820 825 830 Asn Arg Phe Leu Pro Pro Thr Pro Val Arg Met Leu Leu Asp Lys Asn 835 840 845 Gly Asn Asn Leu Ala Ala Gln Val Glu Phe Glu Thr Phe Asn Arg Gln 850 855 860 Leu Asn Ala Val Asn Arg His Thr Gly Ser Lys Leu Val Asn Ala Val 865 870 875 880 Gln Gln Asp Val His Ala Ile Leu Gln Leu Gly Glu Ala Gln Ile Glu 885 890 895 Lys Ser Ala Arg Ala Leu Ile Asp Ala Ala Arg Asn Glu Ala Asp Glu 900 905 910 Lys Leu Ser Ala Glu Leu Ser Arg Leu Glu Ala Leu Arg Ala Val Asn 915 920 925 Pro Asn Ile Arg Asp Asp Glu Leu Thr Ala Ile Glu Ser Asn Arg Gln 930 935 940 Gln Val Met Glu Ser Leu Asp Gln Ala Gly Trp Arg Leu Asp Ala Leu 945 950 955 960 Arg Leu Ile Val Val Thr His Gln 965 <210> 46 <211> 693 <212> PRT <213> Escherichia coli <400> 46 Met Lys Gly Arg Leu Leu Asp Ala Val Pro Leu Ser Ser Leu Thr Gly 1 5 10 15 Val Gly Ala Ala Leu Ser Asn Lys Leu Ala Lys Ile Asn Leu His Thr 20 25 30 Val Gln Asp Leu Leu Leu His Leu Pro Leu Arg Tyr Glu Asp Arg Thr 35 40 45 His Leu Tyr Pro Ile Gly Glu Leu Leu Pro Gly Val Tyr Ala Thr Val 50 55 60 Glu Gly Glu Val Leu Asn Cys Asn Ile Ser Phe Gly Gly Arg Arg Met 65 70 75 80 Met Thr Cys Gln Ile Ser Asp Gly Ser Gly Ile Leu Thr Met Arg Phe 85 90 95 Phe Asn Phe Ser Ala Ala Met Lys Asn Ser Leu Ala Ala Gly Arg Arg 100 105 110 Val Leu Ala Tyr Gly Glu Ala Lys Arg Gly Lys Tyr Gly Ala Glu Met 115 120 125 Ile His Pro Glu Tyr Arg Val Gln Gly Asp Leu Ser Thr Pro Glu Leu 130 135 140 Gln Glu Thr Leu Thr Pro Val Tyr Pro Thr Thr Glu Gly Val Lys Gln 145 150 155 160 Ala Thr Leu Arg Lys Leu Thr Asp Gln Ala Leu Asp Leu Leu Asp Thr 165 170 175 Cys Ala Ile Glu Glu Leu Leu Pro Pro Glu Leu Ser Gln Gly Met Met 180 185 190 Thr Leu Pro Glu Ala Leu Arg Thr Leu His Arg Pro Pro Pro Thr Leu 195 200 205 Gln Leu Ser Asp Leu Glu Thr Gly Gln His Pro Ala Gln Arg Arg Leu 210 215 220 Ile Leu Glu Glu Leu Leu Ala His Asn Leu Ser Met Leu Ala Leu Arg 225 230 235 240 Ala Gly Ala Gln Arg Phe His Ala Gln Pro Leu Ser Ala Asn Asp Thr 245 250 255 Leu Lys Asn Lys Leu Leu Ala Ala Leu Pro Phe Lys Pro Thr Gly Ala 260 265 270 Gln Ala Arg Val Val Ala Glu Ile Glu Arg Asp Met Ala Leu Asp Val 275 280 285 Pro Met Met Arg Leu Val Gln Gly Asp Val Gly Ser Gly Lys Thr Leu 290 295 300 Val Ala Ala Leu Ala Ala Leu Arg Ala Ile Ala His Gly Lys Gln Val 305 310 315 320 Ala Leu Met Ala Pro Thr Glu Leu Leu Ala Glu Gln His Ala Asn Asn 325 330 335 Phe Arg Asn Trp Phe Ala Pro Leu Gly Ile Glu Val Gly Trp Leu Ala 340 345 350 Gly Lys Gln Lys Gly Lys Ala Arg Leu Ala Gln Gln Glu Ala Ile Ala 355 360 365 Ser Gly Gln Val Gln Met Ile Val Gly Thr His Ala Ile Phe Gln Glu 370 375 380 Gln Val Gln Phe Asn Gly Leu Ala Leu Val Ile Ile Asp Glu Gln His 385 390 395 400 Arg Phe Gly Val His Gln Arg Leu Ala Leu Trp Glu Lys Gly Gln Gln 405 410 415 Gln Gly Phe His Pro His Gln Leu Ile Met Thr Ala Thr Pro Ile Pro 420 425 430 Arg Thr Leu Ala Met Thr Ala Tyr Ala Asp Leu Asp Thr Ser Val Ile 435 440 445 Asp Glu Leu Pro Pro Gly Arg Thr Pro Val Thr Thr Val Ala Ile Pro 450 455 460 Asp Thr Arg Arg Thr Asp Ile Ile Asp Arg Val His His Ala Cys Ile 465 470 475 480 Thr Glu Gly Arg Gln Ala Tyr Trp Val Cys Thr Leu Ile Glu Glu Ser 485 490 495 Glu Leu Leu Glu Ala Gln Ala Ala Glu Ala Thr Trp Glu Glu Leu Lys 500 505 510 Leu Ala Leu Pro Glu Leu Asn Val Gly Leu Val His Gly Arg Met Lys 515 520 525 Pro Ala Glu Lys Gln Ala Val Met Ala Ser Phe Lys Gln Gly Glu Leu 530 535 540 His Leu Leu Val Ala Thr Thr Val Ile Glu Val Gly Val Asp Val Pro 545 550 555 560 Asn Ala Ser Leu Met Ile Ile Glu Asn Pro Glu Arg Leu Gly Leu Ala 565 570 575 Gln Leu His Gln Leu Arg Gly Arg Val Gly Arg Gly Ala Val Ala Ser 580 585 590 His Cys Val Leu Leu Tyr Lys Thr Pro Leu Ser Lys Thr Ala Gln Ile 595 600 605 Arg Leu Gln Val Leu Arg Asp Ser Asn Asp Gly Phe Val Ile Ala Gln 610 615 620 Lys Asp Leu Glu Ile Arg Gly Pro Gly Glu Leu Leu Gly Thr Arg Gln 625 630 635 640 Thr Gly Asn Ala Glu Phe Lys Val Ala Asp Leu Leu Arg Asp Gln Ala 645 650 655 Met Ile Pro Glu Val Gln Arg Leu Ala Arg His Ile His Glu Arg Tyr 660 665 670 Pro Gln Gln Ala Lys Ala Leu Ile Glu Arg Trp Met Pro Glu Thr Glu 675 680 685 Arg Tyr Ser Asn Ala 690 <210> 47 <211> 467 <212> PRT <213> Homo sapiens <400> 47 Met Ser Leu Ser Leu Trp Gln Gln Cys Leu Ala Arg Leu Gln Asp Glu 1 5 10 15 Leu Pro Ala Thr Glu Phe Ser Met Trp Ile Arg Pro Leu Gln Ala Glu 20 25 30 Leu Ser Asp Asn Thr Leu Ala Leu Tyr Ala Pro Asn Arg Phe Val Leu 35 40 45 Asp Trp Val Arg Asp Lys Tyr Leu Asn Asn Ile Asn Gly Leu Leu Thr 50 55 60 Ser Phe Cys Gly Ala Asp Ala Pro Gln Leu Arg Phe Glu Val Gly Thr 65 70 75 80 Lys Pro Val Thr Gln Thr Pro Gln Ala Ala Val Thr Ser Asn Val Ala 85 90 95 Ala Pro Ala Gln Val Ala Gln Thr Gln Pro Gln Arg Ala Ala Pro Ser 100 105 110 Thr Arg Ser Gly Trp Asp Asn Val Pro Ala Pro Ala Glu Pro Thr Tyr 115 120 125 Arg Ser Asn Val Asn Val Lys His Thr Phe Asp Asn Phe Val Glu Gly 130 135 140 Lys Ser Asn Gln Leu Ala Arg Ala Ala Ala Arg Gln Val Ala Asp Asn 145 150 155 160 Pro Gly Gly Ala Tyr Asn Pro Leu Phe Leu Tyr Gly Gly Thr Gly Leu 165 170 175 Gly Lys Thr His Leu Leu His Ala Val Gly Asn Gly Ile Met Ala Arg 180 185 190 Lys Pro Asn Ala Lys Val Val Tyr Met His Ser Glu Arg Phe Val Gln 195 200 205 Asp Met Val Lys Ala Leu Gln Asn Asn Ala Ile Glu Glu Phe Lys Arg 210 215 220 Tyr Tyr Arg Ser Val Asp Ala Leu Leu Ile Asp Asp Ile Gln Phe Phe 225 230 235 240 Ala Asn Lys Glu Arg Ser Gln Glu Glu Phe Phe His Thr Phe Asn Ala 245 250 255 Leu Leu Glu Gly Asn Gln Gln Ile Ile Leu Thr Ser Asp Arg Tyr Pro 260 265 270 Lys Glu Ile Asn Gly Val Glu Asp Arg Leu Lys Ser Arg Phe Gly Trp 275 280 285 Gly Leu Thr Val Ala Ile Glu Pro Pro Glu Leu Glu Thr Arg Val Ala 290 295 300 Ile Leu Met Lys Lys Ala Asp Glu Asn Asp Ile Arg Leu Pro Gly Glu 305 310 315 320 Val Ala Phe Phe Ile Ala Lys Arg Leu Arg Ser Asn Val Arg Glu Leu 325 330 335 Glu Gly Ala Leu Asn Arg Val Ile Ala Asn Ala Asn Phe Thr Gly Arg 340 345 350 Ala Ile Thr Ile Asp Phe Val Arg Glu Ala Leu Arg Asp Leu Leu Ala 355 360 365 Leu Gln Glu Lys Leu Val Thr Ile Asp Asn Ile Gln Lys Thr Val Ala 370 375 380 Glu Tyr Tyr Lys Ile Lys Val Ala Asp Leu Leu Ser Lys Arg Arg Ser 385 390 395 400 Arg Ser Val Ala Arg Pro Arg Gln Met Ala Met Ala Leu Ala Lys Glu 405 410 415 Leu Thr Asn His Ser Leu Pro Glu Ile Gly Asp Ala Phe Gly Gly Arg 420 425 430 Asp His Thr Thr Val Leu His Ala Cys Arg Lys Ile Glu Gln Leu Arg 435 440 445 Glu Glu Ser His Asp Ile Lys Glu Asp Phe Ser Asn Leu Ile Arg Thr 450 455 460 Leu Ser Ser 465 <210> 48 <211> 215 <212> PRT <213> Homo sapiens <400> 48 Met Gly Lys Gly Asp Pro Lys Lys Pro Arg Gly Lys Met Ser Ser Tyr 1 5 10 15 Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro 20 25 30 Asp Ala Ser Val Asn Phe Ser Glu Phe Ser Lys Lys Cys Ser Glu Arg 35 40 45 Trp Lys Thr Met Ser Ala Lys Glu Lys Gly Lys Phe Glu Asp Met Ala 50 55 60 Lys Ala Asp Lys Ala Arg Tyr Glu Arg Glu Met Lys Thr Tyr Ile Pro 65 70 75 80 Pro Lys Gly Glu Thr Lys Lys Lys Phe Lys Asp Pro Asn Ala Pro Lys 85 90 95 Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu Tyr Arg Pro Lys 100 105 110 Ile Lys Gly Glu His Pro Gly Leu Ser Ile Gly Asp Val Ala Lys Lys 115 120 125 Leu Gly Glu Met Trp Asn Asn Thr Ala Ala Asp Asp Lys Gln Pro Tyr 130 135 140 Glu Lys Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala 145 150 155 160 Ala Tyr Arg Ala Lys Gly Lys Pro Asp Ala Ala Lys Lys Gly Val Val 165 170 175 Lys Ala Glu Lys Ser Lys Lys Lys Lys Glu Glu Glu Glu Asp Glu Glu 180 185 190 Asp Glu Glu Asp Glu Glu Glu Glu Glu Asp Glu Glu Asp Glu Asp Glu 195 200 205 Glu Glu Asp Asp Asp Asp Glu 210 215 <210> 49 <211> 209 <212> PRT <213> Homo sapiens <400> 49 Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr 1 5 10 15 Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro 20 25 30 Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg 35 40 45 Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala 50 55 60 Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro 65 70 75 80 Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys 85 90 95 Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys 100 105 110 Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys 115 120 125 Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr 130 135 140 Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala 145 150 155 160 Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly 165 170 175 Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu 180 185 190 Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu 195 200 205 Glu <210> 50 <211> 616 <212> PRT <213> Homo sapiens <400> 50 Met Val Gly Gln Leu Ser Glu Gly Ala Ile Ala Ala Ile Met Gln Lys 1 5 10 15 Gly Asp Thr Asn Ile Lys Pro Ile Leu Gln Val Ile Asn Ile Arg Pro 20 25 30 Ile Thr Thr Gly Asn Ser Pro Pro Arg Tyr Arg Leu Leu Met Ser Asp 35 40 45 Gly Leu Asn Thr Leu Ser Ser Phe Met Leu Ala Thr Gln Leu Asn Pro 50 55 60 Leu Val Glu Glu Glu Gln Leu Ser Ser Asn Cys Val Cys Gln Ile His 65 70 75 80 Arg Phe Ile Val Asn Thr Leu Lys Asp Gly Arg Arg Val Val Ile Leu 85 90 95 Met Glu Leu Glu Val Leu Lys Ser Ala Glu Ala Val Gly Val Lys Ile 100 105 110 Gly Asn Pro Val Pro Tyr Asn Glu Gly Leu Gly Gln Pro Gln Val Ala 115 120 125 Pro Pro Ala Pro Ala Ala Ser Pro Ala Ala Ser Ser Arg Pro Gln Pro 130 135 140 Gln Asn Gly Ser Ser Gly Met Gly Ser Thr Val Ser Lys Ala Tyr Gly 145 150 155 160 Ala Ser Lys Thr Phe Gly Lys Ala Ala Gly Pro Ser Leu Ser His Thr 165 170 175 Ser Gly Gly Thr Gln Ser Lys Val Val Pro Ile Ala Ser Leu Thr Pro 180 185 190 Tyr Gln Ser Lys Trp Thr Ile Cys Ala Arg Val Thr Asn Lys Ser Gln 195 200 205 Ile Arg Thr Trp Ser Asn Ser Arg Gly Glu Gly Lys Leu Phe Ser Leu 210 215 220 Glu Leu Val Asp Glu Ser Gly Glu Ile Arg Ala Thr Ala Phe Asn Glu 225 230 235 240 Gln Val Asp Lys Phe Phe Pro Leu Ile Glu Val Asn Lys Val Tyr Tyr 245 250 255 Phe Ser Lys Gly Thr Leu Lys Ile Ala Asn Lys Gln Phe Thr Ala Val 260 265 270 Lys Asn Asp Tyr Glu Met Thr Phe Asn Asn Glu Thr Ser Val Met Pro 275 280 285 Cys Glu Asp Asp His His Leu Pro Thr Val Gln Phe Asp Phe Thr Gly 290 295 300 Ile Asp Asp Leu Glu Asn Lys Ser Lys Asp Ser Leu Val Asp Ile Ile 305 310 315 320 Gly Ile Cys Lys Ser Tyr Glu Asp Ala Thr Lys Ile Thr Val Arg Ser 325 330 335 Asn Asn Arg Glu Val Ala Lys Arg Asn Ile Tyr Leu Met Asp Thr Ser 340 345 350 Gly Lys Val Val Thr Ala Thr Leu Trp Gly Glu Asp Ala Asp Lys Phe 355 360 365 Asp Gly Ser Arg Gln Pro Val Leu Ala Ile Lys Gly Ala Arg Val Ser 370 375 380 Asp Phe Gly Gly Arg Ser Leu Ser Val Leu Ser Ser Ser Thr Ile Ile 385 390 395 400 Ala Asn Pro Asp Ile Pro Glu Ala Tyr Lys Leu Arg Gly Trp Phe Asp 405 410 415 Ala Glu Gly Gln Ala Leu Asp Gly Val Ser Ile Ser Asp Leu Lys Ser 420 425 430 Gly Gly Val Gly Gly Ser Asn Thr Asn Trp Lys Thr Leu Tyr Glu Val 435 440 445 Lys Ser Glu Asn Leu Gly Gln Gly Asp Lys Pro Asp Tyr Phe Ser Ser 450 455 460 Val Ala Thr Val Val Tyr Leu Arg Lys Glu Asn Cys Met Tyr Gln Ala 465 470 475 480 Cys Pro Thr Gln Asp Cys Asn Lys Lys Val Ile Asp Gln Gln Asn Gly 485 490 495 Leu Tyr Arg Cys Glu Lys Cys Asp Thr Glu Phe Pro Asn Phe Lys Tyr 500 505 510 Arg Met Ile Leu Ser Val Asn Ile Ala Asp Phe Gln Glu Asn Gln Trp 515 520 525 Val Thr Cys Phe Gln Glu Ser Ala Glu Ala Ile Leu Gly Gln Asn Ala 530 535 540 Ala Tyr Leu Gly Glu Leu Lys Asp Lys Asn Glu Gln Ala Phe Glu Glu 545 550 555 560 Val Phe Gln Asn Ala Asn Phe Arg Ser Phe Ile Phe Arg Val Arg Val 565 570 575 Lys Val Glu Thr Tyr Asn Asp Glu Ser Arg Ile Lys Ala Thr Val Met 580 585 590 Asp Val Lys Pro Val Asp Tyr Arg Glu Tyr Gly Arg Arg Leu Val Met 595 600 605 Ser Ile Arg Arg Ser Ala Leu Met 610 615 <210> 51 <211> 270 <212> PRT <213> Homo sapiens <400> 51 Met Trp Asn Ser Gly Phe Glu Ser Tyr Gly Ser Ser Ser Tyr Gly Gly 1 5 10 15 Ala Gly Gly Tyr Thr Gln Ser Pro Gly Gly Phe Gly Ser Pro Ala Pro 20 25 30 Ser Gln Ala Glu Lys Lys Ser Arg Ala Arg Ala Gln His Ile Val Pro 35 40 45 Cys Thr Ile Ser Gln Leu Leu Ser Ala Thr Leu Val Asp Glu Val Phe 50 55 60 Arg Ile Gly Asn Val Glu Ile Ser Gln Val Thr Ile Val Gly Ile Ile 65 70 75 80 Arg His Ala Glu Lys Ala Pro Thr Asn Ile Val Tyr Lys Ile Asp Asp 85 90 95 Met Thr Ala Ala Pro Met Asp Val Arg Gln Trp Val Asp Thr Asp Asp 100 105 110 Thr Ser Ser Glu Asn Thr Val Val Pro Pro Glu Thr Tyr Val Lys Val 115 120 125 Ala Gly His Leu Arg Ser Phe Gln Asn Lys Lys Ser Leu Val Ala Phe 130 135 140 Lys Ile Met Pro Leu Glu Asp Met Asn Glu Phe Thr Thr His Ile Leu 145 150 155 160 Glu Val Ile Asn Ala His Met Val Leu Ser Lys Ala Asn Ser Gln Pro 165 170 175 Ser Ala Gly Arg Ala Pro Ile Ser Asn Pro Gly Met Ser Glu Ala Gly 180 185 190 Asn Phe Gly Gly Asn Ser Phe Met Pro Ala Asn Gly Leu Thr Val Ala 195 200 205 Gln Asn Gln Val Leu Asn Leu Ile Lys Ala Cys Pro Arg Pro Glu Gly 210 215 220 Leu Asn Phe Gln Asp Leu Lys Asn Gln Leu Lys His Met Ser Val Ser 225 230 235 240 Ser Ile Lys Gln Ala Val Asp Phe Leu Ser Asn Glu Gly His Ile Tyr 245 250 255 Ser Thr Val Asp Asp Asp His Phe Lys Ser Thr Asp Ala Glu 260 265 270 <210> 52 <211> 121 <212> PRT <213> Homo sapiens <400> 52 Met Val Asp Met Met Asp Leu Pro Arg Ser Arg Ile Asn Ala Gly Met 1 5 10 15 Leu Ala Gln Phe Ile Asp Lys Pro Val Cys Phe Val Gly Arg Leu Glu 20 25 30 Lys Ile His Pro Thr Gly Lys Met Phe Ile Leu Ser Asp Gly Glu Gly 35 40 45 Lys Asn Gly Thr Ile Glu Leu Met Glu Pro Leu Asp Glu Glu Ile Ser 50 55 60 Gly Ile Val Glu Val Val Gly Arg Val Thr Ala Lys Ala Thr Ile Leu 65 70 75 80 Cys Thr Ser Tyr Val Gln Phe Lys Glu Asp Ser His Pro Phe Asp Leu 85 90 95 Gly Leu Tyr Asn Glu Ala Val Lys Ile Ile His Asp Phe Pro Gln Phe 100 105 110 Tyr Pro Leu Gly Ile Val Gln His Asp 115 120 <210> 53 <211> 339 <212> PRT <213> Homo sapiens <400> 53 Met Ala Met Gln Met Gln Leu Glu Ala Asn Ala Asp Thr Ser Val Glu 1 5 10 15 Glu Glu Ser Phe Gly Pro Gln Pro Ile Ser Arg Leu Glu Gln Cys Gly 20 25 30 Ile Asn Ala Asn Asp Val Lys Lys Leu Glu Glu Ala Gly Phe His Thr 35 40 45 Val Glu Ala Val Ala Tyr Ala Pro Lys Lys Glu Leu Ile Asn Ile Lys 50 55 60 Gly Ile Ser Glu Ala Lys Ala Asp Lys Ile Leu Ala Glu Ala Ala Lys 65 70 75 80 Leu Val Pro Met Gly Phe Thr Thr Ala Thr Glu Phe His Gln Arg Arg 85 90 95 Ser Glu Ile Ile Gln Ile Thr Thr Gly Ser Lys Glu Leu Asp Lys Leu 100 105 110 Leu Gln Gly Gly Ile Glu Thr Gly Ser Ile Thr Glu Met Phe Gly Glu 115 120 125 Phe Arg Thr Gly Lys Thr Gln Ile Cys His Thr Leu Ala Val Thr Cys 130 135 140 Gln Leu Pro Ile Asp Arg Gly Gly Gly Glu Gly Lys Ala Met Tyr Ile 145 150 155 160 Asp Thr Glu Gly Thr Phe Arg Pro Glu Arg Leu Leu Ala Val Ala Glu 165 170 175 Arg Tyr Gly Leu Ser Gly Ser Asp Val Leu Asp Asn Val Ala Tyr Ala 180 185 190 Arg Ala Phe Asn Thr Asp His Gln Thr Gln Leu Leu Tyr Gln Ala Ser 195 200 205 Ala Met Met Val Glu Ser Arg Tyr Ala Leu Leu Ile Val Asp Ser Ala 210 215 220 Thr Ala Leu Tyr Arg Thr Asp Tyr Ser Gly Arg Gly Glu Leu Ser Ala 225 230 235 240 Arg Gln Met His Leu Ala Arg Phe Leu Arg Met Leu Leu Arg Leu Ala 245 250 255 Asp Glu Phe Gly Val Ala Val Val Ile Thr Asn Gln Val Val Ala Gln 260 265 270 Val Asp Gly Ala Ala Met Phe Ala Ala Asp Pro Lys Lys Pro Ile Gly 275 280 285 Gly Asn Ile Ile Ala His Ala Ser Thr Thr Arg Leu Tyr Leu Arg Lys 290 295 300 Gly Arg Gly Glu Thr Arg Ile Cys Lys Ile Tyr Asp Ser Pro Cys Leu 305 310 315 320 Pro Glu Ala Glu Ala Met Phe Ala Ile Asn Ala Asp Gly Val Gly Asp 325 330 335 Ala Lys Asp <210> 54 <211> 418 <212> PRT <213> Homo sapiens <400> 54 Met Ser Gly Thr Glu Glu Ala Ile Leu Gly Gly Arg Asp Ser His Pro 1 5 10 15 Ala Ala Gly Gly Gly Ser Val Leu Cys Phe Gly Gln Cys Gln Tyr Thr 20 25 30 Ala Glu Glu Tyr Gln Ala Ile Gln Lys Ala Leu Arg Gln Arg Leu Gly 35 40 45 Pro Glu Tyr Ile Ser Ser Arg Met Ala Gly Gly Gly Gln Lys Val Cys 50 55 60 Tyr Ile Glu Gly His Arg Val Ile Asn Leu Ala Asn Glu Met Phe Gly 65 70 75 80 Tyr Asn Gly Trp Ala His Ser Ile Thr Gln Gln Asn Val Asp Phe Val 85 90 95 Asp Leu Asn Asn Gly Lys Phe Tyr Val Gly Val Cys Ala Phe Val Arg 100 105 110 Val Gln Leu Lys Asp Gly Ser Tyr His Glu Asp Val Gly Tyr Gly Val 115 120 125 Ser Glu Gly Leu Lys Ser Lys Ala Leu Ser Leu Glu Lys Ala Arg Lys 130 135 140 Glu Ala Val Thr Asp Gly Leu Lys Arg Ala Leu Arg Ser Phe Gly Asn 145 150 155 160 Ala Leu Gly Asn Cys Ile Leu Asp Lys Asp Tyr Leu Arg Ser Leu Asn 165 170 175 Lys Leu Pro Arg Gln Leu Pro Leu Glu Val Asp Leu Thr Lys Ala Lys 180 185 190 Arg Gln Asp Leu Glu Pro Ser Val Glu Glu Ala Arg Tyr Asn Ser Cys 195 200 205 Arg Pro Asn Met Ala Leu Gly His Pro Gln Leu Gln Gln Val Thr Ser 210 215 220 Pro Ser Arg Pro Ser His Ala Val Ile Pro Ala Asp Gln Asp Cys Ser 225 230 235 240 Ser Arg Ser Leu Ser Ser Ser Ala Val Glu Ser Glu Ala Thr His Gln 245 250 255 Arg Lys Leu Arg Gln Lys Gln Leu Gln Gln Gln Phe Arg Glu Arg Met 260 265 270 Glu Lys Gln Gln Val Arg Val Ser Thr Pro Ser Ala Glu Lys Ser Glu 275 280 285 Ala Ala Pro Pro Ala Pro Pro Val Thr His Ser Thr Pro Val Thr Val 290 295 300 Ser Glu Pro Leu Leu Glu Lys Asp Phe Leu Ala Gly Val Thr Gln Glu 305 310 315 320 Leu Ile Lys Thr Leu Glu Asp Asn Ser Glu Lys Trp Ala Val Thr Pro 325 330 335 Asp Ala Gly Asp Gly Val Val Lys Pro Ser Ser Arg Ala Asp Pro Ala 340 345 350 Gln Thr Ser Asp Thr Leu Ala Leu Asn Asn Gln Met Val Thr Gln Asn 355 360 365 Arg Thr Pro His Ser Val Cys His Gln Lys Pro Gln Ala Lys Ser Gly 370 375 380 Ser Trp Asp Leu Gln Thr Tyr Ser Ala Asp Gln Arg Thr Thr Gly Asn 385 390 395 400 Trp Glu Ser His Arg Lys Ser Gln Asp Met Lys Lys Arg Lys Tyr Asp 405 410 415 Pro Ser <210> 55 <211> 1417 <212> PRT <213> Homo sapiens <400> 55 Met Ala Ala Val Pro Gln Asn Asn Leu Gln Glu Gln Leu Glu Arg His 1 5 10 15 Ser Ala Arg Thr Leu Asn Asn Lys Leu Ser Leu Ser Lys Pro Lys Phe 20 25 30 Ser Gly Phe Thr Phe Lys Lys Lys Thr Ser Ser Asp Asn Asn Val Ser 35 40 45 Val Thr Asn Val Ser Val Ala Lys Thr Pro Val Leu Arg Asn Lys Asp 50 55 60 Val Asn Val Thr Glu Asp Phe Ser Phe Ser Glu Pro Leu Pro Asn Thr 65 70 75 80 Thr Asn Gln Gln Arg Val Lys Asp Phe Phe Lys Asn Ala Pro Ala Gly 85 90 95 Gln Glu Thr Gln Arg Gly Gly Ser Lys Ser Leu Leu Pro Asp Phe Leu 100 105 110 Gln Thr Pro Lys Glu Val Val Cys Thr Thr Gln Asn Thr Pro Thr Val 115 120 125 Lys Lys Ser Arg Asp Thr Ala Leu Lys Lys Leu Glu Phe Ser Ser Ser 130 135 140 Pro Asp Ser Leu Ser Thr Ile Asn Asp Trp Asp Asp Met Asp Asp Phe 145 150 155 160 Asp Thr Ser Glu Thr Ser Lys Ser Phe Val Thr Pro Pro Gln Ser His 165 170 175 Phe Val Arg Val Ser Thr Ala Gln Lys Ser Lys Lys Gly Lys Arg Asn 180 185 190 Phe Phe Lys Ala Gln Leu Tyr Thr Thr Asn Thr Val Lys Thr Asp Leu 195 200 205 Pro Pro Pro Ser Ser Glu Ser Glu Gln Ile Asp Leu Thr Glu Glu Gln 210 215 220 Lys Asp Asp Ser Glu Trp Leu Ser Ser Asp Val Ile Cys Ile Asp Asp 225 230 235 240 Gly Pro Ile Ala Glu Val His Ile Asn Glu Asp Ala Gln Glu Ser Asp 245 250 255 Ser Leu Lys Thr His Leu Glu Asp Glu Arg Asp Asn Ser Glu Lys Lys 260 265 270 Lys Asn Leu Glu Glu Ala Glu Leu His Ser Thr Glu Lys Val Pro Cys 275 280 285 Ile Glu Phe Asp Asp Asp Asp Tyr Asp Thr Asp Phe Val Pro Pro Ser 290 295 300 Pro Glu Glu Ile Ile Ser Ala Ser Ser Ser Ser Ser Lys Cys Leu Ser 305 310 315 320 Thr Leu Lys Asp Leu Asp Thr Ser Asp Arg Lys Glu Asp Val Leu Ser 325 330 335 Thr Ser Lys Asp Leu Leu Ser Lys Pro Glu Lys Met Ser Met Gln Glu 340 345 350 Leu Asn Pro Glu Thr Ser Thr Asp Cys Asp Ala Arg Gln Ile Ser Leu 355 360 365 Gln Gln Gln Leu Ile His Val Met Glu His Ile Cys Lys Leu Ile Asp 370 375 380 Thr Ile Pro Asp Asp Lys Leu Lys Leu Leu Asp Cys Gly Asn Glu Leu 385 390 395 400 Leu Gln Gln Arg Asn Ile Arg Arg Lys Leu Leu Thr Glu Val Asp Phe 405 410 415 Asn Lys Ser Asp Ala Ser Leu Leu Gly Ser Leu Trp Arg Tyr Arg Pro 420 425 430 Asp Ser Leu Asp Gly Pro Met Glu Gly Asp Ser Cys Pro Thr Gly Asn 435 440 445 Ser Met Lys Glu Leu Asn Phe Ser His Leu Pro Ser Asn Ser Val Ser 450 455 460 Pro Gly Asp Cys Leu Leu Thr Thr Thr Leu Gly Lys Thr Gly Phe Ser 465 470 475 480 Ala Thr Arg Lys Asn Leu Phe Glu Arg Pro Leu Phe Asn Thr His Leu 485 490 495 Gln Lys Ser Phe Val Ser Ser Asn Trp Ala Glu Thr Pro Arg Leu Gly 500 505 510 Lys Lys Asn Glu Ser Ser Tyr Phe Pro Gly Asn Val Leu Thr Ser Thr 515 520 525 Ala Val Lys Asp Gln Asn Lys His Thr Ala Ser Ile Asn Asp Leu Glu 530 535 540 Arg Glu Thr Gln Pro Ser Tyr Asp Ile Asp Asn Phe Asp Ile Asp Asp 545 550 555 560 Phe Asp Asp Asp Asp Asp Trp Glu Asp Ile Met His Asn Leu Ala Ala 565 570 575 Ser Lys Ser Ser Thr Ala Ala Tyr Gln Pro Ile Lys Glu Gly Arg Pro 580 585 590 Ile Lys Ser Val Ser Glu Arg Leu Ser Ser Ala Lys Thr Asp Cys Leu 595 600 605 Pro Val Ser Ser Thr Ala Gln Asn Ile Asn Phe Ser Glu Ser Ile Gln 610 615 620 Asn Tyr Thr Asp Lys Ser Ala Gln Asn Leu Ala Ser Arg Asn Leu Lys 625 630 635 640 His Glu Arg Phe Gln Ser Leu Ser Phe Pro His Thr Lys Glu Met Met 645 650 655 Lys Ile Phe His Lys Lys Phe Gly Leu His Asn Phe Arg Thr Asn Gln 660 665 670 Leu Glu Ala Ile Asn Ala Ala Leu Leu Gly Glu Asp Cys Phe Ile Leu 675 680 685 Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Cys 690 695 700 Val Ser Pro Gly Val Thr Val Val Ile Ser Pro Leu Arg Ser Leu Ile 705 710 715 720 Val Asp Gln Val Gln Lys Leu Thr Ser Leu Asp Ile Pro Ala Thr Tyr 725 730 735 Leu Thr Gly Asp Lys Thr Asp Ser Glu Ala Thr Asn Ile Tyr Leu Gln 740 745 750 Leu Ser Lys Lys Asp Pro Ile Ile Lys Leu Leu Tyr Val Thr Pro Glu 755 760 765 Lys Ile Cys Ala Ser Asn Arg Leu Ile Ser Thr Leu Glu Asn Leu Tyr 770 775 780 Glu Arg Lys Leu Leu Ala Arg Phe Val Ile Asp Glu Ala His Cys Val 785 790 795 800 Ser Gln Trp Gly His Asp Phe Arg Gln Asp Tyr Lys Arg Met Asn Met 805 810 815 Leu Arg Gln Lys Phe Pro Ser Val Pro Val Met Ala Leu Thr Ala Thr 820 825 830 Ala Asn Pro Arg Val Gln Lys Asp Ile Leu Thr Gln Leu Lys Ile Leu 835 840 845 Arg Pro Gln Val Phe Ser Met Ser Phe Asn Arg His Asn Leu Lys Tyr 850 855 860 Tyr Val Leu Pro Lys Lys Pro Lys Lys Val Ala Phe Asp Cys Leu Glu 865 870 875 880 Trp Ile Arg Lys His His Pro Tyr Asp Ser Gly Ile Ile Tyr Cys Leu 885 890 895 Ser Arg Arg Glu Cys Asp Thr Met Ala Asp Thr Leu Gln Arg Asp Gly 900 905 910 Leu Ala Ala Leu Ala Tyr His Ala Gly Leu Ser Asp Ser Ala Arg Asp 915 920 925 Glu Val Gln Gln Lys Trp Ile Asn Gln Asp Gly Cys Gln Val Ile Cys 930 935 940 Ala Thr Ile Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg Phe 945 950 955 960 Val Ile His Ala Ser Leu Pro Lys Ser Val Glu Gly Tyr Tyr Gln Glu 965 970 975 Ser Gly Arg Ala Gly Arg Asp Gly Glu Ile Ser His Cys Leu Leu Phe 980 985 990 Tyr Thr Tyr His Asp Val Thr Arg Leu Lys Arg Leu Ile Met Met Glu 995 1000 1005 Lys Asp Gly Asn His His Thr Arg Glu Thr His Phe Asn Asn Leu 1010 1015 1020 Tyr Ser Met Val His Tyr Cys Glu Asn Ile Thr Glu Cys Arg Arg 1025 1030 1035 Ile Gln Leu Leu Ala Tyr Phe Gly Glu Asn Gly Phe Asn Pro Asp 1040 1045 1050 Phe Cys Lys Lys His Pro Asp Val Ser Cys Asp Asn Cys Cys Lys 1055 1060 1065 Thr Lys Asp Tyr Lys Thr Arg Asp Val Thr Asp Asp Val Lys Ser 1070 1075 1080 Ile Val Arg Phe Val Gln Glu His Ser Ser Ser Gln Gly Met Arg 1085 1090 1095 Asn Ile Lys His Val Gly Pro Ser Gly Arg Phe Thr Met Asn Met 1100 1105 1110 Leu Val Asp Ile Phe Leu Gly Ser Lys Ser Ala Lys Ile Gln Ser 1115 1120 1125 Gly Ile Phe Gly Lys Gly Ser Ala Tyr Ser Arg His Asn Ala Glu 1130 1135 1140 Arg Leu Phe Lys Lys Leu Ile Leu Asp Lys Ile Leu Asp Glu Asp 1145 1150 1155 Leu Tyr Ile Asn Ala Asn Asp Gln Ala Ile Ala Tyr Val Met Leu 1160 1165 1170 Gly Asn Lys Ala Gln Thr Val Leu Asn Gly Asn Leu Lys Val Asp 1175 1180 1185 Phe Met Glu Thr Glu Asn Ser Ser Ser Val Lys Lys Gln Lys Ala 1190 1195 1200 Leu Val Ala Lys Val Ser Gln Arg Glu Glu Met Val Lys Lys Cys 1205 1210 1215 Leu Gly Glu Leu Thr Glu Val Cys Lys Ser Leu Gly Lys Val Phe 1220 1225 1230 Gly Val His Tyr Phe Asn Ile Phe Asn Thr Val Thr Leu Lys Lys 1235 1240 1245 Leu Ala Glu Ser Leu Ser Ser Asp Pro Glu Val Leu Leu Gln Ile 1250 1255 1260 Asp Gly Val Thr Glu Asp Lys Leu Glu Lys Tyr Gly Ala Glu Val 1265 1270 1275 Ile Ser Val Leu Gln Lys Tyr Ser Glu Trp Thr Ser Pro Ala Glu 1280 1285 1290 Asp Ser Ser Pro Gly Ile Ser Leu Ser Ser Ser Arg Gly Pro Gly 1295 1300 1305 Arg Ser Ala Ala Glu Glu Leu Asp Glu Glu Ile Pro Val Ser Ser 1310 1315 1320 His Tyr Phe Ala Ser Lys Thr Arg Asn Glu Arg Lys Arg Lys Lys 1325 1330 1335 Met Pro Ala Ser Gln Arg Ser Lys Arg Arg Lys Thr Ala Ser Ser 1340 1345 1350 Gly Ser Lys Ala Lys Gly Gly Ser Ala Thr Cys Arg Lys Ile Ser 1355 1360 1365 Ser Lys Thr Lys Ser Ser Ser Ile Ile Gly Ser Ser Ser Ala Ser 1370 1375 1380 His Thr Ser Gln Ala Thr Ser Gly Ala Asn Ser Lys Leu Gly Ile 1385 1390 1395 Met Ala Pro Pro Lys Pro Ile Asn Arg Pro Phe Leu Lys Pro Ser 1400 1405 1410 Tyr Ala Phe Ser 1415 <210> 56 <211> 846 <212> PRT <213> Homo sapiens <400> 56 Met Gly Ile Gln Gly Leu Leu Gln Phe Ile Lys Glu Ala Ser Glu Pro 1 5 10 15 Ile His Val Arg Lys Tyr Lys Gly Gln Val Val Ala Val Asp Thr Tyr 20 25 30 Cys Trp Leu His Lys Gly Ala Ile Ala Cys Ala Glu Lys Leu Ala Lys 35 40 45 Gly Glu Pro Thr Asp Arg Tyr Val Gly Phe Cys Met Lys Phe Val Asn 50 55 60 Met Leu Leu Ser His Gly Ile Lys Pro Ile Leu Val Phe Asp Gly Cys 65 70 75 80 Thr Leu Pro Ser Lys Lys Glu Val Glu Arg Ser Arg Arg Glu Arg Arg 85 90 95 Gln Ala Asn Leu Leu Lys Gly Lys Gln Leu Leu Arg Glu Gly Lys Val 100 105 110 Ser Glu Ala Arg Glu Cys Phe Thr Arg Ser Ile Asn Ile Thr His Ala 115 120 125 Met Ala His Lys Val Ile Lys Ala Ala Arg Ser Gln Gly Val Asp Cys 130 135 140 Leu Val Ala Pro Tyr Glu Ala Asp Ala Gln Leu Ala Tyr Leu Asn Lys 145 150 155 160 Ala Gly Ile Val Gln Ala Ile Ile Thr Glu Asp Ser Asp Leu Leu Ala 165 170 175 Phe Gly Cys Lys Lys Val Ile Leu Lys Met Asp Gln Phe Gly Asn Gly 180 185 190 Leu Glu Ile Asp Gln Ala Arg Leu Gly Met Cys Arg Gln Leu Gly Asp 195 200 205 Val Phe Thr Glu Glu Lys Phe Arg Tyr Met Cys Ile Leu Ser Gly Cys 210 215 220 Asp Tyr Leu Ser Ser Leu Arg Gly Ile Gly Leu Ala Lys Ala Cys Lys 225 230 235 240 Val Leu Arg Leu Ala Asn Asn Pro Asp Ile Val Lys Val Ile Lys Lys 245 250 255 Ile Gly His Tyr Leu Lys Met Asn Ile Thr Val Pro Glu Asp Tyr Ile 260 265 270 Asn Gly Phe Ile Arg Ala Asn Asn Thr Phe Leu Tyr Gln Leu Val Phe 275 280 285 Asp Pro Ile Lys Arg Lys Leu Ile Pro Leu Asn Ala Tyr Glu Asp Asp 290 295 300 Val Asp Pro Glu Thr Leu Ser Tyr Ala Gly Gln Tyr Val Asp Asp Ser 305 310 315 320 Ile Ala Leu Gln Ile Ala Leu Gly Asn Lys Asp Ile Asn Thr Phe Glu 325 330 335 Gln Ile Asp Asp Tyr Asn Pro Asp Thr Ala Met Pro Ala His Ser Arg 340 345 350 Ser His Ser Trp Asp Asp Lys Thr Cys Gln Lys Ser Ala Asn Val Ser 355 360 365 Ser Ile Trp His Arg Asn Tyr Ser Pro Arg Pro Glu Ser Gly Thr Val 370 375 380 Ser Asp Ala Pro Gln Leu Lys Glu Asn Pro Ser Thr Val Gly Val Glu 385 390 395 400 Arg Val Ile Ser Thr Lys Gly Leu Asn Leu Pro Arg Lys Ser Ser Ile 405 410 415 Val Lys Arg Pro Arg Ser Ala Glu Leu Ser Glu Asp Asp Leu Leu Ser 420 425 430 Gln Tyr Ser Leu Ser Phe Thr Lys Lys Thr Lys Lys Asn Ser Ser Glu 435 440 445 Gly Asn Lys Ser Leu Ser Phe Ser Glu Val Phe Val Pro Asp Leu Val 450 455 460 Asn Gly Pro Thr Asn Lys Lys Ser Val Ser Thr Pro Pro Arg Thr Arg 465 470 475 480 Asn Lys Phe Ala Thr Phe Leu Gln Arg Lys Asn Glu Glu Ser Gly Ala 485 490 495 Val Val Val Pro Gly Thr Arg Ser Arg Phe Phe Cys Ser Ser Asp Ser 500 505 510 Thr Asp Cys Val Ser Asn Lys Val Ser Ile Gln Pro Leu Asp Glu Thr 515 520 525 Ala Val Thr Asp Lys Glu Asn Asn Leu His Glu Ser Glu Tyr Gly Asp 530 535 540 Gln Glu Gly Lys Arg Leu Val Asp Thr Asp Val Ala Arg Asn Ser Ser 545 550 555 560 Asp Asp Ile Pro Asn Asn His Ile Pro Gly Asp His Ile Pro Asp Lys 565 570 575 Ala Thr Val Phe Thr Asp Glu Glu Ser Tyr Ser Phe Glu Ser Ser Lys 580 585 590 Phe Thr Arg Thr Ile Ser Pro Pro Thr Leu Gly Thr Leu Arg Ser Cys 595 600 605 Phe Ser Trp Ser Gly Gly Leu Gly Asp Phe Ser Arg Thr Pro Ser Pro 610 615 620 Ser Pro Ser Thr Ala Leu Gln Gln Phe Arg Arg Lys Ser Asp Ser Pro 625 630 635 640 Thr Ser Leu Pro Glu Asn Asn Met Ser Asp Val Ser Gln Leu Lys Ser 645 650 655 Glu Glu Ser Ser Asp Asp Glu Ser His Pro Leu Arg Glu Glu Ala Cys 660 665 670 Ser Ser Gln Ser Gln Glu Ser Gly Glu Phe Ser Leu Gln Ser Ser Asn 675 680 685 Ala Ser Lys Leu Ser Gln Cys Ser Ser Lys Asp Ser Asp Ser Glu Glu 690 695 700 Ser Asp Cys Asn Ile Lys Leu Leu Asp Ser Gln Ser Asp Gln Thr Ser 705 710 715 720 Lys Leu Arg Leu Ser His Phe Ser Lys Lys Asp Thr Pro Leu Arg Asn 725 730 735 Lys Val Pro Gly Leu Tyr Lys Ser Ser Ser Ala Asp Ser Leu Ser Thr 740 745 750 Thr Lys Ile Lys Pro Leu Gly Pro Ala Arg Ala Ser Gly Leu Ser Lys 755 760 765 Lys Pro Ala Ser Ile Gln Lys Arg Lys His His Asn Ala Glu Asn Lys 770 775 780 Pro Gly Leu Gln Ile Lys Leu Asn Glu Leu Trp Lys Asn Phe Gly Phe 785 790 795 800 Lys Lys Asp Ser Glu Lys Leu Pro Pro Cys Lys Lys Pro Leu Ser Pro 805 810 815 Val Arg Asp Asn Ile Gln Leu Thr Pro Glu Ala Glu Glu Asp Ile Phe 820 825 830 Asn Lys Pro Glu Cys Gly Arg Val Gln Arg Ala Ile Phe Gln 835 840 845 <210> 57 <211> 649 <212> PRT <213> Homo sapiens <400> 57 Met Ala Ser Val Ser Ala Leu Thr Glu Glu Leu Asp Ser Ile Thr Ser 1 5 10 15 Glu Leu His Ala Val Glu Ile Gln Ile Gln Glu Leu Thr Glu Arg Gln 20 25 30 Gln Glu Leu Ile Gln Lys Lys Lys Val Leu Thr Lys Lys Ile Lys Gln 35 40 45 Cys Leu Glu Asp Ser Asp Ala Gly Ala Ser Asn Glu Tyr Asp Ser Ser 50 55 60 Pro Ala Ala Trp Asn Lys Glu Asp Phe Pro Trp Ser Gly Lys Val Lys 65 70 75 80 Asp Ile Leu Gln Asn Val Phe Lys Leu Glu Lys Phe Arg Pro Leu Gln 85 90 95 Leu Glu Thr Ile Asn Val Thr Met Ala Gly Lys Glu Val Phe Leu Val 100 105 110 Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Leu 115 120 125 Cys Ser Asp Gly Phe Thr Leu Val Ile Cys Pro Leu Ile Ser Leu Met 130 135 140 Glu Asp Gln Leu Met Val Leu Lys Gln Leu Gly Ile Ser Ala Thr Met 145 150 155 160 Leu Asn Ala Ser Ser Ser Lys Glu His Val Lys Trp Val His Ala Glu 165 170 175 Met Val Asn Lys Asn Ser Glu Leu Lys Leu Ile Tyr Val Thr Pro Glu 180 185 190 Lys Ile Ala Lys Ser Lys Met Phe Met Ser Arg Leu Glu Lys Ala Tyr 195 200 205 Glu Ala Arg Arg Phe Thr Arg Ile Ala Val Asp Glu Val His Cys Cys 210 215 220 Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Lys Ala Leu Gly Ile 225 230 235 240 Leu Lys Arg Gln Phe Pro Asn Ala Ser Leu Ile Gly Leu Thr Ala Thr 245 250 255 Ala Thr Asn His Val Leu Thr Asp Ala Gln Lys Ile Leu Cys Ile Glu 260 265 270 Lys Cys Phe Thr Phe Thr Ala Ser Phe Asn Arg Pro Asn Leu Tyr Tyr 275 280 285 Glu Val Arg Gln Lys Pro Ser Asn Thr Glu Asp Phe Ile Glu Asp Ile 290 295 300 Val Lys Leu Ile Asn Gly Arg Tyr Lys Gly Gln Ser Gly Ile Ile Tyr 305 310 315 320 Cys Phe Ser Gln Lys Asp Ser Glu Gln Val Thr Val Ser Leu Gln Asn 325 330 335 Leu Gly Ile His Ala Gly Ala Tyr His Ala Asn Leu Glu Pro Glu Asp 340 345 350 Lys Thr Thr Val His Arg Lys Trp Ser Ala Asn Glu Ile Gln Val Val 355 360 365 Val Ala Thr Val Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg 370 375 380 Phe Val Ile His His Ser Met Ser Lys Ser Met Glu Asn Tyr Tyr Gln 385 390 395 400 Glu Ser Gly Arg Ala Gly Arg Asp Asp Met Lys Ala Asp Cys Ile Leu 405 410 415 Tyr Tyr Gly Phe Gly Asp Ile Phe Arg Ile Ser Ser Met Val Val Met 420 425 430 Glu Asn Val Gly Gln Gln Lys Leu Tyr Glu Met Val Ser Tyr Cys Gln 435 440 445 Asn Ile Ser Lys Cys Arg Arg Val Leu Met Ala Gln His Phe Asp Glu 450 455 460 Val Trp Asn Ser Glu Ala Cys Asn Lys Met Cys Asp Asn Cys Cys Lys 465 470 475 480 Asp Ser Ala Phe Glu Arg Lys Asn Ile Thr Glu Tyr Cys Arg Asp Leu 485 490 495 Ile Lys Ile Leu Lys Gln Ala Glu Glu Leu Asn Glu Lys Leu Thr Pro 500 505 510 Leu Lys Leu Ile Asp Ser Trp Met Gly Lys Gly Ala Ala Lys Leu Arg 515 520 525 Val Ala Gly Val Val Ala Pro Thr Leu Pro Arg Glu Asp Leu Glu Lys 530 535 540 Ile Ile Ala His Phe Leu Ile Gln Gln Tyr Leu Lys Glu Asp Tyr Ser 545 550 555 560 Phe Thr Ala Tyr Ala Thr Ile Ser Tyr Leu Lys Ile Gly Pro Lys Ala 565 570 575 Asn Leu Leu Asn Asn Glu Ala His Ala Ile Thr Met Gln Val Thr Lys 580 585 590 Ser Thr Gln Asn Ser Phe Arg Ala Glu Ser Ser Gln Thr Cys His Ser 595 600 605 Glu Gln Gly Asp Lys Lys Met Glu Glu Lys Asn Ser Gly Asn Phe Gln 610 615 620 Lys Lys Ala Ala Asn Met Leu Gln Gln Ser Gly Ser Lys Asn Thr Gly 625 630 635 640 Ala Lys Lys Arg Lys Ile Asp Asp Ala 645 <210> 58 <211> 760 <212> PRT <213> Homo sapiens <400> 58 Met Lys Leu Asn Val Asp Gly Leu Leu Val Tyr Phe Pro Tyr Asp Tyr 1 5 10 15 Ile Tyr Pro Glu Gln Phe Ser Tyr Met Arg Glu Leu Lys Arg Thr Leu 20 25 30 Asp Ala Lys Gly His Gly Val Leu Glu Met Pro Ser Gly Thr Gly Lys 35 40 45 Thr Val Ser Leu Leu Ala Leu Ile Met Ala Tyr Gln Arg Ala Tyr Pro 50 55 60 Leu Glu Val Thr Lys Leu Ile Tyr Cys Ser Arg Thr Val Pro Glu Ile 65 70 75 80 Glu Lys Val Ile Glu Glu Leu Arg Lys Leu Leu Asn Phe Tyr Glu Lys 85 90 95 Gln Glu Gly Glu Lys Leu Pro Phe Leu Gly Leu Ala Leu Ser Ser Arg 100 105 110 Lys Asn Leu Cys Ile His Pro Glu Val Thr Pro Leu Arg Phe Gly Lys 115 120 125 Asp Val Asp Gly Lys Cys His Ser Leu Thr Ala Ser Tyr Val Arg Ala 130 135 140 Gln Tyr Gln His Asp Thr Ser Leu Pro His Cys Arg Phe Tyr Glu Glu 145 150 155 160 Phe Asp Ala His Gly Arg Glu Val Pro Leu Pro Ala Gly Ile Tyr Asn 165 170 175 Leu Asp Asp Leu Lys Ala Leu Gly Arg Arg Gln Gly Trp Cys Pro Tyr 180 185 190 Phe Leu Ala Arg Tyr Ser Ile Leu His Ala Asn Val Val Val Tyr Ser 195 200 205 Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Asp Leu Val Ser Lys Glu 210 215 220 Leu Ala Arg Lys Ala Val Val Val Phe Asp Glu Ala His Asn Ile Asp 225 230 235 240 Asn Val Cys Ile Asp Ser Met Ser Val Asn Leu Thr Arg Arg Thr Leu 245 250 255 Asp Arg Cys Gln Gly Asn Leu Glu Thr Leu Gln Lys Thr Val Leu Arg 260 265 270 Ile Lys Glu Thr Asp Glu Gln Arg Leu Arg Asp Glu Tyr Arg Arg Leu 275 280 285 Val Glu Gly Leu Arg Glu Ala Ser Ala Ala Arg Glu Thr Asp Ala His 290 295 300 Leu Ala Asn Pro Val Leu Pro Asp Glu Val Leu Gln Glu Ala Val Pro 305 310 315 320 Gly Ser Ile Arg Thr Ala Glu His Phe Leu Gly Phe Leu Arg Arg Leu 325 330 335 Leu Glu Tyr Val Lys Trp Arg Leu Arg Val Gln His Val Val Gln Glu 340 345 350 Ser Pro Pro Ala Phe Leu Ser Gly Leu Ala Gln Arg Val Cys Ile Gln 355 360 365 Arg Lys Pro Leu Arg Phe Cys Ala Glu Arg Leu Arg Ser Leu Leu His 370 375 380 Thr Leu Glu Ile Thr Asp Leu Ala Asp Phe Ser Pro Leu Thr Leu Leu 385 390 395 400 Ala Asn Phe Ala Thr Leu Val Ser Thr Tyr Ala Lys Gly Phe Thr Ile 405 410 415 Ile Ile Glu Pro Phe Asp Asp Arg Thr Pro Thr Ile Ala Asn Pro Ile 420 425 430 Leu His Phe Ser Cys Met Asp Ala Ser Leu Ala Ile Lys Pro Val Phe 435 440 445 Glu Arg Phe Gln Ser Val Ile Ile Thr Ser Gly Thr Leu Ser Pro Leu 450 455 460 Asp Ile Tyr Pro Lys Ile Leu Asp Phe His Pro Val Thr Met Ala Thr 465 470 475 480 Phe Thr Met Thr Leu Ala Arg Val Cys Leu Cys Pro Met Ile Ile Gly 485 490 495 Arg Gly Asn Asp Gln Val Ala Ile Ser Ser Lys Phe Glu Thr Arg Glu 500 505 510 Asp Ile Ala Val Ile Arg Asn Tyr Gly Asn Leu Leu Leu Glu Met Ser 515 520 525 Ala Val Val Pro Asp Gly Ile Val Ala Phe Phe Thr Ser Tyr Gln Tyr 530 535 540 Met Glu Ser Thr Val Ala Ser Trp Tyr Glu Gln Gly Ile Leu Glu Asn 545 550 555 560 Ile Gln Arg Asn Lys Leu Leu Phe Ile Glu Thr Gln Asp Gly Ala Glu 565 570 575 Thr Ser Val Ala Leu Glu Lys Tyr Gln Glu Ala Cys Glu Asn Gly Arg 580 585 590 Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu Gly Ile 595 600 605 Asp Phe Val His His Tyr Gly Arg Ala Val Ile Met Phe Gly Val Pro 610 615 620 Tyr Val Tyr Thr Gln Ser Arg Ile Leu Lys Ala Arg Leu Glu Tyr Leu 625 630 635 640 Arg Asp Gln Phe Gln Ile Arg Glu Asn Asp Phe Leu Thr Phe Asp Ala 645 650 655 Met Arg His Ala Ala Gln Cys Val Gly Arg Ala Ile Arg Gly Lys Thr 660 665 670 Asp Tyr Gly Leu Met Val Phe Ala Asp Lys Arg Phe Ala Arg Gly Asp 675 680 685 Lys Arg Gly Lys Leu Pro Arg Trp Ile Gln Glu His Leu Thr Asp Ala 690 695 700 Asn Leu Asn Leu Thr Val Asp Glu Gly Val Gln Val Ala Lys Tyr Phe 705 710 715 720 Leu Arg Gln Met Ala Gln Pro Phe His Arg Glu Asp Gln Leu Gly Leu 725 730 735 Ser Leu Leu Ser Leu Glu Gln Leu Glu Ser Glu Glu Thr Leu Lys Arg 740 745 750 Ile Glu Gln Ile Ala Gln Gln Leu 755 760 <210> 59 <211> 782 <212> PRT <213> Homo sapiens <400> 59 Met Gly Lys Arg Asp Arg Ala Asp Arg Asp Lys Lys Lys Ser Arg Lys 1 5 10 15 Arg His Tyr Glu Asp Glu Glu Asp Asp Glu Glu Asp Ala Pro Gly Asn 20 25 30 Asp Pro Gln Glu Ala Val Pro Ser Ala Ala Gly Lys Gln Val Asp Glu 35 40 45 Ser Gly Thr Lys Val Asp Glu Tyr Gly Ala Lys Asp Tyr Arg Leu Gln 50 55 60 Met Pro Leu Lys Asp Asp His Thr Ser Arg Pro Leu Trp Val Ala Pro 65 70 75 80 Asp Gly His Ile Phe Leu Glu Ala Phe Ser Pro Val Tyr Lys Tyr Ala 85 90 95 Gln Asp Phe Leu Val Ala Ile Ala Glu Pro Val Cys Arg Pro Thr His 100 105 110 Val His Glu Tyr Lys Leu Thr Ala Tyr Ser Leu Tyr Ala Ala Val Ser 115 120 125 Val Gly Leu Gln Thr Ser Asp Ile Thr Glu Tyr Leu Arg Lys Leu Ser 130 135 140 Lys Thr Gly Val Pro Asp Gly Ile Met Gln Phe Ile Lys Leu Cys Thr 145 150 155 160 Val Ser Tyr Gly Lys Val Lys Leu Val Leu Lys His Asn Arg Tyr Phe 165 170 175 Val Glu Ser Cys His Pro Asp Val Ile Gln His Leu Leu Gln Asp Pro 180 185 190 Val Ile Arg Glu Cys Arg Leu Arg Asn Ser Glu Gly Glu Ala Thr Glu 195 200 205 Leu Ile Thr Glu Thr Phe Thr Ser Lys Ser Ala Ile Ser Lys Thr Ala 210 215 220 Glu Ser Ser Gly Gly Pro Ser Thr Ser Arg Val Thr Asp Pro Gln Gly 225 230 235 240 Lys Ser Asp Ile Pro Met Asp Leu Phe Asp Phe Tyr Glu Gln Met Asp 245 250 255 Lys Asp Glu Glu Glu Glu Glu Glu Thr Gln Thr Val Ser Phe Glu Val 260 265 270 Lys Gln Glu Met Ile Glu Glu Leu Gln Lys Arg Cys Ile His Leu Glu 275 280 285 Tyr Pro Leu Leu Ala Glu Tyr Asp Phe Arg Asn Asp Ser Val Asn Pro 290 295 300 Asp Ile Asn Ile Asp Leu Lys Pro Thr Ala Val Leu Arg Pro Tyr Gln 305 310 315 320 Glu Lys Ser Leu Arg Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly 325 330 335 Val Ile Val Leu Pro Cys Gly Ala Gly Lys Ser Leu Val Gly Val Thr 340 345 350 Ala Ala Cys Thr Val Arg Lys Arg Cys Leu Val Leu Gly Asn Ser Ala 355 360 365 Val Ser Val Glu Gln Trp Lys Ala Gln Phe Lys Met Trp Ser Thr Ile 370 375 380 Asp Asp Ser Gln Ile Cys Arg Phe Thr Ser Asp Ala Lys Asp Lys Pro 385 390 395 400 Ile Gly Cys Ser Val Ala Ile Ser Thr Tyr Ser Met Leu Gly His Thr 405 410 415 Thr Lys Arg Ser Trp Glu Ala Glu Arg Val Met Glu Trp Leu Lys Thr 420 425 430 Gln Glu Trp Gly Leu Met Ile Leu Asp Glu Val His Thr Ile Pro Ala 435 440 445 Lys Met Phe Arg Arg Val Leu Thr Ile Val Gln Ala His Cys Lys Leu 450 455 460 Gly Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Val Asp Leu 465 470 475 480 Asn Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu 485 490 495 Gln Asn Asn Gly Tyr Ile Ala Lys Val Gln Cys Ala Glu Val Trp Cys 500 505 510 Pro Met Ser Pro Glu Phe Tyr Arg Glu Tyr Val Ala Ile Lys Thr Lys 515 520 525 Lys Arg Ile Leu Leu Tyr Thr Met Asn Pro Asn Lys Phe Arg Ala Cys 530 535 540 Gln Phe Leu Ile Lys Phe His Glu Arg Arg Asn Asp Lys Ile Ile Val 545 550 555 560 Phe Ala Asp Asn Val Phe Ala Leu Lys Glu Tyr Ala Ile Arg Leu Asn 565 570 575 Lys Pro Tyr Ile Tyr Gly Pro Thr Ser Gln Gly Glu Arg Met Gln Ile 580 585 590 Leu Gln Asn Phe Lys His Asn Pro Lys Ile Asn Thr Ile Phe Ile Ser 595 600 605 Lys Val Gly Asp Thr Ser Phe Asp Leu Pro Glu Ala Asn Val Leu Ile 610 615 620 Gln Ile Ser Ser His Gly Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu 625 630 635 640 Gly Arg Val Leu Arg Ala Lys Lys Gly Met Val Ala Glu Glu Tyr Asn 645 650 655 Ala Phe Phe Tyr Ser Leu Val Ser Gln Asp Thr Gln Glu Met Ala Tyr 660 665 670 Ser Thr Lys Arg Gln Arg Phe Leu Val Asp Gln Gly Tyr Ser Phe Lys 675 680 685 Val Ile Thr Lys Leu Ala Gly Met Glu Glu Glu Asp Leu Ala Phe Ser 690 695 700 Thr Lys Glu Glu Gln Gln Gln Leu Leu Gln Lys Val Leu Ala Ala Thr 705 710 715 720 Asp Leu Asp Ala Glu Glu Glu Val Val Ala Gly Glu Phe Gly Ser Arg 725 730 735 Ser Ser Gln Ala Ser Arg Arg Phe Gly Thr Met Ser Ser Met Ser Gly 740 745 750 Ala Asp Asp Thr Val Tyr Met Glu Tyr His Ser Ser Arg Ser Lys Ala 755 760 765 Pro Ser Lys His Val His Pro Leu Phe Lys Arg Phe Arg Lys 770 775 780 <210> 60 <211> 1432 <212> PRT <213> Homo sapiens <400> 60 Met Ser Glu Lys Lys Leu Glu Thr Thr Ala Gln Gln Arg Lys Cys Pro 1 5 10 15 Glu Trp Met Asn Val Gln Asn Lys Arg Cys Ala Val Glu Glu Arg Lys 20 25 30 Ala Cys Val Arg Lys Ser Val Phe Glu Asp Asp Leu Pro Phe Leu Glu 35 40 45 Phe Thr Gly Ser Ile Val Tyr Ser Tyr Asp Ala Ser Asp Cys Ser Phe 50 55 60 Leu Ser Glu Asp Ile Ser Met Ser Leu Ser Asp Gly Asp Val Val Gly 65 70 75 80 Phe Asp Met Glu Trp Pro Pro Leu Tyr Asn Arg Gly Lys Leu Gly Lys 85 90 95 Val Ala Leu Ile Gln Leu Cys Val Ser Glu Ser Lys Cys Tyr Leu Phe 100 105 110 His Val Ser Ser Met Ser Val Phe Pro Gln Gly Leu Lys Met Leu Leu 115 120 125 Glu Asn Lys Ala Val Lys Lys Ala Gly Val Gly Ile Glu Gly Asp Gln 130 135 140 Trp Lys Leu Leu Arg Asp Phe Asp Ile Lys Leu Lys Asn Phe Val Glu 145 150 155 160 Leu Thr Asp Val Ala Asn Lys Lys Leu Lys Cys Thr Glu Thr Trp Ser 165 170 175 Leu Asn Ser Leu Val Lys His Leu Leu Gly Lys Gln Leu Leu Lys Asp 180 185 190 Lys Ser Ile Arg Cys Ser Asn Trp Ser Lys Phe Pro Leu Thr Glu Asp 195 200 205 Gln Lys Leu Tyr Ala Ala Thr Asp Ala Tyr Ala Gly Phe Ile Ile Tyr 210 215 220 Arg Asn Leu Glu Ile Leu Asp Asp Thr Val Gln Arg Phe Ala Ile Asn 225 230 235 240 Lys Glu Glu Glu Ile Leu Leu Ser Asp Met Asn Lys Gln Leu Thr Ser 245 250 255 Ile Ser Glu Glu Val Met Asp Leu Ala Lys His Leu Pro His Ala Phe 260 265 270 Ser Lys Leu Glu Asn Pro Arg Arg Val Ser Ile Leu Leu Lys Asp Ile 275 280 285 Ser Glu Asn Leu Tyr Ser Leu Arg Arg Met Ile Ile Gly Ser Thr Asn 290 295 300 Ile Glu Thr Glu Leu Arg Pro Ser Asn Asn Leu Asn Leu Leu Ser Phe 305 310 315 320 Glu Asp Ser Thr Thr Gly Gly Val Gln Gln Lys Gln Ile Arg Glu His 325 330 335 Glu Val Leu Ile His Val Glu Asp Glu Thr Trp Asp Pro Thr Leu Asp 340 345 350 His Leu Ala Lys His Asp Gly Glu Asp Val Leu Gly Asn Lys Val Glu 355 360 365 Arg Lys Glu Asp Gly Phe Glu Asp Gly Val Glu Asp Asn Lys Leu Lys 370 375 380 Glu Asn Met Glu Arg Ala Cys Leu Met Ser Leu Asp Ile Thr Glu His 385 390 395 400 Glu Leu Gln Ile Leu Glu Gln Gln Ser Gln Glu Glu Tyr Leu Ser Asp 405 410 415 Ile Ala Tyr Lys Ser Thr Glu His Leu Ser Pro Asn Asp Asn Glu Asn 420 425 430 Asp Thr Ser Tyr Val Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met 435 440 445 Leu Lys His Leu Ser Pro Asn Asp Asn Glu Asn Asp Thr Ser Tyr Val 450 455 460 Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met Leu Lys Ser Leu Glu 465 470 475 480 Asn Leu Asn Ser Gly Thr Val Glu Pro Thr His Ser Lys Cys Leu Lys 485 490 495 Met Glu Arg Asn Leu Gly Leu Pro Thr Lys Glu Glu Glu Glu Asp Asp 500 505 510 Glu Asn Glu Ala Asn Glu Gly Glu Glu Asp Asp Asp Lys Asp Phe Leu 515 520 525 Trp Pro Ala Pro Asn Glu Glu Gln Val Thr Cys Leu Lys Met Tyr Phe 530 535 540 Gly His Ser Ser Phe Lys Pro Val Gln Trp Lys Val Ile His Ser Val 545 550 555 560 Leu Glu Glu Arg Arg Asp Asn Val Ala Val Met Ala Thr Gly Tyr Gly 565 570 575 Lys Ser Leu Cys Phe Gln Tyr Pro Pro Val Tyr Val Gly Lys Ile Gly 580 585 590 Leu Val Ile Ser Pro Leu Ile Ser Leu Met Glu Asp Gln Val Leu Gln 595 600 605 Leu Lys Met Ser Asn Ile Pro Ala Cys Phe Leu Gly Ser Ala Gln Ser 610 615 620 Glu Asn Val Leu Thr Asp Ile Lys Leu Gly Lys Tyr Arg Ile Val Tyr 625 630 635 640 Val Thr Pro Glu Tyr Cys Ser Gly Asn Met Gly Leu Leu Gln Gln Leu 645 650 655 Glu Ala Asp Ile Gly Ile Thr Leu Ile Ala Val Asp Glu Ala His Cys 660 665 670 Ile Ser Glu Trp Gly His Asp Phe Arg Asp Ser Phe Arg Lys Leu Gly 675 680 685 Ser Leu Lys Thr Ala Leu Pro Met Val Pro Ile Val Ala Leu Thr Ala 690 695 700 Thr Ala Ser Ser Ser Ile Arg Glu Asp Ile Val Arg Cys Leu Asn Leu 705 710 715 720 Arg Asn Pro Gln Ile Thr Cys Thr Gly Phe Asp Arg Pro Asn Leu Tyr 725 730 735 Leu Glu Val Arg Arg Lys Thr Gly Asn Ile Leu Gln Asp Leu Gln Pro 740 745 750 Phe Leu Val Lys Thr Ser Ser His Trp Glu Phe Glu Gly Pro Thr Ile 755 760 765 Ile Tyr Cys Pro Ser Arg Lys Met Thr Gln Gln Val Thr Gly Glu Leu 770 775 780 Arg Lys Leu Asn Leu Ser Cys Gly Thr Tyr His Ala Gly Met Ser Phe 785 790 795 800 Ser Thr Arg Lys Asp Ile His His Arg Phe Val Arg Asp Glu Ile Gln 805 810 815 Cys Val Ile Ala Thr Ile Ala Phe Gly Met Gly Ile Asn Lys Ala Asp 820 825 830 Ile Arg Gln Val Ile His Tyr Gly Ala Pro Lys Asp Met Glu Ser Tyr 835 840 845 Tyr Gln Glu Ile Gly Arg Ala Gly Arg Asp Gly Leu Gln Ser Ser Cys 850 855 860 His Val Leu Trp Ala Pro Ala Asp Ile Asn Leu Asn Arg His Leu Leu 865 870 875 880 Thr Glu Ile Arg Asn Glu Lys Phe Arg Leu Tyr Lys Leu Lys Met Met 885 890 895 Ala Lys Met Glu Lys Tyr Leu His Ser Ser Arg Cys Arg Arg Gln Ile 900 905 910 Ile Leu Ser His Phe Glu Asp Lys Gln Val Gln Lys Ala Ser Leu Gly 915 920 925 Ile Met Gly Thr Glu Lys Cys Cys Asp Asn Cys Arg Ser Arg Leu Asp 930 935 940 His Cys Tyr Ser Met Asp Asp Ser Glu Asp Thr Ser Trp Asp Phe Gly 945 950 955 960 Pro Gln Ala Phe Lys Leu Leu Ser Ala Val Asp Ile Leu Gly Glu Lys 965 970 975 Phe Gly Ile Gly Leu Pro Ile Leu Phe Leu Arg Gly Ser Asn Ser Gln 980 985 990 Arg Leu Ala Asp Gln Tyr Arg Arg His Ser Leu Phe Gly Thr Gly Lys 995 1000 1005 Asp Gln Thr Glu Ser Trp Trp Lys Ala Phe Ser Arg Gln Leu Ile 1010 1015 1020 Thr Glu Gly Phe Leu Val Glu Val Ser Arg Tyr Asn Lys Phe Met 1025 1030 1035 Lys Ile Cys Ala Leu Thr Lys Lys Gly Arg Asn Trp Leu His Lys 1040 1045 1050 Ala Asn Thr Glu Ser Gln Ser Leu Ile Leu Gln Ala Asn Glu Glu 1055 1060 1065 Leu Cys Pro Lys Lys Leu Leu Leu Pro Ser Ser Lys Thr Val Ser 1070 1075 1080 Ser Gly Thr Lys Glu His Cys Tyr Asn Gln Val Pro Val Glu Leu 1085 1090 1095 Ser Thr Glu Lys Lys Ser Asn Leu Glu Lys Leu Tyr Ser Tyr Lys 1100 1105 1110 Pro Cys Asp Lys Ile Ser Ser Gly Ser Asn Ile Ser Lys Lys Ser 1115 1120 1125 Ile Met Val Gln Ser Pro Glu Lys Ala Tyr Ser Ser Ser Gln Pro 1130 1135 1140 Val Ile Ser Ala Gln Glu Gln Glu Thr Gln Ile Val Leu Tyr Gly 1145 1150 1155 Lys Leu Val Glu Ala Arg Gln Lys His Ala Asn Lys Met Asp Val 1160 1165 1170 Pro Pro Ala Ile Leu Ala Thr Asn Lys Ile Leu Val Asp Met Ala 1175 1180 1185 Lys Met Arg Pro Thr Thr Val Glu Asn Val Lys Arg Ile Asp Gly 1190 1195 1200 Val Ser Glu Gly Lys Ala Ala Met Leu Ala Pro Leu Leu Glu Val 1205 1210 1215 Ile Lys His Phe Cys Gln Thr Asn Ser Val Gln Thr Asp Leu Phe 1220 1225 1230 Ser Ser Thr Lys Pro Gln Glu Glu Gln Lys Thr Ser Leu Val Ala 1235 1240 1245 Lys Asn Lys Ile Cys Thr Leu Ser Gln Ser Met Ala Ile Thr Tyr 1250 1255 1260 Ser Leu Phe Gln Glu Lys Lys Met Pro Leu Lys Ser Ile Ala Glu 1265 1270 1275 Ser Arg Ile Leu Pro Leu Met Thr Ile Gly Met His Leu Ser Gln 1280 1285 1290 Ala Val Lys Ala Gly Cys Pro Leu Asp Leu Glu Arg Ala Gly Leu 1295 1300 1305 Thr Pro Glu Val Gln Lys Ile Ile Ala Asp Val Ile Arg Asn Pro 1310 1315 1320 Pro Val Asn Ser Asp Met Ser Lys Ile Ser Leu Ile Arg Met Leu 1325 1330 1335 Val Pro Glu Asn Ile Asp Thr Tyr Leu Ile His Met Ala Ile Glu 1340 1345 1350 Ile Leu Lys His Gly Pro Asp Ser Gly Leu Gln Pro Ser Cys Asp 1355 1360 1365 Val Asn Lys Arg Arg Cys Phe Pro Gly Ser Glu Glu Ile Cys Ser 1370 1375 1380 Ser Ser Lys Arg Ser Lys Glu Glu Val Gly Ile Asn Thr Glu Thr 1385 1390 1395 Ser Ser Ala Glu Arg Lys Arg Arg Leu Pro Val Trp Phe Ala Lys 1400 1405 1410 Gly Ser Asp Thr Ser Lys Lys Leu Met Asp Lys Thr Lys Arg Gly 1415 1420 1425 Gly Leu Phe Ser 1430 <210> 61 <211> 991 <212> PRT <213> Homo sapiens <400> 61 Met Ser Ser His His Thr Thr Phe Pro Phe Asp Pro Glu Arg Arg Val 1 5 10 15 Arg Ser Thr Leu Lys Lys Val Phe Gly Phe Asp Ser Phe Lys Thr Pro 20 25 30 Leu Gln Glu Ser Ala Thr Met Ala Val Val Lys Gly Asn Lys Asp Val 35 40 45 Phe Val Cys Met Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr Gln Leu 50 55 60 Pro Ala Leu Leu Ala Lys Gly Ile Thr Ile Val Val Ser Pro Leu Ile 65 70 75 80 Ala Leu Ile Gln Asp Gln Val Asp His Leu Leu Thr Leu Lys Val Arg 85 90 95 Val Ser Ser Leu Asn Ser Lys Leu Ser Ala Gln Glu Arg Lys Glu Leu 100 105 110 Leu Ala Asp Leu Glu Arg Glu Lys Pro Gln Thr Lys Ile Leu Tyr Ile 115 120 125 Thr Pro Glu Met Ala Ala Ser Ser Ser Phe Gln Pro Thr Leu Asn Ser 130 135 140 Leu Val Ser Arg His Leu Leu Ser Tyr Leu Val Val Asp Glu Ala His 145 150 155 160 Cys Val Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Leu Arg Leu 165 170 175 Gly Ala Leu Arg Ser Arg Leu Gly His Ala Pro Cys Val Ala Leu Thr 180 185 190 Ala Thr Ala Thr Pro Gln Val Gln Glu Asp Val Phe Ala Ala Leu His 195 200 205 Leu Lys Lys Pro Val Ala Ile Phe Lys Thr Pro Cys Phe Arg Ala Asn 210 215 220 Leu Phe Tyr Asp Val Gln Phe Lys Glu Leu Ile Ser Asp Pro Tyr Gly 225 230 235 240 Asn Leu Lys Asp Phe Cys Leu Lys Ala Leu Gly Gln Glu Ala Asp Lys 245 250 255 Gly Leu Ser Gly Cys Gly Ile Val Tyr Cys Arg Thr Arg Glu Ala Cys 260 265 270 Glu Gln Leu Ala Ile Glu Leu Ser Cys Arg Gly Val Asn Ala Lys Ala 275 280 285 Tyr His Ala Gly Leu Lys Ala Ser Glu Arg Thr Leu Val Gln Asn Asp 290 295 300 Trp Met Glu Glu Lys Val Pro Val Ile Val Ala Thr Ile Ser Phe Gly 305 310 315 320 Met Gly Val Asp Lys Ala Asn Val Arg Phe Val Ala His Trp Asn Ile 325 330 335 Ala Lys Ser Met Ala Gly Tyr Tyr Gln Glu Ser Gly Arg Ala Gly Arg 340 345 350 Asp Gly Lys Pro Ser Trp Cys Arg Leu Tyr Tyr Ser Arg Asn Asp Arg 355 360 365 Asp Gln Val Ser Phe Leu Ile Arg Lys Glu Val Ala Lys Leu Gln Glu 370 375 380 Lys Arg Gly Asn Lys Ala Ser Asp Lys Ala Thr Ile Met Ala Phe Asp 385 390 395 400 Ala Leu Val Thr Phe Cys Glu Glu Leu Gly Cys Arg His Ala Ala Ile 405 410 415 Ala Lys Tyr Phe Gly Asp Ala Leu Pro Ala Cys Ala Lys Gly Cys Asp 420 425 430 His Cys Gln Asn Pro Thr Ala Val Arg Arg Arg Leu Glu Ala Leu Glu 435 440 445 Arg Ser Ser Ser Trp Ser Lys Thr Cys Ile Gly Pro Ser Gln Gly Asn 450 455 460 Gly Phe Asp Pro Glu Leu Tyr Glu Gly Gly Arg Lys Gly Tyr Gly Asp 465 470 475 480 Phe Ser Arg Tyr Asp Glu Gly Ser Gly Gly Ser Gly Asp Glu Gly Arg 485 490 495 Asp Glu Ala His Lys Arg Glu Trp Asn Leu Phe Tyr Gln Lys Gln Met 500 505 510 Gln Leu Arg Lys Gly Lys Asp Pro Lys Ile Glu Glu Phe Val Pro Pro 515 520 525 Asp Glu Asn Cys Pro Leu Lys Glu Ala Ser Ser Arg Arg Ile Pro Arg 530 535 540 Leu Thr Val Lys Ala Arg Glu His Cys Leu Arg Leu Leu Glu Glu Ala 545 550 555 560 Leu Ser Ser Asn Arg Gln Ser Thr Arg Thr Ala Asp Glu Ala Asp Leu 565 570 575 Arg Ala Lys Ala Val Glu Leu Glu His Glu Thr Phe Arg Asn Ala Lys 580 585 590 Val Ala Asn Leu Tyr Lys Ala Ser Val Leu Lys Lys Val Ala Asp Ile 595 600 605 His Arg Ala Ser Lys Asp Gly Gln Pro Tyr Asp Met Gly Gly Ser Ala 610 615 620 Lys Ser Cys Ser Ala Gln Ala Glu Pro Pro Glu Pro Asn Glu Tyr Asp 625 630 635 640 Ile Pro Pro Ala Ser His Val Tyr Ser Leu Lys Pro Lys Arg Val Gly 645 650 655 Ala Gly Phe Pro Lys Gly Ser Cys Pro Phe Gln Thr Ala Thr Glu Leu 660 665 670 Met Glu Thr Thr Arg Ile Arg Glu Gln Ala Pro Gln Pro Glu Arg Gly 675 680 685 Gly Glu His Glu Pro Pro Ser Arg Pro Cys Gly Leu Leu Asp Glu Asp 690 695 700 Gly Ser Glu Pro Leu Pro Gly Pro Arg Gly Glu Val Pro Gly Gly Ser 705 710 715 720 Ala His Tyr Gly Gly Pro Ser Pro Glu Lys Lys Ala Lys Ser Ser Ser 725 730 735 Gly Gly Ser Ser Leu Ala Lys Gly Arg Ala Ser Lys Lys Gln Gln Leu 740 745 750 Leu Ala Thr Ala Ala His Lys Asp Ser Gln Ser Ile Ala Arg Phe Phe 755 760 765 Cys Arg Arg Val Glu Ser Pro Ala Leu Leu Ala Ser Ala Pro Glu Ala 770 775 780 Glu Gly Ala Cys Pro Ser Cys Glu Gly Val Gln Gly Pro Pro Met Ala 785 790 795 800 Pro Glu Lys Tyr Thr Gly Glu Glu Asp Gly Ala Gly Gly His Ser Pro 805 810 815 Ala Pro Pro Gln Thr Glu Glu Cys Leu Arg Glu Arg Pro Ser Thr Cys 820 825 830 Pro Pro Arg Asp Gln Gly Thr Pro Glu Val Gln Pro Thr Pro Ala Lys 835 840 845 Asp Thr Trp Lys Gly Lys Arg Pro Arg Ser Gln Gln Glu Asn Pro Glu 850 855 860 Ser Gln Pro Gln Lys Arg Pro Arg Pro Ser Ala Lys Pro Ser Val Val 865 870 875 880 Ala Glu Val Lys Gly Ser Val Ser Ala Ser Glu Gln Gly Thr Leu Asn 885 890 895 Pro Thr Ala Gln Asp Pro Phe Gln Leu Ser Ala Pro Gly Val Ser Leu 900 905 910 Lys Glu Ala Ala Asn Val Val Val Lys Cys Leu Thr Pro Phe Tyr Lys 915 920 925 Glu Gly Lys Phe Ala Ser Lys Glu Leu Phe Lys Gly Phe Ala Arg His 930 935 940 Leu Ser His Leu Leu Thr Gln Lys Thr Ser Pro Gly Arg Ser Val Lys 945 950 955 960 Glu Glu Ala Gln Asn Leu Ile Arg His Phe Phe His Gly Arg Ala Arg 965 970 975 Cys Glu Ser Glu Ala Asp Trp His Gly Leu Cys Gly Pro Gln Arg 980 985 990 <210> 62 <211> 1208 <212> PRT <213> Homo sapiens <400> 62 Met Glu Arg Leu Arg Asp Val Arg Glu Arg Leu Gln Ala Trp Glu Arg 1 5 10 15 Ala Phe Arg Arg Gln Arg Gly Arg Arg Pro Ser Gln Asp Asp Val Glu 20 25 30 Ala Ala Pro Glu Glu Thr Arg Ala Leu Tyr Arg Glu Tyr Arg Thr Leu 35 40 45 Lys Arg Thr Thr Gly Gln Ala Gly Gly Gly Leu Arg Ser Ser Glu Ser 50 55 60 Leu Pro Ala Ala Ala Glu Glu Ala Pro Glu Pro Arg Cys Trp Gly Pro 65 70 75 80 His Leu Asn Arg Ala Ala Thr Lys Ser Pro Gln Ser Thr Pro Gly Arg 85 90 95 Ser Arg Gln Gly Ser Val Pro Asp Tyr Gly Gln Arg Leu Lys Ala Asn 100 105 110 Leu Lys Gly Thr Leu Gln Ala Gly Pro Ala Leu Gly Arg Arg Pro Trp 115 120 125 Pro Leu Gly Arg Ala Ser Ser Lys Ala Ser Thr Pro Lys Pro Pro Gly 130 135 140 Thr Gly Pro Val Pro Ser Phe Ala Glu Lys Val Ser Asp Glu Pro Pro 145 150 155 160 Gln Leu Pro Glu Pro Gln Pro Arg Pro Gly Arg Leu Gln His Leu Gln 165 170 175 Ala Ser Leu Ser Gln Arg Leu Gly Ser Leu Asp Pro Gly Trp Leu Gln 180 185 190 Arg Cys His Ser Glu Val Pro Asp Phe Leu Gly Ala Pro Lys Ala Cys 195 200 205 Arg Pro Asp Leu Gly Ser Glu Glu Ser Gln Leu Leu Ile Pro Gly Glu 210 215 220 Ser Ala Val Leu Gly Pro Gly Ala Gly Ser Gln Gly Pro Glu Ala Ser 225 230 235 240 Ala Phe Gln Glu Val Ser Ile Arg Val Gly Ser Pro Gln Pro Ser Ser 245 250 255 Ser Gly Gly Glu Lys Arg Arg Trp Asn Glu Glu Pro Trp Glu Ser Pro 260 265 270 Ala Gln Val Gln Gln Glu Ser Ser Gln Ala Gly Pro Pro Ser Glu Gly 275 280 285 Ala Gly Ala Val Ala Val Glu Glu Asp Pro Pro Gly Glu Pro Val Gln 290 295 300 Ala Gln Pro Pro Gln Pro Cys Ser Ser Pro Ser Asn Pro Arg Tyr His 305 310 315 320 Gly Leu Ser Pro Ser Ser Gln Ala Arg Ala Gly Lys Ala Glu Gly Thr 325 330 335 Ala Pro Leu His Ile Phe Pro Arg Leu Ala Arg His Asp Arg Gly Asn 340 345 350 Tyr Val Arg Leu Asn Met Lys Gln Lys His Tyr Val Arg Gly Arg Ala 355 360 365 Leu Arg Ser Arg Leu Leu Arg Lys Gln Ala Trp Lys Gln Lys Trp Arg 370 375 380 Lys Lys Gly Glu Cys Phe Gly Gly Gly Gly Ala Thr Val Thr Thr Lys 385 390 395 400 Glu Ser Cys Phe Leu Asn Glu Gln Phe Asp His Trp Ala Ala Gln Cys 405 410 415 Pro Arg Pro Ala Ser Glu Glu Asp Thr Asp Ala Val Gly Pro Glu Pro 420 425 430 Leu Val Pro Ser Pro Gln Pro Val Pro Glu Val Pro Ser Leu Asp Pro 435 440 445 Thr Val Leu Pro Leu Tyr Ser Leu Gly Pro Ser Gly Gln Leu Ala Glu 450 455 460 Thr Pro Ala Glu Val Phe Gln Ala Leu Glu Gln Leu Gly His Gln Ala 465 470 475 480 Phe Arg Pro Gly Gln Glu Arg Ala Val Met Arg Ile Leu Ser Gly Ile 485 490 495 Ser Thr Leu Leu Val Leu Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr 500 505 510 Gln Leu Pro Ala Leu Leu Tyr Ser Arg Arg Ser Pro Cys Leu Thr Leu 515 520 525 Val Val Ser Pro Leu Leu Ser Leu Met Asp Asp Gln Val Ser Gly Leu 530 535 540 Pro Pro Cys Leu Lys Ala Ala Cys Ile His Ser Gly Met Thr Arg Lys 545 550 555 560 Gln Arg Glu Ser Val Leu Gln Lys Ile Arg Ala Ala Gln Val His Val 565 570 575 Leu Met Leu Thr Pro Glu Ala Leu Val Gly Ala Gly Gly Leu Pro Pro 580 585 590 Ala Ala Gln Leu Pro Pro Val Ala Phe Ala Cys Ile Asp Glu Ala His 595 600 605 Cys Leu Ser Gln Trp Ser His Asn Phe Arg Pro Cys Tyr Leu Arg Val 610 615 620 Cys Lys Val Leu Arg Glu Arg Met Gly Val His Cys Phe Leu Gly Leu 625 630 635 640 Thr Ala Thr Ala Thr Arg Arg Thr Ala Ser Asp Val Ala Gln His Leu 645 650 655 Ala Val Ala Glu Glu Pro Asp Leu His Gly Pro Ala Pro Val Pro Thr 660 665 670 Asn Leu His Leu Ser Val Ser Met Asp Arg Asp Thr Asp Gln Ala Leu 675 680 685 Leu Thr Leu Leu Gln Gly Lys Arg Phe Gln Asn Leu Asp Ser Ile Ile 690 695 700 Ile Tyr Cys Asn Arg Arg Glu Asp Thr Glu Arg Ile Ala Ala Leu Leu 705 710 715 720 Arg Thr Cys Leu His Ala Ala Trp Val Pro Gly Ser Gly Gly Arg Ala 725 730 735 Pro Lys Thr Thr Ala Glu Ala Tyr His Ala Gly Met Cys Ser Arg Glu 740 745 750 Arg Arg Arg Val Gln Arg Ala Phe Met Gln Gly Gln Leu Arg Val Val 755 760 765 Val Ala Thr Val Ala Phe Gly Met Gly Leu Asp Arg Pro Asp Val Arg 770 775 780 Ala Val Leu His Leu Gly Leu Pro Pro Ser Phe Glu Ser Tyr Val Gln 785 790 795 800 Ala Val Gly Arg Ala Gly Arg Asp Gly Gln Pro Ala His Cys His Leu 805 810 815 Phe Leu Gln Pro Gln Gly Glu Asp Leu Arg Glu Leu Arg Arg His Val 820 825 830 His Ala Asp Ser Thr Asp Phe Leu Ala Val Lys Arg Leu Val Gln Arg 835 840 845 Val Phe Pro Ala Cys Thr Cys Thr Cys Thr Arg Pro Pro Ser Glu Gln 850 855 860 Glu Gly Ala Val Gly Gly Glu Arg Pro Val Pro Lys Tyr Pro Pro Gln 865 870 875 880 Glu Ala Glu Gln Leu Ser His Gln Ala Ala Pro Gly Pro Arg Arg Val 885 890 895 Cys Met Gly His Glu Arg Ala Leu Pro Ile Gln Leu Thr Val Gln Ala 900 905 910 Leu Asp Met Pro Glu Glu Ala Ile Glu Thr Leu Leu Cys Tyr Leu Glu 915 920 925 Leu His Pro His His Trp Leu Glu Leu Leu Ala Thr Thr Tyr Thr His 930 935 940 Cys Arg Leu Asn Cys Pro Gly Gly Pro Ala Gln Leu Gln Ala Leu Ala 945 950 955 960 His Arg Cys Pro Pro Leu Ala Val Cys Leu Ala Gln Gln Leu Pro Glu 965 970 975 Asp Pro Gly Gln Gly Ser Ser Ser Val Glu Phe Asp Met Val Lys Leu 980 985 990 Val Asp Ser Met Gly Trp Glu Leu Ala Ser Val Arg Arg Ala Leu Cys 995 1000 1005 Gln Leu Gln Trp Asp His Glu Pro Arg Thr Gly Val Arg Arg Gly 1010 1015 1020 Thr Gly Val Leu Val Glu Phe Ser Glu Leu Ala Phe His Leu Arg 1025 1030 1035 Ser Pro Gly Asp Leu Thr Ala Glu Glu Lys Asp Gln Ile Cys Asp 1040 1045 1050 Phe Leu Tyr Gly Arg Val Gln Ala Arg Glu Arg Gln Ala Leu Ala 1055 1060 1065 Arg Leu Arg Arg Thr Phe Gln Ala Phe His Ser Val Ala Phe Pro 1070 1075 1080 Ser Cys Gly Pro Cys Leu Glu Gln Gln Asp Glu Glu Arg Ser Thr 1085 1090 1095 Arg Leu Lys Asp Leu Leu Gly Arg Tyr Phe Glu Glu Glu Glu Gly 1100 1105 1110 Gln Glu Pro Gly Gly Met Glu Asp Ala Gln Gly Pro Glu Pro Gly 1115 1120 1125 Gln Ala Arg Leu Gln Asp Trp Glu Asp Gln Val Arg Cys Asp Ile 1130 1135 1140 Arg Gln Phe Leu Ser Leu Arg Pro Glu Glu Lys Phe Ser Ser Arg 1145 1150 1155 Ala Val Ala Arg Ile Phe His Gly Ile Gly Ser Pro Cys Tyr Pro 1160 1165 1170 Ala Gln Val Tyr Gly Gln Asp Arg Arg Phe Trp Arg Lys Tyr Leu 1175 1180 1185 His Leu Ser Phe His Ala Leu Val Gly Leu Ala Thr Glu Glu Leu 1190 1195 1200 Leu Gln Val Ala Arg 1205 <210> 63 <211> 1101 <212> PRT <213> Homo sapiens <400> 63 Met Asp Glu Cys Gly Ser Arg Ile Arg Arg Arg Val Ser Leu Pro Lys 1 5 10 15 Arg Asn Arg Pro Ser Leu Gly Cys Ile Phe Gly Ala Pro Thr Ala Ala 20 25 30 Glu Leu Val Pro Gly Asp Glu Gly Lys Glu Glu Glu Glu Met Val Ala 35 40 45 Glu Asn Arg Arg Arg Lys Thr Ala Gly Val Leu Pro Val Glu Val Gln 50 55 60 Pro Leu Leu Leu Ser Asp Ser Pro Glu Cys Leu Val Leu Gly Gly Gly 65 70 75 80 Asp Thr Asn Pro Asp Leu Leu Arg His Met Pro Thr Asp Arg Gly Val 85 90 95 Gly Asp Gln Pro Asn Asp Ser Glu Val Asp Met Phe Gly Asp Tyr Asp 100 105 110 Ser Phe Thr Glu Asn Ser Phe Ile Ala Gln Val Asp Asp Leu Glu Gln 115 120 125 Lys Tyr Met Gln Leu Pro Glu His Lys Lys His Ala Thr Asp Phe Ala 130 135 140 Thr Glu Asn Leu Cys Ser Glu Ser Ile Lys Asn Lys Leu Ser Ile Thr 145 150 155 160 Thr Ile Gly Asn Leu Thr Glu Leu Gln Thr Asp Lys His Thr Glu Asn 165 170 175 Gln Ser Gly Tyr Glu Gly Val Thr Ile Glu Pro Gly Ala Asp Leu Leu 180 185 190 Tyr Asp Val Pro Ser Ser Gln Ala Ile Tyr Phe Glu Asn Leu Gln Asn 195 200 205 Ser Ser Asn Asp Leu Gly Asp His Ser Met Lys Glu Arg Asp Trp Lys 210 215 220 Ser Ser Ser His Asn Thr Val Asn Glu Glu Leu Pro His Asn Cys Ile 225 230 235 240 Glu Gln Pro Gln Gln Asn Asp Glu Ser Ser Ser Lys Val Arg Thr Ser 245 250 255 Ser Asp Met Asn Arg Arg Lys Ser Ile Lys Asp His Leu Lys Asn Ala 260 265 270 Met Thr Gly Asn Ala Lys Ala Gln Thr Pro Ile Phe Ser Arg Ser Lys 275 280 285 Gln Leu Lys Asp Thr Leu Leu Ser Glu Glu Ile Asn Val Ala Lys Lys 290 295 300 Thr Val Glu Ser Ser Ser Asn Asp Leu Gly Pro Phe Tyr Ser Leu Pro 305 310 315 320 Ser Lys Val Arg Asp Leu Tyr Ala Gln Phe Lys Gly Ile Glu Lys Leu 325 330 335 Tyr Glu Trp Gln His Thr Cys Leu Thr Leu Asn Ser Val Gln Glu Arg 340 345 350 Lys Asn Leu Ile Tyr Ser Leu Pro Thr Ser Gly Gly Lys Thr Leu Val 355 360 365 Ala Glu Ile Leu Met Leu Gln Glu Leu Leu Cys Cys Arg Lys Asp Val 370 375 380 Leu Met Ile Leu Pro Tyr Val Ala Ile Val Gln Glu Lys Ile Ser Gly 385 390 395 400 Leu Ser Ser Phe Gly Ile Glu Leu Gly Phe Phe Val Glu Glu Tyr Ala 405 410 415 Gly Ser Lys Gly Arg Phe Pro Pro Thr Lys Arg Arg Glu Lys Lys Ser 420 425 430 Leu Tyr Ile Ala Thr Ile Glu Lys Gly His Ser Leu Val Asn Ser Leu 435 440 445 Ile Glu Thr Gly Arg Ile Asp Ser Leu Gly Leu Val Val Val Asp Glu 450 455 460 Leu His Met Ile Gly Glu Gly Ser Arg Gly Ala Thr Leu Glu Met Thr 465 470 475 480 Leu Ala Lys Ile Leu Tyr Thr Ser Lys Thr Thr Gln Ile Ile Gly Met 485 490 495 Ser Ala Thr Leu Asn Asn Val Glu Asp Leu Gln Lys Phe Leu Gln Ala 500 505 510 Glu Tyr Tyr Thr Ser Gln Phe Arg Pro Val Glu Leu Lys Glu Tyr Leu 515 520 525 Lys Ile Asn Asp Thr Ile Tyr Glu Val Asp Ser Lys Ala Glu Asn Gly 530 535 540 Met Thr Phe Ser Arg Leu Leu Asn Tyr Lys Tyr Ser Asp Thr Leu Lys 545 550 555 560 Lys Met Asp Pro Asp His Leu Val Ala Leu Val Thr Glu Val Ile Pro 565 570 575 Asn Tyr Ser Cys Leu Val Phe Cys Pro Ser Lys Lys Asn Cys Glu Asn 580 585 590 Val Ala Glu Met Ile Cys Lys Phe Leu Ser Lys Glu Tyr Leu Lys His 595 600 605 Lys Glu Lys Glu Lys Cys Glu Val Ile Lys Asn Leu Lys Asn Ile Gly 610 615 620 Asn Gly Asn Leu Cys Pro Val Leu Lys Arg Thr Ile Pro Phe Gly Val 625 630 635 640 Ala Tyr His His Ser Gly Leu Thr Ser Asp Glu Arg Lys Leu Leu Glu 645 650 655 Glu Ala Tyr Ser Thr Gly Val Leu Cys Leu Phe Thr Cys Thr Ser Thr 660 665 670 Leu Ala Ala Gly Val Asn Leu Pro Ala Arg Arg Val Ile Leu Arg Ala 675 680 685 Pro Tyr Val Ala Lys Glu Phe Leu Lys Arg Asn Gln Tyr Lys Gln Met 690 695 700 Ile Gly Arg Ala Gly Arg Ala Gly Ile Asp Thr Ile Gly Glu Ser Ile 705 710 715 720 Leu Ile Leu Gln Glu Lys Asp Lys Gln Gln Val Leu Glu Leu Ile Thr 725 730 735 Lys Pro Leu Glu Asn Cys Tyr Ser His Leu Val Gln Glu Phe Thr Lys 740 745 750 Gly Ile Gln Thr Leu Phe Leu Ser Leu Ile Gly Leu Lys Ile Ala Thr 755 760 765 Asn Leu Asp Asp Ile Tyr His Phe Met Asn Gly Thr Phe Phe Gly Val 770 775 780 Gln Gln Lys Val Leu Leu Lys Glu Lys Ser Leu Trp Glu Ile Thr Val 785 790 795 800 Glu Ser Leu Arg Tyr Leu Thr Glu Lys Gly Leu Leu Gln Lys Asp Thr 805 810 815 Ile Tyr Lys Ser Glu Glu Glu Val Gln Tyr Asn Phe His Ile Thr Lys 820 825 830 Leu Gly Arg Ala Ser Phe Lys Gly Thr Ile Asp Leu Ala Tyr Cys Asp 835 840 845 Ile Leu Tyr Arg Asp Leu Lys Lys Gly Leu Glu Gly Leu Val Leu Glu 850 855 860 Ser Leu Leu His Leu Ile Tyr Leu Thr Thr Pro Tyr Asp Leu Val Ser 865 870 875 880 Gln Cys Asn Pro Asp Trp Met Ile Tyr Phe Arg Gln Phe Ser Gln Leu 885 890 895 Ser Pro Ala Glu Gln Asn Val Ala Ala Ile Leu Gly Val Ser Glu Ser 900 905 910 Phe Ile Gly Lys Lys Ala Ser Gly Gln Ala Ile Gly Lys Lys Val Asp 915 920 925 Lys Asn Val Val Asn Arg Leu Tyr Leu Ser Phe Val Leu Tyr Thr Leu 930 935 940 Leu Lys Glu Thr Asn Ile Trp Thr Val Ser Glu Lys Phe Asn Met Pro 945 950 955 960 Arg Gly Tyr Ile Gln Asn Leu Leu Thr Gly Thr Ala Ser Phe Ser Ser 965 970 975 Cys Val Leu His Phe Cys Glu Glu Leu Glu Glu Phe Trp Val Tyr Arg 980 985 990 Ala Leu Leu Val Glu Leu Thr Lys Lys Leu Thr Tyr Cys Val Lys Ala 995 1000 1005 Glu Leu Ile Pro Leu Met Glu Val Thr Gly Val Leu Glu Gly Arg 1010 1015 1020 Ala Lys Gln Leu Tyr Ser Ala Gly Tyr Lys Ser Leu Met His Leu 1025 1030 1035 Ala Asn Ala Asn Pro Glu Val Leu Val Arg Thr Ile Asp His Leu 1040 1045 1050 Ser Arg Arg Gln Ala Lys Gln Ile Val Ser Ser Ala Lys Met Leu 1055 1060 1065 Leu His Glu Lys Ala Glu Ala Leu Gln Glu Glu Val Glu Glu Leu 1070 1075 1080 Leu Arg Leu Pro Ser Asp Phe Pro Gly Ala Val Ala Ser Ser Thr 1085 1090 1095 Asp Lys Ala 1100 <210> 64 <211> 1196 <212> PRT <213> Herpes simplex virus <400> 64 Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly 1 5 10 15 Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu 20 25 30 Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val 35 40 45 Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn 50 55 60 Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala 65 70 75 80 Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val 85 90 95 Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu 100 105 110 Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr 115 120 125 Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu 130 135 140 Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val 145 150 155 160 Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu 165 170 175 His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His 180 185 190 Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg 195 200 205 Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Lys 210 215 220 Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu 225 230 235 240 Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn 245 250 255 Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn 260 265 270 His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu 275 280 285 Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys 290 295 300 Gly Ala Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly 305 310 315 320 Asp Ala Ala Leu Ala Leu Glu Ser Ile Val Ser Met Ala Val Phe Asp 325 330 335 Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp 340 345 350 Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala 355 360 365 Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His 370 375 380 Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser 385 390 395 400 Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala 405 410 415 Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu 420 425 430 Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly 435 440 445 Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys 450 455 460 Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Ala Val Ile Val Gly Arg 465 470 475 480 Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp 485 490 495 Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His 500 505 510 Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala 515 520 525 Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser 530 535 540 Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg 545 550 555 560 Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg 565 570 575 Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val 580 585 590 Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr 595 600 605 Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val 610 615 620 Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn 625 630 635 640 Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu 645 650 655 Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu 660 665 670 Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln 675 680 685 Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg 690 695 700 Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn 705 710 715 720 Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly 725 730 735 Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala 740 745 750 Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro 755 760 765 Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala 770 775 780 Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala 785 790 795 800 Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly 805 810 815 Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro 820 825 830 Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln 835 840 845 Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr 850 855 860 Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe 865 870 875 880 Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met 885 890 895 Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn 900 905 910 Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln 915 920 925 Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly 930 935 940 Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr 945 950 955 960 Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg 965 970 975 Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala 980 985 990 Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly 995 1000 1005 Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys 1010 1015 1020 Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser 1025 1030 1035 Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu 1040 1045 1050 Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val 1055 1060 1065 Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu 1070 1075 1080 Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser 1085 1090 1095 Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn 1100 1105 1110 Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala 1115 1120 1125 Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn 1130 1135 1140 Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly 1145 1150 1155 Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala 1160 1165 1170 Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys 1175 1180 1185 Gly Asp Leu Thr Leu Asp Met Leu 1190 1195 <210> 65 <211> 843 <212> PRT <213> Saccharomyces cerevisiae <400> 65 Met Thr Asp Val Glu Gly Tyr Gln Pro Lys Ser Lys Gly Lys Ile Phe 1 5 10 15 Pro Asp Met Gly Glu Ser Phe Phe Ser Ser Asp Glu Asp Ser Pro Ala 20 25 30 Thr Asp Ala Glu Ile Asp Glu Asn Tyr Asp Asp Asn Arg Glu Thr Ser 35 40 45 Glu Gly Arg Gly Glu Arg Asp Thr Gly Ala Met Val Thr Gly Leu Lys 50 55 60 Lys Pro Arg Lys Lys Thr Lys Ser Ser Arg His Thr Ala Ala Asp Ser 65 70 75 80 Ser Met Asn Gln Met Asp Ala Lys Asp Lys Ala Leu Leu Gln Asp Thr 85 90 95 Asn Ser Asp Ile Pro Ala Asp Phe Val Pro Asp Ser Val Ser Gly Met 100 105 110 Phe Arg Ser His Asp Phe Ser Tyr Leu Arg Leu Arg Pro Asp His Ala 115 120 125 Ser Arg Pro Leu Trp Ile Ser Pro Ser Asp Gly Arg Ile Ile Leu Glu 130 135 140 Ser Phe Ser Pro Leu Ala Glu Gln Ala Gln Asp Phe Leu Val Thr Ile 145 150 155 160 Ala Glu Pro Ile Ser Arg Pro Ser His Ile His Glu Tyr Lys Ile Thr 165 170 175 Ala Tyr Ser Leu Tyr Ala Ala Val Ser Val Gly Leu Glu Thr Asp Asp 180 185 190 Ile Ile Ser Val Leu Asp Arg Leu Ser Lys Val Pro Val Ala Glu Ser 195 200 205 Ile Ile Asn Phe Ile Lys Gly Ala Thr Ile Ser Tyr Gly Lys Val Lys 210 215 220 Leu Val Ile Lys His Asn Arg Tyr Phe Val Glu Thr Thr Gln Ala Asp 225 230 235 240 Ile Leu Gln Met Leu Leu Asn Asp Ser Val Ile Gly Pro Leu Arg Ile 245 250 255 Asp Ser Asp His Gln Val Gln Pro Pro Glu Asp Val Leu Gln Gln Gln 260 265 270 Leu Gln Gln Thr Ala Gly Lys Pro Ala Thr Asn Val Asn Pro Asn Asp 275 280 285 Val Glu Ala Val Phe Ser Ala Val Ile Gly Gly Asp Asn Glu Arg Glu 290 295 300 Glu Glu Asp Asp Asp Ile Asp Ala Val His Ser Phe Glu Ile Ala Asn 305 310 315 320 Glu Ser Val Glu Val Val Lys Lys Arg Cys Gln Glu Ile Asp Tyr Pro 325 330 335 Val Leu Glu Glu Tyr Asp Phe Arg Asn Asp His Arg Asn Pro Asp Leu 340 345 350 Asp Ile Asp Leu Lys Pro Ser Thr Gln Ile Arg Pro Tyr Gln Glu Lys 355 360 365 Ser Leu Ser Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly Ile Ile 370 375 380 Val Leu Pro Cys Gly Ala Gly Lys Thr Leu Val Gly Ile Thr Ala Ala 385 390 395 400 Cys Thr Ile Lys Lys Ser Val Ile Val Leu Cys Thr Ser Ser Val Ser 405 410 415 Val Met Gln Trp Arg Gln Gln Phe Leu Gln Trp Cys Thr Leu Gln Pro 420 425 430 Glu Asn Cys Ala Val Phe Thr Ser Asp Asn Lys Glu Met Phe Gln Thr 435 440 445 Glu Ser Gly Leu Val Val Ser Thr Tyr Ser Met Val Ala Asn Thr Arg 450 455 460 Asn Arg Ser His Asp Ser Gln Lys Val Met Asp Phe Leu Thr Gly Arg 465 470 475 480 Glu Trp Gly Phe Ile Ile Leu Asp Glu Val His Val Val Pro Ala Ala 485 490 495 Met Phe Arg Arg Val Val Ser Thr Ile Ala Ala His Ala Lys Leu Gly 500 505 510 Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Gly Asp Leu Asn 515 520 525 Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu Ser 530 535 540 Gln Lys Gly His Ile Ala Asn Val Gln Cys Ala Glu Val Trp Cys Pro 545 550 555 560 Met Thr Ala Glu Phe Tyr Gln Glu Tyr Leu Arg Glu Thr Ala Arg Lys 565 570 575 Arg Met Leu Leu Tyr Ile Met Asn Pro Thr Lys Phe Gln Ala Cys Gln 580 585 590 Phe Leu Ile Gln Tyr His Glu Arg Arg Gly Asp Lys Ile Ile Val Phe 595 600 605 Ser Asp Asn Val Tyr Ala Leu Gln Glu Tyr Ala Leu Lys Met Gly Lys 610 615 620 Pro Phe Ile Tyr Gly Ser Thr Pro Gln Gln Glu Arg Met Asn Ile Leu 625 630 635 640 Gln Asn Phe Gln Tyr Asn Asp Gln Ile Asn Thr Ile Phe Leu Ser Lys 645 650 655 Val Gly Asp Thr Ser Ile Asp Leu Pro Glu Ala Thr Cys Leu Ile Gln 660 665 670 Ile Ser Ser His Tyr Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu Gly 675 680 685 Arg Ile Leu Arg Ala Lys Arg Arg Asn Asp Glu Gly Phe Asn Ala Phe 690 695 700 Phe Tyr Ser Leu Val Ser Lys Asp Thr Gln Glu Met Tyr Tyr Ser Thr 705 710 715 720 Lys Arg Gln Ala Phe Leu Val Asp Gln Gly Tyr Ala Phe Lys Val Ile 725 730 735 Thr His Leu His Gly Met Glu Asn Ile Pro Asn Leu Ala Tyr Ala Ser 740 745 750 Pro Arg Glu Arg Arg Glu Leu Leu Gln Glu Val Leu Leu Lys Asn Glu 755 760 765 Glu Ala Ala Gly Ile Glu Val Gly Asp Asp Ala Asp Asn Ser Val Gly 770 775 780 Arg Gly Ser Asn Gly His Lys Arg Phe Lys Ser Lys Ala Val Arg Gly 785 790 795 800 Glu Gly Ser Leu Ser Gly Leu Ala Gly Gly Glu Asp Met Ala Tyr Met 805 810 815 Glu Tyr Ser Thr Asn Lys Asn Lys Glu Leu Lys Glu His His Pro Leu 820 825 830 Ile Arg Lys Met Tyr Tyr Lys Asn Leu Lys Lys 835 840 <210> 66 <211> 778 <212> PRT <213> Saccharomyces cerevisiae <400> 66 Met Lys Phe Tyr Ile Asp Asp Leu Pro Val Leu Phe Pro Tyr Pro Lys 1 5 10 15 Ile Tyr Pro Glu Gln Tyr Asn Tyr Met Cys Asp Ile Lys Lys Thr Leu 20 25 30 Asp Val Gly Gly Asn Ser Ile Leu Glu Met Pro Ser Gly Thr Gly Lys 35 40 45 Thr Val Ser Leu Leu Ser Leu Thr Ile Ala Tyr Gln Met His Tyr Pro 50 55 60 Glu His Arg Lys Ile Ile Tyr Cys Ser Arg Thr Met Ser Glu Ile Glu 65 70 75 80 Lys Ala Leu Val Glu Leu Glu Asn Leu Met Asp Tyr Arg Thr Lys Glu 85 90 95 Leu Gly Tyr Gln Glu Asp Phe Arg Gly Leu Gly Leu Thr Ser Arg Lys 100 105 110 Asn Leu Cys Leu His Pro Glu Val Ser Lys Glu Arg Lys Gly Thr Val 115 120 125 Val Asp Glu Lys Cys Arg Arg Met Thr Asn Gly Gln Ala Lys Arg Lys 130 135 140 Leu Glu Glu Asp Pro Glu Ala Asn Val Glu Leu Cys Glu Tyr His Glu 145 150 155 160 Asn Leu Tyr Asn Ile Glu Val Glu Asp Tyr Leu Pro Lys Gly Val Phe 165 170 175 Ser Phe Glu Lys Leu Leu Lys Tyr Cys Glu Glu Lys Thr Leu Cys Pro 180 185 190 Tyr Phe Ile Val Arg Arg Met Ile Ser Leu Cys Asn Ile Ile Ile Tyr 195 200 205 Ser Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Glu Arg Val Ser Asn 210 215 220 Glu Val Ser Lys Asp Ser Ile Val Ile Phe Asp Glu Ala His Asn Ile 225 230 235 240 Asp Asn Val Cys Ile Glu Ser Leu Ser Leu Asp Leu Thr Thr Asp Ala 245 250 255 Leu Arg Arg Ala Thr Arg Gly Ala Asn Ala Leu Asp Glu Arg Ile Ser 260 265 270 Glu Val Arg Lys Val Asp Ser Gln Lys Leu Gln Asp Glu Tyr Glu Lys 275 280 285 Leu Val Gln Gly Leu His Ser Ala Asp Ile Leu Thr Asp Gln Glu Glu 290 295 300 Pro Phe Val Glu Thr Pro Val Leu Pro Gln Asp Leu Leu Thr Glu Ala 305 310 315 320 Ile Pro Gly Asn Ile Arg Arg Ala Glu His Phe Val Ser Phe Leu Lys 325 330 335 Arg Leu Ile Glu Tyr Leu Lys Thr Arg Met Lys Val Leu His Val Ile 340 345 350 Ser Glu Thr Pro Lys Ser Phe Leu Gln His Leu Lys Gln Leu Thr Phe 355 360 365 Ile Glu Arg Lys Pro Leu Arg Phe Cys Ser Glu Arg Leu Ser Leu Leu 370 375 380 Val Arg Thr Leu Glu Val Thr Glu Val Glu Asp Phe Thr Ala Leu Lys 385 390 395 400 Asp Ile Ala Thr Phe Ala Thr Leu Ile Ser Thr Tyr Glu Glu Gly Phe 405 410 415 Leu Leu Ile Ile Glu Pro Tyr Glu Ile Glu Asn Ala Ala Val Pro Asn 420 425 430 Pro Ile Met Arg Phe Thr Cys Leu Asp Ala Ser Ile Ala Ile Lys Pro 435 440 445 Val Phe Glu Arg Phe Ser Ser Val Ile Ile Thr Ser Gly Thr Ile Ser 450 455 460 Pro Leu Asp Met Tyr Pro Arg Met Leu Asn Phe Lys Thr Val Leu Gln 465 470 475 480 Lys Ser Tyr Ala Met Thr Leu Ala Lys Lys Ser Phe Leu Pro Met Ile 485 490 495 Ile Thr Lys Gly Ser Asp Gln Val Ala Ile Ser Ser Arg Phe Glu Ile 500 505 510 Arg Asn Asp Pro Ser Ile Val Arg Asn Tyr Gly Ser Met Leu Val Glu 515 520 525 Phe Ala Lys Ile Thr Pro Asp Gly Met Val Val Phe Phe Pro Ser Tyr 530 535 540 Leu Tyr Met Glu Ser Ile Val Ser Met Trp Gln Thr Met Gly Ile Leu 545 550 555 560 Asp Glu Val Trp Lys His Lys Leu Ile Leu Val Glu Thr Pro Asp Ala 565 570 575 Gln Glu Thr Ser Leu Ala Leu Glu Thr Tyr Arg Lys Ala Cys Ser Asn 580 585 590 Gly Arg Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu 595 600 605 Gly Ile Asp Phe Asp His Gln Tyr Gly Arg Thr Val Leu Met Ile Gly 610 615 620 Ile Pro Phe Gln Tyr Thr Glu Ser Arg Ile Leu Lys Ala Arg Leu Glu 625 630 635 640 Phe Met Arg Glu Asn Tyr Arg Ile Arg Glu Asn Asp Phe Leu Ser Phe 645 650 655 Asp Ala Met Arg His Ala Ala Gln Cys Leu Gly Arg Val Leu Arg Gly 660 665 670 Lys Asp Asp Tyr Gly Val Met Val Leu Ala Asp Arg Arg Phe Ser Arg 675 680 685 Lys Arg Ser Gln Leu Pro Lys Trp Ile Ala Gln Gly Leu Ser Asp Ala 690 695 700 Asp Leu Asn Leu Ser Thr Asp Met Ala Ile Ser Asn Thr Lys Gln Phe 705 710 715 720 Leu Arg Thr Met Ala Gln Pro Thr Asp Pro Lys Asp Gln Glu Gly Val 725 730 735 Ser Val Trp Ser Tyr Glu Asp Leu Ile Lys His Gln Asn Ser Arg Lys 740 745 750 Asp Gln Gly Gly Phe Ile Glu Asn Glu Asn Lys Glu Gly Glu Gln Asp 755 760 765 Glu Asp Glu Asp Glu Asp Ile Glu Met Gln 770 775 <210> 67 <211> 129 <212> PRT <213> Streptococcus pyogenes <400> 67 Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu 1 5 10 15 Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile 20 25 30 Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala 35 40 45 Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala 50 55 60 Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala 65 70 75 80 Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu 85 90 95 Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu 100 105 110 Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg 115 120 125 Val <210> 68 <211> 625 <212> PRT <213> Streptococcus pyogenes <400> 68 Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu 1 5 10 15 Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu 20 25 30 Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys 35 40 45 Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala 50 55 60 Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp 65 70 75 80 Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val 85 90 95 Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly 100 105 110 Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg 115 120 125 Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu 130 135 140 Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys 145 150 155 160 Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp 165 170 175 Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln 180 185 190 Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu 195 200 205 Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu 210 215 220 Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr 225 230 235 240 Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu 245 250 255 Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly 260 265 270 Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu 275 280 285 Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp 290 295 300 Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln 305 310 315 320 Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe 325 330 335 Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr 340 345 350 Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg 355 360 365 Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn 370 375 380 Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu 385 390 395 400 Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro 405 410 415 Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr 420 425 430 Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser 435 440 445 Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg 450 455 460 Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu 465 470 475 480 Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala 485 490 495 Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp 500 505 510 Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu 515 520 525 Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys 530 535 540 Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg 545 550 555 560 Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly 565 570 575 Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser 580 585 590 Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser 595 600 605 Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 610 615 620 Asp 625 <210> 69 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21)..(49) <223> a, c, t, g, unknown or other <400> 69 nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49 <210> 70 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21)..(49) <223> a, c, t, g, unknown or other <400> 70 nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49 <210> 71 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(10) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(25) <223> a, c, t, g, unknown or other <400> 71 nnnnnnnnnn tctctnnnnn nnnnn 25 <210> 72 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(10) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(25) <223> a, c, t, g, unknown or other <400> 72 nnnnnnnnnn tctctnnnnn nnnnn 25 <210> 73 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (6)..(10) <223> a, c, t, g, unknown or other <400> 73 gtrhgnnnnn 10 <210> 74 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (11)..(11) <223> a, c, t, g, unknown or other <400> 74 yyyyyyyyyy nyag 14 <210> 75 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: 'LAGLIDADG' family motif peptide <400> 75 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 76 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 76 Leu Arg Gly Ser 1 <210> 77 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(3) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (8)..(21) <223> a, c, t, g, unknown or other <400> 77 nnnaaaannn nnnnnnnnnn ngg 23 <210> 78 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt agaggccat 59 <210> 79 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 79 Leu Asn Tyr Gly Val Cys Phe Cys Gly 1 5 <210> 80 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21)..(49) <223> a, c, t, g, unknown or other <400> 80 nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49 <210> 81 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 81 caaatgcttg tgagaaagct tgctca 26 <210> 82 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 82 Gln Ser Ser Asp Leu Ser Arg 1 5 <210> 83 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 83 Leu Lys Trp Asn Leu Arg Thr 1 5 <210> 84 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Arg Ser Asp Asn Leu Ala Arg 1 5 <210> 85 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Trp Gln Ser Ser Leu Ile Val 1 5 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 86 Gln Ser Gly Asn Arg Thr Thr 1 5 <210> 87 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 87 atgcttgtga gaaagcttgc tcatca 26 <210> 88 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 88 cttgtgagaa agcttgctca tcatac 26 <210> 89 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 89 Thr Asn Gln Asn Arg Ile Thr 1 5 <210> 90 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 90 Arg Ser Ala Asn Leu Thr Arg 1 5 <210> 91 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 91 gtgagaaagc ttgctcatca tacttg 26 <210> 92 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 92 Ala His Gly Ala Arg Trp Asn 1 5

Claims

적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인;
적어도 하나의 DNA 탈안정화 분자; 및
적어도 하나의 아데닌 또는 시토신 데아미나제
를 포함하는, DNA 내의 아데닌 (A) 또는 시티딘 (C) 염기를 편집하기 위한 조성물이며, 여기서 조성물은 DNA 내에 이중 가닥 절단을 만들지 않는 것인 조성물.
제1항에 있어서, DNA 탈안정화 분자가 Cas9 닉카제, 또는 단일 가이드 RNA (sgRNA)에 작동가능하게 연결된 Cas9 단백질인 조성물.
제1항에 있어서, Cas9 단백질을 포함하지 않는 조성물.
제1항 내지 제3항 중 어느 한 항에 있어서, DNA 탈안정화 분자가 징크 핑거 뉴클레아제 (ZFN) 닉카제인 조성물.
제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 하나의 ZFP DNA 결합 도메인이 Cas9 닉카제 또는 불활성화된 Cas9 단백질 (dCas9)에 작동가능하게 연결되는 것인 조성물.
제1항 내지 제5항 중 어느 한 항에 있어서, 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 여기서 제1 ZFP DNA 결합 도메인이 Cas9 닉카제에 작동가능하게 연결되는 것인 조성물.
제1항 내지 제6항 중 어느 한 항에 있어서, 아데닌 또는 시토신 데아미나제가, 이량체화되어 활성 아데닌 또는 시토신 데아미나제를 형성하는 제1 및 제2 불활성 도메인으로 구성되는 것인 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, 아데닌 또는 시토신 데아미나제의 제1 불활성 도메인이 Cas9 닉카제에 작동가능하게 연결되고 아데닌 또는 시토신 데아미나제의 제2 불활성 도메인이 제2 ZFP DNA 결합 도메인에 작동가능하게 연결되는 것인 조성물.
제2항에 있어서, 아데닌 또는 시토신 데아미나제 및 ZFP DNA 결합 도메인이 Cas9 닉카제에 작동가능하게 연결되는 것인 조성물.
제2항에 있어서, 제1 및 제2 ZFP DNA 도메인, Cas9 닉카제에 작동가능하게 연결된 제1 ZFP 및 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된 제2 ZFP DNA 결합 도메인을 포함하는 조성물.
제1항 내지 제10항 중 어느 한 항에 있어서, 적어도 하나의 ZFP DNA 결합 도메인이 아데닌 또는 시토신 데아미나제에 작동가능하게 연결되는 것인 조성물.
제1항 내지 제11항 중 어느 한 항에 있어서, ZFN 닉카제를 추가로 포함하는 조성물.
제1항 내지 제12항 중 어느 한 항에 있어서, DNA 탈안정화 인자가 적어도 하나의 단백질 및/또는 적어도 하나의 뉴클레오티드를 포함하는 것인 조성물.
제13항에 있어서, DNA 탈안정화 인자가 단백질을 포함하는 것인 조성물.
제14항에 있어서, DNA 탈안정화 인자가 Cas 단백질 및/또는 표 A에 제시된 바와 같은 단백질을 포함하는 것인 조성물.
제13항에 있어서, DNA 탈안정화 뉴클레오티드가 올리고뉴클레오티드를 포함하는 것인 조성물.
제16항에 있어서, 올리고뉴클레오티드가 펩티드 핵산 (PNA); 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함하는 것인 조성물.
제17항에 있어서, PNA가
를 포함하며, 여기서 O가 8-아미노-2,6-디옥사옥탄산 링커를 나타내고; C가 시토신을 나타내며 Lys 잔기가 임의적인 것인 조성물.
제17항에 있어서, LNA가
을 포함하며, 여기서 LNA 뉴클레오티드가 대문자로 표시되고; DNA 뉴클레오티드가 소문자로 표시되고; "*"가 포스포로티오에이트 결합을 나타내는 것인 조성물.
제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드.
제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물 또는 제20항에 따른 하나 이상의 폴리뉴클레오티드를 포함하는 세포, 또는 편집된 염기를 포함하는 세포의 자손.
제1항 내지 제19항 중 어느 한 항에 따른 조성물 또는 제20항의 하나 이상의 폴리뉴클레오티드를 세포에 제공하는 것을 포함하는, 세포 내의 표적 DNA에서의 염기를 편집하는 방법.
제22항에 있어서, 편집이
(i) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 것이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것;
(ii) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 것이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것; 및/또는
(iii) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 것
을 포함하는 것인 방법.
제22항에 있어서, 세포에서의 편집이
(i) C:G 염기쌍의 T:A 염기쌍으로의 변화;
(ii) C:G 염기쌍의 G:C 염기쌍으로의 변화;
(iii) A:T 염기쌍의 G:C 염기쌍으로의 변화;
(iv) 정지 코돈의 도입; 및/또는
(v) 스플라이싱 서열의 편집 또는 생성
을 발생시키는 것인 방법.
제24항에 있어서, 편집이 질환 돌연변이를 교정하는 것인 방법.
제22항에 있어서, 엑손이 편집되는 것인 방법.
제20항의 하나 이상의 폴리뉴클레오티드를 포함하는, 표적 DNA에서의 염기를 편집하는 데 사용하기 위한 키트.
단리된 세포 또는 대상체에서 표적 DNA 분자를 편집하기 위한, 제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물 또는 제20항의 하나 이상의 폴리뉴클레오티드의 용도이며, 임의로 여기서 세포 또는 대상체 내의 염색체 또는 염색체 외 에피솜에서의 DNA가 편집되는 것인 용도.
제28항에 있어서, 편집이
(iv) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 것이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것;
(v) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 것이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것; 및/또는
(vi) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 것
을 포함하는 것인 용도.
제28항 또는 제29항에 있어서, 세포 또는 대상체에서의 편집이
(vi) C:G 염기쌍의 T:A 염기쌍으로의 변화;
(vii) C:G 염기쌍의 G:C 염기쌍으로의 변화;
(viii) A:T 염기쌍의 G:C 염기쌍으로의 변화;
(ix) 정지 코돈의 도입; 및/또는
(x) 스플라이싱 서열의 편집 또는 생성
을 발생시키는 것인 용도.
제28항 내지 제30항 중 어느 한 항에 있어서, 엑손이 편집되는 것인 용도.