KR20200121782A

KR20200121782A - 아데노신 염기 편집제의 용도

Info

Publication number: KR20200121782A
Application number: KR1020207013985A
Authority: KR
Inventors: 데이비드 알. 리우; 니콜 고델리; 마이클 에스. 파커; 그레고리 뉴비
Original assignee: 더 브로드 인스티튜트, 인코퍼레이티드; 프레지던트 앤드 펠로우즈 오브 하바드 칼리지; 빔 테라퓨틱스, 인크.
Priority date: 2017-10-16
Filing date: 2018-10-16
Publication date: 2020-10-26
Also published as: JP2024041081A; CA3082251A1; CN111757937A; US11795443B2; JP2021500036A; AU2018352592A1; US20200399626A1; EP3697906A1; WO2019079347A1

Abstract

본 개시내용은 혈액 질환/장애, 예컨대 겸상 적혈구 질환, 혈색소증, 혈우병 및 베타-지중해빈혈을 치료하기 위한 방법 및 조성물을 제공한다. 예를 들어, 본 개시내용은 HBG1/2의 프로모터를 표적화하여 태아성 헤모글로빈의 발현을 증가시키는 점 돌연변이를 생성하는 치료적 가이드 RNA를 제공한다. 또 다른 예로서, 본 개시내용은 HBB, 인자 VIII 및 HFE 내의 돌연변이를 표적화하여 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 및 혈색소증을 치료하는 치료적 가이드 RNA를 제공한다. 본 개시내용은 또한 Cas9 (예를 들어, Cas9 니카제) 도메인 및 DNA 내의 아데노신을 탈아미노화시키는 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 융합 단백질은 융합 단백질을 DNA 서열 (예를 들어, HBG1 또는 HBG2 프로모터 서열, 또는 HFE, GBB 또는 F8 유전자 서열)에 표적화하는 핵산, 예컨대 가이드 RNA (gRNA)와 복합체화된다. 이러한 복합체는 태아성 헤모글로빈의 발현을 증가시키거나 또는 HFE 내의 점 돌연변이 (예를 들어, C282Y)를 교정하는데 유용할 수 있다.

Description

아데노신 염기 편집제의 용도

핵산 서열의 표적화된 편집, 예를 들어 표적화된 절단 또는 게놈 DNA 내로의 특정 변형의 표적화된 도입은 유전자 기능의 연구를 위한 고도로 유망한 접근법이고, 또한 인간 유전 질환에 대한 새로운 요법을 제공하는 잠재력을 갖는다. 많은 유전 질환은 원칙적으로 게놈 내 특정 위치에서 특정 뉴클레오티드 변화 (예를 들어, 질환과 연관된 유전자의 특정 코돈에서 A에서 G로 또는 T에서 C로의 변화)를 유발함으로써 치료될 수 있기 때문에, 이러한 정확한 유전자 편집을 달성하기 위한 프로그램가능한 방식의 개발은 강력한 신규 연구 도구, 뿐만 아니라 유전자 편집-기반 치료제에 대한 잠재적 신규 접근법 둘 다를 나타낸다.

본 개시내용은 혈액 질환/장애, 예컨대 겸상 적혈구 질환, 혈색소증, 혈우병 및 베타-지중해빈혈을 치료하기 위한 방법 및 조성물을 제공한다. 예를 들어, 본 개시내용은 HBG1/2의 프로모터를 표적화하여 태아성 헤모글로빈의 발현을 증가시키는 점 돌연변이를 생성하는 치료적 가이드 RNA를 제공한다. 또 다른 예로서, 본 개시내용은 HBB, 인자 VIII 및 HFE 내의 돌연변이 (예를 들어, 병원성 돌연변이)를 표적화하여 겸상 적혈구 질환, 베타-지중해빈혈 (예를 들어, Hb C 및 Hb E), 혈우병 및 혈색소증을 치료하는 치료적 가이드 RNA를 제공한다. 본원에 제공된 가이드 RNA는 염기 편집제 단백질 (예를 들어, 아데노신 염기 편집제)과 복합체화되어 유전자 또는 유전자 프로모터 내의 점 돌연변이를 생성할 수 있으며, 이는 병원성 돌연변이를 교정하거나, 비-병원성 점 돌연변이를 생성하거나, 또는 유전자의 발현을 조정할 (예를 들어, 증가시킬)할 수 있다.

아데노신 데아미나제 및 핵산 프로그램가능한 DNA 결합 단백질 (예를 들어, Cas9)을 사용하여 폴리뉴클레오티드 (예를 들어, DNA)를 변형시키는 조성물, 키트 및 방법이 본원에 제공된다. 본 개시내용의 일부 측면은 DNA와 관련하여 아데노신의 가수분해성 탈아미노화 (구아닌 (G)과 같이 염기 쌍을 형성하는 이노신을 형성함)를 촉매하는 핵염기 편집 단백질을 제공한다. DNA에 작용하는 공지된 자연 발생 아데노신 데아미나제는 존재하지 않는다. 대신에, 공지된 아데노신 데아미나제는 RNA (예를 들어, tRNA 또는 mRNA)에 작용한다. 이러한 결점을 극복하기 위해, 최초 데옥시아데노신 데아미나제를 진화시켜 DNA 기질을 받아들이고 데옥시아데노신 (dA)을 데옥시이노신으로 탈아미노화시키도록 하였다. 이러한 아데노신 데아미나제는 2017년 8월 3일에 출원된 국제 출원 번호: PCT/US2017/045,381에 기재되어 있고; 이의 전체 내용은 본원에 참조로 포함된다. 에스케리키아 콜라이(Escherichia coli)로부터의 tRNA에 작용하는 아데노신 데아미나제 (ADAT) (tRNA 아데노신 데아미나제 A, TadA)를 dCas9 또는 Cas9 니카제 도메인에 공유 융합시키고, 구축물의 데아미나제 부분에 돌연변이를 함유하는 융합 단백질을 조립하였다. 이. 콜라이 TadA (ecTadA) 이외에도, 다른 자연 발생 아데노신 데아미나제, 예컨대 인간 ADAR (RNA에 작용하는 아데노신 데아미나제), 마우스 ADA (아데노신 데아미나제) 및 인간 ADAT2가 dCas9 또는 Cas9 니카제 도메인에 융합되어 아데노신 핵염기 편집제 (ABE) 융합 단백질 구축물을 생성할 수 있다. 이들 융합 단백질의 방향적 진화는, 특히 게놈 편집의 현재 Cas9 뉴클레아제-매개된 HDR 방법과 비교하였을 때, 표적 A-T 염기 쌍을 G-C 염기 쌍으로 낮은 오프-타겟 변형 및 낮은 비율의 삽입결실(indel) (확률적 삽입 또는 결실) 형성 하에 효율적으로 전환시키는 프로그램가능한 아데노신 염기 편집제를 생성하였다. 본원에 개시된 ABE는 질환-연관 점 돌연변이의 교정 및 질환-억제 점 돌연변이의 도입 (예를 들어, 단일 뉴클레오티드 다형성) 둘 다에 사용될 수 있다.

핵염기 편집 단백질의 데아미나제 도메인 내의 돌연변이는 아데노신 데아미나제를 진화시킴으로써 제조되었다. 예를 들어, DNA 내의 아데노신을 탈아미노화시킬 수 있는 ecTadA 변이체는 서열식별번호(SEQ ID NO): 1의 하기 돌연변이: W23L, W23R, R26G, H36L, N37S, P48S, P48T, P48A, I49V, R51L, N72D, L84F, S97C, D108N, A106V, H123Y, G125A, A142N, S146C, D147Y, R152H, R152P, E155V, I156F, K157N 및 K161T 중 1개 이상을 포함한다. 그러나, DNA 내의 아데노신을 탈아미노화시킬 수 있는 변이체를 생성하기 위해 다른 아데노신 데아미나제에서 상동 돌연변이가 만들어질 수 있다는 것이 인지되어야 한다. 도 7은 본원에 개시된 방법에 유용할 수 있는 ecTadA 변이체를 예시한다.

본원에 제공된 예에서, 진화된 융합 단백질의 일반 구조를 갖는 예시적인 핵염기 편집제, 예컨대 ecTadA(D108X; X=G, V 또는 N)-XTEN-nCas9는 세포, 예컨대 진핵 세포 (예를 들어, Hek293T 포유동물 세포)에서 A에서 G로의 전이 돌연변이를 촉매하였다. 다른 예에서, 예시적인 핵염기 편집제는 2개의 ecTadA 도메인 및 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 함유한다. 2개의 ecTadA 도메인은 동일할 수 있거나 (예를 들어, 동종이량체), 또는 2개의 상이한 ecTadA 도메인일 수 있다 (예를 들어, 이종이량체 (예를 들어, 야생형 ecTadA 및 ecTadA(A106V/D108N))). 예를 들어, 핵염기 편집제는 일반 구조 ecTadA-ecTadA*-nCas9를 가질 수 있으며, 여기서 ecTadA*는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 진화된 ecTadA를 나타낸다. 본원에 제공된 ecTadA 변이체를 함유하는 핵염기 편집제의 추가의 예는 포유동물 세포에서의 핵염기 편집제의 성능 개선을 입증한다.

어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 본원에 기재된 아데노신 핵염기 편집제는 DNA 내의 A 염기를 탈아미노화시키는 ecTadA 변이체를 사용하여 이노신 형성을 통해 A에서의 G로의 돌연변이를 유발함으로써 작용한다. 이노신은 우선적으로 C와 수소 결합하여 DNA 복제 동안 A에서 G로의 돌연변이를 유발한다. Cas9 (또는 또 다른 핵산 프로그램가능한 DNA 결합 단백질)에 공유 테더링되는 경우에, 아데노신 데아미나제 (예를 들어, ecTadA)는 관심 유전자에 국재화되고 ssDNA 기질에서 A에서 G로의 돌연변이를 촉매한다. 이 편집제는 A에서 G로의 복귀가 요구되는 질환-관련 유전자에서 단일 뉴클레오티드 다형성 (SNP)을 표적화하고 되돌리는데 사용될 수 있다. 이 편집제는 또한 T에 대향하는 A를 G로 돌연변이시킴으로써 T에서 C로의 복귀가 요구되는 질환-관련 유전자에서 단일 뉴클레오티드 다형성 (SNP)을 표적화하고 되돌리는데 사용될 수도 있다. 이때, T는, 예를 들어 염기 절제 복구 메카니즘에 의해 C로 대체될 수 있거나, 또는 DNA 복제의 후속 라운드에서 변화될 수 있다. 따라서, 본원에 기재된 아데노신 염기 편집제는 A 핵염기를 탈아미노화시켜, 질환 또는 장애와 연관되지 않은 뉴클레오티드 서열을 제공할 수 있다. 일부 측면에서, 본원에 기재된 아데노신 염기 편집제는 유전자 프로모터 내의 아데노신 (A) 핵염기를 탈아미노화시키는데 유용할 수 있다. 일부 실시양태에서, 탈아미노화는 유전자의 전사를 유도하도록 한다. 유전자의 전사의 유도는 유전자에 의해 코딩되는 단백질 (예를 들어, 유전자 산물)의 발현의 증가를 일으킨다. 염기 편집제에 결합된 가이드 RNA (gRNA)는 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열이다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 서열식별번호: 838-845 중 어느 하나의 핵산 위치 14에서의 T (볼드체로 제시됨)를 포함하고, 위치 14에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열에서 T에서 C로의 돌연변이를 유발한다. 일부 실시양태에서, 표적 핵산은 서열식별번호: 838-845 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함한다. 일부 실시양태에서, 가이드 RNA는 프로모터 내의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 26개의 인접 핵산을 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 서열식별번호: 254-280 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 염기 편집제는 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질을 포함하고, (ii) 아데노신 데아미나제는 핵염기를 탈아미노화시키기 위해 관심 표적 서열에 상보적인 가이드 RNA와 조합되어 사용된다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제일 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 이. 콜라이 TadA (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함하는 ecTadA이다.

따라서, 일부 측면에서, 본원에 기재된 염기 편집제 및 가이드 RNA 복합체는 HBG1 및/또는 HBG2 유전자의 프로모터 내 C에서 T로의 돌연변이에 의해 유발되는 질환 또는 장애를 치료하는데 유용할 수 있다. 일부 실시양태에서, 질환 또는 장애는 혈액의 질환 또는 장애이다. 특정 실시양태에서, 질환 또는 장애는 빈혈이다. 일부 실시양태에서, 빈혈은 겸상 적혈구성 빈혈이다. 예를 들어, HBG1 및/또는 HBG2 유전자의 프로모터 내 -198C에서 T로의 돌연변이는 γ-글로빈 발현 수준의 감소를 일으켜, 겸상 적혈구 질환 (SCD) 및 β-지중해빈혈의 발생을 촉진할 수 있다. HBG1 및/또는 HBG2 유전자의 프로모터 내의 아데노신 핵염기의 탈아미노화는 프로모터 내의 T-A 염기 쌍이 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 아데노신 핵염기의 탈아미노화는 태아성 헤모글로빈의 유전성 지속 (HPFH)이 촉진되는 서열을 촉진한다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 단백질의 양의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG2 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG2 단백질의 양의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 및 HBG2 유전자 둘 다의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 및 HBG2 단백질 둘 다의 양의 증가를 일으킨다.

또 다른 측면에서, 본원에 기재된 아데노신 염기 편집제는 유전자 내의 아데노신 (A) 핵염기를 탈아미노화시켜 유전자 내의 점 돌연변이를 교정하는데 유용할 수 있다. 일부 실시양태에서, 유전자는 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발하는 코돈 내의 돌연변이를 포함할 수 있다. 염기 편집제에 결합된 가이드 RNA (gRNA)는 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 HFE 유전자 내의 핵산 서열이다. 일부 실시양태에서, HFE 유전자는 C에서 T로의 돌연변이를 포함한다. 본원에 기재된 염기 편집제 및 가이드 RNA 복합체에 의한 T에 상보적인 A 핵염기의 탈아미노화는 C에서 T로의 돌연변이를 교정한다 (예를 들어, 도 7 참조). 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열을 포함한다. 일부 실시양태에서, HFE 유전자는 Cys에서 Tyr로의 돌연변이 (예를 들어, C282Y)를 포함하는 인간 혈색소증 (HFE) 단백질을 코딩한다. 본원에 기재된 염기 편집제 및 가이드 RNA 복합체에 의한 T에 상보적인 A 핵염기의 탈아미노화는 HFE 단백질 내의 Cys에서 Tyr로의 돌연변이를 교정하여, 야생형 단백질의 발현을 유발한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, 표적 핵산은 서열식별번호: 854-861의 핵산 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 26개의 인접 핵산을 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 서열식별번호: 862-869의 핵산 서열 중 어느 하나의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열

를 포함한다. 일부 실시양태에서, 염기 편집제는 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질을 포함하고, (ii) 아데노신 데아미나제는 핵염기를 탈아미노화시키기 위해 관심 표적 서열에 상보적인 가이드 RNA와 조합되어 사용된다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제일 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 이. 콜라이 TadA (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함하는 ecTadA이다.

따라서, 일부 측면에서, 본원에 기재된 염기 편집제 및 가이드 RNA 복합체는 HFE 유전자 내 C에서 T로의 돌연변이에 의해 유발되는 질환 또는 장애를 치료하는데 유용할 수 있다. 일부 실시양태에서, 장애는 철 축적 장애이다. 일부 실시양태에서, 철 축적 장애는 유전성 혈색소증 (HHC)이다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 T-A 염기 쌍이 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자로부터 전사된 HFE 단백질 기능의 증가를 일으킨다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 철 축적 장애의 1종 이상의 증상을 호전시킨다.

일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 핵산 분자 내의 아데노신을 탈아미노화시킬 수 있다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 시험관내에서 접촉시키는 것을 포함한다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 생체내에서 접촉시키는 것을 포함한다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 접촉시키는 것을 포함하며, 여기서 세포는 대상체 내에 존재한다. 일부 실시양태에서, 세포는 불멸화 림프모구성 세포 (LCL)이다. 본 개시내용의 다른 측면은 Cas9 도메인 및 아데노신 데아미나제 도메인, 예를 들어 DNA 내의 아데노신을 탈아미노화시킬 수 있는 조작된 데아미나제 도메인을 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 융합 단백질은 핵 국재화 서열 (NLS), 이노신 염기 절제 복구의 억제제 (예를 들어, dISN) 및/또는 1종 이상의 링커 중 하나 이상을 포함한다.

일부 측면에서, 본 개시내용은 데옥시리보핵산 (DNA) 기질 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 제공한다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아, 예를 들어, 이. 콜라이 또는 에스. 아우레우스로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 TadA 데아미나제이다. 일부 실시양태에서, TadA 데아미나제는 이. 콜라이 TadA 데아미나제 (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, X는 G, N, V, A 또는 Y이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, X는 V, G, I, L 또는 A이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 및 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 및 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 A106X, D108X, D147X, E155X, L84X, H123X 및 I156X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y 및 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 A106X, D108X, D147X, E155X, L84X, H123X, I156X, H36X, R51X, S146X 및 K157X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y, I156F, H36L, R51L, S146C 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신은 A106X, D108X, D147X, E155V, L84X, H123X, I156X, H36X, R51X, S146X, K157X, W23X, P48X 및 R152X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y, I156F, H36L, R51L, S146C, K157N, W23R, P48A 및 R152P 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 본원에 제공된 아데노신 데아미나제는 본원에 제공된 돌연변이 중 1개 이상을 임의의 조합으로 함유할 수 있는 것으로 인지되어야 한다.

또 다른 측면에서, 본 개시내용은 광범위한 표적 서열 상용성을 갖는 아데노신 핵염기 편집제 (ABE)를 제공한다. 일반적으로, 천연 ecTadA는 tRNA^Arg의 안티코돈 루프의 서열 UAC (예를 들어, 표적 서열)에서의 아데닌을 탈아미노화한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 1개 이상의 ecTadA 도메인, 예컨대 본원에 제공된 임의의 아데노신 데아미나제를 포함하는 ABE의 유용성을 확장시키기 위해, 아데노신 데아미나제 단백질이 아데노신 핵염기 편집제 복합체의 편집 효율을 손상시키지 않으면서 프로토스페이서 서열 내의 폭넓게 다양한 표적 서열을 인식하도록 최적화되었다. 일부 실시양태에서, 표적 서열은 5'-NAN-3'이며, 여기서 N은 T, C, G 또는 A이다. 예를 들어, 표적 서열은 도 3a에 제시된다. 일부 실시양태에서, 표적 서열은 5'-TAC-3'를 포함한다. 일부 실시양태에서, 표적 서열은 5'-GAA-3'를 포함한다.

일부 실시양태에서, 염기 편집제는 서열식별번호: 707의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 708의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 709의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 710의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 711의 아미노산 서열을 포함하거나 이로 이루어진다.

또 다른 측면에서, 본 개시내용은 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), (ii) 아데노신 데아미나제를 포함하는 융합 단백질, 및 (iii) 융합 단백질을 관심 표적 서열에 지시하는 가이드 RNA를 포함하는 복합체; 및 임의로 제약상 허용되는 부형제를 포함하는 제약 조성물을 제공한다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제 도메인 또는 그의 임의의 조합일 수 있다. 일부 실시양태에서, napDNAbp는 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HBG1 및/또는 HBG2 유전자의 프로모터로 지시하는 가이드 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 핵산 서열은 서열식별번호: 846-853의 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HFE 유전자로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 핵산 서열은 서열식별번호: 862-870의 핵산 서열을 포함한다. 일부 실시양태에서, 제약 조성물은 그를 필요로 하는 대상체에게 (예를 들어, 질환 또는 장애를 치료하기 위해) 투여된다. 일부 실시양태에서, 대상체는 혈액 질환을 갖는다. 일부 실시양태에서, 혈액 질환은 빈혈이다. 일부 실시양태에서, 빈혈은 겸상 적혈구성 빈혈이다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖는다. 일부 실시양태에서, 철 축적 장애는 유전성 혈색소증 (HHC)이다. 또 다른 측면에서, 본 개시내용은 (a) (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) 아데노신 데아미나제를 포함하는 융합 단백질을 코딩하는 핵산 서열; (b) (a)의 서열의 발현을 구동하는 이종 프로모터; 및 (c) 가이드 RNA 백본을 코딩하는 발현 구축물을 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 RNA 백본 내로의 클로닝을 가능하게 하도록 위치된 클로닝 부위를 포함하는 것인 핵산 구축물을 포함하는 키트를 제공한다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제 도메인 또는 그의 임의의 조합일 수 있다. 일부 실시양태에서, napDNAbp는 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HBG1 및/또는 HBG2 유전자의 프로모터로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 서열식별번호: 838-845 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HFE 유전자로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 서열식별번호: 854-861 중 어느 하나의 핵산 서열을 포함한다.

상기 개요는 비제한적 방식으로 본원에 개시된 기술의 실시양태, 이점, 특색 및 용도의 일부를 예시하는 것으로 의도된다. 본원에 개시된 기술의 다른 실시양태, 이점, 특색 및 용도는 상세한 설명, 도면, 실시예 및 청구범위로부터 분명해질 것이다.

도 1a 내지 1c는 A·T에서 G·C로의 염기 편집제 (ABE)에 의한 염기 편집의 범주 및 개관을 보여준다. 도 1a: ClinVar 데이터베이스에서 공지된 병원성 인간 SNP를 교정하는데 요구되는 염기 쌍 변화의 상대 분포. 도 1b: 아데노신 (A)의 가수분해성 탈아미노화는 이노신 (I)을 형성하며, 이는 폴리머라제 효소에 의해 구아노신 (G)으로 판독된다. 도 1c: ABE-매개된 A·T에서 G·C로의 염기 편집 전략. ABE는 자연에 존재하는 것으로 공지되지 않은 가설 데옥시아데노신 데아미나제 및 촉매적으로 손상된 Cas9를 함유한다. 이들은 관심 이중-가닥 DNA 표적에 가이드 RNA-프로그램화 방식으로 결합하여, "R-루프" 복합체에서 단일 가닥 DNA의 소형 버블을 노출시킨다. 데옥시아데노신 데아미나제 도메인은 이러한 단일-가닥 버블 내에서 데옥시아데노신에서 데옥시이노신으로의 형성을 촉매한다. DNA 복구 또는 복제 후, 원래의 A·T 염기 쌍은 표적 부위에서 G·C 염기 쌍으로 대체된다.
도 2a 내지 2c는 ABE의 단백질 진화 및 조작을 보여준다. 도 2a: RNA 아데노신 데아미나제로부터 출발하여 DNA 데옥시아데노신 데아미나제를 진화시키는 전략. 이. 콜라이 세포의 라이브러리는 각각 촉매 기능상실 Cas9 (dCas9)에 융합된 돌연변이체 ecTadA (TadA*) 유전자를 발현하는 플라스미드, 및 항생제 내성을 회복시키기 위해 1개 이상의 A·T에서 G·C로의 돌연변이를 요구하는 결함성 항생제 내성 유전자를 발현하는 선택 플라스미드를 보유한다. 각 라운드의 돌연변이 및 선택에서 생존한 TadA* 변이체로부터의 돌연변이를 포유동물 ABE 아키텍처 내로 도입하고, 인간 세포에서 프로그램가능한 A·T에서 G·C로의 염기 편집 활성에 대해 검정하였다. 도 2b: 각 라운드의 진화로부터 발생하는 진화된 ABE의 하위세트의 유전자형. 본 연구에서 특징화된 모든 57개의 진화된 ABE 유전자형의 목록에 대해서는, 도 7을 참조한다. 이량체화 상태 (단량체, 진화된 TadA* 도메인의 동종이량체, 또는 야생형 TadA-진화된 TadA*의 이종이량체) 및 링커 길이 (아미노산의 수)가 또한 열거된다. 돌연변이는 이들이 확인된 진화 라운드에 기초하여 착색되어 있다. 도 2c: tRNAArg2와 복합체화된 에스. 아우레우스 TadA (제시되지 않음)의 구조 (PDB 2B3J)와 정렬된 이. 콜라이 TadA 데아미나제 구조 (PDB 1Z3A)의 3개의 도면. tRNA의 UAC 안티코돈 루프는 야생형 TadA의 내인성 기질이다. TadA 이량체 및 tRNA 안티코돈 루프가 좌측에 제시되고; 기질 아데노신 상류의 U의 리보스의 2' 히드록실 기 근처의 잔기가 중간에 제시되고; ABE 진화 동안 돌연변이되고 UAC 기질을 둘러싸는 잔기가 우측에 제시된다. 야생형 잔기는 각 라운드의 진화로부터 나타나는 돌연변이 및 도 2b에서의 유전자형 표에 상응하도록 착색되어 있다.
도 3a 내지 3c는 초기- 및 중간-단계 진화된 ABE가 인간 게놈 DNA 부위에서 A·T에서 G·C로의 염기 편집을 매개한다는 것을 보여준다. 도 3a: 19개의 인간 게놈 DNA 시험 부위 (좌측)와 상응하는 인간 염색체 상의 위치 (우측)의 표. 편집된 A (적색)의 서열 콘텍스트 (표적 모티프)가 각각의 부위에 대해 제시되어 있다. PAM 서열은 청색으로 제시되어 있다. 도 3b: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 1 및 라운드 2 ABE의 A·T에서 G·C로의 염기 편집 효율. 도 3c: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 3, 라운드 4 및 라운드 5 ABE의 A·T에서 G·C로의 염기 편집 효율. ABE2.9 편집이 비교를 위해 제시되어 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 동종이량체는 융합된 TadA*-TadA*-Cas9 니카제 아키텍처를 나타내고; 이종이량체는 융합된 wtTadA-TadA*-Cas9 니카제 아키텍처를 나타낸다. 서열은 상단에서 하단으로 서열식별번호: 91-109에 상응한다.
도 4a 및 4b는 후기-단계 진화된 ABE가 게놈 DNA 편집을 보다 큰 활성 및 보다 넓은 서열 상용성으로 매개한다는 것을 보여준다. 도 4a: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 6 및 라운드 7 ABE의 A·T에서 G·C로의 염기 편집 효율. ABE5.3 편집이 비교를 위해 제시되어 있다. 도 4b: HEK293T 세포 내 확장 세트의 인간 게놈 부위에서 라운드 6 및 라운드 7 ABE의 A·T에서 G·C로의 염기 편집 효율. 부위 1-17은 표적 A에 플랭킹된 모든 가능한 NAN 서열 콘텍스트를 집합적으로 포함한다. ABE5.3 편집이 비교를 위해 제시되어 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 도 4a 및 4b에 제시된 모든 ABE는 wtTadA-TadA*-Cas9 니카제 아키텍처의 이종이량체이다.
도 5a 내지 5c는 후기-단계 ABE의 활성 윈도우 및 생성물 순도를 보여준다. 도 5a: HEK293T 세포 내 각각의 프로토스페이서 위치 1-9에서 A가 함께 배치된 2개의 인간 게놈 DNA 부위에서 이들 위치에서의 후기-단계 ABE의 상대 A·T에서 G·C로의 염기 편집 효율. 값을 각각의 ABE = 1에 대해 각각의 2개 부위에서의 최대 관찰 효율에 대해 정규화하였다. 도 5b: HEK293T 세포 내 시험된 모든 19개의 인간 게놈 DNA 부위에 걸쳐 프로토스페이서 위치 1-18 및 20에서의 후기-단계 ABE의 상대 A·T에서 G·C로의 염기 편집 효율. 값을 각각의 ABE = 1에 대해 각각의 19개 부위에서의 최대 관찰 효율에 대해 정규화하였다. 도 5c: ABE7.10 또는 ABE7.9 및 상응하는 sgRNA로 처리된 HEK293T 세포 또는 비처리된 HEK293T 세포 내 2개의 대표적인 인간 게놈 DNA 부위에서의 생성물 분포. 삽입결실 빈도는 우측에 제시되어 있다. 도 5a 및 5b의 경우, 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 서열은 상단에서 하단으로 서열식별번호: 110-111에 상응한다.
도 6a 내지 6c는 ABE7.10-매개된 염기 편집 및 Cas9-매개된 HDR의 비교, 및 ABE7.10의 두 질환-관련 SNP에 대한 적용을 보여준다. 도 6a: ABE7.10 또는 Cas9 뉴클레아제 및 5개의 인간 게놈 DNA 부위에 표적화된 ssDNA 공여자 주형 (CORRECT HDR 방법41에 따름)으로 처리된 HEK293T 세포에서의 A·T에서 G·C로의 염기 편집 효율. 도 6b: 도 6a에 기재된 바와 같이 처리된 HEK293T 세포에서의 삽입결실 형성의 비교. 도 6c: 질환-억제 SNP를 설치하거나 또는 질환 유도 SNP를 교정하기 위한 ABE의 적용. 상단: HEK293T 세포에서 HBG1 및 HBG2 유전자의 프로모터 영역 내 ABE7.10-매개된 -198T→C로의 돌연변이 (서열분석 데이터 표에 제시된 것에 상보적인 가닥 상). 표적 A는 프로토스페이서의 위치 7에 있다. 하단: LCL 세포에서 HFE 유전자 내 C282Y 돌연변이의 ABE7.10-매개된 복귀. 이러한 돌연변이는 유전성 혈색소증의 통상적인 원인이다. 표적 A는 프로토스페이서의 위치 5에 있다.
도 7은 본 연구에 기재된 모든 ABE의 유전자형 표를 보여준다. 돌연변이는 이들이 확인된 진화 라운드에 기초하여 착색되어 있다.
도 8a 내지 8d는 추가의 초기-단계 ABE 변이체의 염기 편집 효율을 보여준다. 도 8a: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 Cas9 니카제에 융합된 다양한 야생형 RNA 아데닌 데아미나제의 A·T에서 G·C로의 염기 편집 효율. 값은 상이한 날에 수행된 3회의 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 도 8b: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 변경된 융합 배향 및 링커 길이를 갖는 ABE2 편집제의 A·T에서 G·C로의 염기 편집 효율. 도 8c: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 DNA 내의 이노신에 결합하는 2종의 단백질인 촉매적으로 불활성화된 알킬-아데노신 글리코실라제 (AAG) 또는 엔도뉴클레아제 V (엔도V)에 융합된 ABE2 편집제의 A·T에서 G·C로의 염기 편집 효율. 도 8d: HAP1 세포 내 AAG의 존재 또는 부재 하에 부위 1에서 ABE2.1의 A·T에서 G·C로의 염기 편집 효율. 도 8b 및 8c에서의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 9는 ABE2.1 및 각각의 6개의 인간 게놈 부위를 표적화하는 sgRNA로 처리된 HEK293T 세포의 고처리량 DNA 서열분석 분석을 보여준다. 하나의 대표적인 반복실험이 제시되어 있다. 비처리된 HEK293T 세포로부터의 데이터가 비교를 위해 제시되어 있다.
도 10a 내지 10c는 추가의 ABE2 및 ABE3 변이체의 염기 편집 효율, 및 이. 콜라이에서 항생제 선택 생존에 대한 TadA*-dCas9 융합체에의 A142N 부가의 효과를 보여준다. 도 10a: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 상이한 조작된 이량체 상태를 갖는 ABE2 변이체의 A·T에서 G·C로의 염기 편집 효율. 플롯팅된 데이터는 3회의 생물학적 반복실펌의 평균 값이다. 도 10b: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 이량체 상태 (TadA*-TadA*-Cas9 니카제의 동종이량체, 또는 야생형 TadA-TadA*-Cas9 니카제의 이종이량체), TadA-TadA 링커의 길이 및 TadA-Cas9 니카제 링커의 길이가 상이한 ABE3.1 변이체의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 도 10c: 스펙티노마이신 내성 유전자 내의 I89T 결함을 표적화하는 sgRNA 및 진화 라운드 4에서 확인된 A142N 돌연변이가 결여되거나 함유된 TadA*-dCas9 편집제를 발현하는 이. 콜라이 세포의 256 μg/mL의 스펙티노마이신 함유 2xYT 한천 상에서의 콜로니-형성 단위. 표적 부위에서 성공적인 A·T에서 G·C로의 염기 편집은 스펙티노마이신 내성을 회복시킨다. 도 10a 및 10b에서의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 11a 및 11b는 추가의 ABE5 변이체의 염기 편집 효율을 보여준다. 도 11a: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 라운드 5 라이브러리의 스펙티노마이신 선택으로부터 단리된 2개의 돌연변이 쌍을 갖는 2개의 ABE3.1 변이체의 A·T에서 G·C로의 염기 편집 효율. 도 11b: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 상이한 링커 길이를 갖는 ABE5 변이체의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 12a 내지 12c는 17개 게놈 부위에서 ABE7 변이체의 염기 편집 효율을 보여준다. HEK293T 세포 내 17개 인간 게놈 표적 DNA 부위에서 ABE7.1-7.5 (도 12a) 및 ABE7.6-7.10 (도 12b)의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 도 12c: U2OS 세포 내 6개 인간 게놈 표적 DNA 부위에서 ABE7.8-7.10의 A·T에서 G·C로의 염기 편집 효율. HEK293T 세포와 비교하여 U2OS 세포에서 관찰된 더 낮은 편집 효율은 두 세포주 사이의 형질감염 효율 차이와 일치하며; 본 연구에서 사용된 조건 하에 HEK293T 세포에서의 65-80%와 비교하여 U2OS 세포에서 ~40 내지 55%의 전형적인 형질감염 효율이 관찰되었다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 13은 수회 라운드의 진화 및 조작이 ABE 프로세싱성을 증가시켰다는 것을 보여준다. 각 라운드의 진화 및 조작으로부터 나타나는 가장 활성인 ABE에 대한 6 내지 17개의 인간 게놈 표적 DNA 부위에서의 근처 표적 A들 사이의 계산된 평균 정규화된 연관 불균형 (LD). 보다 높은 LD 값은 동일한 DNA 가닥 (동일한 서열분석 판독물) 내의 근처 A가 또한 편집될 경우 ABE가 A를 편집할 가능성이 더 크다는 것을 나타낸다. LD 값은 편집 효율과 독립적이도록 0 내지 1로 정규화된다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험으로부터의 정규화 LD 값의 평균 및 표준 편차를 반영한다.
도 14a 및 14b는 5개의 후기-단계 ABE 변이체 및 HBG1 및 HBG2의 프로모터 내의 -198T를 표적화하는 sgRNA로 처리된 HEK293T 세포의 고처리량 DNA 서열 분석을 보여준다. 하나의 대표적인 반복실험이 HBG1 (도 14a) 및 HBG2 (도 14b) 프로모터 표적에서 DNA 서열로 제시된다. ABE-매개된 염기 편집은 서열분석 데이터 표에 제시된 것에 상보적인 가닥 상에 -198T→C 돌연변이를 설치한다. 비처리된 HEK293T 세포로부터의 데이터가 비교를 위해 제시되어 있다.
도 15는 염기 편집제 ABE7.10 및 HBG1/2의 프로모터 영역을 표적화하는 12개의 gRNA를 사용하는 염기 편집 데이터를 보여준다. gRNA 표적 서열의 정체는 (1) 서열식별번호: 259, (2) 서열식별번호: 260, (3) 서열식별번호: 266, (4) 서열식별번호: 267, (5) 서열식별번호: 268, (6) 서열식별번호: 269, (7) 서열식별번호: 270, (8) 서열식별번호: 276, (9) 서열식별번호: 277, (10) 서열식별번호: 278, (11) 서열식별번호: 279, 및 (12) 서열식별번호: 280이다.

정의

본원 및 청구범위에 사용된 단수 형태는 문맥이 달리 명백하게 나타내지 않는 한 단수 및 복수 지시대상을 포함한다. 따라서, 예를 들어, "작용제"에 대한 언급은 단일 작용제 및 복수의 이러한 작용제를 포함한다.

용어 "데아미나제" 또는 "데아미나제 도메인"은 탈아미노화 반응을 촉매하는 단백질 또는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 각각 아데노신 또는 데옥시아데노신의 이노신 또는 데옥시이노신으로의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제 이다. 일부 실시양태에서, 아데노신 데아미나제는 데옥시리보핵산 (DNA) 내의 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매한다. 본원에 제공된 아데노신 데아미나제 (예를 들어 조작된 아데노신 데아미나제, 진화된 아데노신 데아미나제)는 임의의 유기체, 예컨대 박테리아로부터의 것일 수 있다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 유기체로부터의 자연 발생 데아미나제의 변이체이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연에서 발생하지 않는다. 예를 들어, 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연 발생 데아미나제에 대해 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일하다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아, 예컨대 이. 콜라이(E. coli), 에스. 아우레우스(S. aureus), 에스. 티피(S. typhi), 에스. 푸트레파시엔스(S. putrefaciens), 에이치. 인플루엔자에(H. influenzae) 또는 씨. 크레센투스(C. crescentus)로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 TadA 데아미나제이다. 일부 실시양태에서, TadA 데아미나제는 이. 콜라이 TadA 데아미나제 (ecTadA)이다. 일부 실시양태에서, TadA 데아미나제는 말단절단된 이. 콜라이 TadA 데아미나제이다. 예를 들어, 말단절단된 ecTadA는 전장 ecTadA에 비해 1개 이상의 N-말단 아미노산이 결여되어 있을 수 있다. 일부 실시양태에서, 말단절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19 또는 20개의 N-말단 아미노산 잔기가 결여되어 있을 수 있다. 일부 실시양태에서, 말단절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19 또는 20개의 C-말단 아미노산 잔기가 결여되어 있을 수 있다. 일부 실시양태에서, ecTadA 데아미나제는 N-말단 메티오닌을 포함하지 않는다.

일부 실시양태에서, TadA 데아미나제는 N-말단 말단절단된 TadA이다. 특정 실시양태에서, 아데노신 데아미나제는 하기 아미노산 서열을 포함한다:

일부 실시양태에서 TadA 데아미나제는 전장 이. 콜라이 TadA 데아미나제이다. 예를 들어, 특정 실시양태에서, 아데노신 데아미나제는 하기 아미노산 서열을 포함한다:

그러나, 본 출원에 유용한 추가의 아데노신 데아미나제는 통상의 기술자에게 분명할 것이고 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다. 예를 들어, 아데노신 데아미나제는 ADAT의 상동체일 수 있다. 예시적인 ADAT 상동체는 비제한적으로 하기를 포함한다:

스타필로코쿠스 아우레우스(Staphylococcus aureus) TadA:

바실루스 서브틸리스(Bacillus subtilis) TadA:

살모넬라 티피무리움(Salmonella typhimurium) (에스. 티피무리움) TadA:

슈와넬라 푸트레파시엔스(Shewanella putrefaciens) (에스. 푸트레파시엔스) TadA:

헤모필루스 인플루엔자에(Haemophilus influenzae) F3031 (에이치. 인플루엔자에) TadA:

카울로박터 크레센투스(Caulobacter crescentus) (씨. 크레센투스) TadA:

게오박터 술푸레두센스(Geobacter sulfurreducens) (지. 술푸레두센스) TadA:

용어 "염기 편집제 (BE)" 또는 "핵염기 편집제 (NBE)"는 핵산 서열 (예를 들어, DNA 또는 RNA) 내의 염기 (예를 들어, A, T, C, G 또는 U)에 변형을 가할 수 있는 폴리펩티드를 포함하는 작용제를 지칭한다. 일부 실시양태에서, 염기 편집제는 핵산 내의 염기를 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 분자 내의 염기를 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 내의 아데닌 (A)을 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 Cas9 단백질이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 뉴클레아제-불활성 Cas9 (dCas9)이다. 일부 실시양태에서, 염기 편집제는 염기 절제 복구의 억제제, 예를 들어 UGI 도메인 또는 dISN 도메인에 융합된다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 Cas9 니카제 및 염기 절제 복구의 억제제, 예컨대 UGI 또는 dISN 도메인을 포함한다. 일부 실시양태에서, 융합 단백질의 dCas9 도메인은 서열식별번호: 52의 D10A 및 H840A 돌연변이, 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 이는 Cas9 단백질의 뉴클레아제 활성을 불활성화킨다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 52의 D10A 돌연변이를 포함하고, 잔기 840에서의 히스티딘, 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 이는 Cas9가 핵산 듀플렉스의 단지 한 가닥만을 절단할 수 있게 한다. Cas9 니카제의 예는 서열식별번호: 35에 제시된다.

본원에 사용된 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 융합 단백질의 2개의 도메인, 예컨대, 예를 들어 뉴클레아제-불활성 Cas9 도메인 및 핵산-편집 도메인 (예를 들어, 아데노신 데아미나제)을 연결하는 결합 (예를 들어, 공유 결합), 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 Cas9 뉴클레아제 도메인을 포함한 RNA-프로그램가능한 뉴클레아제의 gRNA 결합 도메인, 및 핵산-편집 단백질의 촉매 도메인을 연결한다. 일부 실시양태에서, 링커는 dCas9 및 핵산-편집 단백질을 연결한다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치되거나, 그에 플랭킹되고, 공유 결합을 통해 서로 연결되어, 2개를 연결한다. 일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 링커는 5-100개 아미노산의 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산의 길이이다. 보다 긴 또는 보다 짧은 링커가 또한 고려된다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하며, 이는 또한 XTEN 링커로 지칭될 수 있다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함하며, 이는 또한 (SGGS)₂-XTEN-(SGGS)₂로 지칭될 수 있다. 일부 실시양태에서, 링커는 (SGGS)_n (서열식별번호: 37), (GGGS)_n (서열식별번호: 38), (GGGGS)_n (서열식별번호: 39), (G)_n, (EAAAK)_n (서열식별번호: 40), (GGS)_n, SGSETPGTSESATPES (서열식별번호: 10), (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801) 또는 (XP)_n 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이고, X는 임의의 아미노산이다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다.

본원에 사용된 용어 "돌연변이"는 서열, 예를 들어 핵산 또는 아미노산 서열 내의 잔기의 또 다른 잔기로의 치환, 또는 서열 내의 1개 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 전형적으로 원래 잔기에 이어서 서열 내의 그 잔기의 위치 및 이어서 새롭게 치환된 잔기의 정체를 확인함으로써 본원에 기재된다. 본원에 제공된 아미노산 치환 (돌연변이)을 만드는 다양한 방법은 관련 기술분야에 널리 공지되어 있고, 예를 들어 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4^th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))]에 제공되어 있다.

용어 "핵 국재화 서열" 또는 "NLS"는, 예를 들어 핵 수송에 의한 세포 핵 내로의 단백질의 도입을 촉진하는 아미노산 서열을 지칭한다. 핵 국재화 서열은 관련 기술분야에 공지되어 있고 통상의 기술자에게 분명할 것이다. 예를 들어, NLS 서열은 2000년 11월 23일 출원되고 2001년 5월 31일에 WO/2001/038547로 공개된 국제 PCT 출원 PCT/EP2000/011690 (Plank et al.)에 기재되어 있으며, 상기 문헌의 내용은 예시적인 핵 국재화 서열의 개시내용에 대해 본원에 참조로 포함된다. 일부 실시양태에서, NLS는 아미노산 서열 PKKKRKV (서열식별번호: 4), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 5), MKRTADGSEFEPKKKRKV (서열식별번호: 342), 또는 KRTADGSEFEPKKKRKV (서열식별번호: 343)를 포함한다.

용어 "핵산 프로그램가능한 DNA 결합 단백질" 또는 "napDNAbp"는 핵산 (예를 들어, DNA 또는 RNA), 예컨대 napDNAbp를 특이적 핵산 서열로 가이드하는 가이드 핵산과 회합되는 단백질을 지칭한다. 예를 들어, Cas9 단백질은 Cas9 단백질을 가이드 RNA에 상보적인 특정 DNA 서열로 가이드하는 가이드 RNA와 회합될 수 있다. 일부 실시양태에서, napDNAbp는 부류 2 미생물 CRISPR-Cas 이펙터이다. 일부 실시양태에서, napDNAbp는 Cas9 도메인, 예를 들어 뉴클레아제 활성 Cas9, Cas9 니카제 (nCas9) 또는 뉴클레아제 불활성 Cas9 (dCas9)이다. 핵산 프로그램가능한 DNA 결합 단백질의 예는, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3 및 아르고노트를 포함한다. 그러나, 핵산 프로그램가능한 DNA 결합 단백질은 또한 RNA에 결합하는 핵산 프로그램가능한 단백질을 포함한다는 것이 인지되어야 한다. 예를 들어, napDNAbp는 napDNAbp를 RNA로 가이드하는 핵산과 회합될 수 있다. 다른 핵산 프로그램가능한 DNA 결합 단백질은 이들이 본 개시내용에 구체적으로 열거되어 있지 않을 수 있더라도 또한 본 개시내용의 범주 내에 있다.

용어 "Cas9" 또는 "Cas9 뉴클레아제"는 Cas9 단백질, 또는 그의 단편 (예를 들어, Cas9의 활성, 불활성, 또는 부분적 활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA-가이드 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casn1 뉴클레아제 또는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)-연관 뉴클레아제로 지칭된다. CRISPR은 이동성 유전 요소 (바이러스, 전위가능 요소 및 접합 플라스미드)에 대한 보호를 제공하는 적응 면역계이다. CRISPR 클러스터는 스페이서, 선행 이동성 요소에 상보적인 서열, 및 표적 침입 핵산을 함유한다. CRISPR 클러스터는 전사되고, CRISPR RNA (crRNA)로 프로세싱된다. 유형 II CRISPR 시스템에서 프리-crRNA의 교정 프로세싱은 트랜스-코딩된 소형 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질을 요구한다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조된 프로세싱을 위한 가이드로서의 역할을 한다. 후속적으로, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 핵산내부분해로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 핵산내부분해로 절단된 다음, 핵산외부분해로 3'-5' 트리밍된다. 사실상, DNA-결합 및 절단은 전형적으로 단백질 및 둘 다의 RNA를 요구한다. 그러나, 단일 가이드 RNA ("sgRNA" 또는 간단히 "gNRA")는 crRNA 및 tracrRNA 둘 다의 측면을 단일 RNA 종 내로 혼입하도록 조작될 수 있다. 예를 들어, 문헌 [Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다. Cas9는 자기 대 비-자기를 구별하는 것을 돕기 위한 CRISPR 반복 서열 (PAM 또는 프로토스페이서 인접 모티프)에서의 짧은 모티프를 인식한다. Cas9 뉴클레아제 서열 및 구조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨). Cas9 오르토로그는 에스. 피오게네스(S. pyogenes) 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지는 않는 다양한 종에서 설명되었다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 문헌 [Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737] (그의 전체 내용은 본원에 참조로 포함됨)에 개시된 유기체 및 유전자좌로부터의 Cas9 서열을 포함한다. 일부 실시양태에서, Cas9 뉴클레아제는 불활성 (예를 들어, 불활성화된) DNA 절단 도메인을 가지며, 즉, Cas9는 니카제이다.

뉴클레아제-불활성화된 Cas9 단백질은 "dCas9" 단백질 (뉴클레아제-"기능상실" Cas9에 대한 것)로 상호교환가능하게 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질 (또는 그의 단편)을 생성하는 방법은 공지되어 있다 (예를 들어, 문헌 [Jinek et al., Science. 337:816-821(2012); Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28;152(5):1173-83] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨). 예를 들어, Cas9의 DNA 절단 도메인은 2종의 서브도메인인 HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하고, 반면에 RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H840A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, Cas9의 단편을 포함하는 단백질이 제공된다. 예를 들어, 일부 실시양태에서, 단백질은 다음 2개의 Cas9 도메인 중 1개를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 실시양태에서, Cas9 또는 그의 단편을 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9 또는 그의 단편에 대한 상동성을 공유한다. 예를 들어 Cas9 변이체는 야생형 Cas9에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는 야생형 Cas9와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 아미노산 변화를 가질 수 있다. 일부 실시양태에서, Cas9 변이체는 Cas9의 단편 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함하며, 이러한 단편은 야생형 Cas9의 상응하는 단편에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, 단편은 상응하는 야생형 Cas9의 아미노산 길이의 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5%이다.

일부 실시양태에서, 단편은 적어도 100개 아미노산의 길이이다. 일부 실시양태에서, 단편은 적어도 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250 또는 1300개 아미노산의 길이이다. 일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_017053.1, 서열식별번호: 47 (뉴클레오티드); 서열식별번호: 48 (아미노산))에 상응한다.

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, 야생형 Cas9는 서열식별번호: 49 (뉴클레오티드) 및/또는 서열식별번호: 50 (아미노산)에 상응하거나 또는 이를 포함한다:

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_002737.2, 서열식별번호: 51 (뉴클레오티드); 및 유니프롯 참조 서열: Q99ZW2, 서열식별번호: 52 (아미노산))에 상응한다.

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, Cas9는 하기로부터의 Cas9를 지칭한다: 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola) (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세(Spiroplasma taiwanense) (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에(Streptococcus iniae) (NCBI Ref: NC_021314.1); 벨리엘라 발티카(Belliella baltica) (NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴시(Psychroflexus torquisI) (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI Ref: YP_820832.1); 리스테리아 인노쿠아(Listeria innocua) (NCBI Ref: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni) (NCBI Ref: YP_002344900.1); 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus) (NCBI Ref: NZ_CP008934.1); 또는 네이세리아 메닌기티디스(Neisseria meningitidis) (NCBI Ref: YP_002342100.1); 또는 임의의 다른 유기체로부터의 Cas9.

일부 실시양태에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 1개 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 상응하거나, 또는 이를 부분적으로 또는 전체적으로 포함한다. 예를 들어, 일부 실시양태에서, dCas9 도메인은 서열식별번호: 52의 D10A 및 H840A 돌연변이 또는 또 다른 Cas9에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, dCas9는 서열식별번호: 53의 아미노산 서열을 포함한다.

dCas9 (D10A 및 H840A):

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, Cas9 도메인은 D10A 돌연변이를 포함하고, 반면에 위치 840 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 위치에서의 잔기는 서열식별번호: 52에 제공된 아미노산 서열에서의 히스티딘을 유지한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 촉매 잔기 H840의 존재는 표적화된 A에 대향하는 T를 함유하는 비-편집 (예를 들어, 비-탈아미노화) 가닥을 절단하기 위한 Cas9의 활성을 유지한다. H840의 회복 (예를 들어, dCas9의 A840으로부터)은 A를 함유하는 표적 가닥의 절단을 유발하지 않는다. 이러한 Cas9 변이체는 gRNA-한정된 표적 서열에 기초하여 특정 위치에서 단일-가닥 DNA 파괴 (닉)를 생성할 수 있어, 비-편집 가닥의 복구를 유도하여, 궁극적으로 비-편집 가닥 상의 T에서 C로의 변화를 유발한다. 이 과정의 개략적 표현은 도 1c에 제시되어 있다. 간략하게, 및 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, A-T 염기 쌍의 A는 아데노신 데아미나제, 예를 들어 DNA 내의 아데노신을 탈아미노화시키는 아데노신 데아미나제에 의해 이노신 (I)으로 탈아미노화될 수 있다. T를 갖는 비-편집 가닥을 니킹하는 것은 미스매치 복구 메카니즘을 통한 T의 제거를 용이하게 한다. UGI 도메인 또는 촉매 불활성 이노신-특이적 뉴클레아제 (dISN)는 이노신-특이적 뉴클레아제를 (예를 들어, 입체적으로) 억제할 수 있고, 이에 의해 이노신 (I)의 제거를 방지한다.

다른 실시양태에서, 예를 들어 뉴클레아제 불활성화된 Cas9 (dCas9)를 유발하는, D10A 및 H840A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예로서, D10 및 H840에서의 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내에서의 다른 치환 (예를 들어, HNH 뉴클레아제 서브도메인 및/또는 RuvC1 서브도메인 내에서의 치환)을 포함한다. 일부 실시양태에서, 서열식별번호: 10에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일한 dCas9의 변이체 또는 상동체 (예를 들어, 서열식별번호: 53의 변이체)가 제공된다. 일부 실시양태에서, 약 5개 아미노산, 약 10개 아미노산, 약 15개 아미노산, 약 20개 아미노산, 약 25개 아미노산, 약 30개 아미노산, 약 40개 아미노산, 약 50개 아미노산, 약 75개 아미노산, 약 100개 아미노산 또는 그 초과만큼 서열식별번호: 53보다 더 짧거나 더 긴 아미노산 서열을 갖는 dCas9의 변이체 (예를 들어, 서열식별번호: 53의 변이체)가 제공된다.

일부 실시양태에서, 본원에 제공된 바와 같은 Cas9 융합 단백질은 Cas9 단백질의 전장 아미노산 서열, 예를 들어 본원에 제공된 Cas9 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 바와 같은 융합 단백질은 전장 Cas9 서열을 포함하는 것이 아니라, 단지 그의 단편만을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하며, 여기서 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들어 그것이 단지 뉴클레아제 도메인의 말단절단된 형태만을 포함하거나 또는 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서 기능적 뉴클레아제 도메인을 포함하지 않는다.

적합한 Cas9 도메인 및 Cas9 단편의 예시적인 아미노산 서열은 본원에 제공되며, Cas9 도메인 및 단편의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 분명할 것이다.

일부 실시양태에서, Cas9는 하기로부터의 Cas9를 지칭한다: 코리네박테리움 울세란스 (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아 (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라 (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아 (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세 (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에 (NCBI Ref: NC_021314.1); 벨리엘라 발티카 (NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴시 (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스 (NCBI Ref: YP_820832.1); 리스테리아 인노쿠아 (NCBI Ref: NP_472073.1); 캄필로박터 제주니 (NCBI Ref: YP_002344900.1); 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus) (NCBI Ref: NZ_CP008934.1); 또는 네이세리아 메닌기티디스 (NCBI Ref: YP_002342100.1).

추가의 Cas9 단백질 (예를 들어, 뉴클레아제 기능상실 Cas9 (dCas9), Cas9 니카제 (nCas9) 또는 뉴클레아제 활성 Cas9)은, 그의 변이체 및 상동체를 포함하여, 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다. 예시적인 Cas9 단백질은, 비제한적으로, 하기 제공된 것을 포함한다. 일부 실시양태에서, Cas9 단백질은 뉴클레아제 기능상실 Cas9 (dCas9)이다. 일부 실시양태에서, dCas9는 아미노산 서열 (서열식별번호: 34)을 포함한다. 일부 실시양태에서, Cas9 단백질은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, nCas9는 아미노산 서열 (서열식별번호: 35)을 포함한다. 일부 실시양태에서, Cas9 단백질은 뉴클레아제 활성 Cas9이다. 일부 실시양태에서, 뉴클레아제 활성 Cas9는 아미노산 서열 (서열식별번호: 36)을 포함한다.

예시적인 촉매 불활성 Cas9 (dCas9):

예시적인 Cas9 니카제 (nCas9):

예시적인 촉매 활성 Cas9:

일부 실시양태에서, Cas9는 단세포형 원핵 미생물의 도메인 및 계를 구성하는 고세균 (예를 들어 나노고세균)으로부터의 Cas9를 지칭한다. 일부 실시양태에서, Cas9는 CasX 또는 CasY를 지칭하며, 이는 예를 들어 문헌 [Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다. 게놈-분해 메타유전체학을 사용하여, 생명체의 고세균 도메인에서 최초 보고된 Cas9를 포함한, 수많은 CRISPR-Cas 시스템이 확인되었다. 이 분기 Cas9 단백질은 활성 CRISPR-Cas 시스템의 일부로서 거의 연구되지 않은 나노고세균에서 발견되었다. 박테리아에서, 2종의 이전에 공지되지 않은 시스템인 CRISPR-CasX 및 CRISPR-CasY가 발견되었으며, 이는 이제껏 발견된 시스템 중 가장 소형이다. 일부 실시양태에서, Cas9는 CasX 또는 CasX의 변이체를 지칭한다. 일부 실시양태에서, Cas9는 CasY 또는 CasY의 변이체를 지칭한다. 다른 RNA-가이드 DNA 결합 단백질은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)로서 사용될 수 있고 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다.

일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 CasX 또는 CasY 단백질일 수 있다. 일부 실시양태에서, napDNAbp는 CasX 단백질이다. 일부 실시양태에서, napDNAbp는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 서열식별번호: 417-419 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 서열식별번호: 417-419 중 어느 하나의 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 CasX 및 CasY는 또한 본 개시내용에 따라 사용될 수 있다는 것이 인지되어야 한다.

본원에 사용된 용어 "유효량"은 목적하는 생물학적 반응을 도출해내기에 충분한 생물학적 활성제의 양을 지칭한다. 예를 들어, 일부 실시양태에서, 핵염기 편집제의 유효량은 핵염기 편집제에 의해 특이적으로 결합되고 돌연변이되는 표적 부위의 돌연변이를 유도하기에 충분한 핵염기 편집제의 양을 지칭할 수 있다. 일부 실시양태에서, 본원에 제공된 융합 단백질, 예를 들어 핵산 프로그램가능한 DNA 결합 단백질 및 데아미나제 도메인 (예를 들어, 아데노신 데아미나제 도메인)을 포함하는 융합 단백질의 유효량은 융합 단백질에 의해 특이적으로 결합되고 편집되는 표적 부위의 편집을 유도하기에 충분한 융합 단백질의 양을 지칭할 수 있다. 통상의 기술자에 의해 인지될 바와 같이, 작용제, 예를 들어 융합 단백질, 핵염기 편집제, 데아미나제, 하이브리드 단백질, 단백질 이량체, 단백질 (또는 단백질 이량체) 및 폴리뉴클레오티드의 복합체, 또는 폴리뉴클레오티드의 유효량은, 예를 들어 목적하는 생물학적 반응, 예를 들어 편집될 특이적 대립유전자, 게놈 또는 표적 부위, 표적화될 세포 또는 조직, 및 사용될 작용제와 같은 다양한 인자에 따라 달라질 수 있다.

본원에 사용된 용어 "핵산" 및 "핵산 분자"는 핵염기 및 산성 모이어티, 예를 들어 뉴클레오시드, 뉴클레오티드, 또는 뉴클레오티드의 중합체를 포함하는 화합물을 지칭한다. 전형적으로, 중합체 핵산, 예를 들어 3개 이상의 뉴클레오티드를 포함하는 핵산 분자는 선형 분자이며, 여기서 인접 뉴클레오티드는 포스포디에스테르 연결을 통해 서로 연결된다. 일부 실시양태에서, "핵산"은 개별 핵산 잔기 (예를 들어 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 3개 이상의 개별 뉴클레오티드 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체 (예를 들어, 일련의 적어도 3개의 뉴클레오티드)를 지칭하는 것으로 상호교환가능하게 사용될 수 있다. 일부 실시양태에서, "핵산"은 RNA 뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포괄한다. 핵산은, 예를 들어 게놈, 전사체, mRNA, tRNA, rRNA, siRNA, snRNA, 플라스미드, 코스미드, 염색체, 크로마티드 또는 다른 자연 발생 핵산 분자와 관련하여 자연 발생일 수 있다. 다른 한편으로, 핵산 분자는 비-자연 발생 분자, 예를 들어 재조합 DNA 또는 RNA, 인공 염색체, 조작된 게놈, 또는 그의 단편, 또는 합성 DNA, RNA, DNA/RNA 하이브리드이거나, 또는 비-자연 발생 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 추가로, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 예를 들어 포스포디에스테르 백본 이외의 것을 갖는 유사체를 포함한다. 핵산은 천연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생성되고, 임의로 정제되고, 화학적으로 합성 등이 될 수 있다. 적절한 경우, 예를 들어 화학적으로 합성된 분자의 경우, 핵산은 뉴클레오시드 유사체, 예컨대 화학적으로 변형된 염기 또는 당, 및 백본 변형을 갖는 유사체를 포함할 수 있다. 핵산 서열은 달리 나타내지 않는 한 5'에서 3'로의 방향으로 제시된다. 일부 실시양태에서, 핵산은 천연 뉴클레오시드 (예를 들어 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신 및 데옥시시티딘); 뉴클레오시드 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기 (예를 들어, 메틸화 염기); 삽입된 염기; 변형된 당 (예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스); 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트 및 5'-N-포스포르아미다이트 연결)이거나 또는 이를 포함한다.

본원에 사용된 용어 "프로모터"는 핵산 서열의 나머지 부분의 개시 및 전사 속도를 제어하는 핵산 서열의 제어 영역을 지칭한다. 프로모터는 또한 조절 단백질 및 분자, 예컨대 RNA 폴리머라제 및 다른 전사 인자가 결합할 수 있는 하위영역를 함유할 수 있다.

용어 "단백질", "펩티드" 및 "폴리펩티드"는 본원에서 상호교환가능하게 사용되며, 펩티드 (아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 상기 용어는 임의의 크기, 구조 또는 기능의 단백질, 펩티드 또는 폴리펩티드를 지칭한다. 전형적으로, 단백질, 펩티드 또는 폴리펩티드는 적어도 3개의 아미노산 길이일 것이다. 단백질, 펩티드 또는 폴리펩티드는 개별 단백질 또는 단백질의 집합을 지칭할 수 있다. 단백질, 펩티드 또는 폴리펩티드에서의 아미노산 중 1개 이상은, 예를 들어 화학 물질, 예컨대 탄수화물 기, 히드록실 기, 포스페이트 기, 파르네실 기, 이소파르네실 기, 지방산 기, 접합용 링커의 첨가, 관능화, 또는 다른 변형 등에 의해 변형될 수 있다. 단백질, 펩티드 또는 폴리펩티드는 또한 단일 분자일 수 있거나 또는 다중-분자 복합체일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단지 자연 발생 단백질 또는 펩티드의 단편일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 자연 발생, 재조합 또는 합성, 또는 그의 임의의 조합일 수 있다. 본원에 사용된 용어 "융합 단백질"은 적어도 2종의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩티드를 지칭한다. 1종의 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분에 또는 카르복시-말단 (C-말단) 단백질에 위치하며, 따라서 각각 "아미노-말단 융합 단백질" 또는 "카르복시-말단 융합 단백질"을 형성할 수 있다. 단백질은 핵산 편집 단백질의 상이한 도메인, 예를 들어 핵산 결합 도메인 (예를 들어, 표적 부위에 대한 단백질의 결합을 지시하는 Cas9의 gRNA 결합 도메인) 및 핵산 절단 도메인 또는 촉매 도메인을 포함할 수 있다. 일부 실시양태에서, 단백질은 단백질성 부분, 예를 들어 핵산 결합 도메인을 구성하는 아미노산 서열, 및 유기 화합물, 예를 들어 핵산 절단제로서 작용할 수 있는 화합물을 포함한다. 일부 실시양태에서, 단백질은 핵산, 예를 들어 RNA와 복합체로 존재하거나 또는 그와 회합된다. 본원에 제공된 임의의 단백질은 관련 기술분야에 공지된 임의의 방법에 의해 생성될 수 있다. 예를 들어, 본원에 제공된 단백질은 펩티드 링커를 포함하는 융합 단백질에 특별히 적합한 재조합 단백질 발현 및 정제를 통해 생성될 수 있다. 재조합 단백질 발현 및 정제를 위한 방법은 널리 공지되어 있고 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4^th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)] (이의 전체 내용은 본원에 참조로 포함됨)에 기재된 것을 포함한다.

용어 "RNA-프로그램가능한 뉴클레아제" 및 "RNA-가이드 뉴클레아제"는 본원에서 상호교환가능하게 사용되며, 절단을 위한 표적이 아닌 1개 이상의 RNA(들)와 복합체를 형성하는 (예를 들어, 그와 결합하거나 회합하는) 뉴클레아제를 지칭한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는, RNA와의 복합체로 존재하는 경우, 뉴클레아제:RNA 복합체로 지칭될 수 있다. 전형적으로, 결합된 RNA(들)는 가이드 RNA (gRNA)로 지칭된다. gRNA는 2개 이상의 RNA의 복합체로서, 또는 단일 RNA 분자로서 존재할 수 있다. 단일 RNA 분자로서 존재하는 gRNA는 단일-가이드 RNA (sgRNA)로 지칭될 수 있으며, "gRNA"는 단일 분자로서 또는 2개 이상의 분자의 복합체로서 존재하는 가이드 RNA를 지칭하는데 상호교환가능하게 사용된다. 전형적으로, 단일 RNA 종으로서 존재하는 gRNA는 다음 2개의 도메인을 포함한다: (1) 표적 핵산에 대한 상동성을 공유하는 (예를 들어, 표적에 대한 Cas9 복합체의 결합을 지시하는) 도메인 (가이드 서열로 지칭됨); 및 (2) Cas9 단백질에 결합하는 도메인. 일부 실시양태에서, 도메인 (1)은 HBG1 및/또는 HBG2 유전자의 프로모터 내의 서열과 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 서열 5'-GTGGGGAAGGGGCCCCCAAGAGG-3' (서열식별번호: 2)와 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 HFE 유전자 내의 서열과 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 서열 5'-TATACGTACCAGGTGGAGCACCCAGG-3' (서열식별번호: 3)와 상동성을 공유한다. 일부 실시양태에서, 도메인 (2)는 tracrRNA로 공지된 서열에 상응하며, 스템-루프 구조를 포함한다. 예를 들어, 일부 실시양태에서, 도메인 (2)는 문헌 [Jinek et al., Science 337:816-821(2012)] (이의 전체 내용은 본원에 참조로 포함됨)에 제공된 바와 같은 tracrRNA와 동일하거나 상동이다. gRNA의 다른 예 (예를 들어, 도메인 2를 포함하는 것)는 2013년 9월 6일에 출원된 발명의 명칭 "스위칭가능한 Cas9 뉴클레아제 및 그의 용도"인 미국 특허 가출원 U.S.S.N. 61/874,682, 및 2013년 9월 6일에 출원된 발명의 명칭 "기능적 뉴클레아제를 위한 전달 시스템"인 미국 특허 가출원 U.S.S.N. 61/874,746에서 발견될 수 있으며, 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, gRNA는 도메인 (1) 및 (2) 중 2개 이상을 포함하며, "연장된 gRNA"로 지칭될 수 있다. 예를 들어, 연장된 gRNA는, 예를 들어 본원에 기재된 바와 같이 2종 이상의 Cas9 단백질에 결합하고, 2개 이상의 별개의 영역에서 표적 핵산에 결합할 것이다. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함하며, 이는 상기 표적 부위에 대한 뉴클레아제/RNA 복합체의 결합을 매개하여, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는 (CRISPR-연관 시스템) Cas9 엔도뉴클레아제, 예를 들어 스트렙토코쿠스 피오게네스로부터의 Cas9 (Csn1)이다 (예를 들어, 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨).

RNA-프로그램가능한 뉴클레아제 (예를 들어, Cas9)는 DNA 절단 부위를 표적화하기 위해 RNA:DNA 혼성화를 사용하기 때문에, 이들 단백질은 원칙적으로 가이드 RNA에 의해 특정된 임의의 서열에 표적화될 수 있다. 부위-특이적 절단 (예를 들어, 게놈을 변형시키기 위함)을 위해 RNA-프로그램가능한 뉴클레아제, 예컨대 Cas9를 사용하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨).

본원에 사용된 용어 "대상체"는 개별 유기체, 예를 들어 개별 포유동물을 지칭한다. 일부 실시양태에서, 대상체는 인간이다. 일부 실시양태에서, 대상체는 비-인간 포유동물이다. 일부 실시양태에서, 대상체는 비-인간 영장류이다. 일부 실시양태에서, 대상체는 설치류이다. 일부 실시양태에서, 대상체는 양, 염소, 소, 고양이 또는 개이다. 일부 실시양태에서, 대상체는 척추동물, 양서류, 파충류, 어류, 곤충, 파리 또는 선충류이다. 일부 실시양태에서, 대상체는 연구용 동물이다. 일부 실시양태에서, 대상체는 유전자 조작되며, 예를 들어 유전자 조작된 비-인간 대상체이다. 대상체는 어느 한 성별일 수 있고 임의의 발달 단계에 있을 수 있다.

용어 "표적 부위"는 데아미나제 또는 데아미나제를 포함하는 융합 단백질 (예를 들어, 본원에 제공된 dCas9-아데노신 데아미나제 융합 단백질)에 의해 탈아미노화되는 핵산 분자 내의 서열을 지칭한다.

용어 "치료", "치료하다" 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 완화시키거나, 그의 발병을 지연시키거나 또는 그의 진행을 억제하는 것을 목표로 하는 임상 개입을 지칭한다. 본원에 사용된 용어 "치료", "치료하다" 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 완화시키거나, 그의 발병을 지연시키거나 또는 그의 진행을 억제하는 것을 목표로 하는 임상 개입을 지칭한다. 일부 실시양태에서, 치료는 1종 이상의 증상이 발생하였고/거나 질환이 진단된 후에 투여될 수 있다. 다른 실시양태에서, 치료는 증상의 부재 하에서, 예를 들어 증상의 발병을 예방 또는 지연시키거나, 또는 질환의 발병 또는 진행을 억제하기 위해 투여될 수 있다. 예를 들어, 치료는 증상의 발병 전에 (예를 들어, 증상의 병력에 비추어 및/또는 유전적 또는 다른 감수성 인자에 비추어) 걸리기 쉬운 개체에게 투여될 수 있다. 치료는 또한, 예를 들어 그의 재발을 방지 또는 지연시키기 위해, 증상이 해소된 후에 계속될 수 있다.

단백질 또는 핵산과 관련하여 본원에 사용된 용어 "재조합"은 자연에서 발생하는 것이 아니라 인간 조작의 생성물인 단백질 또는 핵산을 지칭한다. 예를 들어, 일부 실시양태에서, 재조합 단백질 또는 핵산 분자는 임의의 자연 발생 서열과 비교하여 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개의 돌연변이를 포함하는 아미노산 또는 뉴클레오티드 서열을 포함한다.

발명의 상세한 설명

본 개시내용의 일부 측면은 핵염기 아데닌을 탈아미노화시키는 단백질에 관한 것이다. 본 개시내용은 데옥시리보핵산 (DNA) 내의 데옥시아데노신 잔기의 아데닌을 탈아미노화 (즉, 아민 기 제거)시킬 수 있는 아데노신 데아미나제 단백질을 제공한다. 예를 들어, 본원에 제공된 아데노신 데아미나제는 DNA의 데옥시아데노신 잔기의 아데닌을 탈아미노화시킬 수 있다. 본 개시내용의 다른 측면은 아데노신 데아미나제 (예를 들어, 본원에 기재된 바와 같은 DNA 내의 데옥시아데노신을 탈아미노화시키는 아데노신 데아미나제) 및 특이적 뉴클레오티드 서열에 결합할 수 있는 도메인 (예를 들어, Cas9 또는 Cpf1 단백질)을 포함하는 융합 단백질을 제공한다. 아데노신 데아미나제에 의한 아데노신의 탈아미노화는 점 돌연변이를 유도할 수 있으며, 이 과정은 본원에서 핵산 편집으로 지칭된다. 예를 들어, 아데노신은 이노신 잔기로 전환될 수 있으며, 이는 전형적으로 시토신 잔기와 염기 쌍을 이룬다. 이러한 융합 단백질은 특히 핵산 서열의 표적화된 편집에 유용하다. 이러한 융합 단백질은 시험관내 DNA의 표적화된 편집, 예를 들어 돌연변이체 세포 또는 동물의 생성; 표적화된 돌연변이의 도입, 예를 들어 생체외 세포에서의, 예를 들어 대상체로부터 수득된 후 후속적으로 동일한 또는 또 다른 대상체 내로 재-도입되는 세포에서의 유전적 결함의 교정; 및 생체내 표적화된 돌연변이의 도입, 예를 들어 대상체에서의 질환-연관된 유전자 내 유전적 결함의 교정 또는 탈활성화 돌연변이의 도입에 사용될 수 있다. 예로서, A에서 G 또는 T에서 C로의 돌연변이를 만듦으로써 치료될 수 있는 질환은 본원에 제공된 핵염기 편집제를 사용하여 치료될 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 겸상 적혈구성 빈혈과 같은 특정 빈혈은 전형적으로 성인에서 침묵되는 태아성 헤모글로빈과 같은 헤모글로빈의 발현을 유도함으로써 치료될 수 있다. 한 예로서, HBG1 및 HBG2 유전자 발현을 구동하는 프로모터 내 -198T를 C로 돌연변이시키는 것은 HBG1 및 HBG2의 증가된 발현을 유발한다.

또 다른 예로, 유전자 내 G에서 A로의 돌연변이로부터 유발되는 장애의 부류는 철 축적 장애이며, 여기서 HFE 유전자는 C282Y 돌연변이체 HFE 단백질의 발현을 유발하는 G에서 A로의 돌연변이를 포함한다. 따라서, 본원에 기재된 아데노신 염기 편집제는 이러한 G에서 A로의 돌연변이의 표적화된 편집 (예를 들어, 표적화된 게놈 편집)에 이용될 수 있다. 본 발명은 데아미나제 및 핵염기 편집제를 이용하는, 데아미나제, 융합 단백질, 핵산, 벡터, 세포, 조성물, 방법, 키트, 시스템 등을 제공한다.

일부 실시양태에서, 본원에 제공된 핵염기 편집제는 1개 이상의 단백질 도메인을 함께 융합시켜 융합 단백질을 생성함으로써 제조될 수 있다. 특정 실시양태에서, 본원에 제공된 융합 단백질은 융합 단백질의 염기 편집 활성 (예를 들어, 효율, 선택성 및 특이성)을 개선시키는 1개 이상의 특색을 포함한다. 예를 들어, 본원에 제공된 융합 단백질은 감소된 뉴클레아제 활성을 갖는 Cas9 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 뉴클레아제 활성을 갖지 않는 Cas9 도메인 (dCas9), 또는 Cas9 니카제 (nCas9)로 지칭되는, 듀플렉스 DNA 분자의 한 가닥을 절단하는 Cas9 도메인을 가질 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 촉매 잔기 (예를 들어, H840) 돌연변이의 존재는 표적화된 A에 대향하는 T를 함유하는 비-편집 (예를 들어, 비-탈아미노화) 가닥을 절단하기 위한 Cas9의 활성을 유지한다. Cas9의 촉매 잔기의 돌연변이 (예를 들어, D10에서 A10으로)는 표적화된 A 잔기를 함유하는 편집된 가닥의 절단을 방지한다. 이러한 Cas9 변이체는 gRNA-한정된 표적 서열에 기초하여 특정 위치에서 단일-가닥 DNA 파괴 (닉)를 생성할 수 있어, 비-편집 가닥의 복구를 유도하여, 궁극적으로 비-편집 가닥 상의 T에서 C로의 변화를 유발한다.

아데노신 데아미나제

본 개시내용의 일부 측면은 아데노신 데아미나제를 제공한다. 일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 아데닌을 탈아미노화시킬 수 있다. 일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 DNA의 데옥시아데노신 잔기에서의 아데닌을 탈아미노화시킬 수 있다. 아데노신 데아미나제는 임의의 적합한 유기체 (예를 들어, 이. 콜라이)로부터 유래될 수 있다. 일부 실시양태에서, 아데닌 데아미나제는 본원에 제공된 임의의 돌연변이 (예를 들어, ecTadA에서의 돌연변이)에 상응하는 1개 이상의 돌연변이를 포함하는 자연 발생 아데노신 데아미나제이다. 관련 기술분야의 통상의 기술자는 관련 기술분야에 널리 공지된 방법, 예를 들어 서열 정렬 및 상동 잔기의 결정에 의해 임의의 상동 단백질 및 각각의 코딩 핵산에서 상응하는 잔기를 확인할 수 있을 것이다. 따라서, 관련 기술분야의 통상의 기술자는 본원에 기재된 임의의 돌연변이, 예를 들어 ecTadA에서 확인된 임의의 돌연변이에 상응하는 임의의 자연 발생 아데노신 데아미나제 (예를 들어, ecTadA에 대한 상동성을 갖는 것)에 돌연변이를 생성시킬 수 있을 것이다. 일부 실시양태에서, 아데노신 데아미나제는 원핵생물로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 에스케리키아 콜라이, 스타필로코쿠스 아우레우스, 살모넬라 티피, 슈와넬라 푸트레파시엔스, 헤모필루스 인플루엔자에, 카울로박터 크레센투스 또는 바실루스 서브틸리스로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 이. 콜라이로부터의 것이다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나제는 1개 이상의 돌연변이 (예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있다는 것이 인지되어야 한다. 본 개시내용은 임의의 데아미나제 도메인에 특정 퍼센트 동일성 플러스 본원에 기재된 임의의 돌연변이 또는 그의 조합을 제공한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160 또는 적어도 170개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108G, D108N, D108V, D108A 또는 D108Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 그러나, 추가의 데아미나제가 본원에 제공된 바와 같이 돌연변이될 수 있는 상동 아미노산 잔기를 확인하기 위해 유사하게 정렬될 수 있다는 것이 인지되어야 한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 A106X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155D, E155G 또는 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D147X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D147Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

본원에 제공된 임의의 돌연변이 (예를 들어, 서열식별번호: 1의 ecTadA 아미노산 서열에 기초함)는 다른 아데노신 데아미나제, 예컨대 에스. 아우레우스 TadA (saTadA) 또는 다른 아데노신 데아미나제 (예를 들어, 박테리아 아데노신 데아미나제) 내로 도입될 수 있다는 것이 인지되어야 한다. ecTadA에서의 돌연변이된 잔기에 상동인 다른 아데노신 데아미나제로부터의 아미노산 잔기를 확인하는 방법은 통상의 기술자에게 분명할 것이다. 따라서, ecTadA에서 확인된 임의의 돌연변이는 상동 아미노산 잔기를 갖는 다른 아데노신 데아미나제에서 만들어질 수 있다. 또한 본원에 제공된 임의의 돌연변이는 ecTadA 또는 또 다른 아데노신 데아미나제에서 개별적으로 또는 임의의 조합으로 만들어질 수 있다는 것인 인지되어야 한다. 예를 들어, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 D108N, A106V, E155V 및/또는 D147Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 함유할 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 하기 돌연변이의 군 (돌연변이의 군은 ";"으로 구분됨) 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다: D108N 및 A106V; D108N 및 E155V; D108N 및 D147Y; A106V 및 E155V; A106V 및 D147Y; E155V 및 D147Y; D108N, A106V, 및 E55V; D108N, A106V, 및 D147Y; D108N, E55V, 및 D147Y; A106V, E55V, 및 D147Y; 및 D108N, A106V, E55V, 및 D147Y. 그러나, 본원에 제공된 상응하는 돌연변이의 임의의 조합이 아데노신 데아미나제 (예를 들어, ecTadA)에서 만들어질 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 아데노신 데아미나제는 ecTadA에서 만들어진 개별 돌연변이 및 돌연변이의 조합을 확인시켜 주는 도 7에 제시된 돌연변이 중 1개 이상을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 본원에 제공된 임의의 돌연변이 또는 돌연변이의 조합을 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 L84X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 H123X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H123Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 I156X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84X, A106X, D108X, H123X, D147X, E155X 및 I156X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S2A, I49F, A106V, D108N, D147Y 및 E155V로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5 또는 6개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H8Y, A106T, D108N, N127S 및 K160S로 이루어진 군으로부터 선택된 1, 2, 3, 4 또는 5개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 A142X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A142N, A142D, A142G 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A142N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 H36X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 N37X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N37T 또는 N37S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N37S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 P48X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48T, P48S, P48A 또는 P48L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48T 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48A 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R51X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R51H 또는 R51L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R51L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 S146X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S146R 또는 S146C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S146C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 K157X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 W23X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R 또는 W23L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R152X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152P 또는 R52H 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152P 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152H 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R26X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R26G 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 I49X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 I49V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 N72X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N72D 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 S97X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S97C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 G125X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 G125A 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 K161X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 K161T 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, N37X, P48X, I49X, R51X, N72X, L84X, S97X, A106X, D108X, H123X, G125X, A142X, S146X, D147X, R152X, E155X, I156X, K157X 및/또는 K161X 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, W23R, H36L, P48S, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및/또는 K157N 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 상응하는 도 7에 제공된 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 및 D108X로부터 선택된 1 또는 2개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 및 D108N으로부터 선택된 1 또는 2개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X, D108X, D147X 및 E155X로부터 선택된 1, 2, 3 또는 4개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V, D108N, D147Y 및 E155V로부터 선택된 1, 2, 3 또는 4개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V, D108N, D147Y 및 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84X, A106X, D108X, H123X, D147X, E155X 및 I156X로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, P48X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, R152X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, R152X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 상응하는 도 7에 제공된 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이 중 1개 이상을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 도 7에 제공된 서열식별번호: 1의 변이체 또는 또 다른 아데노신 데아미나제에서의 상응하는 변이체를 포함하거나 이로 이루어진다.

아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제)는 도 7에 제시된 임의의 아데노신 데아미나제 (예를 들어, ecTadA 아데노신 데아미나제)에 제공된 돌연변이 중 1개 이상을 포함할 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 아데노신 데아미나제는 도 7에 제시된 임의의 아데노신 데아미나제 (예를 들어, ecTadA 아데노신 데아미나제)에 제공된 돌연변이의 조합을 포함한다. 예를 들어, 아데노신 데아미나제는 돌연변이 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N (서열식별번호: 1에 대한 것)을 포함할 수 있으며, 이는 도 7에서 ABE7.10으로 제시된다. 일부 실시양태에서, 아데노신 데아미나제는 돌연변이 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N (서열식별번호: 1에 대한 것)을 포함할 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 대해 하기 돌연변이의 조합 중 임의의 것을 포함하며, 여기서 조합의 각각의 돌연변이는 "_"로 분리되고 돌연변이의 각각의 조합은 괄호 사이에 있다:

일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160 또는 적어도 166개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제의 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제의 아미노산 서열로 이루어진다. 하기 제공된 ecTadA 서열은 ecTadA (서열식별번호: 1)로부터 N-말단 메티오닌 (M)이 부재하는 것이다. 하기 제공된 saTadA 서열은 saTadA (서열식별번호: 8)로부터 N-말단 메티오닌 (M)이 부재하는 것이다. 명확성을 위해, 다양한 아미노산 돌연변이를 확인하는데 사용된 아미노산 넘버링 스킴은 이. 콜라이 TadA 대한 ecTadA (서열식별번호: 1) 및 에스. 아우레우스 TadA 대한 saTadA (서열식별번호: 8)로부터 유래된다. 서열식별번호: 1 (ecTadA) 또는 서열식별번호: 8 (saTadA)에 대한 아미노산 돌연변이는 밑줄표시에 의해 나타나 있다.

핵염기 편집제의 Cas9 도메인

일부 측면에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 비제한적, 예시적인 Cas9 도메인이 본원에 제공된다. Cas9 도메인은 뉴클레아제 활성 Cas9 도메인, 뉴클레아제 불활성 Cas9 도메인 또는 Cas9 니카제일 수 있다. 일부 실시양태에서, Cas9 도메인은 뉴클레아제 활성 도메인이다. 예를 들어, Cas9 도메인은 듀플렉스 핵산의 양쪽 가닥 (예를 들어, 듀플렉스 DNA 분자의 양쪽 가닥)을 절단하는 Cas9 도메인일 수 있다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 바와 같은 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, Cas9 도메인은 뉴클레아제-불활성 Cas9 도메인 (dCas9)이다. 예를 들어, dCas9 도메인은 듀플렉스 핵산 분자의 어느 하나의 가닥을 절단하지 않고 듀플렉스 핵산 분자에 (예를 들어, gRNA 분자를 통해) 결합할 수 있다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 52에 제시된 아미노산 서열의 D10X 돌연변이 및 H840X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산 변화이다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 52에 제시된 아미노산 서열의 D10A 돌연변이 및 H840A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 한 예로서, 뉴클레아제-불활성 Cas9 도메인은 서열식별번호: 54에 제시된 아미노산 서열을 포함한다 (클로닝 벡터 pPlatTET-gRNA2, 수탁 번호 BAV54124).

예를 들어, 문헌 [Qi et al., "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression." Cell. 2013; 152(5):1173-83] 참조, 이의 전체 내용은 본원에 참조로 포함됨).

추가의 적합한 뉴클레아제-불활성 dCas9 도메인은 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 본 개시내용의 범주 내에 있다. 이러한 추가의 예시적인 적합한 뉴클레아제-불활성 Cas9 도메인은 D10A/H840A, D10A/D839A/H840A 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Prashant et al., CAS9 transcriptional activators for target specificity screening 및 paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838] 참조, 이의 전체 내용은 본원에 참조로 포함됨). 일부 실시양태에서 dCas9 도메인은 본원에 제공된 dCas9 도메인 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, Cas9 도메인은 Cas9 니카제이다. Cas9 니카제는 듀플렉스 핵산 분자 (예를 들어, 듀플렉스 DNA 분자)의 단지 1개의 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 표적 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성된 (그에 상보적인) 가닥을 절단함을 의미한다. 일부 실시양태에서, Cas9 니카제는 D10A 돌연변이를 포함하며, 서열식별번호: 52의 위치 840에 히스티딘 또는 서열식별번호: 108-357 중 임의의 것에서의 돌연변이를 갖는다. 한 예로서, Cas9 니카제는 서열식별번호: 35에 제시된 바와 같은 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 비-표적, 비-염기-편집 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성되지 않은 가닥을 절단함을 의미한다. 일부 실시양태에서, Cas9 니카제는 H840A 돌연변이를 포함하며, 서열식별번호: 52의 위치 10에 아스파르트산 잔기 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 갖는다. 일부 실시양태에서 Cas9 니카제는 본원에 제공된 Cas9 니카제 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 추가의 적합한 Cas9 니카제는 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 본 개시내용의 범주 내에 있다.

감소된 PAM 배타성을 갖는 Cas9 도메인

본 개시내용의 일부 측면은 상이한 PAM 특이성을 갖는 Cas9 도메인을 제공한다. 전형적으로, Cas9 단백질, 예컨대 에스. 피오게네스로부터의 Cas9 (spCas9)는 정규 NGG PAM 서열이 특정한 핵산 영역에 결합할 것을 요구하며, 여기서 "NGG" 내 "N"은 아데닌 (A), 티민 (T), 구아닌 (G) 또는 시토신 (C)이고, G는 구아닌이다. 이는 게놈 내에서 목적하는 염기를 편집하는 능력을 제한할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집 융합 단백질은, 예를 들어 표적 염기가 PAM의 대략 15개 염기 상류에 있는 4개의 염기 영역 (예를 들어, "탈아미노화 윈도우") 내인 정확한 위치에 놓일 필요가 있을 수 있다. 문헌 [Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016)]을 참조하며, 이의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 탈아미노화 윈도우는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 염기 영역 내이다. 일부 실시양태에서, 탈아미노화 윈도우는 PAM의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개 염기 상류에 있다. 따라서, 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 정규 (예를 들어, NGG) PAM 서열을 함유하지 않는 뉴클레오티드 서열에 결합할 수 있는 Cas9 도메인을 함유할 수 있다. 비-정규 PAM 서열에 결합하는 Cas9 도메인은 관련 기술분야에 기재되었으며, 통상의 기술자에게 분명할 것이다. 예를 들어, 비-정규 PAM 서열에 결합하는 Cas9 도메인은 문헌 [Kleinstiver, B. P., et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" Nature 523, 481-485 (2015); 및 Kleinstiver, B. P., et al., "Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33, 1293-1298 (2015)] (각각의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.

일부 실시양태에서, Cas9 도메인은 스타필로코쿠스 아우레우스로부터의 Cas9 도메인 (SaCas9)이다. 일부 실시양태에서, SaCas9 도메인은 뉴클레아제 활성 SaCas9, 뉴클레아제 불활성 SaCas9 (SaCas9d), 또는 SaCas9 니카제 (SaCas9n)이다. 일부 실시양태에서, SaCas9는 아미노산 서열 서열식별번호: 55를 포함한다. 일부 실시양태에서, SaCas9는 서열식별번호: 55의 N579X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 N을 제외한 임의의 아미노산이다. 일부 실시양태에서, SaCas9는 서열식별번호: 55의 N579A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 NNGRRT PAM 서열을 갖는 핵산 서열에 결합할 수 있으며, 여기서 N = A, T, C 또는 G 및 R = A 또는 G이다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781X, N967X 및 R1014X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781K, N967K 및 R1014H 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 1개 이상의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781K, N967K 또는 R1014H 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나의 아미노산 서열로 이루어진다.

예시적인 SaCas9 서열

밑줄표시 및 볼드체인 서열식별번호: 55의 잔기 N579는 돌연변이되어 (예를 들어, A579로) SaCas9 니카제를 생성할 수 있다.

예시적인 SaCas9n 서열

서열식별번호: 55의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 56의 잔기 A579는 밑줄표시되어 있고 볼드체이다.

예시적인 SaKKH Cas9

서열식별번호: 55의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 57의 잔기 A579는 밑줄표시되어 있고 볼드체이다. 서열식별번호: 55의 E781, N967 및 R1014로부터 돌연변이되어 SaKKH Cas9를 생성할 수 있는 서열식별번호: 57의 잔기 K781, K967 및 H1014는 밑줄표시되어 있고 이탤릭체이다.

일부 실시양태에서, Cas9 도메인은 스트렙토코쿠스 피오게네스로부터의 Cas9 도메인 (SpCas9)이다. 일부 실시양태에서, SpCas9 도메인은 뉴클레아제 활성 SpCas9, 뉴클레아제 불활성 SpCas9 (SpCas9d) 또는 SpCas9 니카제 (SpCas9n)이다. 일부 실시양태에서, SpCas9는 아미노산 서열 서열식별번호: 58을 포함한다. 일부 실시양태에서, SpCas9는 서열식별번호: 58의 D9X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 D를 제외한 임의의 아미노산이다. 일부 실시양태에서, SpCas9는 서열식별번호: 58의 D9A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인 또는 SpCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인 또는 SpCas9n 도메인은 NGG, NGA 또는 NGCG PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134E, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134E, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, G1217X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, G1217R, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, G1217R, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.

일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나의 아미노산 서열로 이루어진다.

예시적인 SpCas9

예시적인 SpCas9n

예시적인 SpEQR Cas9

서열식별번호: 58의 D1134, R1334 및 T1336으로부터 돌연변이되어 SpEQR Cas9를 생성할 수 있는 서열식별번호: 60의 잔기 E1134, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.

예시적인 SpVQR Cas9

서열식별번호: 58의 D1134, R1334 및 T1336으로부터 돌연변이되어 SpVQR Cas9를 생성할 수 있는 서열식별번호: 61의 잔기 V1134, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.

예시적인 SpVRER Cas9

서열식별번호: 58의 D1134, G1217, R1334 및 T1336으로부터 돌연변이되어 SpVRER Cas9를 생성할 수 있는 서열식별번호: 62의 잔기 V1134, R1217, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.

고충실도 Cas9 도메인

본 개시내용의 일부 측면은 본원에 제공된 핵염기 편집제의 고충실도 Cas9 도메인을 제공한다. 일부 실시양태에서, 고충실도 Cas9 도메인은 상응하는 야생형 Cas9 도메인과 비교하여, Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 정전기적 상호작용을 감소시키는 1개 이상의 돌연변이를 포함하는 조작된 Cas9 도메인이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, DNA의 당-포스페이트 백본과의 감소된 정전기적 상호작용을 갖는 고충실도 Cas9 도메인은 보다 적은 오프-타겟 효과를 가질 수 있다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 야생형 Cas9 도메인)은 Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 회합을 감소시키는 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인은 Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 회합을 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70% 또는 그 초과만큼 감소시키는 1개 이상의 돌연변이를 포함한다.

일부 실시양태에서, 본원에 제공된 임의의 Cas9 융합 단백질은 서열식별번호: 52에 제공된 아미노산 서열의 N497X, R661X, Q695X 및/또는 Q926X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, 본원에 제공된 임의의 Cas9 융합 단백질은 서열식별번호: 52에 제공된 아미노산 서열의 N497A, R661A, Q695A 및/또는 Q926A 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 52에 제공된 아미노산 서열의 D10A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 본원에 제공된 임의의 융합 단백질의 것)은 서열식별번호: 62에 제시된 바와 같은 아미노산 서열을 포함한다. 고충실도를 갖는 Cas9 도메인은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 분명할 것이다. 예를 들어, 고충실도를 갖는 Cas9 도메인은 문헌 [Kleinstiver, B.P., et al. "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects." Nature 529, 490-495 (2016); 및 Slaymaker, I.M., et al. "Rationally engineered Cas9 nucleases with improved specificity." Science 351, 84-88 (2015)] (각각의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.

본원에 제공된 임의의 염기 편집제, 예를 들어 본원에 제공된 아데노신 데아미나제 임의의 염기 편집제는 본원에 기재된 바와 같이 Cas9 도메인을 변형시킴으로써 고충실도 염기 편집제로 전환되어 고충실도 염기 편집제, 예를 들어 고충실도 아데노신 염기 편집제를 생성할 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 고충실도 Cas9 도메인은 dCas9 도메인이다. 일부 실시양태에서, 고충실도 Cas9 도메인은 nCas9 도메인이다.

서열식별번호: 10의 Cas9에 대한 돌연변이가 볼드체 및 밑줄로 제시된 고충실도 Cas9 도메인

핵산 프로그램가능한 DNA 결합 단백질

본 개시내용의 일부 측면은 단백질, 예컨대 염기 편집제를 특정 핵산 (예를 들어, DNA 또는 RNA) 서열에 가이드하는데 사용될 수 있는 핵산 프로그램가능한 DNA 결합 단백질을 제공한다. 핵산 프로그램가능한 DNA 결합 단백질은, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3, 및 아르고노트를 포함한다. Cas9와 상이한 PAM 특이성을 갖는 핵산 프로그램가능한 DNA 결합 단백질의 한 예는 프레보텔라 및 프란시셀라 1로부터의 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (Cpf1)이다. Cas9와 유사하게, Cpf1도 또한 부류 2 CRISPR 이펙터이다. Cpf1은 Cas9와는 다른 특색을 가지면서 강건한 DNA 간섭을 매개하는 것으로 밝혀졌다. Cpf1은 tracrRNA가 결여된 단일 RNA-가이드 엔도뉴클레아제이고, T-풍부 프로토스페이서-인접 모티프 (TTN, TTTN 또는 YTN)를 이용한다. 더욱이, Cpf1은 엇갈린 DNA 이중-가닥을 통해 DNA를 절단한다. 16종의 Cpf1-패밀리 단백질 중에서, 아시다미노코쿠스(Acidaminococcus) 및 라크노스피라세아에(Lachnospiraceae)로부터의 2종의 효소는 인간 세포에서의 효율적인 게놈-편집 활성을 갖는 것으로 밝혀져 있다. Cpf1 단백질은 관련 기술분야에 공지되어 있고, 이전에, 예를 들어 문헌 [Yamano et al., "Crystal structure of Cpf1 in complex with guide RNA and target DNA." Cell (165) 2016, p. 949-962] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.

일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 미생물 CRISPR-Cas 시스템의 단일 이펙터이다. 미생물 CRISPR-Cas 시스템의 단일 이펙터는, 비제한적으로, Cas9, Cpf1, C2c1, C2c2 및 C2c3을 포함한다. 전형적으로, 미생물 CRISPR-Cas 시스템은 부류 1 및 부류 2 시스템으로 나누어진다. 부류 1 시스템은 멀티서브유닛 이펙터 복합체를 갖고, 반면에 부류 2 시스템은 단일 단백질 이펙터를 갖는다. 예를 들어, Cas9 및 Cpf1은 부류 2 이펙터이다. Cas9 및 Cpf1 이외에, 3종의 특유한 부류 2 CRISPR-Cas 시스템 (C2c1, C2c2 및 C2c3)이 문헌 [Shmakov et al., "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems", Mol. Cell, 2015 Nov 5; 60(3): 385-397] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.

뉴클레아제 프로그램가능한 DNA 결합 단백질 및 아데노신 데아미나제를 포함하는 융합 단백질

본 개시내용의 일부 측면은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 염기 편집제이다. 일부 실시양태에서, napDNAbp는 Cas9 도메인, Cpf1 도메인, CasX 도메인, CasY 도메인, C2c1 도메인, C2c2 도메인, aC2c3 도메인 또는 아르고노트 도메인이다. 일부 실시양태에서, napDNAbp는 본원에 제공된 임의의 napDNAbp이다. 본 개시내용의 일부 측면은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. Cas9 도메인은 본원에 제공된 Cas9 도메인 또는 Cas9 단백질 (예를 들어, dCas9 또는 nCas9) 중 임의의 것일 수 있다. 일부 실시양태에서, 본원에 제공된 Cas9 도메인 또는 Cas9 단백질 (예를 들어, dCas9 또는 nCas9) 중 임의의 것은 본원에 제공된 임의의 아데노신 데아미나제와 융합될 수 있다. 일부 실시양태에서, 융합 단백질은 하기 구조를 포함한다:

NH₂-[아데노신 데아미나제]-[napDNAbp]-COOH; 또는

NH₂-[napDNAbp]-[아데노신 데아미나제]-COOH

일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp (예를 들어, Cas9 도메인)를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 실시양태에서, 링커는 아데노신 데아미나제 도메인과 napDNAbp 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 실시양태에서 아데노신 데아미나제 및 napDNAbp는 하기 "링커" 표제의 섹션에 제공된 임의의 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 1 내지 200개의 아미노산을 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 1 내지 5, 1 내지 10, 1 내지 20, 1 내지 30, 1 내지 40, 1 내지 50, 1 내지 60, 1 내지 80, 1 내지 100, 1 내지 150, 1 내지 200, 5 내지 10, 5 내지 20, 5 내지 30, 5 내지 40, 5 내지 60, 5 내지 80, 5 내지 100, 5 내지 150, 5 내지 200, 10 내지 20, 10 내지 30, 10 내지 40, 10 내지 50, 10 내지 60, 10 내지 80, 10 내지 100, 10 내지 150, 10 내지 200, 20 내지 30, 20 내지 40, 20 내지 50, 20 내지 60, 20 내지 80, 20 내지 100, 20 내지 150, 20 내지 200, 30 내지 40, 30 내지 50, 30 내지 60, 30 내지 80, 30 내지 100, 30 내지 150, 30 내지 200, 40 내지 50, 40 내지 60, 40 내지 80, 40 내지 100, 40 내지 150, 40 내지 200, 50 내지 60 50 내지 80, 50 내지 100, 50 내지 150, 50 내지 200, 60 내지 80, 60 내지 100, 60 내지 150, 60 내지 200, 80 내지 100, 80 내지 150, 80 내지 200, 100 내지 150, 100 내지 200, 또는 150 내지 200개 아미노산의 길이를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 3, 4, 16, 24, 32, 64, 100 또는 104개 아미노산의 길이를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 SGSETPGTSESATPES (서열식별번호: 10), SGGS (서열식별번호: 37), SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385) 또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)의 아미노산 서열을 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 XTEN 링커로 또한 지칭될 수 있는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)₂-XTEN-(SGGS)₂로 또한 지칭될 수 있는 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801)을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다.

핵 국재화 서열 (NLS)을 포함하는 융합 단백질

일부 실시양태에서, 본원에 제공된 융합 단백질은 1개 이상의 핵 표적화 서열, 예를 들어 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 NLS를 포함하는 단백질의 세포 핵 내로의 도입 (예를 들어, 핵 수송에 의해)을 용이하게 하는 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 IBR (예를 들어, dISN)의 N-말단에 융합된다. 일부 실시양태에서, NLS는 IBR (예를 들어, dISN)의 C-말단에 융합된다. 일부 실시양태에서, NLS는 napDNAbp의 N-말단에 융합된다. 일부 실시양태에서, NLS는 napDNAbp의 C-말단에 융합된다. 일부 실시양태에서, NLS는 아데노신 데아미나제의 N-말단에 융합된다. 일부 실시양태에서, NLS는 아데노신 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, NLS는 1개 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커 없이 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 본원에 제공되거나 언급된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, NLS는 서열식별번호: 4 또는 서열식별번호: 5에 제시된 바와 같은 아미노산 서열을 포함한다. 추가의 핵 국재화 서열은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 분명할 것이다. 예를 들어, NLS 서열은 PCT/EP2000/011690 (Plank et al.)에 기재되어 있으며, 상기 문헌의 내용은 예시적인 핵 국재화 서열의 개시내용에 대해 본원에 참조로 포함된다. 일부 실시양태에서, NLS는 아미노산 서열 PKKKRKV (서열식별번호: 4), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 5), MKRTADGSEFEPKKKRKV (서열식별번호: 342), 또는 KRTADGSEFEPKKKRKV (서열식별번호: 343)를 포함한다.

일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp를 갖는 예시적인 융합 단백질의 일반적 아키텍처는 하기 구조 중 어느 하나를 포함하며, 여기서 NLS는 핵 국재화 서열 (예를 들어, 본원에 제공된 임의의 NLS), NH₂는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다.

아데노신 데아미나제, napDNAbp 및 NLS를 포함하는 융합 단백질.

NH₂-[NLS]-[아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;

NH₂-[아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;

NH₂-[NLS]-[napDNAbp]-[아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[NLS]-[아데노신 데아미나제]-COOH; 및

NH₂-[napDNAbp]-[아데노신 데아미나제]-[NLS]-COOH.

일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 아데노신 데아미나제, napDNAbp 및/또는 NLS) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.

본 개시내용의 일부 측면은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 적어도 2개의 아데노신 데아미나제 도메인을 포함하는 융합 단백질을 제공한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 아데노신 데아미나제의 이량체화 (예를 들어, 시스 또는 트랜스)는 융합 단백질이 핵산 염기를 변형시키는, 예를 들어 아데닌을 탈아미노화시키는 능력 (예를 들어, 효율)을 개선시킬 수 있다. 일부 실시양태에서, 융합 단백질 중 임의의 것은 2, 3, 4 또는 5개의 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 2개의 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 단지 2개의 아데노신 데아미나제만을 함유한다. 일부 실시양태에서, 아데노신 데아미나제는 동일하다. 일부 실시양태에서, 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 상이하다. 일부 실시양태에서, 제1 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이고, 제2 아데노신은 본원에 제공된 임의의 아데노신 데아미나제이지만 제1 아데노신 데아미나제와는 동일하지 않다. 한 예로서, 융합 단백질은 둘 다가 ecTadA (서열식별번호: 1)로부터의 A106V, D108N, D147Y 및 E155V 돌연변이를 함유하는 서열식별번호: 72의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 682의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 802의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 803의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 804의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 805의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 2개의 아데노신 데아미나제 도메인을 포함하는 추가의 융합 단백질 구축물이 도 7에 예시되어 있다.

일부 실시양태에서, 융합 단백질은 2개의 아데노신 데아미나제 (예를 들어, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제)를 포함한다. 일부 실시양태에서, 융합 단백질은 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 제1 아데노신 데아미나제는 융합 단백질에서 제2 아데노신 데아미나제의 N-말단에 있다. 일부 실시양태에서, 제1 아데노신 데아미나제는 융합 단백질에서 제2 아데노신 데아미나제의 C-말단. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 데아미나제는 직접적으로 또는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 본원에 제공된 임의의 링커, 예를 들어 "링커" 섹션에 기재된 임의의 링커이다. 일부 실시양태에서, 링커는 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)₂-XTEN-(SGGS)₂로 또한 지칭될 수 있는 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801)을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 제1 아데노신 데아미나제는 제2 아데노신 데아미나제와 동일하다. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 본원에 기재된 아데노신 데아미나제 중 임의의 것이다. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 상이하다. 일부 실시양태에서, 제1 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이다. 일부 실시양태에서, 제2 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이지만 제1 아데노신 데아미나제와 동일하지 않다. 일부 실시양태에서, 제1 아데노신 데아미나제는 ecTadA 아데노신 데아미나제이다. 일부 실시양태에서, 제1 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질의 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 ecTadA (서열식별번호: 1)에서의 돌연변이, 또는 표 4에 제공된 구축물 (예를 들어, pNMG-371, pNMG-477, pNMG-576, pNMG-586 및 pNMG-616) 중 어느 하나에 제시된 바와 같은 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 융합 단백질은 표 4에서의 구축물 (예를 들어, pNMG-371, pNMG-477, pNMG-576, pNMG-586 및 pNMG-616) 중 어느 하나의 2개의 아데노신 데아미나제 (예를 들어, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제)를 포함한다.

일부 실시양태에서, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및 napDNAbp를 갖는 예시적인 융합 단백질의 일반적 아키텍처는 하기 구조 중 어느 하나를 포함하며, 여기서 NLS는 핵 국재화 서열 (예를 들어, 본원에 제공된 임의의 NLS)이고, NH₂는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다.

제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및 napDNAbp를 포함하는 융합 단백질.

NH₂-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;

NH₂-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;

일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및/또는 napDNAbp) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.

제1 아데노신 데아미나제, 제2 아데노신 데아미나제, napDNAbp 및 NLS를 포함하는 융합 단백질.

NH₂-[NLS]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제1 아데노신 데아미나제]-[NLS]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;

NH₂-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;

NH₂-[NLS]-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;

NH₂-[제1 아데노신 데아미나제]-[NLS]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;

NH₂-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS]-[제2 아데노신 데아미나제]-COOH;

NH₂-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-[NLS]-COOH;

NH₂-[NLS]-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[NLS]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제1 아데노신 데아미나제]-[NLS]-[제2 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[NLS]-COOH;

NH₂-[NLS]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제2 아데노신 데아미나제]-[NLS]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;

NH₂-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;

NH₂-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;

NH₂-[NLS]-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;

NH₂-[제2 아데노신 데아미나제]-[NLS]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;

NH₂-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]-[제1 아데노신 데아미나제]-COOH;

NH₂-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-[NLS]-COOH;

NH₂-[NLS]-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[NLS]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제2 아데노신 데아미나제]-[NLS]-[제1 아데노신 데아미나제]-COOH;

NH₂-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[NLS]-COOH;

일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제, napDNAbp 및/또는 NLS) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.

본 개시내용의 융합 단백질은 1개 이상의 추가의 특색을 포함할 수 있다는 것이 인지되어야 한다. 예를 들어, 일부 실시양태에서, 융합 단백질은 세포질 국재화 서열, 유출 서열, 예컨대 핵 유출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제 또는 검출에 유용한 서열 태그 포함할 수 있다. 본원에 제공된 적합한 단백질 태그는 또한 비오틴 카르복실라제 담체 단백질 (BCCP) 태그, myc-태그, 칼모둘린-태그, FLAG-태그, 헤마글루티닌 (HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질 (MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제 (GST)-태그, 녹색 형광 단백질 (GFP)-태그, 티오레독신-태그, S-태그, 소프태그 (예를 들어, 소프태그 1, 소프태그 3), 스트렙-태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그를 포함하나 이에 제한되지는 않는다. 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 분명할 것이다. 일부 실시양태에서, 융합 단백질은 1종 이상의 His 태그를 포함한다.

링커

특정 실시양태에서, 링커는 본원에 기재된 단백질 또는 단백질 도메인 중 임의의 것을 연결하는데 사용될 수 있다. 링커는 공유 결합만큼 단순할 수 있거나 또는 다수의 원자 길이의 중합체 링커일 수 있다. 특정 실시양태에서, 링커는 폴리펩티드이거나 또는 아미노산을 기재로 한다. 다른 실시양태에서, 링커는 펩티드-유사가 아니다. 특정 실시양태에서, 링커는 공유 결합 (예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로원자 결합 등)이다. 특정 실시양태에서, 링커는 아미드 연결의 탄소-질소 결합이다. 특정 실시양태에서, 링커는 시클릭 또는 비-시클릭, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 실시양태에서, 링커는 중합체 (예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 실시양태에서, 링커는 아미노알칸산의 단량체, 이량체 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 아미노알칸산 (예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 특정 실시양태에서, 링커는 아미노헥산산 (Ahx)의 단량체, 이량체 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 카르보시클릭 모이어티 (예를 들어, 시클로펜탄, 시클로헥산)를 기재로 한다. 다른 실시양태에서, 링커는 폴리에틸렌 글리콜 모이어티 (PEG)를 포함한다. 다른 실시양태에서, 링커는 아미노산을 포함한다. 특정 실시양태에서, 링커는 펩티드를 포함한다. 특정 실시양태에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 실시양태에서, 링커는 페닐 고리를 기재로 한다. 링커는 펩티드에서 링커로 친핵체 (예를 들어, 티올, 아미노)의 부착을 용이하게 하는 관능화된 모이어티를 포함할 수 있다. 임의의 친전자체는 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용자, 알킬 할라이드, 아릴 할라이드, 아실 할라이드 및 이소티오시아네이트를 포함하나 이에 제한되지는 않는다.

일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 결합 (예를 들어, 공유 결합), 유기 분자, 기, 중합체 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산의 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150 또는 150-200개 아미노산의 길이이다. 보다 긴 또는 보다 짧은 링커도 또한 고려된다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하며, 이는 또한 XTEN 링커로 지칭될 수 있다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)₂-XTEN-(SGGS)₂로 또한 지칭될 수 있는 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 (SGGS)_n (서열식별번호: 37), (GGGS)_n (서열식별번호: 38), (GGGGS)_n (서열식별번호: 39), (G)_n, (EAAAK)_n (서열식별번호: 40), (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801), (GGS)_n, SGSETPGTSESATPES (서열식별번호: 10), 또는 (XP)_n 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이고, X는 임의의 아미노산이다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다. 일부 실시양태에서, 링커는 SGSETPGTSESATPES (서열식별번호: 10) 및 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384)를 포함한다. 일부 실시양태에서, 링커는 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385)를 포함한다. 일부 실시양태에서, 링커는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)를 포함한다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다. 본원에 제공된 임의의 링커는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제; 아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제) 및 napDNAbp; napDNAbp 및 NLS; 또는 아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제) 및 NLS를 연결하는데 사용될 수 있다는 것이 인지되어야 한다.

일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로에 융합된 아데노신 데아미나제 및 napDNAbp를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로에 융합된 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 아데노신 데아미나제 (예를 들어, 제1 및/또는 제2 아데노신 데아미나제), 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), 및/또는 염기 복구의 억제제 (IBR)에 융합될 수 있는 NLS를 포함한다. 아데노신 데아미나제 (예를 들어, 조작된 ecTadA)와 napDNAbp (예를 들어, Cas9 도메인) 사이 및/또는 제1 아데노신 데아미나제와 제2 아데노신 데아미나제 사이에 다양한 링커 길이 및 가요성이 사용되어 (예를 들어, 형태 (GGGGS)_n (서열식별번호: 38), (GGGGS)_n (서열식별번호: 39) 및 (G)_n의 매우 가요성인 링커에서 형태 (EAAAK)_n (서열식별번호: 40), (SGGS)_n (서열식별번호: 37), SGSETPGTSESATPES (서열식별번호: 10) (예를 들어, 문헌 [Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82] (전체 내용은 본원에 참조로 포함됨) 및 (XP)_n의 보다 강성인 링커에 이르는 범위) 특정한 적용을 위한 데아미나제 활성을 위한 최적 길이를 달성할 수 있다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다. 일부 실시양태에서, 링커는 (GGS)_n 모티프를 포함하며, 여기서 n은 1, 3 또는 7이다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 아데노신 데아미나제 및 napDNAbp 및/또는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10), SGGS (서열식별번호: 37), SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385) 또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)₂-XTEN-(SGGS)₂로 또한 지칭될 수 있는 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다.

본 개시내용의 일부 측면은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 예시적인 융합 단백질은, 비제한적으로, 하기 융합 단백질을 포함한다 (명확성의 목적을 위해, 아데노신 데아미나제 도메인은 볼드체로 제시되고; ecTadA 데아미나제 도메인의 돌연변이는 볼드체 밑줄표시로 제시되고; XTEN 링커는 이탤릭체로 제시되고; UGI/AAG/EndoV 도메인은 볼드체 이탤릭체로 제시되고; NLS는 밑줄표시된 이탤릭체로 제시된다):

ecTadA(wt)-XTEN-nCas9-NLS:

ecTadA(D108N)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):

ecTadA(D108G)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):

ecTadA(D108V)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):

제1 라운드의 진화로부터 생성된 변이체 (박테리아에서) ecTadA(H8Y_D108N_N127S)-XTEN-dCas9:

제2 라운드의 진화로부터의 풍부화된 변이체 (박테리아에서) ecTadA (H8Y_D108N_N127S_E155X)-XTEN-dCas9; X=D, G 또는 V:

ABE7.7:

pNMG-624 아미노산 서열:

ABE3.2:

ABE5.3:

pNMG-558 아미노산 서열:

pNMG-576 아미노산 서열:

pNMG-577 아미노산 서열:

pNMG-586 아미노산 서열:

ABE7.2:

pNMG-620 아미노산 서열:

pNMG-617 아미노산 서열:

pNMG-618 아미노산 서열:

pNMG-620 아미노산 서열:

pNMG-621 아미노산 서열:

pNMG-622 아미노산 서열:

pNMG-623 아미노산 서열:

ABE6.3:

ABE6.4:

ABE7.8:

ABE7.9:

ABE7.10:

일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질과 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질과 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160, 적어도 170, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100, 적어도 1200, 적어도 1300, 적어도 1400, 적어도 1500, 적어도 1600, 적어도 1700, 적어도 1750 또는 적어도 1800개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.

핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)과 가이드 핵산의 복합체

본 개시내용의 일부 측면은 본원에 제공된 임의의 융합 단백질, 예를 들어 본원에 제공된 임의의 아데노신 염기 편집제 및 융합 단백질의 napDNAbp에 결합된 가이드 핵산을 포함하는 복합체를 제공한다. 일부 실시양태에서, 본 개시내용은 본원에 제공된 임의의 가이드 RNA에 결합된 본원에 제공된 임의의 융합 단백질 (예를 들어, 아데노신 염기 편집제)을 제공한다. 일부 실시양태에서, 융합 단백질 (예를 들어, 아데노신 염기 편집제)의 napDNAbp는 가이드 RNA에 결합된 Cas9 도메인 (예를 들어, dCas9, 뉴클레아제 활성 Cas9 또는 Cas9 니카제)이다. 일부 실시양태에서, 본원에 제공된 복합체는, 예를 들어 유전자 (예를 들어, HFE, HBB 또는 F8) 내의 점 돌연변이를 교정하거나 또는 프로모터 (예를 들어, HBG1 또는 HBG2 프로모터)를 돌연변이시켜 이러한 프로모터의 제어 하에 있는 1개 이상의 단백질 (예를 들어, 감마 글로빈 단백질)의 발현을 조정하기 위한 핵산 내 돌연변이를 생성하도록 구성된다.

일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 HBG1 또는 HBG2 유전자의 프로모터 영역, 예를 들어 인간 HBG1 또는 HBG2 유전자의 프로모터 영역 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 인간 헤모글로빈 서브유닛 감마 1 (HBG1)은 유전자 ID: 3047의 HBG1이다. 일부 실시양태에서, 인간 헤모글로빈 서브유닛 감마 2 (HBG2)는 유전자 ID: 3048의 HBG2이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 프로모터이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 인간 HBG1 또는 HBG2 프로모터이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 HBG1 또는 HBG2 유전자의 100 내지 300개 뉴클레오티드 상류에 있다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 HBG1 또는 HBG2 유전자의 100 내지 300, 110 내지 290, 120 내지 280, 130 내지 270, 140 내지 260, 150 내지 250, 160 내지 240, 160 내지 230, 170 내지 220, 180 내지 210 또는 190 내지 200개 뉴클레오티드 상류에 있다. 일부 실시양태에서, HBG1 발현을 구동하는 프로모터는 HBG1의 198개 뉴클레오티드 상류에 있는 T (-198T)를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질 (예를 들어, 아데노신 염기 편집제)과 복합체화된 gRNA는 HBG1 또는 HBG2에 대해 위치 -198에서 T를 표적화하도록 설계되어, T에서 C로의 돌연변이를 유도한다. 예시적인 HBG1 및 HBG2 프로모터 서열은 각각 서열식별번호: 344 및 345로서 제공된다. 예시적인 HBG1 및 HBG2 프로모터 영역은 예시적인 것이고 제한적인 것으로 의도되지 않음이 인지되어야 한다.

일부 실시양태에서, HBG1 또는 HBG2 프로모터는 하기 서열, 예컨대 핵산의 5' 말단에 CCT를 갖는 서열식별번호: 838-846, 297-323 및 서열식별번호: 838-846 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다.

일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 5' 말단에 CCT를 추가로 포함하는 서열식별번호: 838-845, 297-323 및 서열식별번호: 838-845) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. 프로모터 서열은 개체의 게놈 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간 게놈 내의 HBG1 또는 HBG2 프로모터 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.

일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 846-853 및 254-280 중 어느 하나를 포함하는 가이드 서열을 포함한다.

개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 846-853 및 254-280에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 846-853 및 254-280 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 846-853 및 254-280을 제공한다.

일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 혈색소증 (HFE) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 HFE 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, HFE 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 HFE 유전자이다. 일부 실시양태에서, HFE 유전자는 인간 HFE 유전자이다. 일부 실시양태에서, HFE 유전자는 유전자 ID: 3077의 HFE 유전자이며, 이는 또한 HH, HFE1, HLA-H, MVCD7 및 TFQTL2로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 이러한 유전자에 의해 코딩되는 HFE 단백질은 MHC 부류 I-유형 단백질과 유사하고 베타2-마이크로글로불린 (베타2M)과 회합하는 막 단백질이다. 이러한 단백질은 트랜스페린과 트랜스페린 수용체의 상호작용을 조절함으로써 철 흡수를 조절하는 기능을 하는 것으로 생각된다. 철 축적 장애인 유전성 혈색소증은 이러한 유전자 내의 결함으로부터 유발되는 열성 유전 장애이다. 적어도 9종의 대안적으로 스플라이싱된 변이체가 상기 유전자에 대해 기재되었다. 추가의 변이체가 또한 발견되었다.

HFE 유전자의 예시적인 코딩 서열이 하기에 제시되며, 여기서 아미노산 잔기 282의 Cys (C)에서 Tyr (Y)로의 돌연변이 (C282Y)를 야기하는, A로 돌연변이되는 야생형 G가 볼드체 및 밑줄로 제시된다. 일부 실시양태에서, 이러한 돌연변이는 혈색소증 (예를 들어, 유전성 혈색소증)을 유발한다:

상기 HFE 핵산 코딩 서열로부터 코딩되는 예시적인 HFE 아미노산 서열은 하기 (서열식별번호: 750)에 제시되며, 여기서 혈색소증에서 Y로 돌연변이되는 위치 282에서의 C가 볼드체 및 밑줄로 표시된다:

일부 실시양태에서, HFE 유전자는 HFE 유전자의 코딩 서열 내에 G에서 A로의 돌연변이를 포함하며, 이는 HFE 단백질에서 C에서 Y로의 돌연변이, 예를 들어 서열식별번호: 750에서의 C282Y 돌연변이를 야기한다. 일부 실시양태에서, HFE 유전자는 서열식별번호: 871의 핵산 잔기 845에 G에서 A로의 돌연변이를 포함하며, 이는 코딩된 HFE 단백질에서 C에서 Y로의 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 혈색소증을 유발하는 HFE에서의 C에서 Y로의 돌연변이 (예를 들어, 서열식별번호: 750의 C282Y 돌연변이)를 교정하도록 설계된다. HFE의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 혈색소증을 유발하는 HFE에서의 C에서 Y로의 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.

일부 실시양태에서, HFE 유전자는 하기 서열, 예컨대 핵산의 5' 말단에 CCT를 갖는 서열식별번호 854-861 및 서열식별번호: 854-861 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다. 하기 제공된 서열은 HFE 유전자의 코딩 서열의 부분의 역 상보체이다.

일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 854-861 및 5' 말단에 CCT를 갖는 서열식별번호: 854-861) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. HFE 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 HFE 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.

일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 862-869 중 어느 하나를 포함하는 가이드 서열을 포함한다.

개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 862-869에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 862-869 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 862-869를 제공한다.

일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 베타 글로빈 (HBB) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 HBB 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, HBB 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 HBB 유전자이다. 일부 실시양태에서, HBB 유전자는 인간 HBB 유전자이다. 일부 실시양태에서, HBB 유전자는 유전자 ID: 3043의 HBB 유전자이며, 이는 또한 ECYT6, CD113t-C 및 베타-글로빈으로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 헤모글로빈 서브유닛 베타는 글로빈 단백질이고, 이는 알파 글로빈 (HBA)과 함께, 성인 인간에서 헤모글로빈의 가장 흔한 형태를 구성한다. 유전자 내의 돌연변이는 유전 장애, 예컨대 겸상 적혈구 질환 및 베타 지중해빈혈, 예컨대 헤모글로빈 C 질환 (Hb C) 및 헤모글로빈 E 질환 (Hb E)과 연관된 단백질의 여러 변이체를 생산한다.

HBB 유전자의 예시적인 코딩 서열이 하기에 제시된다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, A에서 T로의 돌연변이) 겸상 적혈구 질환 (단백질 내의 E6V 돌연변이)을 유발한다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, G에서 A로의 돌연변이) Hb C (단백질 내의 E6K 돌연변이)를 유발한다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, G에서 A로의 돌연변이) HbE (단백질 내의 E26K 돌연변이)를 유발한다.

예시적인 HBB 유전자:

예시적인 HBB 아미노산 서열은 하기 (서열식별번호: 340)에 제시되며, 여기서 겸상 적혈구 질환에서 V로 돌연변이되거나 또는 Hb C에서 K로 돌연변이되는 위치 6에서의 E가 볼드체 및 밑줄로 표시된다. Hb E에서 K로 돌연변이되는 위치 26에서의 E가 또한 볼드체 및 밑줄로 표시된다.

일부 실시양태에서, HBB 유전자는 HBB 유전자의 코딩 서열 내에 G에서 A로 또는 A에서 T로의 돌연변이를 포함하고, 이는 HBB에서 E6V, E6K 또는 E26K 돌연변이, 예를 들어 서열식별번호: 340에서의 E6V, E6K 또는 E26K 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 각각 겸상 적혈구 질환, Hb C 및 Hb E를 유발하는 HBB에서의 E6V 돌연변이를 교정하거나 (예를 들어, 병원성 V 돌연변이에서 비-병원성 A 돌연변이로 변화시킴), E6K 또는 E26K 돌연변이를 교정하도록 설계된다. HBB의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 본원에 제공된 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.

일부 실시양태에서, HBB 유전자는 하기 서열, 예컨대 서열식별번호: 324-337 중 어느 하나의 핵산 서열 또는 그의 역 상보체를 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다.

일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 324-337) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함하는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. BB 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 HBB 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.

일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 281-294 중 어느 하나를 포함하는 가이드 서열을 포함한다. 서열식별번호: 281-290은 겸상 적혈구 질환을 치료하도록 설계된다 (예를 들어, E6V 돌연변이를 비-병원성인 위치 6에서의 A를 갖도록 변화시킴). 서열식별번호: 291은 Hb C를 치료하도록 설계된다 (예를 들어, E6K 돌연변이). 서열식별번호: 292-294는 Hb E를 치료하도록 설계된다 (예를 들어, E26K 돌연변이).

개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 281-294에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 281-294 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 281-294를 제공한다.

일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 응고 인자 VIII (F8) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 F8 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, F8 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 F8 유전자이다. 일부 실시양태에서, F8 유전자는 인간 F8 유전자이다. 일부 실시양태에서, F8 유전자는 유전자 ID: 2157의 F8 유전자이며, 이는 또한 AHF, F8B, F8C, HEMA, FVIII 및 DXS1253E로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, F8은 혈액 응고의 고유 경로에 참여하는 응고 인자 VIII을 코딩하고; 인자 VIII은 Ca⁺² 및 인지질의 존재 하에 인자 X를 활성화된 형태 Xa로 전환시키는 인자 IXa에 대한 보조인자이다. 이 유전자 내의 결함은 통상의 열성 X-연관 응고 장애인 A형 혈우병을 유발한다.

F8 유전자의 예시적인 코딩 서열은 서열식별번호: 347로 제공된다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, C에서 T로의 돌연변이) A형 혈우병 (단백질 내의 R612C 돌연변이)을 유발한다.

예시적인 응고 인자 VIII 아미노산 서열은 하기 (서열식별번호: 341)에 제시되며, 여기서 A형 혈우병에서 C로 돌연변이되는 위치 612에서의 R이 볼드체 및 밑줄로 표시된다.

일부 실시양태에서, F8 유전자는 F8 유전자의 코딩 서열 내에 C에서 T로의 돌연변이를 포함하고, 이는 응고 인자 VIII에서 R에서 C로의 돌연변이, 예를 들어 서열식별번호: 341에서의 R612C 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 A형 혈우병을 유발하는 F8에서의 R에서 C로의 (예를 들어, R612C) 돌연변이를 교정하도록 설계된다. F8의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 본원에 제공된 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.

일부 실시양태에서, F8 유전자는 하기 서열, 예컨대 서열식별번호: 338-339 중 어느 하나의 핵산 서열 또는 그의 역 상보체를 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다.

일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 338-339) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. F8 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 F8 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.

일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 295-296 중 어느 하나를 포함하는 가이드 서열을 포함하며, 이는 A형 혈우병을 치료하도록 설계된다 (예를 들어 서열식별번호: 341의, 예를 들어 R612C 돌연변이).

개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 295-296에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 295-295 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 295-296을 제공한다.

일부 실시양태에서, 가이드 핵산 (예를 들어, 가이드 RNA)은 15-150개 뉴클레오티드의 길이이고, 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드의 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150개 뉴클레오티드의 길이이다. 일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 본원에 제공된 임의의 HBG1 또는 HBG2 프로모터 서열 또는 본원에 제공된 임의의 HFE, HBB 또는 F8 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 인접 뉴클레오티드의 가이드 서열을 포함한다. 일부 실시양태에서, 표적 서열은 DNA 서열이다. 일부 실시양태에서, 표적 서열은 포유동물 게놈 내의 서열이다. 일부 실시양태에서, 표적 서열은 인간 게놈 내의 서열이다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접한다. 일부 실시양태에서, 가이드 핵산 (예를 들어, 가이드 RNA)은 질환 또는 장애, 예를 들어 태아성 헤모글로빈의 유전성 지속 (HPFH), 베타-지중해빈혈, 유전성 혈색소증 (HHC), 겸상 적혈구 질환, Hb C, Hb E 또는 혈우병 (예를 들어, A형 혈우병)과 연관된 서열에 상보적이다.

아데노신 데아미나제 및 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 도메인을 포함하는 융합 단백질을 사용하는 방법

본 개시내용의 일부 측면은 본원에 제공된 융합 단백질 또는 가이드 핵산 (예를 들어, gRNA) 및 핵염기 편집제를 포함하는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 측면은 DNA 또는 RNA 분자를 본원에 제공된 임의의 융합 단백질 및 적어도 1종의 가이드 핵산 (예를 들어, 가이드 RNA)과 접촉시키는 것을 포함하며, 여기서 가이드 핵산 (예를 들어, 가이드 RNA)은 표적 서열에 100% 상보적인 적어도 10개 (예를 들어, 적어도 10, 15, 20, 25 또는 30개)의 인접 뉴클레오티드의 서열 (예를 들어, DNA 표적 서열에 결합하는 가이드 서열)을 포함하는 것인 방법을 제공한다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접한다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접하지 않는다. 일부 실시양태에서, 표적 서열의 3' 말단은 AGC, GAG, TTT, GTG 또는 CAA 서열에 바로 인접한다.

헤모글로빈 발현

본 개시내용의 일부 측면은 세포 (예를 들어, 포유동물 세포)에 질환-억제 돌연변이를 도입하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 헤모글로빈 유전자 (예를 들어, HBG1 및/또는 HBG2)의 발현을 조정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBG1 및/또는 HBG2의 프로모터 영역에 A에서 T로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다.

희귀 양성 상태인 태아성 헤모글로빈의 유전성 지속 (HPFH)을 갖는 인간은 겸상 적혈구성 빈혈을 포함한 일부 β-글로빈 질환에 내성이 있다. 특정 환자에서, 이러한 표현형은 출생 즈음 인간에서는 통상 침묵되는 태아성 헤모글로빈의 지속 발현을 가능하게 하는 γ-글로빈 유전자 HBG1 및 HBG2의 프로모터 내의 돌연변이에 의해 매개된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, HBG1 또는 HBG2의 프로모터 영역 내의 1개 이상의 돌연변이를 생성하는 것은 HBG1 및/또는 HBG2의 발현을 증가시켜 β-글로빈 질환을 치료할 수 있다.

일부 실시양태에서, 방법은 HBG1 또는 HBG2 유전자의 프로모터를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시킴으로써 상기 프로모터 내의 아데노신 핵염기 (A)를 탈아미노화시키는 것을 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. HBG1 및 HBG2 유전자의 프로모터는 본원에 기재된 HBG1 및 HBG2 프로모터의 임의의 서열을 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 HBG1 또는 HBG2의 프로모터 서열 내의 표적 핵산 서열에 100% 상보적인 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40개 또는 그 초과의 인접 핵산을 포함한다.

일부 실시양태에서, 방법은 표적 서열을 니킹하는 것을 추가로 포함하며, 이는 핵산 프로그램가능한 결합 단백질 (napDNAbp), 예컨대 gRNA의 가이드 서열에 상보적인 표적 서열을 니킹하는 Cas9 니카제 (nCas9)를 사용함으로써 달성될 수 있다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:

서열식별번호: 297-323 중 어느 하나.

서열식별번호: 838-845의 핵산 중 임의의 것은 그의 5' 말단에 5'-CCT-3'를 추가로 포함할 수 있는 것으로 인지되어야 한다.

일부 실시양태에서, gRNA의 가이드 서열은 하기 핵산 서열을 포함한다:

서열식별번호: 254-280 중 어느 하나.

서열식별번호: 846-853 또는 254-280의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.

일부 실시양태에서, HBG1 또는 HBG2의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 프로모터 내의 T-A 염기 쌍이 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 태아성 헤모글로빈의 유전성 지속 (HPFH)과 연관된 서열을 생성한다. 태아성 헤모글로빈의 유전성 지속은, 일부 실시양태에서, 태아성 헤모글로빈 (예를 들어, 헤모글로빈 F)이 성인에서 발현되는 양성 상태를 특징으로 한다. 일부 실시양태에서, HPFH는 2세 이상, 5세 이상, 10세 이상, 15세 이상, 20세 이상, 25세 이상 또는 30세 이상의 대상체에서의 태아성 헤모글로빈의 발현을 특징으로 한다. 일부 실시양태에서, HPFH는 2세 이상, 5세 이상, 10세 이상, 15세 이상, 20세 이상, 25세 이상 또는 30세 이상의 정상 대상체에서 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80% 또는 그 초과 더 큰 수준으로 발현되는 경우에 성인에서 발현되는 것으로 간주된다.

일부 실시양태에서, HBG1 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG1 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, HBG2 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG2 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, HBG1 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG1 단백질 수준의 증가를 일으킨다. 일부 실시양태에서, HBG2 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG2를 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG2 단백질 수준의 증가를 일으킨다.

일부 실시양태에서, 방법은 시험관내, 예를 들어 배양된 세포에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 혈액 질환 또는 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 질환 또는 장애는 빈혈이다. 일부 실시양태에서, 빈혈은 철 결핍성 빈혈, 재생불량성 빈혈, 용혈성 빈혈, 지중해빈혈, 겸상 적혈구성 빈혈, 악성 빈혈, 또는 판코니 빈혈이다. 일부 실시양태에서, 질환 또는 장애는 글로빈 단백질을 코딩하는 유전자, 예를 들어 CYGB, HBA1, HBA2, HBB, HBD, HBE1, HBG1, HBG2, HBM, HBQ1, HBZ 또는 MB, 또는 이러한 유전자의 프로모터 내의 돌연변이에 의해 유발된다.

HFE 유전자 내의 돌연변이의 교정

본 개시내용의 일부 측면은 HFE 유전자 내의 점 돌연변이를 교정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HFE 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HFE 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HFE 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, HFE 유전자는 C에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질의 기능을 손상시킨다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, HFE 단백질의 기능은 철 흡수이다.

일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정한다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질 내의 Cys (C)에서 Tyr (Y)로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 HFE 단백질 내의 Cys에서 Tyr로의 돌연변이를 교정한다.

일부 실시양태에서, gRNA의 가이드 서열은 HFE 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:

서열식별번호: 854-861의 핵산 중 임의의 것은 그의 5' 말단에 5'-CCT-3'를 추가로 포함할 수 있는 것으로 인지되어야 한다.

서열식별번호: 862-869의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.

일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 T-A 염기 쌍이 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 HFE 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100% HFE 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈색소증의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 철 흡수 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 철 흡수 수준, 예를 들어 혈색소증을 갖지 않는 대상체에서의 철 흡수 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 철 흡수 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자로부터 전사된 HFE 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.

일부 실시양태에서, HFE 유전자는 세포, 예컨대 배양물 내의 세포 (예를 들어, 불멸화 림프모구성 세포 (LCL)) 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, HFE 유전자는 Cys에서 Tyr로의 돌연변이를 포함하는 HFE 단백질을 코딩한다. 일부 실시양태에서, HFE 단백질은 서열식별번호: 750의 아미노산 서열의 잔기 282에서의 Cys에서 Tyr로의 돌연변이 (C282Y)를 포함하며, 여기서 위치 282에서의 Cys는 볼드체로 제시된다:

일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 혈색소증을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 유전성 혈색소증 (HHC)을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 HFE 유전자 내의 돌연변이를 가지며, 여기서 A로 돌연변이되는 야생형 G (예를 들어, 서열식별번호: 871에서의 G845A 돌연변이)가, 예를 들어 서열식별번호: 750의 아미노산 잔기 282에서의 Cys (C)에서 Tyr (Y)로의 돌연변이 (C282Y)를 야기한다. 일부 실시양태에서, 이러한 돌연변이는 혈색소증 (예를 들어, 유전성 혈색소증)을 유발한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 철 축적 장애의 1종 이상의 증상을 호전시킨다.

HBB 유전자 내의 돌연변이의 교정/생성

본 개시내용의 일부 측면은 HBB 유전자 내의 점 돌연변이를 교정하거나 또는 비-병원성인 점 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBB 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBB 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBB 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, HBB 유전자는 A에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 베타 글로빈 단백질의 기능을 손상시킨다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 HBB 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, HBB 단백질의 기능은 산소 운반 능력이다. 일부 실시양태에서, A에서 T로의 돌연변이는 겸상 적혈구 질환을 유발하고, T:A 염기 쌍을 C:G 염기 쌍으로 변화시키는 것은 헤모글로빈의 중합 능력을, 예를 들어 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 감소시키는 비-병원성 점 돌연변이를 생성한다.

일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 HBB 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정하거나 또는 비-병원성 돌연변이를 생성한다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 HBB 단백질 내의 E에서 V로의 돌연변이 또는 E에서 K로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 HBB 단백질 내의 E에서 K로의 돌연변이를 교정한다. 예를 들어, T에 상보적인 아데노신 핵염기의 탈아미노화시키는 것은, 예를 들어 서열식별번호: 340과 비교하여 HBB 내의 E6K (Hb C) 또는 E26K (Hb E) 돌연변이를 교정한다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 병원성 돌연변이를 비-병원성 돌연변이로 변화시킨다. 예를 들어, HBB 내의 E6V 돌연변이 (예를 들어, 서열식별번호: 340과 비교하여)는 위치 6에서의 A를 생성하도록 돌연변이되어 (예를 들어, V6A 돌연변이) 비-병원성 돌연변이를 생성할 수 있다.

일부 실시양태에서, gRNA의 가이드 서열은 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, HBB 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:

서열식별번호: 281-294의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.

일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 유전자 내의 T-A 염기 쌍이 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 Hb C 또는 Hb E와 연관된 서열을 교정하도록 하거나; 또는 비-병원성 돌연변이를 생성하도록 한다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 HBB 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100% HBB 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자의 아데노신 핵염기를 탈아미노화시키는 것은 겸상 적혈구 질환, Hb C 또는 Hb E의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, HBB 유전자의 아데노신 핵염기를 탈아미노화시키는 것은 산소 운반 기능의 증가 또는 베타 글로빈의 중합의 감소 또는 겸상 적혈구화의 감소를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 산소 운반 기능 수준, 예를 들어 겸상 적혈구, Hb C 및/또는 Hb E를 갖지 않는 대상체에서의 산소 운반 기능 (예를 들어, 산소 포화도) 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 산소 운반 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 유전자로부터 전사된 HBB 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.

일부 실시양태에서, HBB 유전자는 세포, 예컨대 배양물 내의 세포 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, HBB 유전자는 E에서 V로 또는 E에서 K로의 돌연변이를 포함하는 HBB 단백질을 코딩한다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 V로의 돌연변이 (E6V)를 포함하며 (겸상 적혈구 질환), 여기서 위치 6에서의 E는 볼드체로 제시된다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 K로의 돌연변이 (E6K)를 포함하며 (Hb C), 여기서 위치 6에서의 E는 볼드체로 제시된다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 K로의 돌연변이 (E26K)를 포함하며 (Hb E), 여기서 위치 26에서의 E는 볼드체 및 밑줄로 제시된다.

일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 겸상 적혈구 질환 또는 베타-지중해빈혈을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 Hb C 또는 Hb E를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 HBB 유전자 내의 돌연변이를 가지며, 여기서 야생형 A가 T로 돌연변이되거나 야생형 G가 A로 돌연변이된다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 겸상 적혈구 질환, Hb C 또는 Hb E의 1종 이상의 증상을 호전시킨다.

F8 유전자 내의 돌연변이의 교정

본 개시내용의 일부 측면은 F8 유전자 내의 점 돌연변이를 교정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 F 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 F8 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, F8 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, F8 유전자는 C에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 응고 인자 VIII 단백질의 기능을 손상시킨다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 응고 인자 VIII 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, 응고 인자 VIII 단백질의 기능은 혈액 응고이다.

일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정한다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 인자 VIII 단백질 내의 R에서 C로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 단백질 내의 R에서 C로의 돌연변이를 교정한다.

일부 실시양태에서, gRNA의 가이드 서열은 F8 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, F8 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:

서열식별번호: 295-296의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.

일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 F8 유전자 내의 T-A 염기 쌍이 F8 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈우병 (예를 들어, A형 혈우병)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 단백질 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 인자 VIII 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100%로 인자 VIII 단백질 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈우병의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈액 응고 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 혈액 응고 기능 수준, 예를 들어 혈우병을 갖지 않는 대상체에서의 혈액 응고 기능 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 혈액 응고 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 F8 유전자로부터 전사된 인자 VIII 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.

일부 실시양태에서, F8 유전자는 세포, 예컨대 배양물 내의 세포 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, F8 유전자는 R에서 C로의 돌연변이를 포함하는 인자 VIII 단백질을 코딩한다. 일부 실시양태에서, 인자 VIII 단백질은 서열식별번호: 341의 아미노산 서열의 잔기 612에서의 R에서 C로의 돌연변이 (R612C)를 포함하며, 여기서 위치 612에서의 R은 볼드체로 제시된다:

일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 혈우병을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 A형 혈우병을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 F8 유전자 내의 돌연변이를 가지며, 여기서 A로 돌연변이되는 야생형 G는, 예를 들어 서열식별번호: 341의 아미노산 잔기 612에서의 R에서 C로의 돌연변이 (R612C)를 야기한다. 일부 실시양태에서, 이러한 돌연변이는 혈우병 (예를 들어, A형 혈우병)을 유발한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 혈우병의 1종 이상의 증상을 호전시킨다.

일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함한다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 점 돌연변이를 포함한다. 일부 실시양태에서, 융합 단백질 (예를 들어, 아데노신 데아미나제 및 Cas9 도메인을 포함함) 또는 복합체의 활성은 점 돌연변이의 교정을 유발한다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 G→A 또는 C→T 점 돌연변이를 포함하며, 여기서 돌연변이체 A 염기의 탈아미노화는 질환 또는 장애와 연관되지 않은 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 단백질을 코딩하고, 점 돌연변이는 코돈에 있으며, 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발한다. 일부 실시양태에서, 돌연변이체 A의 탈아미노화는 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발한다. 일부 실시양태에서, 돌연변이체 A의 탈아미노화는 야생형 아미노산을 코딩하는 코돈을 유발한다. 일부 실시양태에서, 접촉은 대상체의 생체내에서 이루어진다. 일부 실시양태에서, 대상체는 질환 또는 장애를 갖거나 갖는 것으로 진단되었다.

일부 실시양태는 본원에 제공된 DNA 편집 융합 단백질을 사용하는 방법을 제공한다. 일부 실시양태에서, 융합 단백질은 표적 핵염기, 예를 들어 A 잔기를 탈아미노화함으로써 점 돌연변이를 핵산 내로 도입하는데 사용된다. 일부 실시양태에서, 표적 핵염기의 탈아미노화는 유전적 결함의 교정, 예를 들어 유전자 산물에서의 기능 상실을 일으키는 점 돌연변이의 교정을 유발한다. 일부 실시양태에서, 유전적 결함은 질환 또는 장애, 예를 들어 유전성 혈색소증과 연관된다. 일부 실시양태에서, 본원에 제공된 방법은 유전자 (예를 들어, HBG1 또는 HBG2)의 발현을 조정하는 (예를 들어, 증가 또는 감소시키는) 점 돌연변이를 상기 유전자의 프로모터 내로 도입하기 위해 사용된다. 예를 들어, 일부 실시양태에서, DNA 편집 융합 단백질을 사용하여 점 돌연변이를 HBG1 또는 HBG2의 프로모터 영역 내로 도입함으로써 HBG1 또는 HBG2의 발현을 증가시키는 방법이 본원에 제공된다. 이러한 점 돌연변이는, 일부 실시양태에서, 대상체에서 HBG1 또는 HBG2의 발현을 증가시킬 수 있으며, 이는 겸상 적혈구성 빈혈을 포함한 β-글로빈 질환을 치료하는데 유용할 수 있다.

일부 실시양태에서, 본원에 제공된 방법의 목적은 게놈 편집을 통해 기능이상 유전자의 기능을 회복시키는 것이다. 본원에 제공된 핵염기 편집 단백질은, 예를 들어 인간 세포 배양물에서 질환-연관 돌연변이를 교정함으로써, 시험관내에서 유전자 편집-기반 인간 치료제에 대해 검증될 수 있다. 본원에 제공된 핵염기 편집 단백질, 예를 들어 핵산 프로그램가능한 DNA 결합 단백질 (예를 들어, Cas9) 및 아데노신 데아미나제 도메인을 포함하는 융합 단백질은 임의의 단일 점 G에서 A로 또는 C에서 T로의 돌연변이를 교정하는데 사용될 수 있다는 것이 통상의 기술자에 의해 이해될 것이다. 전자의 경우에, 돌연변이체 A에서 I로의 탈아미노화는 돌연변이를 교정하고, 후자의 경우에, 돌연변이체 T와 염기-쌍형성된 A의 탈아미노화, 이어서 복제 라운드 또는 이어서 염기 편집 복구 활성은 돌연변이를 교정한다.

본 개시내용은 본원에 제공된 DNA 편집 융합 단백질에 의해 교정될 수 있는 점 돌연변이와 연관되거나 그에 의해 유발되는 질환을 갖는 것으로 진단된 대상체의 치료 방법을 제공한다. 예를 들어, 일부 실시양태에서, 이러한 질환, 예를 들어 빈혈 또는 혈색소증을 갖는 대상체에게, 유전자 (예를 들어, HFE) 내의 점 돌연변이를 교정하거나 또는 유전자의 프로모터 영역 (예를 들어, HBG1 또는 HBG2의 프로모터 영역) 내로 돌연변이를 도입하는 아데노신 데아미나제 융합 단백질의 유효량을 투여하는 것을 포함하는 방법이 제공된다. 일부 실시양태에서, 질환은 유전 질환이다. 일부 실시양태에서, 질환은 빈혈과 연관된 질환이다. 일부 실시양태에서, 질환은 철 축적 질환 (예를 들어, 유전성 혈색소증)이다. 일부 실시양태에서, 질환은 리소솜 축적 질환이다. 점 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관 유전자 내로 도입함으로써 치료될 수 있는 다른 질환은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이며, 본 개시내용은 이에 관하여 제한되지 않는다.

일부 실시양태에서, 융합 단백질은 정규 PAM을 인식하고 따라서 플랭킹 서열에서 각각 정규 PAM, 예를 들어 NGG에 의해 병원성 G에서 A로 또는 C에서 T로의 돌연변이를 교정할 수 있다. 예를 들어, 정규 PAM을 인식하는 Cas9 단백질은 서열식별번호: 52에 의해 제공된 바와 같은 스트렙토코쿠스 피오게네스 Cas9의 아미노산 서열에 대해, 또는 서열식별번호: 52의 RuvC 및 HNH 도메인을 포함하는 그의 단편에 대해 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함한다.

본원에 개시된 바와 같은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질 중 임의의 것을 표적 부위, 예를 들어 편집될 점 돌연변이를 포함하는 부위에 표적화하기 위해, 전형적으로 융합 단백질을 가이드 RNA, 예를 들어 sgRNA와 함께 공-발현시킬 필요가 있다는 것은 관련 기술분야의 통상의 기술자에게 분명할 것이다. 본원의 다른 곳에서 보다 상세히 설명된 바와 같이, 가이드 RNA는 전형적으로 Cas9 결합을 허용하는 tracrRNA 프레임워크, 및 가이드 서열을 포함하며, 이는 Cas9:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여한다. 일부 실시양태에서, 가이드 RNA는 구조 5'-[가이드 서열]-guuuuagagcuagaaauagcaaguuaaaauaaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3' (서열식별번호: 389)를 포함하며, 여기서 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 일부 실시양태에서, 가이드 서열은 표 2에 제공된 뉴클레오티드 서열 중 임의의 것을 포함한다. 가이드 서열은 전형적으로 20개 뉴클레오티드의 길이이다. Cas9:핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위에 표적화하는데 적합한 가이드 RNA의 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 50개 뉴클레오티드 상류 또는 하류 내의 핵 서열에 상보적인 가이드 서열을 포함한다. 제공된 융합 단백질 중 임의의 것을 특이적 표적 서열에 표적화하는데 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다. 추가의 가이드 서열은 그의 유전자좌를 포함하여, 하기 표 3에 제시된다.

염기 편집제 효율

본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 비율의 삽입결실을 생성하지 않으면서 특이적 뉴클레오티드 염기를 변형시킬 수 있다는 인식에 기초한다. 본원에 사용된 "삽입결실"은 핵산 내의 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내의 프레임 시프트 돌연변이를 일으킬 수 있다. 일부 실시양태에서, 핵산에서 다수의 삽입 또는 결실 (즉, 삽입결실)을 생성하지 않으면서, 핵산 내의 특이적 뉴클레오티드를 효율적으로 변형시키는 (예를 들어 돌연변이시키거나 탈아미노화시키는) 염기 편집제를 생성하는 것이 바람직하다. 특정 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 보다 큰 비율의 의도된 변형 (예를 들어, 점 돌연변이 또는 탈아미노화) 대 삽입결실을 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 1:1 초과인 의도된 점 돌연변이 대 삽입결실의 비를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1 또는 적어도 1000:1 또는 그 초과의 의도된 점 돌연변이 대 삽입결실의 비를 생성할 수 있다. 의도된 돌연변이 및 삽입결실의 수는 임의의 적합한 방법, 예를 들어 하기 실시예에 사용된 방법을 사용하여 결정될 수 있다. 일부 실시양태에서, 삽입결실 빈도를 계산하기 위해, 서열분석 판독물을 삽입결실이 발생할 수 있는 윈도우의 양쪽 측면에 플랭킹되어 있는 2개의 10-bp 서열에 대한 정확한 매치에 대해 스캐닝한다. 정확한 매치가 위치하지 않는 경우에, 판독물을 분석으로부터 제외한다. 이 삽입결실 윈도우의 길이가 참조 서열에 정확하게 매치되는 경우에, 판독물을 삽입결실을 함유하지 않는 것으로서 분류한다. 삽입결실 윈도우가 참조 서열보다 2개 이상의 염기 더 길거나 더 짧은 경우에, 서열분석 판독물을 각각 삽입 또는 결실로서 분류한다.

일부 실시양태에서, 본원에 제공된 염기 편집제는 핵산의 영역에서의 삽입결실의 형성을 제한할 수 있다. 일부 실시양태에서, 영역은 염기 편집제에 의해 표적화되는 뉴클레오티드, 또는 염기 편집제에 의해 표적화되는 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오티드 내의 영역에 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 핵산의 영역에서의 삽입결실의 형성을 1% 미만, 1.5% 미만, 2% 미만, 2.5% 미만, 3% 미만, 3.5% 미만, 4% 미만, 4.5% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 12% 미만, 15% 미만 또는 20% 미만으로 제한할 수 있다. 핵산 영역에서 형성된 삽입결실의 수는 핵산 (예를 들어, 세포의 게놈 내의 핵산)이 염기 편집제에 노출되는 시간의 양에 의존할 수 있다. 일부 실시양태에서, 삽입결실의 수 또는 비율은 염기 편집제에 핵산 (예를 들어, 세포의 게놈 내의 핵산)을 노출시킨지 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일 또는 적어도 14일 후에 결정된다.

본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 수의 비의도된 돌연변이, 예컨대 비의도된 점 돌연변이를 생성하지 않으면서 핵산 (예를 들어 대상체의 게놈 내의 핵산)에서 의도된 돌연변이, 예컨대 점 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다. 일부 실시양태에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 gRNA에 결합된 특이적 염기 편집제에 의해 생성된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 아데닌 (A)에서 구아닌 (G)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 티민 (T)에서 시토신 (C)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 아데닌 (A)에서 구아닌 (G)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 티민 (T)에서 시토신 (C)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈, 예를 들어 유전자의 코딩 영역 내의 조기 정지 코돈을 생성하는 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈을 제거하는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 스플라이싱을 변경시키는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 조절 서열 (예를 들어, 유전자 프로모터 또는 유전자 리프레서)을 변경시키는 돌연변이이다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 1:1 초과인 의도된 돌연변이 대 비의도된 돌연변이 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)의 비를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 150:1, 적어도 200:1, 적어도 250:1, 적어도 500:1 또는 적어도 1000:1 또는 그 초과인 의도된 돌연변이 대 비의도된 돌연변이 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)의 비를 생성할 수 있다. 본원에서 "염기 편집제 효율" 섹션에 기재된 염기 편집제의 특징은 본원에 제공된 융합 단백질 또는 융합 단백질을 사용하는 방법 중 임의의 것에 적용될 수 있다는 것이 인지되어야 한다.

핵산을 편집하는 방법

본 개시내용의 일부 측면은 핵산을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 핵산의 핵염기 (예를 들어, 이중-가닥 DNA 서열의 염기 쌍)를 편집하는 방법이다. 일부 실시양태에서, 방법은 하기 단계를 포함한다: a) 핵산의 표적 영역 (예를 들어, 이중-가닥 DNA 서열)을 염기 편집제 (예를 들어, 아데노신 데아미나제 도메인에 융합된 Cas9 도메인) 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적화된 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, 및 d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계이며, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되는 것인 단계. 일부 실시양태에서, 방법은 핵산에서 20% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 단계 b는 생략된다는 것이 인지되어야 한다. 일부 실시양태에서, 제1 핵염기는 아데닌이다. 일부 실시양태에서, 제2 핵염기는 탈아미노화된 아데닌 또는 이노신이다. 일부 실시양태에서, 제3 핵염기는 티민이다. 일부 실시양태에서, 제4 핵염기는 시토신이다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만 또는 0.1% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 방법은 제2 핵염기를 제4 핵염기에 상보적인 제5 핵염기로 대체함으로써, 의도된 편집된 염기 쌍 (예를 들어, A:T에서 G:C로)을 생성하는 것을 추가로 포함한다. 일부 실시양태에서, 제5 핵염기는 구아닌이다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45% 또는 50%가 편집된다.

일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 또는 200:1 또는 그 초과이다. 일부 실시양태에서, 의도된 점 돌연변이 대 삽입결실 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1 또는 1000:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 절단된 단일 가닥 (니킹된 가닥)은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 염기 편집제는 Cas9 도메인을 포함한다. 일부 실시양태에서, 제1 염기는 아데닌이고 제2 염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 제1 염기는 아데닌이다. 일부 실시양태에서, 제2 염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집 가닥을 보호하거나 그에 결합한다. 일부 실시양태에서, 염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 염기 편집제는 촉매 불활성 이노신-특이적 뉴클레아제를 포함한다. 일부 실시양태에서, 염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기쌍은 PAM 부위의 하류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 하류에 있다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산의 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산의 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산의 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1-10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3, 1-2 또는 1개 뉴클레오티드의 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드의 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에 있다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 방법은 본원에 제공된 염기 편집제 중 임의의 것을 사용하여 수행된다. 일부 실시양태에서, 표적 윈도우는 탈아미노화 윈도우이다.

일부 실시양태에서, 본 개시내용은 뉴클레오티드를 편집하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 이중-가닥 DNA 서열의 핵염기 쌍을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 a) 이중-가닥 DNA 서열의 표적 영역을 염기 편집제 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계를 포함하며, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되고, 제2 핵염기는 제4 핵염기에 상보적인 제5 핵염기로 대체됨으로써, 의도된 편집된 염기 쌍을 생성하고, 의도된 편집된 염기 쌍을 생성하는 효율은 적어도 5%이다. 일부 실시양태에서, 단계 b는 생략된다는 것이 인지되어야 한다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45% 또는 50%가 편집된다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만 또는 0.1% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 또는 200:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 의도된 점 돌연변이 대 삽입결실 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1 또는 1000:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 절단된 단일 가닥은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 제1 염기는 아데닌이다. 일부 실시양태에서, 제2 핵염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집 가닥을 보호하거나 (예를 들어, 염기 절제 복구를 형성하거나) 또는 그에 결합한다. 일부 실시양태에서, 핵염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 염기 편집제는 촉매 불활성 이노신-특이적 뉴클레아제를 포함한다. 일부 실시양태에서, 핵염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기쌍은 PAM 부위의 하류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 하류에 있다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산의 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산의 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산의 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1-10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3, 1-2 또는 1개 뉴클레오티드의 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드의 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에서 발생한다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 핵염기 편집제는 본원에 제공된 염기 편집제 중 어느 하나이다.

제약 조성물

본 개시내용의 다른 측면은 본원에 기재된 아데노신 데아미나제, 융합 단백질 또는 융합 단백질-gRNA 복합체 중 어느 것을 포함하는 제약 조성물에 관한 것이다. 본원에 사용된 용어 "제약 조성물"은 제약 용도를 위해 제제화된 조성물을 지칭한다. 일부 실시양태에서, 제약 조성물은 제약상 허용되는 담체를 추가로 포함한다. 일부 실시양태에서, 제약 조성물은 추가의 작용제 (예를 들어 특정 전달, 반감기 증가 또는 다른 치료 화합물을 위해)를 포함한다.

본원에 사용된 용어 "제약상 허용되는 담체"는 신체의 한 부위 (예를 들어, 전달 부위)로부터 또 다른 부위 (예를 들어, 신체의 기관, 조직 또는 부분)로 화합물을 운반하거나 수송하는데 수반되는 제약상 허용되는 물질, 조성물 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 제조 보조제 (예를 들어, 윤활제, 활석, 스테아르산마그네슘, 스테아르산칼슘 또는 스테아르산아연, 또는 스테아르산), 또는 용매 캡슐화 물질을 의미한다. 제약상 허용되는 담체는 제제의 다른 성분과 상용성이고 대상체의 조직에 유해하지 않다는 (예를 들어, 생리학상 상용성, 멸균, 생리적 pH 등) 의미에서 "허용된다". 제약상 허용되는 담체로서의 역할을 할 수 있는 물질의 일부 예는 하기를 포함한다: (1) 당, 예컨대 락토스, 글루코스 및 수크로스; (2) 전분, 예컨대 옥수수 전분 및 감자 전분; (3) 셀룰로스 및 그의 유도체, 예컨대 소듐 카르복시메틸 셀룰로스, 메틸셀룰로스, 에틸 셀룰로스, 미세결정질 셀룰로스 및 셀룰로스 아세테이트; (4) 분말화 트라가칸트; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대 스테아르산마그네슘, 소듐 라우릴 술페이트 및 활석; (8) 부형제, 예컨대 코코아 버터 및 좌제 왁스; (9) 오일, 예컨대 땅콩 오일, 목화씨 오일, 홍화 오일, 참깨 오일, 올리브 오일, 옥수수 오일 및 대두 오일; (10) 글리콜, 예컨대 프로필렌 글리콜; (11) 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜 (PEG); (12) 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; (15) 알긴산; (16) 발열원 무함유 물; (17) 등장성 염수; (18) 링거액; (19) 에틸 알콜; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; (22) 벌킹제, 예컨대 폴리펩티드 및 아미노산 (23) 혈청 성분, 예컨대 혈청 알부민, HDL 및 LDL; (22) C2-C12 알콜, 예컨대 에탄올; 및 (23) 제약 제제에 사용된 다른 비-독성 상용성 물질. 습윤제, 착색제, 방출제, 코팅제, 감미제, 향미제, 퍼퓸제, 보존제 및 항산화제가 또한 제제에 존재할 수 있다. "부형제", "담체", "제약상 허용되는 담체" 등과 같은 용어는 본원에서 상호교환가능하게 사용된다.

일부 실시양태에서, 제약 조성물은 대상체에의 전달을 위해, 예를 들어 유전자 편집을 위해 제제화된다. 본원에 기재된 제약 조성물을 투여하는 적합한 경로는 비제한적으로 하기를 포함한다: 국소, 피하, 경피, 피내, 병변내, 관절내, 복강내, 방광내, 경점막, 치은, 치아내, 안구내, 경고실, 기관내, 경막외, 척수강내, 근육내, 정맥내, 혈관내, 골내, 안구주위, 종양내, 뇌내 및 뇌실내 투여.

일부 실시양태에서, 본원에 기재된 제약 조성물은 이환 부위 (예를 들어, 종양 부위)에 국부로 투여된다. 일부 실시양태에서, 본원에 기재된 제약 조성물은 주사에 의해, 카테터에 의해, 좌제에 의해 또는 이식물에 의해 대상체에게 투여되며, 이식물은 막, 예컨대 실라스틱 막, 또는 섬유를 포함한, 다공성, 비-다공성 또는 젤라틴성 물질이다.

다른 실시양태에서, 본원에 기재된 제약 조성물은 제어 방출 시스템으로 전달된다. 한 실시양태에서, 펌프가 사용될 수 있다 (예를 들어, 문헌 [Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574] 참조). 또 다른 실시양태에서, 중합체 물질이 사용될 수 있다. (예를 들어, 문헌 [Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61] 참조. 또한, 문헌 [Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25:351; Howard et al., 1989, J. Neurosurg. 71:105] 참조.). 다른 제어 방출 시스템은, 예를 들어 [Langer, 상기 문헌]에서 논의된다.

일부 실시양태에서, 제약 조성물은 대상체, 예를 들어 인간에의 정맥내 또는 피하 투여에 적합화된 조성물로서 상용 절차에 따라 제제화된다. 일부 실시양태에서, 주사에 의한 투여를 위한 제약 조성물은 멸균 등장성 수성 완충제 중 용액이다. 필요한 경우, 제약은 또한 가용화제 및 주사 부위에서 통증을 완화시키기 위한 국부 마취제, 예컨대 리그노카인을 포함할 수 있다. 일반적으로, 성분은 개별적으로 또는 함께 혼합되어 단위 투여 형태로, 예를 들어 활성제의 양을 표시하는 기밀 용기, 예컨대 앰플 또는 사쉐 내의 건조 동결건조 분말 또는 무수 농축물로서 공급된다. 제약이 주입에 의해 투여될 경우에, 이는 멸균 제약 등급 물 또는 염수를 함유하는 주입 병으로 분배될 수 있다. 제약 조성물이 주사에 의해 투여되는 경우에, 성분이 투여 전에 혼합될 수 있도록 멸균 주사용수 또는 염수의 앰플이 제공될 수 있다.

전신 투여를 위한 제약 조성물은 액체, 예를 들어 멸균 염수, 락테이트화된 링거액 또는 행크 용액일 수 있다. 추가로, 제약 조성물은 고체 형태일 수 있고, 사용 직전 재-용해되거나 현탁될 수 있다. 동결건조된 형태가 또한 고려된다.

제약 조성물은 지질 입자 또는 소포, 예컨대 리포솜 또는 미세결정 내에 함유될 수 있으며, 이는 또한 비경구 투여에 적합하다. 입자는 조성물이 그 안에 함유되는 한, 임의의 적합한 구조, 예컨대 단층 또는 복수층일 수 있다. 화합물은 융합생성 지질 디올레오일포스파티딜에탄올아민 (DOPE), 낮은 수준 (5-10 몰%)의 양이온성 지질을 함유하는 "안정화된 플라스미드-지질 입자" (SPLP)에 포획될 수 있고, 폴리에틸렌글리콜 (PEG) 코팅에 의해 안정화될 수 있다 (Zhang Y. P. et al., Gene Ther. 1999, 6:1438-47). 양으로 하전된 지질, 예컨대 N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄메틸술페이트 또는 "DOTAP"는 이러한 입자 및 소포에 특히 바람직하다. 이러한 지질 입자의 제조는 널리 공지되어 있다. 예를 들어, 미국 특허 번호 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016 및 4,921,757 (이들 각각은 본원에 참조로 포함됨)을 참조한다.

본원에 기재된 제약 조성물은, 예를 들어 단위 용량으로 투여되거나 포장될 수 있다. 본 개시내용의 제약 조성물에 관하여 사용되는 경우 용어 "단위 용량"은 대상체에 대한 단일 투여량으로서 적합한 물리적 이산 단위를 지칭하며, 각각의 단위는 요구되는 희석제; 즉, 담체 또는 비히클과 함께 목적하는 치료 효과를 생성하도록 계산된 미리 결정된 양의 활성 물질을 함유한다.

추가로, 제약 조성물은 (a) 동결건조 형태의 본 발명의 화합물을 함유하는 용기 및 (b) 주사용 제약상 허용되는 희석제 (예를 들어, 멸균수)를 함유하는 제2 용기를 포함하는 제약 키트로서 제공될 수 있다. 제약상 허용되는 희석제는 본 발명의 동결건조 화합물의 재구성 또는 희석을 위해 사용될 수 있다. 인간 투여를 위한 제조, 사용 또는 판매의 기관에 의한 승인을 반영하는, 제약 또는 생물학적 제품의 제조, 사용 또는 판매를 관할하는 정부 기관에 의해 규정된 형태의 통지서가 이러한 용기(들)에 임의로 회합될 수 있다.

또 다른 측면에서, 상기 기재된 질환의 치료에 유용한 물질을 함유하는 제조 물품이 포함된다. 일부 실시양태에서, 제조 물품은 용기 및 라벨을 포함한다. 적합한 용기는, 예를 들어 병, 바이알, 시린지 및 시험 튜브를 포함한다. 용기는 다양한 물질, 예컨대 유리 또는 플라스틱으로 형성될 수 있다. 일부 실시양태에서, 용기는 본원에 기재된 질환을 치료하는데 효과적인 조성물을 보유하며, 멸균 접근 포트를 가질 수 있다. 예를 들어, 용기는 피하 주사 바늘에 의해 뚫릴 수 있는 마개를 갖는 정맥내 용액 백 또는 바이알일 수 있다. 조성물 중 활성제는 본 발명의 화합물이다. 일부 실시양태에서, 용기 상의 또는 그와 회합된 라벨은 조성물이 선택 질환을 치료하는데 사용된다는 것을 표시한다. 제조 물품은 제약상 허용되는 완충제, 예컨대 포스페이트 완충 염수, 링거액 또는 덱스트로스 용액을 함유하는 제2 용기를 추가로 포함할 수 있다. 이는 다른 완충제, 희석제, 필터, 바늘, 시린지, 및 사용에 대한 지침서를 갖는 패키지 삽입물을 포함한, 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있다.

키트, 벡터, 세포

본 개시내용의 일부 측면은 데옥시리보핵산 (DNA) 분자 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 뉴클레오티드 서열은 본원에 제공된 임의의 아데노신 데아미나제를 코딩한다. 일부 실시양태에서, 뉴클레오티드 서열은 아데노신 데아미나제의 발현을 유도하는 이종 프로모터를 포함한다.

본 개시내용의 일부 측면은 (a) 본원에 제공된 바와 같은, 아데노신 데아미나제에 융합된 napDNAbp (예를 들어, Cas9 도메인), 또는 napDNAbp (예를 들어, Cas9 도메인) 및 아데노신 데아미나제를 포함하는 융합 단백질을 코딩하는 뉴클레오티드 서열; 및 (b) (a)의 서열의 발현을 유도하는 이종 프로모터를 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 키트는 가이드 핵산 백본 (예를 들어, 가이드 RNA 백본)을 코딩하는 발현 구축물을 추가로 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 핵산 백본 (예를 들어, 가이드 RNA 백본) 내로의 클로닝을 허용하도록 위치된 클로닝 부위를 포함한다.

본 개시내용의 일부 측면은 본원에 제공된 아데노신 데아미나제, 융합 단백질 또는 복합체 중 임의의 것을 포함하는 세포를 제공한다. 일부 실시양태에서, 세포는 본원에 제공된 아데노신 데아미나제 또는 융합 단백질 중 임의의 것을 코딩하는 뉴클레오티드를 포함한다. 일부 실시양태에서, 세포는 본원에 제공된 뉴클레오티드 또는 벡터 중 임의의 것을 포함한다.

상기 리포터 시스템의 예시적인 실시양태의 설명은 단지 예시 목적으로 제공되며, 제한하는 것으로 의도되지 않는다. 추가의 리포터 시스템, 예를 들어 상기 상세히 기재된 예시적인 시스템의 변형은 또한 본 개시내용에 의해 포함된다.

그러나 추가의 융합 단백질이 본 개시내용 및 관련 기술분야의 지식에 기초하여 통상의 기술자에게 분명할 것이라는 것이 인지되어야 한다.

본 발명의 이들 및 다른 실시양태의 기능 및 이점은 하기 실시예로부터 보다 완전히 이해될 것이다. 하기 실시예는 본 발명의 이익을 예시하고 특정한 실시양태를 기재하고자 의도된 것이지만, 본 발명의 전체 범주를 예시하고자 의도된 것은 아니다. 따라서, 실시예는 본 발명의 범주를 제한하는 것으로 의도되지 않는다는 것이 이해될 것이다.

실시예

하기 실시예에 제공된 데이터는 DNA와 관련하여 아데노신의 가수분해성 탈아미노화 (구아닌 (G)과 같이 염기 쌍을 형성하는 이노신을 형성함)를 촉매할 수 있는 염기 편집제의 조작을 기재한다. DNA에 작용하는 공지된 자연 발생 아데노신 데아미나제는 존재하지 않는다. 대신에, 공지된 아데노신 데아미나제는 RNA (예를 들어, tRNA 또는 mRNA)에 작용한다. 최초 데옥시아데노신 데아미나제를 진화시켜 DNA 기질을 받아들이고 데옥시아데노신 (dA)을 데옥시이노신으로 탈아미노화시키도록 하였다. 한 예로서, DNA에 작용하는 아데노신 데아미나제를 조작하기 위해, 에스케리키아 콜라이로부터의 tRNA에 작용하는 아데노신 데아미나제 (ADAT) (tRNA 아데노신 데아미나제 A, TadA)를 사용하여 진화 실험을 수행하였다. 간략하게, ecTadA를 dCas9 도메인에 공유 융합시키고, 구축물의 데아미나제 부분에 돌연변이를 함유하는 상기 융합체의 라이브러리를 조립하였다. 하기 기재된 진화 실험에서, ecTadA 내 여러 돌연변이는 DNA 내의 아데노신을 탈아미노화시키는 ecTadA의 능력을 개선시키는 것으로 발견되었다. 박테리아 및 인간 세포에서 A·T에서 G·C 염기 쌍으로의 프로그램가능한 전환을 매개하는 아데닌 염기 편집제 (ABE)의 방향적 진화, 조작 및 특징화가 본원에서 보고된다. 실제로, 공지된 병원성 단일 뉴클레오티드 다형성의 대략 절반은 C·G에서 T·A로의 전이이다. 따라서 프로그램가능하고 효율적이며 정확한 방식으로 A·T 염기 쌍을 G·C 염기 쌍으로 전환시키는 능력은 유전 질환을 연구하고 치료하기 위한 노력을 실질적으로 진보시킬 수 있다. ABE 효율 및 서열 일반성을 최대화하기 위한 광범위한 진화 및 조작은 제7-세대 아데닌 염기 편집제, 예컨대 ABE7.10을 생성하였으며, 이는 비처리 세포의 경우와 대등한 매우 높은 생성물 순도 (전형적으로 > 99%) 및 매우 낮은 비율의 삽입결실 (전형적으로 ≤ 0.1%)로 표적 A·T를 G·C 염기 쌍으로 효율적으로 전환시킨다 (인간 세포에서 17개의 게놈 부위에 걸쳐 평균 53%). 하기 실시예에서 ABE7 변이체는 현재 Cas9 뉴클레아제-매개된 HDR 방법보다 훨씬 더 효율적으로 및 깨끗하게 점 돌연변이를 도입하고, Cas9 뉴클레아제보다 더 적은 오프-타겟 게놈 변형을 유도하며, 배양된 인간 세포에서 질환-연관 SNP의 교정 및 질환-억제 SNP의 도입 둘 다에 사용될 수 있는 것으로 제시된다.

각각 시토신 및 5-메틸시토신의 자발적 가수분해성 탈아미노화로부터의 우라실 및 티민의 형성은^1,2 인간에서 1일에 세포당 100-500회의 추정치로 발생하고¹, 모든 공지된 병원성 SNP의 대략 절반을 차지하는 C·G에서 T·A로의 돌연변이를 유발할 수 있다 (도 1a). 따라서, 변형되지 않은 세포의 게놈 DNA 내의 표적 유전자좌에서 A·T 염기 쌍을 G·C 염기 쌍으로 전환시키는 능력은 질환과 연관된 상당한 분율의 인간 SNP의 교정을 가능하게 할 수 있다.

염기 편집은 이중 가닥 DNA 파괴 (DSB), 상동성-지정 복구 (HDR) 과정 또는 공여자 DNA 주형을 요구하지 않으면서 표적 게놈 유전자좌에서의 한 염기 쌍에서 또 다른 염기 쌍으로의 직접적인 비가역적 전환을 가능하게 하는 게놈 편집의 형태이다^3-5. 점 돌연변이를 도입하기 위한 표준 게놈 편집 방법과 비교하여, 염기 편집은 보다 효율적으로⁶, 및 보다 적은 바람직하지 않은 생성물, 예컨대 확률적 삽입 또는 결실 (삽입결실) 또는 전위로^4,6-8 진행될 수 있다.

가장 통상적으로 사용되는 염기 편집제는 (i) DSB를 만들 수 없는 촉매적으로 손상된 CRISPR-Cas9 돌연변이체, (ii) Cas9에 의해 생성된 단일-가닥 DNA 버블에서 작은 윈도우 (~5개 뉴클레오티드) 이내에서 C를 우라실 (U)로 전환시키는 단일-가닥-특이적 시티딘 데아미나제, (iii) 염기 편집 효율 및 생성물 순도를 감소시키는 우라실 절제 및 하류 방법을 저해하는 우라실 글리코실라제 억제제 (UGI)⁹, 및 (iv) 비-편집 DNA 가닥을 니킹하여 G-함유 DNA 가닥을 대체하는 세포성 미스매치 복구를 지시하는 니카제 활성^6,9으로 이루어진 제3-세대 설계 (BE3)이다. 종합하면, 이들 성분은 박테리아, 효모^4,10, 식물^11,12, 제브라피쉬¹³, 포유동물 세포^14,15, 마우스^16,17, 및 심지어 인간 배아^18,19에서 효율적이고 영구적인 C·G에서 T·A로의 염기 쌍 전환을 가능하게 한다. 염기 편집 능력은 상이한 프로토스페이서-인접 모티프 (PAM) 상용성⁷, 좁은 편집 윈도우⁷, 증진된 DNA 특이성⁸, 및 소분자 의존성²⁰을 갖는 염기 편집제의 개발을 통해 확장되었다. 제4-세대 염기 편집제 (BE4 및 BE4-Gam)는 C·G에서 T·A로의 편집 효율 및 생성물 순도를 추가로 개선시켰다.⁹

현재까지, 모든 보고된 염기 편집제는 C·G에서 T·A로의 전환을 매개한다. 본 연구에서, 단백질 진화 및 조작을 사용하여 박테리아 및 인간 세포에서 DNA 내의 A·T를 G·C 염기 쌍으로 전환시키는 새로운 부류의 아데닌 염기 편집제 (ABE)를 개발하였다. 제7-세대 ABE, 예컨대 ABE7.10 (도 7)은 ~50%의 전형적인 효율 및 매우 높은 정도의 생성물 순도 (> 99%)로 인간 세포 내 폭넓은 범위의 표적 게놈 유전자좌에서 A·T를 G·C로 전환시키며, 이는 BE3의 전형적인 성능 특징을 능가한다. ABE는 염기 편집의 범주를 크게 확장시키고, 이전에 기재된 염기 편집제와 함께, 살아있는 세포의 게놈 내의 모든 4개의 전이 돌연변이 (C에서 T로, A에서 G로, T에서 C로 및 G에서 A로)의 프로그램가능한 설치를 가능하게 한다.

실시예 1 - DNA 상에서 작동하는 아데닌 데아미나제의 진화

아데노신의 가수분해성 탈아미노화는 이노신을 생성한다 (도 1b). 폴리머라제 활성 부위의 제약 내에서, 이노신은 C와 가장 안정적으로 쌍형성하고, 따라서 G로 판독 또는 복제된다²¹. 기존 염기 편집제의 시티딘 데아미나제 도메인을 아데닌 데아미나제로 대체하는 것이 이론상 ABE를 제공할 수 있지만 (도 1c), DNA에서 아데닌을 탈아미노화시키는 효소는 공지되어 있지 않다. 아데닌 데아미나제의 모든 보고된 예들이 유리 아데닌, 유리 아데노신, RNA 내 또는 잘못 쌍형성된 RNA:DNA 헤테로듀플렉스 내의 아데노신을 프로세싱하거나²², 또는 이상하게도, 단일-가닥 DNA 상에서 C에서 U로의 형성을 촉매하지만²³, 본 발명의 노력은 BE3의 APOBEC1 성분을 천연 아데닌 데아미나제, 예컨대 이. 콜라이 TadA^24-26, 인간 ADAR^27,28, 마우스 ADA²⁹, 및 인간 ADAT2^30,31 (보충 서열 1)로 대체하여 높은 유효 몰농도의 단일-가닥 DNA가 DNA 상에서의 그의 불량한 활성을 극복할 수 있는지의 가능성을 시험함으로써 시작되었다. 불행하게도, 이들 아데닌 데아미나제-Cas9 D10A 니카제 융합체를 코딩하는 플라스미드 DNA 구축물을 상응하는 단일-가이드 RNA (sgRNA)와 함께 HEK293T 세포 내로 형질감염시켰을 때, 비처리 세포의 경우를 상회하는 유의한 A·T에서 G·C로의 편집은 관찰되지 않았다 (도 8a). 이들 결과는 시험된 천연 아데닌 데아미나제 효소가 DNA를 프로세싱할 수 없다는 것이 ABE에서의 그의 직접적인 사용을 배제시킨다는 것을 시사한다.

이들 결과를 고려하여, 자연 발생 RNA 아데닌 데아미나제로부터 출발하여 기질로서 DNA를 받아들이는 아데닌 데아미나제 변이체를 진화시키고자 하였다. 중요한 위치에서의 점 돌연변이를 함유하는 항생제 내성 유전자를 생성함으로써 염기 편집을 위한 박테리아 선택을 개발하였다 (표 8 및 보충 서열 2). 염기 편집제에 의한 이들 돌연변이의 복귀는 항생제의 존재 하에 박테리아 생존을 가능하게 한다. 선택을 검증하기 위해, 박테리아 코돈 최적화된 버전의 BE2⁶ (dCas9 및 UGI에 융합된 APOBEC1 시티딘 데아미나제)를 사용하였는데, 이는 박테리아가 BE3에 의한 보다 효율적인 염기 편집을 가능하게 하는 닉-지정 미스매치 복구 기구가 결여되어 있기 때문이다³². 표적 돌연변이 선택, 프로모터 강도, 선택 플라스미드 카피수, 인큐베이션 시간 및 항생제 선택 엄격도를 최적화한 후에, 불활성화 돌연변이로의 염기 편집을 지시하도록 프로그램화된 sgRNA 및 BE2에 의한 촉매 잔기에서의 A·T에서 G·C로의 돌연변이 (H193R)를 함유하는 결함성 클로람페니콜 아세틸 트랜스퍼라제 (Cam^R)의 성공적인 구제가 관찰되었으며, 1 μg/mL에서 32μg/mL로 클로람페니콜 최소 억제 농도 (MIC)가 증가하였다. DNA 서열분석은 선택에서 생존한 박테리아 세포가 Cam^R 기능을 회복시키는 C·G에서 T·A로의 돌연변이를 함유하였다는 것을 확인시켜 주었다.

다음으로, 선택 플라스미드를 Cam^R 유전자 내에 C·G에서 T·A로의 돌연변이를 도입함으로써 ABE 활성에 대해 개조하여, 1 μg/mL 클로람페니콜의 MIC를 부여하는 H193Y 치환을 생성시켰다 (표 8 및 보충 서열 2). H193Y 돌연변이에서의 A·T를 G·C로 전환시키는 것은 클로람페니콜 내성을 회복시켜, ABE 활성을 클로람페니콜의 존재 하의 박테리아 생존과 연관시킬 것이다.

이전에 기재된 염기 편집제^6-9는 단일-가닥 DNA 상에서 작동하고 이중-가닥 DNA를 거부하는 시티딘 데아미나제 효소의 사용을 이용한다. 이러한 단일-가닥 DNA 요건은 Cas9에 의해 생성된 단일-가닥 버블 내 작은 윈도우의 뉴클레오티드에 데아미나제 활성을 집중시켜, 표적 뉴클레오티드(들) 이외의 바람직하지 않은 탈아미노화 사건을 최소화하는데 중요하다. TadA는 tRNA^Arg의 단일-가닥 안티코돈 루프 내 아데닌을 이노신 (I)으로 전환시키는 tRNA 아데닌 데아미나제이다²⁴. 이. 콜라이 TadA는 원래의 염기 편집제에 사용되는 APOBEC 패밀리의 효소³³와 상동성을 공유하고, 구조적 연구는 일부 APOBEC가 TadA에 결합된 tRNA의 입체형태와 닮은 입체형태로 단일-가닥 DNA에 결합한다는 것을 밝혀냈다³³. TadA는 (ADAR³⁴과 대조적으로) 소분자 활성화제를 요구하지 않고, (ADA²⁹와 달리) 폴리핵산에 작용한다. 이들 고찰에 기초하여, DNA 아데닌 데아미나제를 진화시키기 위한 노력의 출발점으로서 이. 콜라이 TadA를 선택하였다.

편집제의 Cas9 부분의 유리한 특성을 변경하는 것을 피하기 위해 구축물의 아데닌 데아미나제 부분에서만 돌연변이를 함유하는 ecTadA-dCas9 융합체의 비편향 플라스미드 라이브러리를 생성하였다. 생성된 플라스미드 라이브러리를 Cam^R H193Y 선택을 보유하는 이. 콜라이 내로 형질전환시키고, ~5.0 x 10⁶개의 형질전환체를 2 내지 16 μg/mL 클로람페니콜을 함유하는 배지 상에 플레이팅하였다 (도 2a). 생존 콜로니에는 TadA 돌연변이 A106V 및 D108N이 강하게 풍부하였다 (도 2b). 진화된 이. 콜라이 TadA를, tRNA^Arg와 복합체화된 구조가 보고된 바 있는³⁵ 상동체인 에스. 아우레우스 TadA와 함께 서열 정렬시키는 것은, D108의 측쇄가 기질 아데노신의 바로 상류의 우리딘 뉴클레오티드에서의 리보스의 2'-OH 기와 수소 결합을 이룬다는 것을 예측해 준다 (도 2c). D108에서의 돌연변이는 아마도 이러한 수소 결합을 제거하여, 기질-결합 부위 내에 DNA를 받아들이는 에너지 기회 비용을 감소시킨다. DNA 서열분석은 선택에서 생존한 모든 박테리아 클론이 Cam^R 내의 표적화 부위에서 실질적인 A·T에서 G·C로의 복귀를 보여주었음을 확인시켜 주었다. 종합하면, 이들 결과는 TadA D108에서 또는 그 근처에서의 돌연변이가 TadA로 하여금 DNA 기질에 대한 아데닌 탈아미노화를 수행하는 것을 가능하게 한다는 것을 나타낸다.

목적하는 염기 편집 결과를 유리하게 하도록 세포성 DNA 미스매치 복구를 조작하기 위해 박테리아 진화에 사용된 dCas9를 BE3에 사용된 Cas9 D10A 니카제로 대체하고 C-말단 핵 국재화 신호 (NLS)를 부가한 포유동물 코돈-최적화된 TadA-Cas9 니카제 융합 구축물 내로 TadA A106V 및 D108N 돌연변이를 혼입시켰다. TadA*가 진화된 TadA 변이체를 나타내고 XTEN이 BE3⁶에 사용된 16개-아미노산 링커인 생성된 TadA*-XTEN-nCas9-NLS 구축물을 ABE1.2로 지정하였다. ABE1.2 및 6개의 인간 게놈 부위를 표적화하는 sgRNA를 발현하는 플라스미드의 형질감염 (도 3a)은, PAM을 위치 21-23으로서 카운팅하여 프로토스페이서 위치 5에서 또는 그 근처에서 (도 3b) 인간 게놈 내의 6개의 다양한 표적 부위에 걸쳐 (도 2a) 매우 낮지만 관찰가능한 A에서 G로의 편집 효율 (3.2±0.88%; 모든 편집 효율은 달리 언급되지 않는 한 형질감염된 세포에 대해 형질감염된 세포에 대한 풍부화 없이 3회의 생물학적 반복실험의 평균±SD로 보고됨)을 나타냈다. 이들 데이터는 낮은 수준의 A·T에서 G·C로의 전환을 촉매할 수 있는 ABE가 제1 라운드의 단백질 진화 및 조작으로부터 나타났다는 것을 확인시켜 주었다.

실시예 2 - 개선된 데아미나제 변이체 및 ABE 아키텍처

제2 라운드의 진화를 통해 ABE1.2의 편집 효율을 개선시키고자 하였다. ABE1.2 변이체의 비편향 라이브러리를 상기와 같이 생성하고, 생성된 TadA* 1.2-dCas9 돌연변이체를 라운드 1에서 사용된 것보다 더 높은 농도의 클로람페니콜 (16 내지 128 μg/mL)을 사용하여 박테리아에서 챌린지하였다 (표 7 및 8). 이러한 제2 라운드의 진화로부터, TadA 내 기질에 인접한 나선에 놓여있는 것으로 예측되는 2개의 돌연변이 D147Y 및 E155V를 확인하였다 (도 2c). 포유동물 세포에서, ABE2.1 (ABE1.2 + D147Y + E155V)은 시험된 6개의 게놈 부위에서 ABE1.2보다 2배 내지 7배 더 높은 활성을 나타냈으며, 이는 평균 11±2.9%의 A·T에서 G·C로의 염기 편집을 유발하였다 (도 3b).

다음으로, ABE2.1 편집 효율을 추가의 단백질 조작을 통해 개선시키고자 하였다. TadA(2.1)* 도메인을 Cas9 니카제의 N-말단 대신 C-말단에 융합시키는 것은 편집 활성의 완전한 상실을 유발하였으며 (도 7 및 8b), 이는 BE3⁶을 사용한 이전 발견과 일치한다. 또한, TadA(2.1)*와 Cas9 니카제 사이의 링커 길이를 변화시켰다. ABE2.1에서의 원래 16개-잔기 XTEN 링커의 2배 길이의 링커 (32개 아미노산, (SGGS)₂-XTEN-(SGGS)₂)를 갖는 ABE2 변이체 (ABE2.6)는 ABE2.1과 비교하여 보통 더 높은 편집 효율을 제공하였으며, 본 발명에서 시험된 6개의 게놈 유전자좌에 걸쳐 평균 14±2.4%였다 (도 7 및 8b).

우라실 N-글리코실라제 (UNG)가 DNA로부터 우라실의 제거를 촉매하고 염기 절제 복구를 개시하는 메카니즘과 유사하게, 알킬 아데닌 DNA 글리코실라제 (AAG)는 DNA 내의 이노신의 글리코시드 결합의 절단을 촉매한다^36,37. 이노신 절제가 ABE 성능을 저해하는지를 시험하기 위해, 이노신 염기 절제 복구 (BER)의 잠재적 공급원을 최소화하도록 설계된 ABE2 변이체를 생성하였다. AAG의 공지된 단백질 억제제가 부재한다는 것을 고려하여, 이노신 결합 또는 제거에 관여하는 효소의 촉매적으로 불활성화된 버전: 인간 AAG (E125Q 돌연변에 의해 불활성화됨³⁸) 또는 이. 콜라이 엔도 V (D35A 돌연변이에 의해 불활성화됨³⁹)를 ABE2.1의 C-말단에 개별적으로 융합시킴으로써 내인성 AAG가 이노신 중간체에 접근하는 것이 차단되도록 시도하였다. ABE2.1-AAG(E125Q) (ABE2.2) 및 ABE2.1-엔도 V(D35A) (ABE2.3) 둘 다는 ABE2.1과 비교하여 HEK293T 세포에서 변경된 A·T에서 G·C로의 편집 효율을 나타내지 않았다 (도 7 및 8c). 실제로, AAG가 결여된 Hap1 세포에서 ABE2.1을 사용하는 것은 야생형 AAG를 함유하는 Hap1 세포와 비교하여 염기 편집 효율의 증가, 생성물 순도의 증가, 또는 삽입결실 빈도의 감소를 유발하지 않았다 (도 8d). 더욱이, ABE2.1은 시험된 6개의 유전자좌에서 실질적으로 삽입결실 부재 (≤ 0.1%) 또는 A·T에서 비-G·C로의 생성물 (≤ 0.1%)을 유도하였으며, 이는 이노신 중간체의 비효율적인 절제와 일치한다 (도 11a 내지 11b). 종합하면, 이들 관찰은 ABE에 의해 생성된 이노신 중간체의 세포 복구가 비효율적이라는 것을 강하게 시사하며, 이는 BER과 같은 방법을 뒤엎을 필요성을 제거한다. 이러한 상황은 염기 편집 효율 및 생성물 순도를 최대화하고 삽입결실 형성을 억제하기 위해 우라실 절제를 억제하는 것에 강하게 의존하는 BE3 및 BE4의 상황과 대조적이다^6,9.

최종 ABE2 조작 연구로서, 인간 세포에서의 염기 편집 효율에 대한 TadA* 이량체화 상태의 역할을 조사하였다. 천연 형태에서, TadA는 동종이량체로서 작동하며, 하나의 단량체는 A에서 I로의 탈아미노화를 촉매하고, 다른 단량체는 tRNA 기질에 대한 도킹 스테이션으로서 작용한다⁴⁰. 이. 콜라이에서의 선택 동안, 내인성 TadA는 비-촉매 단량체로서의 역할을 하는 것으로 추측된다. 포유동물 세포에서, 추가의 야생형 또는 진화된 TadA 단량체를 테더링하는 것은 분자간 ABE 이량체화에 대한 의존성을 최소화함으로써 편집 효율을 개선시킬 수 있는 것으로 가정된다. 실제로, ABE2.1을 야생형 TadA 또는 TadA*2.1과 함께 공동-발현시켜 트랜스로 ABE2.1:TadA 또는 ABE2.1:TadA*2.1 이량체 형성을 촉진하는 것 (각각 ABE2.7 및 ABE2.8), 뿐만 아니라 진화된 또는 야생형 TadA를 ABE2.1의 N-말단에 직접 융합시키는 것 (각각 ABE2.9 및 ABE2.10)은, 실질적으로 편집 효율을 개선시켰다 (도 3b, 7 및 10a). 융합된 TadA-ABE2.1 아키텍처 (ABE2.9)가 최고 편집 효율을 제공하는 것으로 확인하였으며 (6개의 게놈 유전자좌에 걸쳐 평균 20±3.8%, 및 ABE1.2에 비해 각각의 부위에서 7.6±2.6배 평균 개선), 이를 모든 후속 실험에서 사용하였다 (도 2b 및 3b). 2개의 야생형 TadA 도메인을 함유하고 진화된 TadA* 도메인을 함유하지 않는 대조군 ABE 변이체는 시험된 6개의 게놈 부위에서 A·T에서 G·C로의 편집을 유발하지 않았으며 (도 10a), 이는 이량체화 단독으로는 ABE 활성을 매개하는데 불충분하다는 것을 확인시켜 준다.

이들 결과는 TadA 이량체화를 ABE 편집 효율의 중요한 성분으로서 연루시켰기 때문에, TadA-ABE2 융합체 내의 2개의 TadA 서브유닛 중 어느 것이 A에서 I로의 촉매작용을 담당하는지를 결정하였다. 불활성화 E59A 돌연변이²⁴를 ABE2.9의 N-말단 또는 내부 TadA 단량체 내로 도입하여, 각각 ABE2.11 또는 ABE2.12를 생성하였다. 불활성화된 N-말단 TadA 서브유닛을 갖는 변이체 (ABE2.11)는 ABE2와 대등한 편집 효율을 나타냈고, 반면 불활성화된 내부 TadA 서브유닛을 갖는 변이체는 모든 편집 활성을 상실하였다 (도 7 및 10a). 이들 결과는 내부 TadA 서브유닛이 A에서 I로의 촉매작용을 담당한다는 것을 확립시켜 준다.

실시예 3 - 표적의 하위세트를 효율적으로 편집하는 ABE

다음으로, A·T에서 G·C로의 편집 효율을 추가로 증가시키기 위해 TadA*2.1-dCas9로 출발하여 (내인성 이. 콜라이 TadA와 또는 그 자체와의 트랜스 이량체화에 의존함) 제3 라운드의 박테리아 진화를 수행하였다. 카나마이신 내성 유전자 (Kan^R, 아미노글리코시드 포스포트랜스퍼라제, 표 8 및 보충 서열 2)에 2개의 초기 정지 코돈 (Q4정지 및 W15정지)을 도입함으로써 선택의 엄격도를 증가시켰다. 각각의 돌연변이는 조기 정지 코돈을 교정하기 위해 A·T에서 G·C로의 복귀를 요구하였다. 진화 라운드 3 선택 플라스미드를 보유하는 숙주 세포에 대한 MIC는 ~8 μg/mL 카나마이신이었고, 카나마이신 내성을 회복시키기 위해서는 동일한 플라스미드 상에서 두 Kan^R 돌연변이의 염기 편집이 요구되었다 (표 8). TadA 도메인 내의 돌연변이를 함유하는 TadA*2.1-dCas9 변이체의 라이브러리를 16 내지 128 μg/mL 카나마이신의 존재 하에 이보다 더 높은 엄격도 선택에 적용하여, 3개의 새로운 TadA 돌연변이: L84F, H123Y 및 I157F의 강한 풍부화를 유발하였다. 이들 돌연변이를 ABE2.9 포유동물 구축물 내로 도입하여 ABE3.1을 생성하였다 (도 2b). HEK293T 세포에서, ABE3.1은 6개의 시험된 부위에 걸쳐 평균 29±2.6%의 편집 효율, ABE2.9에 비해 각각의 부위에서 A·T에서 G·C로의 전환의 1.6배 평균 증가, 및 ABE1.2에 비해 11배 평균 개선을 가져왔다 (도 3c). 2개의 TadA 단량체들 사이 또는 TadA*와 Cas9 니카제 사이의 더 긴 (64개- 또는 100개-아미노산) 링커를 또한 시험하였고, ABE3.1과 비교하여 편집 효율에 대한 음성 효과가 관찰되었다 (도 7 및 10b).

비록 ABE3.1-매개된 염기 편집 효율이 일부 부위, 예컨대 CAC 콘텍스트 내 프로토스페이서 위치 5에 편집된 A를 배치한 부위 1에서 높았지만 (65±4.2% 전환), 다른 부위, 예컨대 GAG 콘텍스트 내 편집된 A를 배치한 부위 5의 경우 편집 효율은 훨씬 더 낮았다 (8.3±0.67% 전환) (도 3c). 표적 A 주위의 상이한 서열 콘텍스트를 갖는 6개의 게놈 유전자좌로부터의 결과는, 라운드 1-3으로부터의 ABE가 YAC의 표적 서열 콘텍스트 (여기서 Y = T 또는 C임)를 강하게 선호하였다는 것을 시사한다. 이러한 서열 콘텍스트 선호는 tRNA^Arg의 안티코돈 루프의 UAC 콘텍스트 내 A를 탈아미노화시키는 천연 이. 콜라이 TadA의 기질 특이성으로부터 유전되었을 가능성이 있다. 그러나, 염기 편집 적용에 대한 ABE의 유용성이 이러한 표적 서열 제한에 의해 크게 제한될 것이다.

ABE3.1의 YAC 서열 선호를 극복하기 위해, 표적 A의 상류 및 하류 뉴클레오티드와 상호작용하는 것으로 예측된 TadA 잔기에서의 돌연변이유발에 촛점을 맞춘 제4 진화 캠페인을 개시하였다. 에스. 아우레우스 TadA·tRNA 공-결정 구조의 검사³⁵는 이. 콜라이 TadA E25, R26, R107, A142 및 A143에 상응하는, tRNA 기질의 안티코돈 루프와 직접 접촉하는 잔기를 밝혀냈다. 이들 위치에서의 무작위화 잔기를 함유하는 TadA*2.1- dCas9 라이브러리 (표 7)를, 비-YAC 표적 (스펙티노마이신 내성 단백질 내의 T89I 돌연변이를 야기하는 GAT)의 A·T에서 G·C로의 전환이 항생제 내성 (표 8 및 보충 서열 2)을 회복시키는 새로운 박테리아 선택에 적용하였다. 선택 플라스미드를 보유하는 세포 내의 라이브러리 구성원 (MIC ~32 μg/mL 스펙티노마이신, 표 8)을 고농도의 스펙티노마이신 (64 내지 512 μg/mL)으로 챌린지하였다. 생존 박테리아는 TadA 돌연변이 A142N에 강하게 수렴하였다. 박테리아 세포에서 TadA*4.3-dCas9 (TadA*3.1+A142N-dCas9)에 의한 겉보기 A·T에서 G·C로의 염기 편집 효율이 스펙티노마이신 MIC에 의해 판단하였을 때 TadA*3.1-dCas9에 의한 경우보다 더 높았지만 (도 10c), ABE4.3은 일반적으로 포유동물 세포에서 ABE3.1과 비교하여 감소된 염기 편집 효율 (평균 16±5.8%)을 나타냈다 (도 2b 및 3c). A142N 돌연변이는 콘텍스트-의존성 방식으로 염기 편집에 이로울 수 있는 것으로 가정되었고, 이후 라운드의 진화에서의 그의 포함을 재논의하였다 (하기 참조).

제5 라운드의 진화를 수행하여 ABE 촉매 성능을 증가시키고 표적 서열 상용성을 확장시켰다. TadA* 도메인 전체에 걸쳐 비편향 돌연변이를 함유하는 TadA*3.1-dCas9 변이체의 라이브러리를 상기와 같이 생성하였다 (표 7). 보다 빠른 동역학을 갖는 ABE 구축물에 유리하도록, 이러한 라이브러리를 이전 라운드의 진화 (~ 14시간)의 절반의 지속기간 (7시간) 동안만 ABE 발현을 허용한 후에 더 높은 용량의 클로람페니콜 (≥ 128 μg/mL)을 사용한 Cam^R H193Y 선택에 적용하였다. 생존 클론은 TadA의 N- 및 C-말단 도메인 근처에 다양한 돌연변이를 함유하였다. 놀랍게도, 이들 돌연변이의 컨센서스 세트 (H36L, R51L, S146C 및 K157N)를 ABE3.1 내로 도입하여 ABE5.1을 생성하는 것은, HEK293T 세포에서의 전체 편집 효율을 1.7±0.29배 감소시켰다 (도 2b 및 3c).

ABE5.1은 ABE2.1에 대한 이전 이량체화 상태 실험 이후 7개의 돌연변이를 포함하였기 때문에, 이들 새로운 돌연변이의 축적은 비-촉매적 N-말단 TadA 서브유닛이 포유동물 세포에서 그의 구조적 역할을 수행하는 능력을 손상시킬 수 있는 것으로 추측되었다. 이. 콜라이에서, 내인성 야생형 TadA 단량체는 트랜스로 제공되며, 이는 잠재적으로 박테리아 선택 표현형과 포유동물 세포 편집 효율 사이의 단절을 설명한다. 따라서, ABE5 변이체의 N-말단 비-촉매적 TadA 도메인에 진화된 TadA* 변이체 대신 야생형 TadA를 사용하는 효과를 조사하였다. 이들 연구는 내부 진화된 TadA*에 융합된 야생형 이. 콜라이 TadA로 구성된 이종이량체 구축물 (ABE5.3)이 2개의 동일한 진화된 TadA* 도메인을 갖는 동종이량체 ABE5.1과 비교하여 크게 개선된 편집 효율을 나타냈다는 것을 밝혀냈다. 6개의 게놈 시험 부위에 걸친 ABE5.3 편집 효율은 평균 39±5.9%이고, ABE5.1에 비해 각각의 부위에서의 평균 개선은 2.9±0.78배였다 (도 2b 및 3c). ABE3.1과 비교하여, ABE5.3은 각각의 시험된 부위에서 평균 1.8±0.39배 편집 효율을 증가시켰다. 중요하게는, ABE5.3은 또한 본 발명에서 부위 3 (AAG), 부위 4 (CAA), 부위 5 (GAG) 및 부위 6 (GAC)을 포함한 비-YAC 표적의 22-33% 편집을 가능하게 한 확장된 서열 상용성을 나타냈다 (도 3c).

동시에, 라운드 5 라이브러리를 라운드 4에 사용된 비-YAC 스펙티노마이신 선택에 적용하였다. 고도로 풍부화된 돌연변이가 나타나지는 않았지만, 이러한 선택으로부터 나타나는 2개의 유전자형으로부터의 새로운 돌연변이, N72D + G125A; 및 P48S + S97C (도 7)를 후속 라이브러리 생성 단계에 포함시켰다. 이들 돌연변이를 ABE3.1에 단순 부가한 것 (각각 ABE5.13 및 ABE5.14를 생성함)은 편집 효율을 개선시키지 않았다 (도 7 및 11a).

ABE3 링커 연구는 32개 아미노산보다 훨씬 더 긴 링커가 ABE 활성을 감소시켰다는 것을 입증하였기 때문에 (도 7 및 10b), ABE5 링커를 최적화하기 위해 보다 정밀화된 접근법을 취하였다. TadA 도메인들 사이 또는 TadA와 Cas9 니카제 사이의 24개-, 32개- 또는 40개-잔기 링커를 함유하는 8개의 이종이량체 야생형 TadA-TadA* ABE5.3 변이체 (ABE5.5 내지 ABE5.12)를 HEK293T 세포에서 시험하였으며, 이는 염기 편집 효율에 있어서 명백한 개선을 가져오지 않았다 (도 7 및 11b). 따라서, 모든 후속 연구는 2개의 32개-잔기 링커를 갖는 이종이량체 wtTadA-TadA*-Cas9 니카제를 함유하는 ABE5.3 아키텍처를 사용하였다.

실시예 4 - 넓은 서열 상용성을 갖는 고도로 활성인 ABE

제6 라운드의 진화는 DNA 셔플링에 의해 임의의 비-유익한 돌연변이를 제거하고, 다른 돌연변이에 의해 음성 상위성으로부터 유리되었을 때 ABE 성능에 대해 상이한 효과를 가질 수 있는 이전 라운드의 진화로부터의 돌연변이를 재조사하는 것을 목표로 하였다. 야생형 이. 콜라이 TadA와 함께 라운드 1 내지 5로부터의 진화된 TadA*-dCas9 변이체를 셔플링하고, 스펙티노마이신 내성 T89I 선택 플라스미드를 보유하는 이. 콜라이 내로 형질전환시키고, 384 μg/mL 스펙티노마이신이 보충된 배지 상에서 선택하였다. 이러한 선택으로부터 2개의 돌연변이를 강하게 풍부화시켰다: P48S/T 및 A142N (라운드 4에서 처음 볼 수 있음). 이들 돌연변이를 개별적으로 또는 함께 ABE5.3에 부가하여 ABE6.1 내지 ABE6.6을 형성하였다 (도 7). ABE6.3 (ABE5.3+P48S)은 각각의 시험된 6개 게놈 부위에서 ABE5.3에 비해 1.3±0.28배더 높은 평균 A·T에서 G·C로의 편집 및 47±5.8%의 평균 전환 효율을 유발하였다 (도 2b 및 4a). P48은 TadA 결정 구조에서 기질 아데닌 핵염기 및 2'-히드록실로부터 ~5 A에 놓여있는 것으로 예측되고 (도 2c), 이 잔기를 Ser으로 돌연변이시키는 것은 데옥시아데노신 기질과의 상용성을 개선시킬 수 있는 것으로 추측되었다. 대부분의 부위에서 A142N 돌연변이를 함유한 ABE6 변이체는 이러한 돌연변이가 결여된 ABE보다 덜 활성이었지만, 프로토스페이서 내의 위치 7에서 표적 A를 함유하는 부위 6에서의 ABE6.4 (ABE6.3 + A142N)에 의한 편집은, ABE6.3에 의한 편집보다 1.5±0.13배 더 효율적이었고, ABE5.3에 의한 편집보다 1.8±0.16배 더 효율적이었다 (도 4a). 이들 결과는 A142N 변이체가 위치 5 보다 PAM에 더 가까운 표적 아데닌의 개선된 편집을 제공할 수 있다는 것을 시사한다.

6 라운드의 진화 및 조작이 실질적인 개선을 가져왔지만, ABE6 편집제는 표적화된 A 근처에 다수의 아데닌을 함유하는 표적 서열, 예컨대 부위 3 (AAG) 및 부위 4 (CAA)에서 감소된 편집 효율 (~20-40%)을 여전히 겪었다 (도 4a). 이러한 난제를 다루기 위해, 새로 생성된 TadA*6-dCas9 변이체의 라이브러리를 카나마이신 내성 유전자 내의 2개의 별개의 부위: TAT 모티프 편집을 필요로 하는 라운드 3에 사용된 Q4정지 돌연변이 및 TAA 서열 편집을 필요로 하는 새로운 D208N 돌연변이로 표적화시키는 제7 라운드의 진화를 수행하였다 (표 7 및 8, 보충 서열 2). 라운드 7 선택 플라스미드를 보유하는 숙주 세포의 MIC는 8 μg/mL 카나마이신이었다 (표 8). 돌연변이된 TadA*6-dCas9 변이체의 비편향 라이브러리를 이. 콜라이 내로 형질전환시키고, 64 μg/mL 내지 384 μg/mL 카나마이신을 함유하는 배지 상에서 선택하였다. 생존 클론은 3개의 풍부화된 돌연변이 세트: W23L/R, P48A 및 R152H/P를 함유하였다.

이들 돌연변이를 개별적으로 또는 조합하여 포유동물 세포 ABE (ABE7.1 내지 ABE7.10) 내로 도입한 것은, 특히 다수의 A 잔기를 함유하는 표적에서 A·T에서 G·C로의 편집 효율의 실질적인 증가를 가져왔다 (도 2b, 4a, 4b, 7, 12a 및 12b). ABE7.10은 6개 게놈 시험 부위를 평균 효율 58±4.0%로 편집하였고, 각각의 부위에서 ABE6.3에 비해 1.3±0.20배의 평균 개선 (도 4a) 및 ABE1.2와 비교하여 29±7.4배의 평균 개선을 가져왔다. 돌연변이 정밀조사는 모든 3개의 새로운 돌연변이가 편집 효율의 증가에 기여하는 것으로 밝혀냈지만 (도 7, 12a 및 12b), R152P 치환이 특히 주목할 만하다. 정렬된 ecTadA 결정 구조는 R152가 C-말단 나선에 있고 tRNA 기질의 UAC 안티코돈 루프에서 C와 접촉하는 것으로 예측한다 (도 2b 및 2c). Arg에서 Pro로의 치환은 이러한 나선을 파괴하고 염기-특이적 효소:DNA 상호작용을 제거할 수 있는 것으로 추측된다.

실시예 5 - 후기-단계 ABE의 특징화

라운드 5-7로부터의 가장 유망한 ABE를 심층적으로 특징화하였다. 표적 A를 프로토스페이서의 위치 5 또는 7에 배치하고 집합적으로 모든 가능한 NAN 서열 콘텍스트를 포함하는 확장된 17개 인간 게놈 표적 세트를 선택하였다 (도 3a). 전체적으로, HEK293T 세포에서 ABE5로부터 ABE7 변이체로의 진행 동안 A·T에서 G·C로의 편집 효율의 강한 개선이 관찰되었다 (도 4b). 전체에서 가장 활성인 편집제 ABE7.10의 염기 편집 효율은 시험된 17개 부위에서 평균 53±3.7%였고, 이들 부위 중 11개에서 50%를 초과하였으며, 34-68% 범위였다 (도 4a 및 4b). 이들 효율은 BE3⁶의 전형적인 C·G에서의 T·A로의 편집 효율보다 유리한 것으로 비교된다.

다음으로, 후기-단계 ABE의 염기 편집 활성 윈도우를 추가로 특징화하고자 하였다. 프로토스페이서 내의 2 내지 9의 모든 홀수 위치 (부위 18) 또는 모든 짝수 위치 (부위 19)에 A가 배치되도록 2개의 sgRNA 중 어느 하나로 표적화될 수 있는 교대 5'-A-N-A-N-A-N-3' 서열을 함유하는 인간 게놈 부위를 선택하였다 (도 3a). 생성된 편집 결과 (도 5a)는, 시험된 모든 19개 부위 전체에 걸쳐 모든 프로토스페이서 위치에서의 편집 효율의 분석 (도 5b)과 함께, 후기-단계 변이체의 활성 윈도우가 PAM을 위치 21-23으로서 카운팅하여 ABE7.10의 경우 프로토스페이서 위치 ~4-7에서 및 ABE6.3, ABE7.8 및 ABE7.9의 경우 위치 ~4-9에서 대략 4-6개 뉴클레오티드 폭이라는 것을 시사한다 (도 5a 내지 5c). 정확한 편집 윈도우 경계는 BE3 및 BE4의 경우와 같이 표적-의존성 방식으로 달라질 수 있음을 주목한다 (표 1). 또한 U2OS 세포 내 부위 1-6에서 ABE7.8, ABE7.9 및 ABE7.10을 시험하였고, HEK293T 세포에서와 유사한 편집 결과가 관찰되었으며 (도 12c), 이는 ABE 활성이 HEK293T 세포에 제한되지 않는다는 것을 입증한다.

HEK293T 세포 내 6 내지 17개의 게놈 부위에서의 ABE 편집으로부터의 개별 고처리량 DNA 서열분석 판독물의 분석은 편집 윈도우 내의 근처 아데닌에서의 염기 편집 결과가 통계적으로 독립적인 사건이 아니라는 것을 밝혀냈다. 근처 표적 아데닌들 사이의 평균 정규화된 연관 불평형 (LD)은 ABE 진화가 진행됨에 따라 꾸준히 증가하여, ABE1.2, ABE3.1, ABE5.3 및 ABE7.10의 정규화 LD는 각각 0.17±0.12, 0.56±0.27, 0.67±0.25 및 0.94±0.08이었다 (도 14a 및 14b). 따라서, 초기-단계 ABE는 근처 아데닌들을 더 독립적으로 편집하고, 반면 후기-단계 ABE는 근처 아데닌들을 더 프로세싱적으로 편집하여 동일한 DNA 가닥 내의 근처 A가 또한 편집될 경우 A를 편집할 가능성이 더 크다. 이들 발견은, 진화 과정 동안 TadA가 편집 윈도우 내의 추가의 A가 전환되기 전에 기질 방출 가능성을 감소시키는 진화된 동역학적 변화를 가져, BE3⁶의 거동과 유사한 프로세싱성을 유발할 수 있다는 것을 시사한다.

시티딘의 BE3-매개된 염기 편집으로부터 발생할 수 있는 C에서 비-T로의 편집 및 삽입결실의 형성과 대조적으로, ABE는 HEK293T 및 U2OS 세포에서 매우 깨끗하게 A·T를 G·C로 전환시키며, 비처리 대조군 세포의 경우와 유사하게 평균 < 0.1% 삽입결실이 일어나고, 시험된 17개의 게놈 NAN 부위 중 비처리 세포의 경우보다 많은 A에서 비-G로의 편집은 관찰되지 않았다 (도 5c 및 표 1). 최근에는 BE3의 바람직하지 않은 생성물이 우라실 절제 및 하류 복구 과정으로부터 일어난다는 것이 밝혀졌다⁹. BE3과 비교하여 모든 시험된 ABE 변이체의 현저한 생성물 순도는, DNA로부터 이노신을 제거하는 효소의 활성 또는 존재비가 UNG의 경우와 비교하여 낮아 아데닌 염기 편집 후 최소 염기 절제 복구를 가져올 수 있다는 것을 시사한다.

ABE7.10 촉매된 A·T에서 G·C로의 편집 효율을 최신 기술의 Cas9 뉴클레아제-매개된 HDR 방법 CORRECT⁴¹의 경우와 비교하였다. HEK293T 세포에서 최적화된 48시간 조건 하에 CORRECT HDR 방법을 사용하여 HEK293T 세포 내 5개의 게놈 유전자좌에서 0.47% 내지 4.2% 범위의 평균 표적 돌연변이 빈도와 3.3% 내지 10.6% 삽입결실이 관찰되었다 (도 6a). 이들 동일한 5개의 게놈 유전자좌에서, ABE7.10은 48시간 후 10-35% 및 120시간 후 55-68%의 평균 표적 돌연변이 빈도 (도 6a)와 < 0.1% 삽입결실 (도 6b)을 유발하였다. 표적 돌연변이:삽입결실 비는 CORRECT HDR의 경우 평균 0.43이고 ABE7.10의 경우 > 500이었으며, 이는 ABE7.10에 유리한 생성물 선택성의 > 1,000배 개선을 나타낸다. 이들 결과는 ABE7.10이 현재 Cas9 뉴클레아제-매개된 HDR 방법보다 훨씬 더 높은 효율 및 훨씬 더 적은 바람직하지 않은 생성물로 A·T에서 G·C로의 점 돌연변이를 도입할 수 있다는 것을 입증한다.

다음으로, ABE7 변이체의 오프-타겟 활성을 조사하였다. ABE의 오프-타겟 활성을 포괄적으로 프로파일링하는 방법이 아직 존재하지 않기 때문에, BE3을 사용한 경우에서 관찰된 바와 같이^6,8,9,42, 오프-타겟 ABE 편집은 Cas9 뉴클레아제가 특정한 가이드 RNA와 복합체화되는 경우에 편집되는 것과 동일한 오프-타겟 부위에서 주로 발생하는 것으로 가정되었다. HEK293T 세포를 3종의 잘-특징화되어 있는 가이드 RNA (HEK 부위 2, 3 및 4를 표적화함)⁴³ 및 Cas9 뉴클레아제 또는 ABE7 변이체로 처리하고, 게놈-와이드 GUIDE-Seq 방법에 의해 확인된 바와 같이 이들 가이드 RNA와 연관된 12개의 가장 활성인 오프-타겟 인간 게놈 유전자좌 및 온-타겟 유전자좌를 서열분석하였다.⁴³ Cas9에 의한 온-타겟 삽입결실의 효율 및 ABE7.10에 의한 온-타겟 염기 편집의 효율은 둘 다 평균 54%였다 (표 2-4). Cas9 뉴클레아제에 의한 검출가능한 변형 (≥ 0.2% 삽입결실)은 공지된 오프-타겟 유전자좌 12개 중 9개 (75%)에서 관찰되었다 (도 6c 및 표 2-4). 이와 대조적으로, 동일한 sgRNA와 복합체화된 경우, ABE7.10, ABE7.9 또는 ABE7.8은 공지된 Cas9 오프-타겟 부위 12개 중 단지 4개 (33%)에서만 ≥ 0.2% 오프-타겟 염기 편집을 일으켰다. 또한, 9개의 확인된 Cas9 오프-타겟 유전자좌는 평균 14% 삽입결실의 효율로 변형되었고, 반면 4개의 확인된 ABE 오프-타겟 유전자좌는 단지 평균 1.3% A·T에서 G·C로의 돌연변이로 변형되었다 (표 2-4). 9개의 확인된 Cas9 오프-타겟 유전자좌 중 7개가 ABE 활성 윈도우 내 적어도 1개의 A를 함유하였지만, 이들 7개의 오프-타겟 유전자좌 중 3개는 ABE7.8, 7.9 또는 7.10에 의해 검출가능하게 편집되지 않았다. 종합하면, 이들 데이터는 ABE7 변이체가, 편집가능한 A를 함유하는 오프-타겟 부위에 대해서도 Cas9 뉴클레아제보다 오프-타겟 게놈 변형에 덜 취약할 수 있다는 것을 시사한다. 추가로, ABE 처리 후 온-타겟 또는 오프-타겟 프로토스페이서 외부에서 ABE-유도된 A·T에서 G·C로의 편집의 증거는 검출되지 않았다.

실시예 6 - 인간 질환과 관련된 돌연변이의 ABE-매개된 교정 및 설치

마지막으로, 포유동물 세포에서 병원성 돌연변이를 교정하고 질환-억제 돌연변이를 도입하기 위한 ABE의 잠재력을 시험하였다. b-글로빈 유전자 내의 돌연변이는 다양한 혈액 질환을 유발한다. 희귀 양성 상태인 HPFH (태아성 헤모글로빈의 유전성 지속)를 갖는 인간은 겸상 적혈구성 빈혈을 포함한 일부 b-글로빈 질환에 대해 내성을 갖는다. 특정 환자에서, 이러한 표현형은 출생 즈음 인간에서는 통상 침묵되는 태아성 헤모글로빈의 지속 발현을 가능하게 하는 g-글로빈 유전자 HBG1 및 HBG2의 프로모터 내의 돌연변이에 의해 매개된다^44,45. 표적 A·T 염기 쌍을 프로토스페이서 위치 7에 배치함으로써 HBG1 발현을 구동하는 프로모터에서 -198T를 C로, 및 HBG2 발현을 구동하는 프로모터에서 -198T를 C로 동시에 돌연변이시키도록 ABE를 프로그램화하는 sgRNA를 설계하였다. 이들 돌연변이는 브리티쉬-유형 HPFH를 부여하고, 성인에서 태아성 헤모글로빈 생산을 가능하게 하는 것으로 공지되어 있다⁴⁶. ABE7.10은 HEK293T 세포 내 HBG1 및 HBG2 프로모터에 목적하는 T·A에서 C·G로의 돌연변이를 각각 29% 및 30% 효율로 설치하였다 (도 6c 및 14).

철 축적 장애인 유전성 혈색소증 (HHC)은 HFE 단백질 내 C282Y 돌연변이를 생성하는, 인간 HFE 유전자 내 뉴클레오티드 845에서의 G에서 A로의 돌연변이에 의해 통상적으로 유발되는 상염색체 열성 유전 장애이다^47,48. 이러한 돌연변이는 간 철 호르몬인 헵시딘의 불충분한 생산을 일으켜 과도한 장 철 흡수 및 잠재적으로 생명-위협 혈청 페리틴 상승을 유발한다. ABE7.10을 코딩하는 DNA 및 프로토스페이서 위치 5에 표적 A를 배치하는 가이드 RNA를, HFE C282Y 게놈 돌연변이를 보유하는 불멸화 림프모구성 세포주 (LCL) 내로 형질감염시켰다. 형질감염에 대한 LCL 세포의 극한 내성으로 인해, 형질감염된 세포를 단리하고, 편집 효율을 생성된 게놈 DNA의 HTS에 의해 측정하였다. 형질감염된 세포로부터의 총 DNA 서열분석 판독물의 28%에서 Tyr282로부터 Cys282 코돈으로의 깨끗한 전환이 관찰되었으며, 온-타겟 유전자좌에서 바람직하지 않은 편집 또는 삽입결실의 증거는 없었다 (도 6c). 이들 ABE 편집 전략을 글로빈병증, HHC 및 유전 성분을 갖는 다른 질환에 대한 잠재적인 향후 임상 요법으로 개발하기 위해서는 많은 추가의 연구가 필요하지만, 이들 실시예는 집합적으로 인간 세포에서 질환-구동 돌연변이를 교정하고 유전 질환 표현형을 억제하는 것으로 공지된 돌연변이를 설치하는 ABE의 잠재력을 입증한다.

요약하면, 7 라운드의 진화 및 조작은, DNA (야생형 TadA-dCas9 융합체) 내의 표적 유전자좌에서의 아데닌을 탈아미노화시키는 능력을 초기에 나타내지 않은 단백질을, DNA를 약하게 편집하는 형태 (ABE1 및 ABE2), 부위의 제한된 하위세트를 효율적으로 편집하는 변이체 (ABE3, ABE4 및 ABE5), 및 궁극적으로 넓은 서열 상용성을 갖는 고도로 활성인 아데닌 염기 편집제 (ABE6 및 ABE7)로 형질전환시켰다. ABE의 개발은 이중-가닥 DNA 파괴를 도입하지 않으면서 게놈 편집에 의해 다루어질 수 있는 병원성 SNP의 분율 및 염기 편집의 능력을 크게 확장시킨다 (도 1a). 추가로, ABE는 63개의 비-동의 코돈 변화, 개시 코돈의 파괴 또는 생성, 조기 정지 코돈의 파괴, 스플라이싱 공여자 또는 수용자 부위의 복구, 및 조절 서열의 변형을 포함한 광범위한 유용성의 정확한 유전적 변화를 만들기 위해 또한 사용될 수 있다. ABE7.10은 일반적인 A·T에서 G·C로의 염기 편집에 권장된다. 표적 A가 프로토스페이서 위치 8-10에 존재하는 경우에, 이들 위치에서의 전환 효율이 전형적으로 프로토스페이서 위치 4-7에서보다 더 낮긴 하지만, ABE7.9, ABE7.8 또는 ABE6.3은 ABE7.10보다 더 높은 편집 효율을 제공할 수 있다. BE3 및 BE4⁹와 함께, 이들 ABE는 최소의 바람직하지 않은 부산물로 살아있는 세포 내 표적 유전자좌에 모든 4개의 돌연변이의 직접 설치를 가능하게 함으로써 게놈 편집 분야를 진보시킨다.

데이터 이용가능성. ABE6.3, ABE7.8, ABE7.9 및 ABE7.10을 코딩하는 발현 벡터는 애드진(Addgene)으로부터 입수가능하다. 고처리량 DNA 서열분석 데이터는 NCBI 서열 판독물 아카이브에 기탁될 것이다.

방법

일반적 방법. 달리 언급되지 않는 한 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (써모피셔 사이언티픽(ThermoFisher Scientific)) 또는 Q5 핫 스타트 하이-피델리티 2x 마스터 믹스 (뉴 잉글랜드 바이오랩스(New England BioLabs))를 사용하여 PCR에 의해 DNA 증폭을 수행하였다. 이러한 연구에서 생성된 모든 포유동물 세포 및 박테리아 플라스미드를 이전에 기재된 바와 같이⁴⁹ USER 클로닝 방법을 사용하여 조립하고, 출발 물질 유전자 주형을 박테리아 또는 포유동물 코돈-최적화된 g블록 유전자 단편 (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies))으로서 합성적으로 접근하였다. 모든 sgRNA 발현 플라스미드를 목적하는 sgRNA 표적화 부위에 상응하는 가변 20-nt 서열을 함유하는 PCR 생성물의 1-조각 평활-말단 라이게이션에 의해 구축하였다. 이러한 연구에 사용된 모든 sgRNA 플라스미드의 합성에 사용된 프라이머 및 주형은 표 5에 열거되어 있다. 모든 포유동물 ABE 구축물 sgRNA 플라스미드 및 박테리아 구축물을 형질전환시키고, recA^-인 Mach1 T1^R 컴피턴트 셀 (써모 피셔 사이언티픽)에 -80℃에서 글리세롤 스톡으로 저장하였다. 분자 생물학 등급 하이클론 물 (지이 헬스케어 라이프 사이언시스(GE Healthcare Life Sciences))을 모든 검정 및 PCR 반응에 사용하였다. 내독소 제거를 포함하는 지모퓨어 플라스미드 미디프렙 (지모 리서치 코포레이션(Zymo Research Corporation))을 사용하여 진화 실험 및 포유동물 세포 검정에 사용된 모든 벡터를 정제하였다. 진화 동안 플라스미드 유지 또는 선택을 위해 사용된 항생제는 골드 바이오테크놀로지(Gold Biotechnology)로부터 구입하였다.

박테리아 TadA* 라이브러리의 생성 (진화 라운드 1-3, 5 및 7). 간략하게, 돌연변이유발된 이. 콜라이 TadA 유전자를 함유하는 PCR 생성물 및 편집제 플라스미드의 나머지 부분 (XTEN 링커, dCas9, sgRNA, 선택 마커, 복제 기점 및 프로모터 포함)을 함유하는 PCR 생성물의 2-조각 USER 조립에 의해 박테리아 ABE 구축물의 라이브러리를 생성하였다. 구체적으로, 뮤타자임 II (애질런트 테크놀로지스(Agilent Technologies))를 제조업체의 프로토콜에 따라 사용하고 프라이머 NMG-823 및 824 (표 6)를 사용하여 75 ng-1.2 μg의 주형을 함유하는 8 x 25 μL PCR 반응물에서 출발 주형 내로 돌연변이를 도입하였다 (표 7). 증폭 후, 생성된 PCR 생성물을 풀링하고, 민엘루트 PCR 정제 키트 (퀴아젠(Qiagen))를 사용하여 폴리머라제 및 반응 완충제로부터 정제하였다. PCR 생성물을 37℃에서 2시간 동안 Dpn1 (NEB)로 처리하여 임의의 잔류 주형 플라스미드를 소화시켰다. 후속적으로 목적하는 PCR 생성물을 0.5 μg/mL 브로민화에틸마그네슘을 함유하는 1% 아가로스 겔을 사용하여 겔 전기영동에 의해 정제하였다. 퀴아퀵 겔 추출 키트 (퀴아젠)를 사용하여 겔로부터 PCR 생성물을 추출하고, 30 μL의 H₂O로 용리시켰다. 겔 정제 후에, 돌연변이유발된 ecTadA DNA 단편을 프라이머 NMG-825 및 NMG-826 (표 6)에 의해 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (8 x 50 μL PCR 반응물, 66℃ 어닐링, 20초 연장)를 사용하여 증폭시켜 적절한 USER 접합부 서열을 단편의 5' 및 3' 말단 상에 설치하였다. 생성된 PCR 생성물을 겔 전기영동에 의해 정제하였다. 다음으로, 박테리아 염기 편집제 플라스미드 주형의 백본 (표 7)을 프라이머 NMG-799 및 NMG-824 (표 6) 및 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (98-웰 PCR 플레이트에서 웰당 100 μL, 총 5-6개의 플레이트, Tm 66℃, 4.5분 연장)를 제조업체의 프로토콜에 따라 사용하여 증폭시켰다. 각각의 PCR 반응물을 300 mL의 PB DNA 결합 완충제 (퀴아젠)와 합하고, 25 mL의 용액을 하이바인드 DNA 미디 칼럼 (오메가 바이오-테크(Omega Bio-Tek)) 상에 로딩하였다. 결합된 DNA를 5 칼럼 부피의 PE 세척 완충제 (퀴아젠)로 세척하고, DNA 단편을 칼럼당 800 μL의 H2O로 용리시켰다. 두 DNA 단편을 나노드롭 1000 분광광도계 (써모 피셔 사이언티픽)를 사용하여 정량화하였다.

TadA* 라이브러리를 이전에 보고된 USER 조립 절차⁴⁹에 따라 하기 조건을 사용하여 조립하였다: 10 μL의 USER 조립 혼합물당 0.22 pmol의 ecTadA 돌연변이유발된 DNA 단편 1, 0.22 pmol의 플라스미드 백본 단편 2, 1 U의 USER (우라실-특이적 절제 시약, 뉴 잉글랜드 바이오랩스) 효소 및 1 U의 DpnI 효소 (뉴 잉글랜드 바이오랩스)를 50 mM 아세트산칼륨, 20 mM 트리스-아세테이트, 10 mM 아세트산마그네슘, 100 μg/mL BSA (pH7.9) (1x 컷스마트 완충제, 뉴 잉글랜드 바이오랩스) 중에서 합하였다. 일반적으로, 각각의 진화 라운드는 ~1 mL의 USER 조립 혼합물 (22 nmol의 각각의 DNA 조립 단편)을 필요로 하였으며, 이를 다중 8-웰 PCR 스트립에 걸쳐 10-μL 분취량으로 분배하였다. 반응물을 60분 동안 37℃로 가온한 다음, 3분 동안 80℃로 가열하여 2종의 효소를 변성시켰다. 조립 혼합물을 써모사이클러에서 0.1℃/s로 12℃로 서서히 냉각시켜 2개의 USER 접합부의 새로 생성된 말단의 어닐링을 촉진시켰다.

수동으로 구축물의 라이브러리를 사용하여, 5 부피의 PB 완충제 (퀴아젠)를 조립 반응 혼합물에 첨가하고 물질을 민엘루트 칼럼 상에 결합시킴으로서 (칼럼당 480 μL), 변성된 효소 및 반응 완충제를 조립 혼합물로부터 제거하였다. ABE 혼성화된 라이브러리 구축물을 칼럼당 30 μL의 H2O 중에 용리시키고, 2 μL의 상기 용리된 물질을 20 μL의 NEB 10-베타 전기적격 이. 콜라이에 첨가하고, 16-웰 뉴클레오큐벳 스트립에서 박테리아 프로그램 5를 사용하여 론자(Lonza) 4D-뉴클레오펙터 시스템으로 전기천공하였다. 전형적인 진화 라운드는 5-10백만개의 콜로니 형성 단위 (cfu)를 생성하기 위해 ~300회의 전기천공을 사용하였다. 새로 전기천공된 이. 콜라이를 37℃에서 200 mL의 미리-가온된 데이비스 풍부 배지 (DRM) 내에서 회수하고, 500-mL 배기 배플형 플라스크 내에서 200 rpm으로 진탕시키면서 15분 동안 인큐베이션한 후, 카르베니실린 (플라스미드 유지를 위함)을 30 μg/mL로 첨가하였다. 배양물을 200 rpm으로 진탕시키면서 37℃에서 18시간 동안인큐베이션하였다. 플라스미드 라이브러리를 칼럼당 200 μL의 미리-가온된 물 중에서 용리시키는 것을 제외하고는, 플라스미드 라이브러리를 지모퓨어 플라스미드 미디프렙 키트로 제조업체의 절차에 따라 단리하였다 (DNA 칼럼당 50 mL 배양물). 진화 라운드 1-3, 5 및 7은 이러한 절차를 따라 부차 변이를 갖는 상응하는 라이브러리를 생성하였다 (표 7).

부위-포화 박테리아 TadA* 라이브러리의 생성 (진화 라운드 4). 주형으로서 ecTadA*(2.1)-dCas9를 사용하고 적절하게 설계된 축중성 NNK-함유 프라이머를 사용하여 증폭시킴으로써 ecTadA의 Arg24, Glu25, Arg107, Ala142 및 Ala143에서의 돌연변이유발을 달성하였다 (표 6). 간략하게, ecTadA*(2.1)-dCas9 주형을 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스를 사용하여 2 세트의 프라이머: NMG-1197 + NMG-1200 및 NMG-1199 + NMG-1200으로 개별적으로 증폭시켜, 각각 PCR 생성물 1 및 PCR 생성물 2를 형성하였다. 두 PCR 생성물을 PB 결합 완충제 및 민엘루트 칼럼을 사용하여 개별적으로 정제하고, 200 μL의 PCR 반응물당 20 μL의 H₂O로 용리시켰다. 제3 PCR 반응에서, 1 μL의 PCR 생성물 1 및 1 μL의 PCR 생성물 2를 외부 우라실-함유 프라이머 NMG-1202 및 NMG-1197과 조합하고, 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스에 의해 증폭시켜 플랭킹 우라실-함유 USER 접합부를 갖는 목적하는 연장-중첩 PCR 생성물을 형성하였다. 제4 PCR 반응에서, ecTadA*(2.1)-dCas9를 NMG-1201 및 NMG-1198로 증폭시켜, USER 조립을 위한 백본 DNA 단편을 생성하였다. 두 USER 조립 단편의 DpnI 소화 및 겔 정제 후에, 연장-중첩 PCR 생성물 (ecTadA 내의 목적하는 NNK 돌연변이를 함유함)을 상기 기재된 바와 같이 USER 조립에 의해 ecTadA*(2.1)-dCas9 백본 내로 혼입시켰다. 새로 생성된 NNK 라이브러리를 NEB 10-베타 전기적격 이. 콜라이 내로 형질전환시키고, DNA를 상기 기재된 바와 같이 수거하였다.

DNA-셔플링된 박테리아 TadA* 라이브러리의 생성 (진화 라운드 6). DNA 셔플링을 변형된 버전의 뉴클레오티드 교환 및 절제 기술 (NExT) DNA 셔플링 방법에 의해 달성하였다⁵⁰. 각각 10 mM의 dATP, dCTP, dGTP 및 dTTP/dUTP의 용액 (3부 dUTP: 7부 dTTP)을 새로 제조하였다. 다음으로, Taq DNA 폴리머라제 (NEB), 프라이머 NMG-822 및 NMG-823 (표 6), 및 1x 써모폴 반응 완충제 (Tm 63 ℃, 1.5분 연장 시간) 중 각각 400 μM의 dATP, dCTP, dGTP 및 dUTP/dTTP (3:7)를 사용하여 등몰 농도로 진화 라운드 1-5로부터 단리된 TadA*-XTEN-dCas9 박테리아 구축물의 풀 20 fmol로부터 TadA* 단편을 증폭시켰다. 새로 생성된 우라실-함유 DNA 라이브러리 단편을 겔 전기영동에 의해 정제하고, 퀴아퀵 겔 추출 키트 (퀴아젠)로 추출하고, 칼럼당 20 μL의 H2O로 용리시켜 정제하였다. 정제된 DNA 생성물을 37℃에서 1x 컷스마트 완충제 중 40 μL당 2 U의 USER 효소로 소화시키고, 소화가 완료될 때까지 분석적 아가로스 겔 전기영동에 의해 모니터링하였다. 출발 물질이 더 이상 관찰되지 않을 때 (전형적으로 37℃에서 3-4시간) 10 부피의 PN1 결합 완충제 (퀴아젠)로 반응을 켄칭하였다. 필요한 경우에 추가의 USER 효소를 반응에 첨가하였다. 소화된 물질을 퀴아엑스II 키트 (퀴아젠)로 제조업체의 프로토콜을 사용하여 정제하고, DNA 단편을 칼럼당 50 μL의 미리-가온된 H2O 중에 용리시켰다.

정제된 셔플링된 TadA* 단편을 내부 프라이머 연장 절차에 의해 전장 TadA*-XTENdCas9 생성물로 재조립하였다. 용리된 소화된 DNA 단편 (25 μL)을 0.5 mM MgSO4가 보충된 1x 써모폴 완충제 중 4 U의 벤트 폴리머라제 (NEB), 각각 800 μM의 dATP, dCTP, dGTP 및 dTTP, 1 U의 Taq DNA 폴리머라제와 합하였다. 재조립 절차를 위한 써모사이클러 프로그램은 하기와 같다: 3분 동안 94℃, 30초 동안 92℃에서 변성의 40 사이클, 30℃에서 출발하여 사이클당 1℃ 추가되면서 증가하는 온도에서 60초에 걸쳐 어닐링 (냉각 기울기 = 1℃/초), 및 사이클당 4초 추가되면서 60초 동안 72℃에서 연장, 10분 동안 72℃의 한 최종 사이클로 종료. 재조립된 생성물을 하기 조건을 사용하여 PCR에 의해 증폭시켰다: 15 μL의 정제되지 않은 내부 조립물을 각각 1 μM의 USER 프라이머 NMG-825 및 NMG-826, 100 μL의 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 및 H2O와 200 μL의 최종 부피로 합함, 63℃ 어닐링, 30초의 연장 시간. PCR 생성물을 겔 전기영동에 의해 정제하고, USER 방법을 사용하여 상기와 같이 USER 프라이머 NMG-799 및 NMG-824를 사용하여 백본의 증폭으로부터 생성된 상응하는 플랭킹 USER 접합부를 갖는 상응하는 ecTadA*-XTEN-dCas9 백본 내로 조립하였다. 혼성화된 라이브러리를 NEB 10-베타 전기적격 이. 콜라이 내로 형질전환시킨 후에 지모퓨어 플라스미드 미디프렙 키트를 제조업체의 절차에 따라 사용하여 진화 6 구축물의 라이브러리를 단리하였다.

TadA 변이체의 박테리아 진화. 이전에 기재된 균주 S1030⁵¹을 모든 진화 실험에서 사용하였고, 각각의 진화 라운드에 특이적인 적절한 선택 플라스미드를 보유하는 전기적격 버전의 박테리아를 이전에 기재된 바와 같이⁴⁹ 제조하였다 (표 7). 간략하게, 상기 기재된 바와 같이 제조된 2 μL의 새로 생성된 TadA* 라이브러리 (300-600 ng/μL)를 표적 선택 플라스미드를 함유하는 새로 제조된 전기적격 S1030 세포 22 μL에 첨가하고, 16-웰 뉴클레오큐벳 스트립에서 론자 4D-뉴클레오펙터 시스템으로 박테리아 프로그램 5를 사용하여 전기천공하였다. 전형적인 선택은 5-10 x 10⁶ cfu를 사용하였다. 전기천공 후에, 새로 형질전환된 S1030 세포를 15분 동안 200 rpm으로 진탕시키면서 37℃에서 총 250 mL의 미리-가온된 DRM 배지에서 회수하였다. 이러한 짧은 회수 인큐베이션 후에, 선택 플라스미드를 유지하기 위한 적절한 항생제와 함께, 라이브러리 플라스미드를 유지하기 위한 카르베니실린을 30 μg/mL의 최종 농도로 첨가하였으며; 각 라운드에 대해 사용된 항생제를 포함한 선택 조건의 목록에 대해서는 표 7을 참조한다. 플라스미드 유지 항생제의 첨가 직후에, 100 mM의 L-아라비노스를 배양물에 첨가하여 TadA*-dCas9 융합 라이브러리 구성원의 번역을 유도하였으며, 이는 P_BAD 프로모터로부터 발현되었다. 배양물을 18시간 동안 200 rpm으로 진탕시키면서 37℃에서 포화로 성장시켰으며, 예외로 진화 라운드 5에 대한 인큐베이션 시간은 단지 7시간이었다.

1.8% 한천-2xYT, 30 μg/mL의 플라스미드 유지 항생제, 및 항생제 단독을 보유하는 S1030 균주의 MIC를 초과하도록 미리 결정된 농도의 선택 항생제 (표 8)를 함유하는 각각 4개의 500-cm2 정사각형 배양 접시 상에 10 mL의 포화 배양물을 플레이팅함으로써 라이브러리 구성원을 챌린지하였다. 플레이트를 37℃에서 2일 동안 인큐베이션하고, ~500개의 생존 콜로니를 단리하였다. 이들 콜로니로부터의 TadA* 유전자를 프라이머 NMG-822 및 NMG-823 (표 6)으로 PCR에 의해 증폭시키고, DNA 서열분석을 위해 제출하였다. 공동으로, 콜로니를 96-딥 웰 플레이트 내 1-mL DRM 배양물에 개별적으로 접종하고, 37℃, 200 r.p.m에서 밤새 성장시켰다. 각각의 밤샘 배양물의 분취물 (100 μL)을 풀링하고, 플라스미드 DNA를 단리하고, TadA* 유전자를 USER 프라이머 NMG-825 및 NMG-826 (표 6)으로 증폭시켰다. TadA* 유전자를 상기 기재된 사용자 USER 조립 프로토콜을 사용하여 플라스미드 백본 (XTEN 링커-dCas9 및 적절한 가이드 RNA를 함유함) 내로 다시 서브클로닝하였다. 이러한 풍부화된 라이브러리를 적절한 S1030 (+선택 플라스미드) 전기적격 세포 내로 형질전환시키고, 유지 항생제 및 L-Ara와 함께 인큐베이션하고, 선택 조건으로 재-챌린지하였다. 2-일 인큐베이션 후에, 300-400개의 생존 클론을 상기 기재된 바와 같이 단리하고, 그의 TadA* 유전자를 서열분석하였다. 각각의 선택 라운드로부터 발생한 돌연변이를 포유동물 ABE 구축물 내로 도입하고, 하기 기재된 바와 같이 포유동물 세포에서 시험하였다.

일반적 포유동물 세포 배양 조건. HEK293T (ATCC CRL-3216) 및 U2OS (ATTC HTB-96)를 ATCC로부터 구입하고, 10% (v/v) 태아 소 혈청 (FBS)이 보충된 둘베코 변형 이글 배지 (DMEM) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 배양 및 계대배양하였다. Hap1 (호리즌 디스커버리(Horizon Discovery), C631) 및 Hap1 AAG세포 (호리즌 디스커버리, HZGHC001537c002)를 10% (v/v) FBS가 보충된 이스코브 변형 둘베코 배지 (IMDM) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 유지하였다. HFE 유전자에 C282Y 돌연변이를 함유하는 림프모구성 세포주 (LCL) (코리엘 바이오레포지토리(Coriell Biorepository), GM14620)를 20% FBS가 보충된 로스웰 파크 메모리얼 인스티튜트 배지 1640 (RPMI-1640) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 유지하였다. 모든 세포 유형을 인큐베이션하고, 유지하고, 37℃에서 5% CO₂ 하에 배양하였다.

HEK293T 조직 배양 형질감염 프로토콜 및 게놈 DNA 제조. 항생제의 부재 하에 성장시킨 HEK293T 세포를 48-웰 폴리-D-리신 코팅된 플레이트 (코닝) 상에 시딩하였다. 시딩 12-14시간 후에, 세포를 대략 70% 전면생장률에서 1.5 μL의 리포펙타민 2000 (써모 피셔 사이언티픽)을 제조업체의 프로토콜에 따라 사용하고, 750 ng의 ABE 플라스미드, 250ng의 sgRNA 발현 플라스미드 및 10 ng의 GFP 발현 플라스미드 (론자)를 사용하여 형질감염시켰다. 달리 언급되지 않는 한, 세포를 제3일에 배지 교체하면서 5일 동안 배양하였다. 배지를 제거하고, 세포를 1x PBS 용액 (써모 피셔 사이언티픽)으로 세척하고, 100 μL의 새로 제조된 용해 완충제 (10 mM 트리스-HCl, pH 7.0, 0.05% SDS, 25 μg/mL 프로테이나제 K (써모피셔 사이언티픽))를 조직 배양 플레이트의 각 웰에 직접 첨가함으로써 게놈 DNA를 추출하였다. 게놈 DNA 혼합물을 96-웰 PCR 플레이트로 옮기고, 37℃에서 1시간 동안 인큐베이션하고, 이어서 80℃ 효소 변성 단계를 30분 동안 수행하였다. 포유동물 세포 게놈 DNA 증폭에 사용된 프라이머는 표 9에 열거되어 있다.

HAP1 및 HAP1 AAG^- 세포의 뉴클레오펙션 및 게놈 DNA 추출. SE 세포주 4D-뉴클레오펙터 X 키트 S를 제조업체의 프로토콜에 따라 사용하여 HAP1 및 HAP1 AAG^- 세포를 뉴클레오펙션시켰다. 간략하게, 4 x 10⁵개 세포를 4D-뉴클레오펙터 프로그램 DZ-113을 사용하여 300 ng의 ABE 플라스미드 및 100 ng의 sgRNA 발현 플라스미드로 뉴클레오펙션시키고, 48-웰 폴리-D-리신 코팅된 배양 플레이트 내 250 μL의 배지에서 3일 동안 배양하였다. 상기 기재된 바와 같이 DNA를 추출하였다.

U2OS 세포의 뉴클레오펙션 및 게놈 DNA 추출. SG 세포주 4D-뉴클레오펙터 X 키트 (론자)를 제조업체의 프로토콜에 따라 사용하여 U2OS 세포를 뉴클레오펙션시켰다. 간략하게, 1.25 x 10⁵개 세포를 16-웰 뉴클레오큐벳 스트립에서 (웰당 20 μL의 세포) 4D-뉴클레오펙터 프로그램 EH-100을 사용하여 20 μL의 SG 완충제 중 500 ng의 ABE 플라스미드 및 100 ng의 sgRNA 발현 플라스미드로 뉴클레오펙션시켰다. 새로 뉴클레오펙션된 세포를 48-웰 폴리-D-리신 코팅된 배양 플레이트 내 250 μL의 배지 내로 옮겼다. 세포를 5일 동안 인큐베이션하고, 배지를 매일 교체하였다. 상기 기재된 바와 같이 DNA를 추출하였다.

LCL HFE C828Y 세포의 전기천공. 진 펄서 엑스셀 전기천공기 (바이오라드(BioRad)) 및 0.4 cm 갭 진 펄서 전기천공 큐벳 (바이오라드)을 사용하여 LCL 세포를 전기천공하였다. 간략하게, 1 x 10⁷개 LCL 세포를 250 μL RPMI-160 플러스 글루타맥스 중에 재현탁시켰다. 이 배지에 ABE7.10, GFP 및 HFE 유전자 내의 C282Y 돌연변이를 표적화하는 상응하는 sgRNA를 발현하는 플라스미드 65 μg을 첨가하였다. 혼합물을 사전냉각된 0.4 cm 갭 전기천공 큐벳에 첨가하고, 세포/DNA 혼합물을 얼음 상의 큐벳 내에서 10분 동안 인큐베이션하였다. 세포를 250 V 및 950 μF에서 3 ms 동안 펄싱하였다. 세포를 얼음 상에 10분 동안 다시 옮기고, 이어서 T-75 플라스크 내 20% FBS가 보충된 사전-가온된 RPMI-160 15 mL로 옮겼다. 다음날, 추가 5 mL의 배지를 플라스크에 첨가하고, 세포를 총 5일 동안 인큐베이션되도록 하였다. 인큐베이션 후, 세포를 원심분리에 의해 단리하고, 400 μL의 배지 중에 재현탁시키고, 40 μm 스트레이너 (써모 피셔 사이언티픽)를 통해 여과하고, FACSAria III 유동 세포측정기 (벡톤 딕킨슨 바이오사이언시스(Becton Dickenson Biosciences))를 사용하여 GFP 형광에 대해 분류하였다. GFP-양성 세포를 500 μL의 배지를 함유하는 1.5-mL 튜브에 수집하였다. 원심분리 후, 배지를 제거하고, 세포를 600 μL의 1x PBS (써모 피셔 사이언티픽)로 2회 세척하였다. 게놈 DNA를 상기 기재된 바와 같이 추출하였다.

'CORRECT' 방법⁵²을 사용하는 ABE7.10과 상동성 지정 복구 사이의 비교. 항생제의 부재하에서 성장시킨 HEK293T 세포를 48-웰 폴리-D리신 코팅된 플레이트 (코닝) 상에 시딩하였다. 12-14시간 후, 세포를 ~70% 전면생장률에서 750 ng의 Cas9 또는 염기 편집제 플라스미드, 250 ng의 sgRNA 발현 플라스미드, 1.5 μL의 리포펙타민 3000 (써모 피셔 사이언티픽), 및 HDR 검정을 위한 0.7 μg의 단일-가닥 공여자 DNA 주형 (100 nt, IDT로부터 PAGE-정제됨)을 제조업체의 지침에 따라 사용하여 형질감염시켰다. 100-량체 단일-가닥 올리고뉴클레오티드 공여자 주형은 표 10에 열거되어 있다.

아젠코트 DNA드밴스 게놈 DNA 단리 키트 (베크만 쿨터(Beckman Coulter))를 사용하여 (CORRECT 방법52의 개발 동안 문헌 [Tessier-Lavigne et al.]에 기재된 바와 같이) 형질감염 48시간 후에 게놈 DNA를 수거하였다. 크기-선택적 DNA 단리 단계는 후속 PCR 증폭 및 서열분석 단계에서 단일 가닥 공여자 DNA 주형에 의한 오염의 위험이 없도록 보장하였다. 공여자 올리고 주형 증폭의 위험이 최소이도록 보장하기 위해 증폭 프라이머를 재-설계하였다.

게놈 DNA 샘플의 고처리량 DNA 서열분석 (HTS). 관심 영역 및 적절한 일루미나 정방향 및 역방향 어댑터에 대한 상동성을 함유하는 프라이머 (표 9)를 사용하여 PCR에 의해 관심 게놈 부위를 증폭시켰다. 이러한 연구에서 논의된 모든 게놈 부위에 대한 제1 라운드의 PCR (PCR 1)에서 사용된 프라이머 쌍을 표 9에서 찾아볼 수 있다. 구체적으로, 0.5 μM의 각각의 정방향 및 역방향 프라이머, 1 μL의 게놈 DNA 추출물 및 12.5 μL의 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스를 함유하는 25 μL의 주어진 PCR 1 반응물을 조립하였다. PCR 반응을 하기와 같이 수행하였다: 95℃에서 2분 동안, 이어서 [95℃에서 15초 동안, 62℃에서 20초 동안 및 72℃에서 20초 동안]의 30 사이클, 이어서 2분 동안 최종 72℃ 연장. 브로민화에티듐이 보충된 2% 아가로스 겔 상에서 DNA 표준물 (퀵-로드 100 bp DNA 래더)과의 비교에 의해 PCR 생성물을 검증하였다. 2차 PCR 반응 (PCR 2)에서 각각의 샘플에 고유한 일루미나 바코딩 프라이머 쌍을 첨가하였다. 구체적으로, 0.5 μM의 각각의 고유한 정방향 및 역방향 일루미나 바코딩 프라이머 쌍, 2 μL의 비정제된 PCR 1 반응 혼합물 및 12.5 μL의 Q5 핫 스타트 하이-피델리티 2x 마스터 믹스를 함유하는 25 μL의 주어진 PCR 2 반응물을 조립하였다. 바코딩 PCR 2 반응을 하기와 같이 수행하였다: 95℃에서 2분 동안, 이어서 [95℃에서 15초 동안, 61℃에서 20초 동안 및 72℃에서 20초 동안]의 15 사이클, 이어서 2분 동안 최종 72℃ 연장. 퀴아퀵 겔 추출 키트를 사용하여 2% 아가로스 겔에서 30 μL의 H2O로 용리시키면서 전기영동하여 PCR 생성물을 정제하였다. DNA 농도를 KAPA 라이브러리 정량화 키트-일루미나 (카파 바이오시스템즈(KAPA Biosystems))로 정량화하고, 일루미나 MiSeq 기기 상에서 제조업체의 프로토콜에 따라 서열분석하였다.

일반적 HTS 데이터 분석. 서열분석 판독물을 MiSeq 리포터 (일루미나)에서 디멀티플렉싱하였다. 개선된 출력 포맷을 갖는 매트랩 스크립트 (보충 노트 1)를 사용하여 이전에 기재된 바와 같이 앰플리콘 서열의 참조 서열에 대한 정렬을 수행하였다. 간략하게, 스미스-워터맨 알고리즘을 사용하여 삽입결실이 없는 서열을 참조 서열에 대해 정렬하고; 30 미만의 품질 점수를 갖는 염기를 'N'으로 전환시켜 서열분석 오류의 결과로서의 염기 오호출을 방지하였다. 품질 점수 Q30 미만의 염기 호출의 절반 초과를 갖는 서열분석 판독물을 필터링하는 변형된 버전의 이전에 기재된 매트랩 스크립트 (보충 노트 2)를 사용하여 삽입결실을 개별적으로 정량화하였다. 예측된 Cas9 절단 부위를 둘러싸는 30-bp 윈도우 내에서 1 bp 이상의 삽입 또는 결실을 함유한 판독물로서 삽입결실을 카운팅하였다.

HBG1 및 HBG2 유전자좌에서의 상동성으로 인해, 단일 PCR 반응 내에서 두 유전자좌를 증폭시킬 프라이머를 설계하였다. 이들 2개의 게놈 부위의 서열을 계산상 분리시키기 위해, 이러한 앰플리콘을 포함하는 서열분석 실험을 개별 파이톤 스크립트 (보충 노트 3)를 사용하여 프로세싱하였다. 간략하게, 염기 호출의 절반 초과가 Q30 미만이고, Q30 미만의 품질 점수를 갖는 염기 호출이 'N'으로 전환된 경우에 판독물을 무시하였다. 부위들 사이에 상이한 2개의 SNP를 함유하는 37-bp 서열에 대해 정확한 매치를 갖는 것으로 HBG1 또는 HBG2 판독물을 확인하였다. 프로토스페이서 서열에 중심을 둔 43-bp 윈도우의 양측 상의 10-bp 플랭킹 서열에 대한 정확한 매치에 의해 염기 호출 및 삽입결실 윈도우를 규정하였다. 이러한 염기 호출 윈도우가 ≥ 1 bp 상이한 길이인 판독물로서 삽입결실을 카운팅하였다. 이러한 파이톤 스크립트는 동일한 품질 (추정된 염기 호출 오류율 1,000개 중 < 1개)을 갖는 출력을 산출하지만, 정렬 단계의 부재로 인해 훨씬 더 짧은 시간 안에 이루어진다.

편집된 판독물의 총수를 성공적으로 서열분석된 판독물의 총수의 비율로서 계산하기 위해, 정렬 알고리즘에 의해 측정된 바와 같은 편집된 판독물의 분율에 [1 - 삽입결실을 함유하는 판독물의 분율]을 곱하였다.

연관 불평형 분석. 맞춤 파이톤 스크립트 (보충 노트 4)를 사용하여 1차 표적 A (P₁), 2차 표적 A (P₂) 및 1차 및 2차 표적 A 둘 다 (P_1,2)에서의 편집 확률을 평가하였다. 이어서 연관 불평형 (LD)을 P_1,2- (P₁ x P₂)로서 평가하였다. LD 값을 Min(P₁(1 - P₂), (1 - P₁)P₂)의 정규화 인자로 정규화하였다. 이러한 정규화는 대립유전자 빈도를 제어하고 0 내지 1의 정규화된 LD 값을 산출한다.

실시예 7 - 인간 질환, 예컨대 겸상 적혈구 질환 및 베타-지중해빈혈을 치료하기 위한 HBG1/2 프로모터 내 ABE-매개된 돌연변이 설치

도 15에 나타낸 sgRNA는 성인에서 태아성 헤모글로빈 상향조절을 부여하는 공지된 돌연변이 또는 그 근처의 부위에 주로 초점이 맞추어진 HBG1/2 프로모터 내의 부위를 표적화한다. ABE7.10 및 개별 sgRNA 플라스미드 (750ng의 편집제, 250ng의 가이드)를 HEK293T 세포 내로 리포펙션시켰다. HEK293T 세포에서 3일의 발현 후에, 배지를 흡인하고, 신선한 배지를 첨가하였다. 2일의 성장 후에, DNA를 추출하였다. PCR을 수행하여 HBG1/2 프로모터 영역을 증폭시켰다. 일루미나 MiSeq를 사용하여 PCR 생성물을 서열분석하고, 각각의 샘플에 대해 편집을 정량화하였다. 도 15에 나타낸 가이드로 처리된 세포에 대한 윈도우 내에서 관찰된 최고 편집이 플롯팅되어 있다. 이들 결과는 성인에서 태아성 헤모글로빈을 상향조절할 수 있는 돌연변이가 도입될 수 있다는 것을 확립시켜 준다. 이러한 돌연변이의 도입은 겸상 적혈구 질환 및 베타 지중해빈혈에 치료적일 수 있다.

참고문헌

표 1. 비처리 HEK293T 세포 및 17개의 게놈 부위에서 ABE6.3, ABE7.8, ABE7.9 또는 ABE7.10으로 처리되고 상응하는 sgRNA 발현 플라스미드로 공동-형질감염된 HEK293T 세포의 HTS 서열분석 결과 및 %삽입결실. 하나의 임의적으로 선택된 복제물이 제시되어 있고; 모든 복제물에 대한 데이터는 NCBI 서열분석 판독물 아카이브로부터 입수가능하다.

표 2. 에스. 피오게네스 Cas9 뉴클레아제에 대해 이전에 특징화된 HEK2 온-타겟 및 오프-타겟 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.¹

표 3. 에스. 피오게네스 Cas9 뉴클레아제에 의한 온-타켓 및 오프-타겟 변형에 대해 이전에 특징화된 HEK3 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.¹

표 4. 에스. 피오게네스 Cas9 뉴클레아제에 의한 온-타겟 및 오프-타겟 변형에 대해 이전에 특징화된 HEK4 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.¹ HEK4 오프-타겟 부위 3은 ABE 처리시 상당한 삽입결실 형성을 나타냈지만, 이러한 유전자좌는 또한 Cas9 뉴클레아제에 의해 비통상적으로 높은 (89%) 삽입결실 형성을 나타냈고, Cas9 니카제로의 처리시에 삽입결실 형성을 나타내는 유일한 시험된 오프-타겟 부위였다. 이러한 유전자좌는 비통상적으로 취약하고, 여기서의 삽입결실 형성은 ABE-매개된 아데닌 탈아미노화보다는 단순히 부위의 니킹으로부터 발생한 것으로 추측된다.

표 5. sgRNA 플라스미드를 생성하는데 사용된 프라이머. 20-nt 표적 프로토스페이서가 적색으로 제시되어 있다. 표적 DNA 서열이 'G'로 시작되지 않은 경우에는, 인간 U6 프로모터가 전사 개시 부위에 'G'를 선호하기 때문에 프라이머의 5' 말단에 'G'를 부가하였다^2-4. 이전에 기재된 pFYF sgRNA 플라스미드⁵를 PCR 증폭을 위한 주형으로서 사용하였다.

표 6. 박테리아 TadA* 라이브러리를 생성하는데 사용된 프라이머.

표 7. 이. 콜라이에서 각 라운드의 TadA* 돌연변이유발 및 선택에 사용된 출발 구축물. 모든 플라스미드는 SC101 복제 기점, 카르베니실린에 의한 플라스미드 유지를 위한 β-락타마제 유전자, TadA*-dCas9 발현을 구동하는 P_BAD 프로모터 및 sgRNA 전사를 구동하는 lac 프로모터를 함유한다. 박테리아 선택 동안 사용된 염기 편집제의 아키텍처는 TadA*-링커(16 aa)-dCas9이다.

표 8. 항생제 선택 플라스미드 및 그의 상응하는 이. 콜라이 항생제 최소 억제 농도 (MIC).

표 9. 포유동물 세포 게놈 DNA 증폭에 사용된 프라이머.

표 10. HDR 실험에 사용된 100-량체 단일-가닥 올리고뉴클레오티드 공여자 주형 (ssODN).

보충 서열 1. 본 연구에 사용된 아데닌 데아미나제의 DNA 서열.

박테리아 코돈-최적화된 ecTadA (야생형):

포유동물 코돈-최적화된 ecTadA (야생형):

포유동물 코돈-최적화된 mADA:

포유동물 코돈 최적화된 hADAR2 (촉매 도메인):

포유동물 코돈 최적화된 hADAT2:

보충 서열 2. 본 연구에 사용된 항생제 내성 유전자의 DNA 서열. 불활성화 돌연변이는 볼드체로 제시된다.

클로람페니콜 내성 유전자 (Cam^R) H193Y:

카나마이신 내성 유전자 (Kan^R) Q4정지 및 W15정지:

스펙티노마이신 내성 유전자 (Spect^R) T89I:

카나마이신 내성 유전자 (Kan^R) Q4정지 및 D208N:

보충 노트 1. 염기 호출을 위한 매트랩 스크립트.

보충 노트 2. 삽입결실 분석을 위한 매트랩 스크립트.

보충 노트 3. HBG1 및 HBG2 염기 편집 및 삽입결실의 분석을 위한 파이톤 스크립트.

등가물 및 범주, 참조로 포함

관련 기술분야의 통상의 기술자는 상용 실험에 지나지 않는 것을 사용하여, 본원에 기재된 본 발명의 구체적 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 본 발명의 범주는 상기 설명에 제한되도록 의도된 것은 아니며, 오히려 첨부된 청구범위에 제시된 바와 같다.

청구범위에서 단수표현은 달리 나타내지 않는 한 또는 달리 문맥으로부터 명백하지 않는 한 하나 또는 하나 초과를 의미할 수 있다. 군의 하나 이상의 구성원들 사이에 "또는"을 포함하는 청구범위 또는 설명은 달리 나타내지 않는 한 또는 달리 문맥으로부터 명백하지 않는 한 군 구성원 중 하나, 하나 초과 또는 모두가 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 경우에 충족된 것으로 간주된다. 본 발명은 군의 정확하게 하나의 구성원이 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 실시양태를 포함한다. 본 발명은 또한 군 구성원의 하나 초과 또는 모두가 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 실시양태를 포함한다.

추가로, 본 발명은 하나 이상의 청구항 또는 명세서의 관련 부분으로부터의 하나 이상의 제한, 요소, 절, 서술적 용어 등이 또 다른 청구항 내에 도입되는 모든 변동, 조합 및 순열을 포괄하는 것으로 이해될 것이다. 예를 들어, 또 다른 청구항에 대해 종속항인 임의의 청구항은 동일 기반 청구항에 대해 종속항인 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 추가로, 청구항이 조성물을 인용하는 경우에, 달리 나타내지 않거나 또는 모순 또는 불일치가 발생할 것임이 관련 기술분야의 통상의 기술자에게 분명하지 않는 한, 본원에 개시된 임의의 목적을 위해 상기 조성물을 사용하는 방법이 포함되고, 본원에 개시된 임의의 제조 방법 또는 관련 기술분야에 공지된 다른 방법에 따라 상기 조성물을 제조하는 방법이 포함되는 것으로 이해될 것이다.

요소들이, 예를 들어 마쿠쉬 군 포맷의 목록으로서 제시되는 경우에, 요소의 각각의 하위군이 또한 개시되고, 임의의 요소(들)가 이러한 군으로부터 제거될 수 있는 것으로 이해될 것이다. 또한 용어 "포함하는"은 개방된 것을 의도하고 추가의 요소 또는 단계의 포함을 허용한다는 것에 주의한다. 일반적으로, 본 발명 또는 본 발명의 측면이 특정한 요소, 특색, 단계 등을 포함하는 것으로 언급된 경우, 본 발명 또는 본 발명의 측면의 특정 실시양태가 그러한 요소, 특색, 단계 등으로 이루어지거나 본질적으로 이루어지는 것으로 이해되어야 한다. 단순성의 목적을 위해, 그 실시양태는 본원에 구체적으로 제시되지 않았다. 따라서, 하나 이상의 요소, 특색, 단계 등을 포함하는 본 발명의 각각의 실시양태에 대해, 본 발명은 또한 그 요소, 특색, 단계 등으로 이루어지거나 본질적으로 이루어지는 실시양태를 제공한다.

범위가 주어진 경우, 종점들이 포함된다. 추가로, 달리 나타내지 않는 한 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 문맥이 달리 명백하게 지시하지 않는 한 본 발명의 상이한 실시양태에서 언급된 범위 내에 있는 임의의 특정 값을 상기 범위의 하한치의 단위의 10분의 1로 취할 수 있는 것으로 이해될 것이다. 달리 나타내지 않는 한 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 주어진 범위 내에 있는 임의의 하위범위를 취할 수 있며, 여기서 하위범위의 종점은 상기 범위의 하한치의 단위의 10분의 1과 동일한 정도의 정확도로 표현되는 것으로 또한 이해될 것이다.

추가로, 본 발명의 임의의 특정한 실시양태는 어느 하나 이상의 청구항으로부터 명백하게 배제될 수 있는 것으로 이해될 것이다. 범위가 주어지는 경우에, 범위 내에 있는 임의의 값은 어느 하나 이상의 청구항으로부터 명백하게 배제될 수 있다. 본 발명의 조성물 및/또는 방법의 임의의 실시양태, 요소, 특색, 적용 또는 측면은 어느 하나 이상의 청구항으로부터 배제될 수 있다. 간결성의 목적을 위해, 하나 이상의 요소, 특색, 목적 또는 측면이 배제된 모든 실시양태는 본원에 명백하게 제시되지 않는다.

상기 열거된 항목을 포함한, 본원에 언급된 모든 공개물, 특허 및 서열 데이터베이스 목록은 마치 각각의 개별 공개물 또는 특허가 구체적으로 및 개별적으로 참조로 포함되는 것으로 나타내어진 바와 같이 그 전문이 본원에 참조로 포함된다. 상충되는 경우에, 본원의 임의의 정의를 포함한 본 출원이 우선할 것이다.

SEQUENCE LISTING <110> The Broad Institute, Inc. President and Fellows of Harvard College Beam Therapeutics Inc. <120> USES OF ADENOSINE BASE EDITORS <130> B1195.70048WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/573,127 <151> 2017-10-16 <160> 871 <170> PatentIn version 3.5 <210> 1 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 1 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp 165 <210> 2 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 2 gtggggaagg ggcccccaag agg 23 <210> 3 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 3 tatacgtacc aggtggagca cccagg 26 <210> 4 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 4 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 5 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 5 Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys 1 5 10 15 Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys 20 25 30 <210> 6 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 6 cctcttgggg gccccttccc cacacta 27 <210> 7 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 7 cctcttgggg gccccttccc cacact 26 <210> 8 <211> 160 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 8 Met Gly Ser His Met Thr Asn Asp Ile Tyr Phe Met Thr Leu Ala Ile 1 5 10 15 Glu Glu Ala Lys Lys Ala Ala Gln Leu Gly Glu Val Pro Ile Gly Ala 20 25 30 Ile Ile Thr Lys Asp Asp Glu Val Ile Ala Arg Ala His Asn Leu Arg 35 40 45 Glu Thr Leu Gln Gln Pro Thr Ala His Ala Glu His Ile Ala Ile Glu 50 55 60 Arg Ala Ala Lys Val Leu Gly Ser Trp Arg Leu Glu Gly Cys Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Thr Ile Val Met 85 90 95 Ser Arg Ile Pro Arg Val Val Tyr Gly Ala Asp Asp Pro Lys Gly Gly 100 105 110 Cys Ser Gly Ser Leu Met Asn Leu Leu Gln Gln Ser Asn Phe Asn His 115 120 125 Arg Ala Ile Val Asp Lys Gly Val Leu Lys Glu Ala Cys Ser Thr Leu 130 135 140 Leu Thr Thr Phe Phe Lys Asn Leu Arg Ala Asn Lys Lys Ser Thr Asn 145 150 155 160 <210> 9 <211> 161 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 9 Met Thr Gln Asp Glu Leu Tyr Met Lys Glu Ala Ile Lys Glu Ala Lys 1 5 10 15 Lys Ala Glu Glu Lys Gly Glu Val Pro Ile Gly Ala Val Leu Val Ile 20 25 30 Asn Gly Glu Ile Ile Ala Arg Ala His Asn Leu Arg Glu Thr Glu Gln 35 40 45 Arg Ser Ile Ala His Ala Glu Met Leu Val Ile Asp Glu Ala Cys Lys 50 55 60 Ala Leu Gly Thr Trp Arg Leu Glu Gly Ala Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Val Val Leu Ser Arg Val Glu 85 90 95 Lys Val Val Phe Gly Ala Phe Asp Pro Lys Gly Gly Cys Ser Gly Thr 100 105 110 Leu Met Asn Leu Leu Gln Glu Glu Arg Phe Asn His Gln Ala Glu Val 115 120 125 Val Ser Gly Val Leu Glu Glu Glu Cys Gly Gly Met Leu Ser Ala Phe 130 135 140 Phe Arg Glu Leu Arg Lys Lys Lys Lys Ala Ala Arg Lys Asn Leu Ser 145 150 155 160 Glu <210> 10 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 10 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 11 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 11 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 12 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 12 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 13 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 13 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Gly Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 14 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 14 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Val Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 15 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 15 cctcttgggg gccccttccc cacac 25 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 16 cctcttgggg gccccttccc caca 24 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 17 cctcttgggg gccccttccc cac 23 <210> 18 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 18 cctcttgggg gccccttccc ca 22 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 19 cctcttgggg gccccttccc c 21 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 20 cctcttgggg gccccttccc 20 <210> 21 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 21 cctgggtgct ccacctggta cgtatat 27 <210> 22 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 22 cctgggtgct ccacctggta cgtata 26 <210> 23 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 23 cctgggtgct ccacctggta cgtat 25 <210> 24 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 24 cctgggtgct ccacctggta cgta 24 <210> 25 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 25 cctgggtgct ccacctggta cgt 23 <210> 26 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 26 cctgggtgct ccacctggta cg 22 <210> 27 <211> 1550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 27 Met Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp 1550 <210> 28 <211> 1550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <222> (155)..(155) <223> Xaa can be any naturally occurring amino acid <400> 28 Met Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Xaa Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp 1550 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 29 cctgggtgct ccacctggta c 21 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 30 cctgggtgct ccacctggta 20 <210> 31 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 31 atgtctgaag tcgaatttag ccacgaatac tggatgcgtc acgcgctgac gctggcgaaa 60 cgtgcctggg atgagcggga agtgccggtc ggcgcggtat tagtgcataa caatcgggta 120 atcggcgaag gctggaaccg cccgattggt cgccatgatc ccaccgcaca tgcagaaatc 180 atggccctgc ggcagggtgg tctggtgatg caaaattatc gtctgatcga cgccacgttg 240 tatgtcacgc ttgaaccatg tgtaatgtgt gccggagcga tgatccacag tcgcattggt 300 cgcgtggtct ttggtgcgcg tgacgcgaaa actggcgctg cgggatcttt aatggatgtg 360 ctgcatcatc cgggtatgaa tcaccgagtg gaaattacgg aaggaatact ggcggatgag 420 tgcgcggcgt tgctcagtga cttctttcgc atgcgccgcc aggaaattaa agcgcagaaa 480 aaagcgcaat cctcgacgga t 501 <210> 32 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 32 atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60 agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120 atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180 atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240 tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300 cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360 ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420 tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480 aaagcacaat cctctactga c 501 <210> 33 <211> 1056 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 33 atggcccaga cacccgcatt caacaaaccc aaagtagagt tacacgtcca cctggatgga 60 gccatcaagc cagaaaccat cttatacttt ggcaagaaga gaggcatcgc cctcccggca 120 gatacagtgg aggagctgcg caacattatc ggcatggaca agcccctctc gctcccaggc 180 ttcctggcca agtttgacta ctacatgcct gtgattgcgg gctgcagaga ggccatcaag 240 aggatcgcct acgagtttgt ggagatgaag gcaaaggagg gcgtggtcta tgtggaagtg 300 cgctatagcc cacacctgct ggccaattcc aaggtggacc caatgccctg gaaccagact 360 gaaggggacg tcacccctga tgacgttgtg gatcttgtga accagggcct gcaggaggga 420 gagcaagcat ttggcatcaa ggtccggtcc attctgtgct gcatgcgcca ccagcccagc 480 tggtcccttg aggtgttgga gctgtgtaag aagtacaatc agaagaccgt ggtggctatg 540 gacttggctg gggatgagac cattgaagga agtagcctct tcccaggcca cgtggaagcc 600 tatgagggcg cagtaaagaa tggcattcat cggaccgtcc acgctggcga ggtgggctct 660 cctgaggttg tgcgtgaggc tgtggacatc ctcaagacag agagggtggg acatggttat 720 cacaccatcg aggatgaagc tctctacaac agactactga aagaaaacat gcactttgag 780 gtctgcccct ggtccagcta cctcacaggc gcctgggatc ccaaaacgac gcatgcggtt 840 gttcgcttca agaatgataa ggccaactac tcactcaaca cagacgaccc cctcatcttc 900 aagtccaccc tagacactga ctaccagatg accaagaaag acatgggctt cactgaggag 960 gagttcaagc gactgaacat caacgcagcg aagtcaagct tcctcccaga ggaagagaag 1020 aaggaacttc tggaacggct ctacagagaa taccaa 1056 <210> 34 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 34 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 35 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 35 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 36 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 36 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 37 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <400> 37 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 1 5 10 15 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 85 90 95 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 100 105 110 Ser Gly Gly Ser Ser Gly Gly Ser 115 120 <210> 38 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <400> 38 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 20 25 30 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 35 40 45 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 50 55 60 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 85 90 95 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 100 105 110 Gly Gly Gly Ser Gly Gly Gly Ser 115 120 <210> 39 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (6)..(150) <400> 39 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 50 55 60 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 85 90 95 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 100 105 110 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser 145 150 <210> 40 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (6)..(150) <400> 40 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 1 5 10 15 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 20 25 30 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 35 40 45 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 50 55 60 Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 65 70 75 80 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 85 90 95 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 100 105 110 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 115 120 125 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 130 135 140 Lys Glu Ala Ala Ala Lys 145 150 <210> 41 <211> 1209 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 41 atgcatctcg atcaaacccc gagccgccaa ccaatcccga gtgaaggcct gcaactgcat 60 ctgccacaag ttctggcgga tgccgttagc cgcctggtct tgggtaagtt cggtgatctg 120 acagacaact tttctagtcc acatgctcgc cgtaaggtgc tggctggcgt tgtgatgacc 180 acaggtacag acgtcaaaga tgctaaagtg atttctgtgt ctactggcac gaagtgcatt 240 aacggcgaat atatgtctga ccgtggctta gcgcttaacg attgtcatgc cgaaatcatc 300 tcccgtcgtt cattgcttcg cttcctgtac acgcagttgg aactgtatct gaataacaaa 360 gacgatcaga agcgttctat tttccagaag tctgagcgcg gcgggttccg tcttaaagag 420 aatgtgcagt ttcaccttta tatttcaacc tctccttgtg gtgatgcccg tattttttca 480 ccacacgaac ctattttaga ggaaccggcc gatcgtcatc cgaaccgcaa agcccgtggg 540 cagctgcgta cgaaaatcga atcaggtgaa ggcaccattc ccgtccgctc caatgcgagc 600 attcaaacgt gggacggtgt gttacagggc gaacgcctgt taaccatgag ctgctcagac 660 aaaattgcac gttggaacgt ggtaggcatc cagggctcgt tattgagcat tttcgtggag 720 ccgatttatt ttagttccat cattttgggc tcactctacc acggcgatca ccttagccgc 780 gcgatgtacc agcgcattag taacatcgaa gatttaccgc ccctgtatac cctgaacaaa 840 ccactgttaa gcggtatttc taacgcggag gcgcgtcagc ctggtaaagc cccgaacttc 900 agtgtgaact ggactgtggg tgattctgca attgaggtaa ttaacgcgac gacgggtaaa 960 gatgaactgg gccgtgcctc tcgtctgtgt aaacacgcgc tgtactgtcg ttggatgcgc 1020 gtgcacggta aagttcccag tcatctgtta cgtagcaaga tcaccaagcc aaatgtctac 1080 cacgaatcga agctggccgc gaaagaatac caagcggcta aggcgcgtct gttcaccgcc 1140 tttattaagg ctggcttagg ggcctgggtg gaaaaaccaa ccgagcaaga tcaattcagt 1200 ctgaccccg 1209 <210> 42 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 42 atggaggcga aggcggcacc caagccagct gcaagcggcg cgtgctcggt gtcggcagag 60 gagaccgaaa agtggatgga ggaggcgatg cacatggcca aagaagccct cgaaaatact 120 gaagttcctg ttggctgtct tatggtctac aacaatgaag ttgtagggaa ggggagaaat 180 gaagttaacc aaaccaaaaa tgctactcga catgcagaaa tggtggccat cgatcaggtc 240 ctcgattggt gtcgtcaaag tggcaagagt ccctctgaag tatttgaaca cactgtgttg 300 tatgtcactg tggagccgtg cattatgtgt gcagctgctc tccgcctgat gaaaatcccg 360 ctggttgtat atggctgtca gaatgaacga tttggtggtt gtggctctgt tctaaatatt 420 gcctctgctg acctaccaaa cactgggaga ccatttcagt gtatccctgg atatcgggct 480 gaggaagcag tggaaatgtt aaagaccttc tacaaacaag aaaatccaaa tgcaccaaaa 540 tcgaaagttc ggaaaaagga atgtcagaaa tct 573 <210> 43 <211> 660 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 43 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggagttcc gtatggcaat gaaagacggt 240 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 300 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 360 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 420 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 480 gccaatatgg acaacttctt cgcccccgtt ttcactatgg gcaaatatta tacgcaaggc 540 gacaaggtgc tgatgccgct ggccatccag gtgcactacg ccgtatgcga cggcttccat 600 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 660 <210> 44 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 44 atgatcgaat aagatggatt gcacgcaggt tctccggccg cttaggtgga gcgcctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctaa 795 <210> 45 <211> 792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 45 atgagggaag cggtgatcgc cgaagtatcg actcaactat cagaggtagt tggcgtcatc 60 gagcgccatc tcgaaccgac gttgctggcc gtacatttgt acggctccgc agtggatggc 120 ggcctgaagc cacacagtga tattgatttg ctggttacgg tgaccgtaag gcttgatgaa 180 acaacgcggc gagctttgat caacgacctt ttggaaactt cggcttcccc tggagagagc 240 gagattctcc gcgctgtaga agtcatcatt gttgtgcacg acgacatcat tccgtggcgt 300 tatccagcta agcgcgaact gcaatttgga gaatggcagc gcaatgacat tcttgcaggt 360 atcttcgagc cagccacgat cgacattgat ctggctatct tgctgacaaa agcaagagaa 420 catagcgttg ccttggtagg tccagcggcg gaggaactct ttgatccggt tcctgaacag 480 gatctatttg aggcgctaaa tgaaacctta acgctatgga actcgccgcc cgactgggct 540 ggcgatgagc gaaatgtagt gcttacgttg tcccgcattt ggtacagcgc agtaaccggc 600 aaaatcgcgc cgaaggatgt cgctgccgac tgggcaatgg agcgcctgcc ggcccagtat 660 cagcccgtca tacttgaagc tagacaggct tatcttggac aagaagaaga tcgcttggcc 720 tcgcgcgcag atcagttgga agaatttgtc cactacgtga aaggcgagat caccaaggta 780 gtcggcaaat aa 792 <210> 46 <211> 815 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 46 atgatcgaat aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat agccggccac agttaatgaa 300 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 360 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 420 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 480 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 540 tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 600 cgaatatcat ggtggaaaat ggccgctttt ctggattcat taactgtggc cggctgggtg 660 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 720 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 780 tcgccttcta tcgccttctt gacgagttct tctaa 815 <210> 47 <211> 4104 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 47 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600 attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720 ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960 atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160 catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220 gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280 gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340 aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400 gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460 atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520 gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580 aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640 tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700 aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760 gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820 aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880 ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940 catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000 ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060 attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120 atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180 ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240 acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300 acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360 cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420 tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480 gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540 ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600 agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660 aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720 tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780 cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840 ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900 atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960 gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020 gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080 ttgagtcagc taggaggtga ctga 4104 <210> 48 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 48 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu 705 710 715 720 His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 49 <211> 4212 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 49 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aaggctgcag ga 4212 <210> 50 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 50 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 51 <211> 4107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 51 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 52 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 52 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 53 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 53 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 54 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 54 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 55 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 55 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 56 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 56 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 57 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 57 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 58 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 58 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 59 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 59 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 60 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 60 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 61 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 61 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 62 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 62 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Glu Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 63 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 63 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Ala 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 64 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 64 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 65 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 65 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 66 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 66 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Gly Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 67 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 67 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Val Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 68 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 68 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 69 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 69 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Asp Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 70 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 70 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Gly Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 71 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 71 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 72 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 72 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 73 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 73 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 74 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 74 Ala Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Phe 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 75 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 75 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Thr Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Ser Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 76 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 76 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 77 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 77 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Gly Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 78 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 78 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Asp Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Lys Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Gly Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 79 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 79 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gln Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 80 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 80 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Met Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Pro Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 81 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 81 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Cys Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 82 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 82 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Leu Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 83 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 83 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 84 <211> 178 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 84 Met Arg Arg Ala Phe Ile Thr Gly Val Phe Phe Leu Ser Glu Val Glu 1 5 10 15 Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg 20 25 30 Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn 35 40 45 Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp 50 55 60 Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val 65 70 75 80 Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg 100 105 110 Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu 115 120 125 Met Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr 130 135 140 Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe 145 150 155 160 Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser 165 170 175 Thr Asp <210> 85 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 85 cggtgggagg tctatataag cagagctggt ttagtgaacc gtcagatccg ctagagatcc 60 gcggccgcta atacgactca ccctagggag agccgccacc gtggtgagca agggcgagga 120 gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 180 gttcagcgtg tccggcgag 199 <210> 86 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 86 gtttttctct aatttattct tccctttagc tagtttc 37 <210> 87 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 87 atttttctct aatttattct tccctttagc tagtttt 37 <210> 88 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 88 gtttttctct aatttattct tccctttagc tagtttc 37 <210> 89 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 89 atttttctct aatttattct tccctttagc tagtttt 37 <210> 90 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 90 ttaatttttt 10 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 91 gaacacaaag catagactgc ggg 23 <210> 92 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 92 gagtatgagg catagactgc agg 23 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 93 gtcaagaaag cagagactgc cgg 23 <210> 94 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 94 gagcaaagac aatagactgt agg 23 <210> 95 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 95 gatgagataa tgatgagtca ggg 23 <210> 96 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 96 ggattgaccc aggccagggc tgg 23 <210> 97 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 97 gaatactaag catagactcc agg 23 <210> 98 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 98 gtaaacaaag catagactga ggg 23 <210> 99 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 99 gaagaccaag gatagactgc tgg 23 <210> 100 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 100 gaacataaag aatagaatga tgg 23 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 101 ggacaggcag catagactgt ggg 23 <210> 102 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 102 gtagaaaaag tatagactgc agg 23 <210> 103 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 103 gaagatagag aatagactgc tgg 23 <210> 104 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 104 ggctaaagac catagactgt ggg 23 <210> 105 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 105 gtctagaaag cttagactgc tgg 23 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 106 gggaataatc atagaatcct gg 22 <210> 107 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 107 gacaaagagg aagagagacg ggg 23 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 108 acacacacac ttagaatctg tgg 23 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 109 cacacacact tagaatctgt ggg 23 <210> 110 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 110 acacacacac ttagaatctg tgg 23 <210> 111 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 111 cacacacact tagaatctgt ggg 23 <210> 112 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 112 ggtgtttcgt cctttccaca ag 22 <210> 113 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 113 gaacacaaag catagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 114 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 114 gagtatgagg catagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 115 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 115 gtcaagaaag cagagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 116 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 116 gagcaaagag aatagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 117 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 117 gatgagataa tgatgagtca gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 118 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 118 ggattgaccc aggccagggc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 119 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 119 gaatactaag catagactcc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 120 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 120 gtaaacaaag catagactga gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 121 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 121 gaagaccaag gatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 122 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 122 gaacataaag aatagaatga gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 123 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 123 ggacaggcag catagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 124 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 124 gtagaaaaag tatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 125 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 125 gaagatagag aatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 126 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 126 ggctaaagac catagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 127 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 127 gtctagaaag cttagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 128 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 128 gggaataaat catagaatcc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 129 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 129 gacaaagagg aagagagacg gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 130 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 130 gacacacaca cttagaatct ggttttagag ctagaaatag caagttaaaa taaggc 56 <210> 131 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 131 gcacacacac ttagaatctg tgttttagag ctagaaatag caagttaaaa taaggc 56 <210> 132 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 132 gtggggaagg ggcccccaag gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 133 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 133 gacgtaccag gtggagcacc cgttttagag ctagaaatag caagttaaaa taaggc 56 <210> 134 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (12)..(12) <223> U is ideoxyU <400> 134 agttgtacgc guccaaaaaa acggg 25 <210> 135 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 135 agattagcgg atcctacctg ac 22 <210> 136 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 136 gcggtctgta tttcccagaa c 21 <210> 137 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 137 accggggact tcagaaucgg c 21 <210> 138 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 138 attctgaagt ccccggugtt tcg 23 <210> 139 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (12)..(12) <223> U is ideoxyU <400> 139 acgcgtacaa cucaaaggag gaaaaaaaaa tg 32 <210> 140 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (15)..(15) <223> U is ideoxyU <220> <221> misc_feature <222> (25)..(26) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (28)..(29) <223> n is a, c, g, t or u <400> 140 acgctggcga aacgugcctg ggatnnknnk gaagtgccgg tcggcgc 47 <210> 141 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (15)..(15) <223> U is ideoxyU <400> 141 acgtttcgcc agcgucagcg cgtgacg 27 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 142 acgcgaaaac tggcgcugcg 20 <210> 143 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <220> <221> misc_feature <222> (20)..(21) <223> n is a, c, g, t or u <400> 143 agcgccagtt ttcgcgutmn ncacaccaaa gaccacgcga cc 42 <210> 144 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (14)..(14) <223> U is ideoxyU <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (20)..(21) <223> n is a, c, g, t or u <400> 144 agtggcggat gagugcnnkn nkttgctcag ttacttcttt cgcatgcg 48 <210> 145 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (14)..(14) <223> U is ideoxyU <400> 145 actcatccgc caguattcct tccg 24 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 146 tacggcgtag tgcacctgga 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 147 tacggcgtag tgcacctgga 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 148 atcttattcg atcatgcgaa 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 149 caatgatgac ttctacagcg 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 150 caatgatgac ttctacagcg 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 151 caatgatgac ttctacagcg 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 152 ttcattaact gtggccggct 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 153 gcttaggtgg agcgcctatt 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 154 tacggcgtag tgcacctgga 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 155 tacggcgtag tgcacctgga 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 156 atcttattcg atcatgcgaa 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 157 tacggcgtag tgcacctgga 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 158 tacggcgtag tgcacctgga 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 159 atcttattgg agcgcctatt 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 160 gcttaggtgg agcgcctatt 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 161 caatgatgac ttctacagcg 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 162 tacggcgtag tgcacctgga 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 163 caatgatgac ttctacagcg 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 164 tacggcgtag tgcacctgga 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 165 caatgatgac ttctacagcg 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 166 tacggcgtag tgcacctgga 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 167 atcttattcg atcatgcgaa 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 168 ttcattaact gtggccggct 20 <210> 169 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 169 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 170 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 170 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 171 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 171 acactctttc cctacacgac gctcttccga tctnnnnaga gactgattgc gtggagt 57 <210> 172 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 172 tggagttcag acgtgtgctc ttccgatctc actccagcct aggcaacaa 49 <210> 173 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 173 acactctttc cctacacgac gctcttccga tctnnnnccg acagccagtg gttaagt 57 <210> 174 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 174 tggagttcag acgtgtgctc ttccgatctg cttttcaccg actgcacag 49 <210> 175 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 175 acactctttc cctacacgac gctcttccga tctnnnnctg cacctagcct ccatgtc 57 <210> 176 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 176 tggagttcag acgtgtgctc ttccgatctc cttgcactga gaccgtgaa 49 <210> 177 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 177 acactctttc cctacacgac gctcttccga tctnnnngtc tgaggtcaca cagtggg 57 <210> 178 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 178 tggagttcag acgtgtgctc ttccgatctc tgagagcagg gaccacatc 49 <210> 179 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 179 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 180 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 180 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 181 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 181 acactctttc cctacacgac gctcttccga tctnnnngat gccctccatc ttctccg 57 <210> 182 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 182 tggagttcag acgtgtgctc ttccgatcta ggtttgcata gacctgccc 49 <210> 183 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 183 acactctttc cctacacgac gctcttccga tctnnnnccc tgttcctaaa gcccacc 57 <210> 184 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 184 tggagttcag acgtgtgctc ttccgatcta ctggttctgt ttgtggcca 49 <210> 185 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 185 acactctttc cctacacgac gctcttccga tctnnnnttg cttattgctg aggggca 57 <210> 186 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 186 tggagttcag acgtgtgctc ttccgatcta cctctctcct ccagctgag 49 <210> 187 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 187 acactctttc cctacacgac gctcttccga tctnnnntcc acctccccac ttctctt 57 <210> 188 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 188 tggagttcag acgtgtgctc ttccgatctg gtgaaatgag caaggcaca 49 <210> 189 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 189 acactctttc cctacacgac gctcttccga tctnnnnccc taaaccacct gcagagg 57 <210> 190 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 190 tggagttcag acgtgtgctc ttccgatctc agccccagcc acattctat 49 <210> 191 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 191 acactctttc cctacacgac gctcttccga tctnnnnacc catgtgcctg acatagg 57 <210> 192 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 192 tggagttcag acgtgtgctc ttccgatctt ggtgattatg gttacacagc g 51 <210> 193 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 193 acactctttc cctacacgac gctcttccga tctnnnntca cttcagccca ggagtat 57 <210> 194 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 194 tggagttcag acgtgtgctc ttccgatctt ctctttctct cccccaccc 49 <210> 195 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 195 acactctttc cctacacgac gctcttccga tctnnnngaa cctgaagcct ttcccca 57 <210> 196 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 196 tggagttcag acgtgtgctc ttccgatcta acctgtgtga cacttggca 49 <210> 197 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 197 acactctttc cctacacgac gctcttccga tctnnnngca gacacccaca actgtct 57 <210> 198 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 198 tggagttcag acgtgtgctc ttccgatctg cactcagcta gacttaactc cc 52 <210> 199 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 199 acactctttc cctacacgac gctcttccga tctnnnnggg aggtggagag aggatgt 57 <210> 200 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 200 tggagttcag acgtgtgctc ttccgatctt cctgaggtct aggaacccg 49 <210> 201 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 201 acactctttc cctacacgac gctcttccga tctnnnncgc gggctgaagt agatcaa 57 <210> 202 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 202 tggagttcag acgtgtgctc ttccgatctc ctgtctctgc tcctttgtcc cc 52 <210> 203 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 203 acactctttc cctacacgac gctcttccga tctnnnngca ttacctggga gcctgtt 57 <210> 204 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 204 tggagttcag acgtgtgctc ttccgatcta acttcagcgg gcatcagaa 49 <210> 205 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 205 acactctttc cctacacgac gctcttccga tctnnnngtg gagtttagcc agggacc 57 <210> 206 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 206 tggagttcag acgtgtgctc ttccgatctt acaggcctca ctggagcta 49 <210> 207 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 207 acactctttc cctacacgac gctcttccga tctnnnnggc tggataacct tggctgt 57 <210> 208 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 208 tggagttcag acgtgtgctc ttccgatctt cctcaggcac tcctctcaa 49 <210> 209 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 209 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 210 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 210 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 211 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 211 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 212 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 212 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 213 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 213 acactctttc cctacacgac gctcttccga tctnnnngaa cccaggtagc cagagac 57 <210> 214 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 214 tggagttcag acgtgtgctc ttccgatctt cctttcaacc cgaacggag 49 <210> 215 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 215 acactctttc cctacacgac gctcttccga tctnnnngtg tggagagtga gtaagcca 58 <210> 216 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 216 tggagttcag acgtgtgctc ttccgatcta cggtaggatg atttcaggca 50 <210> 217 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 217 acactctttc cctacacgac gctcttccga tctnnnncac aaagcagtgt agctcagg 58 <210> 218 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 218 tggagttcag acgtgtgctc ttccgatctt ttttggtact cgagtgttat tcag 54 <210> 219 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 219 acactctttc cctacacgac gctcttccga tctnnnntcc cctgttgacc tggagaa 57 <210> 220 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 220 tggagttcag acgtgtgctc ttccgatctc actgtacttg ccctgacca 49 <210> 221 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 221 acactctttc cctacacgac gctcttccga tctnnnnttg gtgttgacag ggagcaa 57 <210> 222 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 222 tggagttcag acgtgtgctc ttccgatctc tgagatgtgg gcagaaggg 49 <210> 223 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 223 acactctttc cctacacgac gctcttccga tctnnnntga gagggaacag aagggct 57 <210> 224 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 224 tggagttcag acgtgtgctc ttccgatctg tccaaaggcc caagaacct 49 <210> 225 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 225 acactctttc cctacacgac gctcttccga tctnnnntcc tagcactttg gaaggtcg 58 <210> 226 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 226 tggagttcag acgtgtgctc ttccgatctg ctcatcttaa tctgctcagc c 51 <210> 227 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 227 acactctttc cctacacgac gctcttccga tctnnnnaaa ggagcagctc ttcctgg 57 <210> 228 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 228 tggagttcag acgtgtgctc ttccgatctg tctgcaccat ctcccacaa 49 <210> 229 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 229 acactctttc cctacacgac gctcttccga tctnnnnggc atggcttctg agactca 57 <210> 230 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 230 tggagttcag acgtgtgctc ttccgatctg tctcccttgc actccctgtc ttt 53 <210> 231 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 231 acactctttc cctacacgac gctcttccga tctnnnnttt ggcaatggag gcattgg 57 <210> 232 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 232 tggagttcag acgtgtgctc ttccgatctg aagaggctgc ccatgagag 49 <210> 233 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 233 acactctttc cctacacgac gctcttccga tctnnnnggt ctgaggctcg aatcctg 57 <210> 234 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 234 tggagttcag acgtgtgctc ttccgatctc tgtggcctcc atatccctg 49 <210> 235 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 235 acactctttc cctacacgac gctcttccga tctnnnnttt ccaccagaac tcagccc 57 <210> 236 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 236 tggagttcag acgtgtgctc ttccgatctc ctcggttcct ccacaacac 49 <210> 237 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 237 acactctttc cctacacgac gctcttccga tctnnnncac gggaaggaca ggagaag 57 <210> 238 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 238 tggagttcag acgtgtgctc ttccgatctg caggggaggg ataaagcag 49 <210> 239 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 239 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 240 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 240 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 241 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 241 acactctttc cctacacgac gctcttccga tctnnnnccc tgagatacag tcacgaggt 59 <210> 242 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 242 tggagttcag acgtgtgctc ttccgatctc ctgaaatgct gtgcgtgtct a 51 <210> 243 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 243 acactctttc cctacacgac gctcttccga tctnnnngcc cacattacct tggtgcata 59 <210> 244 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 244 tggagttcag acgtgtgctc ttccgatctg gcaggcagat tatcattccc a 51 <210> 245 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 245 acactctttc cctacacgac gctcttccga tctnnnnaaa gtgctgcgat tacaggc 57 <210> 246 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 246 tggagttcag acgtgtgctc ttccgatctg tggcatccag agacatggt 49 <210> 247 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 247 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 248 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 248 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 249 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 249 ttttccagcc cgctggccct gtaaaggaaa ctggaacgca aagcatagac tgcgcggcgg 60 gccagcctga atagctgcaa acaagtgcag aatatctgat 100 <210> 250 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 250 catgaaaaag agactgattg cgtggagttc atggagtgtg aggcatagac tgcacgagac 60 ataaaccatg acttgcagat gaagaagcat tttaaaagt 99 <210> 251 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 251 gacagccagt ggttaagtca gaacccgact caggtcagga aagcagagac tgcccggggt 60 tgggaaggcg gtgaactcag agatagaaac agggtgggtg 100 <210> 252 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 252 attttaagct gtagtattat gaagggaaat ctggagcgaa gagaatagac tgtacggaaa 60 ccagttaaga aataggacat ggaggctagg tgcagtggct 100 <210> 253 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 253 cctctgccat cacgtgctca gtctgggccc caaggattgg cccaggccag ggctcgagaa 60 gcagaaaaaa agcatcaagc ctacaaatgc atgcttactt 100 <210> 254 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 254 gacagauauu ugcauugaga uagugugg 28 <210> 255 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 255 acagauauuu gcauugagau agugugg 27 <210> 256 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 256 cagauauuug cauugagaua gugugg 26 <210> 257 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 257 agauauuugc auugagauag ugugg 25 <210> 258 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 258 gauauuugca uugagauagu gugg 24 <210> 259 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 259 auauuugcau ugagauagug ugg 23 <210> 260 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 260 augcaaauau cugucugaaa cgg 23 <210> 261 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 261 gcaaauaucu gucugaaacg gucccugg 28 <210> 262 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 262 caaauaucug ucugaaacgg ucccugg 27 <210> 263 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 263 aaauaucugu cugaaacggu cccugg 26 <210> 264 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 264 aauaucuguc ugaaacgguc ccugg 25 <210> 265 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 265 auaucugucu gaaacggucc cugg 24 <210> 266 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 266 uaucugucug aaacgguccc ugg 23 <210> 267 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 267 agauauuugc auugagauag ugu 23 <210> 268 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 268 acagauauuu gcauugagau agu 23 <210> 269 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 269 guggggaagg ggcccccaag agg 23 <210> 270 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 270 cuugaccaau agccuugaca agg 23 <210> 271 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 271 cuugucaagg cuauugguca aggcaagg 28 <210> 272 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 272 uugucaaggc uauuggucaa ggcaagg 27 <210> 273 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 273 ugucaaggcu auuggucaag gcaagg 26 <210> 274 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 274 gucaaggcua uuggucaagg caagg 25 <210> 275 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 275 ucaaggcuau uggucaaggc aagg 24 <210> 276 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 276 caaggcuauu ggucaaggca agg 23 <210> 277 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 277 uugucaaggc uauuggucaa ggc 23 <210> 278 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 278 cuugucaagg cuauugguca agg 23 <210> 279 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 279 uugaccaaua gccuugacaa ggc 23 <210> 280 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 280 uagccuugac aaggcaaacu uga 23 <210> 281 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 281 uucuccacag gagucagaug cac 23 <210> 282 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 282 ucuccacagg agucagaugc acc 23 <210> 283 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 283 uucuccacag gagucagaug caccaugg 28 <210> 284 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 284 ucuccacagg agucagaugc accaugg 27 <210> 285 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 285 cuccacagga gucagaugca ccaugg 26 <210> 286 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 286 uccacaggag ucagaugcac caugg 25 <210> 287 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 287 ccacaggagu cagaugcacc augg 24 <210> 288 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 288 cacaggaguc agaugcacca ugg 23 <210> 289 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 289 acuucuccac aggagucaga ugc 23 <210> 290 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 290 ucuccacagg agucagaugc accauggu 28 <210> 291 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 291 acuccuaagg agaagucugc cgu 23 <210> 292 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 292 uuggugguaa ggcccugggc agg 23 <210> 293 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 293 uggugguaag gcccugggca ggu 23 <210> 294 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 294 ugguaaggcc cugggcaggu ugg 23 <210> 295 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 295 agcauuguau auucucugug agg 23 <210> 296 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 296 aaagcauugu auauucucug uga 23 <210> 297 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 297 ccacactatc tcaatgcaaa tatctgtc 28 <210> 298 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 298 ccacactatc tcaatgcaaa tatctgt 27 <210> 299 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 299 ccacactatc tcaatgcaaa tatctg 26 <210> 300 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 300 ccacactatc tcaatgcaaa tatct 25 <210> 301 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 301 ccacactatc tcaatgcaaa tatc 24 <210> 302 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 302 ccacactatc tcaatgcaaa tat 23 <210> 303 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 303 ccgtttcaga cagatatttg cat 23 <210> 304 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 304 ccagggaccg tttcagacag atatttgc 28 <210> 305 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 305 ccagggaccg tttcagacag atatttg 27 <210> 306 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 306 ccagggaccg tttcagacag atattt 26 <210> 307 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 307 ccagggaccg tttcagacag atatt 25 <210> 308 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 308 ccagggaccg tttcagacag atat 24 <210> 309 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 309 ccagggaccg tttcagacag ata 23 <210> 310 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 310 acactatctc aatgcaaata tct 23 <210> 311 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 311 actatctcaa tgcaaatatc tgt 23 <210> 312 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 312 cctcttgggg gccccttccc cac 23 <210> 313 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 313 ccttgtcaag gctattggtc aag 23 <210> 314 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 314 ccttgccttg accaatagcc ttgacaag 28 <210> 315 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 315 ccttgccttg accaatagcc ttgacaa 27 <210> 316 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 316 ccttgccttg accaatagcc ttgaca 26 <210> 317 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 317 ccttgccttg accaatagcc ttgac 25 <210> 318 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 318 ccttgccttg accaatagcc ttga 24 <210> 319 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 319 ccttgccttg accaatagcc ttg 23 <210> 320 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 320 gccttgacca atagccttga caa 23 <210> 321 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 321 ccttgaccaa tagccttgac aag 23 <210> 322 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 322 gccttgtcaa ggctattggt caa 23 <210> 323 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 323 tcaagtttgc cttgtcaagg cta 23 <210> 324 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 324 gtgcatctga ctcctgtgga gaa 23 <210> 325 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 325 ggtgcatctg actcctgtgg aga 23 <210> 326 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 326 ccatggtgca tctgactcct gtggagaa 28 <210> 327 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 327 ccatggtgca tctgactcct gtggaga 27 <210> 328 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 328 ccatggtgca tctgactcct gtggag 26 <210> 329 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 329 ccatggtgca tctgactcct gtgga 25 <210> 330 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 330 ccatggtgca tctgactcct gtgg 24 <210> 331 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 331 ccatggtgca tctgactcct gtg 23 <210> 332 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 332 gcatctgact cctgtggaga agt 23 <210> 333 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 333 accatggtgc atctgactcc tgtggaga 28 <210> 334 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 334 acggcagact tctccttagg agt 23 <210> 335 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 335 cctgcccagg gccttaccac caa 23 <210> 336 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 336 acctgcccag ggccttacca cca 23 <210> 337 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 337 ccaacctgcc cagggcctta cca 23 <210> 338 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 338 cctcacagag aatatacaat gct 23 <210> 339 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 339 tcacagagaa tatacaatgc ttt 23 <210> 340 <211> 146 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 340 Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp Gly 1 5 10 15 Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu Leu 20 25 30 Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp Leu 35 40 45 Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His Gly 50 55 60 Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp Asn 65 70 75 80 Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys Leu 85 90 95 His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val Cys 100 105 110 Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln Ala 115 120 125 Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His Lys 130 135 140 Tyr His 145 <210> 341 <211> 2351 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 341 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 755 760 765 Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp 770 775 780 Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys 785 790 795 800 Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser 805 810 815 Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr 820 825 830 Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn 835 840 845 Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly 850 855 860 Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu 865 870 875 880 Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys 885 890 895 Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn 900 905 910 Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met 915 920 925 Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys 930 935 940 Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu 945 950 955 960 Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu 965 970 975 Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe 980 985 990 Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala 995 1000 1005 Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser 1010 1015 1020 Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser 1025 1030 1035 Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu 1040 1045 1050 Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg 1055 1060 1065 Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met 1070 1075 1080 Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln 1085 1090 1095 Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met 1100 1105 1110 Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile 1115 1120 1125 Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro 1130 1135 1140 Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu 1145 1150 1155 Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys 1160 1165 1170 Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro 1175 1180 1185 Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu 1190 1195 1200 Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu 1205 1210 1215 Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile 1220 1225 1230 His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu 1235 1240 1245 Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr 1250 1255 1260 Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn 1265 1270 1275 Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu 1280 1285 1290 Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu 1295 1300 1305 Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln 1310 1315 1320 Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg 1325 1330 1335 Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp 1340 1345 1350 Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro 1355 1360 1365 Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala 1370 1375 1380 Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser 1385 1390 1395 Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser 1400 1405 1410 Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe 1415 1420 1425 Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys 1430 1435 1440 Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys 1445 1450 1455 Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly 1460 1465 1470 Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser 1475 1480 1485 Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp 1490 1495 1500 Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His 1505 1510 1515 Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser 1520 1525 1530 Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr 1535 1540 1545 Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val 1550 1555 1560 Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser 1565 1570 1575 Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln 1580 1585 1590 Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys 1595 1600 1605 Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys 1610 1615 1620 Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys 1625 1630 1635 Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg 1640 1645 1650 Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu 1655 1660 1665 Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 1670 1675 1680 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile 1685 1690 1695 Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 1700 1705 1710 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr 1715 1720 1725 Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser 1730 1735 1740 Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 1745 1750 1755 Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu 1760 1765 1770 His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp 1775 1780 1785 Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser 1790 1795 1800 Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly 1805 1810 1815 Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr 1820 1825 1830 Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu 1835 1840 1845 Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu 1850 1855 1860 Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His 1865 1870 1875 Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln 1880 1885 1890 Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp 1895 1900 1905 Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1910 1915 1920 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His 1925 1930 1935 Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met 1940 1945 1950 Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser 1955 1960 1965 Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr 1970 1975 1980 Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr 1985 1990 1995 Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly 2000 2005 2010 Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly 2015 2020 2025 Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro 2030 2035 2040 Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala 2045 2050 2055 Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His 2060 2065 2070 Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser 2075 2080 2085 Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile 2090 2095 2100 Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser 2105 2110 2115 Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr 2120 2125 2130 Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn 2135 2140 2145 Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 2150 2155 2160 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg 2165 2170 2175 Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys 2180 2185 2190 Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln 2195 2200 2205 Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser 2210 2215 2220 Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp 2225 2230 2235 Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe 2240 2245 2250 Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys 2255 2260 2265 Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser 2270 2275 2280 Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys 2285 2290 2295 Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val 2300 2305 2310 Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His 2315 2320 2325 Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu 2330 2335 2340 Gly Cys Glu Ala Gln Asp Leu Tyr 2345 2350 <210> 342 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 342 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg 1 5 10 15 Lys Val <210> 343 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 343 Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys 1 5 10 15 Val <210> 344 <211> 343 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 344 ctgacaaaag aagtcctggt atcctctatg atgggagaag gaaactagct aaagggaaga 60 ataaattaga gaaaaactgg aatgactgaa tcggaacaag gcaaaggcta taaaaaaaat 120 tagcagtatc ctcttggggg ccccttcccc acactatctc aatgcaaata tctgtctgaa 180 acggtccctg gctaaactcc acccatgggt tggccagcct tgccttgacc aatagccttg 240 acaaggcaaa cttgaccaat agtcttagag tatccagtga ggccaggggc cggcggctgg 300 ctagggatga agaataaaag gaagcaccct tcagcagttc cac 343 <210> 345 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 345 ggtgggagaa gaaaactagc taaagggaag aataaattag agaaaaattg gaatgactga 60 atcggaacaa ggcaaaggct ataaaaaaaa ttaagcagca gtatcctctt gggggcccct 120 tccccacact atctcaatgc aaatatctgt ctgaaacggt ccctggctaa actccaccca 180 tgggttggcc agccttgcct tgaccaatag ccttgacaag gcaaacttga ccaatagtct 240 tagagtatcc agtgaggcca ggggccggcg gctggctagg gatgaagaat aaaaggaagc 300 acccttcagc agttccac 318 <210> 346 <211> 1606 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 346 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 60 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 120 ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt aaggagacca 180 atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct 240 ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc ttggacccag 300 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 360 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 420 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 480 cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc ttcttttcta 540 tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag aatgggaaac 600 agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt ttatttgctg 660 ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct tctccgcaat 720 ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata tctctgagat 780 acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac tatttggaat 840 atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt atttttaatt 900 gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata tgtgtacaca 960 tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa 1020 tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat 1080 aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg 1140 ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat tgtaactgat 1200 gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg cttttatttt 1260 atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt 1320 catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca 1380 tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg 1440 tgtggctaat gccctggccc acaagtatca ctaagctcgc tttcttgctg tccaatttct 1500 attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt atgaagggcc 1560 ttgagcatct ggattctgcc taataaaaaa catttatttt cattgc 1606 <210> 347 <211> 9036 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 347 gcttagtgct gagcacatcc agtgggtaaa gttccttaaa atgctctgca aagaaattgg 60 gacttttcat taaatcagaa attttacttt tttcccctcc tgggagctaa agatatttta 120 gagaagaatt aaccttttgc ttctccagtt gaacatttgt agcaataagt catgcaaata 180 gagctctcca cctgcttctt tctgtgcctt ttgcgattct gctttagtgc caccagaaga 240 tactacctgg gtgcagtgga actgtcatgg gactatatgc aaagtgatct cggtgagctg 300 cctgtggacg caagatttcc tcctagagtg ccaaaatctt ttccattcaa cacctcagtc 360 gtgtacaaaa agactctgtt tgtagaattc acggatcacc ttttcaacat cgctaagcca 420 aggccaccct ggatgggtct gctaggtcct accatccagg ctgaggttta tgatacagtg 480 gtcattacac ttaagaacat ggcttcccat cctgtcagtc ttcatgctgt tggtgtatcc 540 tactggaaag cttctgaggg agctgaatat gatgatcaga ccagtcaaag ggagaaagaa 600 gatgataaag tcttccctgg tggaagccat acatatgtct ggcaggtcct gaaagagaat 660 ggtccaatgg cctctgaccc actgtgcctt acctactcat atctttctca tgtggacctg 720 gtaaaagact tgaattcagg cctcattgga gccctactag tatgtagaga agggagtctg 780 gccaaggaaa agacacagac cttgcacaaa tttatactac tttttgctgt atttgatgaa 840 gggaaaagtt ggcactcaga aacaaagaac tccttgatgc aggataggga tgctgcatct 900 gctcgggcct ggcctaaaat gcacacagtc aatggttatg taaacaggtc tctgccaggt 960 ctgattggat gccacaggaa atcagtctat tggcatgtga ttggaatggg caccactcct 1020 gaagtgcact caatattcct cgaaggtcac acatttcttg tgaggaacca tcgccaggcg 1080 tccttggaaa tctcgccaat aactttcctt actgctcaaa cactcttgat ggaccttgga 1140 cagtttctac tgttttgtca tatctcttcc caccaacatg atggcatgga agcttatgtc 1200 aaagtagaca gctgtccaga ggaaccccaa ctacgaatga aaaataatga agaagcggaa 1260 gactatgatg atgatcttac tgattctgaa atggatgtgg tcaggtttga tgatgacaac 1320 tctccttcct ttatccaaat tcgctcagtt gccaagaagc atcctaaaac ttgggtacat 1380 tacattgctg ctgaagagga ggactgggac tatgctccct tagtcctcgc ccccgatgac 1440 agaagttata aaagtcaata tttgaacaat ggccctcagc ggattggtag gaagtacaaa 1500 aaagtccgat ttatggcata cacagatgaa acctttaaga ctcgtgaagc tattcagcat 1560 gaatcaggaa tcttgggacc tttactttat ggggaagttg gagacacact gttgattata 1620 tttaagaatc aagcaagcag accatataac atctaccctc acggaatcac tgatgtccgt 1680 cctttgtatt caaggagatt accaaaaggt gtaaaacatt tgaaggattt tccaattctg 1740 ccaggagaaa tattcaaata taaatggaca gtgactgtag aagatgggcc aactaaatca 1800 gatcctcggt gcctgacccg ctattactct agtttcgtta atatggagag agatctagct 1860 tcaggactca ttggccctct cctcatctgc tacaaagaat ctgtagatca aagaggaaac 1920 cagataatgt cagacaagag gaatgtcatc ctgttttctg tatttgatga gaaccgaagc 1980 tggtacctca cagagaatat acaacgcttt ctccccaatc cagctggagt gcagcttgag 2040 gatccagagt tccaagcctc caacatcatg cacagcatca atggctatgt ttttgatagt 2100 ttgcagttgt cagtttgttt gcatgaggtg gcatactggt acattctaag cattggagca 2160 cagactgact tcctttctgt cttcttctct ggatatacct tcaaacacaa aatggtctat 2220 gaagacacac tcaccctatt cccattctca ggagaaactg tcttcatgtc gatggaaaac 2280 ccaggtctat ggattctggg gtgccacaac tcagactttc ggaacagagg catgaccgcc 2340 ttactgaagg tttctagttg tgacaagaac actggtgatt attacgagga cagttatgaa 2400 gatatttcag catacttgct gagtaaaaac aatgccattg aaccaagaag cttctcccag 2460 aattcaagac accctagcac taggcaaaag caatttaatg ccaccacaat tccagaaaat 2520 gacatagaga agactgaccc ttggtttgca cacagaacac ctatgcctaa aatacaaaat 2580 gtctcctcta gtgatttgtt gatgctcttg cgacagagtc ctactccaca tgggctatcc 2640 ttatctgatc tccaagaagc caaatatgag actttttctg atgatccatc acctggagca 2700 atagacagta ataacagcct gtctgaaatg acacacttca ggccacagct ccatcacagt 2760 ggggacatgg tatttacccc tgagtcaggc ctccaattaa gattaaatga gaaactgggg 2820 acaactgcag caacagagtt gaagaaactt gatttcaaag tttctagtac atcaaataat 2880 ctgatttcaa caattccatc agacaatttg gcagcaggta ctgataatac aagttcctta 2940 ggacccccaa gtatgccagt tcattatgat agtcaattag ataccactct atttggcaaa 3000 aagtcatctc cccttactga gtctggtgga cctctgagct tgagtgaaga aaataatgat 3060 tcaaagttgt tagaatcagg tttaatgaat agccaagaaa gttcatgggg aaaaaatgta 3120 tcgtcaacag agagtggtag gttatttaaa gggaaaagag ctcatggacc tgctttgttg 3180 actaaagata atgccttatt caaagttagc atctctttgt taaagacaaa caaaacttcc 3240 aataattcag caactaatag aaagactcac attgatggcc catcattatt aattgagaat 3300 agtccatcag tctggcaaaa tatattagaa agtgacactg agtttaaaaa agtgacacct 3360 ttgattcatg acagaatgct tatggacaaa aatgctacag ctttgaggct aaatcatatg 3420 tcaaataaaa ctacttcatc aaaaaacatg gaaatggtcc aacagaaaaa agagggcccc 3480 attccaccag atgcacaaaa tccagatatg tcgttcttta agatgctatt cttgccagaa 3540 tcagcaaggt ggatacaaag gactcatgga aagaactctc tgaactctgg gcaaggcccc 3600 agtccaaagc aattagtatc cttaggacca gaaaaatctg tggaaggtca gaatttcttg 3660 tctgagaaaa acaaagtggt agtaggaaag ggtgaattta caaaggacgt aggactcaaa 3720 gagatggttt ttccaagcag cagaaaccta tttcttacta acttggataa tttacatgaa 3780 aataatacac acaatcaaga aaaaaaaatt caggaagaaa tagaaaagaa ggaaacatta 3840 atccaagaga atgtagtttt gcctcagata catacagtga ctggcactaa gaatttcatg 3900 aagaaccttt tcttactgag cactaggcaa aatgtagaag gttcatatga cggggcatat 3960 gctccagtac ttcaagattt taggtcatta aatgattcaa caaatagaac aaagaaacac 4020 acagctcatt tctcaaaaaa aggggaggaa gaaaacttgg aaggcttggg aaatcaaacc 4080 aagcaaattg tagagaaata tgcatgcacc acaaggatat ctcctaatac aagccagcag 4140 aattttgtca cgcaacgtag taagagagct ttgaaacaat tcagactccc actagaagaa 4200 acagaacttg aaaaaaggat aattgtggat gacacctcaa cccagtggtc caaaaacatg 4260 aaacatttga ccccgagcac cctcacacag atagactaca atgagaagga gaaaggggcc 4320 attactcagt ctcccttatc agattgcctt acgaggagtc atagcatccc tcaagcaaat 4380 agatctccat tacccattgc aaaggtatca tcatttccat ctattagacc tatatatctg 4440 accagggtcc tattccaaga caactcttct catcttccag cagcatctta tagaaagaaa 4500 gattctgggg tccaagaaag cagtcatttc ttacaaggag ccaaaaaaaa taacctttct 4560 ttagccattc taaccttgga gatgactggt gatcaaagag aggttggctc cctggggaca 4620 agtgccacaa attcagtcac atacaagaaa gttgagaaca ctgttctccc gaaaccagac 4680 ttgcccaaaa catctggcaa agttgaattg cttccaaaag ttcacattta tcagaaggac 4740 ctattcccta cggaaactag caatgggtct cctggccatc tggatctcgt ggaagggagc 4800 cttcttcagg gaacagaggg agcgattaag tggaatgaag caaacagacc tggaaaagtt 4860 ccctttctga gagtagcaac agaaagctct gcaaagactc cctccaagct attggatcct 4920 cttgcttggg ataaccacta tggtactcag ataccaaaag aagagtggaa atcccaagag 4980 aagtcaccag aaaaaacagc ttttaagaaa aaggatacca ttttgtccct gaacgcttgt 5040 gaaagcaatc atgcaatagc agcaataaat gagggacaaa ataagcccga aatagaagtc 5100 acctgggcaa agcaaggtag gactgaaagg ctgtgctctc aaaacccacc agtcttgaaa 5160 cgccatcaac gggaaataac tcgtactact cttcagtcag atcaagagga aattgactat 5220 gatgatacca tatcagttga aatgaagaag gaagattttg acatttatga tgaggatgaa 5280 aatcagagcc cccgcagctt tcaaaagaaa acacgacact attttattgc tgcagtggag 5340 aggctctggg attatgggat gagtagctcc ccacatgttc taagaaacag ggctcagagt 5400 ggcagtgtcc ctcagttcaa gaaagttgtt ttccaggaat ttactgatgg ctcctttact 5460 cagcccttat accgtggaga actaaatgaa catttgggac tcctggggcc atatataaga 5520 gcagaagttg aagataatat catggtaact ttcagaaatc aggcctctcg tccctattcc 5580 ttctattcta gccttatttc ttatgaggaa gatcagaggc aaggagcaga acctagaaaa 5640 aactttgtca agcctaatga aaccaaaact tacttttgga aagtgcaaca tcatatggca 5700 cccactaaag atgagtttga ctgcaaagcc tgggcttatt tctctgatgt tgacctggaa 5760 aaagatgtgc actcaggcct gattggaccc cttctggtct gccacactaa cacactgaac 5820 cctgctcatg ggagacaagt gacagtacag gaatttgctc tgtttttcac catctttgat 5880 gagaccaaaa gctggtactt cactgaaaat atggaaagaa actgcagggc tccctgcaat 5940 atccagatgg aagatcccac ttttaaagag aattatcgct tccatgcaat caatggctac 6000 ataatggata cactacctgg cttagtaatg gctcaggatc aaaggattcg atggtatctg 6060 ctcagcatgg gcagcaatga aaacatccat tctattcatt tcagtggaca tgtgttcact 6120 gtacgaaaaa aagaggagta taaaatggca ctgtacaatc tctatccagg tgtttttgag 6180 acagtggaaa tgttaccatc caaagctgga atttggcggg tggaatgcct tattggcgag 6240 catctacatg ctgggatgag cacacttttt ctggtgtaca gcaataagtg tcagactccc 6300 ctgggaatgg cttctggaca cattagagat tttcagatta cagcttcagg acaatatgga 6360 cagtgggccc caaagctggc cagacttcat tattccggat caatcaatgc ctggagcacc 6420 aaggagccct tttcttggat caaggtggat ctgttggcac caatgattat tcacggcatc 6480 aagacccagg gtgcccgtca gaagttctcc agcctctaca tctctcagtt tatcatcatg 6540 tatagtcttg atgggaagaa gtggcagact tatcgaggaa attccactgg aaccttaatg 6600 gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 6660 attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 6720 gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 6780 atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 6840 ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 6900 aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 6960 actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 7020 agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 7080 ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 7140 taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 7200 ggctgcgagg cacaggacct ctactgaggg tggccactgc agcacctgcc actgccgtca 7260 cctctccctc ctcagctcca gggcagtgtc cctccctggc ttgccttcta cctttgtgct 7320 aaatcctagc agacactgcc ttgaagcctc ctgaattaac tatcatcagt cctgcatttc 7380 tttggtgggg ggccaggagg gtgcatccaa tttaacttaa ctcttaccta ttttctgcag 7440 ctgctcccag attactcctt ccttccaata taactaggca aaaagaagtg aggagaaacc 7500 tgcatgaaag cattcttccc tgaaaagtta ggcctctcag agtcaccact tcctctgttg 7560 tagaaaaact atgtgatgaa actttgaaaa agatatttat gatgttaaca tttcaggtta 7620 agcctcatac gtttaaaata aaactctcag ttgtttatta tcctgatcaa gcatggaaca 7680 aagcatgttt caggatcaga tcaatacaat cttggagtca aaaggcaaat catttggaca 7740 atctgcaaaa tggagagaat acaataacta ctacagtaaa gtctgtttct gcttccttac 7800 acatagatat aattatgtta tttagtcatt atgaggggca cattcttatc tccaaaacta 7860 gcattcttaa actgagaatt atagatgggg ttcaagaatc cctaagtccc ctgaaattat 7920 ataaggcatt ctgtataaat gcaaatgtgc atttttctga cgagtgtcca tagatataaa 7980 gccatttggt cttaattctg accaataaaa aaataagtca ggaggatgca attgttgaaa 8040 gctttgaaat aaaataacaa tgtcttcttg aaatttgtga tggccaagaa agaaaatgat 8100 gatgacatta ggcttctaaa ggacatacat ttaatatttc tgtggaaata tgaggaaaat 8160 ccatggttat ctgagatagg agatacaaac tttgtaattc taataatgca ctcagtttac 8220 tctctccctc tactaatttc ctgctgaaaa taacacaaca aaaatgtaac aggggaaatt 8280 atataccgtg actgaaaact agagtcctac ttacatagtt gaaatatcaa ggaggtcaga 8340 agaaaattgg actggtgaaa acagaaaaaa cactccagtc tgccatatca ccacacaata 8400 ggatccccct tcttgccctc cacccccata agattgtgaa gggtttactg ctccttccat 8460 ctgcctgacc ccttcactat gactacacag aatctcctga tagtaaaggg ggctggagac 8520 aaggataagt tatagagcag ttggaggaag catccaaaga ttgcaaccca gggcaaatgg 8580 aaaacaggag atcctaatat gaaagaaaaa tggatcccaa tctgagaaaa ggcaaaagaa 8640 tggctacttt tttctatgct ggagtatttt ctaataatcc tgcttgaccc ttatctgacc 8700 tctttggaaa ctataacata gctgtcacag tatagtcaca atccacaaat gatgcaggtg 8760 caaatggttt atagccctgt gaagttctta aagtttagag gctaacttac agaaatgaat 8820 aagttgtttt gttttatagc ccggtagagg agttaacccc aaaggtgata tggttttatt 8880 tcctgttatg tttaacttga taatcttatt ttggcattct tttcccattg actatataca 8940 tctctatttc tcaaatgttc atggaactag ctcttttatt ttcctgctgg tttcttcagt 9000 aatgagttaa ataaaacatt gacacataca aacaaa 9036 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <211> 183 <212> PRT <213> Salmonella typhimurium <400> 371 Met Pro Pro Ala Phe Ile Thr Gly Val Thr Ser Leu Ser Asp Val Glu 1 5 10 15 Leu Asp His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg 20 25 30 Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn 35 40 45 His Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp 50 55 60 Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val 65 70 75 80 Leu Gln Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Gly Arg 100 105 110 Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu 115 120 125 Ile Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Ile 130 135 140 Glu Gly Val Leu Arg Asp Glu Cys Ala Thr Leu Leu Ser Asp Phe Phe 145 150 155 160 Arg Met Arg Arg Gln Glu Ile Lys Ala Leu Lys Lys Ala Asp Arg Ala 165 170 175 Glu Gly Ala Gly Pro Ala Val 180 <210> 372 <211> 164 <212> PRT <213> Shewanella putrefaciens <400> 372 Met Asp Glu Tyr Trp Met Gln Val Ala Met Gln Met Ala Glu Lys Ala 1 5 10 15 Glu Ala Ala Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Asp Gly 20 25 30 Gln Gln Ile Ala Thr Gly Tyr Asn Leu Ser Ile Ser Gln His Asp Pro 35 40 45 Thr Ala His Ala Glu Ile Leu Cys Leu Arg Ser Ala Gly Lys Lys Leu 50 55 60 Glu Asn Tyr Arg Leu Leu Asp Ala Thr Leu Tyr Ile Thr Leu Glu Pro 65 70 75 80 Cys Ala Met Cys Ala Gly Ala Met Val His Ser Arg Ile Ala Arg Val 85 90 95 Val Tyr Gly Ala Arg Asp Glu Lys Thr Gly Ala Ala Gly Thr Val Val 100 105 110 Asn Leu Leu Gln His Pro Ala Phe Asn His Gln Val Glu Val Thr Ser 115 120 125 Gly Val Leu Ala Glu Ala Cys Ser Ala Gln Leu Ser Arg Phe Phe Lys 130 135 140 Arg Arg Arg Asp Glu Lys Lys Ala Leu Lys Leu Ala Gln Arg Ala Gln 145 150 155 160 Gln Gly Ile Glu <210> 373 <211> 173 <212> PRT <213> Haemophilus influenzae <400> 373 Met Asp Ala Ala Lys Val Arg Ser Glu Phe Asp Glu Lys Met Met Arg 1 5 10 15 Tyr Ala Leu Glu Leu Ala Asp Lys Ala Glu Ala Leu Gly Glu Ile Pro 20 25 30 Val Gly Ala Val Leu Val Asp Asp Ala Arg Asn Ile Ile Gly Glu Gly 35 40 45 Trp Asn Leu Ser Ile Val Gln Ser Asp Pro Thr Ala His Ala Glu Ile 50 55 60 Ile Ala Leu Arg Asn Gly Ala Lys Asn Ile Gln Asn Tyr Arg Leu Leu 65 70 75 80 Asn Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ala Gly 85 90 95 Ala Ile Leu His Ser Arg Ile Lys Arg Leu Val Phe Gly Ala Ser Asp 100 105 110 Tyr Lys Thr Gly Ala Ile Gly Ser Arg Phe His Phe Phe Asp Asp Tyr 115 120 125 Lys Met Asn His Thr Leu Glu Ile Thr Ser Gly Val Leu Ala Glu Glu 130 135 140 Cys Ser Gln Lys Leu Ser Thr Phe Phe Gln Lys Arg Arg Glu Glu Lys 145 150 155 160 Lys Ile Glu Lys Ala Leu Leu Lys Ser Leu Ser Asp Lys 165 170 <210> 374 <211> 161 <212> PRT <213> Caulobacter crescentus <400> 374 Met Arg Thr Asp Glu Ser Glu Asp Gln Asp His Arg Met Met Arg Leu 1 5 10 15 Ala Leu Asp Ala Ala Arg Ala Ala Ala Glu Ala Gly Glu Thr Pro Val 20 25 30 Gly Ala Val Ile Leu Asp Pro Ser Thr Gly Glu Val Ile Ala Thr Ala 35 40 45 Gly Asn Gly Pro Ile Ala Ala His Asp Pro Thr Ala His Ala Glu Ile 50 55 60 Ala Ala Met Arg Ala Ala Ala Ala Lys Leu Gly Asn Tyr Arg Leu Thr 65 70 75 80 Asp Leu Thr Leu Val Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly 85 90 95 Ala Ile Ser His Ala Arg Ile Gly Arg Val Val Phe Gly Ala Asp Asp 100 105 110 Pro Lys Gly Gly Ala Val Val His Gly Pro Lys Phe Phe Ala Gln Pro 115 120 125 Thr Cys His Trp Arg Pro Glu Val Thr Gly Gly Val Leu Ala Asp Glu 130 135 140 Ser Ala Asp Leu Leu Arg Gly Phe Phe Arg Ala Arg Arg Lys Ala Lys 145 150 155 160 Ile <210> 375 <211> 179 <212> PRT <213> Geobacter sulfurreducens <400> 375 Met Ser Ser Leu Lys Lys Thr Pro Ile Arg Asp Asp Ala Tyr Trp Met 1 5 10 15 Gly Lys Ala Ile Arg Glu Ala Ala Lys Ala Ala Ala Arg Asp Glu Val 20 25 30 Pro Ile Gly Ala Val Ile Val Arg Asp Gly Ala Val Ile Gly Arg Gly 35 40 45 His Asn Leu Arg Glu Gly Ser Asn Asp Pro Ser Ala His Ala Glu Met 50 55 60 Ile Ala Ile Arg Gln Ala Ala Arg Arg Ser Ala Asn Trp Arg Leu Thr 65 70 75 80 Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Leu Met Cys Met Gly 85 90 95 Ala Ile Ile Leu Ala Arg Leu Glu Arg Val Val Phe Gly Cys Tyr Asp 100 105 110 Pro Lys Gly Gly Ala Ala Gly Ser Leu Tyr Asp Leu Ser Ala Asp Pro 115 120 125 Arg Leu Asn His Gln Val Arg Leu Ser Pro Gly Val Cys Gln Glu Glu 130 135 140 Cys Gly Thr Met Leu Ser Asp Phe Phe Arg Asp Leu Arg Arg Arg Lys 145 150 155 160 Lys Ala Lys Ala Thr Pro Ala Leu Phe Ile Asp Glu Arg Lys Val Pro 165 170 175 Pro Glu Pro <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <400> 380 000 <210> 381 <400> 381 000 <210> 382 <400> 382 000 <210> 383 <400> 383 000 <210> 384 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 384 Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala 1 5 10 15 Thr Pro Glu Ser Ser Gly Gly Ser 20 <210> 385 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 385 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 <210> 386 <211> 104 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 386 Gly Gly Ser Gly Gly Ser Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 1 5 10 15 Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 20 25 30 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly 35 40 45 Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly 50 55 60 Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 65 70 75 80 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala 85 90 95 Thr Ser Gly Gly Ser Gly Gly Ser 100 <210> 387 <400> 387 000 <210> 388 <400> 388 000 <210> 389 <211> 82 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 389 guuuuagagc uagaaauagc aaguuaaaau aaaggcuagu ccguuaucaa cuugaaaaag 60 uggcaccgag ucggugcuuu uu 82 <210> 390 <400> 390 000 <210> 391 <400> 391 000 <210> 392 <400> 392 000 <210> 393 <400> 393 000 <210> 394 <400> 394 000 <210> 395 <400> 395 000 <210> 396 <400> 396 000 <210> 397 <400> 397 000 <210> 398 <400> 398 000 <210> 399 <400> 399 000 <210> 400 <400> 400 000 <210> 401 <400> 401 000 <210> 402 <400> 402 000 <210> 403 <400> 403 000 <210> 404 <400> 404 000 <210> 405 <400> 405 000 <210> 406 <400> 406 000 <210> 407 <400> 407 000 <210> 408 <400> 408 000 <210> 409 <400> 409 000 <210> 410 <400> 410 000 <210> 411 <400> 411 000 <210> 412 <400> 412 000 <210> 413 <400> 413 000 <210> 414 <400> 414 000 <210> 415 <400> 415 000 <210> 416 <400> 416 000 <210> 417 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 417 Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln 1 5 10 15 Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu 20 25 30 Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile 35 40 45 Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys 50 55 60 Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu 65 70 75 80 Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys 85 90 95 Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe 100 105 110 Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys 115 120 125 Pro Glu Phe Tyr Glu Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr 130 135 140 Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Ile Ala Ala 145 150 155 160 Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly 165 170 175 Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr 180 185 190 Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu 195 200 205 Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr 210 215 220 Asn Pro Asn Val Ser Val Val Arg Ile Tyr Thr Ile Ser Asp Ala Val 225 230 235 240 Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr 245 250 255 Lys Leu Leu Glu Lys Arg Tyr Leu Leu Ser Glu Arg Leu Glu Ala Ile 260 265 270 Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile 275 280 285 Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu 290 295 300 Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn 305 310 315 320 Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val 325 330 335 Asn Gly Glu Leu Ile Arg Gly Glu Gly 340 345 <210> 418 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 418 Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln 1 5 10 15 Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu 20 25 30 Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile 35 40 45 Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys 50 55 60 Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu 65 70 75 80 Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys 85 90 95 Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe 100 105 110 Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys 115 120 125 Pro Glu Phe Tyr Lys Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr 130 135 140 Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Met Ala Ala 145 150 155 160 Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly 165 170 175 Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr 180 185 190 Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu 195 200 205 Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr 210 215 220 Asn Pro Asn Val Ser Val Val Ser Ile Tyr Thr Ile Ser Asp Ala Val 225 230 235 240 Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr 245 250 255 Lys Leu Leu Glu Lys Arg Asp Leu Leu Ser Glu Arg Leu Glu Ala Ile 260 265 270 Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile 275 280 285 Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu 290 295 300 Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn 305 310 315 320 Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val 325 330 335 Asn Gly Glu Leu Ile Arg Gly Glu Gly 340 345 <210> 419 <211> 1210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 419 Met Ser Lys Arg His Pro Arg Ile Ser Gly Val Lys Gly Tyr Arg Leu 1 5 10 15 His Ala Gln Arg Leu Glu Tyr Thr Gly Lys Ser Gly Ala Met Arg Thr 20 25 30 Ile Lys Tyr Pro Leu Tyr Ser Ser Pro Ser Gly Gly Arg Thr Val Pro 35 40 45 Arg Glu Ile Val Ser Ala Ile Asn Asp Asp Tyr Val Gly Leu Tyr Gly 50 55 60 Leu Ser Asn Phe Asp Asp Leu Tyr Asn Ala Glu Lys Arg Asn Glu Glu 65 70 75 80 Lys Val Tyr Ser Val Leu Asp Phe Trp Tyr Asp Cys Val Gln Tyr Gly 85 90 95 Ala Val Phe Ser Tyr Thr Ala Pro Gly Leu Leu Lys Asn Val Ala Glu 100 105 110 Val Arg Gly Gly Ser Tyr Glu Leu Thr Lys Thr Leu Lys Gly Ser His 115 120 125 Leu Tyr Asp Glu Leu Gln Ile Asp Lys Val Ile Lys Phe Leu Asn Lys 130 135 140 Lys Glu Ile Ser Arg Ala Asn Gly Ser Leu Asp Lys Leu Lys Lys Asp 145 150 155 160 Ile Ile Asp Cys Phe Lys Ala Glu Tyr Arg Glu Arg His Lys Asp Gln 165 170 175 Cys Asn Lys Leu Ala Asp Asp Ile Lys Asn Ala Lys Lys Asp Ala Gly 180 185 190 Ala Ser Leu Gly Glu Arg Gln Lys Lys Leu Phe Arg Asp Phe Phe Gly 195 200 205 Ile Ser Glu Gln Ser Glu Asn Asp Lys Pro Ser Phe Thr Asn Pro Leu 210 215 220 Asn Leu Thr Cys Cys Leu Leu Pro Phe Asp Thr Val Asn Asn Asn Arg 225 230 235 240 Asn Arg Gly Glu Val Leu Phe Asn Lys Leu Lys Glu Tyr Ala Gln Lys 245 250 255 Leu Asp Lys Asn Glu Gly Ser Leu Glu Met Trp Glu Tyr Ile Gly Ile 260 265 270 Gly Asn Ser Gly Thr Ala Phe Ser Asn Phe Leu Gly Glu Gly Phe Leu 275 280 285 Gly Arg Leu Arg Glu Asn Lys Ile Thr Glu Leu Lys Lys Ala Met Met 290 295 300 Asp Ile Thr Asp Ala Trp Arg Gly Gln Glu Gln Glu Glu Glu Leu Glu 305 310 315 320 Lys Arg Leu Arg Ile Leu Ala Ala Leu Thr Ile Lys Leu Arg Glu Pro 325 330 335 Lys Phe Asp Asn His Trp Gly Gly Tyr Arg Ser Asp Ile Asn Gly Lys 340 345 350 Leu Ser Ser Trp Leu Gln Asn Tyr Ile Asn Gln Thr Val Lys Ile Lys 355 360 365 Glu Asp Leu Lys Gly His Lys Lys Asp Leu Lys Lys Ala Lys Glu Met 370 375 380 Ile Asn Arg Phe Gly Glu Ser Asp Thr Lys Glu Glu Ala Val Val Ser 385 390 395 400 Ser Leu Leu Glu Ser Ile Glu Lys Ile Val Pro Asp Asp Ser Ala Asp 405 410 415 Asp Glu Lys Pro Asp Ile Pro Ala Ile Ala Ile Tyr Arg Arg Phe Leu 420 425 430 Ser Asp Gly Arg Leu Thr Leu Asn Arg Phe Val Gln Arg Glu Asp Val 435 440 445 Gln Glu Ala Leu Ile Lys Glu Arg Leu Glu Ala Glu Lys Lys Lys Lys 450 455 460 Pro Lys Lys Arg Lys Lys Lys Ser Asp Ala Glu Asp Glu Lys Glu Thr 465 470 475 480 Ile Asp Phe Lys Glu Leu Phe Pro His Leu Ala Lys Pro Leu Lys Leu 485 490 495 Val Pro Asn Phe Tyr Gly Asp Ser Lys Arg Glu Leu Tyr Lys Lys Tyr 500 505 510 Lys Asn Ala Ala Ile Tyr Thr Asp Ala Leu Trp Lys Ala Val Glu Lys 515 520 525 Ile Tyr Lys Ser Ala Phe Ser Ser Ser Leu Lys Asn Ser Phe Phe Asp 530 535 540 Thr Asp Phe Asp Lys Asp Phe Phe Ile Lys Arg Leu Gln Lys Ile Phe 545 550 555 560 Ser Val Tyr Arg Arg Phe Asn Thr Asp Lys Trp Lys Pro Ile Val Lys 565 570 575 Asn Ser Phe Ala Pro Tyr Cys Asp Ile Val Ser Leu Ala Glu Asn Glu 580 585 590 Val Leu Tyr Lys Pro Lys Gln Ser Arg Ser Arg Lys Ser Ala Ala Ile 595 600 605 Asp Lys Asn Arg Val Arg Leu Pro Ser Thr Glu Asn Ile Ala Lys Ala 610 615 620 Gly Ile Ala Leu Ala Arg Glu Leu Ser Val Ala Gly Phe Asp Trp Lys 625 630 635 640 Asp Leu Leu Lys Lys Glu Glu His Glu Glu Tyr Ile Asp Leu Ile Glu 645 650 655 Leu His Lys Thr Ala Leu Ala Leu Leu Leu Ala Val Thr Glu Thr Gln 660 665 670 Leu Asp Ile Ser Ala Leu Asp Phe Val Glu Asn Gly Thr Val Lys Asp 675 680 685 Phe Met Lys Thr Arg Asp Gly Asn Leu Val Leu Glu Gly Arg Phe Leu 690 695 700 Glu Met Phe Ser Gln Ser Ile Val Phe Ser Glu Leu Arg Gly Leu Ala 705 710 715 720 Gly Leu Met Ser Arg Lys Glu Phe Ile Thr Arg Ser Ala Ile Gln Thr 725 730 735 Met Asn Gly Lys Gln Ala Glu Leu Leu Tyr Ile Pro His Glu Phe Gln 740 745 750 Ser Ala Lys Ile Thr Thr Pro Lys Glu Met Ser Arg Ala Phe Leu Asp 755 760 765 Leu Ala Pro Ala Glu Phe Ala Thr Ser Leu Glu Pro Glu Ser Leu Ser 770 775 780 Glu Lys Ser Leu Leu Lys Leu Lys Gln Met Arg Tyr Tyr Pro His Tyr 785 790 795 800 Phe Gly Tyr Glu Leu Thr Arg Thr Gly Gln Gly Ile Asp Gly Gly Val 805 810 815 Ala Glu Asn Ala Leu Arg Leu Glu Lys Ser Pro Val Lys Lys Arg Glu 820 825 830 Ile Lys Cys Lys Gln Tyr Lys Thr Leu Gly Arg Gly Gln Asn Lys Ile 835 840 845 Val Leu Tyr Val Arg Ser Ser Tyr Tyr Gln Thr Gln Phe Leu Glu Trp 850 855 860 Phe Leu His Arg Pro Lys Asn Val Gln Thr Asp Val Ala Val Ser Gly 865 870 875 880 Ser Phe Leu Ile Asp Glu Lys Lys Val Lys Thr Arg Trp Asn Tyr Asp 885 890 895 Ala Leu Thr Val Ala Leu Glu Pro Val Ser Gly Ser Glu Arg Val Phe 900 905 910 Val Ser Gln Pro Phe Thr Ile Phe Pro Glu Lys Ser Ala Glu Glu Glu 915 920 925 Gly Gln Arg Tyr Leu Gly Ile Asp Ile Gly Glu Tyr Gly Ile Ala Tyr 930 935 940 Thr Ala Leu Glu Ile Thr Gly Asp Ser Ala Lys Ile Leu Asp Gln Asn 945 950 955 960 Phe Ile Ser Asp Pro Gln Leu Lys Thr Leu Arg Glu Glu Val Lys Gly 965 970 975 Leu Lys Leu Asp Gln Arg Arg Gly Thr Phe Ala Met Pro Ser Thr Lys 980 985 990 Ile Ala Arg Ile Arg Glu Ser Leu Val His Ser Leu Arg Asn Arg Ile 995 1000 1005 His His Leu Ala Leu Lys His Lys Ala Lys Ile Val Tyr Glu Leu 1010 1015 1020 Glu Val Ser Arg Phe Glu Glu Gly Lys Gln Lys Ile Lys Lys Val 1025 1030 1035 Tyr Ala Thr Leu Lys Lys Ala Asp Val Tyr Ser Glu Ile Asp Ala 1040 1045 1050 Asp Lys Asn Leu Gln Thr Thr Val Trp Gly Lys Leu Ala Val Ala 1055 1060 1065 Ser Glu Ile Ser Ala Ser Tyr Thr Ser Gln Phe Cys Gly Ala Cys 1070 1075 1080 Lys Lys Leu Trp Arg Ala Glu Met Gln Val Asp Glu Thr Ile Thr 1085 1090 1095 Thr Gln Glu Leu Ile Gly Thr Val Arg Val Ile Lys Gly Gly Thr 1100 1105 1110 Leu Ile Asp Ala Ile Lys Asp Phe Met Arg Pro Pro Ile Phe Asp 1115 1120 1125 Glu Asn Asp Thr Pro Phe Pro Lys Tyr Arg Asp Phe Cys Asp Lys 1130 1135 1140 His His Ile Ser Lys Lys Met Arg Gly Asn Ser Cys Leu Phe Ile 1145 1150 1155 Cys Pro Phe Cys Arg Ala Asn Ala Asp Ala Asp Ile Gln Ala Ser 1160 1165 1170 Gln Thr Ile Ala Leu Leu Arg Tyr Val Lys Glu Glu Lys Lys Val 1175 1180 1185 Glu Asp Tyr Phe Glu Arg Phe Arg Lys Leu Lys Asn Ile Lys Val 1190 1195 1200 Leu Gly Gln Met Lys Lys Ile 1205 1210 <210> 420 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 420 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Ala Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Asn Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Glu Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 421 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 421 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 422 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 422 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Thr Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Thr Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 423 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 423 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Ser Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 424 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 424 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 425 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 425 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Arg Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 426 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 426 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Leu Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 427 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 427 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 428 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 428 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 429 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 429 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Arg Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 430 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 430 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Ser Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly His His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 431 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 431 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 432 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 432 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly His His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 433 <400> 433 000 <210> 434 <400> 434 000 <210> 435 <400> 435 000 <210> 436 <400> 436 000 <210> 437 <400> 437 000 <210> 438 <400> 438 000 <210> 439 <400> 439 000 <210> 440 <400> 440 000 <210> 441 <400> 441 000 <210> 442 <400> 442 000 <210> 443 <400> 443 000 <210> 444 <400> 444 000 <210> 445 <400> 445 000 <210> 446 <400> 446 000 <210> 447 <400> 447 000 <210> 448 <400> 448 000 <210> 449 <400> 449 000 <210> 450 <400> 450 000 <210> 451 <400> 451 000 <210> 452 <400> 452 000 <210> 453 <400> 453 000 <210> 454 <400> 454 000 <210> 455 <400> 455 000 <210> 456 <400> 456 000 <210> 457 <400> 457 000 <210> 458 <400> 458 000 <210> 459 <400> 459 000 <210> 460 <400> 460 000 <210> 461 <400> 461 000 <210> 462 <400> 462 000 <210> 463 <400> 463 000 <210> 464 <400> 464 000 <210> 465 <400> 465 000 <210> 466 <400> 466 000 <210> 467 <400> 467 000 <210> 468 <400> 468 000 <210> 469 <400> 469 000 <210> 470 <400> 470 000 <210> 471 <400> 471 000 <210> 472 <400> 472 000 <210> 473 <400> 473 000 <210> 474 <400> 474 000 <210> 475 <400> 475 000 <210> 476 <400> 476 000 <210> 477 <400> 477 000 <210> 478 <400> 478 000 <210> 479 <400> 479 000 <210> 480 <400> 480 000 <210> 481 <400> 481 000 <210> 482 <400> 482 000 <210> 483 <400> 483 000 <210> 484 <400> 484 000 <210> 485 <400> 485 000 <210> 486 <400> 486 000 <210> 487 <400> 487 000 <210> 488 <400> 488 000 <210> 489 <400> 489 000 <210> 490 <400> 490 000 <210> 491 <400> 491 000 <210> 492 <400> 492 000 <210> 493 <400> 493 000 <210> 494 <400> 494 000 <210> 495 <400> 495 000 <210> 496 <400> 496 000 <210> 497 <400> 497 000 <210> 498 <400> 498 000 <210> 499 <400> 499 000 <210> 500 <400> 500 000 <210> 501 <400> 501 000 <210> 502 <400> 502 000 <210> 503 <400> 503 000 <210> 504 <400> 504 000 <210> 505 <400> 505 000 <210> 506 <400> 506 000 <210> 507 <400> 507 000 <210> 508 <400> 508 000 <210> 509 <400> 509 000 <210> 510 <400> 510 000 <210> 511 <400> 511 000 <210> 512 <400> 512 000 <210> 513 <400> 513 000 <210> 514 <400> 514 000 <210> 515 <400> 515 000 <210> 516 <400> 516 000 <210> 517 <400> 517 000 <210> 518 <400> 518 000 <210> 519 <400> 519 000 <210> 520 <400> 520 000 <210> 521 <400> 521 000 <210> 522 <400> 522 000 <210> 523 <400> 523 000 <210> 524 <400> 524 000 <210> 525 <400> 525 000 <210> 526 <400> 526 000 <210> 527 <400> 527 000 <210> 528 <400> 528 000 <210> 529 <400> 529 000 <210> 530 <400> 530 000 <210> 531 <400> 531 000 <210> 532 <400> 532 000 <210> 533 <400> 533 000 <210> 534 <400> 534 000 <210> 535 <400> 535 000 <210> 536 <400> 536 000 <210> 537 <400> 537 000 <210> 538 <400> 538 000 <210> 539 <400> 539 000 <210> 540 <400> 540 000 <210> 541 <400> 541 000 <210> 542 <400> 542 000 <210> 543 <400> 543 000 <210> 544 <400> 544 000 <210> 545 <400> 545 000 <210> 546 <400> 546 000 <210> 547 <400> 547 000 <210> 548 <400> 548 000 <210> 549 <400> 549 000 <210> 550 <400> 550 000 <210> 551 <400> 551 000 <210> 552 <400> 552 000 <210> 553 <400> 553 000 <210> 554 <400> 554 000 <210> 555 <400> 555 000 <210> 556 <400> 556 000 <210> 557 <400> 557 000 <210> 558 <400> 558 000 <210> 559 <400> 559 000 <210> 560 <400> 560 000 <210> 561 <400> 561 000 <210> 562 <400> 562 000 <210> 563 <400> 563 000 <210> 564 <400> 564 000 <210> 565 <400> 565 000 <210> 566 <400> 566 000 <210> 567 <400> 567 000 <210> 568 <400> 568 000 <210> 569 <400> 569 000 <210> 570 <400> 570 000 <210> 571 <400> 571 000 <210> 572 <400> 572 000 <210> 573 <400> 573 000 <210> 574 <400> 574 000 <210> 575 <400> 575 000 <210> 576 <400> 576 000 <210> 577 <400> 577 000 <210> 578 <400> 578 000 <210> 579 <400> 579 000 <210> 580 <400> 580 000 <210> 581 <400> 581 000 <210> 582 <400> 582 000 <210> 583 <400> 583 000 <210> 584 <400> 584 000 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <400> 600 000 <210> 601 <400> 601 000 <210> 602 <400> 602 000 <210> 603 <400> 603 000 <210> 604 <400> 604 000 <210> 605 <400> 605 000 <210> 606 <400> 606 000 <210> 607 <400> 607 000 <210> 608 <400> 608 000 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 672 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 673 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 673 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Thr Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 674 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 674 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 675 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 675 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 676 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 676 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 677 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 677 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 678 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 678 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Pro Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 679 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 679 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met His Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 680 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 680 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 681 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 681 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 682 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 682 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 683 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 683 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 684 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 684 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 685 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 685 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser 20 <210> 686 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 686 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser 35 40 <210> 687 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 687 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 35 40 45 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 <210> 688 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 688 Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser 1 5 10 15 Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser 20 25 30 Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu 35 40 45 Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser 50 55 60 Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr 65 70 75 80 Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser 85 90 <210> 689 <400> 689 000 <210> 690 <400> 690 000 <210> 691 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 691 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 692 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 692 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 693 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 693 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Ser Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 694 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 694 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 695 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 695 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 696 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 696 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 697 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 697 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 698 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 698 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 699 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 699 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 700 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 700 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 701 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 701 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 702 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 702 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 703 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 703 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 704 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 704 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 705 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 705 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 706 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 706 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 707 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 707 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 708 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 708 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 709 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 709 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 710 <211> 1773 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 710 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Gly Glu Gly 225 230 235 240 Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile 245 250 255 Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile 260 265 270 Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly 275 280 285 Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn 290 295 300 Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro 305 310 315 320 Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu 325 330 335 Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe 340 345 350 Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser 355 360 365 Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr 370 375 380 Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser 385 390 395 400 Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr 405 410 415 Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr 420 425 430 Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp 435 440 445 Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg 450 455 460 Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe 465 470 475 480 Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu 485 490 495 Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile 500 505 510 Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr 515 520 525 Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp 530 535 540 Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly 545 550 555 560 His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp 565 570 575 Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu 580 585 590 Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala 595 600 605 Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro 610 615 620 Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu 625 630 635 640 Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala 645 650 655 Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu 660 665 670 Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys 675 680 685 Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr 690 695 700 Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp 705 710 715 720 Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln 725 730 735 Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly 740 745 750 Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys 755 760 765 Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu 770 775 780 Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp 785 790 795 800 Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile 805 810 815 Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu 820 825 830 Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro 835 840 845 Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu 850 855 860 Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala 865 870 875 880 Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu 885 890 895 Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe 900 905 910 Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met 915 920 925 Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp 930 935 940 Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu 945 950 955 960 Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly 965 970 975 Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu 980 985 990 Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp 995 1000 1005 Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg 1010 1015 1020 Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp 1025 1030 1035 Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp 1040 1045 1050 Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln 1055 1060 1065 Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 1070 1075 1080 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 1085 1090 1095 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 1100 1105 1110 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 1115 1120 1125 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys 1130 1135 1140 Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 1145 1150 1155 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu 1160 1165 1170 Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 1175 1180 1185 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu 1190 1195 1200 Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val 1205 1210 1215 Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp 1220 1225 1230 His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn 1235 1240 1245 Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn 1250 1255 1260 Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg 1265 1270 1275 Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn 1280 1285 1290 Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala 1295 1300 1305 Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 1310 1315 1320 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 1325 1330 1335 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 1340 1345 1350 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 1355 1360 1365 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu 1370 1375 1380 Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu 1385 1390 1395 Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg 1400 1405 1410 Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala 1415 1420 1425 Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu 1430 1435 1440 Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu 1445 1450 1455 Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp 1460 1465 1470 Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile 1475 1480 1485 Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser 1490 1495 1500 Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys 1505 1510 1515 Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val 1520 1525 1530 Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser 1535 1540 1545 Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met 1550 1555 1560 Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1565 1570 1575 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1580 1585 1590 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu 1595 1600 1605 Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro 1610 1615 1620 Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys 1625 1630 1635 Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val 1640 1645 1650 Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser 1655 1660 1665 Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys 1670 1675 1680 Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu 1685 1690 1695 Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly 1700 1705 1710 Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys 1715 1720 1725 Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His 1730 1735 1740 Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln 1745 1750 1755 Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 1770 <210> 711 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 711 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <211> 347 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 750 Met Gly Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gln 1 5 10 15 Thr Ala Val Leu Gln Gly Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30 Leu Phe Met Gly Ala Ser Glu Gln Asp Leu Gly Leu Ser Leu Phe Glu 35 40 45 Ala Leu Gly Tyr Val Asp Asp Gln Leu Phe Val Phe Tyr Asp His Glu 50 55 60 Ser Arg Arg Val Glu Pro Arg Thr Pro Trp Val Ser Ser Arg Ile Ser 65 70 75 80 Ser Gln Met Trp Leu Gln Leu Ser Gln Ser Leu Lys Gly Trp Asp His 85 90 95 Met Phe Thr Val Asp Phe Trp Thr Ile Met Glu Asn His Asn His Ser 100 105 110 Lys Glu Ser His Thr Leu Gln Val Ile Leu Gly Cys Glu Met Gln Glu 115 120 125 Asp Asn Ser Thr Glu Gly Tyr Trp Lys Tyr Gly Tyr Asp Gly Gln Asp 130 135 140 His Leu Glu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala Glu Pro 145 150 155 160 Arg Ala Trp Pro Thr Lys Leu Glu Trp Glu Arg His Lys Ile Arg Ala 165 170 175 Arg Gln Asn Arg Ala Tyr Leu Glu Arg Asp Cys Pro Ala Gln Leu Gln 180 185 190 Gln Leu Leu Glu Leu Gly Arg Gly Val Leu Asp Gln Gln Val Pro Pro 195 200 205 Leu Val Lys Val Thr His His Val Thr Ser Ser Val Thr Thr Leu Arg 210 215 220 Cys Arg Ala Leu Asn Tyr Tyr Pro Gln Asn Ile Thr Met Lys Trp Leu 225 230 235 240 Lys Asp Lys Gln Pro Met Asp Ala Lys Glu Phe Glu Pro Lys Asp Val 245 250 255 Leu Pro Asn Gly Asp Gly Thr Tyr Gln Gly Trp Ile Thr Leu Ala Val 260 265 270 Pro Pro Gly Glu Glu Gln Arg Tyr Thr Cys Gln Val Glu His Pro Gly 275 280 285 Leu Asp Gln Pro Leu Ile Val Ile Trp Glu Pro Ser Pro Ser Gly Thr 290 295 300 Leu Val Ile Gly Val Ile Ser Gly Ile Ala Val Phe Val Val Ile Leu 305 310 315 320 Phe Ile Gly Ile Leu Phe Ile Ile Leu Arg Lys Arg Gln Gly Ser Arg 325 330 335 Gly Ala Met Gly His Tyr Val Leu Ala Glu Arg 340 345 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 800 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser 20 <210> 801 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <220> <221> MISC_FEATURE <222> (137)..(256) <223> May be absent <400> 801 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 1 5 10 15 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 85 90 95 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 100 105 110 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 115 120 125 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 130 135 140 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 145 150 155 160 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 165 170 175 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 180 185 190 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 195 200 205 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 225 230 235 240 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 <210> 802 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 802 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 803 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 803 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 804 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 804 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 805 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 805 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 806 <400> 806 000 <210> 807 <400> 807 000 <210> 808 <400> 808 000 <210> 809 <400> 809 000 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <400> 829 000 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 838 cttgggggcc ccttccccac acta 24 <210> 839 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 839 cttgggggcc ccttccccac act 23 <210> 840 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 840 cttgggggcc ccttccccac ac 22 <210> 841 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 841 cttgggggcc ccttccccac a 21 <210> 842 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 842 cttgggggcc ccttccccac 20 <210> 843 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 843 cttgggggcc ccttcccca 19 <210> 844 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 844 cttgggggcc ccttcccc 18 <210> 845 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 845 cttgggggcc ccttccc 17 <210> 846 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 846 ucaugugggg aaggggcccc caag 24 <210> 847 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 847 caugugggga aggggccccc aag 23 <210> 848 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 848 auguggggaa ggggccccca ag 22 <210> 849 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 849 uguggggaag gggcccccaa g 21 <210> 850 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 850 guggggaagg ggcccccaag 20 <210> 851 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 851 uggggaaggg gcccccaag 19 <210> 852 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 852 ggggaagggg cccccaag 18 <210> 853 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 853 gggaaggggc ccccaag 17 <210> 854 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 854 gggtgctcca cctggtacgt atat 24 <210> 855 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 855 gggtgctcca cctggtacgt ata 23 <210> 856 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 856 gggtgctcca cctggtacgt at 22 <210> 857 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 857 gggtgctcca cctggtacgt a 21 <210> 858 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 858 gggtgctcca cctggtacgt 20 <210> 859 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 859 gggtgctcca cctggtacg 19 <210> 860 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 860 gggtgctcca cctggtac 18 <210> 861 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 861 gggtgctcca cctggta 17 <210> 862 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 862 auauacguac cagguggagc accc 24 <210> 863 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 863 uauacguacc agguggagca ccc 23 <210> 864 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 864 auacguacca gguggagcac cc 22 <210> 865 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 865 uacguaccag guggagcacc c 21 <210> 866 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 866 acguaccagg uggagcaccc 20 <210> 867 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 867 cguaccaggu ggagcaccc 19 <210> 868 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 868 guaccaggug gagcaccc 18 <210> 869 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 869 uaccaggugg agcaccc 17 <210> 870 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 870 gacguaccag guggagcacc c 21 <210> 871 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 871 atgggcccgc gagccaggcc ggcgcttctc ctcctgatgc ttttgcagac cgcggtcctg 60 caggggcgct tgctgcgttc acactctctg cactacctct tcatgggtgc ctcagagcag 120 gaccttggtc tttccttgtt tgaagctttg ggctacgtgg atgaccagct gttcgtgttc 180 tatgatcatg agagtcgccg tgtggagccc cgaactccat gggtttccag tagaatttca 240 agccagatgt ggctgcagct gagtcagagt ctgaaagggt gggatcacat gttcactgtt 300 gacttctgga ctattatgga aaatcacaac cacagcaagg agtcccacac cctgcaggtc 360 atcctgggct gtgaaatgca agaagacaac agtaccgagg gctactggaa gtacgggtat 420 gatgggcagg accaccttga attctgccct gacacactgg attggagagc agcagaaccc 480 agggcctggc ccaccaagct ggagtgggaa aggcacaaga ttcgggccag gcagaacagg 540 gcctacctgg agagggactg ccctgcacag ctgcagcagt tgctggagct ggggagaggt 600 gttttggacc aacaagtgcc tcctttggtg aaggtgacac atcatgtgac ctcttcagtg 660 accactctac ggtgtcgggc cttgaactac tacccccaga acatcaccat gaagtggctg 720 aaggataagc agccaatgga tgccaaggag ttcgaaccta aagacgtatt gcccaatggg 780 gatgggacct accagggctg gataaccttg gctgtacccc ctggggaaga gcagagatat 840 acgtgccagg tggagcaccc aggcctggat cagcccctca ttgtgatctg ggagccctca 900 ccgtctggca ccctagtcat tggagtcatc agtggaattg ctgtttttgt cgtcatcttg 960 ttcattggaa ttttgttcat aatattaagg aagaggcagg gttcaagagg agccatgggg 1020 cactacgtct tagctgaacg tgagtga 1047

Claims

HBG1 또는 HBG2 유전자의 프로모터를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBG1 또는 HBG2 유전자의 프로모터의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
제1항에 있어서, 가이드 서열이 프로모터의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵염기를 포함하는 것인 방법.
제1항 또는 제2항에 있어서, 염기 편집제가 표적 핵산 서열을 니킹하는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하는 것인 방법.
제4항에 있어서, 표적 핵산 서열이 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 표적 핵산 서열이
를 포함하는 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 가이드 서열이 하기를 포함하는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 가이드 서열이
를 포함하는 것인 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 845의 위치 14에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 가이드 서열이 하기를 포함하는 것인 방법.
제10항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 302의 위치 21에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제10항 또는 제11항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제13항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 303의 위치 15, 17, 18 또는 19 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제13항 또는 제14항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845 또는 서열식별번호: 302를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853 또는 서열식별번호: 259를 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제16항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 309의 위치 22에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제16항 또는 제17항에 있어서,
제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302 또는 서열식별번호: 303을 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259 또는 서열식별번호: 260을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제19항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 310의 위치 19에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제19항 또는 제20항에 있어서,
제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303 또는 서열식별번호: 309를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제22항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 311의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제22항 또는 제23항에 있어서, 제1항 내지 제21항 중 어느 한 항의 방법을 수행하는 것을 추가로 포함하는 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제25항에 있어서, 프로모터의 표적 핵산 서열이 하기의 핵산 위치 16 및 17에서의 T를 포함하며,

여기서 위치 16 또는 17 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 T에서 C로의 돌연변이를 유발하는 것인 방법.
제25항 또는 제26항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309 또는 서열식별번호: 311을 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266 또는 서열식별번호: 268을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제28항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 313의 위치 15, 16 또는 19 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제28항 또는 제29항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311 또는 서열식별번호: 312를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268 또는 서열식별번호: 269를 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제28항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 319의 위치 16, 21 또는 22 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제31항 또는 제32항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312 또는 서열식별번호: 313을 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269 또는 서열식별번호: 270을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제34항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 320의 위치 17 또는 18 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제34항 또는 제35항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313 또는 서열식별번호: 319를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270 또는 서열식별번호: 276을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제37항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 321의 위치 16 또는 17 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제37항 또는 제38항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319 또는 서열식별번호: 320을 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276 또는 서열식별번호: 277을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제40항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 322의 위치 16, 17 또는 20 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제40항 또는 제41항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319, 서열식별번호: 320 또는 서열식별번호: 321을 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276, 서열식별번호: 277 또는 서열식별번호: 278을 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제43항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 323의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제43항 또는 제44항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
(a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319, 서열식별번호: 320, 서열식별번호: 321 또는 서열식별번호: 322를 포함하거나;
(b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276, 서열식별번호: 277, 서열식별번호: 278 또는 서열식별번호: 279를 포함하거나; 또는
(c) (a) 및 (b) 둘 다인 방법.
제1항 내지 제45항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 프로모터 내의 T-A 염기 쌍에서 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
제1항 내지 제46항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 태아성 헤모글로빈의 유전성 지속 (HPFH)과 연관된 서열을 생성하는 것인 방법.
제1항 내지 제47항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 유전자의 전사의 증가를 일으키는 것인 방법.
제1항 내지 제48항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 단백질의 증가를 일으키는 것인 방법.
제1항 내지 제49항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG2 유전자의 전사의 증가를 일으키는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG2 단백질의 증가를 일으키는 것인 방법.
제1항 내지 제51항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 및 HBG2 유전자 둘 다의 전사의 증가를 일으키는 것인 방법.
제1항 내지 제52항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 및 HBG2 단백질의 양의 증가를 일으키는 것인 방법.
제1항 내지 제53항 중 어느 한 항에 있어서, HBG1 또는 HBG2 유전자의 프로모터가 세포 내에 존재하는 것인 방법.
제1항 내지 제54항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
제1항 내지 제54항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
제56항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
제56항 또는 제57항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에게 태아성 헤모글로빈의 유전성 지속 (HPFH)을 부여하는 것인 방법.
제56항 내지 제58항 중 어느 한 항에 있어서, 대상체가 혈액 질환 또는 장애를 갖는 것인 방법.
제59항에 있어서, 질환 또는 장애가 빈혈인 방법.
제60항에 있어서, 빈혈이 겸상 적혈구성 빈혈인 방법.
제59항에 있어서, 질환 또는 장애가 베타-지중해빈혈인 방법.
제59항 내지 제62항 중 어느 한 항에 있어서, 질환 또는 장애가 글로빈 단백질을 코딩하는 유전자 또는 이러한 유전자의 프로모터 내의 돌연변이에 의해 유발되는 것인 방법.
제63항에 있어서, 유전자가 CYGB, HBA1, HBA2, HBB, HBD, HBE1, HBG1, HBG2, HBM, HBQ1, HBZ 또는 MB인 방법.
HFE 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HFE 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
제65항에 있어서, HFE 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
제66항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
제66항에 있어서, HFE 유전자가 Cys에서 Tyr로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
제68항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Cys에서 Tyr로의 돌연변이를 교정하는 것인 방법.
제65항 내지 제69항 중 어느 한 항에 있어서, 가이드 서열이 HFE 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
제65항 내지 제70항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
제65항 내지 제71항 중 어느 한 항에 있어서, HFE 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
제72항에 있어서, 표적 핵산 서열이 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 방법.
제65항 내지 제73항 중 어느 한 항에 있어서, HFE 유전자의 표적 핵산 서열이
를 포함하는 것인 방법.
제65항 내지 제74항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제75항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
제65항 내지 제76항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 핵산 서열
를 포함하는 것인 방법.
제65항 내지 제77항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 861의 위치 16에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제65항 내지 제78항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 유전자 내의 T-A 염기 쌍에서 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
제65항 내지 제79항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 하는 것인 방법.
제65항 내지 제80항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 유전자로부터 전사된 HFE 단백질의 기능 증가를 일으키는 것인 방법.
제65항 내지 제81항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 안정성 또는 반감기의 증가를 일으키는 것인 방법.
제65항 내지 제82항 중 어느 한 항에 있어서, HFE 유전자가 세포 내에 존재하는 것인 방법.
제83항에 있어서, HFE 유전자가 Cys에서 Tyr로의 돌연변이를 포함하는 HFE 단백질을 코딩하는 것인 방법.
제84항에 있어서, HFE 단백질이 하기 아미노산 서열의 잔기 282에서의 Cys에서 Tyr로의 돌연변이 (C282Y)를 포함하는 것인 방법.
제83항 내지 제85항 중 어느 한 항에 있어서, 세포가 불멸화 림프모구성 세포 (LCL)인 방법.
제65항 내지 제86항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
제65항 내지 제85항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
제88항에 있어서, 대상체가 철 축적 장애를 갖는 것인 방법.
제89항에 있어서, 철 축적 장애가 유전성 혈색소증 (HHC)인 방법.
제88항 내지 제90항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
제90항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 철 축적 장애의 1종 이상의 증상을 호전시키는 것인 방법.
HBB 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBB 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
제93항에 있어서, HBB 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
제94항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
제94항에 있어서, HBB 유전자가 Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
제96항에 있어서, Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 6에서의 것인 방법.
제97항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이를 교정하는 것인 방법.
제93항 내지 제98항 중 어느 한 항에 있어서, 가이드 서열이 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
제93항 내지 제99항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
제93항 내지 제100항 중 어느 한 항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 324의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 325의 위치 18에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 331의 위치 22에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 332의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 333의 위치 23에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 334의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제93항 내지 제107항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제108항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
제93항 내지 제109항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자 내의 T-A 염기 쌍에서 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
제93항 내지 제110항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 겸상 적혈구 질환과 연관된 서열을 교정하도록 하는 것인 방법.
제93항 내지 제110항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 Hb C 베타-지중해빈혈과 연관된 서열을 교정하도록 하는 것인 방법.
제93항 내지 제112항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자로부터 전사된 베타-글로빈 단백질의 기능 증가를 일으키는 것인 방법.
제93항 내지 제113항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-글로빈 안정성 또는 반감기의 증가를 일으키는 것인 방법.
제93항 내지 제114항 중 어느 한 항에 있어서, HBB 유전자가 세포 내에 존재하는 것인 방법.
제93항 내지 제115항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
제93항 내지 제116항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
제117항에 있어서, 대상체가 겸상 적혈구 질환을 갖는 것인 방법.
제117항에 있어서, 대상체가 베타-지중해빈혈을 갖는 것인 방법.
제119항에 있어서, 대상체가 Hb C 베타-지중해빈혈 (헤모글로빈 C 질환)을 갖는 것인 방법.
제93항 내지 제120항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
제118항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 겸상 적혈구 질환의 1종 이상의 증상을 호전시키는 것인 방법.
제119항 또는 제120항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-지중해빈혈의 1종 이상의 증상을 호전시키는 것인 방법.
제94항에 있어서, HBB 유전자가 Glu에서 Lys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
제124항에 있어서, Glu에서 Lys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 26에서의 것인 방법.
제125항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Glu에서 Lys로의 돌연변이를 교정하는 것인 방법.
제124항 내지 제126항 중 어느 한 항에 있어서, 가이드 서열이 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
제124항 내지 제127항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
제124항 내지 제128항 중 어느 한 항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 335의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 336의 위치 16에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 위치 19에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제124항 내지 제132항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제133항에 있어서, gRNA의 가이드 서열이 5'에 G를 추가로 포함하는 것인 방법.
제124항 내지 제134항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자 내의 T-A 염기 쌍에서 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
제124항 내지 제136항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 Hb E 베타-지중해빈혈과 연관된 서열을 교정하도록 하는 것인 방법.
제124항 내지 제136항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자로부터 전사된 베타-글로빈 단백질의 기능 증가를 일으키는 것인 방법.
제124항 내지 제137항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-글로빈 안정성 또는 반감기의 증가를 일으키는 것인 방법.
제124항 내지 제138항 중 어느 한 항에 있어서, HBB 유전자가 세포 내에 존재하는 것인 방법.
제124항 내지 제139항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
제124항 내지 제140항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
제141항에 있어서, 대상체가 베타-지중해빈혈을 갖는 것인 방법.
제142항에 있어서, 대상체가 Hb E 베타-지중해빈혈 (헤모글로빈 E 질환)을 갖는 것인 방법.
제124항 내지 제143항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
제141항, 제142항 및 제144항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-지중해빈혈의 1종 이상의 증상을 호전시키는 것인 방법.
F8 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, F8 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
제146항에 있어서, F8 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
제147항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
제148항에 있어서, F8 유전자가 Arg에서 Cys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
제149항에 있어서, Arg에서 Cys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 612에서의 것인 방법.
제150항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Arg에서 Cys로의 돌연변이를 교정하는 것인 방법.
제146항 내지 제151항 중 어느 한 항에 있어서, 가이드 서열이 F8 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
제146항 내지 제152항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
제146항 내지 제153항 중 어느 한 항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
제154항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 388의 위치 20에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제154항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하며,

여기서 서열식별번호: 339의 위치 18에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
제146항 내지 제156항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
제157항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
제146항 내지 제158항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 F8 유전자 내의 T-A 염기 쌍에서 F8 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
제146항 내지 제159항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 혈우병과 연관된 서열을 교정하도록 하는 것인 방법.
제160항에 있어서, 혈우병이 A형 혈우병인 방법.
제146항 내지 제161항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 혈우병과 연관된 서열을 교정하도록 하는 것인 방법.
제146항 내지 제162항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 F8 유전자로부터 전사된 인자 VIII 단백질의 기능 증가를 일으키는 것인 방법.
제146항 내지 제163항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 인자 VIII 안정성 또는 반감기의 증가를 일으키는 것인 방법.
제146항 내지 제164항 중 어느 한 항에 있어서, F8 유전자가 세포 내에 존재하는 것인 방법.
제146항 내지 제165항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
제146항 내지 제166항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
제167항에 있어서, 대상체가 혈우병을 갖는 것인 방법.
제168항에 있어서, 대상체가 A형 혈우병을 갖는 것인 방법.
제146항 내지 제169항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
제168항 또는 제169항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 혈우병의 1종 이상의 증상을 호전시키는 것인 방법.
제1항 내지 제171항 중 어느 한 항에 있어서, 염기 편집제가 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) 아데노신 데아미나제를 포함하는 융합 단백질을 포함하는 것인 방법.
제172항에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 방법.
제173항에 있어서, NLS가 이분된 NLS인 방법.
제173항 또는 제174항에 있어서, NLS가 아미노산 서열
를 포함하는 것인 방법.
제172항 내지 제175항 중 어느 한 항에 있어서, 아데노신 데아미나제가 이. 콜라이(E. coli) TadA (ecTadA)인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열로 이루어진 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 도 7의 ABE 중 어느 하나로부터의 1개 이상의 돌연변이 또는 또 다른 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 도 7의 ABE 중 어느 하나로부터의 각각의 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
제172항 내지 제192항 중 어느 한 항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 Cas9 도메인, Cpf1 도메인, CasX 도메인, CasY 도메인, C2c1 도메인, C2c2 도메인 또는 C2c3 도메인인 방법.
제193항에 있어서, Cas9 도메인이 기능상실 Cas9 (dCas9) 도메인, Cas9 니카제 (nCas9) 도메인 및 뉴클레아제 활성 Cas9 도메인으로 이루어진 군으로부터 선택된 것인 방법.
제194항에 있어서, Cas9 도메인이 Cas9 니카제 (nCas9) 도메인인 방법.
제195항에 있어서, Cas9 니카제 도메인이 서열식별번호: 35에 제시된 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제196항 중 어느 한 항에 있어서, 융합 단백질이 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)과 아데노신 데아미나제 사이에 1개 이상의 링커를 추가로 포함하는 것인 방법.
제197항에 있어서, 1개 이상의 링커가 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나에 제시된 아미노산 서열을 포함하는 것인 방법.
제198항에 있어서, 링커가 서열식별번호: 800에 제시된 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제199항 중 어느 한 항에 있어서, 융합 단백질이 제2 아데노신 데아미나제를 추가로 포함하는 것인 방법.
제200항에 있어서, 제2 아데노신 데아미나제가 ecTadA인 방법.
제201항에 있어서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제가 동일한 것인 방법.
제201항에 있어서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제가 상이한 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열을 포함하는 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열로 이루어진 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열을 포함하는 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열로 이루어진 것인 방법.
제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
제172항 내지 제209항 중 어느 한 항에 있어서, 융합 단백질이 하기 구조를 포함하며,
[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp];
[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp];
[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]; 또는
[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS];
여기서 napDNAbp는 Cas9 도메인이고, "-"는 임의적 링커 서열의 존재를 나타내는 것인 방법.
제210항에 있어서, Cas9 도메인이 Cas9 니카제 (nCas9)인 방법.
제200항 내지 제211항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 및 제2 데아미나제가 아미노산 서열 (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801) (여기서 n은 1, 2, 3, 4 또는 5임)을 포함하는 링커를 통해 융합된 것인 방법.
제200항 내지 제212항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 및 제2 데아미나제가 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함하는 링커를 통해 융합된 것인 방법.
제200항 내지 제213항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 또는 제2 아데노신 데아미나제가 아미노산 서열 (SGGS)_n-SGSETPGTSESATPES-(SGGS)_n (서열식별번호: 801) (여기서 n은 1, 2, 3, 4 또는 5임)을 포함하는 링커를 통해 napDNAbp에 융합된 것인 방법.
제200항 내지 제214항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 또는 제2 아데노신 데아미나제가 아미노산 서열 (SGGS)₂-SGSETPGTSESATPES-(SGGS)₂ (서열식별번호: 800)를 포함하는 링커를 통해 napDNAbp에 융합된 것인 방법.
제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 805의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 804의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 803의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 802의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 682의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
제221항에 있어서, 가이드 RNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제222항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
제222항 또는 제223항에 있어서, gRNA의 가이드 서열이
를 포함하는 것인 방법.
제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
제225항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제226항에 있어서, gRNA의 가이드 서열이 제226항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
제225항 내지 제227항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 핵산 서열
를 포함하는 것인 방법.
제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
제229항에 있어서, 가이드 RNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제230항에 있어서, gRNA의 가이드 서열이 제230항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
제232항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제233항에 있어서, gRNA의 가이드 서열이 제233항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
제235항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
제236항에 있어서, gRNA의 가이드 서열이 제236항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 707의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 708의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 709의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 710의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 711의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
제1항 내지 제242항 중 어느 한 항에 있어서, 20%, 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 또는 0.1% 미만의 삽입결실(indel) 형성을 유발하는 방법.
제1항 내지 제243항 중 어느 한 항에 있어서, A 핵염기의 탈아미노화 효율이 적어도 5%인 방법.
제244항에 있어서, A 핵염기의 탈아미노화 효율이 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95% 또는 98%인 방법.
(a) (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) DNA 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 포함하는 염기 편집제 융합 단백질을 코딩하는 핵산 서열;
및
(b) 가이드 RNA 또는 가이드 RNA를 코딩하는 발현 구축물
을 포함하며, 여기서 가이드 RNA는
(i) HBG1 및/또는 HBG2 유전자의 프로모터;
(ii) HFE 유전자;
(iii) HBB 유전자; 또는
(iv) F8 유전자
의 센스 또는 안티센스 가닥 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 핵산 구축물을 포함하는 키트.
제246항에 있어서, 표적 핵산 서열이 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열인 키트.
제247항에 있어서, 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
제248항에 있어서, 표적 핵산이 제238항에 열거된 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 키트.
제247항 내지 제249항 중 어느 한 항에 있어서, 프로모터 내의 표적 핵산 서열이 핵산 서열
를 포함하는 것인 키트.
제246항에 있어서, 표적 핵산 서열이 HFE 유전자 내의 핵산 서열인 키트.
제250항에 있어서, HFE 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
제251항에 있어서, 표적 핵산이 제241항에 열거된 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 키트.
[청구항 253]
제250항 내지 제252항 중 어느 한 항에 있어서, HFE 유전자 내의 표적 핵산 서열이 핵산 서열
를 포함하는 것인 키트.
제246항에 있어서, 표적 핵산 서열이 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열인 키트.
제254항에 있어서, 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
제256항에 있어서, 표적 핵산 서열이 HBB 유전자 내의 핵산 서열인 키트.
제256항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
제246항에 있어서, 표적 핵산 서열이 F8 유전자 내의 핵산 서열인 키트.
제258항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
(i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
(i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
(i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
(i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
(i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
하기 핵산 서열을 포함하는 가이드 RNA (sgRNA).
제265항에 있어서, 단일-가이드 RNA (sgRNA)인 가이드 RNA.
제265항 또는 제266항의 가이드 RNA를 코딩하는 핵산.
제267항의 핵산을 포함하는 벡터.
제268항에 있어서, 가이드 RNA의 발현을 구동하는 이종 프로모터를 포함하는 벡터.
제260항 또는 제264항의 복합체; 제265항 또는 제266항의 가이드 RNA; 제267항의 핵산; 또는 제268항 또는 제269항의 벡터를 포함하는 제약 조성물.
제270항에 있어서, 제약상 허용되는 부형제를 추가로 포함하는 제약 조성물.
제270항 또는 제271항에 있어서, 양이온성 지질 또는 양이온성 중합체를 추가로 포함하는 제약 조성물.