KR20130111219A

KR20130111219A - 신규 dna 결합 단백질 및 이의 용도

Info

Publication number: KR20130111219A
Application number: KR1020127032393A
Authority: KR
Inventors: 필립 디. 그레고리; 제프리 씨. 밀러; 데이비드 파스촌; 에드워드 제이. 레바르; 슈왠 탄; 표도르 우르노브; 레이 장
Original assignee: 상가모 바이오사이언스 인코포레이티드
Priority date: 2010-05-17
Filing date: 2011-05-17
Publication date: 2013-10-10
Also published as: CN103025344A; US20170016030A1; JP6208580B2; CA2798988A1; US11661612B2; IL222961A0; US9322005B2; EP2571512A4; US20110301073A1; EP2571512B1; KR101953237B1; US8912138B2; US9783827B2; US20180010152A1; IL222961B; AU2011256838A1; US20190169640A1; US9493750B2; AU2011256838B2; CN103025344B

Abstract

본원은 폴리펩타이드, 폴리뉴클레오타이드 인코딩, 세포 및 TALE DNA 결합 도메인을 포함하는 신규 DNA 결합 도메인을 포함하는 유기체를 개시한다. 내인성 세포 서열의 유전자 발현 조절 및/또는 게놈 편집을 위한 이들 신규 DNA 결합 도메인을 사용하는 방법을 또한 개시한다.

Description

신규 DNA 결합 단백질 및 이의 용도 {NOVEL DNA-BINDING PROTEINS AND USES THEREOF}

관련 출원에 대한 상호참조

본원은 2010년 5월 17일에 출원된 미국 가출원 제61/395,836호; 2010년 8월 12일에 출원된 제61/401,429호; 2010년 10월 13일에 출원된 제61/455,121호; 2010년 12월 20일에 출원된 제61/459,891호; 2011년 2월 2일에 출원된 제61/462,482호; 2011년 3월 24일에 출원된 제61/465,869호의 이익을 주장하며, 이의 전문이 본원에 참고로써 통합되어 있다.

연방 지원 연구 하에 이뤄진 발명에 대한 권리의 진술

해당 없음.

기술분야

본 발명은 조작된 DNA 결합 단백질을 이용하여 내인성 유전자 및 다른 게놈 좌위(locus)의 발현 상태를 유전적으로 변형시키고 조절하는 방법을 제공한다.

많은, 아마도 대부분의 생리학적 및 병리생리학적 과정들은 유전자 발현의 선택적인 상향 또는 하향조절에 의해 제어될 수 있다. 선택적인 조절에 의해 제어될 수 있는 병리학의 예는, 몇 가지 열거하면, 류마티스 관절염에서 염증유발(proinflammatory) 사이토카인의 부적절한 발현, 고콜레스테롤혈증에서 간 LDL 수용체의 저발현, 고체 종양 성장에서 혈관신생유발 인자(proangiogenic factor)의 과발현 및 혈관신생억제 인자의 저발현을 포함한다. 또한, 바이러스, 세균, 진균, 및 원생생물과 같은 병원체들은 이들의 숙주 세포의 유전자 발현을 변화시킴으로써 제어될 수 있다. 따라서, 간단하게 유익한 유전자를 상향조절하고 질병을 일으키는 유전자를 하향조절할 수 있는 치료 접근법에 대해 충족되지 않은 명확한 요구가 존재한다.

또한, 선택된 유전자의 선택적인 과발현 및 저발현을 가능하게 하는 간단한 방법이 과학계에 대단히 유용할 것이다. 세포 모델 시스템, 형질전환 동물 및 형질전환 식물에서 유전자 조절을 가능하게 하는 방법이 학계의 연구소, 제약 회사, 게놈 회사 및 생명공학 산업에서 광범위하게 사용될 것이다.

유전자 발현은 보통 전사 인자라 불리는 서열 특이적 DNA 결합 단백질의 기능 변화를 통해 제어된다. 이들은 프로모터에서의 전사 개시 복합체의 형성 또는 기능의 효율에 영향을 미치는 작용을 한다. 전사 인자는 긍정적인 방식(활성화) 또는 부정적인 방식(억제)으로 작용할 수 있다.

전사 인자 기능은 구성적(항상 "진행중") 또는 조건적일 수 있다. 조건적 기능은 다양한 수단에 의해 전사 인자에게 부여될 수 있지만, 이들 조절 기전의 대부분은 세포질에서의 상기 인자의 격리 및 유도성 방출 및 이후 핵 전좌(nuclear translocaton), DNA 결합 및 활성화(또는 억제)에 의존한다. 이러한 방식으로 기능하는 전사 인자의 예는 프로게스테론 수용체, 스테롤 반응 요소 결합 단백질(SREBP) 및 NF-카파 B를 포함한다. 이들의 동족 DNA 인식 서열에 결합하는 능력을 변화시킴으로써 인산화 또는 소분자 리간드에 반응하는 전사 인자들의 예가 있다(Hou et al., Science 256:1701 (1994); Gossen & Bujard, Proc . Nat'l Acad Sci 89:5547 (1992); Oligino et al., Gene Ther. 5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al., Blood 88:1147-1155 (1996); and Rendahl et al., Nat . Biotechnol. 16:757-761 (1998)).

아연 핑거 단백질("ZFP") 유래의 DNA 결합 도메인을 포함하는 재조합 전사 인자들은 내인성 유전자의 유전자 발현을 조절하는 능력을 갖는다(예컨대, 미국 특허 제6,534,261호; 제6,599,692호; 제6,503,717호; 제6,689,558호; 제7,067,317호; 제7,262,054호 참조). 이러한 아연 핑거 단백질을 함유하는 조작된 전사 인자를 이용한 임상 시험들은 이들 신규 전사 인자들이 다양한 질환을 치료할 수 있음을 보여주었다(예컨대, 문헌[Yu et al. (2006) FASEB J. 20:479-481] 참조).

게놈 생물학에서 또 다른 주된 관심 분야는, 특히 수많은 게놈의 전체 뉴클레오티드 서열의 결정에 비추어 볼 때, 게놈 서열의 표적화된 변화이다. 그러한 표적화된 절단 사건은, 예를 들어, 표적화된 돌연변이 형성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 미리 결정된 염색체 좌위에서의 표적화된 재조합을 촉진하는데 사용될 수 있다. 예를 들어, 미국 특허공보 제20030232410호; 제20050208489호; 제20050026157호; 제20050064474호; 제20060188987호; 제2008015996호, 및 국제공개 제WO 2007/014275호를 참조하며, 이들의 전문이 모든 목적을 위해 참조로써 본원에 통합되어 있다. 또한, 문헌[Santiago et al. (2008) Proc Natl Acad Sci USA 105:5809-5814; Perez et al. (2008) Nat Biotechnol 26:808-816 (2008)]을 참조한다.

설계된 DNA-결합 단백질(예컨대, FokI으로부터와 같은 뉴클레아제 절단 도메인에 연결된 아연-핑거 단백질(ZFP))에 뉴클레아제의 절단 도메인을 연결시키는 인공 뉴클레아제가 진핵 세포에서의 표적화된 절단을 위해 사용되어 왔다. 예를 들어, (1) 살아있는 세포의 게놈 내에, 특히 목적하는 변형을 위한 표적 부위에 이중 가닥 파손(double-strand break, DSB)을 생성함으로써, 그리고 (2) 자연적인 DNA 수선 기전을 통해 이 절단을 "치유"함으로써, 아연 핑거 뉴클레아제-매개의 게놈 편집(genome editing)이 특정 위치에 있는 인간 게놈의 서열을 변형시키는 것으로 나타났다.

특이성을 증가시키기 위해, 상기 절단 사건은, DNA 결합시 이량체화되어 촉매적으로 활성인 뉴클레아제 복합체를 형성하는 한 쌍 이상의 주문 설계된(custom-designed) 아연 핑거 뉴클레아제들을 이용하여 유도된다. 또한, 특이성은, 이종이량체(heterodimer)의 형성시에만 이중-가닥의 DNA를 절단하는 조작된 절단 절반-도메인(cleavage half-domain)을 포함하는 한 쌍 이상의 아연 핑거 뉴클레아제들을 이용하여 더 증가되었다. 예컨대, 전문이 참조로써 본원에 통합되어 있는, 미국 특허공개 제20080131962호를 참조한다.

인공 뉴클레아제에 의해 생성된 이중-가닥의 파손(DSB)은, 예를 들어 표적화된 돌연변이 형성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 미리결정된 염색체 좌위에서 표적화된 재조합을 촉진하기 위해 사용되어 왔다. 예를 들어, 모든 목적을 위해 전문이 참고로써 본원에 통합되어 있는, 미국 특허 공개 제20030232410호; 제20050208489호; 제20050026157호; 제20050064474호; 제20060188987호; 제20060063231호; 제20070218528호; 제20070134796호; 제20080015164호 및 국제 공개 제WO 07/014275호 및 제WO 2007/139982호를 참조한다. 따라서, 표적 게놈 위치에서 DSB를 생성하는 능력은 임의의 게놈의 게놈 편집을 가능하게 한다.

DSB를 수선하는 두 가지 주요한 별개의 경로인, 상동 재조합 및 비상동 말단-결합(NHEJ)이 존재한다. 상동 재조합은 세포 수선 과정을 가이드하는 주형("공여체(donor)"로 알려짐)으로서 상동 서열의 존재를 필요로 하며, 상기 수선의 결과는 오류가 없으며 예측가능하다. 상동 재조합을 위한 주형(또는 "공여체") 서열이 없는 경우, 세포는 통상적으로 오류가 발생하기 쉬운 NHEJ 과정을 통해 DSB를 수선하고자 시도한다.

잔토모나스 속의 식물 병원균은 중요한 작물에서 많은 질병을 유발하는 것으로 알려져 있다. 잔토모나스의 병원성은 25개가 넘는 상이한 효과기 단백질(effector protein)을 식물 세포 내로 주입하는 보존된 제III형 분비(T3S) 시스템에 의존한다. 이들 주입된 단백질 중에는 전사 활성자-유사 효과기(transcription activator-like effector) "TALE" 또는 "TAL-효과기"가 있는데, 이는 식물 전사 활성자를 모방하여 식물 전사체를 조작한다(Kay et al (2007) Science 318:648-651 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 가장 잘 규명된 TALE 중 하나는 잔토모나스 캄페스트리스(Xanthomonas campestris pv. Vesicatoria) 유래의 AvrBs3이다(Bonas et al (1989) Mol Gen Genet 218: 127-136 및 제WO 2010079430호 참조). TALE는 DNA 인식을 매개하는 집중화된 반복 도메인(centralized repeat domain)을 함유하며, 각 반복 단위는 한 개의 표적 염기를 지정하는 대략 33-35개의 아미노산을 함유한다. TALE는 또한 핵 위치 서열(nuclear localization)과 몇 가지 산성 전사 활성화 도메인을 함유한다(검토를 위해, 문헌[Schornack S, et al (2006) J Plant Physiol 163(3): 256-272]을 참조한다). 또한, 식물병원성 박테리아 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, brg11 및 hpx17로 명명된 2개의 유전자들이 랄스토니아 솔라나세아룸 생물변이형 1 균주 GMI1000 및 생물변이형 4 균주 RS1000에서의 잔토모나스의 AvrBs3 패밀리에 상동인 것으로 확인되었다(문헌[Heuer et al (2007) Appl and Envir Micro 73(13): 4379-4384] 참조). 이들 유전자들은 뉴클레오티드 서열이 서로 98.9% 동일하지만, hpx17의 반복 도메인 내에 1,575 bp가 결손된 점이 상이하다. 하지만, 두 유전자 산물들은 잔토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다.

이들 TALE의 DNA-결합 특이성은 일렬(tandem) TALE 반복 단위에서 발견되는 서열에 의존한다. 상기 반복된 서열은 대략 33-35개의 아미노산을 포함하며 상기 반복은 통상적으로 서로 91-100% 상동이다(전술한 Bonas et al). 위치 12 및 13에 있는 초가변 이잔기(diresidue)의 신원(identity)과 TALE의 표적 서열 내의 인접 뉴클레오티드의 신원 사이에는 1 대 1 대응하는 것으로 보인다(문헌[Moscou and Bogdanove, (2009) Science 326:1501 and Boch et al (2009) Science 326:1509-1512] 참조). 이들 2개의 인접한 아미노산들은 반복 가변 이잔기(Repeat Variable Diresidue, RVD)라 불린다. 실험적으로, 위치 12 및 13에 있는 HD 서열이 시토신(C)에 결합하게 하고, NG가 T에 결합하고, NI가 A에 결합하고, NN이 G 또는 A에 결합하고, NG가 T에 결합하도록, 이들 TALE의 DNA 인식을 위한 천연 코드가 결정된다. 이러한 특이성을 결정하는 TALE 반복 단위들은 천연 TALE 반복 단위들과 변화된 수의 반복이 새롭게 조합된 단백질로 조립되어, 변이형 TALE 단백질을 만들어 왔다. 이들 변이형들이 이들의 본래의 구조 내에 있는 경우, 이들은 새로운 서열과 상호작용하고 식물 세포 내의 리포터 유전자의 발현을 활성화시킬 수 있다(전술한 Boch et al). 하지만, 이들 단백질은 본래의(전장) TALE 단백질 구조를 유지하며, 상기 컨스트럭트 내의 TALE 반복 단위의 수와 동일성만이 변화되었다. 또한 전체 또는 거의 전체 TALE 단백질이 FokI 단백질 유래의 뉴클레아제 도메인에 융합되어 TALE-뉴클레아제 융합 단백질("TALEN")을 생성하였으며, 이들 TALEN이 효모 세포에서 에피솜 리포터 유전자를 절단하는 것으로 나타났다(Christian et al . (2010) Genetics 186(2): 757-61; Li et al . (2011a) Nucleic Acids Res . 39(1):359-372). 또한 적절한 서열 증폭 계획이 사용되는 경우, 이러한 컨스트럭트들은 효모 세포에서 내인성 유전자를 정량화할 수 있는 수준까지 변형시키며, 포유동물 및 식물 세포에서 내인성 유전자를 검출가능하지만 정량화할 수 없는 수준까지 변형시킬 수 있다. 문헌[Li et al. (2011b) Nucleic Acids Res . epub doi:10.1093/nar/gkr188; Cermak et al .(2011) Nucleic Acids Res . epub doi:10.1093/nar/gkr218]을 참조한다. 식물과 동물 세포에서의 활성을 검출하기 위해 2단계 농축 계획(enrichment scheme)이 필요하였다는 사실은 거의 전체 TALE 단백질 및 FokI 단백질 유래의 뉴클레아제 도메인 간의 융합이 식물과 동물 세포에서 내인성 유전자를 효과적으로 변형시키지 못한다는 것을 보여준다. 즉, TALE 반복 배열을 FokI 절단 도메인에 연결하기 위해 이들 연구에 사용된 펩타이드들은 고등 진핵생물에서 내인성 유전자의 FokI 도메인에 의한 효과적인 절단을 허용하지 못한다. 그러므로, 이들 연구는 TALE 배열을 뉴클레아제 도메인과 연결하는데 사용될 수 있는, 내인성 진핵생물 환경에서 대단히 유효한 절단을 허용할 조성물을 개발할 필요성을 강조한다.

다양한 세포 유형에서 내인성 유전자를 조절하기 위한 조작된 전사 인자를 포함하는 다양한 적용분야를 위한 이들 결합 단백질의 범위, 특이성 및 유용성을 증가시키기 위한 조작된 DNA 결합 도메인, 및 수많은 모델, 진단 및 치료 시스템, 및 모든 방식의 게놈 조작 및 편집 적용에서 유사하게 사용될 수 있는 조작된 뉴클레아제가 여전히 요구된다.

발명의 요약

따라서 본 발명은 내인성 위치의 발현 상태 또는 서열의 표적 조작의 방법을 제공한다. 본 발명의 일부 구현예에서, 본 발명의 방법은 조작된 전사 인자, 조작된 뉴클레아제 ("TALEN"), 재조합효소, 전이효소, 인테그라아제, 메틸라아제, 효소 도메인 및 리포터를 형성하도록, 기능적 단백질 도메인에 융합된 TALE-반복 단위 (집합적으로 "TALE-융합")의 하나 이상을 포함하는 DNA 결합 단백질을 사용한다. 일부 측면에서, 폴리펩타이드는 내인성 표적 DNA에서 유능한 및 특이적 기능을 위해, 추가 TALE 단백질 서열에 연결된 TALE 반복 단위의 적어도 하나를 포함한다. TALE 반복 도메인 N-및 임의로 C-말단에 연결된 이들 추가 서열은 또한 "N-캡" 및 "C-캡" 서열로 불린다. 따라서, 본 발명은 하나 이상의 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20 이상의) TALE 반복 및/또는 반-반복 단위를 포함하는 폴리펩타이드를 제공한다.

따라서, 일 측면에서, 본원에서 TALE 반복 단위의 적어도 하나 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 이상의 반복 단위(들))를 포함하는 DNA 결합 폴리펩타이드가 제공된다. 폴리펩타이드는 전형적으로 TALE 반복(들)의 DNA 결합 기능 또는 TALE 융합 단백질의 기능적 활성을 지지하는 임의의 길이의 N-캡 서열 (폴리펩타이드)를 포함한다. 임의로, 폴리펩타이드는 또한 C-캡 서열 (폴리펩타이드), 예를 들면 대략 250 미만의 아미노산 (C+230 C-캡; 잔기 C-20 내지 잔기 C+230)의 C-캡 서열을 포함할 수 있다. 또한, 특정 구현예에서, 본원에 기재된 TALE 폴리펩타이드의 TALE 반복 단위의 적어도 하나는 비전형적인 반복 가변 2잔기 (RVD) 영역를 포함한다. TALE 반복 단위는 Xanthomonas, Ralstonia 또는 또 하나의 관련 박테리아로부터 단리된 야생형 도메일일 수 있고/있거나 일부 방식으로 조작될 수 있다 (예를 들면, 비-천연 발생일 수 있다). 특정 구현예에서, TALE 반복 단위의 적어도 하나는 조작된다 (예를 들면, 비-천연 발생, 비전형적인, 최적화 코돈, 이들의 조합 등). 특정 구현예에서, TALE 반복 도메인에서의 하나 이상의 아미노산 (예를 들면, TALE 반복들 중의 하나 내의 RVD)는, 도메인이 (천연 발생 TALE DNA 결합 도메인에 의해 결합된 표적 서열로부터 전형적으로 상이한) 선택된 표적 서열에 결합되도록 변경된다. 다른 구현예에서, TALE 반복 단위의 적어도 하나는 TALE 반복 단위 내의 위치 4, 11, 12, 13 또는 32에서 아미노산의 일부 또는 모두에서 변형된다. 일부 구현예에서, TALE 반복 단위의 적어도 하나는 TALE 반복들 중의 하나 내에 위치 2, 3, 4, 11, 12, 13, 21, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 또는 35에서 아미노산의 하나에서 변형된다. 다른 구현예에서, TALE 반복을 인코딩하는 핵산은, DNA 서열이 변경되지만 아미노산 서열이 아니도록 변형된다. 일부 구현예에서, DNA 변형은 코돈 최적화의 목적을 위한 것이다. 추가 구현예에서, TALE 반복 단위의 적어도 하나는 상기 기재된 변형의 조합에 의해 변경된다. 일부 구현예에서, 몇 개의 변형된 TALE 반복 단위를 포함하는 TALE 단백질이 제공된다. 천연 발생 및 비-천연 발생 TALE 반복 단위의 조합이 또한 제공된다. 바람직한 구현예에서, TALE 단백질 (야생형 또는 조작된)은 추가로, 내인성 표적 DNA에서 유능하고 특이적인 기능을 위해 N-캡 및 임의로 C-캡 서열을 포함한다. 일부 구현예에서, N-캡은 잔기 N+1 내지 N+136 (참고 잔기 넘버링 도식의 설명을 위한 도 1b), 또는 그의 임의의 단편을 포함한다. 다른 구현예에서, C-캡은 잔기 C-20 내지 C+28, C-20 내지 C+39, C-20 내지 C+55, 또는 C-20 내지 C+63 또는 그의 전체 길이 TALE C-말단의 임의의 단편. 특정 구현예에서, TALE 반복 도메인, 뿐만 아니라 N-캡 및 임의의 C-캡 서열을 포함하는 폴리펩타이드는 추가로, 조절 또는 기능적 도메인, 예를 들면, 전사 활성제, 전사 억제제, 뉴클레아제, 재조합효소, 전이효소, 인테그라아제, 메틸라아제 등을 포함한다.

이들 단백질을 인코딩하는 폴리뉴클레오타이드는 또한 약제학적 조성물로서 제공된다. 또한, 본 발명은 이들 단백질/폴리뉴클레오타이드을 포함하고/하거나 이들 단백질 (예를 들면, 자손에게 이전된 게놈 변형)에 의해 변형된 숙주세포, 세포주 및 이식유전자 유기체 (예를 들면, 식물, 진균류, 동물)을 포함한다. 예시적인 세포 및 세포주는 동물 세포 (예를 들면, 인간, 세포, 예컨대 줄기세포를 포함하는 포유동물), 식물 세포, 박테리아 세포, 원생동물 세포, 물고기 세포, 또는 진균 세포를 포함한다. 또 하나의 구현예에서, 세포는 포유동물 세포이다. 이들 단백질 및/또는 폴리뉴클레오타이드를 제조하고 사용하는 방법이 또한 제공된다.

일 측면에서, 하나 이상의 비상동 폴리펩타이드 도메인, 예를 들면 기능적 (조절) 도메인에게 작동가능하게 연결된 하나 이상의 조작된 TALE 반복 단위, N-캡, 및 임의의 C-캡 서열을 포함하는 융합 단백질이 본원에서 제공된다. TALE 반복의 모듈을 포함하는 라이브러리는, 조작된 TALE 반복을 관심 기능적 단백질 도메인에 연결시키기 위해 임의 구조로 되거나 유연한 링커로서 제공된다. 기능적 단백질 도메인 (예를 들면, 전사 활성제, 억제제, 또는 뉴클레아제)는 융합 단백질의 C-또는 N-말단에서 위치할 수 있다. 본원에 기재된 융합 단백질을 제조하는 방법이 또한 제공된다.

본 발명은 또한 조작된 TALE 융합 단백질에 대한 적당한 표적 서열 (부위)을 확인하는 방법을 제공한다. 일부 구현예에서, 확인된 표적 부위는 천연 TALE 표적 서열과 비교하여 구아닌 뉴클레오타이드 ("G")의 증가된 수를 갖는다. 다른 구현예에서, 표적은 천연 발생 TALE 단백질에서는 전형적인 바와 같이 피미딘 뉴클레오타이드 ("T")를 플랭킹(flanking)하는 것을 필요로 하지 않는다. 일부 구현예에서, 조작된 TALE 단백질에서 사용하기 위해 선택된 RVD는 표적 서열에서 G 뉴클레오타이드의 인식을 위해 하나 이상의 NK (아스파라긴 - 리신) RVD를 함유한다. 이 발명은 신규 (비-천연 발생) RVD를 추가로 제공하고, 이는 뉴클레오타이드 염기를 인식할 수 있는 본성에서 발견된 것과는 상이하다. 비전형적인 또는 비-천연 발생 RVD (TALE 반복 단위의 위치 12 및 13에서 아미노산 서열)의 비제한적인 예는 표 30a에서 보여진 RVD, 예를 들면, T를 인식하기 위한 VG 및 IA, A 및 T를 인식하기 위한 RG, 및 A, C, 및 T를 인식하기 위한 AA를 포함한다. 또한 모든 뉴클레오타이드 염기 (예를 들면, A, C, T, 및 G)와 동등하게 상호작용할 수 있는 RVD가 제공된다. 본원에 기재된 조성물 및 방법에서 유용한 추가 RVD가 표 27에서 보여진다.

본 발명에 의해 또한 제공된 방법은 사용자의 선택에 의해, TALE-뉴클레아제 ("TALEN") 헤테로다이머에 의해 변형이 수행된 핵산 상의 2개의 표적 부위 사이의 거리 또는 갭 간격을 억제하거나 억제하기 않는다. 일부 구현예에서, 갭 간격은 12-13 염기쌍으로 억제되고, 한편 다른 구현예에서, 조작된 TALEN은 12 내지 21개의 염기쌍이 갭 간격을 포함하는 DNA 표적들을 절단하도록 디자인된다. 일부 구현예에서, TALEN 헤테로다이머는 각 모노머 결합 부위 사이의 1 내지 34개의 뉴클레오타이드의 갭을 포함하는 서열을 절단하도록 디자인된다. 또 더 많은 구현예에서, TALEN은 +28 C-말단 절단 (C+28 C-캡)을 포함하는 TALEN 구성을 이용하여 12 또는 13개의 염기쌍 갭을 갖는 표적을 절단하도록 억제된다. 다른 구현예에서, 설계된 TALEN은 +63 C-말단 절단을 포함하는 TALEN 구성을 사용하여 12 내지 21개의 염기쌍 갭 간격을 포함하는 표적 핵산을 절단하도록 만들어지고, 이는 갭 간격 요건에서의 적응성에 기인하여 적당한 TALEN 표적 부위를 확인할 수 있는 가능성을 증가시킨다. 일부 구현예에서, TALEN은, R1/2 반복이 T 이외의 뉴클레오타이드 염기를 표적으로 할 수 있도록 조작된 R1/2 반복을 갖는다.

또 하나의 측면에서, 본 발명은 조작된 TALE DNA 결합 도메인 융합을 위한 벡터를 제공하고, 여기서 상기 벡터는 다중 TALE 반복 단위, 링커 서열, 프로모터, 선택성 마커, 폴리아데닐화 신호 부위, 기능적 단백질 도메인 등의 클로닝을 허용하도록 TALE 반복 서열을 플랭킹하는 TALE N-캡 및 C-캡 서열 뿐만 아니라 위치를 포함한다. 본원에 의해 또한 제공된 발명은 특이적 TALE DNA 결합 도메인 도메인 및 이들 도메인 (예를 들면, TALEN)을 포함하는 융합 단백질의 준비된 어셈블리를 위한 적어도 하나의 TALE-반복 단위 (예를 들면, 조작된)를 포함하는 모듈 아르키브 라이브러리의 구성하는 방법이다.

또 하나의 측면에서, 본 발명은 세포에서 내인성 세포 유전자의 발현를 조절하는 방법을 제공하고, 상기 방법은 하기 단계들을 포함한다: 내인성 세포 유전자에서의 제1 표적 부위를 기능적 도메인 (예를 들면, 전사 조절자 도메인)에 융합된 제1 조작된 TALE와 접촉시켜, 내인성 세포 유전자의 발현을 조절하는 단계. 또 하나의 측면에서, 본 발명은 세포에서 내인성 세포 유전자의 발현을 조절하는 방법을 제공하고, 상기 방법은 하기 단계들을 포함한다: 내인성 세포 유전자에서의 표적 부위를 융합 TALE 단백질과 접촉시키는 단계로서, 상기 TALE는, TALE가 원하는 서열에 대해 특이성을 갖도록 조작된 TALE 반복 도메인을 포함하는 단계. 일부 구현예에서, 조절 효과는 내인성 유전자의 발현을 활성화하는 것이다. 일부 구현예에서, 내인성 유전자의 발현이 억제된다. 또 하나의 구현예에서, 내인성 유전자의 활성화 또는 억제는, 내인성 활성제 또는 억제제가 관심 유전자의 조절자 영역에 결합되수 없도록 TALE 융합 단백질의 결합에 의해 조절된다.

일 구현예에서, 접촉 단계는 추가로, 내인성 세포 유전자에서의 제2 표적 부위를 제2 조작된 TALE 융합 단백질과 접촉시켜서 제2 내인성 세포 유전자의 발현을 조절하는 것을 포함한다. 또 하나의 구현예에서, 제1 및 제2 표적 부위는 인접되어 있다. 특정 구현예에서, 제1 및 제2 표적 부위는, 예를 들면 TALE-전사 인자를 사용하여 2개 이상의 유전자의 발현을 조절하기 위해 상이한 유전자에 있다. 다른 구현예에서, 제1 및 제2 표적 부위는, 예를 들면 한 쌍의 TALEN 융합 단백질이 동일한 유전자에서 절단하도록 사용될 때 동일한 유전자에 있다. 제1 및 제2 표적 부위는 임의의 염기쌍 ("갭 크기"), 예를 들면, 1 내지 20 (또는 그 사이의 임의의 수) 또는 더 많은 염기쌍에 의해 분리된다. 또 하나의 구현예에서, 접촉 단계는 추가로, 2개 초과의 표적 부위를 접촉시키는 것을 포함한다. 특정 구현예에서, 2개 세트의 표적 부위는 2개의 쌍의 TALEN에 의해 접촉되고, 2개 세트의 표적에서 특이적 결실 또는 삽입을 만들기 위해 사용된다. 또 하나의 구현예에서, 제1 TALE 단백질은 조절 또는 기능적 도메인을 포함하는 융합 단백질이다. 또 하나의 구현예에서, 제1 TALE 단백질은 적어도 2개의 조절 또는 기능적 도메인을 포함하는 융합 단백질이다. 또 하나의 구현예에서, 제1 및 제2 TALE 단백질은 융합 단백질이고, 각각은 조절 도메인을 포함한다. 또 하나의 구현예에서, 제1 및 제2 TALE 단백질은 융합 단백질이고, 이들 각각은 적어도 2개의 조절 도메인을 포함한다. 하나 이상의 기능적 도메인은 TALE 단백질의 말단 중 하나 (또는 둘 모두)에 융합될 수 있다. 임의의 TALE 융합 단백질은 이들 단백질을 인코딩하는 폴리뉴클레오타이드로서 제공될 수 있다.

또 하나의 측면에서, 본 발명은 뉴클레아제 도메인을 본원에 기재된 TALE 반복 도메인에 연결하는 C-캡을 위한 조성물을 제공하고, 여기서 상기 수득한 융합 단백질은 고활성 뉴클레아제 기능을 나타낸다. 일부 구현예에서, C-캡은 천연 TALE C-말단 측면 서열로부터 펩타이드 서열을 포함한다. 다른 구현예에서, C-캡은 TALE 반복 도메인으로부터 펩타이드 서열을 포함한다. 또 하나의 구현예에서, C-캡은 TALE 단백질로부터 유래되지 않는 서열을 포함한다. C-캡은, 예를 들면 천연 TALE C-말단 측면 서열 및/또는 TALE 반복 도메인으로부터의 펩타이드 서열 및/또는 비-TALE 폴리펩타이드을 포함하는 키메라 구조를 또한 나타낼 수 있다.

본원에 기재된 임의의 조성물 또는 방법에서, 조절 또는 기능적 도메인은 전사 억제제, 전사 활성제, 뉴클레아제 도메인, DNA 메틸트랜스페라제, 단백질 아세틸트랜스페라제, 단백질 데아세틸라제, 단백질 메틸트랜스페라제, 단백질 데아미나제, 단백질 키나아제, 및 단백질 포스파타제로 이루어진 그룹으로부터 선택될 수 있다. 일부 측면에서, 기능적 도메인은 후생유전 조절자이다. 식물에서, 그와 같은 TALE 융합은 표준 기술을 사용하여 이종교배에 의해 제거될 수 있다. 그와 같은 구현예에서, 융합 단백질은 비-제한적 예로서, 히스톤 메틸트랜스페라제, DNA 메틸트랜스페라제, 또는 히스톤 데아세틸라제와 같은 후생유전 조절자를 포함한다. 참고 예를 들면, 공유 미국 특허 7,785,792.

따라서, 일부 측면에서, TALE 융합 단백질은 뉴클레아제 도메인에 융합된 TALE-반복 도메인 ("TALEN")을 포함한다. 상기 언급한 바와 같이, 일부 구현예에서, TALE 반복 도메인은 N-캡 서열, 및 임의로, C-캡 서열에 추가로 융합된다. 다른 구현예에서, 뉴클레아제 도메인은 뉴클레아제 도메인의 유능한 촉매 기능을 제공하는 링커 펩타이드 서열을 통해 N-캡의 아미노 말단 또는 C-캡의 카복시 말단에 연결된다. 뉴클레아제 도메인은 천연 발생일 수 있거나 조작된 또는 비-천연 발생일 수 있다. 일부 구현예에서, 뉴클레아제 도메인은 유형 IIS 뉴클레아제 (예를 들면, FokI)으로부터 유래된다. 다른 구현예에서, TALE DNA 결합 도메인은 Bfi I 뉴클레아제 도메인에 작동가능하게 연결된다. 일부 구현예에서, FokI 도메인은 2개의 절단 하프도메인을 포함하는 단일 사슬 뉴클레아제 도메인이고, 다른 것에서, FokI 절단 하프도메인이다. 본 발명의 일부 측면에서, 단일 TALEN 단백질은 표적 DNA에서 이중가닥 절단을 유도하기 위해 자체로 사용되고, 한편 다른 것에서, TALEN은 한 쌍의 뉴클레아제의 일부로서 사용된다. 일부 구현예에서, 상기 쌍은 FokI 하프도메인을 포함하는 2개의 TALEN을 포함하고, 여기서 FokI 하프도메인의 상기 접합은 DNA 절단을 달성하기 위해 필요하고, 한편 다른 경우에, TALEN 단백질은 아연-핑거 뉴클레아제와 조합하여 사용되고, 여기서 2개의 FokI 절단 도메인의 접합은 DNA 절단을 달성하기 위해 필요하다. 일부 구현예에서, TALE DNA 결합 도메인은 아연 핑거/TALE 하이브리드 DNA 결합 도메인을 만들기 위해 아연 핑거에 융합된다. 일부 예에서, 하이브리드 DNA 결합 도메인은 DNA 표적 결합 부위 내의 DNA 염기의 내부 스트래치(stretch)와의 상호작용을 건너뛸 수 있다. 일부 구현예에서, FokI 도메인은 호모다이머를 형성할 수 있고, 다른 예들에서, TALEN 쌍의 각 수로부터 2개의 비-확인된 FokI 절단 도메인의 헤테로다이머화는 표적화된 절단 활성에 필요하다. 이들 헤테로다이머 TALEN 쌍에서, 동일한 유형의 2개의 FokI 도메인이 생산적으로 호모다이머화할 수 있는 것은 아니다. 다른 구현예에서, TALEN 쌍이 사용되고, 여기서 1개의 FokI 절단 도메인은 비활성이고, 이로써 접합이 일어날 수 있지만, 표적 DNA은 가닥들 둘 모두를 절단하기 보다는 1개의 가닥의 DNA 분자 상의 절단을 생성하도록 표시된다.

본원에 기재된 임의의 조성물 또는 방법에서, TALE 융합 단백질은 TALE 융합 단백질 핵산에 의해 인코딩될 수 있다. 특정 구현예에서, TALE 융합 단백질은 인코딩하는 서열은 프로모터에 작동가능하게 연결된다. 따라서, 특정 구현예에서, 내인성 유전자 발현 또는 게놈 변형을 조절하는 방법은 추가로, 먼저 TALE 단백질을 인코딩하는 핵산을 세포에 투여하는 단계를 포함한다. TALE-융합 단백질은 발현 벡터, 예컨대 레트로바이러스 발현 벡터, 아데노바이러스 발현 벡터, DNA 플라스미드 발현 벡터, 또는 AAV 발현 벡터로부터 발현될 수 있다. 일부 구현예에서, 발현 벡터는 렌티바이러스 벡터이고, 이들 구현예의 일부에서, 렌티바이러스 벡터는 결함있는 인테그라아제이다.

또한 본 발명에는 임의의 세포 유형에서 임의의 원하는 표적 위치 (예를 들면, 내인성 유전자)에 대해 특이적인 TALEN (예를 들면, TALEN 쌍)이 제공된다. 비-제한적 예는 NTF3, VEGF, CCR5, IL2Rγ, BAX, BAK, FUT8, GR, DHFR, CXCR4, GS, Rosa26, AAVS1 (PPP1R12C), MHC 유전자, PITX3, ben-1, Pou5F1 (OCT4), C1, RPD1 등에 대해 특이적인 TALEN을 포함한다.

본원에 기재된 TALE-반복 도메인은 내인성 세포 유전자의 전사 개시 부위의 상류이거나 그 부위에 인접한 표적 부위에 결합할 수 있다. 대안적으로, 표적 부위는 내인성 세포 유전자의 전사 개시 부위의 RNA 폴리머라제 정지 부위 하류에 인접할 수 있다. 또 추가의 구현예에서, TALE 융합 단백질 (예를 들면, TALEN)는 코딩 영역의 상류 또는 하류로, 유전자, 예를 들면, 선도 서열, 트레일러(trailer) 서열 또는 인트론(intron) 내이거나 그것에 인접하거나, 비-전사된 영역 내의 비-코딩 서열에서의 부위에 결합한다.

또 하나의 측면에서, 세포에서 관심 하나 이상의 유전자를 절단하는 방법이 본원에서 기재되어 있고, 상기 방법은 하기를 포함한다: (a) 세포에, TALEN 단백질(들)이 발현되고 하나 이상의 유전자는 절단되는 조건 하에서 하나 이상의 유전자에서 표적 부위에 결합하는 하나 이상의 TALEN 단백질(들) (또는 TALEN을 인코딩하는 폴리뉴클레오타이드)에 도입하는 단계. 2개 이상의 TALEN 단백질이 도입되는 구현예에서, 하나, 일부 또는 모든 것은 폴리뉴클레오타이드로서 또는 폴리펩타이드로서 도입될 수 있다. 일부 측면에서, 상기 유전자 절단으로 표적화된 유전자의 기능적 분열이 생긴다. 표적화된 DNA의 절단은 NHEJ이 뒤따를 수 있고, 여기서 작은 삽입 또는 결실 (indel)는 절단의 부위에서 삽입된다. 그 다음 이들 indel는 절단 위치에서 비특이적 돌연변이의 도입을 통해 기능적 분열을 멈추게 한다.

또 하나의 측면에서, 외인성 서열을 세포의 게놈에 도입하는 방법에 본원에 기재되어 있고, 상기 방법은 하기 단계들을 포함한다: (a) 세포에, TALEN 단백질(들)기 발현되고 유전자 내의 하나 이상의 표적 부위가 절단되는 조건 하에서 표적 유전자에서 표적 부위에 결합하는 하나 이상의 TALEN 단백질(들) (또는 TALEN을 인코딩하는 폴리뉴클레오타이드 단백질(들))을 도입하는 단계; 및 (b) 상기 세포를 외인성 폴리뉴클레오타이드와 접촉시키는 단계; 이로써 DNA 표적 부위(들)의 절단은 상동 재조합에 의해 외인성 폴리뉴클레오타이드의 게놈으로의 통합을 자극한다. 특정 구현예에서, 외인성 폴리뉴클레오타이드는 게놈에 물리적으로 통합된다. 다른 구현예에서, 외인성 폴리뉴클레오타이드는 이중가닥 절단의 상동 지향성 복구 (HDR)와 연과된 전문화된 핵산 복제 관정을 통해 외인성 서열을 숙주세포 게놈에 복사하여 게놈에 통합된다. 또 다른 구현예에서, 게놈으로의 통합은 비-상동 의존 표적화된 통합 (예를 들면, "말단-포획")을 통해 일어난다. 일부 구현예에서, 외인성 폴리뉴클레오타이드는 동족 재조합효소 (예를 들면, Cre 또는 FRT, 각각)에 의해 인식을 위해 재조합효소 인식 부위 (예를 들면, loxP 또는 FLP)를 포함한다. 특정 구현예에서, 외인성 서열은 작은 동물 (예를 들면, 토끼 또는 설치류, 예컨대 마우스, 랫트 등)의 게놈에 통합된다. 일 구현예에서, TALE-융합 단백질은 전이효소, 재조합효소 또는 인테그라아제를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 구현예에서, TALE 폴리펩타이드가 사용된다. 일부 측면에서, TALE-융합 단백질은 트랜스포사제 또는 인테그라아제를 포함하고, CHO-세포 특이적 전이효소/인테그라아제 시스템의 개발을 위해 사용된다.

일부 구현예에서, TALE-융합 단백질은 메틸트랜스페라제를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 구현예에서, TALE-반복 도메인은 게놈 또는 크로마틴의 후생유전 변형을 초래하도록 기능하는 단백질 복합체의 서브유닛에 융합된다.

또 추가의 구현예에서, 상기 TALE-융합은 추가로, 리포터 또는 선택 마커를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 측면에서, 리포터는 형광 마커이고, 한편 다른 측면들에서, 리포터는 효소이다.

또 하나의 측면에서, 하나 이상의 TALE-융합 단백질을 포함하는 조성물이 본원에 기재되어 있다. 특정 구현예에서, 조성물은 약제학적으로 허용가능한 부형제와 함께 하나 이상의 TALE-융합 단백질을 포함한다. 일부 구현예에서, 조성물은 TALE 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 포함한다. 일부 구현예는 TALEN를 인코딩하는 DNA 분자를 포함하는 조성물을 포함한다. 다른 구현예에서, 조성물은 TALEN를 인코딩하는 RNA 분자를 포함한다. 일부 조성물은 추가로, 핵산 공여체 분자를 포함한다.

또 하나의 측면에서, 본원에 기재된 하나 이상의 TALE-융합 단백질을 인코딩하는 폴리뉴클레오타이드가 기재되어 있다. 폴리뉴클레오타이드는, 예를 들면, mRNA일 수 있다.

또 하나의 측면에서, 프로모터 (예를 들면, 구조적, 유도성, 조직 특이적 등)에 작동가능하게 연결된 본원에 기재된 하나 이상의 TALE-융합 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 TALE-융합 단백질 발현 벡터가 본원에 기재되어 있다.

또 하나의 측면에서, 하나 이상의 TALE-융합 단백질 및/또는 하나 이상의 폴리뉴클레오타이드 (예를 들면, 본원에 기재된 TALE-융합 단백질을 인코딩하는 발현 벡터를 포함하는 숙주세포가 본원에 기재되어 있다. 특정 구현예에서, 숙주세포는 추가로, 벡터를 인코딩하는 아연 핑거 단백질 및/또는 ZFP 중 하나 이상을 포함한다. 숙주세포는 하나 이상의 이들 단백질 발현 벡터를 갖는 안정하게 형질전환되거나 일시적으로 형질감염된 이의 조합일 수 있다. 다른 구현예에서, 하나 이상의 단백질 발현 벡터는 숙주세포에서 1개 또는 융합 단백질을 발현시킨다. 또 하나의 구현예에서, 숙주세포는 추가로, 외인성 폴리뉴클레오타이드 공여체 서열을 포함할 수 있다. 임의의 원핵 또는 진핵 숙주세포가 이용될 수 있고, 이 세포는 비제한적으로, 박테리아, 식물, 물고기, 효모, 조류, 곤충, 벌레 또는 포유동물 세포를 포함한다. 일부 구현예에서, 숙주세포는 식물 세포이다. 다른 측면들에서, 숙주세포는 식물 조직의 일부, 예컨대 식물의 채소부, 보관 기관, 과일, 꽃 및/또는 씨드 조직이다. 추가 구현예에서, 숙주세포는 조류 세포이다. 다른 구현예에서, 숙주세포는 섬유아세포이다. 임의의 구현예에서, 본원에서 기재된 바와 같이, 숙주세포는 줄기세포, 예를 들면 배아 줄기세포를 포함할 수 있다. 줄기세포는 포유동물 줄기세포, 예를 들면, 조혈 줄기세포, 간엽 줄기세포, 배아 줄기세포, 신경 줄기세포, 근육 줄기세포, 간 줄기세포, 피부 줄기세포, 유도만능 줄기세포 및/또는 이들의 조합일 수 있다. 특정 구현예에서, 줄기세포는 인간 유도만능 줄기세포 (hiPSC) 또는 인간 배아 줄기세포 (hESC)이다. 임의의 구현예에서, 본원에서 기재된 바와 같이, 숙주세포는 배아 세포, 예를 들면 하나 이상의 마우스, 랫트, 토끼 또는 다른 포유동물 세포 배아를 포함할 수 있다. 일부 측면에서, 줄기세포 또는 배아 세포는. 예를 들면 돌연변이가 유전성인 생식계열로 통합되는 TALE 매개된 게놈 변형을 갖는 동물을 포함하는 이식 유전자 동물의 개발에 사용된다. 추가 측면에서, 이들 이식유전자 동물은 연구 목적을 위해 사용된 것들, 즉 마우스, 랫트, 토끼이고; 한편 다른 측면들에서, 이식유전자 동물은 가축 동물, 즉 소, 닭, 돼지, 양 등. 또 추가의 측면들에서, 이식유전자 동물은 치료 목적을 위해 사용된 것들, 즉 염소, 소, 닭, 돼지이고; 다른 측면들에서, 이식유전자 동물은 반려 동물, 즉 고양이, 개, 말, 새 또는 물고기이다.

본 발명의 의해 제공된 또 하나의 측면에서 TALE 결합을 위해 적당한 핵산 표적을 확인하는, 방법. 일부 구현예에서, 표적은 전형적인, 천연 발생 TALE 단백질에 의해 사용된 표적 부위에 대한 유사성을 기반으로 선택된다. 다른 구현예에서, 전형적인, 천연 발생 TALE 단백질에 의해 이용되지 않는 표적이 선택되는 것은, 조작된 TALE 단백질이 비전형적인, 표적 서열과 상호작용하도록 하는 방식으로 변경되었기 때문이다. 일부 구현예에서, 이 변경은 비전형적인 (비-천연 발생 또는 희귀한) RVD 서열의 선택을 수반한다. 추가 구현예에서, 사용된 비전형적인 RVD는 원하는 표적 서열에서 G 잔기의 인식을 위한 'NK' RVD이다. 다른 구현예에서, 비-천연 비의 핵산 염기를 함유하는 표적이 선택되는 것은, 조작된 TALE 단백질이 비-천연 비의 핵산 염기와 상호작용하도록 하는 방식으로 변경되었기 때문이다. 일부 구현예에서, 원하는 표적 서열에서 염기의 비는 비정상적인 수의 G 잔기를 포함한다. 다른 구현예에서, 원하는 표적 서열에서 염기의 비는 비정상적인 수의 비전형적인 디-뉴클레오타이드, 트리-뉴클레오타이드 또는 테트라-뉴클레오타이드를 포함한다. TALE-DNA 결합 상호작용을 위한 최고 최적의 표적을 확인하기 위한 디자인 규칙이 또한 제공된다. 이들 규칙은 최적의 디-및 트리-뉴클레오타이드 쌍을 포함하는 표적 부위 서열의 선택에 대한 지침을 제공한다. 또한, 이들 규칙은 또한 덜한 최적의 디-및 트리-뉴클레오타이드 쌍에 대한 지침을 제공하고, 이로써 당업자은 필요하면 이들 서열을 피할 수 있다. 또한 표적 서열의 선택시 더 적응성을 사용자에게 제공하기 위해 모든 뉴클레오타이드와 상호작용할 수 있는 RVD가 제공된다.

일 측면에서, 본 발명은 생체내 게놈 조작을 위한 조성물 및 방법을 제공한다. 특정 구현예에서, TALEN를 인코딩하는 mRNA는 바람직한 특이적 DSB를 도입하기 위해 생식선, 난자 또는 배아에 주입될 수 있다. 일부 구현예에서, 공여체 뉴클레오타이드는 유기체에서 특이적 표적화된 통합을 멈추게 하기 위해 TALEN mRNA와 함께 전달된다.

또 추가 측면에서, 본 발명의 TALE-도메인 단백질 (및 이들 TALE-반복 단백질을 포함하는 융합 단백질)을 포함하는 키트가 본원에 제공된다. 이들 키트는 사용자에 의해 게놈 조작을 쉽게 하기 위해 사용될 수 있고, 이로써 예를 들면, 게놈 내의 원하는 표적 또는 안전한 하버(harbor) 위치를 절단할 TALEN를 제공할 수 있다. TALEN는 핵산 (예를 들면, DNA 또는 RNA)으로서 제공될 수 있거나 단백질로서 제공될 수 있다. 일부 예에서, 단백질은 안정성을 증가시키기 위해 제형될 수 있거나, 건조된 형태로 제공될 수 있다. 일부 예에서, 키트는 진단 목적을 위해 사용된다. 일부 예에서, 키트에 포함된 TALE-융합물은 조절자이다. 일부 예에서, TALE-융합은 리포터를 포함한다.

도 1의 패널 A 및 B는 TALE 단백질을 묘사한다. 도 1a는 TALE 단백질의 도메인 구조의 개요도(일정한 비율로 그려지지 않음)를 보여준다. 'N' 및 'C'는 각각 아미노 및 카르복시 말단을 나타낸다. TALE 반복 도메인, N-캡 및 C-캡이 표시되어 있으며, 이 단백질 내의 N-캡 및 C-캡에 대한 잔기 번호 체계가 나타나 있다. "R0"은 제1 일렬 TALE 반복 앞에 선행하는 34개 아미노산을 나타내며, 이는 TALE 반복 단위와 일부 구조적 상동을 가지며 DNA 표적 서열 내의 티민을 지정할 수 있다. "R₁ _/2"은 C-말단 TALE "절반-반복(half-repeat)"을 나타내며, 이는 통상적인 TALE 반복 중 첫 번째 20개 잔기에 대해 상동성을 갖는 20개의 잔기 펩타이드 서열(잔기가 C-20부터 C-1으로 번호가 매겨짐)이다. NLS는 핵 위치 서열이다. AD는 산성 활성화 도메인이다. 도 1b(SEQ ID NO: 135)는 N-말단 1-152 아미노산 잔기를 결실시키고자 설계된 클로닝 체계를 이용하여 분리된, 클로닝된 자연적인 TALE 단백질(이하 "TALE13"로 지칭함)의 일차 서열을 보여준다. N-캡 및 C-캡은 상기 서열 아래에 짙은 검정색 선으로 나타나 있고, 상기 N-캡 내의 위치 N+1 및 N+136 및 C-캡 내의 위치 C+1 및 C+278이 나타나 있다. 절반 반복은 "C+1"로 나타낸 위치 바로 앞의 C-캡 및 말단의 첫 번째 20개 잔기이다. TALE 반복 및 절반 반복에서 밑줄친 잔기들은 표적 결합 중 상기 반복에 의해 접촉된 DNA 뉴클레오티드를 지정하는 아미노산(RVD)들을 나타낸다.
도 2의 패널 A 및 B는 TALE13(TR13)의 예측된 표적에 사용하기 위한 리포터 컨스트럭트를 보여준다. 도 2a(SEQ ID NO:136)는 벡터 내로 1-4 TR13 표적를 삽입하는데 사용되는 클로닝 부위를 나타낸 리포터 벡터의 개요도를 보여준다. 이탤릭체로 된 영역은 루시퍼라아제 유전자에 대한 프로모터 영역이다. 도 2b(SEQ ID NO:137)는 두 개의 TR13 표적을 함유하는, 사용된 링커 서열을 보여준다.
도 3의 패널 A 및 B는 0-4 TR13 표적을 함유하는 리포터 컨스트럭트의 개요도(도 3a) 및 각각 R13x1 내지 R13x4로 표시된 1 내지 4개의 다수의 TR13 표적을 함유하는 루시퍼라아제 리포터 컨스트럭트에 대한 TALE13-VP16 융합 단백질(TR13-VP16, VP16의 활성화 도메인과 연결된 TALE13)에 의한 상승적인 리포터 유전자 활성화(도 3b)를 보여준다. pGL3은 어떠한 TR13 표적 요소도 없는 대조군 리포터 벡터이다.
도 4의 패널 A 및 B는 TALE VP16 융합 단백질에 의한 리포터 유전자 활성화 를 보여준다. 도 4a는 본 연구에 사용된 리포터 컨스트럭트 뿐만 아니라, VP16 도메인이 추가되거나 추가되지 않은 TALE 단백질의 개요도이다. R13x2는 TALE13(TR13) 표적 중 2개가 삽입된 컨스트럭트를 나타내는 반면, R15x2는 TALE15(TR15) 표적 중 2개가 삽입된 컨스트럭트를 나타낸다. 도 4b는 TALE 단백질 자체에 의해서가 아닌, VP16 융합을 갖는 TALE 단백질에 의한 리포터 유전자 활성화를 보여준다. 따라서, TALE 단백질 내에 존재하는 천연 전사 활성화 도메인은 본 분석에서 포유동물 세포에서 기능하지 않았다. 더욱이, 정확한 표적이 이들의 상응하는 TALE VP16 융합과 일치하는 경우에만 리포터 유전자 활성화가 일어나기 때문에, 관찰된 전사 활성은 특이적이었다. 클로닝된 TALE13 및 TALE15는 각각 TR13 및 TR15로 나타나 있다. TR13-VP16 및 TR15-VP16은 부가적인 VP16 활성화 도메인이 이들의 C-말단에 융합된 TR13 및 TR15와 유사하다.
도 5의 패널 A 및 B는 프로모터에 대한 표적 서열 배치의 위치적 효과를 묘사한다. 도 5a는 표적 서열이 SV40 프로모터에 대해 근위(R13x4) 또는 원위 (R13x4D)에 위치한 리포터 컨스트럭트의 개요도를 보여준다. 도 5b는 상기 나타낸 TALE에 의한 리포터 유전자 활성화를 보여준다. "nR13V-d145C"는 SV40 핵 위치 서열, C-말단으로부터 145개의 아미노산 잔기가 결실된 TR13 서열(C+133 C-캡을 생성함) 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭하는 반면, "R13-VP16"은 TALE13 서열 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭한다. 나타난 바와 같이, (i) 전장 TALE 중 C-말단 145개 아미노산이 리포터 유전자 활성화에 필요하지 않으며, (ii) 리포터 유전자 활성화는 표적 서열이 프로모터 서열에 대해 근위에 위치할 때 가장 크다.
도 6의 패널 A 및 B는 TALE 융합을 이용한 리포터 유전자(루시퍼라아제) 활성화를 묘사한 그래프이다. 도 6a는 조작된 TALE 18 단백질(본원에서 R23570; 이하 도면에서는 NT-L로 지칭됨)을 포함하는 융합 단백질을 이용한 리포터 유전자의 활성화를 묘사한다. 상기 리포터 컨스트럭트는 루시퍼라아제 유전자의 상류 쪽에 조작된 TALE18 표적의 2 복제본(copy)을 함유한다. 이 리포터의 활성화는 17.5개의 조작된 반복 서열(17개의 전체 TALE 반복 및 하나의 절반 반복), TR13의 일렬 TALE 반복의 측면에 있는 N- 및 C-말단 서열(N-캡 및 C-캡), 및 VP16 활성화 도메인을 함유하는, R23570V를 이용할 때에만 관찰된다. 두 가지 N- 및 C-말단 측면 서열(N-캡 및 C-캡)의 결실은 활성을 폐지시킨다(nR23570S-dNC를 공(mock)에 비교한다). nR23570S-dNC는 SV40 NLS(n), 단일 p65 활성화 도메인(S)에 융합되어 있지만 TALE(dNC)에서 N- 및 C-말단 서열(N-캡 및 C-캡)이 없는 17.5개의 조작된 TALE 반복 서열을 함유한다. nR23570SS-dNC는 2개의 p65 도메인을 갖는다는 것을 제외하면 nR23570S-dNC와 동일하다. R0-VP16 컨스트럭트는 R23570과 동일하지만, 일렬 TALE 반복이 없다. '공(Mock)'은 발현 컨스트럭트가 없는 실험 결과를 보여준다. 도 6b는 조작된(비자연적으로 발생하는) TALE18 도메인을 포함하는 융합 단백질에 의한 그 염색체 환경에서의 내인성 유전자의 활성화를 묘사한다. NTF3 유전자를 표적화하도록 설계된 상기 조작된 TALE18(R23570V)은 내인성 NTF3 mRNA 수준을 상당히 증가시킬 수 있다. 동일한 조건 하에서 NTF3 mRNA의 발현은 R0-VP16 또는 GFP에 의해 영향을 받지 않는다. R23570V 및 R0-VP16은 상기에 기술되어 있다.
도 7의 패널 A 내지 D는 부가적인 예시적인 NTF3-특이적 TALE 전사 인자 융합을 묘사한다. 도 7a는 예시적인 단백질 및 NTF3 프로모터에서의 이들의 표적 (SEQ ID NO: 138)의 도식을 묘사한다. 두 가지 TALE 전사 인자 변이형들이 VP16 활성화 도메인에 연결되어 HEK293 세포에서 발현되었다. 하단에 있는 서열은 인간 NTF3의 프로모터-근위 영역을 보여준다. 밑줄친 염기들은 NT-L TALE 반복 도메인 에 대한 표적 부위를 나타낸다. 굽은 화살표는 NTF3 전사의 출발 부위를 보여준다. 도 7b는 도 7a에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포에서의 상대적인 NTF3 mRNA 수준을 보여준다. "eGFP"는 향상된 GFP를 발현하는 대조군 플라스미드로 형질감염된 세포를 나타낸다. 측정은 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. 도 7C는 7A에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포로부터 분비된 NTF3 단백질의 수준을 묘사한다. 측정은 ELISA 분석을 이용하여 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. "Neg."는 공 벡터 대조군으로 형질감염된 세포를 나타낸다. 도 7D는 RVD(첫 번째 열의 글자), 예측된 결합 부위(두 번째 열의 글자) 및 NT-L에 대한 SELEX-유래 염기 빈도 매트릭스(하단 그래프)를 보여준다. 상기 행렬 내의 첫 번째 및 다섯 번째 위치를 제외하고, 가장 빈번하게 선택된 염기가 표적 좌위 서열과 일치한다.
도 8의 패널 A 및 B는, 다양한 조작된 TALE DNA 결합 도메인의 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한 그래프이다. 도 8a는 9.5개의 TALE 반복을 포함하는 NT3-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사하는 반면, 도 8b는 9.5개의 TALE 반복을 포함하는 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사한다. 두 가지 데이터 세트의 경우, N-말단 절단이 이뤄질 때, C-말단은 C+95 위치에 유지되는 반면, C-말단 절단의 경우, N-말단이 N+137 위치에 유지되었다(이들 컨스트럭트들은 N+136 N-캡 잔기에 첨부된 메티오닌 잔기를 갖는다). 확인할 수 있는 바와 같이, 두 가지 단백질들은 단백질이 N +134 위치보다 더 N-말단 상에서 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다. 또한, 두 가지 단백질들은 C-말단이 아미노산 C+54를 지나 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다.
도 9의 패널 A 및 B는 전술한 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한다. 도 9a에 NTF3-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있지만, 이 경우 N-말단 절단이 시험되었을 때, C+54 위치에서 C-말단이 유지되었다. C-말단 절단의 경우, N+134 위치에서 N-말단 아미노산이 유지되었다. 도 9b에 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있다. 나타난 바와 같이, N- 및 C-말단은 도 9a에 대하여 전술한 바와 같이 유지되었다.
도 10은 활성과 관련된 TALE 기능성 도메인의 절개도를 보여준다. 표 16에 예시된 표시된 컨스트럭트에 의한 리포터 유전자 활성화에 대한 활성을 조사하였다. 상기 결과는 (i) N-말단 152개 아미노산 및 C-말단 183개 아미노산들이 본 분석에서 강력한 기능에 필요하지 않는다는 것과 (ii) R0 영역 및 류신 풍부 도메인을 포함하는, 일렬 TALE 반복의 측면에 있는 서열이 본 분석에서 세포에서 기능성 활성을 회복시킨다는 것을 보여준다. 첫 번째 TALE 반복의 앞에 있는 N-말단 또는 마지막 반복 이후에 있는 C-말단 서열의 결실은 본 분석에서 기능성 활성을 폐지시킨다. R13V-d145C는 C+133 C-캡을 가지며, R13V-d182C는 C+95 C-캡을 가지고, R13V-dC는 C+22 C-캡을 가지며, nR13V-dN은 N+8 N-캡을 가지고, nR13V-d223N은 N+52 N-캡을 가지며 nR13V-d240은 N+34 N-캡을 갖는다.
도 11의 패널 A 및 B는 K562 세포에서 FokI 도메인의 두 복제본에 연결된 TALE13의 뉴클레아제 활성을 묘사한다. 도 11a는 포유동물 세포에서 뉴클레아제 활성을 검출하기 위한 단일 가닥의 어닐링 기반의 리포터 분석(SSA)의 개요도를 묘사한다. 본 분석에서 리포터 컨스트럭트(SSA-R13)는 GFP 코딩 서열의 N-말단(GF)과 C-말단 부분(FP)에 의해 샌드위치된 TALE13 표적을 함유하였다. 플라스미드 SSA-R13 자체는 GFP 발현을 유도할 수 없었으나, R13 표적의 절단은 GFP의 N-말단(GF) 및 C-말단(FP) 부분 사이의 상동 재조합을 촉진하여 기능성 GFP를 형성한다. 따라서, TALEN 단백질의 뉴클레아제 활성을 GFP 양성 세포의 백분율을 분석함으로써 평가하였다. 도 11B는 TALEN 단백질에 의한 뉴클레아제 활성을 보여준다. SSA-R13 리포터 컨스트럭트로부터 생성된 GFP 양성 세포는 뉴클레아제 플라스미드가 없는 대조 실험(mock)과 비교하여, TALEN(R13d182C-scFokI; C+95 C-캡)을 이용하여 유의하게 증가하였다. R13d182C-scFokI은 FokI 도메인 사이에 GGGGS 서열의 12개의 복제본에 의해 연결된 FokI 도메인의 두 복제본이 VP16 활성화 도메인을 대체하기 위해 사용되는 것을 제외하고 전술한 R13V-d182C와 동일하다.
도 12는 TALE-13 작용기 도메인-FokI 절단 절반-도메인 융합의 시험관내 뉴클레아제 활성을 보여주는 에티디움 브로마이드 겔을 묘사한다. 컬럼들은 4가지 TALE 도메인 뉴클레아제 절단 단백질에 대한 데이터를 보여준다: L2 또는 L8 링커 중 하나를 이용한 N+137, C+28 배열과의 뉴클레아제 융합(실시예 7 참조); L2 링커를 이용한 N+137, C+39 배열과의 뉴클레아제 융합; 및 L2 링커를 갖는 N+137, C+63 융합. 두 가지 표적 부위 사이의 갭 간격(gap spacing)이 웰 아래에 나타나 있으며, 상기 숫자는 표적 사이의 bp 수를 나타낸다. "S"는 단지 절반의 쌍에 대한 단일 표적 부위를 나타낸다. "PmlI"는 표준 제한 효소를 이용한 절단을 나타내며, 블랭크(blank)는 뉴클레아제를 코딩하는 플라스미드 없이 실험이 수행되었을 때의 결과를 나타낸다.
도 13은 표시된 TALE13-FokI 절단 절반 도메인 융합에 의해 얻어진 DNA 절단을 묘사하는 그래프이다. "Dimer Gap"은 두 개의 표적 부위 사이의 bp 수를 나타내며, "퍼센트 DNA 절단"은 반응에서 얼마나 많은 DNA가 절단되었는지를 나타낸다. 상기 결과는 시험된 4개의 뉴클레아제 중 3개를 이용하여 이들 반응 조건에서 실질적으로 100 퍼센트 DNA 절단이 얻어질 수 있음을 보여준다.
도 14는 TALE 도메인-FokI 절반 절단 도메인 융합의 뉴클레아제 활성을 보여주는 에티디움 브로마이드-염색 겔을 묘사한다. 본 실험에서, N-말단은 달라진 반면, C-말단은 C +63 배열로 유지되었다. Pml1 및 블랭크 대조군은 도 12에서와 동일하다. 본 실험에서 시험된 N-말단 절단은 N+137, N+134, N+130 및 N+119였다. 상이한 DNA 표적 부위들은, 라벨이 관련 레인의 아래쪽이 아니라 위쪽에 있다는 점을 제외하면, 도 12처럼 나타나 있다. N-말단이 대략 +134 내지 +137보다 짧을 경우 뉴클레아제의 활성이 감소된다. 5 bp 갭 및 8 bp 갭 표적에 대한 각 레인에 로딩된 DNA의 양이 불균일하여서, 전위된 반복에서 비효율적인 PCR 때문에 이들 레인에서 하부 밴드가 DNA 절단 산물 또는 백그라운드를 나타내는지 여부를 결정하기 어렵다.
도 15의 패널 A 및 B는 K562 세포에서의 TALEN 활성을 묘사한다. 도 15a(SEQ ID NO: 342)는 TALE 쌍을 표적화하는 NTF3에 대한 리포터 플라스미드에서 사용된 표적 서열을 묘사하며, 이는 또한 한 쌍의 CCR5-특이적 ZFN(8267/8196)에 대한 결합 부위를 포함한다. 도 15b는 SSA 뉴클레아제 분석 결과를 묘사하는 그래프로서, (-)NT3 R18 C28L8(옅은 회색 막대; C+28 C-캡, L8 링커)은 NTF3-특이적 쌍 중 단지 하나의 구성원이 존재할 때 관찰된 데이터를 묘사하는 반면, (+)NT3 R18 C28L8(어두운 회색 막대)은 상기 쌍 중 두 가지 구성원이 존재할 때의 결과를 묘사한다. "8267EL8196KK"는 CCR5-특이적 ZFN 쌍을 이용한 결과를 나타낸다.
도 16은 다양한 쌍의 NTF3-표적화 TALEN으로 처리된 세포 상에서의 Cel-I Surveyor^TM 불일치 분석(Transgenomics, "Cel-I 분석")의 결과를 묘사한다. 번호 1-30의 시료들은 본문에 기술되어 있다. (+)는 Cel-I 효소의 첨가를 나타내며, (-)는 효소를 첨가하지 않은 분석을 나타낸다. 대부분의 시료에서 대략 226 bp의 밴드가 보이는데, 이는 뉴클레아제에 의한 내인성 NTF3 표적의 절단에 의해 불일치가 유발된 이후, 야생형 서열을 이용하여 불일치 영역을 도입하는 비-상동성 말단 결합을 보여준다. "gfp"는 GFP 코딩 플라스미드만으로 형질감염된 세포 대조군을 나타낸다. 겔 상에서 정량화된 퍼센트 NHEJ 활성이 Cel-I 효소를 함유하는 각 시료에 표시되어 있다. 상기 겔은 각 쌍들이 포유동물 내의 이 내인성 좌위에서 최대 8.66%의 총 대립유전자에서 표적화된 좌위 붕괴를 유발하였음을 입증한다.
도 17의 패널 A 내지 C는 K562 세포에서 NTF3-특이적 TALEN의 활성을 묘사한다. 도 17a는 NT-L TALEN 융합을 위해 만들어진 조작된 파트너인 NT-R로 명명된 조작된 TALEN 단백질에 대한 SELEX 특이성 데이터를 보여준다. 예측된 염기 및 대응되는 RVD가 도면 위에 나타나 있다. +63 C-말단 측면 영역이 본 SELEX 실험에 사용되었다. 도 17b는 배양 조건이 30℃ 또는 37℃인 K562 세포에서 4개의 NTF3-특이적 TALEN 쌍을 이용한 Cel-I 분석 결과인 겔을 보여준다. 제시된 데이터에서 볼 수 있는 바와 같이, 가장 활성인 쌍은 37℃에서 3% 및 저온 충격(cold-shock) 조건(30℃) 하에서 9%의 유전자 변형 수준을 나타내었다(Doyon et al. (2010) Nat Methods 8(1):74-9. Epub 2010 Dec 5 및 미국 출원번호 제12/800,599호). 이후, 저온 충격 연구에서의 PCR 풀(pool)로부터 84개의 앰플리콘(amplicon)의 서열을 분석하고, 7개의 돌연변이된 대립유전자를 확인하였고, 이를 도 17C에 나타내었다(SEQ ID NO: 343-350). 확인할 수 있는 바와 같이, 작은 삽입-결실(indel)이 관찰된다.
도 18의 패널 A 및 B는 TALEN을 이용하여 K562 세포에서 NTF3 좌위의 내인성 절단 이후 관찰된 서열 결과를 묘사한다. 도 18a는 염색체 서열(SEQ ID NO: 139-140)을 묘사하며 박스는 두 가지 TALEN에 대한 결합 부위를 기술한다. 도 18b는 야생형("wt") 서열(SEQ ID NO: 141-175)과 함께 정렬된 실시예 8에 기술된 상이한 NTF3 TALEN 쌍으로 처리된 세포로부터의 NTF3의 서열 결과의 편집물을 묘사한다.
도 19는 NTF3-특이적 TALEN에 의해 유도된 DSB를 통한 내인성 유전자에서의 표적화된 통합(integration) 사건의 결과를 묘사한다. DSB에서의 포획을 위한 올리고뉴클레오티드들은 TALEN 결합 부위 사이의 공간 내에 있는 모든 가능한 서열에 대응되는 오버행(overhang)을 함유하도록 합성되었다. PCR은 삽입된 올리고뉴클레오티드 및 추정되는 절단 부위의 외부에 있는 영역에 작동가능하게 준비된 프라이머 세트를 이용하여 수행되었다. 8개의 상이한 NTF3-특이적 TALEN 쌍이 시험되었고, 상기 쌍들은 A-H로 표시되어 있다. 상기 범례는 레인들이 판독되는 방법을 보여주는 겔의 일부를 보여준다.
도 20의 패널 A 내지 D는 TALEN 쌍에 의해 좌위에서 유도된 DSB 이후 NHEJ에 의해 매개된 내인성 염색체 위치에서의 올리고뉴클레오티드 이중체의 포획을 보여준다. 도 20a는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 351) 및 이 연구를 위해 사용된 올리고뉴클레오티드 이중체 중 하나(하단 이중체, SEQ ID NO: 352)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 상기 이중체를 가장 효과적으로 포획할 절단 오버행(5' CTGG)이 강조되어 있다. 도 20b는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 353) 및 본 연구를 위해 사용된 이차 올리고뉴클레오티드 이중체(하단 서열, SEQ ID NO: 354)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 이 제2 이중체를 가장 효과적으로 포획할 절단 오버행(5' TGGT)이 나타나 있다. 도 20C(SEQ ID NO: 355-357)는 도 20a에 나타난 올리고뉴클레오티드 이중체의 존재 하에 K562 세포에서 NT-L+28 및 NT-R+63의 발현 이후의 결과를 보여준다. 이후, 상기 이중체 내에서 어닐링하는 하나의 프라이머 및 천연 NTF3 위치에 어닐링하는 하나의 프라이머를 사용하여 성공적으로 통합된 이중체 및 게놈 DNA 간의 접합을 증폭시켰다. 얻어진 앰플리콘을 클로닝하고 서열을 분석하였다. 상단의 "예측된" 서열은 상기 절단된 좌위에 올리고뉴클레오티드를 완벽하게 라이게이션하였을 때 생성될 서열을 나타낸다. 박스는 접합 서열에서의 이중체 오버행의 위치를 강조한다. 하단 2개의 선은 본 연구로부터 얻어진 접합 서열을 제공한다. 나타난 바와 같이, 상기 절단 오버행에 대한 이중체의 완벽한 라이게이션으로부터 11개의 접합 서열이 생성된 한편, 한가지 접합 서열은 NHEJ에 의한 수선 이전의 절제(resection)와 일치하는 짧은 결실(12 bp)을 나타내었다. 도 20D(SEQ ID NO: 358-362)는, 도 20a에 나타난 이중체와 비교하여 하나의 염기가 이동된 4 bp 오버행을 갖는, 도 20b에 나타난 올리고뉴클레오티드 이중체가 사용되었다는 점을 제외하고, 도 20C에 나타난 실험으로부터의 결과를 보여준다. 가장 아래의 4개의 선은 본 연구로부터 얻은 접합 서열을 제공한다. 나타난 바와 같이, 4개의 별개의 서열이 확인되었으며, 이들 각각은 NHEJ-매개 수선 이전의 절제와 일치하는 짧은 결실을 나타낸다.
도 21은 주형의 효율적인 증폭을 파괴할 수 있는, PCR 증폭 동안에 천연 TALE 반복 도메인 내에서 형성될 것으로 예측되는 잠재적인 몇 가지 이차 DNA 구조를 묘사한다. Mfold(M. Zuker Nucleic Acids Res. 31(13):3406-15, (2003))를 이용하여 TALE-반복 단백질의 DNA 서열을 분석하였다. 첫 번째 전체 TALE 반복 서열을 코딩하는 핵산의 5' 말단에서 시작하여, 상기 핵산 서열 중 800 염기쌍의 핵산 서열을 분석하였다. 상기 분석된 서열은 대략 7.5개의 반복을 함유하였다. 분석은 몇 가지 매우 안정한 이차 구조를 밝혀내었다.
도 22는 34개의 아미노산 반복 단위 내의 각 위치에서 보존된 아미노산을 나타내는 잔토모나스 박테리아 유래의 1963개의 TALE 반복의 인실리코(in silico) 분석의 그림을 이용한 결과를 묘사한다. 글자 크기는 임의의 제시된 위치에서의 관찰된 다양성과 반비례한다: 큰 글자는 다양성의 낮은 관용을 나타내는 반면, 작은 글자는 제시된 위치에서 관찰될 수 있는 대체 아미노산을 가리킨다. 상이한 색조는 상이한 화학적 계열의 아미노산을 나타낸다. 이 1963개의 TALE 반복 시료에서, 최대 빈도 RVD는 28.8% HD; 20.6% NI, 15.1% NN; 13.2% NG; 8.5% NS; 5.5% HG; 및 5.5% NG*(상기 별표는 RVD가 보다 통상적인 34-잔기 반복 대신에 33-잔기 TALE 반복에서 관찰된 경우임)였다. 15개의 다른 RVD 서열이 본 시료에서 관찰되었지만 이들 모두 1% 미만의 빈도를 가졌다.
도 23은 목적하는 TAKE 융합 단백질을 제조하기 위해, 선택된 TALE 반복 모듈의 PCR 앰플리콘을 일렬로 연결하고 이들을 벡터 백본내로 라이게이션하는데 사용된 방법의 개요도를 묘사한다. 특이적 프라이머들이 실시예 11에 열거되어 있다. 또한, 조립된 TALE 융합이 클로닝된 벡터 백본이 묘사되어 있다. 상기 융합 파트너 도메인은 FokI 뉴클레아제 촉매 도메인이며 TALEN 쌍 중 하나의 구성원의 생산을 가능하게 한다.
도 24의 패널 A 및 B는 RFLP를 코딩하는 이종성의 짧은 분절을 내인성 CCR5 좌위 내로 상동성-기반의 이동을 유발하는 TALEN의 용도를 묘사한다. 도 24a는 분석을 위한 개요도를 보여주며, 사용된 PCR 프라이머의 위치 및 Bgl I 부위를 묘사한다. 도 24b는 CCR5-특이적 TALEN 쌍에 의해 도입된 DSB 내로의 46 bp 공여체 서열의 삽입을 보여주는 겔을 묘사한다. 상기 공여체 서열은 고유한 BglI 제한 부위를 함유하므로, 표적 부위의 PCR 증폭과 이후의 BglI을 이용한 PCR 산물의 절단시, 상기 TALEN 쌍에 의해 절단되어 46 bp 공여체 서열이 삽입된 서열이 도면에 표시된 바와 같이 두 개의 BglI 절단 산물을 가질 것이다.
도 25의 패널 A 및 B는 표적 갭 간격(gap spacing)과 비교하여 TALEN의 절단 효율을 묘사한 그래프이다. 도 25a는 +28/+28 쌍(두 가지 TALEN 상의 C+28 C-캡)을 갖는 CCR5-특이적 TALEN 쌍의 패널의 활성을 묘사하는 반면, 도 25b는 +63/+63 쌍(두 가지 TALEN 상의 C+63 C-캡)을 포함하는 패널 CCR5-특이적 TALEN 쌍의 활성을 묘사한다. 확인할 수 있는 바와 같이, +28/+28 쌍의 활성은 두 가지 표적 서열 사이에 있는 12 또는 13 bp 갭 간격에 더욱 견고하게 제약된 반면, +63/+63 쌍은 12-23 bp의 갭 간격 범위에 걸쳐 활성을 나타낸다.
도 26은 상이한 길이의 C-캡 서열, 또는 다른 방식으로 언급된, 뉴클레아제 도메인에 전체 TAKE 반복의 배열을 연결시키는 상이한 서열을 갖는 CCR5-특이적 TALEN 쌍의 내인성 활성을 묘사한 그래프이다. C-말단 서열에 걸쳐 C 말단 절단이 이루어져 C-2부터 C+278까지의 C-캡을 생성하였다. 이들 컨스트럭트를 대상으로 18 bp 캡 간격을 갖는 내인성 표적에 대한 K562 세포에서의 TALEN 활성을 시험하였고, 상기 시험에서 세포를 37℃(옅은 사각형) 또는 저온 충격 조건(30℃, 진한 다이아몬드)에서 배양하였다. 상기 활성은 전체 TALE 반복의 배열을 FokI 절단 도메인과 연결시키는데 사용된 서열의 동일성에 상당히 의존하였다. 상기 C-캡 표기법이 C+0을 포함하지 않으므로, C-1 C-캡 값이 X=0에서 도식화되었고 C-2가 X=-1로서 도식화되었음에 유의한다. C+5, C+28 등을 X=5, X=28 등으로서 도식화하였다. 피크 활성을 C+63 C-캡 서열에 대해 관찰하였다.
도 27은 RVD 분석을 위해 선택된 예시적인 TALEN의 특이성을 묘사한다. 상기 TALEN을 11개 염기 표적 서열 5'-TTGACAATCCT-3'(SEQ ID NO: 178)에 결합하도록 설계하였다. 위치 5-7에서의 표적의 동일성이 CAA(설계된 표적), CGA, TCG 또는 TTG이도록, 이 표적이 위치 6에서 변화될 때 ELISA 분석에 의해 결정된 DNA 결합 결과가 나타나 있다.
도 28은 시험된 모든 RVD에 대해 측정된 ELISA 친화도의 그래프 표현이다. 상기 데이터는 20x20 격자로 나타나 있으며, 여기에서 RVD의 첫번째 아미노산(위치 12)이 격자의 수직 좌측에 나타나 있고, RVD의 두 번째 아미노산(위치 13)이 상기 격자 위에 수평으로 나타나 있다. 각 격자에서 글자 A, C, G, 및 T의 크기가 각각 CAA 부위, CCA 부위, 및 CGA 부위 및 CTA 부위에 대해 정규화된 ELISA 신호의 제곱근에 기초하여 크기가 변경되어 있다.　 많은 RVD는 자연적으로 발생하는 HD, NI, NG, NS, NN, IG, HG, 및 NK RVD에 대하여 개선된 DNA 결합 특성을 갖는다. 자연에서 가장 흔히 발견되는 4개의 RVD(HD, NG, NI, 및 NN)가 참고를 위해 박스 표시되어 있다. 이들 4개의 RVD의 경우, ELISA에 의해 선호되는 염기가 예측된 선호되는 염기와 일치하였다.
도 29는 T 이외의 뉴클레오티드 염기와의 상호작용을 가능하게 하기 위해 C-말단 절반 반복이 RVD에서 변화된 TALEN의 활성의 측정 결과를 묘사한 겔이다. 나타낸 TALEN 활성은 전술한 Cel-I 분석에 의해 결정된 바와 같다. 화살표 머리 부분은 삽입-결실(indel)에서의 Cel-I 절단 결과인 밴드를 가리킨다. 레인 배치가 실시예 16의 표 32에 열거되어 있다. 이들 결과는 TALEN C-말단 절반 반복이 목적하는 각 뉴클레오티드 염기에 결합하도록 조작될 수 있음을 입증한다.
도 30은 완전히 비정형적인 RVD(완전히 치환됨), 한 가지 유형 또는 특이성의 모든 반복 단위(예컨대, 'T' 등을 지정하는 RVD를 갖는 모든 반복 단위)가 비정형적인 RVD로 치환된 반복 도메인을 포함하는 TALE 반복 단위를 갖는 TALEN(타입 치환), 또는 상기 배열을 갖는 단지 하나의 반복 단위가 비정형적인 RVD-포함 반복 단위로 치환된 TALEN(단일 치환됨)을 이용한 TALEN 활성의 측정을 묘사한 겔이다. 활성 분석은 37℃ 또는 저온 충격 조건(30℃)에서 수행하였으며, 임의의 측정가능한 NHEJ 활성의 정량이 레인 상에 나타나 있다.
도 31은 랫트 배아의 TALEN 처리 후 태어난 랫트 새끼에서 NHEJ 사건의 존재를 묘사한 일련의 겔이다. 상기 새끼로부터 게놈 DNA를 분리하고 뉴클레아제 표적 부위를 둘러싼 영역 상에서 PCR을 수행하였다. 그리고 나서, 상기 산물에 대해 T7 엔도뉴클레아제를 이용하여 NHEJ 유도된 불일치를 조사하였다. 화살표는 불일치의 존재로부터 생성된 밴드를 나타낸다. 조사된 66마리의 새끼 중 7마리(11%)가 NHEJ 사건에 대해 양성이었다.

발명의 상세한 설명

서론

본원은 목적하는 내인성 DNA 서열을 인식할 수 있도록 TALE-반복 도메인을 조작할 수 있다는 것과 기능성 도메인을 상기 조작된 TALE-반복 도메인에 융합하는 것이 그 본래의 염색질 환경 내에 존재하는, 유전자를 비롯한 내인성 세포 좌위의 기능적 상태나 실질적인 게놈 DNA 서열을 변경하는데 사용될 수 있다는 것을 입증한다. 따라서, 본 발명은 유전자를 비롯한 내인성 세포 좌위를 고효율로 특이적으로 인식하도록 조작된 TALE-융합 DNA 결합 단백질을 제공한다. 그 결과, 본 발명의 TALE-융합은 내인성 유전자 전사의 활성화 및 억제 모두를 통해 내인성 유전자 발현을 조절하는데 사용될 수 있다. 상기 TALE-융합은 또한 내인성 염색체 서열을 변형시키는 다른 조절성 또는 기능성 도메인, 예를 들어 뉴클레아제, 트랜스포사아제(transposase) 또는 메틸라아제에 연결될 수 있다.

본원에 기술된 방법 및 조성물은 신규한 인간 및 포유동물의 치료적 응용, 예컨대, 유전적 질병, 암, 진균류, 원생생물, 박테리아, 및 바이러스 감염, 허혈, 심혈관 질환, 관절염, 면역학적 장애 등의 치료를 가능하게 할 뿐만 아니라, 기능성 게놈 분석을 제공하고, 조사 및 약물 탐색을 위한 조작된 세포주를 생성하고, 증가된 질병 저항성을 포함하나 이에 제한되지 않는 변화된 표현형을 갖는 식물을 개발하기 위한 수단을 제공하고, 과실 숙성 특성, 당 및 오일 조성, 수확량, 및 색상을 변경시키는 것을 제공한다.

본원에 기술된 바와 같이, 둘 이상의 TALE-융합은 임의의 세포에 투여되어, 동일한 표적 내인성 세포 유전자, 또는 상이한 표적 내인성 세포 유전자를 인식할 수 있다.

또 다른 구체예에서, TALE-융합 단백질은 하기에 기술된 적어도 하나 이상의 조절성 도메인에 연결된다. 조절성 또는 기능성 도메인의 비제한적인 예는 KRAB 및 VP16과 같은 전사 인자 억제자 또는 활성자 도메인, 보조-억제자 및 보조-활성자 도메인, DNA 메틸 트랜스퍼라아제, 히스톤 아세틸트랜스퍼라아제, 히스톤 디아세틸라아제, 및 엔도뉴클레아제 Fokl으로부터의 절단 도메인과 같은 DNA 절단 도메인을 포함한다.

또한 하나 이상의 TALE-반복 단위, N-캡 및, 선택적으로 게놈 편집(예컨대, 유전자의 절단; 예를 들어, 절단 후 외인성 서열의 삽입(물리적 삽입 또는 상동성-지정 수선(homology-directed repair)을 통한 삽입) 및/또는 절단 후 NHEJ에 의한 유전자의 변화; 하나 이상의 유전자의 부분적인 또는 전체적인 불활성화; 내인성 유전자의 기능적 상태가 변화된 대립유전자의 생성, 조절 요소의 삽입 등)에 유용한 뉴클레아제 도메인에 융합된 C-캡 및 생식세포 내로 운반된 게놈의 변화를 포함하는, 융합 단백질을 포함하는 조성물 및 방법이 본원에 기술된다. 또한, 예를 들어 표적 세포에서 하나 이상의 유전자를 편집(변화)시키는 이들 조성물(시약)을 제조하고 사용하는 방법이 개시된다. 따라서, 본원에 기술된 방법 및 조성물은 하나 이상의 유전자의 표적화된 유전자 변화(예컨대, 넉인(knock-in)) 및/또는 넉아웃(knockout)(일부 또는 전체) 및/또는 임의의 표적 대립유전자의 서열의 무작위 돌연변이를 위한 매우 효율적인 방법을 제공하며, 따라서 인간 질병의 동물 모델의 생성을 가능하게 한다.

또한 매우 활성인 뉴클레아제 기능을 제공하는 TALE 반복 배열에 뉴클레아제 도메인을 연결하기 위한 조성물(C-캡)이 본원에 제공된다. 일부 구체예에서, 상기 C-캡은 본래의 TALE C-말단 측면 서열 유래의 펩타이드 서열을 포함한다. 다른 구체예에서, 상기 C-캡은 TALE 반복 도메인 유래의 펩타이드 서열을 포함한다. 또 다른 구체예에서, 상기 C-캡은 비-TALE 서열을 포함한다. C-캡은 또한 본래의 TALE C-말단 측면 서열 유래의 펩타이드 서열 및/또는 TALE 반복 도메인을 포함하고/하거나 이들 공급원을 포함하지 않는, 키메라 구조를 나타낼 수 있다.

TALEN은 또한 AAVS1(공동소유의 미국특허공개 제20080299580호 참조) 또는 CCR5(공동소유의 미국 특허공개 제20080159996호 참조)와 같은 안전한 하버(harbor) 좌위 내로 관심대상 공여체를 삽입할 수 있도록 조작될 수 있다. 상기 공여체는 관심대상 유전자를 포함하거나 shRNA, RNAi 또는 miRNA와 같은 관심대상 RNA를 코딩할 수 있다.

조작된 TALE-융합 단백질(예컨대, 전사 활성자, 전사 억제자 및 뉴클레아제)의 발현은 또한 tet-조절된 시스템 및 RU-486 시스템(예컨대, Gossen & Bujard, Proc Natl Acad Sci 89:5547 (1992); Oligino et al., Gene Ther. 5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al, Blood 88:1147-1155 (1996); and Rendahl et al., Nat . Biotechnol . 16:757-761 (1998) 참조)로 대표되는 시스템에 의해 제어될 수 있다. 이들은 TALE-융합 활성자 및 억제자의 발현에 소분자 제어를 제공하여 관심대상 표적 유전자(들)의 소분자 제어를 제공한다. 이러한 이로운 특징은 세포 배양 모델, 유전자 치료요법, 및 형질전환 동물 및 식물에서 사용될 수 있다.

개론

방법의 실행 뿐만 아니라 본원에 개시된 조성물의 제조 및 사용은, 달리 나타내지 않는 한, 분자 생물학, 생화학, 염색질 구조 및 분석, 컴퓨터 화학, 세포 배양, 재조합 DNA 및 본 기술분야의 기술 내에 속하는 관련 분야에서의 통상적인 기술을 이용한다. 이들 기술은 문헌에 자세히 설명되어 있다. 예를 들어, 문헌[Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999]을 참조한다.

정의

용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며, 선형 또는 환형 형태 및 단일-또는 이중-가닥 형태인, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 개시의 목적을 위해, 이들 용어들은 중합체의 길이에 대하여 제한하는 것이 아닌 것으로 해석되어야 한다. 상기 용어들은 천연 뉴클레오티드의 공지된 유사체 뿐만 아니라 염기, 당 및/또는 인산 부분(예컨대, 포스포로티오에이트(phosphorothioate) 백본)이 변형된 뉴클레오티드를 포함할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기-쌍 특이성을 가지며, 즉 A의 유사체는 T와 염기쌍을 이룰 것이다.

용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기들의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 상기 용어는 또한 하나 이상의 아미노산이 대응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.

"결합"은 거대분자 사이(예컨대, 단백질 및 핵산 사이)의 서열-특이적인, 비공유 상호작용을 지칭한다. 상기 상호작용이 전체적으로 서열-특이적인 한, 결합 상호작용의 모든 성분들이 서열 특이적(예컨대, DNA 백본 내의 인산 잔기와 접촉)일 필요는 없다. 상기 상호작용은 일반적으로 10^-6　M 이하의 해리 상수(K_d)를 특징으로 한다. "친화도"는 결합의 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 K_d와 상관된다.

"결합 단백질"은 또 다른 분자와 비공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자(DNA-결합 단백질), RNA 분자(RNA-결합 단백질) 및/또는 단백질 분자(단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우, 이는 그 자신에 결합하고/하거나(동종이량체, 동종삼량체 등을 형성함), 이는 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 한 가지 유형 이상의 결합 활성을 가질 수 있다. 예를 들어, 아연-핑거(zinc-finger) 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 갖는다.

"TALE-반복 도메인"(또한 "반복 배열")은 TALE가 그의 동족 표적 DNA 서열에 결합하는 것에 관여하며 하나 이상의 TALE "반복 단위"를 포함하는 서열이다. 단일 "반복 단위"("반복"으로도 지칭됨)는 통상적으로 33-35개의 아미노산 길이이며 자연적으로 발생하는 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 일부 서열 상동성을 나타낸다. 본원에 기술된 TALE 반복 단위는 일반적으로 (X)^{1 내지 11}-(X^RVD)₂-(X)_20-22(SEQ ID NO: 399) 형태이며, 여기에서 X^RVD(위치 12 및 13)는 자연적으로 발생하는 TALE 단백질에서 초가변성(hypervariability)을 나타낸다. 위치 12 및 13에 있는 아미노산의 신원(identity)을 변화시키는 것은 상기 반복 단위가 상호작용하는 DNA 뉴클레오티드(또는 이중-가닥 DNA에서 상보적인 뉴클레오티드의 쌍)의 신원에 대한 선호도를 변화시킬 수 있다. "비정형적인" RVD는, 자연상에서 드물게 또는 결코 발생하지 않는, 예를 들어 자연적으로 발생하는 TALE 단백질의 5% 미만, 바람직하게는 자연적으로 발생하는 TALE 단백질의 2% 미만, 및 더욱 바람직하게는 자연적으로 발생하는 TALE 단백질의 1% 미만으로 발생하는, RVD 서열(위치 12 및 13)이다. 비정형적인 RVD는 비자연적으로 발생할 수 있다.

용어 "N-캡(cap)" 폴리펩타이드 및 "N-말단 서열"은 TALE 반복 도메인의 N-말단 부분의 측면에 있는 아미노산 서열(폴리펩타이드)을 지칭하기 위해 사용된다. N-캡 서열은, TALE-반복 도메인(들)이 DNA에 결합하는 기능을 하는 한, 임의의 길이(아미노산을 포함하지 않음)일 수 있다(아미노산을 포함하지 않음). 따라서, N-캡 서열은 TALE 반복 도메인에 대한 적절한 구조적 안정화 및/또는 DNA와의 비특이적 접촉을 제공하는데 관여할 수 있다. N-캡 서열은 자연적으로 발생하거나 비자연적으로 발생할 수 있으며, 예를 들어 임의의 전장 TALE 단백질의 N-말단 영역으로부터 유래될 수 있다. N-캡 서열은 전장 TALE 단백질에서 발견되는 폴리펩타이드의 단편(절단)이며, 예를 들어 TALE-반복 도메인의 DNA-결합 기능을 지지하거나 TALE 융합 단백질 활성에 대한 지지를 제공하는데 충분한, 자연적으로 발생하는 TALE 단백질 내의 TALE 반복 도메인의 측면에 있는 N-말단 영역의 임의의 절단이다. 각 TALE-반복 단위가 전형적인 RVD를 포함하는 경우 및/또는 C-캡이 TALE 단백질의 전장의 자연적으로 발생하는 C-말단 영역을 포함하는 경우, N-캡 서열은 자연적으로 발생하는 TALE 단백질의 전장 N-말단 영역을 포함하지 않는다. 따라서, 전술한 바와 같이, 이 서열은 반드시 DNA 인식에 관여하는 것은 아니지만, 내인성 표적 DNA에서의 효율적이고 특이적인 기능이나 TALE 융합 단백질의 효율적인 활성을 향상시킬 수 있다. TALE 반복 도메인의 N-말단 부분에 가장 가까운 N-캡 서열의 부분은 TALE 반복 단위에 대해 일부 상동성을 가질 수 있으며 "R0 반복"으로 지칭된다. 통상적으로, 표적 부위의 바로 5' 위치에 대해 선호되는 뉴클레오티드는 티미딘(T)이다. N-캡의 R0 반복 부분이 TALE 반복에 의해 특정된 표적 서열에 인접한 T(또는 이중 가닥 DNA 내의 T에 염기쌍을 이룬 A)와 상호작용하는 것을 선호할지 모른다. R0 서열의 한 가지 예가 하기에 나타나 있다:

LDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN (SEQ ID NO: 1)

용어 "C-캡" 또는 "C-말단 영역"은 TALE 반복 도메인의 C-말단 부분의 측면에 있을 수 있는 선택적으로 존재하는 아미노산 서열(폴리펩타이드)을 지칭한다. C-캡은 또한 말단 C-말단 TALE 반복의 임의의 부분을 포함할 수 있으며, 이는 0 잔기, TALE 반복의 절단 또는 전체 TALE 반복을 포함한다. C-말단 영역의 첫 번째 20개의 잔기는 통상적으로 TALE 반복 단위의 첫 번째 20개 잔기와 상동이며, TALE 반복 도메인에 의해 지정된 DNA 서열의 뉴클레오티드 3'의 선호도를 지정할 수 있는 RVD 서열을 함유할 수 있다. 존재하는 경우, TALE 반복의 첫 번째 20개 잔기에 상동인 C-말단 영역의 이 부분은 또한 "절반 반복"으로 지칭된다. C-말단 영역 내의 잔기의 번호매기기 계획(numbering scheme)은, C-20에서 시작하여 C-19, C-18, C-17, C-16, C-15, C-14, C-13, C-12, C-11, C-10, C-9, C-8, C-7, C-6, C-5, C-4, C-3, C-2, C-1로 증가하고, C+1로 증가한 다음 폴리펩타이드의 C-말단 쪽으로 C+2, C+3 등으로 증가하는, 이러한 통상적인 부분적인 상동성을 반영한다. C+28 C-캡은 잔기 C-20에서부터 잔기 C+28(포함함)까지의 서열을 지칭하며, 따라서 48개의 잔기 길이를 갖는다. 상기 C-캡 서열은 자연적으로 발생하거나(예컨대, 자연적으로 발생하는 단백질의 단편) 또는 비-자연적으로 발생하거나(예컨대, 하나 이상의 아미노산 결실, 치환 및/또는 부가를 포함하는 자연적으로 발생하는 단백질의 단편), 또는 C 캡으로서 작용하는 능력을 갖는 임의의 다른 자연적 또는 비-자연적 서열일 수 있다. 상기 C-말단 영역은 TALE 반복 도메인(들)의 DNA-결합 기능에 전적으로 요구되지 않지만, 일부 구체예에서 C-캡은 DNA와 상호작용할 수 있으며, 또한 예를 들어 TALE 반복 도메인의 C-말단에 뉴클레아제를 포함하는 융합 단백질에서, 기능성 도메인의 활성을 향상시킬 수 있다.

"아연-핑거 DNA 결합 단백질"(또는 결합 도메인)은, 구조가 아연 이온의 배위(coordination)를 통해 안정화되는 결합 도메인 내의 아미노산 서열의 영역인, 하나 이상의 아연-핑거를 통해 서열-특이적인 방식으로 DNA에 결합하는, 단백질이거나 또는 더 큰 단백질 내의 도메인이다. 용어 아연-핑거 DNA 결합 단백질은 종종 아연-핑거 단백질 또는 ZFP로 약칭된다.

"선발된(selected)" 아연-핑거 단백질 또는 TALE-반복 도메인을 포함하는 단백질은, 파아지 디스플레이, 상호작용 트랩(interaction trap) 또는 하이브리드 선발(hybrid selection)과 같은 실험 과정으로부터 주로 생성되는 단백질이다. 예컨대, 미국 특허 제5,789,538호; 미국 특허 제5,925,523호; 미국 특허 제6,007,988호; 미국 특허 제6,013,453호; 미국 특허 제6,200,759호; 국제 공개 제WO　95/19431호; 국제 공개 제WO　96/06166호; 국제 공개 제WO　98/53057호; 국제 공개 제WO　98/54311호; 국제 공개 제WO　00/27878호; 국제 공개 제WO　01/60970호; 국제 공개 제WO　01/88197호 및 국제 공개 제WO　02/099084호를 참조한다.

용어 "서열"은 임의의 길이의 뉴클레오티드 서열을 지칭하며, 이는 DNA 또는 RNA일 수 있으며; 선형, 환형 또는 분지되거나, 단일-가닥 또는 이중-가닥일 수 있다. 용어 "공여체 서열(donor sequence)"은 게놈 내로 삽입되는 뉴클레오티드 서열을 지칭한다. 공여체 서열은, 임의의 길이, 예를 들어 2 내지 10,000개의 뉴클레오티드 길이(또는 이들 사이 또는 이들을 초과하는 임의의 정수), 바람직하게는 약 100 내지 1,000개의 뉴클레오티드 길이(또는 이들 사이의 임의의 정수), 더욱 바람직하게는 약 200 내지 500개의 뉴클레오티드 길이일 수 있다.

"상동인, 동일하지 않은 서열"은 제2 서열과 어느 정도의 서열 동일성을 공유하지만, 이의 서열이 제2 서열과 동일하지 않은 제1 서열을 지칭한다. 예를 들어, 돌연변이 유전자의 야생형 서열을 포함하는 폴리뉴클레오티드는 상기 돌연변이 유전자의 서열과 상동이나 동일하지 않다. 특정 구체예에서, 상기 두 서열 간의 상동성 정도는 이들 사이에 상동 재조합을 가능하게 하여 정상적인 세포 기전을 이용하는데 충분하다. 두 개의 상동인 동일하지 않은 서열들은 임의의 길이일 수 있으며, 이들의 비상동성 정도는 단일 뉴클레오티드만큰 작거나(예컨대, 표적화된 상동 재조합에 의해 게놈 점 돌연변이를 정정하기 위해), 10 kb만큼 클 수 있다(예컨대, 염색체 내의 미리결정된 이송성 부위에 유전자를 삽입하기 위해). 상동인 동일하지 않은 서열을 포함하는 두 개의 폴리뉴클레오티드들은 동일한 길이일 필요는 없다. 예를 들어, 20 내지 10,000개의 뉴클레오티드 또는 뉴클레오티드 쌍을 갖는 외인성 폴리뉴클레오티드(즉, 공여체 폴리뉴클레오티드)가 사용될 수 있다.

핵산 및 아미노산 서열 동일성을 결정하는 기술은 본 기술분야에 공지되어 있다. 통상적으로, 상기 기술은 유전자에 대한 mRNA의 뉴클레오티드 서열을 결정하는 것 및/또는 이에 의해 코딩된 아미노산 서열을 결정하는 것, 및 이들 서열을 제2 뉴클레오티드 또는 아미노산 서열과 비교하는 것을 포함한다. 게놈 서열은 이러한 방식으로 결정되고 비교될 수도 있다. 일반적으로, 동일성은 두 개의 폴리뉴클레오티드 또는 폴리펩타이드 서열의 정확한 뉴클레오티드-대-뉴클레오티드 또는 아미노산-대-아미노산 대응을 각각 지칭한다. 둘 이상의 서열들(폴리뉴클레오티드 또는 아미노산)은 이들의 퍼센트 동일성을 결정함으로써 비교될 수 있다. 핵산 서열이든 또는 아미노산 서열이든지 간에, 두 서열의 퍼센트 동일성은 정렬된 두 개의 서열 간의 정확한 일치 수를 더 짧은 서열의 길이로 나누고 100을 곱한 것이다.

대안적으로, 폴리뉴클레오티드들 간의 서열 유사성 정도는, 상동 영역 간에 안정적인 이중체를 형성시킬 수 있는 조건 하에서 폴리뉴클레오티드들을 혼성화한 후, 단일 가닥의 특이적 뉴클레아제(들)를 이용하여 절단하고, 상기 절단된 단편의 크기를 결정함으로써 결정될 수 있다. 두 개의 핵산, 또는 두 개의 폴리펩타이드 서열들은, 상기 방법을 이용하여 결정된 바와 같이 상기 서열들이 분자의 확정된 길이에 대해 적어도 약 70%-75%, 바람직하게는 80%-82%, 더욱 바람직하게는 85%-90%, 더욱더 바람직하게는 92%, 훨씬 더 바람직하게는 95%, 및 가장 바람직하게는 98% 서열 동일성을 나타내는 경우 서로에 대해 실질적으로 상동이다. 본원에 사용된 바와 같이, 또한 실질적으로 상동이라는 것은 특정 DNA 또는 폴리펩타이드 서열에 대해 완전히 동일성을 보이는 서열을 지칭한다. 실질적으로 상동인 DNA 서열들은 특정 시스템에 대해 확정된 바와 같이, 예를 들어 엄격한 조건 하에서, 서던 혼성화 실험에서 확인될 수 있다. 적절한 혼성화 조건을 확정하는 것은 본 기술분야의 기술 내에 속한다. 예컨대, 전술한 문헌[Sambrook et al; Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press]을 참조한다.

"재조합"은 두 개의 폴리뉴클레오티드 간의 유전적 정보의 교환 과정을 지칭한다. 본 개시의 목적을 위해, "상동 재조합(HR)"은, 예를 들어 상동성-지정 수선 기전을 통해 세포에서의 이중-가닥 파손의 손상 동안에 일어나는 특수한 형태의 상기 교환을 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 필요로 하며, "표적" 분자(즉, 이중-가닥 파손을 겪은 것)의 수선에 주형으로 작용하는 "공여체" 분자를 사용하고, 이는 공여체로부터 표적으로 유전적 정보를 전달하기 때문에 "비-교차(non-crossover) 유전자 변환" 또는 "짧은 트랙(short tract) 유전자 변환"으로 다양하게 알려져 있다. 어떤 특정 이론에 한정됨이 없이, 상기 전달은 파손된 표적 및 공여체 사이에 형성되는 이종이합체 DNA의 불일치 정정을 수반하고/하거나, 표적의 일부가 될 수 있는 유전적 정보를 재합성하는데에 상기 공여체가 사용되는 합성-의존성 가닥 어닐링(synthesis-dependent strand annealing)" 및/또는 관련 과정을 수반할 수 있다. 상기 특수한 HR은 상기 공여체 폴리뉴클레오티드의 서열의 일부 또는 전부가 표적 폴리뉴클레오티드 내로 통합되도록 종종 표적 분자의 서열의 변화를 초래한다.

본 개시의 방법에서, 본원에 기술된 하나 이상의 표적화된 뉴클레아제는 미리결정된 부위에서 표적 서열(예컨대, 세포 염색질) 내에 이중-가닥의 파손을 생성하며, 상기 파손 영역 내의 뉴클레오티드 서열과 상동성을 갖는 "공여체" 폴리뉴클레오티드는 세포 내로 도입될 수 있다. 이중-가닥의 파손(DSB)의 존재는 공여체 서열의 통합을 용이하게 하는 것으로 나타났다. 상기 공여체 서열은 물리적으로 통합되거나, 대안적으로 상기 공여체 폴리뉴클레오티드는 상동 재조합을 통해 파손의 수선을 위한 주형으로 사용되어 공여체 내의 뉴클레오티드 서열의 전부 또는 일부를 세포 염색질 내로 도입할 수 있다. 따라서, 세포 염색질 내의 제1 서열이 변화될 수 있고, 특정 구체예에서는, 공여체 폴리뉴클레오티드 내에 존재하는 서열로 변환될 수 있다. 따라서, 용어 "대체하다" 또는 "대체"의 사용은 하나의 뉴클레오티드 서열을 다른 것으로 대체하는 것(즉, 정보적인 관점에서의 서열의 대체)을 나타내는 것으로 이해될 수 있으며, 하나의 폴리뉴클레오티드를 또 다른 것으로 물리적 또는 화학적으로 대체하는 것을 반드시 필요로 하지 않는다. 일부 구체예에서, 본원에 기술된 표적화된 뉴클레아제에 의해 두 개의 DSB가 도입되며, 이는 DSB 사이에서의 DNA의 결실을 초래한다. 일부 구체예에서, "공여체" 폴리뉴클레오티드는 이들 두 개의 DSB 사이에 삽입된다.

따라서, 특정 구체예에서, 관심대상 영역 내의 서열에 상동인 공여체 서열의 부분들은 대체되는 게놈 서열에 대해 약 80 내지 99%(또는 이들 사이의 임의의 정수)의 서열 동일성을 나타낸다. 다른 구체예에서, 예를 들어 공여체와 100개가 넘는 인접한 염기쌍 간에 단지 1개의 뉴클레오티드가 다르면, 공여체 및 게놈 서열 간의 상동성은 99%보다 높다. 특정한 경우, 상기 공여체 서열의 비-상동성 부분은, 관심대상 영역 내로 새로운 서열이 삽입됨으로써, 관심대상 영역 내에 존재하지 않는 서열을 함유할 수 있다. 이러한 경우, 상기 비-상동성 서열은 일반적으로 관심대상 영역 내의 서열에 상동이거나 동일한, 50-1,000개의 염기쌍(또는 이들 사이의 임의의 정수값) 또는 1,000개보다 큰 임의의 수의 염기쌍의 서열의 측면에 위치한다. 다른 구체예에서, 공여체 서열은 제1 서열에 대해 비-상동성이며, 비-상동 재조합 기전에 의해 게놈 내로 삽입된다.

본원에 기술된 임의의 방법에서, 뉴클레아제 도메인에 융합된 부가적인 TALE-융합 단백질 뿐만 아니라 TALE- (또는 아연 핑거) 뉴클레아제의 부가적인 쌍이 세포 내의 부가적인 표적 부위의 부가적인 이중-가닥의 절단을 위해 사용될 수 있다.

본원에 기술된 임의의 방법은 관심대상 유전자(들)의 발현을 방해하는 공여체 서열의 표적화된 통합에 의해 세포 내의 하나 이상의 표적 서열을 부분적으로 또는 전체적으로 불활성화시키는데 사용될 수 있다. 부분적으로 또는 완전히 불활성화된 유전자를 갖는 세포주가 또한 제공된다.

나아가, 본원에 기술된 표적화된 통합 방법은 또한 하나 이상의 외인성 서열을 통합하는데 사용될 수 있다. 상기 외인성 핵산 서열은, 예를 들어 하나 이상의 유전자 또는 cDNA 분자, 또는 임의의 유형의 코딩 또는 비코딩 서열 뿐만 아니라, 하나 이상의 제어 요소(예컨대, 프로모터)를 포함할 수 있다. 또한, 상기 외인성 핵산 서열은 하나 이상의 RNA 분자(예컨대, 작은 헤어핀 RNA(shRNA), 조절 RNA(RNAis), 마이크로RNA(miRNA) 등)를 생산할 수 있다.

"절단"은 DNA 분자의 공유 백본의 파괴를 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지 않는 다양한 방법에 의해 개시될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단 모두가 가능하며, 이중-가닥의 절단은 두 개의 별개의 단일-가닥의 절단 사건의 결과로서 발생할 수 있다. DNA 절단은 평활 말단(blunt end) 또는 엇갈림 말단(staggered end) 중 어느 하나를 생성할 수 있다. 특정 구체예에서, 융합 폴리펩타이드는 표적화된 이중-가닥의 DNA 절단을 위해 사용된다.

"절단 절반-도메인"은 이차 폴리펩타이드(동일하거나 상이함)과 함께 절단 활성(바람직하게는 이중-가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩타이드 서열이다. 용어 "제1 및 제2 절단 절반-도메인", "+ 및 - 절단 절반-도메인" 및 "우측 및 좌측 절단 절반-도메인"은 이량체화하는 절단 절반-도메인의 쌍을 지칭한다.

"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인(예컨대, 또 다른 조작된 절단 절반-도메인)과 필수적인 이종이량체를 형성하기 위해 변형된 절단 절반-도메인이다. 또한, 전체가 참고로써 본원에 통합되어 있는 문헌[미국 특허공개 제2005/0064474호; 제2007/0218528호 및 제2008/0131962호]을 참조한다.

"염색질"은 세포 게놈을 포함하는 핵단백질 구조이다. 세포 염색질은 핵산, 주로 DNA, 및 히스톤 및 비-히스톤 염색체 단백질을 비롯한 단백질을 포함한다. 진핵 세포의 염색질의 대부분은 뉴클레오좀의 형태로 존재하며, 여기에서 뉴클레오좀 코어는 두 개의 각각의 히스톤 H2A, H2B, H3 및 H4를 포함하는 8량체와 결합된 대략 150개의 염기쌍의 DNA를 포함하고, 링커 DNA(생물에 따라 길이가 다양함)는 뉴클레오좀 코어 사이로 확장한다. 히스톤 H1의 분자는 일반적으로 상기 링커 DNA와 결합된다. 본 개시의 목적을 위해, 용어 "염색질"은, 원핵 및 진핵의 모든 유형의 세포 핵단백질을 포함하는 것을 의미한다. 세포 염색질은 염색체 및 에피솜 염색질 모두를 포함한다.

"염색체"는 세포의 게놈 모두 또는 일부를 포함하는 염색질이다. 세포의 게놈은 종종 세포의 게놈을 포함하는 모든 염색체의 집합체인 그 핵형에 의해 특징지어진다. 세포의 게놈은 하나 이상의 염색체를 포함할 수 있다.

"에피솜"은 복제하는 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 예는 플라스미드 및 특정 바이러스 게놈을 포함한다.

"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재한다면, 결합 분자가 결합할 핵산의 일부를 한정하는 핵산 서열이다. 예를 들어, 서열 5'-GAATTC-3'는 EcoRI 제한 엔도뉴클레아제를 위한 표적 부위이다.

"식물" 세포는 외떡잎 또는 쌍떡잎 식물의 세포를 포함하나, 이에 제한되지는 않는다. 외떡잎 식물의 비제한적인 예는 옥수수, 쌀, 보리, 오트, 밀, 수수, 호밀, 사탕수수, 파인애플, 양파, 바나나, 및 코코넛과 같은 곡초류를 포함한다. 쌍떡잎 식물의 비제한적인 예는 담배, 토마토, 해바라기, 목화, 사탕무, 감자, 상추, 멜론, 대두, 카놀라(유채씨), 및 앨팰퍼(alfalfa)를 포함한다. 식물 세포는 식물의 임의의 부분으로부터 유래되고/거나 식물 발달의 임의의 단계로부터 유래될 수 있다.

"외인성" 분자는 세포 내에 일반적으로 존재하지 않지만, 하나 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내로 도입될 수 있는 분자이다. "세포 내에서의 일반적인 존재"는 세포의 특정 발달 단계 및 환경적인 조건에 대하여 결정된다. 따라서, 예를 들어, 근육의 배아 발달 중에만 존재하는 분자는 성인 근육 세포에 대하여 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 열 충격을 받지 않은 세포에 대하여 외인성 분자이다. 외인성 분자는, 예를 들어 내인성 분자의 기능을 손상시키는 기능 형태 또는 정상적으로 기능하는 내인성 분자의 기능 부전 형태를 포함할 수 있다. 외인성 분자는 또한 또 다른 종에서 일반적으로 발견되는 분자, 예를 들어 동물의 게놈 내로 도입된 인간 서열일 수 있다.

여러 가지 중에서, 외인성 분자는 조합 화학 공정에 의해 생성된 것과 같은 소분자, 또는 단백질, 핵산, 탄수화물, 지질, 당단백질, 지단백질, 다당류, 상기 분자의 임의의 변형 유도체, 또는 상기 분자 중 하나 이상을 포함하는 임의의 복합체와 같은 거대분자일 수 있다. 핵산은 DNA 및 RNA를 포함하며, 단일- 또는 이중-가닥일 수 있고, 선형, 분지 또는 환형일 수 있으며, 임의의 길이일 수 있다. 핵산은 이중체를 형성할 수 있는 것 뿐만 아니라 삼중체-형성 핵산을 포함한다. 예를 들어, 미국 특허 제5,176,996호 및 제5,422,251호를 참조한다. 단백질은 DNA-결합 단백질, 전사 인자, 염색질 리모델링 인자, 메틸화된 DNA 결합 단백질, 폴리머라아제, 메틸라아제, 디메틸라아제, 아세틸라아제, 디아세틸라아제, 키나아제, 포스파타아제, 인테그라아제, 재조합효소, 리가아제, 토포이소머라아제, 기라아제(gyrase) 및 헬리카아제를 포함하나, 이에 제한되지 않는다.

외인성 분자는 내인성 분자로서의 동일한 유형의 분자, 예컨대 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 세포 내로 도입되는 감염성 바이러스 게놈, 플라스미드 또는 에피솜, 또는 세포 내에 일반적으로 존재하지 않는 염색체를 포함할 수 있다. 세포 내로 외인성 분자를 도입하는 방법은 본 기술분야의 숙련자에게 공지되어 있으며, 이는 지질-매개 전달(즉, 중성 및 양이온성 지질을 포함하는 리포좀), 전기천공법, 직접 주사, 세포 융합, 입자 충격(particle bombardment), 인산칼슘 침전법, DEAE-덱스트란-매개 전달 및 바이러스 벡터-매개 전달을 포함하나, 이에 제한되지 않는다.

그에 반해서, "내인성" 분자는 특정 환경 조건 하에서 특정 발달 단계에 있는 특정 세포 내에 일반적으로 존재하는 것이다. 예를 들어, 내인성 핵산은 염색체, 미토콘드리아, 엽록체 또는 다른 세포 기관의 게놈, 또는 자연적으로 발생하는 에피솜 핵산을 포함할 수 있다. 부가적인 내인성 분자는 단백질, 예를 들어, 전사 인자 및 효소를 포함할 수 있다.

"융합" 분자는 둘 이상의 소단위(subunit) 분자가, 바람직하게는 공유적으로 연결된 분자이다. 상기 소단위 분자는 동일한 화학적 유형의 분자이거나, 상이한 화학적 유형의 분자일 수 있다. 첫 번째 유형의 융합 분자의 예는 융합 단백질(예를 들어, TALE-반복 도메인 및 절단 도메인 간의 융합) 및 융합 핵산(예를 들어, 전술한 융합 단백질을 코딩하는 핵산)을 포함하나, 이에 제한되지 않는다. 두 번째 유형의 융합 분자의 예는 삼중체-형성 핵산 및 폴리펩타이드 간의 융합, 및 작은 홈(minor groove) 결합제와 핵산 간의 융합을 포함하나, 이에 제한되지 않는다.

세포에서 융합 단백질의 발현은 융합 단백질을 세포에 전달하거나 융합 단백질을 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 야기될 수 있으며, 여기에서 상기 폴리뉴클레오티드는 전사되고 상기 전사체는 번역되어 융합 단백질을 생성한다. 트랜스-접합(Trans-splicing), 폴리펩타이드 절단 및 폴리펩타이드 결찰(ligation)이 또한 세포 내 단백질 발현에 관여할 수 있다. 폴리뉴클레오티드 및 폴리펩타이드를 세포에 전달하는 방법은 본 개시 내의 다른 곳에 제시되어 있다.

본 개시의 목적을 위해, "유전자"는 유전자 산물을 코딩하는 DNA 영역(하기 참조) 뿐만 아니라 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함하며, 상기 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지 여부에 관계없이 그러하다. 따라서, 유전자는 프로모터 서열, 종결자, 리보솜 결합 부위 및 내부 리보솜 도입 부위와 같은 번역 조절 서열, 인핸서, 사일런서(silencer), 절연체(insulator), 경계 요소, 복제 원점, 매트릭스 부착 부위 및 위치 제어 영역을 포함하나, 반드시 이에 제한되지는 않는다.

"유전자 발현"은 유전자 내에 함유된 정보를 유전자 산물로 변환하는 것을 지칭한다. 유전자 산물은 유전자의 직접적인 전사 산물(예컨대, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA, shRNA, RNAi, miRNA 또는 임의의 다른 유형의 RNA)이거나 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한 캡핑(capping), 폴리아데닐화, 메틸화, 및 편집과 같은 공정에 의해 변형된 RNA, 및 예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의해 변형된 단백질을 포함한다.

"갭 크기(gap size)"는 핵산 표적 상의 두 개의 TALE 표적 부위 간의 뉴클레오티드를 지칭한다. 갭은 1 내지 100개의 염기쌍, 또는 5 내지 30개의 염기쌍, 바람직하게는 10 내지 25개의 염기쌍, 및 더욱 바람직하게는 12 내지 21개의 염기쌍을 포함하나 이에 제한되지 않는 임의의 크기일 수 있다. 따라서, 바람직한 갭 크기는 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 21개의 염기쌍일 수 있다.

유전자 발현의 "조절(modulation)"은 유전자의 활성 변화를 지칭한다. 발현의 조절은 유전자 활성화 및 유전자 억제를 포함할 수 있으나, 이에 제한되지 않는다. 게놈 편집(예컨대, 절단, 변화, 불활성화, 공여체 삽입, 무작위 돌연변이)이 발현을 조절하는데 사용될 수 있다. 유전자 불활성화는 본원에 기술된 변형제를 포함하지 않는 세포와 비교하여 유전자 발현의 임의의 감소를 지칭한다. 따라서, 유전자 불활성화는 부분적이거나 전체적일 수 있다.

"관심대상 영역"은, 예를 들어, 유전자 또는 유전자 내 또는 이에 인접한 비코딩 서열과 같은, 세포 염색질의 임의의 영역으로서, 상기 서열은 외인성 분자에 결합하는 것이 바람직하다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합을 위한 것일 수 있다. 관심대상 영역은, 예를 들어 염색체, 에피솜, 세포 기관의 게놈(예컨대, 미토콘드리아, 엽록체), 또는 감염성 바이러스 게놈 내에 존재할 수 있다. 관심대상 영역은 유전자의 코딩 영역 내에, 예를 들어 리더 서열, 트레일러(trailer) 서열 또는 인트론과 같이 전사된 비코딩 영역 내에, 또는 상기 코딩 영역의 상류 또는 하부의 전사되지 않은 영역 내에 존재할 수 있다. 관심대상 영역은 단일 뉴클레오티드 쌍만큼 작거나 최대 2,000 뉴클레오티드 쌍의 길이이거나, 또는 임의의 정수값의 뉴클레오티드 쌍일 수 있다.

용어 "작동성 연결(operative linkage)" 및 "작동적으로 연결된 " (또는 "작동가능하게 연결된")은 두 가지 이상의 성분들(예컨대, 서열 요소들)의 병치(juxtaposition)와 관련하여 상호교환적으로 사용되며, 여기에서 상기 성분들은 두 가지 성분들이 정상적으로 기능하고 적어도 하나의 다른 성분에 대해 수행되는 기능을 적어도 하나의 성분이 매개할 수 있는 가능성을 허용한다. 예시로써, 프로모터와 같은 전사 조절 서열은, 상기 전사 조절 서열이 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어하는 경우, 상기 코딩 서열에 작동적으로 연결된다. 전사 조절 서열은 일반적으로 코딩 서열과 시스(cis)로 연결되지만, 그것에 직접 인접할 필요는 없다. 예를 들어, 인핸서는 코딩 서열에 작동적으로 연결된 전사 조절 서열이지만, 그럼에도 불구하고 이들은 인접하지 않는다.

융합 폴리펩타이드와 관련하여, 용어 "작동적으로 연결된"은 각각의 성분들이 다른 성분과의 연결에서, 연결되지 않을 경우에 기능을 수행할 것과 동일한 기능을 수행한다는 사실을 지칭할 수 있다. 예를 들어, TALE-반복 도메인이 절단 도메인에 융합된 융합 폴리펩타이드와 관련하여, 만약 상기 융합 폴리펩타이드에서 TALE-반복 도메인 부분이 그 표적 부위 및/또는 그 결합부위에 결합할 수 있는 한편, 상기 절단 도메인은 표적 부위 근처에서 DNA를 절단할 수 있다면, 상기 TALE-반복 도메인 및 절단 도메인은 작동적으로 연결되어 있다.

단백질, 폴리펩타이드 또는 핵산의 "기능적 단편"은 서열이 전장 단백질, 폴리펩타이드 또는 핵산과 동일하지는 않지만 전장 단백질, 폴리펩타이드 또는 핵산과 비교하여 동일하거나 향상된 기능을 보유하는 단백질, 폴리펩타이드 또는 핵산이다. 또한, 기능적 단편은 전장 단백질, 폴리펩타이드 또는 핵산보다 낮은 기능을 갖지만 사용자에 의해 지정된 충분한 기능을 여전히 가질 수 있다. 기능적 단편은 대응되는 본래의 분자보다 더 많거나, 더 적거나, 동일한 수의 잔기를 가질 수 있고/거나, 하나 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산의 기능(예컨대, 코딩 기능, 또는 다른 핵산에 혼성화하는 능력)을 결정하는 방법은 본 기술분야에 널리 공지되어 있다. 유사하게, 단백질 기능을 결정하는 방법이 널리 공지되어 있다. 예를 들어, 폴리펩타이드의 DNA-결합 기능은, 예를 들어, 필터-결합, 전기영동 이동도 분석, 또는 면역침전 분석에 의해 결정될 수 있다. DNA 절단은 겔 전기영동에 의해 분석될 수 있다. 전술한 문헌[Ausubel et al..]을 참조한다. 다른 단백질과 상호작용하는 단백질의 능력은, 예를 들어, 유전적 및 생화학적인, 공동-면역침전, 이중-하이브리드(two-hybrid) 분석 또는 상보성에 의해 결정될 수 있다. 예를 들어, 문헌[Fields et al . (1989) Nature 340:245-246; 미국 특허 제5,585,245호 및 PCT 제WO 98/44350호]을 참조한다.

TALE-반복 도메인은, 예를 들어 초가변 이잔기(diresidue) 영역, 예를 들어 TALE 단백질 내의 반복 단위 중 위치 12 및/또는 13의 조작(하나 이상의 아미노산의 변화)을 통해, 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 일부 구체예에서, 위치 4, 11, 및 32에 있는 아미노산들이 조작될 수 있다. 다른 구체예에서, 비정형적인 RVD가 조작된 TALE 단백질에서 사용하기 위해 선발될 수 있으며, 이는 광범위한 비-자연적인 표적 부위를 명시한다. 예를 들어, NK RVD가 표적 서열 내의 G 뉴클레오티드를 인식하는데 사용하기 위해 선발될 수 있다. 다른 구체예에서, 반복 단위의 특징(즉, 안정성 또는 이차 구조)을 바꾸기 위해 반복 단위 내의 아미노산들이 변화될 수 있다. 그러므로, 조작된 TALE 단백질은 비-자연적으로 발생하는 단백질이다. 일부 구체예에서, TALE 반복 도메인을 코딩하는 유전자는, TALE 반복 아미노산을 지정하는 코돈이 바뀌었지만 지정된 아미노산은 바뀌지 않도록(예컨대, 코돈 최적화의 공지 기법을 통함) DNA 수준에서 조작된다. 조작된 TALE 단백질의 비제한적인 예는 설계 및/또는 선발에 의해 얻어지는 것이다. 설계된 TALE 단백질은 그 설계/조성이 주로 합리적인 기준으로부터 비롯되는 자연에서 발생하지 않는 단백질이다. 설계를 위한 합리적인 기준은, 종래의 TALE 설계 및 결합 데이터의 정보를 저장하는 데이터베이스에서 정보를 처리하기 위한 대체 규칙(substitution rule) 및 컴퓨터 알고리즘의 응용을 포함한다. "선발된" TALE-반복 도메인은 주로 파아지 디스플레이, 상호작용 트랩(interaction trap) 또는 하이브리드 선발과 같은 시험 공정으로부터 생산되는, 비-자연적으로 발생하는 도메인 또는 비정형적인 도메인이다.

"다량체화 도메인"은 TALE-융합 단백질의 아미노, 카르복시 또는 아미노 및 카르복시 말단 영역에서 통합된 도메인이다. 이들 도메인은 다수의 TALE-융합 단백질 단위들의 다량체화를 가능하게 한다. 다량체화 도메인의 예는 류신 지퍼를 포함한다. 다량체화 도메인은 또한 소분자에 의해 조절될 수 있으며, 여기에서 다량체화 도메인은 소분자 또는 외부 리간드의 존재하에만 또 다른 다량체화 도메인과 상호작용을 허용하는 적절한 형태일 것으로 추정된다. 이러한 방식으로, 외인성 리간드가 이들 도메인의 활성을 조절하는데 사용될 수 있다.

상기 방법에 유용한 표적 부위는 다른 기준에 의해 평가되거나 상기 부위에 특이적인 TALE-융합 단백질의 설계 또는 선발(필요한 경우) 및 생산에 직접적으로 사용될 수 있다. 잠재적인 표적 부위를 평가하기 위한 추가 기준은 유전자 내의 특정 영역에 대한 이들의 근접성이다. 표적 부위는, 조절 서열과 같이, 표적 유전자와 입증가능한 생물학적 유의성을 갖는 분절을 반드시 포함하거나 중첩되지는 않도록 선발될 수 있다. 표적 분절을 평가하기 위한 다른 기준은 상기 분절 또는 관련 분절에 결합하는 TALE-융합 단백질의 우선하는 이용가능성, 및/또는 제시된 표적 분절에 결합하는 새로운 TALE-융합 단백질을 설계하는 것의 편의성을 포함한다.

표적 분절이 선발된 이후, 상기 분절에 결합하는 TALE-융합 단백질은 다양한 접근법에 의해 제공될 수 있다. 일단 TALE-융합 단백질이 선발되거나, 설계되거나, 제시된 표적 분절에 제공되면, 상기 TALE-융합 단백질 또는 이를 코딩하는 DNA가 합성된다. TALE-반복 도메인-함유 단백질을 코딩하는 DNA를 합성하고 발현하는 예시적인 방법들이 하기에 기술되어 있다. TALE-융합 단백질 또는 이를 코딩하는 폴리뉴클레오티드는 TALE-융합 단백질이 결합하는 표적 부위를 함유하는 표적 유전자의 발현의 조절 또는 분석에 사용될 수 있다.

TALE DNA 결합 도메인

본원에 기술된 폴리펩타이드들은 하나 이상(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상)의 TALE-반복 단위를 포함한다. 특이성을 담당하는 서열을 결정하기 위해, 다수의 TALE-반복 단위를 포함하는 TALE DNA 결합 도메인이 연구되어 왔다. 하나의 생물 내에, TALE 반복은 통상적으로 고도로 보존되어 있지만(RVD의 경우는 제외), 다른 종에서는 잘 보존되지 않을 수 있다.

본원에 기술된 폴리펩타이드에서 발견되는 TALE-반복 단위는 일반적으로 하기의 형태이다: X¹-X²-X³-X⁴-X⁵-X⁶-X⁷-X⁸-X⁹-X¹⁰-X¹¹-(X^RVD)₂-(X)_20-22(SEQ ID NO: 399), 여기에서 X는 임의의 아미노산이고 X^RVD (위치 12 및 13)는 DNA 결합에 관여한다. 상기 도메인의 비제한적인 예시적인 구체예들은 X¹이 류신(L), 또는 메티오닌(M) 잔기를 포함하는 구체예; X¹⁰이 알라닌(A) 잔기 또는 발린(V) 잔기를 포함하는 구체예; (X)_20-22가 서열(Gly 또는 Ser)-(X)_19-21(SEQ ID NO: 400)을 포함하는 구체예; (X)_20-22가 서열 (X)_3-4-(Ala 또는 Thr)-(X)_16-17(SEQ ID NO: 401)을 포함하는 구체예; (X)_20-22가 서열 (X)_4-5-(Leu 또는 Val)-(X)_15-16(SEQ ID NO: 402)을 포함하는 구체예; 및 상기 임의의 구체예의 조합(예컨대, X¹이 류신(L) 또는 메티오닌(M) 잔기를 포함하고 X¹⁰이 알라닌(A) 잔기를 포함하며; X¹이 L 또는 M을 포함하고 (X)_20-22가 서열 Gly/Ser-(X)_19-21을 포함하며; (X)_20-22가 서열 Gly/Ser-(X)_2-3-Ala/Thr-(X)_16-17을 포함하고; X¹⁰ 이 알라닌(A) 또는 발린(V) 잔기를 포함하고 (X)_20-22가 서열 Gly/Ser-(X)_19-21을 포함하는 등)을 포함한다.

본원에 기술된 조성물 및 방법의 TALE-반복 단위는 임의의 적합한 TALE-단백질로부터 유래될 수 있다. TALE 단백질의 비제한적인 예는 랄스토니아 종(Ralstonia spp .) 또는 잔토모나스 종(Xanthamonas spp .)으로부터 유래된 TALE 단백질을 포함한다. 따라서, 일부 구체예에서, 상기 DNA-결합 도메인은 식물 병원균 잔토모나스로부터 유래된 하나 이상의 자연적으로 발생하고/거나 조작된 TALE-반복 단위를 포함한다(Boch et al, (2009) Science 326: 1509-1512 및 Moscou and Bogdanove, (2009) Science 326: 1501 참조). 다른 구체예에서, 상기 DNA-결합 도메인은 식물 병원균 랄스토니아 솔라나세아룸(Ralstonia solanacearum)으로부터 유래된 하나 이상의 자연적으로 발생하고/거나 조작된 TALE-반복 단위를 포함하거나, TALE 단백질 패밀리로부터 유래된 다른 TALE DNA 결합 도메인을 포함한다. 본원에 기술된 TALE DNA 결합 도메인(적어도 하나의 TALE 반복 단위를 포함함)은 (i) 자연에서 발견되지 않는 하나 이상의 TALE 반복 단위; (ii) 하나 이상의 자연적으로 발생하는 TALE 반복 단위; (iii) 비정형적인 RVD를 갖는 하나 이상의 TALE 반복 단위; 및 (i), (ii) 및/또는 (iii)의 조합을 포함할 수 있다. 일부 구체예에서, 본 발명의 TALE DNA 결합 도메인은 완전히 비-자연적으로 발생하는 반복 단위 또는 비정형적인 반복 단위로 이루어진다. 나아가, 둘 이상의 TALE-반복 단위를 포함하는 본원에 기술된 폴리펩타이드에서, TALE-반복 단위(자연적으로 발생하는 또는 조작됨)는 동일한 종으로부터 유래되거나, 대안적으로 상이한 종으로부터 유래될 수 있다.

표 1은 두 개의 TALE 단백질 내의 예시적인 반복 단위의 정렬을 보여준다. 각 TALE 반복이 별개의 선 위에 나타나 있으며, 각 컬럼은 반복 유형, 상기 반복의 출발 위치, 상기 반복의 이름, 초가변 위치에 있는 잔기, 및 전체 반복 서열을 나타낸다.

[표 1]

크산토모나스로부터의 2개의 TALE로부터 TALE DNA 결합 도메인의 비교

수개의 TALE DNA 결합 단백질을 확인하였으며 AAB00675.1,(13.5 TALE 반복), AAB69865.1 (13.5 반복), AAC43587.1 (17.5 반복), AAD01494.1 (12.5 반복), AAF98343.1 (25.5 반복), AAG02079.2 (25.5 반복), AAN01357.1 (8.5 반복), AAO72098 (17.5 반복), AAQ79773.2 (5.5 반복), AAS46027.1 (28.5 반복), AAS58127.2 (13.5 반복), AAS58128.2 (17.5 반복), AAS58129.3 (18.5 반복), AAS58130.3(9.5 반복), AAT46123.1 (22.5 반복), AAT46124.1 (26.5 반복), AAW59491.1 (5.5 반복), AAW59492.1 (16.5 반복), AAW59493.1 (19.5 반복), AAW77510.1 (5.5 반복), AAY43358 (21.5 반복), AAY43359.1 (11.5 반복), AAY43360.1 (14.5 반복), AAY54166.1 (19.5 반복), AAY54168.1 (16.5 반복), AAY54169.1 (12.5 반복), AAY54170.1 (23.5 반복), ABB70129.1 (21.5 반복), ABB70183.1 (22.5 반복), ABO77779.1 (17.5 반복) 등을 포함하는, 표준 유전자은행(GenBank) 조사에서 찾을 수 있다.

TALE형 단백질은 또한 세균 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서 발견되었으며 표 2는 이들 DNA 결합 도메인의 2개 예들의 유사한 비교를 나열한다:

[표 2]

랄스토니아로부터의 2개의 TALE로부터 TALE DNA 결합 도메인의 비교

랄스토니아로부터의 TALE 형 단백질의 추가의 예는 ABO27069.1 (10.5 반복), ABO27070.1 (11.5 반복), ABO27071.1 (7.5 반복), ABO27072.1 (3.5 반복) 등을 포함한다.

본원에 기술된 바와 같은 TALE-반복체 도메인을 포함하는 DNA-결합 폴리펩타이드는 또한 추가의 TALE 폴리펩타이드 서열, 예를 들면 N-말단 (N-캡) 서열 및, 임의로, 반복체 도메인을 플랭킹(flanking)하는 C-말단 (C-캡) 서열을 포함할 수 있다. N-캡 서열은 DNA-결합 폴리펩타이드 및 이러한 TALE-반복체 도메인-함유 DNA-결합 폴리펩타이드를 포함하는 융합 단백질의 기능(예를 들면, DNA-결합, 절단, 활성화 등)을 지지하기에 충분한 특정 길이의 천연적으로 또는 비-천연적으로 존재하는 서열일 수 있다. 특정 구현예에서, 상기 단백질은 반복체 도메인에 대해 TALE 단백질 N-말단의 영역의 단편(절단부)을 포함하는 N-캡 서열(예를 들면, 반복체 도메인의 TALE 폴리펩타이드 N-말단의 적어도 130 내지 140개 잔기(예를 들면 131, 132, 133, 134, 135, 136, 137, 138, 139 또는 140개 잔기)를 포함하는 N-캡 서열)을 포함한다. 다른 구현예에서, 본원에 기술된 단백질로서 TALE-반복체 도메인 폴리펩타이드는 반복체 도메인에 대해 TALE 단백질 C-말단의 단편(트렁케이트된; truncated) 영역을 포함하는 C-캡 서열(예를 들면, C-20 내지 C+28, C-20 내지 C+55, 또는 C-20 내지 C+63을 포함하는 C-캡 서열)을 포함한다. 특정 구현예에서, C-캡 서열은 반-반복체(half-repeat)(C-20 내지 C-1)를 포함한다. 본원에 기술된 TALE DNA-결합 폴리펩타이드는 N-캡, C-캡 서열 또는 N-캡과 C-캡 서열 둘다를 포함할 수 있다.

표 1 및 2에 나타낸 TALE 반복체의 완전한 단백질 서열(TALE 반복체 도메인, 및 또한 N-말단 및 C-말단 서열을 포함함)은 하기 표 3에 나타낸다. 표 1 및 2의 TALE 반복체 서열은 굵은 글씨로 나타낸다.

[표 3]

유전자은행 수탁 번호 제 AAA27592 .1호, 제 AAA92974 .1호, 제 ABO27067 .1호 및 제A BO270 68.1호에 대한 완전한 아미노산 서열.

인공 TALE 단백질 및 TALE 융합 단백질을 생산하여 천연의 또는 조작된 TALE 반복체 단위를 사용하여 신규 서열에 결합시킬 수 있다[참조: Boch et al, ibid and Morbitzer et al, (2010) Proc. Natl. Acad. Sci.USA 107(50):21617-21622]. 또한, 예를 들면, 제WO 2010/079430호를 참조한다. 당해 신규 표적 서열을 식물 세포내 리포터 유전자의 상부에 삽입한 경우, 연구자들은 리보터 유전자의 활성화를 입증할 수 있었다. FokI 절단 도메인을 포함하는 인공의 TALE 융합체는 또한 살아있는 세포내에서 DNA를 절단할 수 있다[참조: Christin et al, ibid, Li et al (2011a) and (2011b) ibid, Cernak et al (2011) Nucl. Acid. Res. epub doi:10.1093/nar/gcr218].

조작된 TALE 단백질 및 TALE 융합 단백질은 천연적으로 존재하는 TALE 단백질과 비교하여 신규한 결합 특이성을 지닐 수 있다. 가공 방법은 합리적인 설계 및 각종 유형의 선택을 포함하나, 이에 한정되지 않는다. 합리적인 설계는 예를 들면, 단일 또는 다수의 TALE 반복체에 대한 모듈을 위한 뉴클레오타이드 서열을 포함하는 데이타베이스를 사용함을 포함한다. 파아지 디스플레이 및 2-하이브리드 시스템을 포함하는 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 및 또한 WO　98/37186; WO　98/53057; WO　00/27878; WO　01/88197 및 GB 2,338,237에 기재되어 있다. 천연적으로 존재하는 TALE 단백질에서는, 잠재적인 디펩타이드 모티프(motif)의 제한된 레퍼토리(repertoire)만을 전형적으로 사용한다. 따라서, 본원에 기술된 바와 같이, 모든 가능한 모노- 및 디-펩타이드 서열을 함유하는 TALE 관련 도메인이 제작(constructing)되어 후보 TALE 단백질내로 조립되어 왔다. 따라서, 특정 구현예에서, DNA-결합 단백질의 하나 이상의 TALE-반복체 단위는 비전형적인 RVDs를 포함한다.

또한, 동일한 종의 천연적으로 존재하는 TALE 단백질에서, 반복체 단위는 흔히 골격 서열[즉, 직접적인 DNA 접촉(비-RVD 잔기)에 관여되지 않은 잔기(들)]내에 가변성을 거의 나타내지 않는다. 이러한 가변성의 결여는 개개의 TALE 반복체 단위들 사이의 진화적 관계 및 인접한 반복체들 사이의 단백질 폴딩(folding) 요건을 포함하는 다수의 인자들에 기인할 수 있다. 그러나, 상이한 식물병원성 세균종들(phytopathogenicbacterial species) 사이에서 골격 서열은 변할 수 있다. 예를 들면, 크산토모나스 캄페스트리스 피브이 베시카토리아(Xanthomonas campestris pv vesicatoria), 단백질 AvrBs3내 TALE 반복체 서열은 랄스토니아 솔라나세아룸(Ralstonia solanacearum)으로부터의 brg11 및 hpx17 반복체 단위와 40% 미만의 상동성을 가진다[참조: Heuer et al (2007) Appl Environ Micro 73 (13): 4379-4384]. TALE 반복체는 각각의 세균의 천연 환경에서, 예를 들면, TALE이 조절하는 숙주 식물에서 유전자의 서열로부터 엄격한 기능적 선택(stringent functional selection)하에 존재할 수 있다. 따라서, 본원에 기술된 바와 같이, TALE 골격(예를 들면, TALE 반복체 단위내에서 또는 N-캡 및 C-캡 서열과 같은 단복체 단위 외부의 서열)내 변이체는 당해 분야에 공지된 각종 방법에 의해 표적화되거나 무작위한 돌연변이유발에 의해 도입될 수 있으며, 수득되는 TALE 융합 단백질은 최적 활성에 대해 스크리닝하였다.

다수 TALE 반복체 모듈은 또한 상기 기술된 바와 같이 DNA 결합 도메인(적어도 하나의 TALE 반복체 단위 포함)의 조립 뿐만 아니라, 또한 미니-TALE 다합체(즉, 삽합체, 사합체, 오합체 등)의 조립에도 유용할 수 있으며, 여기서, 미니-TALE DNA 결합 도메인 사이의 캡핑 영역(capping region)으로서 기능화된 스패닝 링커(spanning linker)는 염기 스키핑(base skipping)을 허용할 수 있으며 보다 큰 DNA 결합 특이성을 생성할 수 있다. 연결된 미니-TALE DNA 결합 도메인의 사용은 개개의 TALE 반복체들의 수준에서 엄격한 기능적 모듈방식(modularity)에 대한 요건을 완화시킬 수 있으며 보다 복잡하고/하거나 특이적인 DNA 인식 계획의 발달을 허용하며, 여기서, 제공된 모듈내 인접한 모티프로부터의 아미노산은 목적하는 DNA 표적 서열의 협동적인 인식을 위해 서로 자유로이 상호작용할 수 있다. 미니-TALE DNA 결합 도메인은 무작위처리된 디펩타이드 모티프들(또는 특정의 다른 확인된 주요 위치들)을 지닌 적합한 선택 시스템을 사용하여 연결시키고 발현시키며 이들의 핵산 결합 특성들을 기준으로 하여 선택할 수 있다. 대안적으로, 다수-TALE 반복체 모듈을 사용하여 반복체 모듈의 구조를 생성함으로써 어떠한 특이적인 목적하는 TALE-융합 단백질의 신속한 제작를 허용할 수 있다.

융합 단백질들(및 이를 암호화하는 폴리뉴클레오타이드들)의 설계 및 제작를 위한 표적 부위 및 방법의 선택은 당해 분야의 숙련가에게 공지되어 있으며 본원에 이들의 전문들이 참조로 혼입된 미국 특허원 공보 20050064474 및 20060188987에 상세히 설명되어 있다.

TALE DNA 결합 도메인을 아연 핑거(zinc finger) DNA 결합 도메인에 연결시키는 인공 융합 단백질을 또한 생산할 수 있다. 이들 융합체는 또한 목적하는 기능적 도메인에 추가로 연결시킬 수 있다.

또한, 이들 및 다른 참조 문헌들에 기재되어 있는 바와 같이, TALE DNA 결합 도메인 및/또는 아연 핑거 도메인은, 비록 캡핑 서열(N-캡 및 C-캡 서열들)로서 기능할 수 있는 서열들이 TALE 반복체 도메인과 링커 사이의 계면에서 요구될 수 있다고 해도, 예를 들면, 길이가 5개 이상의 아미노산인 링커[예를 들면, TGEKP(SEQ ID NO:48), TGGQRP(SEQ ID NO:49), TGQKP (SEQ ID NO:50), 및/또는 TGSQKP (SEQ ID NO:51)]를 포함하는 어떠한 적합한 링커 서열을 함께 사용하여 연결시킬 수 있다. 따라서, 링커들이 사용되는 경우, 5개 이상의 아미노산의 링커들이 cap 서열들과 함께 사용되어 TALE DNA 결합 도메인들을 목적하는 융합 파트너 도메인에 결합시킬 수 있다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열들에 대해서는 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 또한, TALE 반복체 도메인과 융합된 기능적 단백질 도메인 사이의 링커를 제작하여 유연하거나 위치적으로 구속되도록 함으로써 가장 효율적인 게놈 변형을 허용할 수 있다. 길이와 조성이 다양한 링커들을 시험할 수 있다.

융합 단백질들

본원에 기술된 바와 같은 DNA-결합 단백질(예를 들면, TALE-융합 단백질) 및 이종 조절 또는 기능적 도메인(또는 이의 기능적 단편)을 포함하는 융합 단백질들 또한 제공된다. 일반적인 도메인들은 예를 들면, 전사 인자 도메인들(활성인자들, 억제인자들(repressors), 보조-활성인자들, 보조-억제인자들), 뉴클레아제 도메인들, 사일런서 도메인들, 종양유전자 도메인들(예를 들면, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 계열 구성원들 등); DNA 복구 효소들 및 이들의 관련된 인자들 및 변형인자들; DNA 재배열 효소들 및 이들의 관련 인자들 및 변형인자들; 크로마틴 관련된 단백질들 및 이들의 변형인자들(예를 들면, 키나제들, 아세틸라제들 및 데아세틸라제들); 및 DNA 변형 효소들(예를 들면, 메틸트랜스퍼라제들, 토포이소머라제들, 헬리카제들, 리가제들, 키나제들, 포스파타제들, 폴리머라제들, 엔도뉴클레아제들), DNA 표적화 효소들, 예를 들면, 트랜프포손들, 인테그라제들, 레컴비나제들 및 레솔바제들 및 이들의 관련 인자들 및 변형인자들, 핵 호르몬 수용체들, 뉴클레아제들(절단 도메인들 또는 반-도메인들(half-domains)) 및 리간드 결합 도메인들을 포함한다. 다른 융합 단백질들은 수용체 또는 선택 마커들을 포함할 수 있다. 리포터 도메인들의 예들은 GFP, GUS 등을 포함한다. 식물 세포들에서 특수 유용성을 갖는 리포터들은 GUS를 포함한다.

활성화를 달성하기에 적합한 도메인들은 HSV VP16 활성화 도메인[참조: 예를 들면, Hagmann et al., J. Virol. 71, 5952-5962 (1997)] 핵 호르몬 수용체들[참조: 예를 들면, Torchia et al., Curr. Opin. Cell. Biol. 10:373-383 (1998)]; 핵 인자 카파 B의 p65 소단위[참조: Bitko & Barik, J. Virol. 72:5610-5618 (1998) 및 Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28 (1998)], 또는 인공 키메라 기능성 도메인, 예를 들면, VP64[참조: Beerli et al., (1998) Proc. Natl. Acad. Sci. USA 95:14623-33], 및 데그론[참조: Molinari et al., (1999) EMBO J. 18, 6439-6447]을 포함한다. 추가의 예시적인 활성화 도메인들은 Oct 1, Oct-2A, Sp1, AP-2, 및 CTF1[참조: Seipel et al., EMBO J. 11, 4961-4968 (1992)] 및 또한 p300, CBP, PCAF, SRC1 PvALF, AtHD2A 및 ERF-2를 포함한다. 예를 들면, Robyr et al. (2000) Mol. Endocrinol. 14:329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3-12; Malik et al. (2000) Trends Biochem. Sci. 25:277-283; 및 Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504를 참조한다. 추가의 예시적인 활성화 도메인은 OsGAI, HALF-1, C1, AP1, ARF-5,-6,-7, 및 -8, CPRF1, CPRF4, MYC-RP/GP, 및 TRAB1을 포함하나, 이에 한정되지 않는다. 예를 들면, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et al. (1999) Proc. Natl. Acad. Sci. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol. Biol. 41:33-44; 및 Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96:15,348-15,353을 참조한다.

본원에 기술된 바와 같은 DNA-결합 도메인과 기능적 도메인 사이의 융합 단백질(또는 이를 암호화하는 핵산)의 형성시, 활성화 도메인과 상호작용하는 활성화 도메인 또는 분자가 기능적 도메인으로 적합하다는 것은 당해 분야의 숙련가에게 명백할 것이다. 필수적으로 표적 유전자에 활성화 복합체 및/또는 활성화 활성(예를 들면, 히스톤 아세틸화와 같은)을 보충할 수 있는 어떠한 분자도 융합 단백질의 활성화 도메인으로서 유용하다. ISWI-함유 도메인들 및/또는 융합 분자에서 기능성 도메인들로서 사용하기에 적합한 메틸 결합 도메인 단백질들과 같은 인슐레이터(insulator) 도메인들, 국재화 도메인들, 및 크로마틴 리모델링 단백질들은 예를 들면 공동-소유의 미국 특허원 2002/0115215 및 2003/0082552 및 공동-소유의 WO 02/44376에 기술되어 있다.

예시적인 억제 도메인들은 KRAB A/B, KOX, TGF-베타-유도성 얼리 유전자(TGF-beta-inducible early gene (TIEG), v-erbA, SID, MBD2, MBD3, DNMT 계열의 구성원들(예를 들면, DNMT1, DNMT3A, DNMT3B), Rb, 및 MeCP2를 포함하나, 이에 한정되지 않는다[참조: 예를 들면, Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; 및 Robertson et al. (2000) Nature Genet. 25:338-342]. 추가의 예시적인 억제 도메인들은 ROM2 및 AtHD2A를 포함하나, 이에 한정되지 않는다[참조: 예를 들면, Chem et al. (1996) Plant Cell 8:305-321; and Wu et al. (2000) Plant J. 22:19-27].

특정 구현예에서, TALE-융합 단백질에 의해 결합된 표적 부위는 세포 크로마틴의 접근가능한 영역내에 존재한다. 접근가능한 영역은 예를 들면, 공동-소유의 국제 공보 WO 01/83732에 기술된 바와 같이 측정될 수 있다. 표적 부위가 세포 크로마틴의 접근가능한 영역내에 존재하지 않는 경우, 하나 이상의 접근가능한 영역은 공동-소유의 WO 01/83793에 설명된 바와 같이 생성될 수 있다. 추가의 구현예들에서, 융합 분자의 DNA-결합 도메인은, 이의 표적 부위가 접근가능한 영역내에 있는지 또는 없는지에 상관없이 세포 크로마틴에 결합할 수 있다. 예를 들면, 이러한 DNA-결합 도메인들은 링커 DNA 및/또는 뉴클레오솜 DNA에 결합할 수 있다. 이러한 유형의 "파이오니어(pioneer)" DNA 결합 도메인의 예들은 특정의 스테로이드 수용체 및 간세포 핵 인자 3(HNF3)에서 발견된다[참조: Cordingley et al. (1987) Cell 48:261-270; Pina et al. (1990) Cell 60:719-731; and Cirillo et al. (1998) EMBO J. 17:244-254].

융합 분자는 당해 분야의 숙련가에게 공지된 바와 같이, 약제학적으로 허용되는 담체와 함께 제형화될 수 있다(참조: 예를 들면, Remington's Pharmaceutical Sciences, 17th ed., 1985; 및 공동-소유의 WO 00/42219).

융합 분자의 기능적 성분/도메인은, 융합 분자가 이의 DNA 결합 도메인을 통해 표적 서열에 결합하면 유전자의 전사에 영향을 미칠 수 있는 각종의 상이한 성분 중 어느 것으로부터 선택될 수 있다. 따라서, 기능적 성분은 활성인자들, 억제인자들, 보조-활성인자들, 보조-억제인자들, 및 사일런서들(silencers)과 같은 각종 전사 인자 도메인들을 포함할 수 있으나, 이에 한정되지 않는다.

추가의 예시적인 기능성 도메인은 예를 들면, 공동-소유의 미국 특허 6,534,261 및 미국 특허원 공보 2002/0160940에 기재되어 있다.

외인성의 소 분자들 또는 리간드들에 의해 조절되는 기능성 도메인들이 또한 선택될 수 있다. 예를 들면, RheoSwitch^® 기술을 사용할 수 있으며, 여기서 기능성 도메인만이 외부 RheoChem^TM 리간드의 존재하에서 이의 활성 구조를 추정한다(참조: 예를 들면, US 20090136465). 따라서, TALE-융합 단백질은 조절가능한 기능성 도메인에 작동적으로 연결될 수 있으며, 여기서 TALE-융합 단백질의 수득된 활성은 외부 리간드에 의해 조절된다.

특정 구현예에서, TALE DNA-결합 단백질, 또는 이의 단편은 적어도 하나의 뉴클레아제(절단 도메인, 절단 반-도메인)에 대한 TALE DNA-결합 도메인의 융합(TALE-반복체 도메인, N-캡 및/또는 C-캡 서열들에 대한 N- 및/또는 C-말단)을 통해 뉴클레아제들로서 사용된다. 본원에 기재된 융합 단백질들의 절단 도메인 부위는 어떠한 엔도뉴클레아제 또는 엑소뉴클레아제로부터도 수득될 수 있다. 절단 도메인이 기원할 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제들 및 호밍 엔도뉴클레아제들(homing endonucleases)을 포함한다. 예를 들면, 2002-2003 Catalogue, New England Biolabs, Beverly, MA; and Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388을 참조한다. DNA를 절단하는 추가의 효소들은 공지되어 있다(예를 들면, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993 참조). 이들 효소들(또는 이의 기능성 단편들) 중 하나 이상은 절단 도메인들 및 절단 반-도메인들의 공급원으로서 사용될 수 있다.

유사하게, 절단 반-도메인은 상기 설정된 바와 같이, 절단 활성에 대한 이합체화를 필요로 하는 어떠한 뉴클레아제 또는 이의 일부로부터도 기원할 수 있다. 일반적으로, 융합 단백질이 절단 반-도메인들을 포함하는 경우 2개의 융합 단백질들이 절단에 필요하다. 대안적으로, 2개의 절단 반-도메인들을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 반-도메인들은 동일한 엔도뉴클레아제(또는 이의 기능성 단편)으로부터 기원할 수 있거나, 각각의 절단 반-도메인은 상이한 엔도뉴클레아제(또는 이의 기능성 단편)으로부터 기원할 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게는 서로와 관련하여 배치됨으로써 이들의 각각의 표적 부위들에 대한 2개의 융합 단백질의 결합은, 반-도메인들을 절단함으로써 예를 들면, 이합체화에 의해 기능성 절단 도메인을 형성하도록 하는 서로에 대해 공간적 배향으로 절단 반-도메인들을 위치시킨다. 따라서, 특정 구현예에서, 표적 부위들의 근처 가장자리는 5 내지 8개 뉴클레오타이드들 또는 15 내지 18개 뉴클레오타이드들에 의해 분리된다. 그러나, 뉴클레오타이드들 또는 뉴클레오타이드 쌍들의 어떠한 진정수(integral number)는 2개의 표적 부위들(예를 들면, 2 내지 50개의 뉴클레오타이드 쌍들 이상) 사이에 개입할 수 있다. 일반적으로, 절단 부위는 표적 부위들 사이에 놓여있다.

제한 엔도뉴클레아제들(제한 효소들)은 많은 종들에서 존재하며 DNA(인식 부위에서), 및 절단하는 DNA에 대해 결합 부위에서 또는 근처에서 서열-특이적으로 결합할 수 있다. 특정의 제한 효소(예를 들면, IIS 형)는 인식 부위로부터 제거된 부위에서 DNA를 절단하며 별개의 결합 및 절단 도메인들을 갖는다. 예를 들면, IIS형 효소 Fok　I은 하나의 쇄 상의 이의 인식 부위로부터의 9개 뉴클레오타이드들 및 다른 쇄의 이의 인식 부위로부터의 13개 뉴클레오타이드에서 DNA의 이본쇄 절단을 촉매한다. 예를 들면, 미국 특허 5,356,802; 5,436,150 및 5,487,994; 및 또한 Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982을 참조한다. 따라서, 하나의 구현예에서, 융합 단백질은 적어도 하나의 IIS형 제한 효소로부터의 절단 도메인(또는 절단 반-도메인) 및 가공되거나 가공되지 않을 수 있는 하나 이상의 TALE DNA-결합 도메인들을 포함한다.

절단 도메인들이 결합 도메인으로부터 분리가능한, 예시적인 IIS형 제한 효소들은 Fok　I 및 BfiI을 포함한다[참조: Zaremba et al, (2004) J Mol Biol. 336(1):81-92]. Fok 효소는 이합체로서 활성이다[참조: Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575]. 표적화된 이-본쇄된 절단 및/또는 TALE 반복체 도메인-Fok　I 융합체(또는 C-캡 및 N-캡을 추가로 포함하는 이의 변이체)를 사용하는 세포 서열의 표적화된 대체의 경우, 각각 FokI 절단 반-도메인을 포함하는 2개의 융합 단백질들을 사용하여 촉매적으로 활성인 절단 도메인을 재구성할 수 있다. 대안적으로, TALE-반복체 도메인 및 2개의 Fok　I 절단 반-도메인들을 함유하는 단일의 폴리펩타이드 분자를 또한 사용할 수 있다. 다른 바람직한 IIS형 제한 효소는 BfiI이다[참조: Zaremba et al, (2004) J Mol Biol . 336(1):81-92]. 당해 효소의 절단 도메인은 이의 DNA 결합 도메인으로부터 분리하여 TALE DNA 결합 도메인에 작동적으로 연결시킴으로써 TALEN을 생성할 수 있다.

절단 도메인 또는 절단 반-도메인은, 절단 활성을 보유하거나, 다합체화(예를 들면, 이합체화)하여 기능성 절단 도메인을 형성하는 능력을 보유하는 단백질의 어떠한 일부일 수 있다.

예시적인 IIS형 제한 효소들은 본원에 이의 전문이 혼입된 국제 공보 WO 07/014275에 기술되어 있다. 추가의 제한 효소들은 또한 별개의 결합 및 절단 도메인들을 함유하며, 이들은 본 기재내용에 의해 고려된다. 예를 들면, Roberts et al. (2003) Nucleic Acids Res. 31:418-420을 참조한다.

절단 특이성을 향상시키기 위하여, 특정 구현예에서, 절단 도메인은 예를 들면, 이들의 전문 모두가 본원에 참조로 혼입된, 미국 특허 공보 20050064474; 20060188987, 20080131962, 20090311787; 20090305346; 20110014616, 및 미국 특허원 12/931,660에 기술된 바와 같이, 단독이합체화를 최소화하거나 예방하는 하나 이상의 조작된 절단 반-도메인(또한 이합체화 도메인 돌연변이체들로 언급됨)을 포함한다. Fok I의 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538번 위치에서 아미노산 잔기들은 Fok I 절단 반-도메인들의 이합체화에 영향을 미치기 위한 모든 표적들이다.

필수 이종이합체를 형성하는 Fok I의 예시적인 조작된 절단 반-도메인들은, 제1의 절단 반-도메인이 Fok I의 490 및 538번 위치에서의 아미노산 잔기들에서 돌연변이들을 포함하며 제2의 절단 반-도메인은 486 및 499번 아미노산 잔기에서 돌연변이들을 포함한다.

필수 이종이합체를 형성하는 Fok I형의 추가의 조작된 절단 반-도메인들을 또한 본원에 기술된 융합 단백질들에 사용할 수 있다. 제1의 절단 반-도메인은 Fok I의 490 및 538번 위치에서의 아미노산 잔기들에서 돌연변이들을 포함하며 제2의 절단 반-도메인은 486 및 499번 아미노산 잔기들에서 돌연변이들을 포함한다.

따라서, 하나의 구현예에서, 490번에서 돌연변이는 Glu (E)를 Lys (K)로 대체하며; 538번에서 돌연변이는 Iso (I)를 Lys (K)로 대체하고; 486번에서 돌연변이는 Gln (Q)를 Glu (E)로 대체하며; 499번에서 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기술된 조작된 절단 반-도메인들은 하나의 절단 반-도메인내에서 490번 위치(E→K) 및 538번 위치(I→K)를 돌연변이시켜 "E490K:I538K"로 지정된 조작된 절단 반-도메인을 생산하고 다른 절단 반-도메인에서 486번 위치(Q→E) 및 499번 위치(I→L)을 돌연변이시켜 "Q486E:I499L"로 지정된 조작된 절단 반-도메인을 생산함으로써 제조하였다. 본원에 기술된 조작된 절단 반-도메인들은 필수 이종이합체 돌연변이체들이며, 여기서 일탈적인 절단(aberrant cleavage)은 최소화되거나 폐지된다. 예를 들면, 이의 기재내용 전체가 모든 목적을 위해 참조로 혼입된, 미국 특허 공보 2008/0131962의 실시예 1을 참조한다.

본원에 기술된 조작된 절단 반-도메인들은 필수 이종이합체 돌연변이들이며, 여기서 일탈적인 절단은 최소화되거나 폐지된다. 예를 들면, WO 07/139898의 실시예 1을 참조한다. 특정 구현예들에서, 조작된 절단 반-도메인은 486, 499 및 496번(야생형 FokI에 대한 번호매김)에서 돌연변이들, 예를 들면, 486번 위치에서의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로 대체하고, 499번 위치에서 야생형 Iso (I) 잔기를 Leu (L) 잔기로 대체하며 496번 위치에서 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체하는 돌연변이들을 포함한다(또한 "ELD" 및 "ELE" 도메인으로 각각 언급된다). 다른 구현예들에서, 조작된 절단 반-도메인은 490, 538 및 537번 위치(야생형 FokI에 대한 번호매김)에서 돌연변이들, 예를 들면 490번 위치에서 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체하고, 538번 위치에서 야생형 Iso (I) 잔기를 Lys (K) 잔기로 대체하며, 537번 위치에서 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체하는 돌연변이들(또한 각각 "KKK" 및 "KKR" 도메인으로 각각 언급됨)을 포함한다. 다른 구현예에서, 조작된 절단 반-도메인은 490 및 537번(야생형 FokI에 대한 번호매김) 위치에서 돌연변이들, 예를 들면, 490번 위치에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고 537번 위치에서 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체된 돌연변이들(또한 각각 "KIK" 및 "KIR" 도메인으로 언급됨)을 포함한다(참조: 2010년 2월 8일자로 출원된 미국 가특허원 61/337,769 및 2010년 9월 23일자로 출원된 미국 가특허원 61/403,916). 또한, "Sharkey" 또는 "Sharkey"(Sharkey prime)" 돌연변이들로 공지된 돌연변이들을 포함하는 FokI 뉴클레아제 도메인 변이체들이 사용될 수 있다[참조: Guo et al, (2010) J. Mol. Biol. doi:10.1016/j.jmb.2010.04.060].

본원에 기술된 조작된 절단 반-도메인들은 어떠한 적합한 방법, 예를 들면, 미국 특허 공보 20050064474, 20070134796; 20080131962에 기술된 바와 같은 야생형 절단 반-도메인들(Fok I)의 부위-지시된 돌연변이유발에 의해 제조될 수 있다.

TALE-융합 폴리펩타이드 및 핵산은 재조합체 유전학의 분야에서 통상의 기술을 이용하여 제조할 수 있다. 본 발명에서 일반적인 사용 방법을 기재하는 기본 교재는 Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., eds., 1994))을 포함한다. 또한, 필수적으로 어떠한 핵산도 다양한 시판 공급원 중 어느 것으로부터 특별 주문할 수 있다. 유사하게, 펩타이드들 및 항체들은 각종의 상업적인 공급원 들 중 어느 것으로부터 특별 주문할 수 있다.

2개의 대체 방법들을 통상적으로 사용하여 새로이 설계된 DNA-결합 펩타이드를 발현하는데 요구되는 암호화 서열을 생성한다. 하나의 프로토콜은 오버랩된 올리고뉴클레오타이드들을 이용하는 PCR-계 조립 과정이다. 이들 올리고뉴클레오타이드들은 주로, 그러나 이들을 상이한 DNA-결합 도메인들 각각에 대해 특이적이도록 하는 반복된 도메인들 상의 12 및 13번 위치에 제한되지 않는 치환들을 함유한다. 추가로, 아미노산 치환들은 4, 11 및 32번 위치에서 이루어질 수 있다. 아미노산 치환체들은 또한 하나의 반복체 단위내에서 2, 3, 4, 21, 23, 24, 25, 27, 30, 31, 33, 34 및/또는 35번 위치에서 이루어질 수 있다. 일부 구현예들에서, 반복체 단위는 하나의 위치에서 치환체를 함유하며, 다른 것에서, 반복체 단위는 2 내지 18개 아미노산 치환들을 함유한다. 일부 구현예들에서, 반복체 단위들의 뉴클레오타이드 서열은 아미노산 서열의 변경없이 변경될 수 있다.

당해 분야의 숙련가에게 공지된 단백질 정제의 어떠한 적합한 방법도 사용하여 본 발명의 TALE-융합 단백질들을 정제할 수 있다(참조: Ausubel, supra, Sambrook, supra). 또한, 어떠한 적합한 숙주, 예를 들면, 세균 세포들, 곤충 세포들, 효모 세포들, 포유동물 세포들 등을 사용할 수 있다.

따라서, 융합 분자들은 당해 분야의 숙련가에게 잘 공지된 클로닝 및 생화학 접합 방법들에 의해 제작된다. 융합 분자들은 DNA-결합 도메인 및 기능성 도메인(예를 들면, 전사 활성화 또는 억제 도메인)을 포함한다. 융합 분자들은 또한 핵 국재화 시그날들(예를 들면, SV40 매질 T-항원) 및 에피토프 태그들(예를 들면, FLAG 및 헤마글루티닌)을 임의로 포함한다. 융합 단백질들(및 이들을 암호화하는 핵산들)은, 해독 판독 프레임이 융합 성분들 중에서 보존되도록 설계된다. 본원에 기술된 바와 같은 융합 단백질들은 본원에 기술된 바와 같은 DNA-결합 폴리펩타이드들의 N- 및/또는 C-말단들에서 하나 이상의 기능성 도메인들을 포함할 수 있다.

한편으로는 기능성 도메인(또는 이의 기능성 단편)의 펩타이드 성분과, 다른 한편으로는 비-단백질 DNA-결합 도메인(예를 들면, 항생제, 인터컬레이터(intercalator), 마이너 그루브 결합인자(minor groove binder), 핵산) 사이의 융합체는 당해 분야의 숙련가에게 공지된 생화학적 접합 방법들에 의해 제작된다. 예를 들면, Pierce Chemical Company (Rockford, IL) Catalogue를 참조한다. 마이너 그루브 결합인자와 폴리펩타이드 사이의 융합체들을 제조하는 방법들 및 조성물들이 기술되어 있다[참조: Mapp et al. (2000) Proc . Natl . Acad . Sci . USA 97:3930-3935].

표적화된 절단을 위한 추가의 방법들

어떠한 목적하는 유전자(들)에서 표적 부위를 갖는 어떠한 뉴클레아제도 본원에 기재된 방법들에서 사용할 수 있다. 예를 들면, 호밍(homing) 엔도뉴클레아제들 및 메가뉴클레아제들은 매우 긴 인지 서열들을 가지며, 이들 중 일부는 통계학적 기준으로, 사람-크기의 게놈내에 1회 존재하는 경향이 있다. 목적하느 유전자에서 표적 부위를 갖는 이러한 뉴클레아제 어떤 것도, 표적화된 절단에 대해, 예를 들면, 아연 핑거 뉴클레아제 및/또는 메가뉴클레아제를 포함하는 TALE-반복체 도메인 뉴클레아제 융합체 대신에, 또는 이것들 외에 사용될 수 있다.

특정 구현예들에서, 뉴클레아제는 메가뉴클레아제(호밍 엔도뉴클레아제)이다. 천연적으로-존재하는 메가뉴클레아제들은 15 내지 40개 염기-쌍 절단 부위들을 인지하며 일반적으로 4개의 계열: LAGLIDADG 계열, GIY-YIG 계열, His-Cyst 박스 계열 및 HNH 계열로 그룹화된다. 예시적인 호밍 엔도뉴클레아제들은 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함한다. 이들의 인지 서열들은 공지되어 있다. 또한, 미국 특허 5,420,032; 미국 특허 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs 카탈로그를 참조한다.

천연적으로-존재하는 메가뉴클레아제들, 주로 LAGLIDADG 계열로부터의 DNA-결합 도메인들을 사용하여 식물, 효모, 드로소필라, 포유동물 세포 및 마우스에서 부위-특이적인 게놈 변형을 촉진하여 왔지만, 이러한 시도는 메가뉴클레아제 인지 서열을 보존하는 동족체 유전자의 변형[참조: Monet et al. (1999), Biochem. Biophysics. Res. Common. 255: 88-93] 또는, 인지 서열이 도입된 예비-조작된 게놈들[참조: Route et al. (1994), Mol. Cell. Biol. 14: 8096-106; Chilton et al. (2003), Plant Physiology. 133: 956-65; Puchta et al. (1996), Proc. Natl. Acad. Sci. USA 93: 5055-60; Rong et al. (2002), Genes Dev. 16: 1568-81; Gouble et al. (2006), J. Gene Med. 8(5):616-622)로 제한되어 왔다. 따라서, 의학적으로 또는 생명과학적으로 관련된 부위들에서 신규의 결합 특이성을 나타내는 메가뉴클레아제들을 가공하기 위한 시도들이 이루어져 왔다[참조: Porteus et al. (2005), Nat. Biotechnol. 23: 967-73; Sussman et al. (2004), J. Mol. Biol. 342: 31-41; Epinat et al. (2003), Nucleic Acids Res. 31: 2952-62; Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 20070117128; 20060206949; 20060153826; 20060078552; 및 20040002092).

전달

TALE-융합 단백질, 이를 암호화하는 폴리뉴클레오타이드 및 본원에 기술된 단백질들 및/또는 폴리뉴클레오타이드들을 포함하는 조성물들은 예를 들면, TAL-융합 단백질들을 암호화하는 mRNA의 주입에 의함을 포함하는 어떠한 적합한 수단들에 의해 표적 세포로 전달할 수 있다[참조: Hammerschmidt et al. (1999) Methods Cell Biol. 59:87-115].

조작된 전사 인자들을 포함하는 단백질들을 전달하는 방법들은 예를 들면, 미국 특허 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기술되어 있으며, 이들 모두의 기재내용은, 이의 전문이 본원에 참조로 혼입되어 있다.

본원에 기술된 바와 같은 TALE-단백질 융합체들은 또한 하나 이상의 TALE-단백질 융합체들을 암호화하는 서열들을 함유하는 벡터들을 사용하여 전달할 수 있다. 플라스미드 벡터들, 레트로이러스 벡터들, 렌티바이러스 벡터들, 아데노바이러스 벡터들, 폭스바이러스 벡터들; 헤르페스바이러스 벡터들 및 아데노-관련 바이러스 벡터들 등을 포함하나, 이에 한정되지 않는 어떠한 벡터 시스템들도 사용될 수 있다. 또한, 이들의 전문이 본원에 참조로 혼입된 미국 특허 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824를 참조한다. 또한, 이들 벡터들 중 어느 것도 서열들을 암호화하는 하나 이상의 TALE-단백질 융합체를 포함할 수 있음이 명백할 것이다. 따라서, 하나 이상의 TALE-단백질 융합체(예를 들면, TALEN들의 쌍)를 세포내로 도입시키는 경우, TALE-단백질 융합은 동일한 벡터 또는 상이한 벡터들 위에서 수행할 수 있다. 다수의 벡터들을 사용하는 경우, 각각의 벡터는 하나 또는 다수의 TALE-단백질 융합체들을 암호화하는 서열을 포함할 수 있다.

통상의 바이러스 및 비-바이러스계 유전자 전달 방법들을 사용하여 전체 유기체들 또는 표적 조직들의 세포들(예를 들면, 포유동물 세포들)내에서 조작된 TALE-단백질 융합체들을 암호화하는 핵산들을 도입할 수 있다. 이러한 방법들을 또한 사용하여 TALE-단백질 융합체를 암호화하는 핵산들을 시험관내에서 세포들내로 투여할 수 있다. 특정 구현예들에서, TALE-단백질 융합체들을 암호화하는 핵산들은 생체내 또는 생체외 사용들을 위해 투여된다. 비-바이러스 벡터 전달 시스템들은 DNA 플라스미드들, 네이키드 핵산(naked nucleic acid), 및 리포좀 또는 폴록사머와 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템들은 DNA 및 RNA 바이러스들을 포함하며, 이들은 세포내로 전달한 후 에피소옴 또는 통합된 게놈들을 가진다. 이들 결합 단백질들을 포함하는 조작된 DNA-결합 단백질들 및 융합 단백질들의 생체내 전달의 고찰을 위해서는, 예를 들면, Rebar (2004) Expert Opinion Invest. Drugs 13(7):829-839; Rossi et al. (2007) Nature Biotech. 25(12):1444-1454 as well as general gene delivery references such as Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Boem (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994)를 참조한다.

비-바이러스 벡터 전달 시스템들은 전기천공(electroporation), 지질감염, 미세주입, 바이올리스틱스(biolistics), 바이로솜들(virosomes), 리포좀들, 면역리포좀들(immunoliposomes), 다가양이온 또는 지질:핵산 접합체들, 네이키드 DNA, 인공 비리온들(virions), 및 DNA의 제제-향상된 흡수를 포함한다. 예를 들면, Sonitron 2000 system(Rich-Mar)을 사용하는 소노포레이션(sonoporation)을 또한 핵산들의 전달에 사용할 수 있다. 바이러스 벡터 전달 시스템들은, DNA 및 RNA 바이러스들을 포함하며, 이는 세포내로 전달 후 에피소옴 또는 통합된 게놈들을 가진다. 추가의 예시적인 핵산 전달 시스템들은 Amaxa Biosystems(독일, 콜로인 소재), Maxcyte, Inc.(매릴린드 록크빌 소재), BTX Molecular Delivery Systems(메사츄세츠 홀링스톤 소재) 및 Copernicus Therapeutics Inc.(참조: 예를 들면, US6008336)에 의해 제공된 것들을 포함한다. 지질감염은 예를 들면, 미국 특허 5,049,386, 미국 특허 4,946,787; 및 미국 특허 4,897,355에 기술되어 있으며 지질감염 시약들은 상업적으로 시판된다(예를 들면, Transfectam^TM 및 Lipofectin^TM). 폴리뉴클레오타이드들의 효율적인 수용체-인지 지질감염에 적합한 양이온성 및 중성 지질들은 Felgner, WO 91/17424, WO 91/16024의 것들을 포함한다. 전달은 세포(생체외 투여) 또는 표적 조직(생체내 투여)에 대해 이루어질 수 있다.

면역지질 복합체들과 같은 표적화된 리포좀들을 포함하는, 지질:핵산 복합체들의 제조는 당해 분야의 숙련가에게 잘 공지되어 있다[참조: 예를 들면, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787].

추가의 전달 방법들은 EnGeneIC 전달 비히클들(EDVs)로 전달되는 핵산들의 패키징의 사용을 포함한다. 이들 EDV들은 이특이적인 항체들을 사용하여 표적 조직에 특이적으로 전달되며, 여기서 항체의 하나의 아암(arm)은 표적 조직에 대해 특이성을 가지며 다른 것은 EDV에 대해 특이성을 가진다. 항체는 EDV들을 표적 세포 표면에 도입한 후 EDV는 세포내이입에 의해 세포내로 도입된다. 일단 세포내에 있는 경우, 내용물들이 방출된다[참조: MacDiarmid et al (2009) Nature Biotechnology vol 27(7) p. 643].

적합한 세포들은 진핵 세포들 및 원핵 세포들 및/또는 세포주들을 포함하나 이에 한정되지 않는다. 이러한 세포들 또는 이러한 세포들로부터 생성된 세포주들의 비-제한적 예들은 COS, CHO(예를 들면, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293(예를 들면, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포, 및 또한 스포도프테라 푸기페르다(Spodoptera fugiperda)(Sf)와 같은 곤충 세포들, 또는 사카로마이세스(Saccharomyces), 피키아(Pichia) 및 스키조사카로마이세스(Schizosaccharomyces)와 같은 진균 세포들을 포함한다. 특정 구현예에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 또한, 원시 세포들을 분리하여 치료할 피검체내로 재도입을 위해 생체외에서 사용한 후 TALE-융합체들로 치료할 수 있다. 적합한 원시 세포들은 말초 혈액 단핵 세포들(PBMC), 및 예를 들면, CD4+ T 세포들 또는 CD8+ T 세포들, 그러나 이에 한정되지 않는 다른 혈액 세포 소세트를 포함한다. 적합한 세포들은 또한 예를 들면, 배아 줄기 세포들, 도입된 다능성 줄기 세포들, 조혈 줄기 세포들, 시경 줄기 세포들, 중간엽 줄기 세포들, 근육 줄기 세포들 및 피부 줄기 세포들과 같은 줄기 세포들을 포함한다.

변형된 줄기 세포들은 또한 일부 구현예들에서 사용될 수 있다. 예를 들면, 세포자멸사에 대해 내성으로 제조된 줄기 세포들을 치료학적 조성물들로서 사용할 수 있으며, 여기서 줄기 세포들은 또한 본 발명의 TALE-융합 단백질을 함유한다. 세포자멸사에 대한 내성은 예를 들면, 줄기 세포들에서 BAX- 또는 BAK-특이적인 TALEN들을 사용하여 BAX 및/또는 BAK들을 녹킹 아웃(knocking out)시킴에 의해, 또는 예를 들면, 카스파제-6 특이적인 TALEN들을 사용하여 파괴시킨 것들로부터 올 수 있다.

DNA를 조혈 줄기 세포들내로 도입시키는 방법들은 예를 들면, 미국 특허 5,928,638에 기재되어 있다. 삽입유전자들을 조혈 줄기 세포들, 예를 들면, CD34⁺ 세포들로 도입시키는데 유용한 벡터들은 아데노바이러스 35형을 포함한다.

본원에 기술된 바와 같은 폴리뉴클레오타이드들의 도입에 적합한 벡터들은 본원에 기술된 비-통합 렌티바이러스 벡터들(IDLV)을 포함한다. 예를 들면, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222; 미국 특허 공보 2009/054985를 참조한다. 위에서 주목한 바와 같이, 기재된 방법들 및 조성물들은 어떠한 세포 유형에도 사용할 수 있다. 동물 세포들의 후대세포, 변이체들 및 유도체들도 또한 사용할 수 있다.

DNA 제작물들은 각종의 통상의 기술들에 의해 목적하는 식물 숙주(예를 들면, 이의 게놈내로)내로 도입시킬 수 있다. 이러한 기술들의 참조를 위해, 예를 들면, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; and Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9를 참조한다.

예를 들면, DNA 제작물은 식물 세포 원형질체의 전기천공 및 미세주입과 같은 기술들을 사용하여 식물 세포의 게놈 DNA내로 직접 도입시킬 수 있거나, DNA 제작물들을 바이올리스틱 방법들, 예를 들면, DNA 입자 충격[참조: 예를 들면, Klein et al (1987) Nature 327:70-73]을 사용하여 식물 조직내로 직접 도입시킬 수 있다. 대안적으로, DNA 제작물들을 적합한 T-DNA 플랭킹 영역들과 결합시켜 통상의 아가로박테리움 투메파시엔시스(Agrobacterium tumefaciens) 숙주 벡터내로 도입시킬 수 있다. 디스아밍(disarming) 및 이원 벡터들의 사용을 포함하는, 아가로박테리움 투메파시엔스-매개된 형질전환 기술은 또한 과학 문헌에 잘 기술되어 있다. 예를 들면, Horsch et al (1984) Science 233:496-498, 및 Fraley et al (1983) Proc. Nat'l. Acad. Sci. USA 80:4803을 참조한다.

또한, 유전자 전달은 리조비움 아종(Rhizobium sp.) NGR234, 시노르히조보이움 멜리로티(Sinorhizoboium meliloti), 메소르히조비움 로티(Mesorhizobium loti), 감자 바이러스 X, 카울리플라워 모자익 바이러스(cauliflower mosaic virus) 및/또는 카사노바 정맥 모자익 바이러스(cassava vein mosaic virus) 및/또는 담배 모자익 바이러스(tobacco mosaic virus)와 같은 아그로박테리움 세균 또는 바이러스를 사용하여 달성할 수 있다[참조: 예를 들면, Chung et al. (2006) Trends Plant Sci. 11(1):1-4].

아그로박테리움 투메파시엔스 숙주의 발병력 기능들은, 세포가 이원 T DNA 벡터[참조: Bevan (1984) Nuc. Acid Res. 12:8711-8721] 또는 동시-배양 과정[참조: Horsch et al (1985) Science 227:1229-1231]을 사용하여 세균에 의해 감염되는 경우, 제작물 및 인접함 마커의 식물 세포 DNA내로의 삽입을 지시할 것이다. 일반적으로, 아가로박테리움 형질전환 시스템을 사용하여 쌍자엽 식물들을 가공한다[참조: Bevan et al (1982) Ann. Rev. Genet 16:357-384; Rogers et al (1986) Methods Enzymol. 118:627-641]. 아가로박테리움 형질전환 시스템을 또한 사용하여 DNA를 단자엽 식물 및 식물 세포들내로 형질전환시킬 뿐만 아니라 형질감염시킬 수도 있다. 미국 특허 5, 591,616; Hernalsteen et al (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311:763-764; Grimsley et al (1987) Nature 325:1677-179; Boulton et al (1989) Plant Mol. Biol. 12:31-40.; 및 Gould et al (1991) Plant Physiol. 95:426-434를 참조한다.

대안의 유전자 전달 및 형질전환 방법들은 네이키드 DNA의 칼슘-, 폴리에틸렌 글리콜(PEG)- 또는 전기천공-매개된 흡수를 통한 원형질체 형질전환[참조: Paszkowski et al. (1984) EMBO J 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; and Shimamoto (1989) Nature 338:274-276] 및 식물 조직의 전기천공[참조: D'Halluin et al. (1992) Plant Cell 4:1495-1505]을 포함하나, 이에 한정되지 않는다. 식물 세포 형질전환을 위한 추가의 방법들은 미세주입, 탄화규소 매개된 DNA 흡수[참조: Kaeppler et al. (1990) Plant Cell Reporter 9:415-418], 및 미세발사 충격(microprojectile bombardment)[참조: Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309; 및 Gordon-Kamm et al. (1990) Plant Cell 2:603-618]를 포함한다.

유기체

본원에 기술된 방법들 및 조성물들은, 유전자 발현을 조절하고/하거나 게놈 변형을 통해 유기체를 변경시키는 것이 바람직한, 식물들, 동물들(예를 들면, 마우스들, 랫트들, 영장류들, 농장 동물들, 토끼들 등과 같은 포유동물), 어류 등과 같은 진핵 유기체들을 포함하나, 이에 한정되지 않는 어떠한 유기체에도 적용가능하다. 진핵 세포들(예를 들면, 효모, 식물, 진균, 물고기 및, 고양이, 개, 쥐, 소, 양 및 돼지와 같은 포유동물 세포들)을 사용할 수 있다. 본원에 기술된 것으로서 하나 이상 동종접합성 KO 유전자위치들(loci) 또는 다른 유전적 변형들을 또한 사용할 수 있다.

예시적인 포유동물 세포들은 목적한 유기체의 어떠한 세포 또는 세포주, 예를 들면, 난모세포들, K562 세포들, CHO(차이니즈 햄스터 난모) 세포들, HEP-G2 세포들, BaF-3 세포들, 슈나이더 세포들(Schneider cells), COS 세포들(SV40 T-항원을 발현하는 원숭이 신장 세포들), CV-1 세포들, HuTu80 세포들, NTERA2 세포들, NB4 세포들, HL-60 세포들 및 HeLa 세포들, 293 세포들[참조: 예를 들면, Graham et al. (1977) J. Gen. Virol. 36:59], 및 SP2 또는 NS0와 같은 흑색종 세포들[참조: 예를 들면, Galfre and Milstein (1981) Meth. Enzymol. 73(B):3 46]을 포함한다. 배아 및 성인 줄기 세포들일 수 있는 말초 혈액 단핵세포들(PBMCs) 또는 T-세포들을 또한 사용할 수 있다. 예를 들면, 사용될 수 있는 줄기 세포들은 배아 줄기 세포들(ES), 유도된 다능성 줄기 세포들(iPSC), 중간엽 줄기 세포들, 조혈 줄기 세포들, 간 줄기 세포들, 피부 줄기 세포들 및 신경 줄기 세포들을 포함한다.

예시적인 표적 식물들 및 식물 세포들은 곡물들(예를 들면, 밀, 옥수수, 벼, 수수, 보리), 과일 작물들(예를 들면, 토마토, 사과, 배, 딸기, 오렌지), 목초 작물들(예를 들면, 알파파), 구근 야채 작물들(예를 들면, 당근, 감자, 사탕무우, 참마), 잎 야채 작물들(예를 들면, 상추, 시금치); 소비용 야채 작물들(예를 들면, 대두 및 다른 콩과식물, 호박, 후추들, 가지, 샐러리 등), 개화 식물들(예를 들면, 페츄니아, 장미, 국화), 침엽수 및 소나무들(예를 들면, 전나무, 가문비나무); 튜울립 나무[예를 들면, 피. 트레물라(P. tremula) x 피. 알바(P. alba)]; 식물환경복원에 사용된 섬유 작물들(면화, 황마, 아마, 대나무) 식물들(예를 들면, 중금속 축적 식물들); 오일 작물들(예를 들면, 해바라기, 평지씨) 및 환경 목적으로 사용된 식물들[예를 들면, 아라비돕시스(Arabidopsis)]을 포함하는 작물들과 같은 단자엽 및 쌍자엽 식물들을 포함하나, 이에 한정되지 않는다. 따라서, 기재된 방법들 및 조성물들은 속 아스파라구스(Asparagus), 아베나(Avena), 브라씨카(Brassica), 시트루스(Citrus), 시트룰루스(Citrullus), 캅시쿰(Capsicum), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 에리게론(Erigeron), 글리신(Glycine), 고십피움(Gossypium), 호르데움(Hordeum), 락투카(Lactuca), 롤리움(Lolium), 리코페르시콘(Lycopersicon), 말루스(Malus), 마니호트(Manihot), 니코티아나(Nicotiana), 오리초프라그무스(Orychophragmus), 오리자(Oryza), 페르세아(Persea), 파세올루스(Phaseolus), 프리숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 세칼레(Secale), 솔라눔(Solanum), 소르굼(Sorghum), 트리티쿰(Triticum), 비티스(Vitis), 비그나(Vigna), 및 제아(Zea)로부터 선택된 종을 포함하나, 이에 한정되지 않는 광범위한 식물들에 걸쳐 용도를 갖는다. 용어 식물 세포들은 분리된 식물 세포들 및 또한 전체 식물들 또는 전체 식물들의 일부들, 예를 들면, 종자들, 칼루스(callus), 잎들, 뿌리들 등을 포함한다. 본 기재내용은 또한 위에서 기술된 식물들의 종자들을 포함하며, 여기서 종자는 삽입유전자 또는 유전자 제작물을 가지고/가지거나 본원에 기술된 조성물들 및/또는 방법들을 사용하여 변형시킨다. 본 기재내용은 위에서 기술된 유전자삽입 식물들의 후대세포, 클론들, 세포주들 또는 세포들을 추가로 포함하며, 여기서 상기 후대세포, 클론, 세포주 또는 세포는 삽입유전자 또는 유전자 제작물을 갖는다.

목적 화합물들, 즉, 가소제들, 탄화수소들 등을 제조하기 위해 조류가 크게 이용되고 있다. 예지적인 조류 종들은 규조류들 및 시아노박테리아를 포함하는 미세조류 및 또한 보트리오코쿠스 브라우니이(Botryococcus braunii), 클로렐라(Chlorella), 두날리엘라 테르티올렉타(Dunaliella tertiolecta), 그라실레리아(Gracileria), 플레우로크리시스 카르테라에(Pleurochrysis carterae), 소르고숨(Sorgassum) 및 울바(Ulva)를 포함함한다.

TALE 융합 단백질에 의한 유전자 발현의 조절을 측정하기 위한 검정

각종 검정들을 사용하여 TALE-융합 단백질에 의한 유전자 발현 조절의 수준을 측정할 수 있다. 특수한 TALE- 융합 단백질의 활성은 예를 들면, 단백질 또는 mRNA 수준들, 생성물 수준들, 효소 활성, 종양 성장; 리포터 유전자의 전사 활성화 또는 억제; 제2 전령인자 수준들(예를 들면, cGMP, cAMP, IP3, DAG, Ca.sup.2+); 사이토킨 및 호르몬 생산 수준들을 측정함으로써 다양한 시험관내 및 생체내 검정을 사용하여 평가할 수 있으며; 신생혈관화는 예를 들면, 면역검정들(예를 들면, ELISA 및 항체들을 사용한 면역조직화학 검정), 하이브리드화 검정들(예를 들면, RNase 보호, 노뎀(northem)들, 반응계내 하이브리드화, 올리고뉴클레오타이드 배열 연구들), 열량계 분석들, 증폭 분석물, 효소 활성 검정들, 종양 성장 검정들, 표현형 검정들 등을 사용하여 평가할 수 있다.

TALE-융합 단백질은 전형적으로 배양된 세포, 예를 들면, 293 세포들, CHO 세포들, VERO 세포들, BHK 세포들, HeLa 세포들, COS 세포들, 식물 세포주들, 식물 칼러스 배양물들 등을 사용하여 시험관내 활성에 대해 우선 시험한다. 바람직하게는 사람 세포들을 사용한다. TALE-융합 단백질은 종종 우선 리포터 유전자를 지닌 일시적인 발현 시스템을 사용하여 시험한 후, 표적 내인성 유전자의 조절을 세포들 및 동물들내에서, 생체내 및 생체외 둘다로 시험한다. TALE 융합 단백질은 세포내에서 재조합적으로 발현되거나, 동물 또는 식물내로 이식된 세포들내에서 재조합적으로 발현되거나, 유전자삽입 동물 또는 식물에서 재조합적으로 발현되거나, 본원에 기술된 전달 비히클들을 사용하여 동물, 식물 또는 세포에 단백질로서 투여될 수 있다. 세포들은 고정화될 수 있거나, 용액이거나, 동물에 투여되거나, 유전자삽입 또는 비-유전자삽입 동물에 천연적으로 존재할 수 있다.

유전자 발현의 조절은 본원에 기술된 시험관내 또는 생체내 검정들 중 하나를 사용하여 시험한다. 시료들 또는 검정들은 TALE-융합 단백질로 처리하고 시험 화합물의 부재하에 대조군 시료들에 대해 비교함으로써 조절 정도를 시험한다.

TALE-융합 단백질의 효과들은 위에서 기술된 매개변수들 중 어느 것을 시험함으로써 측정할 수 있다. 어떠한 적합한 유전자 발현, 표현형적, 또는 생리학적 변화를 사용하여 TALE-융합 단백질의 영향을 평가할 수 있다. 기능적 결과들이 완전한 세포들 또는 동물들을 사용하여 측정되는 경우, 공지된 및 특성화되지 않은 유전 마커들(예를 들면, 노던 블롯들 또는 올리고뉴클레오타이드 배열 연구들) 둘다에 대한 종양 성장, 신생혈관화, 호르몬 방출, 전사 변화들과 같은 각종의 영향들, 세포 성장 또는 pH 변화들과 같은 세포 대사에 있어서의 변화들, 및 cGMP와 같은 세포내 제2의 전령인자들에 있어서의 변화들을 측정할 수 있다.

내인성 유전자 발현의 TALE-융합 단백질 매개된 조절에 대한 바람직한 검정들은 시험관내에서 수행할 수 있다. 하나의 바람직한 시험관내 검정 양식에서, 배양된 세포들내에서 내인성 유전자 발현의 TALE-융합 단백질 매개된 조절은 ELISA 검정을 사용한 단백질 생산을 시험함으로써 측정한다. 시험 시료는 엠티 벡터(empty vector) 또는 다른 유전자에 대해 표적화된 관련되지 않은 TALE-융합 단백질을 사용하여 처리된 대조군 세포들과 비교한다.

다른 구현예에서, 내인성 유전자 발현의 TALE-융합 단백질-매개된 조절은 표적 유전자 mRNA 발현의 수준을 측정함으로써 시험관내에서 측정한다. 유전자 발현의 수준은 예를 들면, PCR, LCR, 또는 하이브리드화 검정들, 예를 들면, 노던 하이브리드화, RNase 보호, 도트 블롯팅(dot blotting)을 사용하여 측정한다. RNase 보호를 하나의 구현예에서 사용한다. 단백질 또는 mRNA의 수준은 본원에 기술된 것으로서, 표지된 검출 제제, 예를 들면, 형광성적으로 또는 방사활성적으로 표지된 핵산들, 방사활성적으로 또는 효소적으로 표지된 항체들 등을 사용하여 검출한다.

대안적으로, 리포터 유전자 시스템은 루시퍼라제, 녹색 형광성 단백질, CAT, 또는 베타-gal과 같은 리포터 유전자에 작동적으로 연결된 표적 유전자 프로모터를 사용하여 고안할 수 있다. 리포터 제작물은 전형적으로 배양된 세포내로 동시-형질감염된다. 선택한 TALE-융합 단백질을 사용한 처리 후, 리포터 유전자 전사, 해독 또는 활성의 양을 당해 분야의 숙련가에게 공지된 표준 기술들에 따라 측정한다.

내인성 유전자 발현의 TALE-융합 단백질 매개된 조절을 모니터링하기에 유용한 바람직한 검정의 다른 예는 생체내에서 수행한다. 당해 검정은 특히 종양 촉진 유전자들, 종양 지지, 예를 들면, 신생혈관화(예를 들면, VEGF)에 관여된 유전자들의 발현을 억제하거나, p53과 같은 종양 억제인자 유전자들을 활성화시키는 TALE-융합체를 시험하는데 특히 유용하다. 당해 검정에서, 선택된 TALE-융합체를 발현하는 배양된 종양 세포들은 무흉선 마우스와 같은 면역 약화된 마우스, 조사된(irradiated) 마우스, 또는 SCID 마우스내로 피하 주입된다. 적합한 기간, 바람직하게는 4 내지 8주 후, 종양 성장을 예를 들면, 용적으로 또는 이의 2개의 치수들로 측정하고, 대조군과 비교한다. 통계적으로 유의적인 감소를 갖는 종양들[예를 들면, 스튜던츠 T 시험(Student's T test)]을 가진 종양들은 성장을 억제하는 것으로 일컬어진다. 대안적으로, 종양 신생혈관화의 정도를 또한 측정할 수 있다. 내피 세포 특이적인 항체들을 사용한 면역검정들을 사용하여 종양의 혈관화 및 종양내 다수의 혈관들에 대해 염색한다. 혈관들의 수(예를 들면, 스튜던츠 T 시험을 사용함)에 있어서 통계적으로 유의적인 감소를 갖는 종양들은 억제된 신생혈관화를 가지는 것으로 일컬어진다.

위에서 기술된 바와 같은 삽입유전자 및 비-삽입유전자 식물들 또는 동물들을 또한 생체내에서 내인성 유전자 발현의 조절을 시험하기 위한 바람직한 구현예로서 사용한다. 삽입유전자 유기체들은 전형적으로 선택한 TALE-융합체를 발현한다. 대안적으로, 선택한 TALE-융합체들을 일시적으로 발현하거나, 이에 대해 TALE 융합 단백질들이 전달 비히클로 투여된 유기체들을 사용할 수 있다. 내인성 유전자 발현의 조절은 본원에 기술된 검정들 중 어느 하나를 사용하여 시험한다.

TALE-융합 단백질을 암호화하는 핵산들

통상의 바이러스 및 비-바이러스계 유전자 전달 방법들을 사용하여 포유동물 세포들, 전체 유기체들 또는 표적 조직들내에서 조작된 TALE 도메인 융합체들을 암호화하는 핵산들을 도입할 수 있다. 이러한 방법들은 TALE 도메인 융합체들을 암호화하는 핵산들을 세포내로 시험관내에서 투여하는데 사용될 수 있다. 바람직하게는, TALE 도메인 융합체들을 암호화하는 핵산들은 생체내 또는 생체외 사용을 위해 투여된다. 비-바이러스 벡터 전달 시스템들은 DNA 플라스미드들, 네이키드 핵산, 및 리포좀과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템들은 세포내로 전달 후, 에피소옴을 가지거나, 게놈들내로 통합된, DNA 및 RNA 바이러스들을 포함한다. 유전자 치료요법 과정들의 고찰을 위해서는, Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bohm (eds) (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)를 참조한다.

조작된 TALE 도메인 융합체들을 암호화하는 핵산들의 전달을 위한 RNA 또는 DNA 바이러스계 시스템들의 사용은 체내에서 바이러스를 특수 세포들로 표적화하고 바이러스 페이로드(payload)를 핵으로 트래피킹(trafficking)하기 위한 고도로 진화된 공정들의 장점을 취한다. 바이러스 벡터들은 환자들에게 직접 투여될 수 있거나(생체내) 이들을 시험관내에서 세포들을 치료하기 위해 사용될 수 있으며 변형된 세포들은 환자들에게 투여된다(생체외). TALE 도메인 융합체들의 전달을 위한 통상의 바이러스계 시스템들은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 헤르페스 단성 바이러스 벡터들을 포함할 수 있었다. 바이러스 벡터들은 표적 세포들 및 조직들에서 유전자 전달의 현재 가장 효율적이고 다용도인 방법이다. 숙주 게놈내에서의 통합은 레트로바이러스, 렌티바이러스, 및 아데노-관련된 바이러스 유전자 전달 방법을 사용하여 가능하며, 흔히 삽입된 삽입유전자의 장기간 발현을 생성한다. 또한, 고 형질유도 효율이 많은 상이한 세포형들 및 표적 조직들에서 관찰되어왔다.

레트로바이러스의 향성(tropism)은 외부 엔벨로프(envelope) 단백질들을 도입시키고, 표적 세포들의 강력한 표적 집단을 확장시킴으로써 변경시킬 수 있다. 렌티바이러스 벡터들은 분열하지 않는 세포들을 형질유도하거나 형질감염시킬 수 있고 고 바이러스 역가를 전형적으로 생산할 수 있는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 전달 시스템의 선택은 외부 서열의 6 내지 10 kb 이하에 대한 패키징 능력을 지닌 시스-작용성의 긴 말단 반복체들로 구성된다. 최소 시스-작용성 LTR은 벡터들의 복제 및 패키징에 충분하며, 이후 이들은 영구적인 삽입유전자 발현을 제공하기 위해 표적 세포내로 치료학적 유전자를 통합시키는데 사용된다. 광범위하게 사용된 레트로바이러스 벡터들은 쥣과 백혈병 바이러스(MuLV), 깁본 아페 백혈병 바이러스(gibbon ape leukemia virus: GaLV), 시미안 면역 결핍 바이러스(Simian Immuno deficiency virus: SIV), 사람 면역 결핍성 바이러스(HIV), 및 이의 조합물들을 기본으로 하는 것들을 포함한다[참조: 예를 들면, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J Virol. 66:1635-1640 (1992); Sommerfelt et al, Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700].

TALE 도메인 융합체들의 일시적인 발현이 바람직한 적용들에서, 아데노바이러스계 시스템들이 전형적으로 사용된다. 아데노바이러스계 벡터들은 많은 세포 유형들에서 매우 높은 형질유도 효율을 지닐 수 있으며 세포 분열을 필요로 하지 않는다. 이러한 벡터들을 사용하여, 발현의 고 역가 및 수준들을 수득하여 왔다. 당해 벡터는 비교적 단순한 시스템에서 다량으로 생산될 수 있다. 아데노-관련 바이러스("AAV") 벡터들을 또한 사용하여 세포를 표적 핵산들로, 예를 들면, 핵산 및 펩타이드들의 시험관내 생산시, 및 생체내 및 생체외 유전자 치료요법 과정들에서 형질유도한다[참조: 예를 들면, West et al., Virology 160:38-47 (1987); U.S. Pat. No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)]. 재조합체 AAV 벡터들의 제작는 미국 특허 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, Proc Natl Acad Sci USA 81:6466-6470 (1984); 및 Samulski et al., J. Virol. 63:03822-3828 (1989)를 포함하는, 다수의 공보들에 기술되어 있다.

특히, 적어도 6개의 바이러스 벡터 시도들이 가장 흔히 사용된 시스템에 의한 레트로바이러스 벡터들을 사용하는 임상 시험들에서 유전자 전달을 위해 현재 이용가능하다. 이들 바이러스 벡터들 모두는 헬퍼 세포주들내로 삽입된 유전자들에 의해 결손 벡터들의 보충을 포함하는 시도들을 이용하여 형질유도제를 생성한다.

pLASN 및 MFG-S은 임상 시험들에서 사용된 레트로바이러스 벡터들의 예이다[참조: Dunbar et al., Blood 85:3048-305 (1995); Kohn et al., Nat. Med. 1:1017-102 (1995); Malech et al., Proc Natl Acad Sci USA 94:22 12133-12138 (1997)]. PA317/pLASN은 유전자 치료요법 시험에서 사용된 최초 치료학적 벡터였다[참조: Blaese et al., Science 270:475480 (1995)]. 50% 이상의 형질도입 효능은 MFG-S 패키지된 벡터들에 대해 관찰되어 왔다[참조: Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997)].

재조합체 아데노-관련 바이러스 벡터들(rAAV)은 결손 및 비병원성 파르보바이러스 아데노-관련 제2형 바이러스를 기본으로 한 유전자 전달 시스템에 대한 촉망되는 대체물이다. 모든 벡터들이 삽입유전자 발현 카세트를 플랭킹하는 AAV 145 bp 역전된 말단 반복체만을 보유하는 플라스미드로부터 기원한다. 형질도입된 세포의 게놈내로의 통합에 기인한 효율적인 유전자 전달 및 안정한 삽입유전자 전달은 당해 벡터 시스템에 대한 주요 특징들이다[참조: Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther. 9:748-55 (1996)].

복제-결함 재조합체 아데노 바이러스들(Ad)은 고 역가로 생산될 수 있으며 다수의 상이한 세포 유형들을 용이하게 감염시키므로, 결장암 유전자 치료요법에 주로 사용된다. 대부분의 아데노바이러스 벡터들은, 삽입유전자가 Ad E1a, E1b, 및 E3 유전자들을 대체하고; 후속적으로 복제 결손인자 벡터가 트랜스 방향으로 결실된 유전자 기능을 보충하는 사람 293 세포들에서 증식되도록 조작된다. Ad 벡터들은 간, 신장 및 근육 시스템 조직들에서 발견된 것들과 같은 비분열성의, 분화된 세포들을 포함하는, 생체내에서 조직들의 다수 유형을 형질도입시킬 수 있다. 통상의 Ad 벡터들은 거대한 운반능을 가진다. 임상 시험에서 Ad 벡터의 사용의 예는 근육내 주입을 사용한 항종양 면역화를 위한 폴리뉴클레오타이드 치료요법을 포함하였다[참조: Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)]. 유전자 전달용 아데노바이러스 벡터들의 용도의 추가의 예들은 Rosenecker et al, Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther. 7:1083-1089 (1998); 미국 특허 공보 2008/0159996를 포함한다.

패키징 세포들은 숙주 세포를 감염시킬 수 있는 바이러스 입자들을 형성하는데 사용된다. 이러한 세포들은 아데노바이러스를 패키지하는 293세포들, 및 레트로바이러스를 패키지하는 psi2 세포들 또는 PA317 세포들을 포함한다. 유전자 치료요법에 사용된 바이러스 벡터들은 일반적으로 핵산 벡터를 바이러스 입자내로 패키지하는 생산자 세포주에 의해 생성된다. 벡터들은 통상적으로 숙주내로 패키징 및 후속적인 통합을 위해 요구되는 최소의 바이러스 서열들을 함유하며, 다른 바이러스 서열들은 발현될 단백질에 대한 발현 카세트에 의해 교체된다. 잃어버린 바이러스 기능들은 패키징 세포주에 의해 트랜스 배향으로 공급된다. 예를 들면, 유전자 치료요법에 사용된 AAV 벡터들은 전형적으로 AAV 게놈으로부터의 ITR 서열들만을 소유하며, 이는 숙주 게놈내로의 패키징 및 통합에 요구된다. 바이러스 DNA는 세포주내에서 패키징되며, 당해 세포주는 다른 AAV 유전자들, 즉, rep 및 cap를 암호화하지만 ITR 서열들을 결여한 헬퍼 플라스미드를 함유한다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염된다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자들의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열들의 결여로 인하여 유의적인 양으로 패키징되지 않는다. 아데노바이러스에 의한 오염은 예를 들면, 아데노바이러스가 AAV보다 더 민감성인 열 처리에 의해 감소시킬 수 있다.

많은 유전자 치료요법 적용들에서, 유전자 치료요법 벡터를 고도의 특이성으로 특별한 세포 유형에 전달하는 것이 바람직하다. 바이러스 벡터는 전형적으로 변형되어 융합 단백질로서의 리간드를 바이러스들 외부 표면에서 바이러스 피복 단백질과 함께 발현시킴에 의해 제공된 세포 유형에 대한 특이성을 갖는다. 리간드는 목적한 세포 유형 위에 존재하는 것으로 공지된 수용체에 대한 친화성을 갖도록 선택된다. 예를 들면, Han et al., Proc Natl Acad Sci USA 92:9747-9751 (1995)는, 몰로니 쥣과 백혈병 바이러스가 변형되어 gp70에 융합된 사람 헤레굴린을 발현시킬 수 있으며, 재조합체 바이러스는 사람 상피 성장 인자 수용체를 발현하는 특정의 사람 유방암 세포들을 감염시킴을 보고하였다. 이러한 원리를 리간드 융합 단백질을 발현하는, 다른 바이러스 쌍들 및 수용체를 발현하는 표적 세포에 연장시킬 수 있다. 예를 들면, 필라멘트성 파아지를 가공하여 바이러스적으로 어떠한 선택된 세포 수용체에 대해 특이적인 결합 친화성을 갖는 항체 단편들(예를 들면, FAB 또는 Fv)를 나타낼 수 있다. 상기 설명이 바이러스 벡터들에 주로 적용된다고 해도, 동일한 원리들을 비바이러스 벡터들에 적용시킬 수 있다. 이러한 벡터들은 특이적인 표적 세포들에 의한 흡수를 촉진하는 것으로 고려되는 특이적인 흡수 서열들을 함유하도록 가공할 수 있다.

유전자 치료요법 벡터들은 하기 기술된 바와 같이, 개인 환자에게 투여함으로써, 전형적으로 전신계 투여(예를 들면, 정맥내, 복강내, 근육내, 피하, 또는 두개내 주입) 또는 국소 적용에 의해 생체내에서 전달될 수 있다. 대안적으로, 벡터들은 개개 환자로부터 외식된(explanted) 세포들(예를 들면, 림프세포, 골수 흡인물, 조직 생검)과 같은, 세포들에게 생체외에서 또는 공통의 공여자 조혈 줄기 세포들에게 전달한 후, 일반적으로 벡터가 혼입된 세포들을 선택한 후, 환자에게 세포들을 재이식함으로써 전달할 수 있다.

진단, 조사를 위한, 또는 유전자 치료요법을 위한(예를 들면, 숙주 유기체내로 형질감염된 세포들의 재-주입을 통해) 생체외 세포 형질감염은 당해 분야의 숙련가에게 잘 공지되어 있다. 바람직한 구현예에서, 세포들은 대상 유기체로부터 분리하고, TALE 융합 핵산(유전자 또는 cDNA)로 형질감염시키고, 피검자 유기체(예를 들면, 환자)내로 다시 재주입시킨다. 생체외 형질감염에 적합한 각종 세포 유형들이 당해 분야의 숙련가에게 잘 공지되어 있다[참조: 예를 들면, Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) 및 환자들로부터 세포를 분리하여 배양하는 방법의 논의에 대해서는 상기 문헌에 인용된 문헌들].

하나의 구현예에서, 줄기 세포들은 세포 형질감염 및 유전자 치료요법을 위해 생체외 과정들에서 사용된다. 줄기 세포들을 사용하는 장점은, 이들이 다른 세포 유형들로 시험관내에서 분화될 수 있거나, 이들이 골수내에에서 이식될 포유동물(예를 들면, 세포들의 공여체)내로 도입될 수 있다는 것이다. 시험관내에서 CD34+ 세포들을 GM-CSF, IFN-감마, 및 TNF-알파와 같은 사이토킨들을 사용하여 임상적으로 중요한 면역 세포 유형들로 분화시키는 방법들은 공지되어 있다[참조: Inaba et al., J. Exp. Med. 176:1693-1702 (1992)].

줄기 세포들은 공지된 방법들을 사용하여 형질도입 및 분화를 위해 분리한다. 예를 들어, 줄기 세포들은 골수 세포들로부터 골수 세포들을 CD4+ 및 CD8+(T 세포들), CD45+ (panb 세포들), GR-1(과립세포들), 및 Iad(분화된 항원 표시 세포들)과 같은 원치않는 세포들에 결합하는 항체들로 패닝(panning)함에 의해 분리된다[참조: Inaba et al., J. Exp. Med. 176:1693-1702 (1992)]. 예시적인 줄기 세포들은 사람 배아 줄기 세포들(hES), 유도된 다능성 줄기 세포들(iPSC), 조혈 줄기 세포들, 중간엽 줄기 세포들, 신경 줄기 세포들, 및 근육 줄기 세포들을 포함한다.

치료학적 TALE 도메인 융합 핵산들을 함유하는 벡터들(예를 들면, 레트로바이러스들, 아데노바이러스들, 리포좀들 등)을 또한 생체내에서 세포들의 형질유도를 위한 유기체내로 직접 투여할 수 있다. 대안적으로, 네이키드 DNA를 투여할 수 있다. 투여는 분자를 혈액 또는 조직 세포들과 친밀하게 접촉되도록 하기 위해 일반적으로 사용된 경로들 중 어느 것에 의해 달성된다. 이러한 핵산들을 투여하는 적합한 방법들은 이용가능하며 당해 분야의 숙련가에게 잘 공지되어 있고, 비록 하나 이상의 경로가 특수 조성물을 투여하기 위해 사용될 수 있다고 해도, 특수 경로가 흔히 다른 경로보다 보다 즉시적이고 보다 효과적인 반응을 제공할 수 있다.

약제학적으로 허용되는 담체들은 투여되는 특별한 조성물, 및 또한 조성물을 투여하기 위해 사용된 특별한 방법에 의해 부분적으로 측정된다. 따라서, 하기 기술된 바와 같이, 본 발명의 약제학적 조성물들의 다양한 적합한 제형들이 존재한다(참조: 예를 들면, Remington's Pharmaceutical Sciences, 17th ed., 1989).

약제학적 조성물 및 투여

TALE-융합체 및, TALE-융합체를 암호화하는 발현 벡터들은 유전자 발현의 조절 및 치료학적 또는 예방학적 적용들, 예를 들면, 암, 허혈, 당뇨병성 망막증, 황반 변성, 류마티스 관절염, 건선, HIV 감염, 낫적혈구 세포 빈혈, 알츠하이머병(Alzheimer's disease), 근 위축증, 신경변성병들, 혈관병, 낭성 섬유증, 뇌졸중 등을 위해 환자에게 직접 투여할 수 있다. TALE 융합 단백질 유전자 치료요법에 의해 억제될 수 있는 미생물들의 예들은 병원성 세균, 예를 들면, 클라미디아(chlamydia), 리켓챠 세균(rickettsial bacteria), 마이코박테리아(mycobacteria), 스타필로코쿠스(staphylococcus), 스트렙토코쿠스(streptococcus), 뉴모코쿠스(pneumococcus), 메닝고코쿠스(meningococcus) 및 코노코쿠스(conococcus), 클렙시엘라(klebsiella), 프로테우스(proteus), 세라티아(serratia), 슈도모나스(pseudomonas), 레지오넬라(legionella), 디프테리아(diphtheria), 살모넬라(salmonella), 바실러스(bacillus), 콜레라(cholera), 테타누스독소증(tetanus), 보툴리눔독소증(botulism), 탄저병, 흑사병, 렙토스피라병, 및, 라임병 세균; 감염성 진균, 예를 들면, 아스퍼질러스(Aspergillus), 칸디다 종들(Candida species); 포자충[예를 들면, 플라스모디아(Plasmodia)], 근족충[예를 들면, 엔타모에바(Entamoeba)] 및 편모충들[트리파노소마(Trypanosoma), 라이쉬마니아(Leishmania), 트리초모나스(Trichomonas), 기아르디아(Giardia) 등]과 같은 원생동물; 바이러스병, 바이러스병들, 예를 들면, 간염(A, B 또는 C), 헤르페스 바이러스(예를 들면, VZV, HSV-1, HSV-6, HSV-II, CMV, 및 EBV), HIV, 에볼라, 아데노바이러스, 인플루엔자 바이러스, 플라비바이러스들, 에코바이러스, 리노바이러스, 콕사키에 바이러스, 코모바이러스, 호흡기세포 융합바이러스, 멈프스 바이러스(mumps virus), 로타바이러스(rotavirus), 풍진 바이러스, 루벨라 바이러스(rubella virus), 파르보바이러스(parvovirus), 박시니아 바이러스(vaccinia virus), HTLV 바이러스, 뎅기열 바이러스(dengue virus), 파필로마바이러스(papillomavirus), 폴리오바이러스(poliovirus), 라비스 바이러스(rabies virus), 및 아르보바이러스성 뇌염 바이러스(arboviral encephalitis virus) 등을 포함한다.

치료학적 유효량의 투여는 TALE-융합체를 치료될 조직과 궁극적으로 접촉시키기 위해 도입시키는데 일반적으로 사용된 경로들 중 어느 것에 의해서도 이루어진다. TALE-융합체들은 어떠한 적합항 방식으로, 바람직하게는 약제학적으로 허용되는 담체들을 사용하여 투여된다. 이러한 조절인자들의 적합한 투여 방법들은 이용가능하며 당해 분야의 숙련가에게 잘 공지되어 있으며, 하나 이상의 경로가 특수 조성물을 투여하기 위해 사용될 수 있다고 해도, 특수 경로는 흔히 다른 경로외에 보다 즉각적이고 보다 효과적인 반응을 제공할 수 있다.

예를 들면, 정맥내, 근육내, 피내, 및 피하 경로에 의한 것과 같은 비경구 투여에 적합한 제형들은 항산화제들, 완충제들, 세균정지제들, 및 제형을 의도된 수용체의 혈액과 등장성이되도록 하는 용질, 및 현탁화제들, 가용화제들, 증점제들, 안정화제들, 및 방부제들을 포함할 수 있는 수성 및 비-수성 멸균 현탁제들을 함유할 수 있는 수성 및 비-수성의, 등장성 멸균 주입 용액들을 포함한다. 본 발명의 실시에 있어서, 조성물들은 예를 들면, 정맥내 주입에 의해, 경구적으로, 국소적으로, 복강내로, 방광내로 또는 경막내로 투여할 수 있다. 화합물들의 제형들은 앰플들 및 바이알들과 같은 단위-투여량 또는 다중-투여량 밀봉된 용기들 속에 존재할 수 있다. 주입 용액들 및 현탁액들은 앞서 기술된 종류의 멸균 산제들, 입제들, 및 정제들로부터 제조할 수 있다.

식물들에서 유전자 발현의 조절

TALE-융합체를 사용하여 증가된 질병 내성, 구조적 및 저장 다당류들의 변형, 풍미들, 단백질들, 및 지방산들, 과일 숙성, 수율, 색상, 영양 특성들, 개선된 저장능, 가뭄 또는 침수/범람 내성 등과 같은 장점들에 대해 식물들을 가공할 수 있다. 특히, 향상된 오일 생산을 위한 작물 종들의 가공, 예를 들면, 평지씨들에서 생산된 지방산들의 변형이 흥미롭다(참조: 예를 들면, 미국 특허 7,262,054; 및 미국 특허 공보 2008/0182332 및 20090205083).

종자 오일들은 주로 지방산들의 글리세롤 에스테르들인, 트리아실글리세롤들(TAGs)로 구성된다. 이들 야채 오일들의 상업적인 생산은 주로 6개의 주요 오일 작물들(대두, 기름야자, 평지씨, 해바라기, 면화 종자, 및 땅콩)이차지한다. 야채 오일들은 주로(90%) 마가린, 쇼트닝(shortening), 샐러드 오일들, 및 튀김 오일과 같은 사람 소비용으로 사용된다. 나머지 10%는 윤활제들, 함유화학제품(oleochemicals), 바이오연료들, 세제들, 및 다른 공업용 제품들과 같은 비-식용 제품들에 사용된다.

이들 적용들 각각에 사용된 오일의 바람직한 특성들은 특히 TAG를 형성하는 지방산들내에 존재하는 이중 결합들의 수 및 쇄 길이 측면에서 광범위하게 변한다. 이들 특성들은 막 유동성 및 온도 민감성을 조절하기 위해 식물에 의해 조절된다. 동일한 특성들을 TALE 도메인 융합체들을 사용하여 조절함으로써 식품 및 산업용의 개선된 특성들을 갖는 오일들을 생산할 수 있다.

평지씨 작물들의 TAG들에 있어서 주요 지방산들은, 길이가 16 내지 18개 탄소들이고 0 내지 3개의 이중 결합들을 함유한다. 팔미트산(16:0 [16개 탄소들: 0개의 이중 결합들]), 올레산(18:1), 리놀레산(18:2), 및 리놀렌산(18:3)이 지배적이다. 이중결합들의 수, 또는 포화도는 융점, 반응성, 요리 수행능, 및 수득되는 오일의 건강 기여도를 결정한다.

올레산(18:1)의 리놀레산(18:2)(이는 이후 18:3 형성의 전구체가 된다)의 전환에 관여하는 효소는 DELTA12-올레이트 데사투라제이며, 이는 또한 오메가-6 데사투라제로 언급된다. 지방산 탈포화 경로에서 당해 단계에서의 차단은 고도 불포화유지들(polyunsaturates)의 소비시 올레산의 축적을 초래할 수 있다.

하나의 구현예에서, TALE 도메인(들)을 함유하는 단백질들을 사용하여 대두들에서 FAD2-1 유전자의 발현을 조절한다. 마이크로솜 DELTA.6을 암호화하는 2개의 유전자들은 대두로부터 최근에 클로닝되었으며, FAD2-1 및 FAD2-2로 언급된다[참조: Heppard et al., Plant Physiol. 110:311-319 (1996)]. FAD2-1(델타 12 데사투라제)는 대두 씨에서 다량의 올레산 탈포화를 조절하는 것으로 여겨진다. 따라서, TALE-융합체들을 사용하여 식물들에서 FAD2-1의 유전자 발현을 조절할 수 있다. 구체적으로, TALE 도메인 융합체들을 사용하여 대두에서 FAD2-1 유전자의 발현을 억제함으로써 오일 종자내 올레산(18:1)의 축적을 증가시킬 수 있다. 또한, TALE-융합체를 사용하여 다른 식물들로부터 델타-9 데사투라제, 델타-12 데사투라제, 델타-15 데사투라제, 아세틸-CoA 카복실라제, 아실-ACP-티오에스테라제, ADP-글루코즈 피로포스포릴라제, 전분 신타제, 셀룰로즈 신타제, 슈크로즈 신타제, 노쇠-관련 유전자들, 중금속 킬레이터들, 지방산 과산화물 리아제, 폴리갈락투로나제, EPSP 신타제, 식물 바이러스 유전자들, 식물 진균 병원체 유전자들, 및 식물 세균 병원체 유전자들과 같은 어떠한 다른 식물 유전자의 발현을 조절할 수 있다.

기능성 유전체학 분석들

TALE-융합체는 또한 유전자 발현의 표현형 결과 및 기능을 측정하기 위한 검정들에 대한 용도를 가진다. 집중된 질량 서열분석 노력들과 결부된, 분석 기술들에서의 최근 진전들은 앞서 이용가능하였던 것 보다 많은 분자 표적들을 확인하고 특성화하는 기회를 생성하여 왔다. 유전자들 및 이들의 기능들에 대한 이러한 신규 정보는 기본적인 생물학적 이해와 함께 가속화될 것이며 치료학적 중재를 위한 많은 새로운 표적들을 제공할 것이다. 일부 경우들에서, 분석 도구들은 새로운 데이타의 생성과 보조를 유지하지 못해왔다. 하나의 예가 전세계의 차등적인 유전자 발현의 측정시 최근 발전들에 의해 제공된다. 유전자 발현 미세배열들, 차감적 cDNA 클로닝 빈도들, 감법 하이브리드화(subtractive hybridization) 및 차등적인 디스플레이 방법들에 의해 대표되는 이들 방법들은 상이한 조직들에서 상향 또는 하향-조절되거나 특수 자극에 대한 반응시 유전자들을 매우 신속하게 확인할 수 있다. 점점, 이러한 방법들은 형질전환, 종양 진행, 염증성 반응, 신경학적 질환 등과 같은 생물학적 공정들을 탐색하는데 사용되고 있다. 현재, 제공된 생리학적 현상과 관련되는 차등적으로 발현된 유전자들의 긴 목록들을 매우 용이하게 생성할 수 있지만, 개개의 차등적으로 발현된 유전자와 현상들 사이의 원인 관계의 증명은 어렵다. 지금까지, 차등적으로 발현된 유전자들에 기능을 지정하는 단순한 방법들은 차등적인 유전자 발현을 모니터링하는 능력을 유지하지 못하고 있다.

통상의 분자적 시도들을 사용하여, 후보물 유전자의 과발현은 완전한 길이의 cDNA를 클로닝하고, 이를 포유동물 발현 벡터내로 아클로닝(subcloning)하며 재조합체 벡터를 적절한 숙주 세포내로 형질감염시킴으로써 달성할 수 있다. 이러한 시도는 간단히 용이하지만, 특히 초기 후보물 유전자가 단순히 발현된 서열 태그(EST)에 의해 나타나는 경우, 노동 집약적이다. "통상적인" 방법들에 의한 후보물 유전자의 발현하에서는 여전히 더 문제가 있다. 표적화된 리보자임들에 의지하는 방법들 및 안티센스 방법들은 선택된 표적들의 소 분획에만 신뢰가능하지 않게 성공하고 있다. 동종 재조합에 의한 유전자 녹아웃은 리콤비노게닉(recombinogenic) 줄기 세포들에서는 양호하게 잘 작업하지만 체세포 기원한 세포주들에서는 매우 비효율적이다. 어느 경우에서도 동계 게놈 DNA(10kb의 순서)의 거대한 클론들은 효율적으로 작업하기 위해 재조합에 대해 분리하여야 한다.

TALE-융합 기술들 사용하여 차등적인 유전자 발현 연구들을 신속하게 분석할 수 있다. 조작된 TALE 도메인 융합체들은 특정의 내인성 표적 유전자를 상향 또는 하향-조절하기 위해 용이하게 사용될 수 있다. 매우 적은 서열 정보가 유전자-특이적인 DNA 결합 도메인을 생성하는데 요구된다. 이는, TALE 도메인 융합체 기술이 불량하게 특성화된 차등적으로 발현된 유전자들의 긴 목록들의 분석에 이상적이 되도록 한다. 각각의 후보물 유전자에 대한 TALE-계 DNA-결합 도메인을 단순하게 제조하고, 키메라성 상향 및 하향-조절되는 인공 전사 인자들을 생성하고 모델 시스템내에서 한번에 1회 후보물 유전자들을 스위치 온(on) 또는 스위치 오프(off)함으로써 연구(형질전환, 사이토킨 등에 대한 반응)하에 표현형에 있어 상향 또는 하향-조절의 결과를 시험할 수 있다.

게놈 데이타에 기능성 정보를 첨가하기 위한 조작된 TALE 도메인 융합체를 사용하는 이러한 특수 예는 단지 예시적이다. 유전자 또는 유전자들의 특이적인 상향 또는 하향-조절로부터 유리할 수 있는 어떠한 실험 상황도 조작된 TALE-융합체들의 사용의 신뢰성 및 용이성으로부터 유리할 수 있었다.

또한, 보다 큰 실험적 조절이 보다 통상의 방법들에 의해 달성될 수 있는 TALE 도메인 융합체들에 의해 부여될 수 있다. 이는, 조작된 TALE-융합체들의 생산 및/또는 기능이 작은 분자 조절하에 위치할 수 있기 때문이다. 이러한 시도의 예들은 Tet-On 시스템, 엑다이손-조절된 시스템(ecdysone-regulated system) 및 돌연변이체 프로게스테론 수용체를 포함하는 키메라 인자들을 혼입하는 시스템에 의해 제공된다. 이들 시스템들은 모두 ZFP 조절인자의 기능 및/또는 발현을 소 분자 조절하에 위치시킴으로써 어떠한 목적한 내인성 유전자 또는 어떠한 삽입유전자에 소 분자 조절을 간접적으로 부여할 수 있다.

유전자삽입 유기체들

TALE-융합 기술의 추가의 적용은 유전자 발현을 조작하고/하거나 게놈을 변경시켜 유전자삽입성 동물들 또는 식물들을 생산하는 것이다. 세포주들을 사용하는 것과 같이, 내인성 유전자의 과-발현 또는 유전자삽입 마우스와 같은 유전자삽입 동물에 대한 이종 유전자의 도입은 상당히 간단한 공정이다. 유사하게, 유전자삽입 식물들의 생산은 잘 알려져 있다. 본원에 기술된 TALE 도메인 융합체 기술을 사용하여 유전자삽입 동물들 및 식물들을 용이하게 생성할 수 있다.

유전자 발현을 조작하기 위한 조작된 TALE 도메인 융합체들의 사용은 앞서의 단락에서 기술된 소 분자 조절된 시스템들을 사용하는 성체 동물들로 제한될 수 있다. TALE 도메인-계 억제인자의 발현 및/또는 기능은 발달 동안 스위치 오프될 수 있으며 성체 동물들에서 마음대로 스위치 온될 수 있다. 이러한 시도는 TALE-융합체 발현 모듈(module)만의 첨가에 의존하며; 동종 재조합은 요구되지 않는다. TALE 도메인 융합체 억제인자들은 트랜스 우성이므로, 배선 전파 또는 동형접합성에 대한 관심이 없다. 이들 쟁점들은 불량하게 특성화된 유전자 후보물(cDNA 또는 EST 클론)으로부터 마우스 모델로 이행하는데 요구되는 시간 및 노동에 현저히 영향을 미친다. 당해 능력은 치료학적 개입을 위한 유전자 표적들을 신속하게 확인하고/하거나 입증하고 복합체 생리학적 현상(발달, 조혈, 형질전환, 신경 기능 등)의 분석을 하용한다. 키메라 표적화된 마우스는 문헌[참조: Hogan et al., Manipulating the Mouse Embryo: A Laboratory Manual, (1988); Teratocarcinomas and Embryonic Stem Cells: A Practical Approach, Robertson, ed., (1987); and Capecchi et al., Science 244:1288 (1989)]에 따라 유도시킬 수 있다.

유전적으로 변형된 동물들은 TALE 융합체를 암호화하는 핵산을 세포 또는 배아로 전달함으로써 생성될 수 있다. 전형적으로, 배아는 수정된 하나의 세포 단계 배아이다. 핵산의 전달은 배아의 핵 또는 세포질내로 미세 주입을 포함하는 당해 분야에 공지된 방법들 중 어느 것에 의해 이루어질 수 있다. TALE 융합체를 암호화하는 핵산들은 목적하는 경우 공여체 핵산들과 함께 공-전달될 수 있다. 이후에, 배아들은 당해 분야에 공지된 바와 같이 배양하여 유전적으로 변형된 동물로 발달한다.

본 발명의 하나의 국면에서, 목적한 유전자 또는 유전자자리를 암호화하는 적어도 하나의 염색체 서열 또는 목적 유전자 자리가 수정된 유전적으로 변형된 동물들을 제공한다. 예를 들면, 수정된 유전자는 불활성화됨으로써 전사되지 않거나 적절히 해독되지 않도록 할 수 있다. 대안적으로, 서열을 수정하여 유전자의 대체형이 발현되도록 할 수 있다[예를 들면, 발현된 단백질내 하나 이상의 아미노산의 삽입(녹 인(knock in) 또는 결실(knock out)]. 또한, 목적 유전자는 조절 영역과 같은 삽입된 서열을 포함할 수 있다. 유전적으로 변형된 동물은 수정된 서열에 대해 동종접합성일 수 있거나 이종접합성일 수 있다. 일부 구현예들에서, 유전적으로 변형된 동물은 Rosa26, HPRT, CCR5 또는 AAVS1 (PPP1R12C) 유전자 자리와 같은 '안전한 자리(safe harbor)'내에 삽입된(녹 인) 서열을 가질 수 있다. 동물들에서 이러한 녹인은 다른 염색체 유전자 자리에서 추가로 수정될 수 있다. 일부 구현예들에서, 목적 서열들은 어떠한 선택 마커, 및/또는 프로모터없이 안전한 자리내로 삽입되므로 발현을 구동하기 위해 내인성 프로모터에 의존한다. 일부 국면들에서, 유전적으로 변형된 동물은 "사람화"됨으로써 숙주 종들 동물에 대해 특이적인 특정 유전자들이 사람 동족체로 대체되도록 할 수 있다. 이러한 방식으로, 유전적으로 변형된 동물들은 발현된 사람 유전자(예를 들면, 인자 IX)로 생산되어 사람 유전자, 단백질 또는 질병을 연구하기 위한 동물 모델 시스템의 발달을 허용한다. 일부 구현예들에서, 목적 유전자는 삽입된 목적 유전자(들)를 플랭킹할 수 있는, 인지체 리컴비나제 Cre 및 FLP 각각의 인지를 위한 loxP 또는 FRT와 같은 리컴비나제 인지 부위를 추가로 포함할 수 있다. 유전자들은 뉴클레아제 부위들을 함유하도록 삽입됨으로써 유전적으로 변형된 동물과 인지체 리컴비나제(예를 들면, Cre)를 발현하는 다른 유전적으로 변형된 동물의 교배가 삽입된 유전자를 결여한 후대가 생성되도록 할 수 있다.

적용들

기재된 방법들 및 조성물들은 바람직한 유전자 자리에서 유전자 조절을 제어하는데 사용될 수 있다. 선택한 유전자들은 TALE-반복체 도메인에 융합된 전사 조절 도메인에 따라, 활성화되거나 억제될 수 있다. TALE 활성인자는 분화된 세포들로부터 iPSC를 생산하는 목적을 위해 전분화능-유도 유전자들에 대해 표적화될 수 있다. 이는 특수 질병 상태들 및 iPSC로부터 기원한 세포 치료요법들을 개발하기 위한 시험관내 및 생체내 모델 개발을 위해 사용될 수 있다.

TALE-융합체들은 특히 뇌 또는 눈과 같은 면역 특별 조직에서 치료제들로서 자체로 유용할 수 있다. 예를 들어, 설계된 활성화제들은 적절한 기능(예를 들면, VEGF)에 대한, 또는 과발현되는 경우 독성인 유전자들에 대한 천연의 스플라이스 변이체 비들을 필요로 하는 유전자 생성물의 투여량을 증가시키는데 특히 유용하다. 설계된 TALE 조절인자들에 대한 일시적인 노출은 또한 후생적 변화들을 부여하는 기능적 도메인의 사용을 통해 유전자 발현 상태의 영구적인 스위칭(switching)을 허용할 수 있었다. 당해 기술은 줄기 세포들을 생성하고 이들의 분화 경로들을 제어하기 위한 추가의 용도를 제공할 수 있다. 또한, TALE-융합체들은 면역억제된 환자들에서 사용될 수 있다.

기재된 방법들 및 조성물들은 또한 특정 유전자 또는 유전자들의 게놈적 수정을 위해 사용될 수 있다. 특정 적용들에서, 방법들 및 조성물들은 게놈 서열들의 불활성화를 위해 사용될 수 있다. 지금까지, 절단-계 방법들을 사용하여 옥수수 및 쥐와 같은 경제적으로 중요한 종들을 포함하는, 이러한 능력들이 이미 이용불가능하였던 적어도 9개의 고등 진핵세포들의 게놈들에 대한 변형들을 표적화하였다. 다른 적용들에서, 방법들 및 조성물들은 수정되지 않은 유전자들 또는 사람화된 유전자들의 통합과 비교하여 상이한 발현 또는 생물학적 특성들을 지닌 유전자들의 신규한 대립유전자 형태들의 생성을 포함하는 무작위 돌연변이들의 생성을 허용하며, 이는 결국 세포 또는 동물 모델들의 생성을 허용한다. 다른 적용들에서, 방법들 및 조성물들은 이들 유전자들의 신규한 대립형질 형태들을 수반하는 동물들을 확인하거나 선택하도록 하는 유전자들의 정의된 위치들에서 무작위적 돌연변이들을 생성하는데 사용될 수 있다. 다른 적용들에서, 방법들 및 조성물들은 외인성(공여체) 서열을 게놈의 어떠한 선택된 부위내로의 표적화된 통합을 허용한다. 조절 서열들(예를 들면, 프로모터들)은 목적 부위에 표적화된 양식으로 통합될 수 있었다. "통합"은 물리적 삽입(예를 들면, 숙주 세포의 게놈내로) 및, 또한, 공여체 서열의 동족체-지시된 DNA 복구 동안 발생하는 특수화된 핵산 정보 교환 공정을 통해 숙주 세포 게놈내로의 카피에 의한 통합 둘다를 의미한다.

공여체 서열들은 또한 shRNAs, miRNAs 등과 같은 핵산들을 포함할 수 있다. 이들 소 핵산 공여체들은 게놈내 목적 유전자들에 있어서 이들의 효과들을 연구하는데 사용될 수 있다. 동물 유전자의 게놈성 수정(genomic editing)(예를 들면, 불활성화, 통합 및/또는 표적화되거나 무작위적인 돌연변이)은 예를 들면, 단일 절단 현상에 의해, 절단에 이은 비-동종 말단 결합에 의해, 절단에 이은 동족체-지시된 복구 메카니즘들에 의해, 절단에 이은 공여체 서열의 물리적 통합에 의해, 2개 부위에서 절단에 이은 2개의 절단 부위들 사이의 서열을 결실시키기 위한 결합에 의해, 미스센스(missense) 또는 논센스(nonsense) 코돈의 암호화 영역내로의 표적화된 재조합에 의해, 유전자 또는 조절 영역을 파괴하기 위한 비관련 서열[즉, "스투퍼(stuffer)" 서열]의 유전자 또는 이의 조절 영역내로의 표적화된 재조합에 의해, 전사체의 미스-스플라이싱(mis-splicing)을 유발하기 위한 스플라이스 수용체 서열의 인트론내로의 표적화 재조합에 의해 달성될 수 있다. 일부 적용들에서, 목적한 삽입유전자들은 명시된 위치에서 TALEN-유도된 DSB를 사용하여 포유동물 또는 식물 게놈내의 안전한 하버 유전자자리내로 통합될 수 있다(참조: 미국 특허 공보 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공보 WO 07/014275, 이의 기재내용들은 모든 목적을 위해 이들의 전문이 참조로 혼입된다). 이들 TALEN들은 표적화된 유전적 조작을 위한 키트(kit)들의 성분으로서 공급될 수 있다.

임의로 신규한 또는 비정형의 RVDs를 지니고, 또한 N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인들을 또한 리컴비나제들, 트랜스포사제들, 레졸바제들 또는 인테그라제들과 같은 DNA 조작 효소들에 융합시킬 수 있다. 따라서, 이들 도메인을 사용하여 표적화된 트랜스포존(transposon) 등과 같은 치료제들 및/또는 도구들의 개발을 허용할 수 있다. 또한, N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인은 뉴클레아제 도메인에 융합되어 설계자 제한 효소를 만들 수 있다. 예를 들면, N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인은 일본쇄 FokI 도메인(여기서, 2개의 FokI 절단 반 도메인은 선택한 링커를 사용하여 함께 결합된다)에 융합됨으로써 뉴클레아제 융합체를 지닌 DNA 제제의 처리가 목적하는 위치에서 정확하게 절단이 일어날 수 있게 할수 있다. 당해 기술은 표준 제한 효소들을 사용하여 용이하게 시도되지 않는 DNA 서열의 클로닝 및 조작을 위해 유용할 수 있다. 이러한 시스템은 또한 제조에 사용된 특수화된 세포 시스템들에 유용할 수 있다. 예를 들면, CHO-기원한 세포주들은 내인성으로 활성인 트랜스포사제/인테그라제 시스템을 가지지 않는다. TALE-트랜스포사제/인테그라제 시스템은 CHO 세포내에서 특수 표적화를 위해 개발될 수 있으며 TALE DNA 결합 도메인의 고도의 특수한 특성으로 인해 게놈 수정 등에서 녹 아웃/녹 인에 유용할 수 있다.

TALE-융합체 단백질은 제공된 유전자자리에 대한 특수한 DNA-결합 단백질의 결합을 예방하는데 사용될 수 있다. 예를 들면, 천연의 조절 단백질은, 조작된 TALE 단백질이 숙주 세포내에서 발현되고 이것이 DNA 상의 위치를 점유함으로써 조절 단백질에 의한 조절을 예방하므로 단순히 프로모터내에서 이의 천연 표적에 대한 결합으로부터 차단될 수 있다.

TALE-융합체 단백질은 RNA에 결합하도록 가공될 수 있다. 예를 들면, 이러한 방식으로, 스플라이스 공여체 및/또는 스플라이스 수용체 부위들은 차폐되고 mRNA내에서 특수 위치들에서 스플라이싱을 예방할 수 있다. 다른 국면에서, TALE은 예를 들면, shRNA, miRNA 또는 RNAi와 같은 특수한 기능적 RNA들에 결합할 수 있다.

TALE 융합 단백질은 진단에 유용할 수 있다. 예를 들면, 단백질을 게놈내에서 특정의 서열을 인지하도록 가공됨으로써 특수 질병과 관련된 것으로 공지된 대립형질을 확인할 수 있다. 예를 들면, 구체적인 수의 TALE 반복체 단위들을 지닌 TALE-융합체들은 "야드 스틱(yard stick)" 종류로서 사용되어 트리뉴클레오타이드 반복체 질환(예를 들면, 헌팅톤병)을 가질 가능성이 있는 환자들에서 다수의 트리뉴클레오타이드 반복체들을 측정함으로써 이들 질병들 중 하나로 고생할 경향성을 측정하거나 당해 증상들의 중증도를 예후할 수 있다. 이들 양식의 단백질들은 또한 진단 키트들의 성분으로 공급됨으로써 목적한 유전 마커들이 신속히 확인되도록 한다. 또한, 이들 단백질은 세포들로부터 정제되어 목적 유전자의 대립형질 유형을 분석하고, mRNA 발현 수준들을 측정하는 등과 같은 용도들에 대해 진단 시약들용으로 또는 진단 키트들 속에서 사용될 수 있다. TALE 융합체들은 다채널 또는 미세유동 분석(microfluidic ananysis)들용 규소 칩들 또는 비드들에 부착될 수 있다.

TALE 융합체들은 세팅들을 제조하는에 유용할 수 있다. TALE-전사 인자 융합체들 또는 TALEN들은 목적한 세포주(예를 들면, CHO 세포)들 또는 조류(예를 들면, 생물연료 생산)에서 사용될 수 있다.

TALE 융합체 단백질 매개된 유전자 또는 게놈 유전자자리의 게놈성 수정을 위한 다수의 적용들이 존재한다. 본원에 기술된 방법들 및 조성물들은 사람 질병들의 모델들의 생성 및 목적하는 특성들을 가진 식물 작물들의 생성을 허용한다.

본 명세서에서 인용된 모든 공보들 및 특허원들은, 개개의 공보 또는 특허원 각각이 참조로 혼입되도록 구체적으로 및 개별적으로 나타난 경우와 같이 참조로 본원에 혼입된다.

앞서의 발명이 이해의 명확성을 목적으로 하여 설명 및 예의 방법으로 일부 상세하게 기술되어 있지만, 본 발명의 교시 내용들의 측면에서 특정의 변화들 및 변형들이 첨부된 특허청구범위의 취지 또는 영역으로부터 벗어남이 없이 이에 대해 이루어질 수 있음이 당해 분야에서 통상의 지식을 가진 자에게 용이하게 명백할 것이다.

실시예

실시예 1: 크산토모나스 악소노포디스로부터 천연 TALE의 클로닝

초기 설계 골격으로서 제공될 수 있는 천연의 TALE 단백질을 확인하기 위하여, 둘다 고도의 특이성 및 또한 포유동물 세포내에서 결합하는 표적 서열의 증거를 나타낸 표준 TALE 및 천연 TALE을 확인하였다. 상세하게는, 12.5 TALE 반복체들(12개의 완전한 반복체들 및 TALE 13으로 언급된 반 반복)을 함유하는 TALE-단백질을 다음 프라이머 쌍을 사용하여 PCR 증폭에 의해 크산토모나스 악소노포디스로부터 클로닝하였다:

pthA_d152N_EcoR, ACGTGGATTCATGGTGGATCTACGCACGCTC (SEQ ID NO:52) 및

pthA_Sac2_Rev, TACGTCCGCGGTCCTGAGGCAATAGCTCCATCA (SEQ ID NO:53). 프라이머 쌍을 초기에 설계하여 N-말단 152개 아미노산 트렁케니션(절단)을 지닌 AvrBs3 유전자를 증폭시켰다. 당해 서열들은 식물 세포들 내로의 수송을 위해 필수적이지만, 한편 기능을 위해 불필요한 것으로 이미 밝혀져 있다[참조: Szurek et al (2002) Mol. Micro 46(1) p. 13-23]. 다수의 중심 탄뎀 반복체(tandem repeat)들의 변형을 지닌 고도로 보존된 서열에 의해 특징화된, 수개의 TALE 단백질들을 이들 프라이머 쌍들을 사용하여 PCR로 분리하였다. hssB3.0으로 보고된[참조: Shiotani et al (2007) J. Bacteriol 189 (8): 3271-9] TALE15를 제외하고, 분리된 다른 TALE 단백질들은 공공의 문헌에서 보고되지 않았기 때문에, 신규 단백질들로 여겨진다. 이들은 각각 13, 9, 및 16개 TALE 반복체들을 갖는 TALE13, TALE9, 및 TALE16을 포함한다.

TALE13(추론된 N-캡의 길이를 갖는)의 도메인 맵은 도 1a에 나타내며 단백질이 상호작용하는 DNA 서열을 측정하는 아미노산들 및 도메인들을 나타내는 서열은 당해 작업에서 사용된 위치 번호매김 시스템의 지시인자들과 함께 도 1b에 나타낸다.

실시예 2: TALE13 및 다른 TALE들의 절단 및 DNA 결합에 있어서의 효과들

최대 활성을 제공하는 캡핑 서열들의 범위의 초기 조사로서, TALE의 수개의 절단들을 제조하였다. 당해 절단들은 표 4에서 하기 나타낸다.

[표 4]

TALE 절단 특성들

주: (+)은 영역의 존재를 나타내는 반면 (-)는 이의 부재를 나타낸다.

절단들의 영역들은 다음과 같이 번호매김한다: N-말단에서, 종점(end point)은 처음의 실제 TALE 반복체의 제1 염기로부터 N-말단 방향으로 아미노산 잔기들의 수를 열거하는 번호에 의해 나타낸다(참조: 도 1b). 예를 들면, N+91의 표지는 제1의 실제 반복체의 N-말단으로부터 N-말단 방향으로 완전한 91개 아미노산들을 남기는 N-말단에서의 절단을 기술한다. C-말단에서, 종점은 마지막 완전한 TALE 반복체의 마지막 아미노산으로부터 C-말단 방향으로 아미노산들의 번호로 나타낸다. TALE-13, 클론 #1로 명명된 절단 #1은 제거된 완전한 길이의 TALE 단백질의 N-말단 152개 아미노산 및 수득되는 N 말단에 첨가된 단일의 메티오닌 잔기를 가짐으로써 N+137 종점((N-캡)을 가져서, 당해 클론의 길이가 대략 2.5kb가 되도록 한다. 또한, 절단 #2는 제거된 완전한 길이의 TALE 단백질의 N-말단 152개 아미노산 및, 수득되는 N-말단에 첨가된 단일의 메티오닌 잔기를 갖고, 따라서 N+137 종점, 및 또한 NLS의 5' 가장자리(edge)의 하부로 C-말단 서열을 가져서, 당해 클론이, 길이가 대략 2.0kb가 되도록 한다. 절단 #3은 루이신이 풍부한 영역(루이신이 풍부한 영역은 반-반복체에 대해 C-말단에 존재하며 C-캡의 C +52까지 연장된다)을 결실함으로써, 당해 클론이 길이가 대략 1.6kb가 됨을 제외하고는 클론 #2와 유사하다. 절단 #4는 N-말단에서, 모두 결실되어 있고 R0 반복체 서열을 포함함으로써 당해 클론이 길이가 대략 1.6kb가 됨을 제외하고는 클론 #2와 유사하다. 절단 #5는, C-말단 측면에서 이의 결실이 루이신이 풍부한 서열을 포함(클론 #2와 유사)함으로써, 당해 클론이, 길이가 대략 1.4kb가 됨을 제외하고는 클론 #4와 유사하다. 완전한 길이의 TALE 13 단백질의 추론된 표적 서열은, 당해 단백질에 대해 확인된 내인성 표적 부위가 아직 존재하지 않는다고 해도, TATAAATACCTTCT (SEQ ID NO:54)이다. 절단 #6은, 43개의 추가의 아미노산들이 결실된 것을 제외하고는, N-말단들로부터 152개 아미노산들이 결실되고 C-말단 영역들에서 클론 #2와 유사하다. 절단 #7은 N-말단으로부터 165개 아미노산들을 결실하며 클론 #6과 동일한 C-말단 결실을 갖는다. 절단 #6 및 #7은 하기 논의되어 있다.

표준 SELEX 검정을 트렁케이트된 TALE 단백질들에서 수행하여 이들 단백질이 결합된 DNA 서열을 확인하고[SELEX 방법에 대해서는, Perez, E. E. et al. Nature Biotech. 26, 808-816 (2008) 참조], 그 결과들을 표 5 및 6에 나타낸다. 표 5에 나타낸 실험은 표적 라이브러리 N18TA를 사용하여 수행하였다. N18TA 라이브러리는 하기 서열을 갖는 DNA 중복체(duplex)를 포함한다.

N18TA:

5'CAGGGATCCATGCACTGTACGTTTNNNNNNNNNNNNNNNNNNAAACCACTTGACTGCGGATCCTGG 3'(SEQ ID NO:55), 여기서 N은 모든 4개 염기들의 혼합물을 나타낸다. 추가의 라이브러리들(나타낸 바와 같음)은 다음 서열들을 포함한다:

데이타는 하기 표 5에 염기 빈도 매트릭스(base frequency matrix)로서 나타낸다. 이들 매트릭스들의 각각의 위치에서, 박스는 예측된 RVD 표적 염기를 나타내고, 숫자들은 각각의 회수된 염기 유형의 상대적 빈도를 나타내고, 여기서 1.0은 100%를 나타낸다.

[표 5]

TALE 13, 클론 #1을 사용한 SELEX 결과들

TALE 13 클론 #1 단백질은 N-말단 152개 아미노산들을 결여함에도 불구하고 이의 결합에 있어서 고도로 선택적인 것으로 여겨진다. TALE 13, 클론 #2에 대한 SELEX 데이타는 표 6에 나타낸다. 당해 표에서, SELEX는 표적 서열들의 2개의 상이한 라이브러리들과 함께 반복되었으며 라이브러리들 둘 다로 유사한 결과들을 수득하였다.

[표 6]

TALE 13, 클론 #2를 사용한 SELEX 결과들

클론 #3, 4 및 5를 SELEX 과정에 적용시키는 경우, 컨센수스 서열들은 검출되지 않았다. 따라서, TALE 결합 도메인들은 클론 #2로부터 구성된 N- 및 C-말단 cap 서열들을 필요로 함으로써 당해 검정에서 컨센수스 서열을 수득하는 것으로 여겨진다. 추가의 절단들을 제조하고 필수적으로 문헌(참조: Bartsevich et al., Stem Cells. 2003; 21:632-7)에 기술된 바와 같이 DNA 결합 ELISA 검정을 사용하여 활성에 대해 시험하였다. 절단들은 하기 표 7에 나타내며, 당해 표는 또한 ELISA 결과들을 포함한다. 당해 절단들에서 출발하는 N-말단은 위에서 논의한 #1, #2, 및 #3 절단들에서 N-말단과 동일하게, 152번 아미노산에 존재한다. 당해 일련의 미세한-규모(fine-scale) 절단에서, 종점들은 다음과 같다.

[표 7]

TALE13의 우수한 절단들에서 ELISA 결과들

이들 데이타는, 당해 시험관내 검정에서 효율적인 TALE 결합이 N+122와 N+137 사이 및 또한 C+53과 C+95 사이의 잔기들을 필요로 함을 제안한다(N121 이하 및 이를 포함하는 N-캡 잔기들은 강력한 결합에 충분하지 않았으며 C+52 이하 및 이를 포함하는 C-캡 잔기들은 강력한 결합에 충분하지 않았다).

예비 맵핑 연구는 최적 결합 활성을 달성하기 위해 크산토모나스 TALE의 최소 N-캡 및 C-캡 서열들의 평가를 허용한다. N-말단 cap의 경우, 제1의 실제 반복체로 개시하기 전에 N+122과 N+137 아미노산들 사이의 아미노산들의 일부를 포함하는 서열은 DNA 결합 활성에 요구되는 것으로 여겨진다. 랄스토니아(Ralstonia) cap에 대한 유사한 cap 예들은 크산토모나스 TALE들에 대한 구조적 상동성을 기본으로 제조될 수 있다(하기 표 8 참조). C-말단 cap들에서, 굵은 아미노산들은 RVD들을 나타낸다.

[표 8]

Cqp 예들

실시예 3: 천연의 TALE 단백질들 9 및 16에 대한 결합 특이성

2개의 추가의 천연 TALE 단백질들을 SELEX 과정에 적용시켜 이들 단백질이 결합하는 표적 DNA 서열들을 확인하였다. TALE 9는 다음 DNA 표적을 규정하는 8.5 TALE 반복체들을 갖고: TANAAACCTT (SEQ ID NO:56), 한편, TALE16는 다음 표적을 예측하는 15.5 TALE 반복체들을 갖는다: TACACATCTTTAACACT (SEQ ID NO:57). 당해 데이타는 표 9 및 10에 나타낸다. 표 9에서는, 클론 #2 구조들에서 TALE 9 단백질을 사용하여 결과들을 나타낸다. TALE 13 클론 #2를 사용하는 경우와 같이, 당해 실험을 제2의 부분적으로 무작위처리된 DNA 라이브러리를 사용하여 반복하여 제1 라이브러리와 유사한 데이타를 제공하였다. TALE 13에 대해 위에서 기술한 바와 같이, TALE 9는 이의 표적 서열에 대해 고도로 특이적이다.

[표 9]

TALE 9, 클론 #2을 사용한 SELEX 결과들

표 10은 N18TA 라이브러리를 지닌 TALE 16 단백질에 대한 SELEX 데이타를 나타내며 다시 확인된 표적에 대한 고도의 서열 특이성을 입증한다.

[표 10]

TALE 16, 클론 #2을 사용한 SELEX 결과들

추가의 절단들을 TALE 단백질들에서 수행하여 효율적인 DNA 결합에 대한 조건들에 대해 추가로 조사하였다. 상기 표 4는 이들 절단들을 나타낸다. TALE 9를 클론 #6 절단에서 시험하는 경우(표 11), DNA 결합 특이성이 유지되었다(표 11을 표 9와 비교).

[표 11]

TALE 9, 클론 #6을 사용한 SELEX 결과들

실시예 4: 포유동물 세포들에서 TALE -융합 단백질들에 의한 리포터 유전자 활성화

포유동물 세포들 내에서 TALE 도메인 융합체들의 기능적 활성을 조사하기 위하여, 조작된 리포터 제작물들을 다음과 같이 제조하였다. 클로닝된 TALE 13 또는 TALE 15에 대한 표적 서열의 하나 이상의 카피들을 NheI과 Bgl II 부위들 사이에 리포터 제작물내에 삽입함으로써 표적들이 pGL3 플라스미드(Promega)내에서 최소 SV40 프로모터에 의해 구동된 개똥벌레 루시퍼라제 발현 단위로부터 상부에 위치하도록 한다(참조: 도 2). pGL3 플라스미드의 프로모터 영역을 도 2a에 나타내고 TALE13에 대한 2개의 예측된 표적 부위들을 도 2b에 나타낸다. 도 3에 나타낸 실험에서, TALE 단백질 제작물은, 2개의 표적을 함유하는 리포터 플라스미드(도 3a), 및 내부 대조군으로서 레닐라(Renilla) 루시퍼라제(Promega)를 함유하는 발현 제작물과 함께, 사람 293 세포내로 공-형질감염시켰다. 다음에, 각각의 TALE 단백질에 의해 유도된 개똥벌레 루시퍼라제 활성을 형질감염 후 2일째에 분석하였다. 다수의 표적들에 대한 반응시, TALE VP16 융합체들은 포유동물 세포들 내에서 리포터 유전자 발현을 상승적으로 활성화시킬 수 있다(도 3). 또한, 도 4b에 나타낸 바와 같이, VP16 활성화 도메인(TR13-VP16 및 TR15-VP16)이 첨가된 TALE 단백질들은 루시퍼라제 리포터 유전자를 활성화시킨다. VP16 도메인이 없는 천연의 TALE 단백질의 발현은 루시퍼라제(TR13 및 TR15)를 활성화시키지 않는다. 따라서, 리포터 유전자 활성화는, 정확한 표적들이 이들의 상응하는 TALE 융합체와 일치하는 경우에만 관찰되며, 이는, 전사 활성화가 표적화된 DNA 결합으로부터 생성됨을 제안한다.

다음에, TALE 표적 서열들을 표적화된 프로모터에 대하여 먼 위치 및 근접한 위치에 삽입하였다. 당해 실험에서, TALE13 표적을 도 5a에 나타낸 바와 같이 사용하였으며, 여기서 4개의 표적 서열들이 프로모터의 상부(예를 들면, "R13x4") 또는 하부("R13x4D")에 삽입되었다. 도 5b에 나타낸 결과들은, 최적의 활성화가, TALE13 결합 부위가 목적 프로모터에 가장 근접하게 상부로 위치하는 경우에 관측됨을 입증한다.

실시예 5: 인공의 TALE 전사 인자의 제작

TALE 단백질이 전사 조절 도메인에 연결되어 포유동물 세포내에서 리포터 유전자 발현을 조절할 수 있는지를 입증하기 위하여, 바람직한 표적 특이성을 가진 TALE 전사 인자를 가공하기 위한 실험들을 수행하였다. TR13 VP16의 사일런트 돌연변이(즉, 아미노산 서열이 변경되지 않은 뉴클레오타이드내 변화)를 도입시켜 처음의 탄뎀 반복체의 개시부 및 마지막 탄뎀 반복체의 말단 각각에서 2개의 유일한 제한 부위들, ApaI 및 HpaI를 생성하였다. 이후에, 이들 ApaI 및 HpaI 부위를 TR13 VP16 골격내로 합성 탄뎀 반복체를 클로닝하는데 사용하여 탄뎀 반복체를 플랭킹하는 완전한 N- 및 C-말단 서열들, 및 VP16 활성화 도메인을 가진 조작된 TALE를 생성하였다.

표적화된 서열은 NT3 프로모터 서열내에 위치하는 GGAGCCATCTGGCCGGGT (SEQ ID NO:58)이었다. 앞서, 당해 서열에 대해 표적화하는 ZFP TF 23570은 내인성 NTF3 유전자 발현을 활성화시키는 것으로 밝혀졌다(참조: 공동-소유의 미국 가특허원 61/206,770). TALE AvrBs3으로부터의 17.5 탄뎀 반복체를 골격으로 사용하여 TALE18(또한 "NT-L"로 명명됨)을 가공하여, 조작된 TALE18 아미노산 서열들의 탄뎀 반복체들이 변경되어 의도한 표적 뉴클레오타이드를 규정하도록 하였다. 조작된 TALE18로부터 DNA-결합 도메인의 아미노산 서열을 하기 표 12에 나타내며, 여기서 RVD들은 굵은 활자체로 박스 안에 나타낸다.

[표 12]

조작된 TALE18 ( NT -L)의 DNA -결합 도메인

앞서 조작된 노력들에서 사용된 4개의 RVD들(표적 A, C, G 및 T 각각에 대해 NI, HD, NN, 및 NG) 외에, 본 발명자들은 또한 이것이 2개의 천연적으로 존재하는 단백질들에서 인지체 표적 부위 구아닌을 사용하여 관찰되었으므로, DNA 표적 부위내에서 G 뉴클레오타이드들에 상응하는 위치들에서 TALE 반복체들의 소세트내에 NK RVD를 혼입시켰다(참조: Moscou et al, ibid). 앞서의 실험 연구들과 일치하여(참조: Boch et al, ibid), 본 발명자들은, 평균적으로 NI, HD, NG가 아데닌, 사이토신, 및 티민 각각에 대한 강력한 선호도를 나타내었으며 NN은 구아닌에 대한 선호도를 나타낸 반면, 또한 아데닌에 결합할 수 있음을 발견하였다. 대조적으로, NK RVD는 구아닌에 대해 강력한 선호도를 나타내며, 이는, 적어도 하나의 구아닌을 포함하는 부위들을 표적화하는 조작된 TALE 단백질들에 대한 잠재적인 개선을 나타낸다.

이후에, 조작된 TALE18의 17.5 탄뎀 반복체들을 암호화하는 DNA 서열을 아미노산 서열로부터 유도하여, 다음과 같이, 길이가 약 40개 뉴클레오타이드들인 84개의 오버랩핑 올리고들에 의해 합성하였다. 우선, 전체 1.8kb DNA 서열들을 11개 블럭들로 나누고, 각각의 블록을 포함하는 오버랩된 올리고들을 PCR-계 방법으로 조립하였으며; 이후에 11개의 블록들을 함께 오버랩핑 PCR에 의해 4개의 보다 큰 블록들로 융합시키고, 4개 블록들은 최외곽 프라이머 쌍들을 사용하여 오버랩핑 PCR에 의해 완전한 길이로 조립하였다. 이후에, 합성된 탄뎀 반복체들을 확인하여 위에서 기술한 바와 같이, TR13-VP16의 ApaI 및 HpaI 부위들내로 클로닝하여 NT-3 프로모터(R23570V)에 표적화하는 조작된 TALE18(NT-L)의 발현 제작물을 생성하였다.

이후에, 당해 조작된 단백질(NT-L로 명명됨)의 특이성을 SELEX로 측정하여, 결과들을 하기 표 13에 나타낸다. 알 수 있는 바와 같이, 데이타는, 전체 신규 TALE 단백질을 가공하여 목적한 서열과 결합시키는 것이 가능함을 입증한다. SELEX 선택을 또한 표 13에서 하기 나타낸 바와 같이 클론 #6 절단(상기 참조) 내에서 NT-L을 사용하여 수행하였으며, 하기 TALE 9와 유사하게, NT-L의 특이성이 당해 절단내에서 유지됨을 입증하였다. SELEX 실험은, DNA 결합 특이성이 유지됨이 입증된 클론 #7 절단내에서 NT-L로 수행하였다.

[표 13]

NT-L, 클론 #2, #6, 및 #7을 사용한 SELEX 결과들

이후에, 조작된 NT-L 단백질들의 전사 활성을 표적 서열의 2개 카피들을 함유하는 루시퍼라제 리포터 제작물에 대해 분석하였다. 하기 표 14 및 도 6a에서 나타낸 바와 같이, 조작된 17.5 탄뎀 반복체들을 함유하지만, 기타의 경우 TR13-VP16과 동일한 조작된 NT-L 융합 단백질(R23570V)은 강력한 리포터 유전자 활성화를 구동시킬 수 있는 반면, 탄뎀 반복체들(R0-VP16)이 없는 유사한 제작물은 루시퍼라제를 활성화시키지 않는다. 완전한 길이의 탄뎀 반복체들(N-캡 및 C-캡)을 플랭킹하고 있는 TALE 서열들은, 반복체들(각각 nR23570S-dNC 및 nR23570S-dNC)를 플랭킹하는 N-말단 또는 C-말단 서열의 결실은 전사 활성을 폐지하므로 리포터 유전자 활성화를 필요로 한다. nR23570S-dNC로 명명된 제작물은 SV40 핵 국재화 시그날(n)을 함유하였으며 조작된 NT-L 반복체(R23570)은 단일의 p65 활성화 도메인(S)에 융합되었다. 당해 제작물은 반복체들만을 함유하였으나 TALE(dNC)로부터의 N-말단 또는 C-말단 서열은 함유하지 않았다. 제작된 nR23570SS-dNC는 2개의 p65 활성화 도메인들을 가졌다는 것을 제외하고는 nR23570S-dNC에 대해 기술된 것과 동일하였다.

표 14로부터 알수 있는 바와 같이, 리포터의 최고 수준의 활성화는 R23570V 제작물을 사용하여 발견되었다. NT-L 반복체들은 N-말단 및 C-말단 캡핑 영역들의 부재하에서 사용된 경우, 배경을 초과하는 활성화가 당해 검정에서 관측되지 않았음(모형(mock)에 대해 nR23570S-dNC를 비교)에 주목한다.

[표 14]

NT-L 융합체의 리포터 활성화

다음에, 제작물들을 사용하여, 조작된 융합 단백질이 포유동물 세포에서 이의 염색체 유전자자리내 내인성 유전자를 활성화시킬 수 있는지를 알아보기 위해 내인성 NTF3 유전자를 표적화하였다. 도 6b의 실험에서, 조작된 NT-L (R23570V), 및 대조군 제작물들(R0-VP16, GFP)을 사람 293 세포들에 일시적으로 형질감염시켰다. 형질감염 2일 후에, NT-3 발현 수준을 태크만 분석(Taqman analysis)으로 분석하였다. 도 6b에 나타낸 바와 같이, 조작된 NT-L(R23570V)의 발현은 사람 293 세포들내에서 NTF3 mRNA 발현의 실질적인 증가를 가져온 반면, 대조군 단백질들(R0-VP16 또는 GFP)의 발현은 NTF3 발현 수준에 영향을 미치지 않았다. 이는, 최초로 특이적으로 조작된 TALE 도메인 융합 단백질이 포유동물 세포내에서 사용되어 내인성 유전자의 발현을 활성화시킨 것이다.

추가의 예시적인 제작물을 제조하여 TALE 반복체 도메인을 플랭킹하는 C-말단 영역들의 모든 278개 잔기들이 활성에 필요한지를 측정하였다. 당해 추가의 제작물(+95)은 TALE 반복체 도메인과 VP16 활성화 도메인(예를 들면, C +95 C-캡) 사이의 C-말단 영역의 처음 95개 잔기들만을 함유하였다. 도 7은, 이들 2개의 제작물들(+278 제작물은 도 6에서 R23570V로 언급되었다) 및 mRNA 및 단백질 수준들에서 NTF3 활성화시 이들 단백질들의 효과의 도식을 나타낸다. 또한 보다 긴 이들 제작물들(+278 C-말단(또는 완전한 길이)의 도메인 함유)에 대한 SELEX 결과들을 나타낸다. 당해 도에서 알 수 있는 바와 같이, TALE 전사 인자 제작물들 둘다는 mRNA 및 단백질 수준들 둘다에서 NTF3 발현을 상향-조절할 수 있다.

VEGF, CCR5 및 PEDF 유전자내 영역들에서 결합에 대해 특이적인 제작물들을 또한 생성하였다. 위에서 기술한 바와 같이, 반복체 도메인들을 가공하여 상기 기술된 방법에 의해 이들 표적들에 결합시켰다. 이들 단백질들에 대한 표적 부위들은 실시예 7에서 하기 나타낸다. 단백질들은 10-반복체 또는 18-반복체 DNA 결합 도메인들을 함유하였다.

또한, 일련의 절단들을 9.5 반복체 NTF3-특이적인 및 9.5 반복체 VEGF-특이적인 TALE DNA 결합 도메인들에서 제조하였다. 절단들은 TNT 커플링된 망상적혈구 분해물 시스템(Coupled Reticulocyte Lysate system)(제조원: Promega)내에서 발현시키고 분해물을 사용하여 다음과 같이 DNA 단편들에 결합시켰다. 단백질은 250 나노그람의 뉴클레아제 융합 클론 플라스미드를 함유하는 5μL의 물을 20μL의 분해물에 가하고 30℃에서 90분 동안 항온처리하여 발현시켰다. 결합 검정들은 위에서 기술한 바와 같이 수행하였다. 표준 기술을 사용한 웨스턴 블롯들은, 발현된 단백질들이 모두 동등하게 발현되었음을 입증하였다. 결합 검정들의 결과들은 표 8에 나타낸다. 당해 실험들에서, N-말단의 절단들의 경우, C-말단 아미노산을 C+95에서 유지시킨 반면, C-말단 절단들의 경우, N-말단을 N+137 구조로 유지시켰다. 도면으로부터 알 수 있는 바와 같이, 최대 결합은, 단백질들이 제1의 실제 반복체의 N-말단 측면에서 적어도 134개의 아미노산, 및 반 반복체의 C-말단 측면에서 적어도 54개의 아미노산들을 함유한 경우 관찰되었으며, 흥미롭게도, 이는 NTF3 서열에 대해 표적화된 TALE DNA 결합 도메인 및 VEGF 서열에 대해 표적화된 TALE DNA 결합 도메인 둘다의 경우 사실이었다(패널 A 및 B를 비교함). 중요한 134번 N-말단 위치 주변에서 절단들은, C-말단이 +54(위에서 기술한 바와 같은 C+95보다는 오히려)에 절단된 단백질을 사용하여 반복하고 C-말단 절단들은, N-말단이 +134 위치(N+137보다는 오히려)에 대해 절단된 경우 반복하였다. 데이타는 도 9에 나타내며 앞서의 실험에서 관찰된 바와 같이, C 말단이 +54 이후에 트렁케이트되고/되거나 N 말단이 +134 이후에 트렁케이트된 경우 DNA 결합에 있어서 유사한 드롭-오프(drop-off)를 나타낸다. 이들 데이타는, 당해 시험관내 친화성 검정에서 최적의 결합에 대한 최소의 cap들이 N+134 및 C+54 위치에서 연장되었음을 나타낸다.

실시예 6: 포유동물 세포들에서 DNA 표적화에 관여하는 TALE 기능성 도메인들의 해부

당해 실험에서, 하기 표 15에 나타낸 바와 같이, TALE13 단백질들의 N-말단 또는 C-말단에서 각종 결실들을 생성시켰다.

[표 15]

TALE 13 결실 제작물들

모든 제작물들은 VP16 활성화 도메인(VP 16을 지닌 제작물들은 "R13V"으로 지정하였다) 및 핵 국재화 시그날(NLS를 지닌 제작물들은 "nR13"으로 지정하였다)에 연결시키고 예측된 TALE13 표적들의 2개 카피들을 함유하는 리포터 제작물로부터의 리포터 유전자 활성화에 대해 시험하였다(도 10, 상부 패널).

도 10에 나타낸 바와 같이, 당해 제작물들 세트에서 강력한 리포터 활성화 활성을 보유하는 최소 영역(참조: 표 15)는 R13V-d182C이며, 이는 이의 N-말단에서 152개 아미노산들 및 이의 C-말단에서 183개 아미노산들을 결여하고 있다. 이들 결과들은, 제1의 탄뎀 반복체들과 루이신이 풍부한 영역 앞에 있고 마지막 반복체가 이어서 오는 R0 영역이 당해 검정에서 최적의 결합을 제공한 반면, 이의 C-말단에서 핵 국제화 시그날, 및 천연의 활성화 도메인을 함유하는 영역이 포유동물 세포들에서 DNA-표적화에 불필요함을 입증한다.

실시예 7: 뉴클레아제 도메인들에 연결된 TALE의 뉴클레아제 절단 활성의 입증

다음에, 인공의 TALE 뉴클레아제들(TALENs)과 관련하여 TALE들의 DNA 표적화 능력을 평가하였다. 실시예 6에서 정의된 바와 같은 TALE13의 DNA 표적화 도메인을 뉴클레아제 도메인들에 연결시켜 R13d182C-scFokI로 명명된 제작물을 생성하였으며, 이는 FokI 도메인들 사이에 GGGS 서열의 12개 카피들에 의해 연결된, FokI 뉴클레아제 도메인의 2개 카피들을 사용하여 VP16 활성화 도메인을 대체한 것을 제외하고는, 상기 기술된 R13V-d182C와 동일하다. 이후에, TALEN 제작물을 일본쇄 어닐링(SSA)을 기본으로 한 리포터 검정에서 뉴클레아제 활성에 대해 시험하였다(참조: 공동-소유의 미국 특허 공보 20110014616).

당해 검정에서 사용된 리포터 제작물(도 11a, SSA-R13)은 GFP 암호화 서열의 N-말단(GF) 및 C-말단 부분(FP)에 의해 샌드위치된 예측한 TALE13 표적을 함유한다. 리포터 SSA-R13 자체는 GFP 발현을 유도할 수 없지만, TALE13 표적에서 절단은 GFP의 N- 및 C-말단 부분 중에서 동종 재조합(HR)을 촉진하여 기능성 GFP 삽입유전자를 형성할 것이다. 이의 결과들이 도 11b에 나타나 있는 실험에서, SSA-R13 리포터 제작물은, (모형) TALEN 제작물의 존재 또는 부재와 함께, 앞서 기술한 바와 같이 K562 세포들내로 일시적으로 형질감염시켰다.

형질감염 2일 후, GFP 양성 세포들의 퍼센트를 유동 세포분석법으로 분석하였다. 도 11b에 나타낸 바와 같이, 약 7%의 GFP 양성 세포들이 TALE 플라스미드(모형)를 결여하고 있는 대조군 실험에서 약 1.4%와 비교하여, TALEN 융합체들(R13d182C-scFokI)에 의해 SSA-R13 리포터 플라스미드로부터 생성되었으며, 이는 SSA-R13 리포터에서 TALE13 표적에서 절단에 있어 유의적인 증가를 나타낸다.

이들 데이타는, TALE DNA 결합 도메인들을 사용하여 포유동물 세포들내에서 DNA의 부위 특이적인 절단을 위한 기능적인 TALEN들을 생성할 수 있음을 입증한다.

TALE 도메인 융합체들을 또한 FokI 절단 반 도메인들을 사용하여 제작하였다. 당해 실험에서, 야생형 FokI 반 절단 도메인들을 사용함으로써 뉴클레아제 활성의 경우, 단독이합체가 융합체들 2개로부터 형성되어야만 하도록 하였다. 이들 융합체들을 위해, TALE13 DNA 결합 도메인은 TALE DNA 결합 도메인을 FokI-규정 서열에 인접한 플라스미드내로 클로닝함으로써 각각의 FokI half 도메인에 융합시켰다. 또한, 각종 링커들은 DNA 결합 도메인과 뉴클레아제 도메인 사이에서 용도에 대해 시험하였다. 다음과 같은 링커들 L2 및 L8을 사용하였다: L2= GS (SEQ ID NO:71) 및 L8= GGSGGSGS (SEQ ID NO:72). 표적 부위들을 각각의 표적 결합 부위 사이에 다양한 gap 공간들을 갖는 TOPO2.1 표적 벡터(제조원: Invitrogen)내로 클로닝함으로써 2개가 서로 2 내지 22 bp 분리되도록 하였다. 표적 벡터의 대략 1kb 영역의 PCR 증폭을 수행하여 표적 DNA들을 생성하였다. TALE DNA 결합 도메인들을 또한 앞서 기술한 바와 같이 트렁케이트하고, 상기 실시예 2 및 6에서 기술한 바와 동일한 명명법을 사용하여 기술한다. TALE 도메인 뉴클레아제 융합 클론들은 250나노그램의 뉴클레아제 융합 클론 플라스미드를 함유하는 5μL의 물을 20μL의 분해물에 가하고 30℃에서 90분 동안 항온처리함으로써 TNT 토끼 망상적혈구 분해물 시스템에서 발현시켰다.

이후에, 분해물을 사용하여 다음과 같이 표적 DNA를 절단하였다: 2.5μL의 분해물을 50 나노그람의 PCR-증폭된 표적 DNA 및 1X의 최종 완충액 2(제조원: New England Biolabs) 농도를 함유하는 50μL의 반응물에 가하였다. 절단 반응은 37℃에서 1시간 동안에 이어서 65℃에서 20분의 가열 불활성화하는 것이었다. 이어서, 반응물을 고속에서 원심분리하여 분해물로부터 표적 DNA를 분리하여, 분해물이 반응 웰 속에서 펠렛으로 농축되도록 하였다. DNA-함유 상층액을 피펫팅하여 제거하고 에티디움 브로마이드-염색된 아가로즈 겔(제조원: Invitrogen)에서 이동시켜 절단된 표적 DNA로부터 완전한 표적 DNA를 분리하였다. 이후에, 아가로즈 겔을 AlphaEaseFC(제조원: Alpha Innotech) 소프트웨어를 사용하여 분석함으로써 표적 DNA의 단일 절단 현상으로부터 생성되는 2개의 보다작은 DNA 밴드들 및 대형의 절단되지 않은 DNA 밴드 속에 존재하는 표적 DNA의 양을 측정하였다. 겔내로 로딩된 표적 DNA의 총 양에서 제외된 절단된 DNA의 비율은 각각의 반응에서 절단 퍼센트로 나타낸다.

본 발명자들은 관련없는 펩타이드 서열의 트리밍(trimming)이 TALEN들의 촉매 활성을 개선시킬 수 있는, FokI 절단 도메인의 보다 구속된 부착을 제공할 수 있다는 것을 추론하여, 효율적인 결합에 요구되는 특이적인 영역들 하부로 융합체를 축소시키기 위한 노력에서 TALE 단백질들의 플랭킹 영역들을 최소화하려고 하였다. TALE DNA 결합 도메인의 N- 및 C-말단들(SEQ ID NO:73 및 서열 번호 369)에서 이루어진 절단들은 하기 나타낸 바와 같이 제조하였으며, 여기서 절단 부위들은 아미노산 서열 위에 나타내고, 예측된 2차 구조(C= 무작위 코일(random coil), H= 나선형)는 서열 아래에 나타낸다.

C-캡:

N-캡:

C-말단 결실 연구들의 결과들은 도 12 및 13에 나타낸다. 도 12는 에티디움 브로마이드 염색된 아가로즈 겔들 위에서 절단 생성물을 가시화시킴에 의한 표적 서열들의 절단을 나타낸다. 도 12에서, L2 또는 L8은 사용된 링커를 나타내며, 각각의 레인 아래의 숫자는 이합체의 2개의 표적 DNA 결합 부위들 사이의 bp gap을 나타내었다. 'S'는, 활성 뉴클레아제 단독이합체가 DNA위에서 형성될 수 없도록 단지 하나의 표적 DNA 결합 부위의 존재를 나타낸다. "Pmll"은 TALE 결합 부위들 다음의 클로닝된 DNA 표적 서열내에 위치하는 유일한 제한 부위의 시판되는 제한 효소(제조원: New England Biolabs)를 사용하여 절단의 양성 대조군 반응을 나타낸다. PmlI 부위에서 절단은, 클로닝된 표적 부위가 PCR-증폭된 표적 DNA에 존재하며 또한 절단된 DNA의 대략 예측된 크기를 나타낸다. 블랭크(blank)는, TALEN이 생산되지 않도록 TALEN 암호화 플라스미드의 부재하에서 음성 대조군 TNT 반응을 나타낸다. 데이타는 도 13에서 그래프 양식으로 나타내며, 단백질의 절단 활성이 적어도 9개 염기들의 스페이서 길이(spacer length)에 대해 C+28 및 C+39 C-캡들로 증가함을 나타낸다. 이들 실험들을 지속하여 추가의 C-캡들(C-2, C+5, C+11, C+17, C+22, C+25, C+28 및 C+63)을 제작하였다. 결과들은 하기 표 16에 요약한다. "스페이서"는 표적 부위들 사이의 다수의 염기 쌍들을 나타내고 "SC"는 표적내에서 단지 하나의 결합 부위를 함유하는 시료들을 나타낸다.

[표 16]

시험관내에서 TALE13-단독이합체의 C 말단 절단들

상기 나타낸 데이타로부터 알 수 있는 바와 같이, C-말단이 대략 C+5 이후에 트렁케이트되는 경우 단백질들은 융합 뉴클레아제들로서 당해 검정에서 거의 활성이 되지 않는 것으로 여겨진다.

나타낸 스페이서를 지닌 표적과 함께 나타낸 경우 추가의 C-말단 절단 지점들을 지닌 TALE13 뉴클레아제들의 절단 활성을 또한 평가하고 결과들을 하기 표 17에 나타낸다. "S"는, 절단 표적이 TALE13에 대한 단일 결합 부위를 함유하였음을 나타낸다.

[표 17]

TALE 13 뉴클레아제 C-말단 절단들

TALE 단백질들의 C-말단 영역에서 이루어진 작업과 유사하게, N-말단에서 또한 결실들을 이루었다. 데이타는 도 14에 나타내며, N-말단이 결실된 단백질의 활성은, 절단들이 N+137 위치에 비교적 근접하여 도입되는 경우 감소됨이 명백하다. 당해 도에서, 각각의 컬럼은 상응하는 N-말단 절단 및 사용된 다수의 별개의 클론들로 표지한다. "S"는, 단지 단일의 결합 부위가 표적내에 존재하였음을 나타낸다. 이들 결과들의 합은, TALEN이 FokI 반 도메인들 또는 일본쇄 구조내에서 상호작용할 수 있는 2개의 반 도메인들에 연결되는 경우 매우 활성일 수 있지만, N-캡 및 C-캡의 길이는 수득되는 TALEN들의 DNA 절단 특성들에 있어 효과를 가짐을 나타낸다.

TALEN들을 제작하여 포유동물 세포내에서 내인성 표적에 결합시켰다. 10개의 반복체 NTF3 결합 도메인을 위에서 기술한 바와 같이 FokI half 도메인에 연결시켰다. 또한, NTF3 특이적인 파트너(rNTF3)를 표준 오버랩핑 올리고뉴클레오타이드 제작 기술을 사용하여 상업적으로 제작하였다. 합성 NTF3 파트너를 C 말단: C+63, C+39 및 C+28에서 3개의 변이체들을 사용하여 제조하고, TALE DNA 결합 도메인을 C-말단에 대한 에피토프 tag 및 핵 국재화 시그날 및 C-말단에 대한 야생형 FokI 절단 도메인이 첨부되는 표준 ZFN 벡터내로 클로닝하였다. 당해 실험들에서 사용된 제작물들의 완전한 아미노산 서열들은 실시예 23에 나타낸다.

9.5 반복체 NTF3-Fok1 융합체, 및 18 반복체 NTF3-특이적인 NT-L 단백질 외에, TALEN들을 또한 제조하여 VEGF A 유전자에 대해 특이적인 부위를 표적화하였다. 당해 융합체 단백질은 9.5 반복체 단위들을 함유하였으며 위에서 기술된 바와 같이 제작하였다. 18 반복체 NT-L 및 VEGF-특이적인 TALEN들을 또한 +28, +39 또는 +63의 C 말단 절단으로 제조하였다. 다음에, 이들 합성 융합체 뉴클레아제들을 시험관내에서 뉴클레아제 검정들에 상기와 같이 각종 조합들로 사용하였다. 기재 서열들은 각종 융합체들에 대한 표적 결합 부위들을 나타내는 대문자들로 하기 나타낸다:

NTF3-NTF3 기질(SEQ ID NO:77):

NT3-VEGF 기질(SEQ ID NO:78):

VEGF-NT3 기질(SEQ ID NO:79):

이들 연구들로부터의 결과들은 하기에서 표 18 및 표 19에 나타낸다.

[표 18]

사람 NTF3에 대해 특이적인 TALEN 쌍들

표 18은 각각의 TALEN 쌍의 중복 시험을 나타낸다. 예를 들면, 시료 1 및 16은 TALEN 단합체들의 동일한 조합이다.

[표 19]

NTF3/NTF3 또는 NTF3/VEGF의 조합들에 대해 표적화된 TALEN들

"NN"은 좌측(NT-L) 및 우측(NT-R) NTF3 TALEN들에 대한 결합을 갖는 내인성 NTF3 표적의 관련 부위를 말한다. #1 또는 #2는 동일한 제작물의 상이한 클론들을 말한다.

따라서, 이들 단백질들은 시험관내에서 뉴클레아제들로 활성이다.

이들 단백질들은 또한 상기 기술된 SSA 리포터 시스템을 사용하여 포유동물 세포내에서 엔도뉴클레아제 활성의 검정에서 사용되었다. 표적 기질(도 15a, 서열 번호 452에 나타냄)을 해체된 GFP 리포터 사이에 클로닝함으로써 절제에 의해 수반된 NTF3 부위의 절단이 발현가능한 전체 GFP 리포터를 생성하도록 하였다. 당해 기질은 NTF3 표적 서열 및 CCR5 유전자를 표적화하는데 특이적인 표적 서열을 둘 다 함유한다. 도 15b는 NTF3-특이적인 TALE 단백질들의 선택을 사용하는 당해 실험의 결과를 나타낸다. 당해 실험에서 다음의 NTF3-특이적인 TALEN 융합체들을 사용하였다. TALE13C28L2는 C+28 절단 및 L2 링커를 지닌 위에서 기술한 TALE13 유도체이다. rNT3R17C28L2은 C+28 절단 및 L2 링커를 가진 17.5 반복체 NT3-특이적인 단백질(NT3 유전자의 암호화 쇄와 관련하여 DNA의 역방향 쇄를 표적화한다)이다. rNT3R17C39L2는 C+39 C 말단을 갖는 유사한 제작물이며, rNT3R17C63L2는 C+63 C 말단을 갖는다. 당해 rNT3R17 DNA 결합 도메인은 또한 NT-R로 명명된다. 8267EL/8196zKK는 CCR5 특이적인 아연 핑커 뉴클레아제들의 쌍을 사용하는 대조군이다. "-NT3R18C28L8"로 표지된 데이타는 NTF3 특이적인 파트너(NTF3 유전자의 암호화 쇄와 관련하여 DNA의 전방 쇄를 표적화한다)의 부재에서의 결과들을 나타내는 한편, "HNT3 R18 C28L8"로서 표지된 데이타는 파트너의 존재하의 결과들을 나타낸다. 당해 경우에, 파트너는 C28 위치에서 트렁케이트되고 L8 링커를 함유하는, 17.5 반복체를 지닌 NTF3 특이적인 단백질이다. 도에서 알 수 있는 바와 같이, TALEN들의 정확한 쌍은 리포터 유전자의 효율적인 절단 및 이에 따른 리포터 유전자 발현을 초래한다.

실시예 8: 포유동물 세포내에서 내인성 유전자자리를 절단하기 위한 조작된 TALEN들의 용도

NTF3 유전자자리에 표적화된 위에서 기술된 이합체 쌍들(참조: 표 18)을 포유동물 세포내에서 내인성 유전자자리에서 시험하였다. 나타낸 바와 같은 이합체 쌍들을 아막사 바이오시스템스 장치(Amaxa Biosystems device)(제조원: Cologne, 독일 소재)를 사용하여 제조업자가 공급한 표준 방법들로 K562 세포들 내로 핵감염(nucleofect)시키고 형질감염 후 일시적인 냉 쇼크 성장 조건에 적용시켰다(참조: 미국 특허원 12/800,599).

세포들을 30℃에서 3일 동안 항온처리한 후, DNA를 분리하여 Cel-I 분석에 사용하였다. 당해 검정을 설계하여 야생형 서열과 비교하여 시료 속에서 미스매치를 검출한다. 당해 미스매치들은 비-동종 말단 결합(NHEJ)의 오류발생이 쉬운 공정에 의해 치유되는 TALEN에 의한 절단으로 인하여 DNA내 이본쇄 파괴의 결과이다. NHEJ는 흔히 작은 첨가들 또는 결실들을 도입하며 Cel-I 검정은 이들 변화들을 검출하기 위해 설계된다. 검정들은 예를 들면 미국 특허 공보 20080015164; 20080131962 및 20080159996에 기술된 바와 같이, 다음 프라이머들을 사용하여 증폭시킨 생성물들을 사용하여 수행하였다: LZNT3-F4: 5'-GAAGGGGTTAAGGCGCTGAG-3'(SEQ ID NO:80) 및 LZNT3-1077R: 5'-AGGGACGTCGACATGAAGAG-3'(SEQ ID NO:81). 이들 프라이머들을 내인성 서열로부터 272 bp 앰플리콘(amplicon)을 증폭시키며 Cel-I 검정에 의한 절단은 대략 226 및 46 bp의 생성물을 생산할 것이다. 226 bp 생성물들은 가시적이지만, 46 bp 생성물들은 이들의 크기로 인하여 겔 위에서 관찰하기가 어렵다. 당해 결과들은 도 16에 나타내며, 여기서 관찰된 게놈 변형 퍼센트는 Cel-I 효소를 포함하는 레인들에 나타낸다. 도면으로부터 명백한 바와 같이, 이들 시료 속에 존재하는 뉴클레아제-유도된 돌연변이들이 존재하며, 시료들은 중복하여 재생될 수 있다(예를 들면, 레인 7 및 22, 또는 레인 12 및 27을 비교함).

연구들을 15, 13, 12, 및 10 쌍들(참조: 표 18)로, 형질감염 후 37℃ 또는 30℃에서 항온처리한 세포들을 사용하여 반복하고 결과들을 도 17에 나타낸다. 우선, NT-R TALE DNA 결합 도메인을 앞에서 기술한 바와 같이 SELEX 검정에서 시험하고 결과들을 도 17a에 나타낸다. K562 세포들에서 발현시키는 경우, 이들 단백질들은 Cel-I 검정에 의해 나타난 것으로서, 37℃ 및 30℃에서 시험한 가장 활성인 이종이합체(쌍 12)에 대한 3% 및 9%의 추정된 수준들을 갖는 강력한 유전자 변형을 수득하였다(참조: 도 17b). 또한, 생거 서열분석(Sanger sequencing)은 30℃ 시료에서 분석한 84개 중 7개의 돌연변이된 대립형질들을 확인하였으며 또한 비-동종 말단 결합(NHEJ)을 통해 비-동종 말단 결합의 오류발생이 쉬운 파괴 복구와 일치하는 돌연변이 스펙트럼(약간의 결실들)을 나타내었다(도 17c).

이들 연구들은, 본원에 기술된 것으로서 TALEN 구조물이 내인성 유전자자리에서 및 포유동물 세포내에서 효율적인 NHEJ-매개된 유전자 변형을 구동시킬 수 있음을 나타낸다.

이들 연구들은 또한 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 뉴클레아제 도메인을 연결하는데 사용될 수 있는 조성물들을 나타낸다. 시료들을 또한 NTF3 유전자자리에서 정밀한 서열분석에 적용시켰다. 시료들을 4 bp 서열로 바코드화하고 50 bp의 판독 길이를 일루미나 게놈 분석기 장치(Illumina Genome Analyzer instrument)(제조원: Illumina, 캘리포니아 산 디에고 소재)에서 사용하였다. 서열들을 통상의 피톤 스크립트(python script)로 가공하였다. 서열들을 뉴클레아제 활성에 의해 유도된 이본쇄 파괴의 결과로서 비-상동성 말단 결합(NHEJ) 활성의 특징들로서 삽입 또는 결실들["InDels"]의 존재에 대해 분석하였다. 결과들은 도 18에 나타낸다. 내인성 유전자 자리에서, 이들 2개의 단백질들에 의해 인지된 표적 서열들 사이에 12개의 염기 쌍 gap이 존재한다(참조: 도 18a). 도 18b에 나타낸 바와 같이, 포유동물 세포내에서 내인성 NTF3 유전자자리에 대한 활성을 입증하는 다수의 InDels이 존재한다. 도 18b에서, 내인성 유전자자리에서 야생형 서열은 "wt"로 나타낸다.

실시예 9: TALEN 절단 이후의 내인성 유전자자리내로 표적화된 통합

NTF3에서 TALE-매개된 표적화된 통합은 HDR DNA 복구 경로를 통해 또는 NHEJ 경로를 통해 일어날 수 있었다. 본 발명자들은 NHEJ에서 작은 이본쇄 올리고뉴클레오타이드의 포획을 기본으로 한 NTF3에서 TALE-매개된 표적화된 통합을 검정하기 위한 실험을 설계하였다. 본 발명자들은 ZFN-유도된 DNA 이본쇄 파괴들(DSBs)의 부위에서 올리고뉴클레오타이드들의 포획을 이미 밝혔다. 이러한 유형의 표적화된 통합은 ZFN 쌍의 FokI 부위들에 의해 생성된 것들에 대해 상보성인 5' 오버행의 존재(그러나 절대적으로 필요하지는 않았다)에 의해 향상되었다. FokI는 천연적으로 4 bp 5' 오버행들을 생성하며; ZFN과 관련하여, FokI 뉴클레아제 도메인은 4 bp 또는 5 bp 5' 오버행들을 생성한다. NTF3 TALEN들에 의해 남아있는 오버행의 위치 및 조성은 알려져있지 않으므로, 본 발명자들은 NTF3 TALEN 결합 부위들(NT3-1F 내지 NT3-9R) 사이에서 12bp 스페이서 영역에서 모든 가능한 4bp 5' 오버행들을 가진 9개의 이본쇄 올리고뉴클레오타이드 공여체를 설계하였다(참조: 표 20).

[표 20]

표적화된 통합 검정에 사용된 PCR 프라이머들

주 - 프라이머 서열내 ^*는 2개의 5' 말단 포스포로티오에이트 연결들을 나타낸다. 모든 프라이머들은 5' 포스페이트들을 결여하고 있다.

이들 공여체들은 2개의 5' 말단 포스포로티오에이트 연결들을 함유하며 5' 포스페이트들, 및 프라이머 내부 F에 대한 결합 부위를 결여하고 있다. 상보성 올리고뉴클레오타이드들(예를 들면, NT3-1R을 지닌 NT3-1F)를 10 mM 트리스 pH 8.0, 1 mM EDTA, 50 mM NaCl 속에서 95℃로 가열하고 0.1°/min으로 실온까지 냉각시킴으로써 어닐링하였다. 공여체 올리고뉴클레오타이드들(5μL의 40μM 어닐링된 올리고뉴클레오타이드)을 20μL의 형질감염 혼합물 속에서 개별적으로 각각 8개의 상이한 TALEN 쌍들(A-H, 400 ng의 각각의 플라스미드 참조: 표 21)로 200,000 K562 세포들내에 프로그램 FF-120로 설정된 아막사 뉴클레오펙터(Amaxa Nucleofector)(제조원: Lonza) 및 용액 SF를 사용하여 형질감염시켰다.

[표 21]

NT3-특이적인 TALEN 쌍들

세포들을 형질감염 후 3일째에 수거하고 50μL의 퀵익스트랙트(QuickExtract) 용액(제조원: Epicentre) 속에서 분해하였다. 1 마이크로리터의 조 분해물을 하기 기술한 바와 같이 PCR 분석에 사용하였다.

본 발명자들은 내부 F 및 GJC 273R 프라이머들을 사용하여 올리고뉴클레오타이드 및 염색체에 의해 생성된 연결부의 PCR 증폭에 의해 NTF3 TALEN으로 생성된 DSB내로 올리고뉴클레오타이드 공여체의 표적화된 통합을 검정하였다. 올리고뉴클레오타이드 공여체의 완전한 연결을 기본으로 한 PCR 증폭의 예측된 크기는 염색체에서 파괴 위치에 따라 변한다. 도 19에서 알 수 있는 바와 같이, 공여체의 통합은 TALEN과 공여체 오버행들의 많은 조합들을 사용하여 검출하였다. 최대 시그날이 12bp 스페이서 영역의 중심 근처에서 CTGG 및 TGGT 오버행들을 사용하여 관측되었다. NHEJ에 의해 포획된 공여체들을 함유하는 내인성 염색체 유전자위치들을 서열분석하여 도 20에 나타내었다. NTF3 표적 유전자자리(상부 이중쇄) 및 당해 연구에 사용된 올리고뉴클레오타이드 이중쇄들 중 하나(하부 이중쇄)를 나타내고 NT-L+28 및 NT-R+63에 대한 결합 부위들은 상부 서열에서 밑줄쳐져 있다. 이중쇄(5' CTGG)를 가장 효율적으로 포획할 절단 오버행이 또한 강조되어 있다. 또한 본 연구에 사용된 제2의 올리고뉴클레오타이드 이중쇄가 도 20b에 나타나 있다. NT-L+28 및 NT-R+63에 대한 결합 부위들은 상부 서열에 밑줄쳐져 있다. 당해 이중쇄(5' TGGT)를 가장 효율적으로 포획할 절단 오버행을 또한 나타낸다. 이후에, TALEN들, NT-L+28 및 NT-R+63을 K562 세포내에서 도 20a에 나타낸 올리고뉴클레오타이드 이중쇄의 존재하에 발현시켰다. 이후에, 성공적으로 통합된 이중쇄와 게놈성 DNA 사이의 연결부들을, 이중쇄내에서 어닐링하는 하나의 프라이머 및 천연의 NTF3 유전자 위치로 어닐링하는 하나의 프라이머를 사용하여 증폭시켰다. 수득되는 암플리콘들을 클로닝하고 서열분석하였다. 도 20c에서 "예측된" 서열은 절단된 유전자 위치에 대한 올리고뉴클레오타이드 이중쇄의 완전한 연결로부터 생성될 수 있는 서열을 나타낸다. 박스는 연결부 서열들에서 이중쇄 오버행의 위치를 강조한다. 하부 2개의 라인들은 본 연구로부터 수득된 연결부 서열들을 제공한다. 나타낸 바와 같이, 11개의 연결부 서열들은 절단 오버행에 대한 이중쇄의 완전한 연결로부터 생성되는 반면, 하나의 연결부 서열은 NHEJ에 의한 복구 전에 절제와 일치하는 짧은 결실(12 bp)을 나타내었다. 도 20d는, 도 20a에 나타낸 이중쇄와 관련하여 하나의 염기에 의해 이동된 4bp 오버행을 갖는, 도 20b에 나타낸, 올리고뉴클레오타이드 이중쇄를 사용하는 것을 제외하고는 도 20c에 나타낸 바와 같은 실험들로부터의 결과들을 나타낸다. 최저 4개의 라인들이 당해 연구로부터 수득된 연결부 서열들을 제공한다. 나타낸 바와 같이, 4개의 명백한 서열들이 확인되었으며, 이는 각각 NHEJ-매개된 복구 전에 절제와 일치하는 짧은 결실들을 나타낸다.

실시예 10: 신규의 TALE 단백질들을 암호화하는 유전자들의 효율적인 조립

천연 단백질들에서 발견된 TALE 반복체들을 암호화하는 DNA 서열은 이들의 상응하는 아미노산 서열과 같이 반복적이다. 천연의 TALE은 각각의 반복체의 서열들 사이에 차이인 단지 소수의 염기쌍의 가치를 갖는다. 반복적인 DNA 서열은 목적하는 완전한 길이의 DNA 앰플리콘을 효율적으로 증폭시키는 것을 어렵게 할 수 있다. 이는, 천연 TALE-함유 단백질들에 대한 DNA를 증폭시키기 위해 시도하는 경우 밝혀졌다. Mfold[참조: M. Zuker Nucleic Acids Res. 31(13):3406-15, (2003)]를 사용한 상기 TALE-반복체 단백질의 DNA 서열의 추가의 분석은, 이들이 효율적인 증폭을 파괴하는 반복적인 서열을 가질 뿐 아니라, 매우 안정한 제2 구조를 함유함을 나타내었다. 당해 분석에서, 서열의 800개 염기쌍들을 제1의 완전한 반복체 서열을 암호화하는 핵산의 5' 말단에서 개시하여 분석하였다. 따라서, 분석된 핵산 서열은 대략 7.5 반복체 서열들을 함유하였다. 수개의 이들 2차 구조들을 도 21에 나타낸다.

이들 구조들은 TALE 반복체들 또는 인접하지 않은 반복체들 중 어느 것의 사이에서 발생할 수 있다. TALE 반복체들을 함유하는 DNA 서열들의 효율적인 증폭을 제공하기 위해, 당해 2차 구조 및 편향(bias)을 파괴하기 위한 사일런트 돌연변이들의 도입을 2차 구조를 안정화시키기 위해 제공된 TALE 반복체들의 영역내에서 이루었다. 이후에, 프라이머들이 목적한 TALE 서열의 효율적인 증폭을 허용하도록 하였다. 이후에, PCR 증폭 생성물을 변이에 대해 서열분석하고 융합 단백질들에서 사용하기 위해 클로닝하였다. 또한, 사일런트 돌연변이들을 포유동물 세포들내에서 코돈 최적화를 위해 TALE 뉴클레오타이드 서열내에서 이루었다. 유사한 코돈 최적화를 다른 숙주 세포 시스템들(예를 들면, 식물, 진균 등)내에서 최적 발현을 위해 사용하였다.

실시예 11: TALE 융합 단백질들을 암호화하는 유전자들의 신속한 제작 방법

각종의 TALE 융합 단백질들의 신속한 조립을 허용하기 위하여, 거의 어떠한 선택된 표적 DNA 서열에 대해 특이적인 TALE DNA 결합 도메인을 생성하기 위해 함께 연결될 수 있는 반복체 모듈들의 보관소(archive)를 생성하기 위한 방법을 개발하였다. 목적하는 표적 DNA 서열을 기본으로 하여, 하나 이상의 모듈들을 집어올려서 PCR계 시도를 통해 검색하였다. 모듈들을 무작위적으로 연결시키고 선택한 융합체 파트너 도메인을 하유하는 벡터 골격내로 연결시켰다.

4개의 TALE 반복체 단위들을 함유하는 모듈들을 256개의 가능한 DNA 테트라뉴클레오타이드(예를 들면, AAAA 표적에 대한 1개의 모듈, AAAT에 대한 1개 등) 각각에 대한 특이성을 사용하여 제작하였다. 또한, 모듈들을 또한 모든 64개의 가능한 DNA 트리뉴클레오타이드 표적물들, 모든 가능한 64개의 디뉴클레오타이드 DNA 표적물들 및 또한 4개의 단일 뉴클레오타이드 표적물들에 대해 생성시켰다. 디펩타이드 인지 영역(또한 RVD-반복체 가변 디펩타이드로 언급됨)의 경우, 다음의 코드를 사용하였다: 아데닌의 인지의 경우, RVD는 NI(아스파라긴-아스파르테이트)이었고, 사이토신의 경우, RVD는 HD(히스티딘-아스파르테이트)이었으며, 티민의 경우, RVD는 NG(아스파라긴-글리신)이었고, R(구아닌 또는 아데닌에 대한 비교가능한 특이성)의 경우, RVD는 NN(아스파라긴-아스파라긴)이었다. 또한, 일부 조작된 TALE에서, RVD NK(아스파라긴-라이신)는 일부 단백질들에서 NN보다 G에 대해 보다 높은 특이성을 제공하는 것으로 여겨지므로 G의 인지를 위해 선택하였다. 또한, RVD의 끝에서 두번째 위치 N-말단(반복체 단위의 11번 위치)는 N 또는 아스파라긴(전형적으로 당해 위치는 S 또는 세린이다)이었다. 당해 모듈 보관소는 다른 어떠한 RVDs를 사용함에 의해 확장시킬 수 있다.

PCR 특이성, 완전한 서열 반복체들을 지닌 DNA의 클로닝 및 조작은 문제가 있다. 따라서, 저장소를 제작하기 위하여, 많은 천연의 TALE 반복체 서열들을 분석하여, 아미노산 서열내 가변성이 DNA 수준에서 반복체 서열들을 다양화시키기 위한 시도에서 견딜 수 있는 경우를 살폈다. 결과들은 도 22에 나타내며, 여기서 문자 크기는 제공된 위치에서 관찰된 다양성과 역으로 관련되어 있는데: 문자들이 클수록 다양성의 내성이 거의 없음을 나타내는 반면 문자들이 작을수록 다른 아미노산들이 때때로 관찰되는 위치들을 나타낸다. 예를 들면, 1번 위치에서, 반복체 단위의 제1 아미노산인, L 또는 루이신은 필수적으로 불변적으로 관측된다. 그러나, 4번 위치에서, 3개의 상이한 아미노산들이 때때로 발견된다: E 또는 글루타메이트, A 또는 알라닌, 또는 D 또는 아스파르테이트. 또한, 다양한 반복체 모듈들을 암호화하는 뉴클레오타이드 서열을 또한 변경시켜 유전 코드에서의 중복성을 이용함으로써 특이적인 아미노산들을 암호화하는 코돈들이 상호교환되어 반복체 단위를 암호화하는 DNA 쇄가 다른 반복체 단위로부터 상이한 서열을 가지도록 할 수 있지만, 아미노산 서열은 동일하게 남아있을 것이다. 이들 기술들 모두는, DNA 결합 도메인의 내부가 어떠한 목적하는 표적도 인지할 수 있는 조작된 TALE DNA 결합 도메인들을 제작하는데 사용될 수 있는 모듈들을 모으는데 이용하였다.

설계자가 모듈들의 위치를 규정하도록 하기 위하여, 제II형 S 제한 효소, BsaI을 사용하였으며, 당해 효소는 이의 DNA 표적 부위의 3' 말단으로 절단한다. BsaI는 하기 나타낸 서열을 인지한다. 또한, 효소적 절단 후 남은 절단된 DNA의 "점착성 말단들(sticky ends)(SEQ ID NOs:102-105)"을 나타낸다:

인지 부위 -> 절단 후

당해 분야의 기술자에 의해 인지될 바와 같이, 점착성 말단들의 서열은 제한 인지 부위의 바로 3'의 DNA 서열에 의존하므로, 이들 점착성 말단들의 다른 것에 대한 연결은, 정확한 서열들이 존재하는 경우에만 발생할 것이다. 이는, PCR 앰플리콘들이 BsaI으로 절단되면 공지된 점착성 말단들을 가질 수 있는 목적하는 모듈들을 증폭시키기 위해 PCR 프라이머들을 개발하는데 이용되었다. 이후에, PCR 생성물들을 BsaI 절단 이후에 결합시켜 사용자가 명시한 순서만으로 생성물들이 함께 연결되도록 한다. 1 내지 16개의 완전한 TALE 반복체들로 구성된 4개 이하의 모듈들을 연결시키는 조립 도해가 도 23에 도시되어 있다. 사용된 프라이머들은 다음과 같으며, 여기서 번호매김은 도에 나타낸 것에 상응한다. 나열된 프라이머들이 동일한 개념을 사용함으로써, 4개 이하의 모듈을 연결시키는데 사용되는 것으로 의도되지만, 보다 많은 프라이머들이 4개 이상의 모듈들을 연결시키기 위해 가해질 수 있다.

프라이머들:

당해 방법을 사용하는 경우, BsaI 절단된 PCR 암플리콘들의 연결은, "A" 모듈의 3' 말단이 "B" 모듈의 5' 말단에 연결되고, "B" 모듈의 3' 말단이 "C" 모둘의 5' 말단에만 연결될 수 있는 경우 등에만 발생할 수 있다. 또한, 연결된 모듈들이 클로닝된 벡터 골격은 또한 특이적인 BsaI 절단된 점착성 말단들을 함유함으로써, "A" 모듈의 5' 말단, 및 "D" 모듈의 3' 말단 만이 연결되어 벡터 원형을 완료할 것이다. 따라서, 조작된 TALE DNA 결합 도메인내 각각의 모듈의 위치는 사용자가 선택한 PCR 프라이머들에 의해 측정된다.

현재, TALE DNA 결합 도메인들에 대한 DNA 표적 부위들은 전형적으로 표적(이는 R0 반복체에 의해 인식된다)의 5' 말단에서 및 표적(이는 R1/2 반복체에 의해 인식된다)의 3' 말단에서 T 뉴클레오타이드들에 의해 플랭킹된다. 따라서, 벡터 골격은, 규정된 모듈들을 함유하는 연결된 PCR 암플리콘들이 벡터내 R0와 R1/2 서열들 사이에 골격내로(in frame) 클로닝되도록 설계되어졌다. 또한, 벡터는, 사용자가 규정한 TALE 단백질의 C-말단 도메인 유형(트렁케이트되어 있거나 되어 있지 않은) 및 융합체 파트너에 대해 선택한 외인성 도메인을 함유한다. 도 23에 도시된 설계에서, 외인성 도메인은 TALE 뉴클레아제의 생산을 허용하는 FokI 도메인이다. 벡터는 또한 CMV 프로모터, 핵 국재화 시그날, 발현을 모니터링하기 위한 tag, 및 폴리 A 부위와 같은 융합 단백질의 발현에 필수적인 서열들을 함유한다. 당해 벡터는, 이제 사용자가 선택한 세포내로 형질감염시킬 수 있다. 또한, 벡터는 추가로 변형되어 상이한 세포 시스템들에 대해 바람직하고/하거나 요구되는 것으로서 선택 마커들, 도메인들 또는 다른 유전자들을 함유할 수 있다.

실시예 12: 특이적인 외인성 TALEN들의 설계 및 특성화

TALEN 설계 방법을 평가하기 위해, 본 발명자들은 사람 CCR5 유전자내에서 델타 32 돌연변이(하기에 굵게 밑줄쳐서 나타냄)의 위치 근처의 TALEN 매개된 유전자 변형을 입증하고자 하였다[참조: Stephens JC et al, (1998) Am J Hum Gen 62(6): 1507-15]. 당해 연구를 위해, 본 발명자들은 16개의 이합체 표적들(SEQ ID NO:114 내지 122)의 패널을 정의한, 델타 32의 위치(하기 참조)에서 4개의 "좌측" 및 4개의 "우측" 결합 부위들의 집단을 지정하였다.

당해 패널내에서, 개개의 표적들은 광범위한 gap 크기-5 내지 27bp에 의해 분리된다. TALEN 단백질들은 실시예 11에 기술된 방법들을 사용하여 조립함으로써, 기술된 모든 단백질들 내에서(구체적으로 나타내지 않음), 'T'를 규정하는 RVD가 NG이고, 'A'의 경우 NI이며, 'C'의 경우 HD이고 'G'의 경우 NN이도록 하였다. 다음에, 2개의 대안 단백질들은 48 또는 83개 잔기들의 C-말단 분절을 지닌, 각각의 표적에 대해 생성시켰다. 최종적으로, "좌측" 및 "우측" 단백질들의 모든 쌍방식(pairwise) 조합들(8x8 = 총 64개)을 K562 세포들내에서 발현시키고 내인성 유전자자리의 변형에 대해 분석하였다. 하기 표 22를 참조한다(3일째 및 10일째):

[표 22]

CCR5 △32-특이적인 TALEN 절단들에 대한 활성의 쌍방식 조합들

3일째 변형 수준들

10일째 변형 수준들

표적 부위들은 다양한 gap 크기들을 함유하였으므로, 최대 활성인 뉴클레아제들에 관한 데이타를 또한 2개의 표적 부위들 사이의 거리와 관련하여 분석할 수 있다. 표 23에서 하기 나타낸 것은 표적 부위들에 대한 gap 크기들을 나타내는 것을 제외하고는, 표 22에서 상기 것들과 유사한 패널이다.

[표 23]

쌍방식 조합들에 대한 gap 크기들

*는 Cel I 검정의 의해 평가한 것으로서 <1% 유전자 정정 활성이 존재하였던 쌍들을 나타낸다(표 22의 +63/+63과 비교)

따라서, 표 22 및 표 23으로부터의 데이타는, 이들 쌍들이 최대 활성인 gap 크기들의 범위가 12 내지 21 bp를 포함하지만 11bp 미만 또는 23bp 초과의 gap을 배제하는 것을 측정하기 위해 비교할 수 있다.

본 발명자들의 TALEN 구조물이 다른 주요 세포 DNA 복구 경로를 통해 유전자 수정을 유도할 수 있는지를 입증하기 위하여: 상동성 지시된 복구(HDR), 삽입유전자 통합을 위한 강력하게 안전한-부위(safe-harbor)로서 선행 연구들에서 촉망되는 것으로 밝혀진 CCR5(유전자자리 162로 명명됨)내 제2의 유전자자리[참조: Lombardo et al (2007) Nat Biotechnol 25: 1298-1306]를 표적화하였다. 4개의 "좌측" 및 4개의 "우측"의 바른 결합 부위들을 지정하고(하기 참조, 서열 번호 123 내지 131), 2개의 대안적인 TALEN들을 각각(+28 및 +63 변이체들)에 대해 제작하고, +28/+28 및 +63/+63 쌍들을 Cel-I 검정(SEQ ID NO:370 내지 379)을 사용하여 NHEJ-매개된 유전자 변형에 대해 스크리닝하였다.

표 24에서 하기 나타낸 바와 같이, 시험한 24개의 쌍들 중의, 16개는 21% 이하의 수준에서 검출가능한 변형을 수득하였다.

[표 24]

CCR5의 162번 유전자자리에 대해 표적화된 TALEN 쌍들의 쌍방식 조합들의 활성

다음에, 2개의 가장 활성인 쌍들(L172+28/R185+28 및 L161+63/R177+63)을 K562 세포들내로 BglII 제한 부위를 지닌 46bp 삽입체를 표적화된 유전자자리로 이전시키도록 설계한 공여체 DNA 단편을 사용하여 도입하였다. 사용된 공여체 서열은 실시예 23에 나타낸다.

삽입 후에, 혼입된 tag 공여체 서열은 밑줄쳐져 있는 유일한 BglI 제한 부위를 갖는 다음 서열과 같았다:

.

공여체 삽입이 HDR을 통해 발생한 경우, 하기 나타낸 바와 같이, 삽입체 부위를 함유하는 영역을 PCR 증폭시킨 후 BglI 분해에 적용시킬 수 있으며, 여기서 상부 쇄는 표적 부위의 서열(SEQ ID NO:133)을 나타내고 하부 쇄(SEQ ID NO:134)는, 표적의 서열이 삽입된 tag 공여체를 가졌음을 나타낸다. 상부 쇄에서 밑줄친 서열은 TALEN 결합 부위를 나타내는 반면, 하부 쇄의 밑줄친 서열은 BglI 제한 부위(SEQ ID NO:445 내지 450)를 나타낸다:

도 24에 나타낸 바와 같이, 하나의 삽입체를 함유하는 클론들의 PCR 생성물들은 BglI 분해 후 2개의 단편들을 가졌다. PCR 및 BglI 분해 도해는 도 24a에 나타낸 반면, 결과들은 도 24b에 나타내며, 고도로 효율적인 수정을 나타내었다. 따라서, 본 발명자들의 TALEN 구조물은 내인성 유전자자리에서 HDR을 통해 효율적인 유전자 변형을 유도하였다.

실시예 13: 선택된 TALEN 구조물들에 대한 gap 공간 선호도의 실험

2개의 바람직한 TALEN 구조물들(C+28 C-캡 또는 C+63 C-캡 쌍들)의 gap 공간 선호도를 시험하기 위해, C+28/C+28 또는 C+63/C+63의 쌍들을 함유하는 모든 TALEN 쌍들을 gap 공간에 따라 활성에 대해 분류하였다. 결과들은 도 25에 나타내며, 보다 작은 TALEN 단백질들, C+28/C+28 쌍이 보다 구속된 gap 공간 선호도를 가지며 표적 서열이 12개 또는 13개 염기쌍들의 gap들에 의해 분리된 경우 표적들에서가장 활성임을 입증한다. 역으로, 도 25b에 나타낸, 보다 큰 TALEN 단백질들, C+63/C+63 쌍들은 12 내지 23 염기 쌍들 범위의 gap 공간을 함유하는 표적들에서 활성이다.

실시예 14: 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 뉴클레아제 도메인을 연결시키는데 사용될 수 있는 조성물들의 전신계적 맵핑

조성물들의 전신계적 맵핑은, 뉴클레아제 도메인을 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 연결시키는데 사용될 수 있다. 초기에, 하나의 TALEN 쌍을 2개의 결합 도메인들 사이의 정의된 gap 공간을 지닌 단일의 표적에 대해 선택하였다. 선택된 TALEN 쌍은 CCR5 유전자에 대해 특이적이고 18개 염기쌍 gap 공간을 가졌던 L538/R557 쌍으로서 실시예 12에 기술된 것이었다. 결실은 상술한 바와 같이 이루어서 일련의 절단이 C-2 내지 C+278에서 C-캡들을 생성하도록 하였다.

이후에, 이들 절단들을 사용하여 Cel-I 미스매치 검정을 사용하여 K562 세포들에서 뉴클레아제 활성을 분석하였다. 결과들(%NHEJ)은 하기 표 25 및 도 26에 나타낸다.

[표 25]

C-말단 절단들의 양호한 맵핑을 위한 뉴클레아제 활성

데이타는, 당해 내인성 표적에 대한 당해 뉴클레아제 쌍에 대한 최대 활성이, C-캡이 대략 C+63인 경우, 다시 말해서, 펩타이드 LTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVA (SEQ ID NO:451)가 완전한 길이의 TALE 반복체들의 배열을 FokI 절단 도메인에 연결시키는데 사용된 경우에 발생함을 입증한다. 당해 실험에서, 뉴클레아제를 앞서와 같이 K652 세포들에서 시험하고 세포들을 30℃ 또는 37℃에서 항온처리하였다. C+278과 비교하여 C+63 C-캡의 활성 비의 대략적인 평가는 37℃ 항온처리시 20배 더 컸으며 30℃ 항온처리의 경우보다 6배 더 컸다.

뉴클레아제 도메인을 내인성 유전자자리에서 고도의 활성인 뉴클레아제 기능이 가능하도록 하는 완전한 길이의 TALE 반복체들의 배열에 연결시키는데 사용될 수 있는 조성물들을 보다 미세하게 특성화하기 위해, 추가의 절단들을 제작하였다. 양호한 일련의 절단들을 다음과 같은 30C-캡들을 포함하도록 조립하였다: C-41, C-35, C-28, C-21, C-16, C-8, C-2, C-1, C+5, C+11, C+17, C+22, C+28, C+34, C+39, C+47, C+55, C+63, C+72, C+79, C+87, C+95, C+109, C+123, C+138, C+153, C+183, C+213, C+231, 및 C+278. 본 발명자들의 C-캡 주목은 -20번 잔기에서 개시함에 주목한다. 따라서, C-41, C-35, C-28, 및 C-21은 C-캡을 완전히 결여하고 마지막 완전한 34-잔기 TALE 반복체의 C-말단으로부터 제거된 20, 14, 7, 또는 0개 잔기들을 지닌 제작물을 나타낸다. 제작물들의 쌍들을 표적 부위들: 0, 2, 4, 7, 10, 14, 18, 23, 28, 및 34개 염기 쌍들 사이에 다음의 gap 공간들을 지닌 적절한 표적 부위들에 대해 시험하였다. 쌍들을 SSA 검정에서 및 또한 내인성 유전자위치에 대한 포유동물 세포내에서 리포터 유전자에 대해 시험하였다. C-캡들을 하기에 설명하며, 여기서 설명은 TALE DNA 결합 도메인의 마지막 완전한 반복체에서 개시하며 C 말단을 향한 지점들을 나타낸다.

C-캡들

실험에 대한 표적 부위들을 하기에 나타내며, 7 bp gap 공간을 지닌 쌍을 나타낸다. -C-16, C-21, C-28, C-35, 및 C-41 C-캡 제작물들은 쌍에서 각각의 TALEN 에 대한 반 반복체내 RVD를 제거하며 이러한 제작물들은 동일한 표적 DNA 서열에 대해 9 bp gap 공간을 효율적으로 갖는다. 시험한 모든 다른 gap 공간들에 대한 표적 부위들은 표적들 사이에 염기 쌍들을 제거하거나 시험할 gap 공간에 따라 추가의 염기 쌍들을 삽입함으로써 제작하였다.

TALEN 단백질들을 암호화하는 유전자들을 실시예 11 및 12에 기술된 바와 같이 조립하고 Cel-1 검정들로 평가하였다. 데이타는 하기 표 26a에 나타낸다. 나타낸 바와 같이, 본원에 기술된 TALE-단백질들은 반 반복체로 연장되는 절단들 및 내인성 유전자자리에 대해 기능성을 완전히 상실하지 않고 TALE 반복체 도메인 자체를 포함하는, 완전한 길이의 TALE-단백질들에 대해 C-말단 절단들을 견딜 수 있다.

[표 26a]

포유동물 세포들에서 TALEN 활성에 대한 C-캡의 효과

주: 숫자들은 Cel-I 검정으로 측정한 NHEJ 활성 퍼센트이다.

또한, C-말단 절단들든 하기 실시예 19에 기술된 바와 같이 DLSSA 검정에서 리포터 유전자에 대해 시험하였다. 당해 실험들에서, CCR5-특이적인 TALEN들의 4개 쌍들을 리포터 시스템에서 사용하였으며, 여기서 이들 쌍들의 표적 부위는 DLSSA 리포터 플라스미드들내로 제작하였다. 4개의 TALEN들의 결합 부위들은 위에 나타내며, TALEN들은 4개 쌍들, L543+R551 (쌍 1), L538+R551 (쌍 2), L543+R557 (쌍 3) 및 L538+R557 (쌍 4)로 사용하였다. Gap 공간들은 쌍들에 대한 결합 부위들 사이에 뉴클레오타이드들의 삽입 또는 결실에 의해 변화시켰다. 데이타는 하기 표 26 b 내지 e에 나타내며, 여기서 수치는 DLSSA 검정에 의해 검출된 상대적인 형광성 및 이에 따른 절단의 정도를 나타낸다. 모든 시료들을 이의 결합 부위가 또한 DLSSA 삽입체(양성 대조군)에 존재하는 대조군 TALEN 쌍에 대해 표준화하였다. 음성 대조군은 TALEN들의 부재하에서 수행된 검정이다. 리포터 #4는 내인성 서열로서 동일한 gap 서열들 및 정확한 DNA 결합 서열을 가지므로 내인성 유전자자리에서 Cel-I 데이타와 비교될 수 있다. 리포터 #4로부터 4개의 TALEN 쌍들의 DLSSA 데이타는 표 26a에 나타낸다. 이들 데이타는 리포터 시스템을 사용하여 발견된 결과들과 내인성 표적에서 관찰된 것들 사이의 일반적인 관련성을 설명하며, 이에 따라 리포터 시스템이 어떠한 내인성 검정에서 시험하기 위한 후보물 뉴클레아제들에 대한 스크리닝 도구로서 유용하다. 이는 정밀한 모델 세포들을 사용하는 시스템들에서 작업하는 경우 또는 의도된 표적 세포 유형이 이용불가능하거나 스크리닝 목적으로 사용되기 어려운 경우에 유용한 도구이다. 이는 또한, 표적 서열들이 내인성 게놈에서 이용불가능한 경우 TALEN 기술 플랫폼을 개발하여 최적화하는데 유용한 도구이다. 활성 뉴클레아제들은 DLSSA로 확인한 후 최종 평가를 위해 내인성 시스템내로 복사(port)할 수 있다.

[표 26b]

L543-R551 TALEN 쌍을 사용한 DLSSA 검정

[표 26c]

L538-R551 TALEN 쌍을 사용한 DLSSA 검정

[표 26d]

L543-R557 TALEN 쌍을 사용한 DLSSA 검정

[표 26e]

L538-R557 TALEN 쌍을 사용한 DLSSA 검정

따라서, Cel-I 및 DLSSA 결과들은, 적절한 C-캡이 사용되고 N-캡이 존재하는 경우 이들 단백질들이 실질적이고 강력한 활성을 가짐을 나타낸다. 또한, gap 공간들은 보다 큰 gap 공간들과 비교하여 C-말단 절단들의 보다 작은 소세트를 사용하여 활성인 보다 작은 gap 공간들을 사용하여 관찰된 최대 활성에서 역활을 담당할 수 있다. 또한, 본 발명자들은, 상대적인 DLSSA 활성이 동일한 온도(37℃)에서 수득된 동일한 TALEN들에 대한 내인성 활성과 선형으로 관련되어 있는 것으로 여겨지지 않는다. 리포터 결과들은 사람 세포들의 천연의 내인성 유전자자리에서 관찰된 것보다 C+153, C+183, C+213, C+231, 및 C+278 C-캡들을 지닌 제작물들에 대해 유의적으로 보다 높은 상대적인 활성을 수득한다. 따라서, 리포터 시스템들, 심지어 포유동물 세포들에서 리포터 시스템들에 있어서 활성은 포유동물 세포들에서 천연적으로 내인성인 활성을 필수적으로 예측하지 않는다.

실시예 15: 신규(비정형의) RVD들

대안적인(비정형의) RVD들을 이용하여 DNA 결합 특이성을 측정하는 위치들에서 다른 아미노산들이 변경될 수 있었는지를 측정하였다. 결합 활성이 SELEX 및 ELISA에 의해 중간 위치에서 미스매치에 대해 민감성인 것으로 밝혀진 TALE 결합 도메인을 제작하였다. 당해 단백질은 서열 5'-TTGACAATCCT-3'(SEQ ID NO:178)에 결합하였으며 서열들 5'-TTGACCATCCT-3'(SEQ ID NO:179), 5'-TTGACGATCCT-3'(SEQ ID NO:180), 또는 5'-TTGACTATCCT-3'(SEQ ID NO:181)에 대해 결합 활성을 거의 나타내지 않았다(도 27에 나타낸 ELISA 데이타). 이들 표적들은 중간 3중 핵산을 나타내는 CXA 표적들로 언급되며, 여기서 X는 A, C, T 또는 G이다.

이후에, 당해 TALE 골격을 사용하여 6번 위치에서 염기를 표적화하는 TALE 반복체에 대한 대안적인 RVD들(아미노산들 12 및 13)의 DNA-결합 특이성을 특성화하였다. 당해 RVD를 암호화하는 2개의 코돈들을 무작위처리하고 클론들을 서열분석에 의해 스크리닝하여 완전한 반복체 단위들이 존재함을 보증하였다. 이후에, 정확한 클론들은 표적 서열의 4개의 버젼들에 대해 DNA-결합 ELISA로 분석하였으며, 여기서 각각의 서열은 신규한(즉, 비정형의) RVD가 (즉 TTGACAATCCT (SEQ ID NO:178), TTGACCATCCT (SEQ ID NO:182), TTGACTATCCT (SEQ ID NO:183) 또는 TTGACGATCCT (SEQ ID NO:184))와 상호작용할 수 있는 위치에서 A, C, T 또는 G를 가졌다. 이들 연구들로부터의 결과들은 표 27a에서 하기 나타내며 당해 검정이, RVD VG가 T와 특이적으로 상호작용할 수 있으며, RG가 T와 상호작용할 수 있고, TA가 T와 상호작용할 수 있으며 AA가 A, C 및 T와 상호작용할 수 있음을 확인함였음을 입증한다.

[표 27a]

예시적인 신규한 RVD들

이들 초기 연구들에 이어서, 분석을 모든 강력한 RVD 조합들을 사용하여 수행하고 고 활성 및 특이성을 사용하여 수개를 확인하였다. 또한, 시험한 모든 염기들에 동등하게 잘 결합한 RVD들을 확인하였다. 이들 데이타는 하기 표 27b 및 또한 도28에 수치 양식으로 제공한다. 하기 나타낸 데이타에서, 모든 데이타는 배경 ELISA 시그날을 감하여 교정한 후 CAA 부위를 지닌 NI, CCA 부위를 지닌 HD, CGA 부위를 지닌 NN, 및 CTA 부위를 지닌 NG의 평균 값에 대해 표준화하였다.

[표 27b]

신규한 RVD 들

당해 데이타는 또한 도 28에 제공하며, 여기서 데이타는 20x20 격자로 나타낸다. RVD의 제1 아미노산(12번 위치)는 격자의 좌측에 나타내고 RVD의 제2 아미노산(13번 위치)은 격자 상단에 나타낸다. 각각의 격자내에서 문자들 A, C, G, 및 T의 크기는 CAA 부위, CCA 부위, 및 CGA 부위 및 CTA 부위 각각에 대한 표준화된 ELISA 시그날의 제곱근을 기본으로 하여 등급화하였다. 박스처리된 RVD들은 크산토모나스에 의해 암호화된 TALE 단백질들에서 발견된 흔히 발생하는 천연의 RVD들을 나타낸다. 많은 RVD들이 천연적으로 존재하는 HD, NI, NG, NS, NN, IG, HG, 및 NK RVD들과 관련하여 개선된 DNA 결합 특성들을 가진다. 예시적인 신규 RVD들 및 이들의 인지체 뉴클레오타이드 염기들이 포함되며, 여기서 N은 모든 염기들과의 양성 상호작용을 나타낸다:

연구들은 공지된 RVD들의 분석을 통해 후보물인 신규 결합제들인 것으로 가설화된 특수 서열들에 대한 RVD 서열들을 적절히 변경시키기 위해 수행되었다. 따라서, 다음의 RVD들이 시험되었다:

RVD 의도된 표적

올리고뉴클레오타이드들을 제조하여 상술한 TALE 제작물의 특이적인 변경을 허용하였다. 이후에, 이들 특이적인 올리고뉴클레오타이드들을 발현 벡터들내로 클로닝시키고 실시예 11에 기술된 바와 같이 조립하며, 수득되는 단백질 추출물들은 DNA-결합 ELISA 및 SELEX로 분석함으로써 RVD들의 결합 특성들을 측정하였다.

비정형 RVD들을 포함하는 12개의 이들 TALE DNA 결합 도메인들을 위에서 기술한 바와 같은 SELEX 분석에 적용시켰다. SELEX 분석으로부터의 결과들은 하기 표 28에 나타낸다. 표에서, 천연의 RVD에 대해 나타낸 데이타('RVD' 컬럼에서 굵은 글씨)는 예시적인 신규 RVD와 함께 나타내며 많은 경우들에서, 신규 RVD가 천연의 RVD와 비교하여 표적화된 염기들에 대해 동일하거나 보다 우수한 선호도를 입증함을 나타낸다.

[표 28]

신규 RVD들로부터의 SELEX 결과들

이후에, 이들 RVD들을 완전한 길이의 TALEN과 관련하여 활성에 대해 시험하였다. CCR5-특이적인 18 반복체 TALEN을 모든 신규한 RVD들을 사용하여 실시예 12에 기술된 CCR5-특이적인 TALEN과의 비교를 위해 생산하였다. 당해 TALEN 쌍에 대한 표적 부위들을 하기에 다시 나타낸다. 101041 TALEN 단량체는 변형된 파트너였던 반면 101047 파트너는 모두 천연 RVD들과 함께 남았다:

또한 전형적인 및 신규한(비정형) RVD들 둘다를 포함하는 CCR5-특이적인 TALEN들을 또한 CCR5 특이적인 TALEN들에서 제작하였으며, 여기서 신규 RVD들은 모든 하나의 유형, 예를 들면, 'T' 또는 'A'를 인지하는 모든 RVD들로 치환시켰다. 비정형 RVD들에 대해 실시예 11 및 12에 앞서 기술한 코드, 즉, A= NI, C= HD, G= NN, T= NG를 사용하였다. 신규한 RVD들의 경우, 다음을 당해 초기 분석에서 시험하였다: A= HI, NI 또는 KI; C= ND, KD, cND; G=SN, AK, DH, cHN, KN; T=TP, IA, VG, SGgs, 또는 IP. 보다 적은 경우 문자들이 사용된 경우, 이들은 RVD 위치들에 근접한 위치들의 변경들을 나타내는데, 예를 들면, "cND"는 반복체 단위내 11, 12 및 13번 위치가 변경되었음을 나타낸다. 이들 연구들을 위해, 후보체 RVD들을 표 27b에 나타낸 데이타로 선택하여 기본 단백질들의 증거를 생성하는데 사용하였다. 추가의 TALE 단백질들은 전체 세트로부터 대안적인 비정형 RVD들을 사용하여 제작할 수 있다. 또한, 비정형 RVD들을 선택하여 염기를 규정하는 RVD들의 혼합물이 생성될 수 있도록 할 수 있다(예를 들어, 하나의 TALEN 단백질은 TP 및 IA RVD들 둘다를 사용하여 제작하여 상이한 위치들에서 'T'를 규정할 수 있다).

반복체 단위들에 대한 RVD 서열들은 하기 표 29a 내지 29c에 나타내며 모든 돌연변이된 위치들은 굵은 서체로 나타낸다.

[표 29a]

모든 신규한(비정형) RVD 치환

[표 29b]

치환들 유형

[표 29c]

단일의 RVD 치환들

이후에, 이들 신규한 TALEN들을 30 및 37℃에서 내인성 CCR5 유전자자리에 대한 절단 활성에 대해 시험하고, 앞서 기술한 바와 같이 Cel-I 검정으로 분석하며 NHEJ를 유도하는데 있어서 활성임을 입증하였다(예를 들면, 도 30 참조). 표지되지 않은 레인은 골격 이동 돌연변이를 지닌 비-기능성 TALEN 제작물을 나타냄에 주목한다.

결과들은, 신규(비정형)의 RVD들이, 각각의 TALE-반복체 단위가 신규의 RVD를 포함하는 TALEN 단백질들에서 및 또한 유형이 치환되거나 단독 치환된 TALEN들에서 사용된 경우 DNA를 절단할 수 있다.

실시예 16: 신규한 TALE C-말단 반 반복체들

천연의 TALE들 중 대부분은 C-말단 반 반복체에서 NG RVD를 사용하여 T 뉴클레오타이드 염기와의 상호작용을 명시한다. 따라서, 신규한 C-말단 반 반복체들의 생성을 시험하여 TALE 표적화의 확장을 허용하였다. Pou5F1 및 PITX3 유전자들을 표적화하는 TALEN들을 골격으로서 사용하고, C-말단 반 반복체(C-캡 아미노산들 C-9 및 C-8)내 RVD를 변경시켜 대안적인 핵산들을 명시하였다. 이들 돌연변이체들에서, NI RVD를 삽입하여 A, C의 경우 HD, G의 경우 NK를 인지하였으며 대조군은 T의 경우 NG였다. 사용된 TALEN들은 15개 내지 18개 사이의 RVD들을 함유하였으며 이들 2개의 유전자들에서 각종 표적 서열들을 표적화하였다.

결과들은 도 29에 나타내며 C-말단 반 반복체내에서 RVD 위치는 단지 T 이외의 뉴클레오타이드 염기들과 상호작용하도록 가공하거나, 모든 염기들을 균일하게 인식하도록 설계할 수 있다. 당해 Cel-I 검정으로 측정된 것으로서, 레인 지정들, 표적 서열들 및 NHEJ %는 하기 표 30에 나타낸다.

[표 30]

신규한 C-말단 반 반복체 표적들

당해 데이타는, 신규한 반 반복체들을 갖는 TALEN들이 이들의 각각의 표적들을 절단할 수 있음을 입증한다.

실시예 17: 최적의 표적 서열들의 확인

최적의 표적 서열들을 측정하고, 따라서, 최적의 TALEN 단백질 설계를 위해서, 인 실리코(in silico) 분석을 다중 SELEX 검정들로부터의 결과들을 사용하여 수행함으로써 i) R1 반복체(N-말단 반복) 단위에 대한 가장 우수한 표적 및 ii) 이합체 및 삽합체 셋팅들에서 이들의 이웃하는 반복체 단위들과 관련하여 특이적인 RVD 반복체들이 거동하는 방법을 측정하였다. 이들 연구들에서, NI RVD는 A, C의 경우 HD, G의 경우 NN, 및 T의 경우 NG를 인지하는데 사용하였다.

결과들은 표 31, 32 및 33에 요약한다. 표 31에서의 값들은 표적화된 염기의 관측된 빈도와 변화(즉, 0.25)에 의해 예측된 염기의 빈도 사이의 비의 알고리즘(기본 4)로 계산한 로그-승산비 점수(log-odds score)들이다. 1.0의 점수는, 표적화된 염기가 시간의 100%(즉, 변화에 의해 예측된 것보다 4배 많은 빈도)로 관찰되었음을 나타낼 수 있고, 0.0의 점수는, 표적화된 염기가 시간의 25%로 관찰되었음을 나타낼 수 있으며, 음성 점수는, 표적화된 염기가 시간의 25% 미만으로 관찰되었음을 나타낼 수 있다. 표 31에서의 값들은 62개의 별개의 TALE 단백질들로부터의 SELEX 데이타로 이루어진 데이타 세트의 적절한 위치들에 대한 평균 염기 빈도로부터 계산되었다. "R1 RVD"로 표지된 값들은 N-말단 TALE 반복체(및 각각의 결합 부위에서 인지체 위치)를 말한다. "R2+ RVD"로 표지된 값들은 모든 다른 RVD들(및 각각의 결합 부위에서 인지체 위치들)을 말한다. 이러한 데이타는, 다른 모든 위치들에 대한 N-말단 위치에서 HD, NN, 및 NG RVD들을 지닌 TALE 반복체들의 특이성에 있어서의 현저한 차이를 나타낸다.

표 32 및 33에 나타낸 값들은 이합체(표 2) 또는 삽합체(표 33) 세팅에서 점수에 대해 독립적으로 각각의 염기에 대해 측정되고 67개의 별개의 TALE 단백질들에 대한 SELEX 데이타로부터 측정된 로그-승산비 점수들에 있어서의 변화를 나타낸다. 따라서, HD RVD에 인접한 NN RVD에 대한 -0.12 값(NN RVD는 제작물의 N-말단에 가깝고 HD RVD는 제작물의 C-말단에 더 가깝다)은, 이합체내 위치들 둘다에 대한 로그-승산비 점수들의 합이, 이들 2개의 RVD들이 서로 독립적으로 거동하는 경우 예측될 수 있는 0.12 미만이었음을 나타낸다. 유사하게, 표 33c에서 -0.34 값은 제2의 NN RVD에 의해 N-말단 측면에서 플랭킹되고 HD RVD에 의해 C-말단 측면에서 플랭킹된 NN RVD가, 목적한 NN RVD가 모든 NN RVD들에 대한 평균 값보다 0.34 미만의 로그-승산비 점수들을 가짐을 나타냄을 나타낸다. 표 32, 33a, 33b, 33c, 및 33d에서, 음성 값들은, 이들이 서로 완전하게 독립적인 경우보다 더 불량하게 수행하는 인접한 RVD들의 조합들을 나타낸다.

[표 31]

단일 위치들에서 RVD 특이성에 대한 로그-승산비 점수들

[표 32]

2개의 인접한 RVD들에 대한 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화

[표 33a]

중간에서 삼량체 위치들, NI(A)에서 RVD 특이성에 대한 로드-승산비 점수들에 있어서의 변화

[표 33b]

중간에서 삼량체 위치들, HD(C)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화

[표 33c]

중간에서 삼량체 위치들, NN(G)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화

[표 33d]

중간에서 삼량체 위치들, NG(T)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화

주: 표 33a 내지 33d에서, 이태릭체는 데이타세트에서 3 미만의 값들을 나타내고, 여기서 모든 다른 수들은 가능성 변화들을 측정하는데 사용된 적어도 3개의 값들을 함유한다.

이들 결과들은, 최적의 반복체 단위 결합 및 최적의 단백질 설계/표적 확인에 대한 상황 의존성(context dependency)이 존재하고, 반복체 단위들은 완전하게 모듈러(modular)가 아님을 입증한다. 전체적으로, 이들 데이타는 특수 TALE에 대해서 및 최적의 TALEN들을 설계하기 위한 표적 선택 둘다를 최적화하는 설계 규칙들을 제안하는데 사용될 수 있다. 예를 들면, NI는 가장 적은 상황 의존성 RVD이며 R1 위치에서 가장 우수한 RVD는 NI(예를 들면, 이상적인 표적 부위들은 TA로부터 출발하여 R0 및 R1-NI를 수용해야 한다)이다. AC, AT, CC, CA, TA, AA는 표적에 대해 가장 우수한 이합체들인 반면 GG, GC, AG, TT, CG, GT, 및 TC는 최악인 것으로 여겨진다. 3문자들 측면에서, AAC, ATG, GCA, ATA, ACG, 및 ATC는 표적에 대해 가장 우수한 3문자들인 반면 GGC, AGC, TGC, TTT, GGA, AGT, GGT, GGG, TCT, GTC, CTT, 및 AGG는 최악인 것으로 여겨진다. 따라서, 이들 설계 규칙들을 합하여 최적으로 결합하는 TALEN들을 생성할 수 있다. 유사하게, 표 28에서 NK, AK, 및 DK RVD들을 사용한 SELEX 연구들 및 NK RVD를 사용한 SELEX 연구들(도 17a)은 13번 위치에서 라이신(K)을 가진 RVD들이 A보다는 G를 명시하기 위해 NK, AK 또는 DK RVD에 대해 NI RVD들 C-말단에 인접하도록 하는 경향이 있음을 나타낸다. 따라서, 전형적인 RVD들 및 NK RVD들에 대해 측정된 설계 규칙들은 또한 13번 위치에서 동일한 잔기를 가진 비정형 RVD들에 적용시킬 수 있다.

실시예 18: 사람 줄기 세포들에서 TALEN-구동된 표적화된 통합의 입증

TALEN 시스템의 다양성을 입증하기 위하여, TALEN들을 사용하여 사람 배아 줄기 세포들(ESC) 및 유도된 다능성 줄기 세포들(iPSC)내에서 표적화된 통합을 구동시켰다. 사람 ESC들 및 iPSC들을, 제한 부위를 추가로 포함하는 푸로마이신 공여체 핵산을 푸로마이신 마커의 발현이 AAVS1 프로모터에 의해 구동되는 AAVS1 유전자자리내로 표적화된 통합시키기 위해 사용하였다. 공여체들 및 후속된 방법들은 공동 소유의 WO 2010117464[참조: 또한 Hockemeyer et al (2009) Nat Biotechnol 27(9): 851-857, 여기서 본 발명자들은, AAVS1 유전자자리 내로 이러한 제작물의 표적화된 통합의 자발적인 빈도가 본 발명자들의 검정의 검출 한계 미만임을 입증하였다]에서 앞서 기술된 것들이었다. 사용된 뉴클레아제들은 실시예 11에 기술된 바와 같은 AAVS1 유전자자리에 대해 특이적인 TALEN들이었으며, 표적 결합 부위는 하기에 나타낸다:

우선, 당해 유전자자리를 푸로마이신 내성 유전자(PURO)가 단지 정확한 표적화 현상이 단지 수반되는 내인성 PPP1R12C 프로모터의 제어하에서 발현된 유전자 트랩 시도(gene trap approach)를 사용하여 표적화하였다. 둘째로, PPP1R12C 유전자자리는 포스포글리세레이트 키나제(PGK) 프로모터로부터의 푸로마이신 내성 유전자 PURO를 발현한 자가 선택 카세트를 사용하여 표적화하였다. 푸로마이신 내성 세포들의 클론들을 성장시키고 표준 방법들을 사용하여 제한된 DNA에 대한 서던 블롯으로 스크리닝하였다. 당해 실험에서 사용된 프로브(probe)는 PPP1R12C/AAVS1 유전자자리에 대한 것이었으며 혼입된 공여체를 지닌 DNA의 작은 제한 단편인 서열을 인지하였다(따라서 보다 높은 이동성을 가졌다). 표적화 효율은 사용된 공여체와는 고 독립성이었으며, 분리된 클론들의 대략 50%는 이종 또는 동종의 정확하게 표적화된 현상들을 지니며 목적하는 유전자자리에서만 삽입유전자를 수반하였다. 당해 효율은 ZFNs을 사용하여 앞서 관찰된 것과 비교가능하다. PPP1R12C 유전자자리에 대한 표적화는 도입된 삽입유전자의 발현을 생성하였다. 향상된 녹색 형광성 단백질(eGFP)의 균일한 발현은, 구성적 eGFP 발현 카세트를 추가로 수반하는 SA-PURO 공여체 플라스미드들로 표적화하는 경우 hESCs 및 iPSC에서 관찰되었다. 중요하게는, TALEN들을 사용하여 유전적으로 조작된 hESC들은 다능성 마커들 OCT4, NANOG, SSEA4, Tra-1-81 및 Tra-1-60의 이들 발현에 의해 나타난 바와 같이 다능성으로 남았다.

TALEN들을 사람 OCT4 유전자(OCT4-Int1-TALEN)의 제1 인트론에 대해 설계하였고 표적 서열을 3개의 상이한 플라스미드들과 함께 하기에 나타낸다:

TALEN들은 +63 C-캡을 이용하였으며 대표적인 RVD들(표적 A, C, G, 및 T 각각에 대한 NI, HD, NN, 및 NG)를 사용하였다. 101125는 15.5 TALE 반복체들을 포함하였으며 101225는 16.5 TALE 반복체들을 포함하였다. 101225는 NN RVD를 지닌 반 반복체를 이용함으로써 이의 표적 위치에서 3'G를 인지하였다.

정확한 표적화 현상들은 내인성 OCT4 프로모터의 제어하에서 푸로마이신 및 OCT4 exon1-eGFP 융합 단백질의 발현에 의해 특징화된다. 제1의 2개의 공여체 플라스미드들을 설계하여 스프라이스 수용체 eGFP-2A-자가-절단 펩타이드(2A)-푸로마이신 카세트를 OCT4의 제1 인트론내로 통합시키고, 동족체 아암(arm)들의 설계시 단독으로 차등화하였지만, 제3의 공여체는 eGFP-2A-푸로마이신 카세트의 판독 프레임에 대한 엑손 1의 직접적인 융합체를 생성하도록 가공하였다. 이들 전략들 둘다는 서던 블롯 분석 및 단일-세포-기원한 클론들의 DNA 서열분석에 의해 측정된 것으로서 OCT4 유전자자리 외에 정확한 표적화된 유전자를 생성하였다. 표적화 효율들은 hESC들 및 iPSC들 둘다에서 67% 내지 100%의 범위이었다.

TALEN들을 사용하여 hESC들에서 발현되지 않은 유전자위치를 유전적으로 가공할 수 있는지를 시험하기 위해, TALEN들을 가공하여(101125 및 101225에 대해 사용된 동일한 설계 및 조립 과정을 사용) PITX3 유전자의 제1의 암호화 엑손내에서 절단하였다. 표적 서열들은 하기 나타낸다:

전기천공 후에, 표적화 현상들을 서던 블롯 분석에 의해 외부 5' 및 내부 3' 프로브를 사용하여 평가하였다. PITX3에서 단독으로 공여체-명시된 eGFP 삽입유전자를 단독으로 수반하는 단일-세포-기원한 클론들을 시간의 평균 6%로 수득하였다. 특히, 분석된 96 hESC 클론들 중 하나는 PITX3 Exon1(WI#3에서) hESC들의 대립형질들 둘다에서 삽입유전자를 수반하였으며, 발현되지 않은 유전자의 대립형질들 둘다의 1 단계의 성공적인 유전적 변형을 입증하였다.

이들 결과들은 줄기 세포들의 게놈내로 표적화된 통합을 구동시키기 위해 TALEN들을 사용하는 능력을 입증한다.

실시예 19:생체내에서 수정되는 TALEN 매개된 유전자의 예들

C. 엘레간스(C. elegans)에서 수정되는 TALEN 게놈. TALEN들이 생체내 유전자 수정을 위해 동물들에서 사용될 수 있는지를 입증하기 위해, 다음 실험들을 수행하였다. 카에노르하브디티스 엘레간스(Caenorhabditis elegans) ben -1 돌연변이에 대해 특이적인 TALEN 쌍을 RNA로서 전달하고 문헌[참조: Driscoll et al ( (1989) J. Cell. Biol. 109:2993-3003]에 기술된 바와 같이 베노밀 내성에 대해 스크리닝하였다. ben-1 돌연변이체 표현형은 우성이며 통상의 해부 현미경하에서 후대세포중 100%에서 가시적이다. 요약하면, 야생형 C. 엘레간스 자웅동체들을 TALENs 표적화 ben-1을 암호화하는 mRNA들을 주입하기 전에 통상의 NGM 아가 플레이트들에 길렀다.

TALEN들을 암호화하는 핵산들을 표준 제한 클로닝 과정들을 사용하여 SP6 시험관내 전사 벡터(IVT)내로 삽입하였다. ICT 벡터 골격은 pJK370로부터 기원하였으며 배선 해독을 지지하기 위해 앞서 나타낸 5' 및 3' UTR 서열들을 함유한다[참조: Marin and Evans (2003) Development 130: 2623-2632]. 5' CAP 구조들 및 폴리 A를 함유하는 mRNA들의 생산을 시험관내에서 mMessage mMachine^®(제조원: Ambion) 및 폴리A 테일링 키트들(제조원: Ambion)을 사용하여 수행하고 NanoDrop 분광기(제조원: Thermoscientific)를 사용하여 정량화하기 전에 Ambion MEGAClear^TM 컬럼 위에서 정제하였다. mRNA 주입물들을 짜이즈 악시오버트(Zeiss Axiovert) 현미경 하에서 나리쉬지(Narishige) IM300 주입기를 사용하여 수행하였다. mRNA들의 주입은 다음의 차이점들을 지닌 표준 C. 엘레간스 DNA 주입 프로토콜들[참조: Stinchcomb et al. (1985) Mol Cell Biol 5:3484-3496]에 따라 수행하였다: 조절인자를 조정하여 N2 가스 탱크로부터의 압력이 60 psi가 되도록 하였다. P_주입 및 P_균형 측정들을 15 psi 및 2 psi 각각으로 조정하였다. 이들 압력 값들은 벌레 생식샘내로 유액의 보다 온화한 방출을 허용하기 위한 DNA 주입들을 위해 통상적으로 사용된 것들보다 더 낮다. 모든 mRNA들을 500 ng/μL에서 주입하고, TALEN을 암호화하는 모든 mRNA를 쌍들로 주입함으로써, 침내 총 mRNA 농도는 1000 ng/μL이었다.

mRNA 주입에 이어서, 동물들을 7μM 베노밀을 함유하는 플레이트들로 이전시켰다. F1 자가-후대세포는 동물의 내부 부위를 접촉시킴으로써 어린 성충으로서 스크리닝하였다. 이종 돌연변이체 동물들은 다수의 사인곡선-형 운동들을 사용하여 거꾸로 반응한 반면, 야생형 동물들은 마비되어 당해 능력을 상실한다. 마비되지 않은 F1 동물들을 표적 부위(위에서 기술된 바와 같음)의 PCR/Cel-I 분석에 대해 개별적으로 분해하거나, 신선한 베노밀 플레이트들 및 표적 부위에 걸쳐 서열분석함으로써 마비되지 않은 F2로부터 분리한 동종접합체들로 개별적으로 전달하였다. 101318/101321로 지정된 하나의 TALEN 쌍은 ben-1 돌연변이 표현형의 역전을 유발하였으며, F1 후대는 베노밀에 대해 내성인 것으로 밝혀졌다. 베노밀 내성 동물들의 서열 분석은 표적 위치에서 2개의 상이한 보나-피드 인델(bona fide indel)들을 나타내었다. 당해 TALEN 쌍에 대한 표적 부위에서의 유전자자리는 하기 나타내며, 이들의 서열들은 실시예 23에 나타낸다.

이들 데이타는, TALEN들이 생체내에서 게놈 수정할 수 있음을 입증한다.

랫트들에서 TALEN 게놈 수정. 다음에, TALEN들을 사용하여 랫트 게놈을 수정하였다. 내인성 랫트 IgM 유전자에서 엑손 2를 표적화하는 랫트 IgM-특이적인 TALEN 쌍 101187/101188은 상기 실시예 11 및 12에서 앞서 기술한 바와 같이 제작하였다. 랫트 게놈에서 표적 서열은 하기에 나타내며, 여기서 굵은 대문자들은 TALE DNA 결합 도메인에 대한 표적 부위를 나타내고 소문자들은 gap 또는 스페이서 영역을 나타낸다:

이후에, 이들 TALEN 쌍을 암호화하는 핵산들을 문헌[참조: Menoret et al (2010) Eur J Immunol. Oct;40(10): 2932-41]에 기술된 바와 같이 랫트 배아내로 주입하였다. TALEN들을 암호화하는 핵산들을 전핵(pronuclear)(PNI, DNA) 또는 세포질내(IC, RNA) 주입으로서 하기 표 35에 나타낸 투여량으로 주입하였다.

[표 34]

랫트 IgM-특이적인 TALEN들의 경로 및 투여량

* 주: 모든 예측된 모체들은 전달되지 않았다, ND=측정되지 않음

주입된 배아들의 퍼센트를 가임신 암컷 랫트들내로 이식하고 수득되는 신생쥐들을 게놈 수정에 대해 검정하였다. DNA를 전핵 DNA 주입물들로부터 생성된 새끼들로부터 분리하여 문헌[참조: Kim et al (2009) Genome Res. 19(7): 1279-1288]에 기술된 바와 같은 T7 미스매치 분석에 적용시켰다. 요약하면, PCR을 프라이머 세트 GJC153F-154R을 사용하여 수행함으로써 371bp PCR 생성물을 생성시켰다. 프라이머 쌍은 하기 나타낸다:

GJC 153F 프라이머: 5' ggaggcaagaagatggattc (SEQ ID NO:453)

GJC 154R 프라이머: 5'gaatcggcacatgcagatct (SEQ ID NO:454)

당해 분석의 경우, 표준 실시에 의해 분리된 100 ng의 테일 gDNA를 사용하였다. 잠재적인 이종이중쇄들이 다음과 같은 PCR 생성물 5μl를 사용하여 형성되도록 하였다: 95℃/95℃ 내지 85℃(-2℃/초)/85℃ 내지 25℃(-0.1℃/초)/4℃에서 2'. 이후에, 이를 T7 엔도뉴클레아제 I(NEBiolabs ref: M0302L)으로 다음 조건들하에 분해하였다: 5μl의 PCR 이종이중쇄 + 1μl의 10xNEB2 + 0.5μl T7 엔도 + 3.5μl H₂O/37℃에서 20'. 분해 후, 반응물을 0.5x TAE 속에서 1.2% 아가로즈 겔 위에서 이동시켰다. 분석된 66마리의 새끼들 중 7마리가 T7 검정에 의한 NHEJ 활성에 대해 양성이었으며(도 31에 나타냄) 서열분석은 NHEJ 관련된 InDels(즉, 랫트 3.3에서 1bp 결실 및 랫트 3.4에서 90 bp 결실)의 존재를 나타내었다.

TALEN 쌍들을 또한 목적한 핵산을 사용한 랫트 세포들내로의 표적화된 통합을 위해 사용하여 유전자삽입 동물들을 생성하였다. TRALEN 쌍에 의해 표적화된 랫트 세포들은 랫트 배아 줄기 세포들이며, 유도된 다능성 줄기(iPS) 세포로 전환가능한 어떠한 랫트 세포 유형 또는 하나 이상의 세포화된 GFP-함유 랫트 배아이다. TALEN 쌍은 세포로 전달되며, 최적으로 CAG 프로모터, mRNA를, 최적으로 5' cap 구조 및 3' 폴리아데노신 테일, TALEN 개방 판독 프레임들을 암호화하는 핵산을 함유하는 정제된 단백질 또는 바이러스 입자들과 함께 함유하는 플라스미드 DNA일 수 있다. 공여체 DNA는 파괴 부위의 양쪽 측면들에서 50 내지 1000bp의 상동성을 함유하는 일본쇄 또는 이본쇄 선형 플라스미드 DNA 또는 파괴 부위의 양쪽 측면들에서 50 내지 1000bp의 상동성을 함유하는 일본쇄 또는 이본쇄 원형 플라스미드 DNA일 수 있다. TALEN 및 공여체는 랫트 세포들 또는 배아들의 미세주입, 랫트 세포들의 전기천공, 지질-계 막 융합, 인산칼슘 침전, PEI 등을 통한 형질감염, 정제된 뉴클레아제 단백질과의 항온처리(예를 들면, 세포를 침투하는 펩타이드에 융합된 경우), 또는 바이러스를 사용한 랫트 세포들 또는 배아들의 감염에 의해 전달된다. 이들 방법들은 당해 분야에 공지되어 있다. 주입된 또는 형질감염된 세포들 또는 배아들로부터 변형된 랫트를 생성하는 수단들은 선택된 전달 방법에 의존할 것이다. 배아들의 경우, 배아들은 가-임신 랫트의 자궁으로 이식될 것이며 앞서 기술된 기간이 되도록 할 것이다. 변형된 세포들의 경우, 3개월이면 가능하다: a) 랫트 세포들이 배아 줄기 세포들인 경우, 랫트 배반포들에게 변형된 랫트 줄기 세포들을 주입한다. 배반포들은 가임신 랫트의 자궁내로 이식되어 기간이 되도록 할 것이다; b) 세포(또는 이의 핵)은 제핵된(enucleated) 난모세포(체세포 핵 전달)로 미세주입되어야 하며 수득되는 배아는 가-임신 랫트의 자궁내로 이식되어 기간이 되도록 할 수 있거나 c) 세포를 iPS 세포로 전환시키고 랫트 배반포내로 주입하여야 한다. 배반포들은 가-임신 랫트의 자궁내로 이식되어 기간이 되도록 할 것이다. 이후에, 새끼들을 PCR 또는 당해 분야에 공지된 어떠한 다른 수단들에 의해 삽입유전자의 존재에 대해 검정한다.

식물들에서 TALEN 게놈 수정. 지. 마이즈(Z. maize) RPD1 및 C1 유전자들에 대해 특이적인 TALEN 쌍들을 상기 실시예 11에서 기술한 바와 같이 제작하였으며 이들의 표적 서열들은 RPD1 유전자자리(서열 번호: 382 내지 387)와 비교하여 하기 나타낸다:

C1 유전자자리에 대해 이루어진 TALEN 쌍들은 하기 유사하게 나타낸다(SEQ ID NO:388 내지 390):

추가의 TALEN 쌍들은 다음과 같이 C1 유전자자리에 대해 제조하였다(SEQ ID NO:391 내지 398):

식물 특이적인 TALEN 쌍들을 포유동물 신경 2A 세포들에서 이중-루시퍼라제 일본쇄 어닐링 검정(Dual-Luciferase Single Strand Annealing Assay)(DLSSA)을 사용하여 활성에 대해 분석하였다. 이는 일시적으로 형질감염된 세포들에서 ZFN 또는 TALEN 활성들을 정량하기 위해 사용된 신규 시스템이며, 업자(Promega)로부터의 Dual-Luciferase Reporter^® 검정 시스템을 기본으로 한다(참조: 실시예 13). 당해 시스템은 단일 튜브(웰)내에서 2개의 개개 리포터 효소들, 개똥벌레 및 레닐라 루시퍼라제들의 연속적인 측정을 허용한다. 개똥벌레 및 레닐라 루시퍼라제 리포터들 둘다를 재가공하고 검정 조건들을 최적화한다. 개똥벌레 루시퍼라제 리포터 제작물은 ZFN 또는 TALEN들에 대한 DNA 결합 부위들에 의해 분리된 개똥벌레 암호화 영역들의 2개의 불완전한 카피들을 함유한다. 당해 연구에서, 5' 카피는 개똥벌레 유전자의 N-말단 부위의 대략 2/3으로부터 기원하고 3' 카피는 개똥벌레 유전자의 C-말단 부분의 대략 2/3로부터 기원한다. 2개의 불완전힌 카피들은 약 600-bp의 동족체 아암들을 함유한다. 분리된 개똥벌레 단편들은 루시퍼라제 활성을 가지지 않는다. ZFN 또는 TALEN 쌍에 의해 유발된 DNA 이본쇄 파괴는 일본쇄 어닐링 경로에 의한 플랭킹 반복체들 사이의 재조합을 자극할 것이며 이후 개똥벌레 루시퍼라제 기능을 회복할 것이다. 동시-형질감염된 레닐라 루시퍼라제 플라스미드는 내부 대조군을 제공한다. 각각의 리포터의 발광 활성은 발광계에서 판독된다. 내부 대조군(레닐라)의 활성에 대한 실험 리포터의 활성의 표준화는 세포 생존능 및/또는 형질감염 효능에 있어서의 차이들에 의해 유발된 실험적 가변능을 최소화한다. 표준화된 값을 사용하여 제공된 ZFN 또는 TALEN 쌍의 활성을 측정한다. 이는, 정밀한 모델 세포들을 지닌 시스템들내에서 작업하거나 의도된 표적 세포 유형이 유용하기 않거나 서열분석 목적으로 사용되기 어려운 경우 유용한 도구이다. 이는 또한, 표적 서열들이 내인성 게놈에서 이용가능하지 않은 경우 TALEN 기술 플랫폼을 개발하고 최적화하는데 유용한 도구이다. 활성 뉴클레아제들은 DLSSA에 의해 확인된 후 최종 평가를 위한 내인성 시스템내로 복사될 수 있다. 식물 표적들에서 활성 TALEN 쌍들은 하기 표 35a에 나타낸다.

[표 35a]

식물 TALEN

^*주: 당해 검정에서 활성은 루시퍼라제 SSA 검정에서 상대적인 단위들로 측정된다.

이후에, TALEN 쌍들을 금-입자 충격을 통해 표준 방법[참조: Frame et al, (2000) In vitro cellular & developmental biology. 36(1): 21-29]을 사용하여 옥수수 Hi II 배아들로 전달하였다. TALEN 쌍당 총, 약 90개의 수분된 옥수수 배아들을 형질전환하고 약 7일 동안 게놈 DNA 추출을 위해 혼주(pooling) 및 액체 N2 속에서 동결시키기 전에 캘루스(callus) 개시 배지 위에서 성장하도록 하였다. 게놈 DNA를 DNeasy Plant Miniprep kit(제조원: Qiagen)를 사용하여 충격을 가한 플레이트당 4 내지 6개의 동결된 배아들로부터 분리하였다. 이후에, 각각의 TALEN 표적을 2단계 PCR에 의해 3개의 생물학적 삼중쇄(triplicate)들로 이루어진 혼주된 게놈 DNA로부터 고-충실성 푸션 핫 스타트 II 폴리머라제(High-Fidelity Phusion Hot Start II Polymerase)(NEB)를 사용하여 2-단계 PCR 라운드로 증폭시켰다. 제1 라운드에서, 각각의 부위는 400ng의 게놈 DNA를 사용하여 20-주기 PCR속에서 증폭시키고 프라이머들은 표 35b에 나열하였다. 제2 라운드에서, 추가의 20 주기들을 1μl의 제1 PCR로부터의 생성물 및 프라이머들 SOLEXA-OUT-F1 및 SOLEXA-OUT-R1을 사용하여 수행함으로써 완전한 일루미나 서열분석 앰플리콘(Illumina sequencing amplicon)들을 생성하였다. 이후에, 수득되는 PCR 생성물들을 퀴아퀵 PCR 정제 컬럼(Qiaquick PCR Purification column)(제조원: Qiagen)들 위에서 정제하고, 각각 50nM로 표준화하고, 동 용적들 속에서 합하여 총 8개 부위들이 단일 일루미나 레인에서 서열분석되도록 하였다. 처리되지 않은 게놈 DNA로부터의 대조군 앰플리콘들을 별도의 레인에 넣었다. 일루미나 단일-판독 100bp 서열분석을 ELIM 바이오파마슈티칼스(ELIM Biopharmaceuticals)(캘리포니아주 하이워드 소재)에서 수행하였다.

[표 35b]

일루미나 서열분석에 사용된 올리고뉴클레오타이드 프라이머들의 서열들

서열분석은 하기 표 36에 나타낸 바와 같이 TALEN 처리된 배아들로부터의 세포 혼주물들에서 다수의 InDels의 존재를 나타내었다. 서열 분석의 세부사항들은 다음과 같다: TALEN 처리된 제아 마이즈(Zea maize) 배아들로부터 기원한 바코드처리한 서열들을 함께 혼주시키고 일루미나 GA2 서열분석기(Illumina GA2 sequencer) 위에서 100bp 판독-길이 서열분석에 넣었다. 모의 처리된 제아 마이즈 배아들로부터 기원한 바코드 처리된 서열들을 함께 혼주시키고 동일한 일루미나 GA2 서열분석기의 별개의 레인 위에서 100bp 판독-길이 서열분석에 넣었다. 각각의 수득되는 데이타 파일에서 서열들을 바코드로 분리하고 변형되지 않은 게놈 서열에 대해 정렬하였다. 배아들의 소 분획들은 배아의 대부분에 대해 C1 유전자에서 3bp 삽입체를 함유하였다. 예측된 TALEN 절단 부위들 위에 집중된 10bp 윈도우(window)내에서 적어도 2개의 연속 삽입되거나 결실된 염기들로 이루어진 InDels을 강력한 NHEJ 현상들로 고려하고 추가로 가공하였다. 제공된 TALEN 처리된 시료 및 인지체 모의 처리된 시료 둘다에서 유사한 빈도로 발생한 InDels을 서열분석 인공물들로 고려하여 폐기하였다.

[표 36]

TALEN 처리된 옥수수에서 InDels

표 37은 상기 나타낸 8개 시료들에서 가잔 우수하게 관찰된 InDels을 나타내며, TALEN들이 유전자 표적물들 및 모든 쌍들의 뉴클레아제들을 사용하여 NHEJ를 유도시킬 수 있었음을 입증한다. 각각의 시료의 경우, 변경되지 않은 게놈 서열은 밑줄친 2개의 TALEN 결합 부위들 사이의 gap으로 나타낸다. 결실된 염기들은 쉼표로 나타내고 삽입된 염기들은 삽입된 서열의 말단을 나타내는 "{"삽입된 서열의 출발을 나타내고"}"을 사용하여 괄호로 나타낸다.

[표 37]

옥수수 시료들에서 관찰된 InDels

처리된 S1 TALEN (유전자 표적: C1, TALEN 쌍 101370/101371)

처리된 S2 TALEN (유전자 표적: C1, TALEN 쌍 101378/101379)

처리된 S3 TALEN (유전자 표적: C1, TALEN 쌍 101380/101381)

처리된 S4 TALEN (유전자 표적: RPD1, TALEN 쌍 101388/101391)

처리된 S5 TALEN (유전자 표적: RPD1, TALEN 쌍 101389/101391)

처리된 S6 TALEN (유전자 표적: RPD1, TALEN 쌍 101389/101393)

처리된 S7 TALEN (유전자 표적: RPD1, TALEN 쌍 101390/101391)

처리된 S8 TALEN (유전자 표적: RPD1, TALEN 쌍 101390/101393)

InDel 빈도는 모든 시료들에서 유사하였다(5,400 현상들 중 1개에 대해 11,000개 현상들 중 약 1 또는 0.0087% 내지 0.0185%). 이는, 제한하는 인자가 TALEN 활성보다는 오히려 옥수수 배아들로의 바이오리스틱스(biolistic) 전달이다. TALEN 처리된 제아 마이즈 배아들로부터 기원한 바코드처리된 서열들을 함께 혼주시키고 일루미나 GA2 서열분석기 위에서 100bp 판독-길이 서열분석을 위해 넣었다.

다음에, 이들 TALEN들을 사용하여 TALEN들에 의해 생성된 DSB내로 목적한 특정의 바람직한 DNA의 표적화된 통합(TI)를 구동시킨다. TI는 단자엽 또는 쌍자엽 식물들에서 당해 분야에 공지된 방법들[참조: 예를 들면, Shukla et al (2009) Nature 459:437 및 Cai et al (2009) Plant Mol Biol 69:699]을 사용하여 달성할 수 있다. 신규한 식물 종들은 또한, 목적하는 경우, 선택된 TALEN에 대해 안정하게 유전자삽입성이도록 생성되어 TALEN 균주의, 돌연변이가 요구되는 다른 균주로의 교배를 허용한 후, 후대를 분리함으로써 일부 후대가 목적하는 돌연변이만을 함유하도록 하고 TALEN 삽입유전자가 분리제거되도록 할 수 있다.

따라서, 이들 실시예들은, 본 발명의 신규한 TALEN들이 식물 및 동물 시스템들에서 생체내에서 게놈 수정할 수 있음을 입증한다.

실시예 21: TALE 반복체 단위의 변경들

TALE 반복체 단위에서 변경들을 이용하기 위해, 크산토모나스(Xanthomonas) 및 랄스토니아(Ralstonia) 둘다로부터의 서열을 비교하였다. 랄스토니아로부터의 52개의 유일한 반복체 단위들을 시험하여 각각의 위치에서 잔기 빈도들을 관찰한 후, 이들 값들을 편집하였다. 데이타는 하기 표 38에 나타내며, 여기서 아민노산들은 좌측으로부터 우측으로 1문자 코드로 나타내며 반복체 단위에서 위치는 상부로부터 하부로 나타내고, RVD 위치들은 굵은 글씨체로 나타낸다:

[표 38]

랄스토니아 반복체들에서 발견된 아미노산들의 빈도들

이후에, 이들 반복체 단위들을 크산토모나스로부터의 것들과 조합하여 유일한 반복체 단위들을 생성할 수 있다. 랄스토니아 반복체들에서 발견된 잔기들과 크산토모나스 잔기들에서 발견된 잔기들의 조합인 반복체 서뎔들은 증가된 DNA 결합 친화성, 증가된 DNA 결합 특이성, 또는 산화에 대한 감소된 민감성과 같은 개선된 특징들을 갖는 단백질들을 수득할 수 있었다. 이러한 반복체 단위 조합물들의 예는 굵고 보다 큰 글자크기로 나타낸 변경된 잔기들과 함께 포함한다:

LTPDQVVAIASHDGGKQALETVQRLLPVLCQDHG 현재의 크산토모나스(SEQ ID NO:333)

당해 가능성을 이용하기 위하여, 하기 표 39에 나타낸 반복체 단위들을 제작하였다. 표는 제1 라인에서 전형적인 랄스토니아 반복체 단위를 나타내고, 제2 라인에 크산토모나스 반복체 단위를 나타낸다. TALE 반복체들에 대한 서열 요건들을 프로브하도록 설계된 랄스토니아 기원한 잔기들 및 다른 변이체들을 함유하는 신규 반복체들은 후속 라인들에 나타낸다. 제2 라인에서 전형적인 크산토모나스 반복체 단위로부터의 모든 차이들은 밑줄쳐져 있다. 다음에, 반복체 단위들은 3 내지 27열에서 굵은 글씨의 위치들을 변화시켜 가공하였다. 이후에, 이들 신규한, 조작된 반복체 단위들은 실시예 15에서 신규한 RVD들을 시험하기 위해 설계된 시스템으로 치환하여 도 27에 나타내고, 수득되는 제작물들은 시험관내에서 해독하고 ELISA에서 사용하였다. ELISA에서 사용된 표적 서열은, 이들 신규 골격 돌연변이체들 모두에서 RVD가 C와 상호작용하도록 HD에서 일정하게 유지되도록 실시예 15에 기술된 'C' 변이체(예를 들면, TTGACCATCC, 서열 번호 182)이었다. 표 39에 나타낸 이들 ELISA 결과들(3개의 상이한 실험들의 평균)은 표준 서열 반복체 단위 서열에 대해 모두 표준화하였다.

[표 39]

신규 반복체 골격 치환체들

ELISA 결과들로부터 알 수 있는 바와 같이, 2, 3, 4, 6, 7, 8, 9, 10 또는 11번 위치들에서 돌연변이들을 지닌 조작된(예를 들면, 신규한) 골격을 포함하는 TALE DNA 결합 도메인의 활성은 약화된다(결합에 있어서 가장 유의적인 효과를 가진 2, 3, 4, 7, 및 11번 위치에서 돌연변이들을 지닌다). 대조적으로, 20, 21, 24, 25, 26, 및 27번 위치에서 많은 치환들은 DNA 결합에서 최소 효과를 가졌거나 DNA 결합을 실제로 증가시켰다. 랄스토니아 반복체에서 21 내지 27번 위치들로부터의 하나 이상의 잔기들이 크산토모나스 반복체내로 치환되는 경우 결합에 있어 최대 증가들이 발생하였다.

하이브리드 반복체 단위들을 어떠한 목적하는 단백질들을 인식할 수 있는 신규한 TALE 단백질들을 생성시키기 위해 직렬로 조합하였다. 이들 신규한 TALE DNA 결합 도메인들은 또한 뉴클레아제 도메인들, 전사 조절 도메인, 또는 다른 어떠한 활성 단백질 도메인에 연결시켜 DNA 상호작용 후 측정가능한 결과를 유발시킨다.

실시예 21: TALE -아연 핑거 DNA 결합 도메인 하이드리드들의 제작

아연 핑거들을 TALE DNA 결합 도메인들에 융합시켜 하이브리드 DNA 결합 도메인을 생성한 후 이를 뉴클레아제에 연결시켰다. 표적 DNA 서열들은 하기 나타내며, CCR5 유전자내에 유전자자리를 둘러싸는 영역을 포함한다. 상기 및 하기에 나타낸 결합 부위는 TALE DNA 결합 도메인에 대한 표적 결합 부위들이며 아연 핑거 결합 부위는 표적 서열위에 굵은 글씨로 밑줄쳐서 나타낸다. 굵은 글씨/밑줄에서 "TAG" 서열은 CCR5-특이적인 ZFN SBS#8267로부터의 제4 핑거에 대한 결합 부위이나, 굵은 글씨/밑줄에서 "AAACTG" 서열은 CCR5-특이적인 ZFN SBS#8196에서 제3 및 제4 핑거들에 대한 결합 부위이다(참조: 미국 특허원 11/805,707). 하기 서열들은, 아연 핑거 DNA 표적들이 DNA 쇄상에서 TALE DNA 결합 도메인 표적들과 인접하지 않으며, "내부 gap"을 생성함을 나타낸다. 따라서, 이러한 유형의 융합은, 내부 gap 영역내에서 요구되는 경우 연구자가 DNA의 영역을 무시하도록 한다.

하기 표, 표 40은 연구들의 결과들을 나타낸다. 당해 연구들에서, 하나의 뉴클레아제 파트너는 7, 10, 또는 13개 염기들의 내부 gap과 일정하게 유지된다. 이후에, 파트너 뉴클레아제를 4 내지 16개 염기들의 내부 gap을 포함하는 단백질들과 짝을 지었다. 표에 나타낸 바와 같이, TALE/아연 핑거 하이브리드 DNA 결합 도메인들은, 내부 gap들이 4 내지 16개 염기들의 범위인 경우 활성 뉴클레아제 쌍들을 형성할 수 있다.

[표 40]

아연 핑거-TALE DNA 결합 도메인 하이드리드들

실시예 22: TALE-인테그라제 융합 단백질의 제작

레트로바이러스들의 생애 주기 동안에, 바이러스 게놈 RNA들은 역 전사되어 심지어 특정의 열점(hot spot)들에 대한 선호도들이 존재한다고 해도, 숙주 게놈내로 많은 상이한 부위들에서 통합된다. 레트로바이러스 벡터들을 이용하는 적용들, 특히 유전자 치료요법의 경우, 종양유전자 위치 근처의 조작된 바이러스 게놈의 무작위적인 통합으로 인하여 레트로바이러스 벡터들의 가능한 발암성은 강력한 위험 인자를 나타낸다. 이러한 잠재적인 문제점들을 극복하기 위하여, 바이러스 인테그라제들의 특이성은 특이적인 TALE DNA-결합 도메인들을 이용함에 의해 예비-측정된 부위들로 재-지시된다. 융합체들은 전체 또는 트렁케이트된 인테그라제들 및 전체 또는 트렁케이트된 인테그라제-결합 단백질들(예를 들면, HIV 인테그라제의 경우 LEDGF)를 사용하여 제조한다. 또한, 쌍의 하나의 구성원이 하나의 단백질(예를 들면, 단백질 1)에 융합된 통합체이고 제2 쌍은 TALE DNA 결합 도메인과 다른 단백질(예를 들면, 단백질 2)의 융합체인 융합체 쌍들을 제조하며, 여기서 단백질 1 및 단백질 2는 서로 결합한다. 융합체 쌍들은 발현 벡터내로 클로닝하여 당해 쌍이 목적 세포내에서 발현된다. 포유동물 게놈 표적의 경우, 융합체 쌍은 포유동물 발현 벡터를 사용하여 발현되도록 한다. TALEN 융합체들의 발현 동안, 공여체 DNA가 공급되어 공여체가 TALEN-유도된 DNA 융합 후 절단 부위내로 혼입되도록 한다.

실시예 23: 다양한 TALE 제작물의 서열

DNA 서열 및 단백질 서열

밑줄 친 코딩 서열을 갖는 완전 TALEN 제작물 서열 (SEQ ID NO:217):

NTF3 변형 및 시험관내 절단 연구에서 사용된 각각의 TALEN에 대한 완전 단백질 및 코딩 서열

각각의 발현 제작물의 서열을 재생하기 위해, 상기 제작물의 밑줄 친 영역을 하기 보여진 각각의 CDS으로 대체하라.

2. CCR5 연구에 대한 TALEN 제작물 및 단백질 서열

밑줄 친 코딩 서열을 갖는 완전 TALEN 제작물 서열 (SEQ ID NO:238):

각각 CCR-5 표적화된 TALEN에 대한 완전 단백질 및 코딩 서열 :

CCR5 공여체 서열:

3. TALE 제작물 및 단백질 서열 used 유전자 활성화 연구

밑줄 친 코딩 서열을 갖는 완전 TALE 제작물 서열 (SEQ ID NO:303):

유전자 활성화 연구에서 사용된 각각의 TALE에 대한 완전 단백질 및 코딩 서열 :

NT-L +95 단백질이 SV40로부터 핵 위치 서열 (NLS)을 포함하지만, NT-L +278에 대한 핵 수송은 TALE C-말단 측면(flanking) 영역³에서 존재하는 내인성 위치 서열에 의존한다는 것을 주목하라.

4. 기타 DNA 서열

도 37에서 기재된 시험을 위해 사용된 공여체 (SEQ ID NO:318)

TALE13 리포터 제작물 (밑줄 친 TALE13 결합 부위 및 SV40 프로모터) (SEQ ID NO:319):

TALE13의 DNA 서열 (SEQ ID NO:320):

TALEs VEGF-1 및 CCR5-1의 단백질 및 유전자 서열

AAVS1 특이적 TALEN의 유전자 서열

101077 ORF (밑줄 친 TALE 영역) (SEQ ID NO:325):

101079 ORF (밑줄 친 TALE 영역) (SEQ ID NO:326):

ben -1 특이적 TALEN ORF 의 서열:

SEQUENCE LISTING <110> SANGAMO BIOSCIENCES, INC. <120> NOVEL DNA-BINDING PROTEINS AND USES THEREOF <130> 8325-0079.40 <140> PCT/US2011/000885 <141> 2011-05-17 <150> 61/465,869 <151> 2011-03-24 <150> 61/462,482 <151> 2011-02-02 <150> 61/459,891 <151> 2010-12-20 <150> 61/455,121 <151> 2010-10-13 <150> 61/401,429 <151> 2010-08-12 <150> 61/395,836 <151> 2010-05-17 <160> 555 <170> PatentIn version 3.5 <210> 1 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 1 Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr 1 5 10 15 Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro 20 25 30 Leu Asn <210> 2 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 2 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 3 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 3 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 4 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 4 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 5 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 5 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 6 <211> 34 <212> PRT <213> Xanthomonas campestris <400> 6 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 7 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 7 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 8 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 9 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 9 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Asn 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 10 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 10 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 11 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 11 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 12 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 12 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 13 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 13 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 14 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 14 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 15 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 15 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Thr 20 25 30 His Gly <210> 16 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 16 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 17 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 17 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 18 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 18 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 19 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 19 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 20 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 20 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Asn His Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 21 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 21 Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser Asn Ser Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 22 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 22 Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 23 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 23 Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 24 <211> 34 <212> PRT <213> Xanthomonas oryzae <400> 24 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln 1 5 10 15 Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu 20 25 30 Ala Ala <210> 25 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 25 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Thr Gly Gly Lys 1 5 10 15 Arg Ala Leu Glu Ala Val Cys Val Gln Leu Pro Val Leu Arg Ala Ala 20 25 30 Pro Tyr Arg 35 <210> 26 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 26 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Lys Ala His Leu Leu Asp Leu Leu Gly Ala 20 25 30 Pro Tyr Val 35 <210> 27 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 27 Leu Asp Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Lys Ala Asp Leu Leu Asp Leu Arg Gly Ala 20 25 30 Pro Tyr Ala 35 <210> 28 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 28 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Lys Ala Asp Leu Leu Asp Leu Arg Gly Ala 20 25 30 Pro Tyr Ala 35 <210> 29 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 29 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala 20 25 30 Pro Tyr Ala 35 <210> 30 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 30 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala 20 25 30 Pro Tyr Ala 35 <210> 31 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 31 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Gly Ile Gly Glu Gln Leu Leu Lys Leu Arg Thr Ala 20 25 30 Pro Tyr Gly 35 <210> 32 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 32 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Ser His Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro Asp Leu Arg Ala Ala 20 25 30 Pro Tyr Ala 35 <210> 33 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 33 Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala 20 25 30 Pro Tyr Ala 35 <210> 34 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 34 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala 20 25 30 Pro Tyr Ala 35 <210> 35 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 35 Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala 20 25 30 Pro Tyr Gly 35 <210> 36 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 36 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala Thr 20 25 30 Pro Tyr Asp 35 <210> 37 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 37 Leu Asn Thr Ala Gln Val Val Ala Ile Ala Ser His Tyr Gly Gly Lys 1 5 10 15 Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Arg Gly Val 20 25 30 Pro Tyr Ala 35 <210> 38 <211> 33 <212> PRT <213> Ralstonia solanacearum <400> 38 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln 1 5 10 15 Ala Leu Glu Ala Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro 20 25 30 His <210> 39 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 39 Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Pro Phe Arg Glu Val Arg Ala Ala 20 25 30 Pro Tyr Ala 35 <210> 40 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 40 Leu Ser Pro Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala 20 25 30 Pro Tyr Gly 35 <210> 41 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 41 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala Thr 20 25 30 Pro Tyr Asp 35 <210> 42 <211> 35 <212> PRT <213> Ralstonia solanacearum <400> 42 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Arg Gly Ala 20 25 30 Pro Tyr Ala 35 <210> 43 <211> 33 <212> PRT <213> Ralstonia solanacearum <400> 43 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln 1 5 10 15 Ala Leu Glu Ala Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro 20 25 30 His <210> 44 <211> 494 <212> PRT <213> Xanthomonas campestris <400> 44 Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu 1 5 10 15 Pro Gly Pro Gln Pro Asp Gly Val Gln Pro Thr Ala Asp Arg Gly Val 20 25 30 Ser Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr 35 40 45 Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe 50 55 60 Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu 65 70 75 80 Phe Asn Thr Ser Leu Phe Asp Ser Leu Pro Pro Phe Gly Ala His His 85 90 95 Thr Glu Ala Ala Thr Gly Glu Trp Asp Glu Val Gln Ser Gly Leu Arg 100 105 110 Ala Ala Asp Ala Pro Pro Pro Thr Met Arg Val Ala Val Thr Ala Ala 115 120 125 Arg Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro 130 135 140 Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr 145 150 155 160 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 165 170 175 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 180 185 190 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 195 200 205 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 210 215 220 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 225 230 235 240 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 245 250 255 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 260 265 270 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 275 280 285 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 290 295 300 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 305 310 315 320 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly 325 330 335 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 340 345 350 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 355 360 365 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 370 375 380 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 385 390 395 400 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 405 410 415 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 420 425 430 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 435 440 445 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 450 455 460 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 465 470 475 480 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Ile 485 490 <210> 45 <211> 1102 <212> PRT <213> Xanthomonas oryzae <400> 45 Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu 1 5 10 15 Pro Gly Pro Gln Pro Asp Arg Val Gln Pro Thr Ala Asp Arg Gly Gly 20 25 30 Ala Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr 35 40 45 Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe 50 55 60 Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu 65 70 75 80 Leu Asp Thr Ser Leu Leu Asp Ser Met Pro Ala Val Gly Thr Pro His 85 90 95 Thr Ala Ala Ala Pro Ala Glu Cys Asp Glu Val Gln Ser Gly Leu Arg 100 105 110 Ala Ala Asp Asp Pro Pro Pro Thr Val Arg Val Ala Val Thr Ala Arg 115 120 125 Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser 130 135 140 Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser 145 150 155 160 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 165 170 175 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 180 185 190 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr 195 200 205 Tyr Gln Asp Ile Ile Arg Ala Leu Pro Glu Ala Thr His Glu Asp Ile 210 215 220 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 225 230 235 240 Leu Thr Glu Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 245 250 255 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 260 265 270 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 275 280 285 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Asn Gln 290 295 300 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 305 310 315 320 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly 325 330 335 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 340 345 350 Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 355 360 365 Gly Gly Lys Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu 370 375 380 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 385 390 395 400 His Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 405 410 415 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 420 425 430 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 435 440 445 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 450 455 460 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 465 470 475 480 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 485 490 495 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 500 505 510 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Thr His Gly Leu Thr Pro 515 520 525 Asp Gln Val Val Ala Ile Ala Asn His Asp Gly Gly Lys Gln Ala Leu 530 535 540 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 545 550 555 560 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 565 570 575 Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 580 585 590 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 595 600 605 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 610 615 620 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 625 630 635 640 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 645 650 655 Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Asn 660 665 670 His Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 675 680 685 Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln Val Val Ala Ile 690 695 700 Ala Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 705 710 715 720 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln Val Val 725 730 735 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Ala Thr Val Gln 740 745 750 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln 755 760 765 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 770 775 780 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 785 790 795 800 Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu 805 810 815 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 820 825 830 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 835 840 845 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg 850 855 860 Arg Ile Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp 865 870 875 880 Leu Ala His Val Val Arg Val Leu Gly Phe Phe Gln Ser His Ser His 885 890 895 Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg 900 905 910 His Gly Leu Ala Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu 915 920 925 Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile 930 935 940 Leu Gln Ala Ser Gly Met Lys Arg Val Lys Pro Ser Pro Thr Ser Ala 945 950 955 960 Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu 965 970 975 Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg 980 985 990 Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro 995 1000 1005 Ser Thr Gln Gln Ser Phe Glu Val Arg Val Pro Glu Gln Gln Asp 1010 1015 1020 Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 1025 1030 1035 Arg Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Ile Ala Ala 1040 1045 1050 Asp Leu Ala Ala Ser Ser Thr Val Met Trp Glu Gln Asp Ala Ala 1055 1060 1065 Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu 1070 1075 1080 Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln Ser Gly Ser Val 1085 1090 1095 Gly Gly Thr Ile 1100 <210> 46 <211> 174 <212> PRT <213> Ralstonia solanacearum <400> 46 Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Pro Phe Arg Glu Val Arg Ala Ala 20 25 30 Pro Tyr Ala Leu Ser Pro Glu Gln Val Val Ala Ile Ala Ser Asn His 35 40 45 Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu 50 55 60 Arg Ala Ala Pro Tyr Gly Leu Ser Thr Ala Gln Val Val Ala Ile Ala 65 70 75 80 Ser Ser Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Trp Ala Leu Leu 85 90 95 Pro Val Leu Arg Ala Thr Pro Tyr Asp Leu Ser Thr Ala Gln Val Val 100 105 110 Ala Ile Ala Ser His Asp Gly Gly Lys Pro Ala Leu Glu Ala Val Trp 115 120 125 Ala Lys Leu Pro Val Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Ala 130 135 140 Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln Ala Leu Glu Ala 145 150 155 160 Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro His Ser 165 170 <210> 47 <211> 509 <212> PRT <213> Ralstonia solanacearum <220> <221> NON_CONS <222> (245)..(246) <400> 47 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Thr Gly Gly Lys 1 5 10 15 Arg Ala Leu Glu Ala Val Cys Val Gln Leu Pro Val Leu Arg Ala Ala 20 25 30 Pro Tyr Arg Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn Lys 35 40 45 Gly Gly Lys Gln Ala Leu Glu Ala Val Lys Ala His Leu Leu Asp Leu 50 55 60 Leu Gly Ala Pro Tyr Val Leu Asp Thr Glu Gln Val Val Ala Ile Ala 65 70 75 80 Ser His Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Lys Ala Asp Leu 85 90 95 Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Glu Gln Val Val 100 105 110 Ala Ile Ala Ser His Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Lys 115 120 125 Ala Asp Leu Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Glu 130 135 140 Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys Gln Ala Leu Glu 145 150 155 160 Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu 165 170 175 Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys Gln 180 185 190 Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala Pro 195 200 205 Tyr Ala Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Gly Ile Gly Glu Gln Leu Leu Lys Leu Arg 225 230 235 240 Thr Ala Pro Tyr Gly Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser 245 250 255 Ser His Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro 260 265 270 Asp Leu Arg Ala Ala Pro Tyr Ala Leu Ser Thr Ala Gln Leu Val Ala 275 280 285 Ile Ala Ser Asn Pro Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala 290 295 300 Leu Phe Arg Glu Leu Arg Ala Ala Pro Tyr Ala Leu Ser Thr Glu Gln 305 310 315 320 Val Val Ala Ile Ala Ser Asn His Gly Gly Lys Gln Ala Leu Glu Ala 325 330 335 Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala Pro Tyr Ala Leu Ser 340 345 350 Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys Gln Ala 355 360 365 Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala Pro Tyr 370 375 380 Gly Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly 385 390 395 400 Lys Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala 405 410 415 Thr Pro Tyr Asp Leu Asn Thr Ala Gln Val Val Ala Ile Ala Ser His 420 425 430 Tyr Gly Gly Lys Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val 435 440 445 Leu Arg Gly Val Pro Tyr Ala Leu Ser Thr Ala Gln Val Val Ala Ile 450 455 460 Ala Cys Ile Ser Gly Gln Gln Ala Leu Glu Ala Ile Glu Ala His Met 465 470 475 480 Pro Thr Leu Arg Gln Ala Pro His Gly Leu Ser Pro Glu Arg Val Ala 485 490 495 Ala Ile Ala Cys Ile Gly Gly Arg Ser Ala Val Glu Ala 500 505 <210> 48 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 48 Thr Gly Glu Lys Pro 1 5 <210> 49 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Thr Gly Gly Gln Arg Pro 1 5 <210> 50 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 50 Thr Gly Gln Lys Pro 1 5 <210> 51 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 51 Thr Gly Ser Gln Lys Pro 1 5 <210> 52 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 52 acgtggattc atggtggatc tacgcacgct c 31 <210> 53 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 53 tacgtccgcg gtcctgaggc aatagctcca tca 33 <210> 54 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 tataaatacc ttct 14 <210> 55 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(42) <223> a, c, t, g, unknown or other <400> 55 cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnaaaccact tgactgcgga 60 tcctgg 66 <210> 56 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (3)..(3) <223> a, c, t, g, unknown or other <400> 56 tanaaacctt 10 <210> 57 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 tacacatctt taacact 17 <210> 58 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 ggagccatct ggccgggt 18 <210> 59 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(46) <223> a, c, t, g, unknown or other <400> 59 cagggatcca tgcactgtac gaaannnnnn nnnnnnnnnn nnnnnntttc cacttgactg 60 cggatcctgg 70 <210> 60 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(45) <223> a, c, t, g, unknown or other <400> 60 cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnnnnaaacc acttgactgc 60 ggatcctgg 69 <210> 61 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(47) <223> a, c, t, g, unknown or other <400> 61 cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnnnnnnaaa ccacttgact 60 gcggatcctg g 71 <210> 62 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(54) <223> a, c, t, g, unknown or other <400> 62 cagggatcca tgcactgtac gcccnnnnnn nnnnnnnnnn nnnnnnnnnn nnnngggcca 60 cttgactgcg gatcctgg 78 <210> 63 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 63 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 64 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 64 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 65 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 65 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 66 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 66 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 67 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 67 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 68 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 68 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 69 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 69 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 70 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 70 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 20 25 30 Leu Ala Ala 35 <210> 71 <211> 2 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 71 Gly Ser 1 <210> 72 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 72 Gly Gly Ser Gly Gly Ser Gly Ser 1 5 <210> 73 <211> 77 <212> PRT <213> Xanthomonas campestris <400> 73 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val 65 70 75 <210> 74 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 74 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Leu Val Leu Arg Ala Ala 20 25 30 Pro Tyr Ala 35 <210> 75 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 75 Leu Thr Pro Asp Ala Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 76 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 76 Leu Thr Pro Asp Gln Ala Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 77 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 77 gcacgtggcg gagccatctg gccgggttgg ctggttataa ccgcgcagat tctgttcacc 60 gcgcgata 68 <210> 78 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 gcacgtggcg gagccatctg gccgggttgg ctggttatga agggggagga tcgatcggac 60 gcgcgata 68 <210> 79 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 79 gcacgtggcc atggactcct cccccttcag ctggttataa ccgcgcagat tctgttcacc 60 gcgcgata 68 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 80 gaaggggtta aggcgctgag 20 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 81 agggacgtcg acatgaagag 20 <210> 82 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 82 tggcgtacgg atccaagctt cgtcgaccta gcc 33 <210> 83 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 83 gccaggctag gtcgacgaag cttggatccg tac 33 <210> 84 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 84 ggctgtacgg atccaagctt cgtcgaccta gcc 33 <210> 85 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 85 agccggctag gtcgacgaag cttggatccg tac 33 <210> 86 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 86 gctggtacgg atccaagctt cgtcgaccta gcc 33 <210> 87 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 87 cagcggctag gtcgacgaag cttggatccg tac 33 <210> 88 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 88 ctgggtacgg atccaagctt cgtcgaccta gcc 33 <210> 89 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 89 ccagggctag gtcgacgaag cttggatccg tac 33 <210> 90 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 90 tggtgtacgg atccaagctt cgtcgaccta gcc 33 <210> 91 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 91 accaggctag gtcgacgaag cttggatccg tac 33 <210> 92 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 92 ggttgtacgg atccaagctt cgtcgaccta gcc 33 <210> 93 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 93 aaccggctag gtcgacgaag cttggatccg tac 33 <210> 94 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 94 gttagtacgg atccaagctt cgtcgaccta gcc 33 <210> 95 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 95 taacggctag gtcgacgaag cttggatccg tac 33 <210> 96 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 96 ttatgtacgg atccaagctt cgtcgaccta gcc 33 <210> 97 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 97 ataaggctag gtcgacgaag cttggatccg tac 33 <210> 98 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 98 tatagtacgg atccaagctt cgtcgaccta gcc 33 <210> 99 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (1)..(2) <223> Phosphorothioate linkage <220> <221> modified_base <222> (2)..(3) <223> Phosphorothioate linkage <400> 99 tataggctag gtcgacgaag cttggatccg tac 33 <210> 100 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 100 ggatccaagc ttcgtcgacc t 21 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 101 cagcgcaaac tttggggaag 20 <210> 102 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (7)..(12) <223> a, c, t, g, unknown or other <400> 102 ggtctcnnnn nn 12 <210> 103 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (7)..(12) <223> a, c, t, g, unknown or other <400> 103 ggtctcnnnn nn 12 <210> 104 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (7)..(12) <223> a, c, t, g, unknown or other <400> 104 ccagagnnnn nn 12 <210> 105 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (7)..(12) <223> a, c, t, g, unknown or other <400> 105 ccagagnnnn nn 12 <210> 106 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 106 ggatccggat ggtctcaacc tgaccccaga ccag 34 <210> 107 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 107 gagggatgcg ggtctctgag tccatgatcc tggcacagt 39 <210> 108 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 108 ggatccggat gggtctcaac tcaccccaga ccaggta 37 <210> 109 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 109 gagggatgcg ggtctctcag cccatgatcc tggcacagt 39 <210> 110 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 110 ggatccggat gggtctcagc tgaccccaga ccag 34 <210> 111 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 111 gagggatgcg ggtctctcaa accatgatcc tggcacagt 39 <210> 112 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 112 ggatccggat gggtctcatt tgaccccaga ccaggta 37 <210> 113 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 113 ctcgagggat ggtctcctgt caggccatga tcc 33 <210> 114 <211> 13 <212> DNA <213> Homo sapiens <400> 114 cttcattaca cct 13 <210> 115 <211> 17 <212> DNA <213> Homo sapiens <400> 115 tcattacacc tgcagct 17 <210> 116 <211> 14 <212> DNA <213> Homo sapiens <400> 116 acacctgcag ctct 14 <210> 117 <211> 17 <212> DNA <213> Homo sapiens <400> 117 acacctgcag ctctcat 17 <210> 118 <211> 79 <212> DNA <213> Homo sapiens <400> 118 aaaaagaagg tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct 60 ggaagaattt ccagacatt 79 <210> 119 <211> 79 <212> DNA <213> Homo sapiens <400> 119 aatgtctgga aattcttcca gaattgatac tgactgtatg gaaaatgaga gctgcaggtg 60 taatgaagac cttcttttt 79 <210> 120 <211> 14 <212> DNA <213> Homo sapiens <400> 120 gatactgact gtat 14 <210> 121 <211> 13 <212> DNA <213> Homo sapiens <400> 121 tgatactgac tgt 13 <210> 122 <211> 17 <212> DNA <213> Homo sapiens <400> 122 cttccagaat tgatact 17 <210> 123 <211> 15 <212> DNA <213> Homo sapiens <400> 123 tcttccagaa ttgat 15 <210> 124 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 124 Gly Gly Gly Gly Ser 1 5 <210> 125 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: "LAGLIDADG" motif sequence <400> 125 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 126 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (24)..(49) <223> a, c, t, g, unknown or other <400> 126 cagggatcca tgcactgtac gttnnnnnnn nnnnnnnnnn nnnnnnnnna accacttgac 60 tgcggatcct gg 72 <210> 127 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 127 Gly Gly Gly Ser 1 <210> 128 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 atcgcgcggt gaacagaatc tgcgcggtta taaccagcca acccggccag atggctccgc 60 cacgtgca 68 <210> 129 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 atcgcgcgtc cgatcgatcc tcccccttca taaccagcca acccggccag atggctccgc 60 cacgtgca 68 <210> 130 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 atcgcgcggt gaacagaatc tgcgcggtta taaccagctg aagggggagg agtccatggc 60 cacgtgca 68 <210> 131 <211> 246 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 131 ctgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 60 acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg 120 gtggccatcg ccagcaatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 180 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagcaatatt 240 ggtggc 246 <210> 132 <211> 332 <212> PRT <213> Xanthomonas sp. <400> 132 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 35 40 45 Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp 50 55 60 Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys 65 70 75 80 Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His 85 90 95 Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr 100 105 110 Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe 115 120 125 Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr 130 135 140 Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val 145 150 155 160 Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser 165 170 175 Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys 180 185 190 Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala 195 200 205 Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His 210 215 220 Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp 225 230 235 240 Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala 245 250 255 Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys 260 265 270 Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro 275 280 285 Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp 290 295 300 Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu 305 310 315 320 Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln 325 330 <210> 133 <211> 92 <212> DNA <213> Homo sapiens <400> 133 tcatctttgg ttttgtgggc aacatgctgg tcatcctcat cctgataaac tgcaaaaggc 60 tgaagagcat gactgacatc tacctgctca ac 92 <210> 134 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 134 tcatctttgg ttttgtgggc aacatgctgg tcatcctcat ctagatcagt gagtatgccc 60 tgatggcgtc tggactggat gcctcgtcta gaaaactgca aaaggctgaa gagcatgact 120 gacatctacc tgctcaac 138 <210> 135 <211> 840 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 135 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 1 5 10 15 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 20 25 30 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 35 40 45 Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala 50 55 60 Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp 65 70 75 80 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu 85 90 95 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala 100 105 110 Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn 115 120 125 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala 130 135 140 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 145 150 155 160 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 165 170 175 Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 180 185 190 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 195 200 205 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr 210 215 220 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 225 230 235 240 Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 245 250 255 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 260 265 270 Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 275 280 285 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala His 290 295 300 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 305 310 315 320 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 325 330 335 His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly 340 345 350 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 355 360 365 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His 370 375 380 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 385 390 395 400 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 405 410 415 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 420 425 430 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala 435 440 445 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 450 455 460 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val 465 470 475 480 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 485 490 495 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 500 505 510 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 515 520 525 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 530 535 540 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala 545 550 555 560 Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala 565 570 575 Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg 580 585 590 Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu 595 600 605 Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val 610 615 620 Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His 625 630 635 640 Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met 645 650 655 Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr Glu 660 665 670 Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp 675 680 685 Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr 690 695 700 Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser 705 710 715 720 Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp Gln 725 730 735 Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr 740 745 750 Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln Arg 755 760 765 Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr 770 775 780 Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp 785 790 795 800 Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro Phe 805 810 815 Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu Ala 820 825 830 Trp Leu Met Glu Leu Leu Pro Gln 835 840 <210> 136 <211> 253 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 136 ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60 gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120 cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180 ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240 caaaaagctt ggc 253 <210> 137 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 ctagtataaa taccttctgc cttactagta taaatacctt ctgccttgct agctcga 57 <210> 138 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 gagcggagcc atctggccgg gttggctggt tataaccgcg cagattctgt tcacgggact 60 cagagttgaa gc 72 <210> 139 <211> 86 <212> DNA <213> Homo sapiens <400> 139 tcaactctga gtcccgtgaa cagaatctgc gcggttataa ccagccaacc cggccagatg 60 gctccgcgct cagcgcctta acccct 86 <210> 140 <211> 86 <212> DNA <213> Homo sapiens <400> 140 aggggttaag gcgctgagcg cggagccatc tggccgggtt ggctggttat aaccgcgcag 60 attctgttca cgggactcag agttga 86 <210> 141 <211> 83 <212> DNA <213> Homo sapiens <400> 141 tcaactctga gtcccgtgaa cagaatctgc gcggttataa ccagccaacc cggccagatg 60 gctccgcgct cagcgcctta acc 83 <210> 142 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 tcaactctga gtcccgtgaa cagaatctgc gcggttataa caacca 46 <210> 143 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 tcaactctga gtcccgtgaa cagaatctgc gcggttatat ataacc 46 <210> 144 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 tcaactctga gtcccgtgaa cagaatctgc gcggttataa gccaac 46 <210> 145 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 tcaactctga gtcccgtgaa cagaatctgc gcggttatca gccaac 46 <210> 146 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 tcaactctga gtcccgtgaa cagaatctgc gcggttacca gccaac 46 <210> 147 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 tcaactctga gtcccgtgaa cagaatctgc gcggttccag ccaacc 46 <210> 148 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 tcaactctga gtcccgtgaa cagaatctgc gcggttatgc caaccc 46 <210> 149 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 tcaactctga gtcccgtgaa cagaatctgc gcggccaacc cggcca 46 <210> 150 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 tcaactctga gtcccgtgaa cagaatctgc gcggttaacc cggcca 46 <210> 151 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 tcaactctga gtcccgtgaa cagaatctgc gcggttataa cggcca 46 <210> 152 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 tcaactctga gtcccgtgaa cagaatctgc gcggtcaacc cggcca 46 <210> 153 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 tcaactctga gtcccgtgaa cagaatctgc gcagccaacc cggcca 46 <210> 154 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 tcaactctga gtcccgtgaa cagaatctgc ccagccaacc cggcca 46 <210> 155 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 tcaactctga gtcccgtgaa cagaatctgc gccaacccgg ccagat 46 <210> 156 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 tcaactctga gtcccgtgaa cagaatctgc gcgcccggcc agatgg 46 <210> 157 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 tcaactctga gtcccgtgaa cagaatctgc gcccggccag atggct 46 <210> 158 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 tcaactctga gtcccgtgaa cagaatctgc gcggccagat ggctcc 46 <210> 159 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 tcaactctga gtcccgtgaa cagaatctgc gcggtcagat ggctcc 46 <210> 160 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 tcaactctga gtcccgtgaa cagaatctgc gcggttataa ggctcc 46 <210> 161 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 tcaactctga gtcccgtgaa cagaatctgc gcggttatat ggctcc 46 <210> 162 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 tcaactctga gtcccgtgaa cagaatctgc ccggccagat ggctcc 46 <210> 163 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 tcaactctga gtcccgtgaa cagaatcaac ccggccagat ggctcc 46 <210> 164 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 tcaactctga gtcccgtgaa cagaaccaac ccggccagat ggctcc 46 <210> 165 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 tcaactctga gtcccgtgaa cagaatctgc gcgccagatg gctccg 46 <210> 166 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 tcaactctga gtcccgtgaa cagaatctgc gccagatggc tccgcg 46 <210> 167 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 tcaactctga gtcccgtgaa cagaatctgc gcggatggct ccgcgc 46 <210> 168 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 tcaactctga gtcccgtgaa cagaatctgc gcggttaccg cgctca 46 <210> 169 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 tcaactctga gtcccgtgaa cagaatctgc gcggttccgc gctcag 46 <210> 170 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 tcaactctga gtcccgtgaa caggatggct ccgcgctcag cgcctt 46 <210> 171 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 tcaactctga gtcccgtgaa cagaatggct ccgcgctcag cgcctt 46 <210> 172 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 tcaactctga gtcccgtgaa cagatggctc cgcgctcagc gcctta 46 <210> 173 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 tcaactctga gtcccgtgaa cagaatctcc gcgctcagcg ccttaa 46 <210> 174 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 tcaactctga gtcccgtgaa cagaatctgc gcgctcagcg ccttaa 46 <210> 175 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 tcaactctga gtcccgtgaa cagaatccgc gctcagcgcc ttaacc 46 <210> 176 <211> 5914 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 176 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctca 240 gaattaaccc tcactaaagg gactagtcct gcaggtttaa acgaattcgc ccttgatact 300 tattaaccat accttggagg ggaaatcaca catgaaaagt gtcatttctt tactaatcat 360 attcatgtct tttctcccca tagcaagaca aagacctgtt ttaaacacat ttacaaccta 420 tatgttgcct tgtactaggt aaaaagttgt acatttctga aataattttg gtatttctgt 480 tcagatcact aaactcaaga atcagcaatt ctctgaggct ttcttttaaa tatacataag 540 gaactttcgg agtgaaggga gagtttgtca ataacttgat gcatgtgaag gggagataaa 600 aaggttgcta tttttcatca acatattttg atttggcttt ctataattga tgggcttaaa 660 agatctaatc tactttaaac agatgccaaa taaatggatg aatcttagac cctctataac 720 agtaacttcc ttttaaaaaa gacctctccc accccacccc cagcccaggc tgtgtatgaa 780 aactaagcca tgtgcacaac tctgactggg tcaccagccc acttgagtcc gtgtcacaag 840 cccacagata tttcctgctc cccagtggat cgggtgtaaa ctgagcttgc tcgctcggga 900 gcctcttgct ggaaaataga acagcatttg cagaagcgtt tggcaatgtg cttttggaag 960 aagactaaga ggtagtttct gaacttctcc ccgacaaagg catagatgat ggggttgatg 1020 cagcagtgcg tcatcccaag agtctctgtc acctgcatag cttggtccaa cctgttagag 1080 ctactgcaat tattcaggcc aaagaattcc tggaaggtgt tcaggagaag gacaatgttg 1140 tagggagccc agaagagaaa ataaacaatc atgatggtga agataagcct cacagccctg 1200 tgcctcttct tctcatttcg acaccgaagc agagttttta ggattcccga gtagcagatg 1260 accatgacaa gcagcggcag gaccagcccc aagatgacta tctttaatgt ctggaaattc 1320 ttccagaatt gatactgact gtatggaaaa tgagagctgc aggtgtaatg aagaccttct 1380 ttttgagatc tggtaaagat gattcctggg agagacgcaa acacagccac cacccaagtg 1440 atcacacttg tcaccacccc aaaggtgacc gtcctggctt ttaaagcaaa cacagcatgg 1500 acgacagcca ggtacctatc gattgtcagg aggatgatga agaagattcc agagaagaag 1560 cctataaaat agagccctgt caagagttga cacattgtat ttccaaagtc ccactgggcg 1620 gcagcatagt gagcccagaa ggggacagta agaaggaaaa acaggtcaga gatggccagg 1680 ttgagcaggt agatgtcagt catgctcttc agccttttgc agttttctag acgaggcatc 1740 cagtccagac gccatcaggg catactcact gatctagatg aggatgacca gcatgttgcc 1800 cacaaaacca aagatgaaca ccagtgagta gagcggaggc aggaggcggg ctgcgatttg 1860 cttcacattg attttttggc agggctccga tgtataataa ttgatgtcat agattggact 1920 tgacacttga taatccatct tgttccaccc tgtgcataaa taaaaagtga tcttttataa 1980 agtcctagaa tgtatttagt tgccctccat gaatgcaaac tgttttatac atcaataggt 2040 ttttaattgc ctacatagat gtctacattg aattaactct ctttttggcc aagcaatgaa 2100 gttttgtagt gaagggaagg tttgctgcta gcttccctgt ccactagatg gagagcttgg 2160 ctctgttggg ggaattcatg aaagcaccat ctcaccaaat aaaatcttgt gctctatagc 2220 accatggagt gaatgaagct ttgacaacaa ttaagggcga attcgcggcc gctaaattca 2280 attcgcccta tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact 2340 gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 2400 ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctatacg 2460 tacggcagtt taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg 2520 tacagagtga tattattgac acgccggggc gacggatggt gatccccctg gccagtgcac 2580 gtctgctgtc agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa 2640 gctggcgcat gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag 2700 tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg 2760 gaatataaat gtcaggcatg agattatcaa aaaggatctt cacctagatc cttttcacgt 2820 agaaagccag tccgcagaaa cggtgctgac cccggatgaa tgtcagctac tgggctatct 2880 ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg cttacatggc 2940 gatagctaga ctgggcggtt ttatggacag caagcgaacc ggaattgcca gctggggcgc 3000 cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 3060 tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga 3120 ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 3180 atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 3240 aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag 3300 acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 3360 acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 3420 tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 3480 ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 3540 agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 3600 atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg 3660 aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3720 gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3780 cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3840 tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3900 agttcttctg aattattaac gcttacaatt tcctgatgcg gtattttctc cttacgcatc 3960 tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg cggaacccct 4020 atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagatt atcaaaaagg 4080 atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 4140 gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 4200 tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 4260 gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 4320 ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 4380 actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 4440 ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4500 tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4560 cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4620 ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4680 ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4740 tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4800 agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4860 atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4920 gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4980 aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 5040 tattgaagca tttatcaggg ttattgtctc atgaccaaaa tcccttaacg tgagttttcg 5100 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5160 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5220 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5280 ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5340 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5400 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5460 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5520 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5580 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5640 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5700 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5760 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5820 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5880 gagcgcagcg agtcagtgag cgaggaagcg gaag 5914 <210> 177 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 177 tcatctttgg ttttgtgggc aacatgctgg tcatcctcat ctagatcagt gagtatgccc 60 tgatggcgtc tggactggat gcctcgtcta gaaaactgca aaaggctgaa gagcatgact 120 gacatctacc tgctcaac 138 <210> 178 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 ttgacaatcc t 11 <210> 179 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 ttgaccatcc t 11 <210> 180 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 ttgacgatcc t 11 <210> 181 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 181 ttgactatcc t 11 <210> 182 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 182 ttgaccatcc t 11 <210> 183 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 183 ttgactatcc t 11 <210> 184 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 184 ttgacgatcc t 11 <210> 185 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 185 gcagctgccc agacct 16 <210> 186 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 186 gaccctgcct gct 13 <210> 187 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 187 gaccctgcct gctcct 16 <210> 188 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 188 cacctgcagc tgcccag 17 <210> 189 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 189 gggctctccc atgcat 16 <210> 190 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 190 tcctagaagg gcaggc 16 <210> 191 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 191 ctgggctctc ccat 14 <210> 192 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 192 cccccattcc tagaagg 17 <210> 193 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 193 ccgcaccccc agct 14 <210> 194 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 194 gctcctggcc cttgca 16 <210> 195 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 195 ggcactccgc accccca 17 <210> 196 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 196 accgctgtgc tcctggc 17 <210> 197 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 197 ggcactccgc acccc 15 <210> 198 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 198 taccgctgtg ctcct 15 <210> 199 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 199 acgccgtgga aaggcc 16 <210> 200 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 200 cggggatgat ctacgg 16 <210> 201 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 201 acgccgtgga aaggc 15 <210> 202 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 202 cggggatgat ctac 14 <210> 203 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 203 acgccgtgga aaggcc 16 <210> 204 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 204 cggggatgat ctac 14 <210> 205 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 205 cgttgccccc gccct 15 <210> 206 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 206 atgagcggcc ccgcc 15 <210> 207 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 207 gagcggcccc gcccgt 16 <210> 208 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 208 cgttgccccc gccct 15 <210> 209 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 209 atgagcggcc ccgcc 15 <210> 210 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 gaatcgttgc ccccgc 16 <210> 211 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 211 gagcggcccc gcccgt 16 <210> 212 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 212 gaatcgttgc ccccgc 16 <210> 213 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 213 tcccctccac cccacagtgg ggccactagg gacaggattg gtgacagaaa a 51 <210> 214 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 214 ttttctgtca ccaatcctgt ccctagtggc cccactgtgg ggtggagggg a 51 <210> 215 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 215 tccagcctga tggaacttat aagggagaaa gtgatttgca gttggaaaga a 51 <210> 216 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 216 ttctttccaa ctgcaaatca ctttctccct tataagttcc atcaggctgg a 51 <210> 217 <211> 5991 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 217 gactcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60 atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120 acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180 aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240 gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300 ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360 atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420 gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480 tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540 aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600 ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660 aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagctgatc 720 cactagtcca gtgtggtgga attcgccatg gactacaaag accatgacgg tgattataaa 780 gatcatgaca tcgattacaa ggatgacgat gacaagatgg cccccaagaa gaagaggaag 840 gtgggcattc acggggtacc cgccgctgtg gatctacgca cgctcggcta cagccagcag 900 caacaggaga agatcaaacc gaaggttcgt tcgacagtgg cgcagcacca cgaggcactg 960 gtcggccatg ggtttacaca cgcgcacatc gttgcgctca gccaacaccc ggcagcgtta 1020 gggaccgtcg ctgtcaagta tcaggacatg atcgcagcgt tgccagaggc gacacacgaa 1080 gcgatcgttg gcgtcggcaa acagtggtcc ggcgcacgcg ccctggaggc cttgctcacg 1140 gtggcgggag agttgagagg tccaccgtta cagttggaca caggccaact tctcaagatt 1200 gcaaaacgtg gcggcgtgac cgcagtggag gcagtgcatg catggcgcaa tgcactgacg 1260 ggggcccccc tgaaccttac tcccgaacaa gtagtagcga tagccagtaa taacggaggt 1320 aaacaagcct tggagacggt ccaaaggttg ctcccggtct tgtgtcaggc acatgggctg 1380 acgcctcaac aggtcgtcgc gatagcgtct aataatggag gaaagcaagc tctggaaacc 1440 gtccagcgac tccttccggt tctgtgccag gctcatggtc tgactccgca gcaagtcgtt 1500 gctatagcgt ccaacatcgg aggcaaacag gccctggaga ccgtgcagcg gttgttgcct 1560 gtgctttgcc aagcccacgg gcttacgcct gagcaagtgg tggcgattgc cagtaacaac 1620 ggcggcaaac aagcccttga gactgtgcag aggctcttgc cggtactctg ccaagcacac 1680 ggcttgaccc ccgagcaggt tgtagccata gctagtcacg acgggggtaa gcaagcgttg 1740 gaaacggtgc aagcacttct ccccgttctc tgtcaagcgc atggacttac cccggaacag 1800 gtggtcgcca ttgcaagcca tgatggagga aagcaggcgc tcgaaacagt ccaggcactt 1860 ttgcccgtac tttgtcaagc tcacggtctc accccggaac aggtggtagc cattgcatct 1920 aacatcggag gtaagcaagc attggaaacg gttcaggccc tgttgcctgt actttgccag 1980 gcgcacggtc tgacacctga gcaggttgtc gccatcgcta gcaacggagg tgggaaacag 2040 gcacttgaaa ctgtgcagag gcttctgccg gtgctgtgcc aagcgcatgg ccttacaccc 2100 gagcaagtag tggctattgc gagtcatgat ggaggcaagc aagcgctgga gactgtccaa 2160 cgacttcttc cggtcttgtg tcaggcacat ggattgaccc ctcaacaagt cgtggcgata 2220 gctagcaacg gcggtggaaa acaggccctc gaaaccgtcc agcgactgct ccccgtactg 2280 tgtcaagccc atggacttac cccagaacaa gttgtggcga ttgcctctaa caatggtggg 2340 aagcaagctc ttgagacggt gcaggcgttg ttgcccgtgc tttgtcaagc tcacgggctc 2400 acgccagagc aagtggtcgc tatcgcgagt aataaagggg gcaaacaagc cttggagaca 2460 gtgcaaaggc tcctgccagt gctctgccag gctcatggtt tgacacccga acaggtagtt 2520 gcaatagcga gtcatgatgg cggaaagcaa gctcttgaaa ctgtgcagcg gctgttgcct 2580 gtactgtgtc aagcccacgg gctgacaccg gaacaagttg tagcgatcgc tagccacgat 2640 ggcgggaaac aagctctgga aacggtacag agactcctcc cagtgctttg tcaggcacac 2700 ggcctcacgc cagagcaggt tgtcgccatc gcgtcaaaca atggtggaaa gcaggccctg 2760 gagacagtcc aacggttgct gccggtcctt tgccaggctc acgggttgac cccccagcag 2820 gtcgtggcca ttgcctcaaa caagggcggt aggccagcat tggagacggt gcagaggctt 2880 ctgcctgtgc tctgccaagc gcatggactc acccccgagc aagtggttgc tatcgcaagt 2940 aacaacggag ggaaacaagc gctcgaaacc gtgcaaaggt tgctccccgt tctctgtcag 3000 gcgcacggtc ttacgccaca acaggtggtg gcgattgcat ctaatggagg cggacgccct 3060 gccttggaga gcattgtggc ccagctgtcc aggccggacc ctgccctggc cgcgttaacc 3120 aacgaccacc tcgtcgcctt ggcctgcctc ggcggaggtt ctggcggcag cggatcccag 3180 ctggtgaaga gcgagctgga ggagaagaag tccgagctgc ggcacaagct gaagtacgtg 3240 ccccacgagt acatcgagct gatcgagatc gccaggaaca gcacccagga ccgcatcctg 3300 gagatgaagg tgatggagtt cttcatgaag gtgtacggct acaggggaaa gcacctgggc 3360 ggaagcagaa agcctgacgg cgccatctat acagtgggca gccccatcga ttacggcgtg 3420 atcgtggaca caaaggccta cagcggcggc tacaatctgc ctatcggcca ggccgacgag 3480 atgcagagat acgtggagga gaaccagacc cggaataagc acatcaaccc caacgagtgg 3540 tggaaggtgt accctagcag cgtgaccgag ttcaagttcc tgttcgtgag cggccacttc 3600 aagggcaact acaaggccca gctgaccagg ctgaaccaca tcaccaactg caatggcgcc 3660 gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaagccgg caccctgaca 3720 ctggaggagg tgcggcgcaa gttcaacaac ggcgagatca acttcagatc ttgataactc 3780 gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 3840 ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 3900 gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 3960 ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 4020 gctggggatg cggtgggctc tatggcttct actgggcggt tttatggaca gcaagcgaac 4080 cggaattgcc agctggggcg ccctctggta aggttgggaa gccctgcaaa gtaaactgga 4140 tggctttctc gccgccaagg atctgatggc gcaggggatc aagctctgat caagagacag 4200 gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 4260 gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 4320 ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 4380 gtgccctgaa tgaactgcaa gacgaggcag cgcggctatc gtggctggcc acgacgggcg 4440 ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 4500 gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 4560 tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 4620 accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 4680 aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 4740 aggcgagcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 4800 atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 4860 cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 4920 aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 4980 ccttctatcg ccttcttgac gagttcttct gaattattaa cgcttacaat ttcctgatgc 5040 ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacaggtg gcacttttcg 5100 gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 5160 gctcatgaga caataaccct gataaatgct tcaataatag cacgtgctaa aacttcattt 5220 ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 5280 acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 5340 agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 5400 ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 5460 cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 5520 gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 5580 cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 5640 gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 5700 caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 5760 aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 5820 tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 5880 gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 5940 ggccttttta cggttcctgg gcttttgctg gccttttgct cacatgttct t 5991 <210> 218 <211> 1008 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 218 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 195 200 205 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala 325 330 335 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 435 440 445 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 465 470 475 480 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg Pro Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys 725 730 735 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 740 745 750 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 755 760 765 Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp 770 775 780 Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys 785 790 795 800 Leu Gly Gly Gly Ser Gly Gly Ser Gly Ser Gln Leu Val Lys Ser Glu 805 810 815 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 820 825 830 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 835 840 845 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 850 855 860 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 865 870 875 880 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 885 890 895 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 900 905 910 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 915 920 925 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 930 935 940 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 945 950 955 960 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 965 970 975 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 980 985 990 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 1005 <210> 219 <211> 3024 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 219 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccgccgct 120 gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 180 cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 240 atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 300 atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 360 tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 420 ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 480 gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct tactcccgaa 540 caagtagtag cgatagccag taataacgga ggtaaacaag ccttggagac ggtccaaagg 600 ttgctcccgg tcttgtgtca ggcacatggg ctgacgcctc aacaggtcgt cgcgatagcg 660 tctaataatg gaggaaagca agctctggaa accgtccagc gactccttcc ggttctgtgc 720 caggctcatg gtctgactcc gcagcaagtc gttgctatag cgtccaacat cggaggcaaa 780 caggccctgg agaccgtgca gcggttgttg cctgtgcttt gccaagccca cgggcttacg 840 cctgagcaag tggtggcgat tgccagtaac aacggcggca aacaagccct tgagactgtg 900 cagaggctct tgccggtact ctgccaagca cacggcttga cccccgagca ggttgtagcc 960 atagctagtc acgacggggg taagcaagcg ttggaaacgg tgcaagcact tctccccgtt 1020 ctctgtcaag cgcatggact taccccggaa caggtggtcg ccattgcaag ccatgatgga 1080 ggaaagcagg cgctcgaaac agtccaggca cttttgcccg tactttgtca agctcacggt 1140 ctcaccccgg aacaggtggt agccattgca tctaacatcg gaggtaagca agcattggaa 1200 acggttcagg ccctgttgcc tgtactttgc caggcgcacg gtctgacacc tgagcaggtt 1260 gtcgccatcg ctagcaacgg aggtgggaaa caggcacttg aaactgtgca gaggcttctg 1320 ccggtgctgt gccaagcgca tggccttaca cccgagcaag tagtggctat tgcgagtcat 1380 gatggaggca agcaagcgct ggagactgtc caacgacttc ttccggtctt gtgtcaggca 1440 catggattga cccctcaaca agtcgtggcg atagctagca acggcggtgg aaaacaggcc 1500 ctcgaaaccg tccagcgact gctccccgta ctgtgtcaag cccatggact taccccagaa 1560 caagttgtgg cgattgcctc taacaatggt gggaagcaag ctcttgagac ggtgcaggcg 1620 ttgttgcccg tgctttgtca agctcacggg ctcacgccag agcaagtggt cgctatcgcg 1680 agtaataaag ggggcaaaca agccttggag acagtgcaaa ggctcctgcc agtgctctgc 1740 caggctcatg gtttgacacc cgaacaggta gttgcaatag cgagtcatga tggcggaaag 1800 caagctcttg aaactgtgca gcggctgttg cctgtactgt gtcaagccca cgggctgaca 1860 ccggaacaag ttgtagcgat cgctagccac gatggcggga aacaagctct ggaaacggta 1920 cagagactcc tcccagtgct ttgtcaggca cacggcctca cgccagagca ggttgtcgcc 1980 atcgcgtcaa acaatggtgg aaagcaggcc ctggagacag tccaacggtt gctgccggtc 2040 ctttgccagg ctcacgggtt gaccccccag caggtcgtgg ccattgcctc aaacaagggc 2100 ggtaggccag cattggagac ggtgcagagg cttctgcctg tgctctgcca agcgcatgga 2160 ctcacccccg agcaagtggt tgctatcgca agtaacaacg gagggaaaca agcgctcgaa 2220 accgtgcaaa ggttgctccc cgttctctgt caggcgcacg gtcttacgcc acaacaggtg 2280 gtggcgattg catctaatgg aggcggacgc cctgccttgg agagcattgt ggcccagctg 2340 tccaggccgg accctgccct ggccgcgtta accaacgacc acctcgtcgc cttggcctgc 2400 ctcggcggag gttctggcgg cagcggatcc cagctggtga agagcgagct ggaggagaag 2460 aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2520 atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2580 aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2640 tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2700 ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2760 acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2820 gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2880 aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2940 ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 3000 aacggcgaga tcaacttcag atct 3024 <210> 220 <211> 1036 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 220 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 210 215 220 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 225 230 235 240 Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Ile 245 250 255 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 260 265 270 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 275 280 285 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 290 295 300 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 305 310 315 320 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu 325 330 335 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 340 345 350 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 355 360 365 Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 370 375 380 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr 385 390 395 400 Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 405 410 415 Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu 420 425 430 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 435 440 445 Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 450 455 460 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 465 470 475 480 Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 485 490 495 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 500 505 510 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn 515 520 525 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu 530 535 540 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 545 550 555 560 Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 565 570 575 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 580 585 590 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 595 600 605 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 610 615 620 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 625 630 635 640 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 645 650 655 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 660 665 670 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 675 680 685 Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu 690 695 700 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 705 710 715 720 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 725 730 735 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 740 745 750 Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 755 760 765 Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro 770 775 780 Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu 785 790 795 800 Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala 805 810 815 Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser 820 825 830 His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys 835 840 845 Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile 850 855 860 Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu 865 870 875 880 Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys 885 890 895 His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly 900 905 910 Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly 915 920 925 Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val 930 935 940 Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp 945 950 955 960 Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser 965 970 975 Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His 980 985 990 Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile 995 1000 1005 Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 1010 1015 1020 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 1025 1030 1035 <210> 221 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 221 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaaccttac tcccgaacaa 540 gtagtagcga tagccagtaa taacggaggt aaacaagcct tggagacggt ccaaaggttg 600 ctcccggtct tgtgtcaggc acatgggctg acgcctcaac aggtcgtcgc gatagcgtct 660 aataatggag gaaagcaagc tctggaaacc gtccagcgac tccttccggt tctgtgccag 720 gctcatggtc tgactccgca gcaagtcgtt gctatagcgt ccaacatcgg aggcaaacag 780 gccctggaga ccgtgcagcg gttgttgcct gtgctttgcc aagcccacgg gcttacgcct 840 gagcaagtgg tggcgattgc cagtaacaac ggcggcaaac aagcccttga gactgtgcag 900 aggctcttgc cggtactctg ccaagcacac ggcttgaccc ccgagcaggt tgtagccata 960 gctagtcacg acgggggtaa gcaagcgttg gaaacggtgc aagcacttct ccccgttctc 1020 tgtcaagcgc atggacttac cccggaacag gtggtcgcca ttgcaagcca tgatggagga 1080 aagcaggcgc tcgaaacagt ccaggcactt ttgcccgtac tttgtcaagc tcacggtctc 1140 accccggaac aggtggtagc cattgcatct aacatcggag gtaagcaagc attggaaacg 1200 gttcaggccc tgttgcctgt actttgccag gcgcacggtc tgacacctga gcaggttgtc 1260 gccatcgcta gcaacggagg tgggaaacag gcacttgaaa ctgtgcagag gcttctgccg 1320 gtgctgtgcc aagcgcatgg ccttacaccc gagcaagtag tggctattgc gagtcatgat 1380 ggaggcaagc aagcgctgga gactgtccaa cgacttcttc cggtcttgtg tcaggcacat 1440 ggattgaccc ctcaacaagt cgtggcgata gctagcaacg gcggtggaaa acaggccctc 1500 gaaaccgtcc agcgactgct ccccgtactg tgtcaagccc atggacttac cccagaacaa 1560 gttgtggcga ttgcctctaa caatggtggg aagcaagctc ttgagacggt gcaggcgttg 1620 ttgcccgtgc tttgtcaagc tcacgggctc acgccagagc aagtggtcgc tatcgcgagt 1680 aataaagggg gcaaacaagc cttggagaca gtgcaaaggc tcctgccagt gctctgccag 1740 gctcatggtt tgacacccga acaggtagtt gcaatagcga gtcatgatgg cggaaagcaa 1800 gctcttgaaa ctgtgcagcg gctgttgcct gtactgtgtc aagcccacgg gctgacaccg 1860 gaacaagttg tagcgatcgc tagccacgat ggcgggaaac aagctctgga aacggtacag 1920 agactcctcc cagtgctttg tcaggcacac ggcctcacgc cagagcaggt tgtcgccatc 1980 gcgtcaaaca atggtggaaa gcaggccctg gagacagtcc aacggttgct gccggtcctt 2040 tgccaggctc acgggttgac cccccagcag gtcgtggcca ttgcctcaaa caagggcggt 2100 aggccagcat tggagacggt gcagaggctt ctgcctgtgc tctgccaagc gcatggactc 2160 acccccgagc aagtggttgc tatcgcaagt aacaacggag ggaaacaagc gctcgaaacc 2220 gtgcaaaggt tgctccccgt tctctgtcag gcgcacggtc ttacgccaca acaggtggtg 2280 gcgattgcat ctaatggagg cggacgccct gccttggaga gcattgtggc ccagctgtcc 2340 aggccggacc ctgccctggc cgcgttaacc aacgaccacc tcgtcgcctt ggcctgcctc 2400 ggcggacgtc ctgcgctgga tgcagtgaaa aagggattgc cgcacgcgcc ggccttgatc 2460 aaaagaacca atcgccgtat tcccgaacgc acatcccatc gcgttgccgg atcccagctg 2520 gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2580 cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2640 atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2700 agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2760 gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2820 cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2880 aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2940 ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 3000 ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 3060 gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 3108 <210> 222 <211> 1001 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 222 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 210 215 220 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 225 230 235 240 Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 245 250 255 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 260 265 270 Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser 275 280 285 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 290 295 300 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 305 310 315 320 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 325 330 335 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 340 345 350 Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 355 360 365 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 370 375 380 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr 385 390 395 400 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 405 410 415 Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 420 425 430 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 435 440 445 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 450 455 460 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 465 470 475 480 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 485 490 495 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 500 505 510 Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly 515 520 525 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 530 535 540 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 545 550 555 560 Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 565 570 575 Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 580 585 590 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 595 600 605 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 610 615 620 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 625 630 635 640 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 645 650 655 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 660 665 670 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 675 680 685 Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu 690 695 700 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 705 710 715 720 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 725 730 735 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 740 745 750 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 755 760 765 Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro 770 775 780 Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu 785 790 795 800 Gly Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu 805 810 815 Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile 820 825 830 Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val 835 840 845 Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly 850 855 860 Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile 865 870 875 880 Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn 885 890 895 Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn 900 905 910 Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr 915 920 925 Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe 930 935 940 Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn 945 950 955 960 Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu 965 970 975 Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe 980 985 990 Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 223 <211> 3003 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 223 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acctatggtg 120 gacttgagga cactcggtta ttcgcaacag caacaggaga aaatcaagcc taaggtcagg 180 agcaccgtcg cgcaacacca cgaggcgctt gtggggcatg gcttcactca tgcgcatatt 240 gtcgcgcttt cacagcaccc tgcggcgctt gggacggtgg ctgtcaaata ccaagatatg 300 attgcggccc tgcccgaagc cacgcacgag gcaattgtag gggtcggtaa acagtggtcg 360 ggagcgcgag cacttgaggc gctgctgact gtggcgggtg agcttagggg gcctccgctc 420 cagctcgaca ccgggcagct gctgaagatc gcgaagagag ggggagtaac agcggtagag 480 gcagtgcacg cctggcgcaa tgcgctcacc ggggccccct tgaatcttac tccagagcag 540 gtcgtcgcaa tcgcgtcgaa taacggggga aagcaagcac tggaaaccgt gcagaggttg 600 ttgccggtct tgtgtcaggc tcacggcttg acacctgccc aagtggtggc cattgcgtcg 660 aacatcgggg gaaaacaggc acttgaaaca gtccagagac ttttgcccgt cctctgccag 720 gcgcacggcc tcacgccgga tcaggtggta gccatcgcgt caaacatcgg agggaagcag 780 gctctggaaa cggtgcagcg gcttttgccg gtactttgcc aagctcatgg gctcacgcca 840 gcccaagtgg tagctatcgc atcgcacgac ggagggaagc aggccttgga gacagtgcaa 900 cggctcctcc ccgtgttgtg ccaggcacat gggttgactc cagagcaggt cgtagcaatc 960 gcctccaata tcgggggaaa gcaagcgttg gagacagtgc agcgactgct gcctgtgctt 1020 tgccaggctc atggcctgac gcccgatcag gtagtggcaa tcgcgtcaaa caaaggtgga 1080 aagcaggcac tcgaaacggt acagcgcttg ctgcccgtct tgtgtcaggc ccacggtctg 1140 acacccgacc aggtagtcgc gattgcgtcg aacatcgggg gaaagcaagc gttggaaacg 1200 gtacaacgcc tgctcccggt gctctgccag gctcatggac ttacacccga gcaggtggtc 1260 gccatcgcgt caaacatcgg aggcaaacag gcattggaga cagtgcagcg ccttctccca 1320 gtcttgtgtc aggcccacgg tctgacaccc gaccaggtcg tcgcgattgc atcgaatgga 1380 ggtgggaaac aggcccttga gacagtacag aggcttttgc ccgtgttgtg ccaggcccac 1440 ggactcacac ccgaacaagt cgtcgccatt gccagccatg atggaggtaa acaggcactt 1500 gagactgtcc agcgcctcct gccggtgctg tgccaagcac atgggctgac cccgcagcaa 1560 gtcgtagcga tcgcctcgaa tggtggagga aaacaagcgc ttgaaaccgt ccagaggttg 1620 ctcccggtgc tgtgccaggc acatggcctt acgcctgaac aagtagtcgc gattgccagc 1680 aacaaaggcg gaaaacaggc tctcgaaacg gtccagcggt tgctgccggt gttgtgccag 1740 gcgcacggtc ttacaccgga ccaggtggtg gcgattgcct cccacgatgg gggtaaacag 1800 gcactggaaa ccgtgcagag attgctccca gtactttgtc aggcacatgg tctgactcct 1860 gctcaagtgg tcgcgatcgc ctcgaacaat ggcggaaagc aggcgctcga aacggtacag 1920 cggctccttc cggtgctctg ccaagcccac ggattgacgc cagaacaggt cgtggcaatt 1980 gcgtcacacg acggtggaaa gcaggcgctc gaaactgtgc aaagactcct gcccgtactc 2040 tgccaggcac acggtttgac tccccagcag gtagtggcca tcgcgagcaa taagggagga 2100 aagcaggcgc ttgaaacggt gcagagactt ctgcccgtgc tttgtcaagc ccacgggctg 2160 actccggagc aggtagtggc catcgcctca aacaacggag gaaagcaagc tctcgaaacc 2220 gtacagaggc ttctccccgt gctctgtcag gcccacgggt tgacccccga acaggtggtc 2280 gccattgcta gcaacggggg aggacggcca gccttggagt ccatcgtagc ccaattgtcc 2340 aggcccgatc ccgcgttggc tgcgttaacg aatgaccatc tggtggcgtt ggcatgtctt 2400 ggtggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2460 ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2520 gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2580 aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2640 gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2700 caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2760 cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2820 agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2880 tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2940 ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 3000 tct 3003 <210> 224 <211> 1036 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 224 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 210 215 220 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 225 230 235 240 Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 245 250 255 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 260 265 270 Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser 275 280 285 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 290 295 300 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 305 310 315 320 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 325 330 335 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 340 345 350 Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 355 360 365 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 370 375 380 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr 385 390 395 400 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 405 410 415 Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 420 425 430 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 435 440 445 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 450 455 460 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 465 470 475 480 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 485 490 495 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 500 505 510 Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly 515 520 525 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 530 535 540 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 545 550 555 560 Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 565 570 575 Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 580 585 590 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 595 600 605 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 610 615 620 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 625 630 635 640 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 645 650 655 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 660 665 670 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 675 680 685 Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu 690 695 700 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 705 710 715 720 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 725 730 735 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 740 745 750 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 755 760 765 Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro 770 775 780 Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu 785 790 795 800 Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala 805 810 815 Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser 820 825 830 His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys 835 840 845 Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile 850 855 860 Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu 865 870 875 880 Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys 885 890 895 His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly 900 905 910 Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly 915 920 925 Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val 930 935 940 Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp 945 950 955 960 Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser 965 970 975 Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His 980 985 990 Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile 995 1000 1005 Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 1010 1015 1020 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 1025 1030 1035 <210> 225 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 225 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acctatggtg 120 gacttgagga cactcggtta ttcgcaacag caacaggaga aaatcaagcc taaggtcagg 180 agcaccgtcg cgcaacacca cgaggcgctt gtggggcatg gcttcactca tgcgcatatt 240 gtcgcgcttt cacagcaccc tgcggcgctt gggacggtgg ctgtcaaata ccaagatatg 300 attgcggccc tgcccgaagc cacgcacgag gcaattgtag gggtcggtaa acagtggtcg 360 ggagcgcgag cacttgaggc gctgctgact gtggcgggtg agcttagggg gcctccgctc 420 cagctcgaca ccgggcagct gctgaagatc gcgaagagag ggggagtaac agcggtagag 480 gcagtgcacg cctggcgcaa tgcgctcacc ggggccccct tgaatcttac tccagagcag 540 gtcgtcgcaa tcgcgtcgaa taacggggga aagcaagcac tggaaaccgt gcagaggttg 600 ttgccggtct tgtgtcaggc tcacggcttg acacctgccc aagtggtggc cattgcgtcg 660 aacatcgggg gaaaacaggc acttgaaaca gtccagagac ttttgcccgt cctctgccag 720 gcgcacggcc tcacgccgga tcaggtggta gccatcgcgt caaacatcgg agggaagcag 780 gctctggaaa cggtgcagcg gcttttgccg gtactttgcc aagctcatgg gctcacgcca 840 gcccaagtgg tagctatcgc atcgcacgac ggagggaagc aggccttgga gacagtgcaa 900 cggctcctcc ccgtgttgtg ccaggcacat gggttgactc cagagcaggt cgtagcaatc 960 gcctccaata tcgggggaaa gcaagcgttg gagacagtgc agcgactgct gcctgtgctt 1020 tgccaggctc atggcctgac gcccgatcag gtagtggcaa tcgcgtcaaa caaaggtgga 1080 aagcaggcac tcgaaacggt acagcgcttg ctgcccgtct tgtgtcaggc ccacggtctg 1140 acacccgacc aggtagtcgc gattgcgtcg aacatcgggg gaaagcaagc gttggaaacg 1200 gtacaacgcc tgctcccggt gctctgccag gctcatggac ttacacccga gcaggtggtc 1260 gccatcgcgt caaacatcgg aggcaaacag gcattggaga cagtgcagcg ccttctccca 1320 gtcttgtgtc aggcccacgg tctgacaccc gaccaggtcg tcgcgattgc atcgaatgga 1380 ggtgggaaac aggcccttga gacagtacag aggcttttgc ccgtgttgtg ccaggcccac 1440 ggactcacac ccgaacaagt cgtcgccatt gccagccatg atggaggtaa acaggcactt 1500 gagactgtcc agcgcctcct gccggtgctg tgccaagcac atgggctgac cccgcagcaa 1560 gtcgtagcga tcgcctcgaa tggtggagga aaacaagcgc ttgaaaccgt ccagaggttg 1620 ctcccggtgc tgtgccaggc acatggcctt acgcctgaac aagtagtcgc gattgccagc 1680 aacaaaggcg gaaaacaggc tctcgaaacg gtccagcggt tgctgccggt gttgtgccag 1740 gcgcacggtc ttacaccgga ccaggtggtg gcgattgcct cccacgatgg gggtaaacag 1800 gcactggaaa ccgtgcagag attgctccca gtactttgtc aggcacatgg tctgactcct 1860 gctcaagtgg tcgcgatcgc ctcgaacaat ggcggaaagc aggcgctcga aacggtacag 1920 cggctccttc cggtgctctg ccaagcccac ggattgacgc cagaacaggt cgtggcaatt 1980 gcgtcacacg acggtggaaa gcaggcgctc gaaactgtgc aaagactcct gcccgtactc 2040 tgccaggcac acggtttgac tccccagcag gtagtggcca tcgcgagcaa taagggagga 2100 aagcaggcgc ttgaaacggt gcagagactt ctgcccgtgc tttgtcaagc ccacgggctg 2160 actccggagc aggtagtggc catcgcctca aacaacggag gaaagcaagc tctcgaaacc 2220 gtacagaggc ttctccccgt gctctgtcag gcccacgggt tgacccccga acaggtggtc 2280 gccattgcta gcaacggggg aggacggcca gccttggagt ccatcgtagc ccaattgtcc 2340 aggcccgatc ccgcgttggc tgcgttaacg aatgaccatc tggtggcgtt ggcatgtctt 2400 ggtggacgac ccgcgctcga tgcagtcaaa aagggtctgc ctcatgctcc cgcattgatc 2460 aaaagaacca accggcggat tcccgagaga acttcccatc gagtcgcggg atcccagctg 2520 gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2580 cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2640 atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2700 agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2760 gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2820 cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2880 aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2940 ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 3000 ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 3060 gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 3108 <210> 226 <211> 829 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 226 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu 625 630 635 640 Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr 645 650 655 Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu 660 665 670 Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly 675 680 685 Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val 690 695 700 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser 705 710 715 720 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr 725 730 735 Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp 740 745 750 Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val 755 760 765 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn 770 775 780 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu 785 790 795 800 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val 805 810 815 Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 820 825 <210> 227 <211> 2487 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 227 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga tcccagctgg tgaagagcga gctggaggag 1920 aagaagtccg agctgcggca caagctgaag tacgtgcccc acgagtacat cgagctgatc 1980 gagatcgcca ggaacagcac ccaggaccgc atcctggaga tgaaggtgat ggagttcttc 2040 atgaaggtgt acggctacag gggaaagcac ctgggcggaa gcagaaagcc tgacggcgcc 2100 atctatacag tgggcagccc catcgattac ggcgtgatcg tggacacaaa ggcctacagc 2160 ggcggctaca atctgcctat cggccaggcc gacgagatgc agagatacgt ggaggagaac 2220 cagacccgga ataagcacat caaccccaac gagtggtgga aggtgtaccc tagcagcgtg 2280 accgagttca agttcctgtt cgtgagcggc cacttcaagg gcaactacaa ggcccagctg 2340 accaggctga accacatcac caactgcaat ggcgccgtgc tgagcgtgga ggagctgctg 2400 atcggcggcg agatgatcaa agccggcacc ctgacactgg aggaggtgcg gcgcaagttc 2460 aacaacggcg agatcaactt cagatct 2487 <210> 228 <211> 840 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 228 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly 625 630 635 640 Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 645 650 655 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 660 665 670 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 675 680 685 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 690 695 700 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 705 710 715 720 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 725 730 735 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 740 745 750 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 755 760 765 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 770 775 780 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 785 790 795 800 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 805 810 815 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 820 825 830 Asn Gly Glu Ile Asn Phe Arg Ser 835 840 <210> 229 <211> 2520 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 229 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 1980 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2040 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2100 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2160 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2220 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2280 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2340 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2400 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2460 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2520 <210> 230 <211> 851 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 230 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly 625 630 635 640 Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Gly Ser Gln Leu Val 645 650 655 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 660 665 670 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 675 680 685 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 690 695 700 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 705 710 715 720 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 725 730 735 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 740 745 750 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 755 760 765 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 770 775 780 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 785 790 795 800 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 805 810 815 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 820 825 830 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 835 840 845 Phe Arg Ser 850 <210> 231 <211> 2553 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 231 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920 ttgccgcacg cgccggcctt gatcaaaaga accggatccc agctggtgaa gagcgagctg 1980 gaggagaaga agtccgagct gcggcacaag ctgaagtacg tgccccacga gtacatcgag 2040 ctgatcgaga tcgccaggaa cagcacccag gaccgcatcc tggagatgaa ggtgatggag 2100 ttcttcatga aggtgtacgg ctacagggga aagcacctgg gcggaagcag aaagcctgac 2160 ggcgccatct atacagtggg cagccccatc gattacggcg tgatcgtgga cacaaaggcc 2220 tacagcggcg gctacaatct gcctatcggc caggccgacg agatgcagag atacgtggag 2280 gagaaccaga cccggaataa gcacatcaac cccaacgagt ggtggaaggt gtaccctagc 2340 agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggcc 2400 cagctgacca ggctgaacca catcaccaac tgcaatggcg ccgtgctgag cgtggaggag 2460 ctgctgatcg gcggcgagat gatcaaagcc ggcaccctga cactggagga ggtgcggcgc 2520 aagttcaaca acggcgagat caacttcaga tct 2553 <210> 232 <211> 864 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 232 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly 625 630 635 640 Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro 645 650 655 Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu 660 665 670 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 675 680 685 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 690 695 700 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 705 710 715 720 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 725 730 735 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 740 745 750 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 755 760 765 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 770 775 780 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 785 790 795 800 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 805 810 815 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 820 825 830 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 835 840 845 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 850 855 860 <210> 233 <211> 2592 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 233 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920 ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980 catcgcgttg ccggatccca gctggtgaag agcgagctgg aggagaagaa gtccgagctg 2040 cggcacaagc tgaagtacgt gccccacgag tacatcgagc tgatcgagat cgccaggaac 2100 agcacccagg accgcatcct ggagatgaag gtgatggagt tcttcatgaa ggtgtacggc 2160 tacaggggaa agcacctggg cggaagcaga aagcctgacg gcgccatcta tacagtgggc 2220 agccccatcg attacggcgt gatcgtggac acaaaggcct acagcggcgg ctacaatctg 2280 cctatcggcc aggccgacga gatgcagaga tacgtggagg agaaccagac ccggaataag 2340 cacatcaacc ccaacgagtg gtggaaggtg taccctagca gcgtgaccga gttcaagttc 2400 ctgttcgtga gcggccactt caagggcaac tacaaggccc agctgaccag gctgaaccac 2460 atcaccaact gcaatggcgc cgtgctgagc gtggaggagc tgctgatcgg cggcgagatg 2520 atcaaagccg gcaccctgac actggaggag gtgcggcgca agttcaacaa cggcgagatc 2580 aacttcagat ct 2592 <210> 234 <211> 880 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 234 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly 625 630 635 640 Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro 645 650 655 Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val 660 665 670 Leu Gly Phe Phe Gln Cys His Ser Gly Ser Gln Leu Val Lys Ser Glu 675 680 685 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 690 695 700 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 705 710 715 720 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 725 730 735 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 740 745 750 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 755 760 765 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 770 775 780 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 785 790 795 800 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 805 810 815 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 820 825 830 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 835 840 845 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 850 855 860 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 865 870 875 880 <210> 235 <211> 2640 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 235 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920 ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980 catcgcgttg ccgaccacgc gcaagtggtt cgcgtgctgg gttttttcca gtgccactcc 2040 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2100 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2160 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2220 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2280 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2340 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2400 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2460 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2520 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2580 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2640 <210> 236 <211> 896 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 236 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser 35 40 45 Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala 50 55 60 Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile 65 70 75 80 Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys 85 90 95 Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile 100 105 110 Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu 115 120 125 Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr 130 135 140 Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu 145 150 155 160 Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu 165 170 175 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln 180 185 190 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 195 200 205 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys 210 215 220 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 225 230 235 240 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 245 250 255 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 260 265 270 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 275 280 285 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 290 295 300 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 305 310 315 320 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 325 330 335 Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 340 345 350 Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 355 360 365 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val 370 375 380 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 385 390 395 400 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 405 410 415 Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr 420 425 430 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 435 440 445 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 450 455 460 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 465 470 475 480 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 485 490 495 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 500 505 510 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly 515 520 525 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 530 535 540 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 545 550 555 560 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 565 570 575 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 580 585 590 Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser 595 600 605 Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala 610 615 620 Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly 625 630 635 640 Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro 645 650 655 Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val 660 665 670 Leu Gly Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp 675 680 685 Ala Met Thr Gln Phe Gly Met Ser Gly Ser Gln Leu Val Lys Ser Glu 690 695 700 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 705 710 715 720 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 725 730 735 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 740 745 750 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 755 760 765 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 770 775 780 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 785 790 795 800 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 805 810 815 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 820 825 830 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 835 840 845 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 850 855 860 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 865 870 875 880 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 885 890 895 <210> 237 <211> 2688 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 237 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120 gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180 tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240 gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300 atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360 ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420 cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480 gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540 gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660 aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720 catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780 ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960 agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020 caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140 gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260 gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440 accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560 gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740 ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800 gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860 cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920 ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980 catcgcgttg ccgaccacgc gcaagtggtt cgcgtgctgg gttttttcca gtgccactcc 2040 cacccagcgc aagcatttga tgacgccatg acgcagttcg ggatgagcgg atcccagctg 2100 gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2160 cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2220 atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2280 agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2340 gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2400 cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2460 aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2520 ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 2580 ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 2640 gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 2688 <210> 238 <211> 5667 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 238 gactcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60 atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120 acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180 aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240 gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300 ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360 atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420 gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480 tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540 aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600 ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660 aattaatacg actcactata gggagagcca agctgactag cgtttaaact taagctgatc 720 cactagtcca gtgtggtgga attcgccatg gactacaaag accatgacgg tgattataaa 780 gatcatgaca tcgattacaa ggatgacgat gacaagatgg cccccaagaa gaagaggaag 840 gtgggcattc accgcggggt acctatggtg gacttgagga cactcggtta ttcgcaacag 900 caacaggaga aaatcaagcc taaggtcagg agcaccgtcg cgcaacacca cgaggcgctt 960 gtggggcatg gcttcactca tgcgcatatt gtcgcgcttt cacagcaccc tgcggcgctt 1020 gggacggtgg ctgtcaaata ccaagatatg attgcggccc tgcccgaagc cacgcacgag 1080 gcaattgtag gggtcggtaa acagtggtcg ggagcgcgag cacttgaggc gctgctgact 1140 gtggcgggtg agcttagggg gcctccgctc cagctcgaca ccgggcagct gctgaagatc 1200 gcgaagagag ggggagtaac agcggtagag gcagtgcacg cctggcgcaa tgcgctcacc 1260 ggggccccct tgaacctgac cccagaccag gtagtcgcaa tcgccaacaa taacggggga 1320 aagcaagccc tggaaaccgt gcaaaggttg ttgccggtcc tttgtcaaga ccacggcctt 1380 acaccggagc aagtcgtggc cattgcatca catgacggtg gcaaacaggc tcttgagacg 1440 gttcagagac ttctcccagt tctctgtcaa gcccacgggc tgactcccga tcaagttgta 1500 gcgattgcga gcaatggggg agggaaacaa gcattggaga ctgtccaacg gctccttccc 1560 gtgttgtgtc aagcccacgg tttgacgcct gcacaagtgg tcgccatcgc caacaacaac 1620 ggcggtaagc aggcgctgga aacagtacag cgcctgctgc ctgtactgtg ccaggatcat 1680 ggactcaccc cagaccaggt agtcgcaatc gccaacaata acgggggaaa gcaagccctg 1740 gaaaccgtgc aaaggttgtt gccggtcctt tgtcaagacc acggccttac accggagcaa 1800 gtcgtggcca ttgcatcaaa cggaggtggc aaacaggctc ttgagacggt tcagagactt 1860 ctcccagttc tctgtcaagc ccacgggctg actcccgatc aagttgtagc gattgcgagc 1920 catgatggag ggaaacaagc attggagact gtccaacggc tccttcccgt gttgtgtcaa 1980 gcccacggtt tgacgcctgc acaagtggtc gccatcgcct ccaatattgg cggtaagcag 2040 gcgctggaaa cagtacagcg cctgctgcct gtactgtgcc aggatcatgg gctgacccca 2100 gaccaggtag tcgcaatcgc gtcgaatggc gggggaaagc aagccctgga aaccgtgcaa 2160 aggttgttgc cggtcctttg tcaagaccac ggccttacac cggagcaagt cgtggccatt 2220 gcatcacatg acggtggcaa acaggctctt gagacggttc agagacttct cccagttctc 2280 tgtcaagccc acgggctgac tcccgatcaa gttgtagcga ttgcgagcca tgatggaggg 2340 aaacaagcat tggagactgt ccaacggctc cttcccgtgt tgtgtcaagc ccacggtttg 2400 acgcctgcac aagtggtcgc catcgcctcc aacggtggcg gtaagcaggc gctggaaaca 2460 gtacagcgcc tgctgcctgt actgtgccag gatcatggtt tgaccccaga ccaggtagtc 2520 gcaatcgcgt cgcatgacgg gggaaagcaa gccctggaaa ccgtgcaaag gttgttgccg 2580 gtcctttgtc aagaccacgg ccttacgcct gcacaagtgg tcgccatcgc ctccaatatt 2640 ggcggtaagc aggcgctgga aacagtacag cgcctgctgc ctgtactgtg ccaggatcat 2700 ggcctgacac ccgaacaggt ggtcgccatt gctagcaacg ggggaggacg gccagccttg 2760 gagtccatcg tagcccaatt gtccaggccc gatcccgcgt tggctgcgtt aacgaatgac 2820 catctggtgg cgttggcatg tcttggtgga tcccagctgg tgaagagcga gctggaggag 2880 aagaagtccg agctgcggca caagctgaag tacgtgcccc acgagtacat cgagctgatc 2940 gagatcgcca ggaacagcac ccaggaccgc atcctggaga tgaaggtgat ggagttcttc 3000 atgaaggtgt acggctacag gggaaagcac ctgggcggaa gcagaaagcc tgacggcgcc 3060 atctatacag tgggcagccc catcgattac ggcgtgatcg tggacacaaa ggcctacagc 3120 ggcggctaca atctgcctat cggccaggcc gacgagatgc agagatacgt ggaggagaac 3180 cagacccgga ataagcacat caaccccaac gagtggtgga aggtgtaccc tagcagcgtg 3240 accgagttca agttcctgtt cgtgagcggc cacttcaagg gcaactacaa ggcccagctg 3300 accaggctga accacatcac caactgcaat ggcgccgtgc tgagcgtgga ggagctgctg 3360 atcggcggcg agatgatcaa agccggcacc ctgacactgg aggaggtgcg gcgcaagttc 3420 aacaacggcg agatcaactt cagatcttga taactcgagt ctagagggcc cgtttaaacc 3480 cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3540 gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3600 attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3660 agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3720 gcttctactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct 3780 ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttctcgccg ccaaggatct 3840 gatggcgcag gggatcaagc tctgatcaag agacaggatg aggatcgttt cgcatgattg 3900 aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 3960 actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 4020 ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg 4080 aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 4140 ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 4200 tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 4260 tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 4320 gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 4380 aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg 4440 atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 4500 tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 4560 tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 4620 tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 4680 tcttctgaat tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt 4740 gcggtatttc acaccgcata caggtggcac ttttcgggga aatgtgcgcg gaacccctat 4800 ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 4860 aatgcttcaa taatagcacg tgctaaaact tcatttttaa tttaaaagga tctaggtgaa 4920 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 4980 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 5040 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 5100 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 5160 ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 5220 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 5280 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 5340 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 5400 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 5460 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 5520 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 5580 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctgggctt 5640 ttgctggcct tttgctcaca tgttctt 5667 <210> 239 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 239 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 240 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 240 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 241 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 241 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 242 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 242 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 243 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 243 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 244 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 244 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660 aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggac catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 245 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 245 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 246 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 246 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660 aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 247 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 247 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 248 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 248 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacagg cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 249 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 249 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 250 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 250 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacagg cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 251 <211> 968 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 251 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 770 775 780 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 785 790 795 800 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 805 810 815 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 820 825 830 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 835 840 845 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 850 855 860 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 865 870 875 880 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 885 890 895 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 900 905 910 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 915 920 925 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 930 935 940 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 945 950 955 960 Asn Gly Glu Ile Asn Phe Arg Ser 965 <210> 252 <211> 2904 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 252 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatctaat atcggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340 aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400 atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460 aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520 tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580 ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640 acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700 gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760 aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820 ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880 aacggcgaga tcaacttcag atct 2904 <210> 253 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 253 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 254 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 254 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatctaat atcggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340 cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400 cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460 cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520 acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580 aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640 cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700 atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760 atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820 ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880 accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940 aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000 ttcagatct 3009 <210> 255 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 255 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 256 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 256 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380 aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaatgg cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 257 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 257 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 258 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 258 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380 aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaatgg cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcttga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 259 <211> 832 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 259 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu 625 630 635 640 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 645 650 655 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 660 665 670 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 675 680 685 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 690 695 700 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 705 710 715 720 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 725 730 735 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 740 745 750 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 755 760 765 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 770 775 780 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 785 790 795 800 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 805 810 815 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 820 825 830 <210> 260 <211> 2496 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 260 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380 aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920 ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980 gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040 gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100 gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160 gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220 gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280 agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340 gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400 gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460 cgcaagttca acaacggcga gatcaacttc agatct 2496 <210> 261 <211> 867 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 261 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val 625 630 635 640 Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg 645 650 655 Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val 660 665 670 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 675 680 685 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 690 695 700 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 705 710 715 720 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 725 730 735 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 740 745 750 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 755 760 765 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 770 775 780 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 785 790 795 800 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 805 810 815 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 820 825 830 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 835 840 845 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 850 855 860 Phe Arg Ser 865 <210> 262 <211> 2601 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 262 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380 aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920 aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980 agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040 tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100 gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160 gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220 acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280 tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340 cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400 ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460 ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520 ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580 ggcgagatca acttcagatc t 2601 <210> 263 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 263 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 264 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 264 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaacgg tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 265 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 265 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 266 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 266 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaacgg tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 267 <211> 866 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 267 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 245 250 255 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys 660 665 670 Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr 675 680 685 Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr 690 695 700 Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val 705 710 715 720 Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly 725 730 735 Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp 740 745 750 Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp 755 760 765 Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile 770 775 780 Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe 785 790 795 800 Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln 805 810 815 Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser 820 825 830 Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu 835 840 845 Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 850 855 860 Arg Ser 865 <210> 268 <211> 2598 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 268 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagccatga tggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040 gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100 aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160 tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220 gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280 aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340 aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400 aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460 aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520 gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580 gagatcaact tcagatct 2598 <210> 269 <211> 901 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 269 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 245 250 255 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 660 665 670 Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr 675 680 685 Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln 690 695 700 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 705 710 715 720 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg 725 730 735 Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe 740 745 750 Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys 755 760 765 Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val 770 775 780 Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly 785 790 795 800 Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn 805 810 815 Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val 820 825 830 Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr 835 840 845 Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala 850 855 860 Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala 865 870 875 880 Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu 885 890 895 Ile Asn Phe Arg Ser 900 <210> 270 <211> 2703 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 270 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagccatga tggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380 ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040 gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100 gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160 ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220 gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280 aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340 gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400 caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460 cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520 agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580 tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640 ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700 tct 2703 <210> 271 <211> 832 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 271 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu 625 630 635 640 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 645 650 655 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 660 665 670 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 675 680 685 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 690 695 700 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 705 710 715 720 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 725 730 735 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 740 745 750 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 755 760 765 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 770 775 780 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 785 790 795 800 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 805 810 815 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 820 825 830 <210> 272 <211> 2496 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 272 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tcccacgacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920 ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980 gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040 gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100 gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160 gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220 gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280 agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340 gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400 gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460 cgcaagttca acaacggcga gatcaacttc agatct 2496 <210> 273 <211> 867 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 273 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val 625 630 635 640 Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg 645 650 655 Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val 660 665 670 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 675 680 685 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 690 695 700 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 705 710 715 720 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 725 730 735 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 740 745 750 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 755 760 765 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 770 775 780 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 785 790 795 800 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 805 810 815 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 820 825 830 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 835 840 845 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 850 855 860 Phe Arg Ser 865 <210> 274 <211> 2601 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 274 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tcccacgacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920 aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980 agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040 tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100 gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160 gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220 acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280 tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340 cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400 ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460 ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520 ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580 ggcgagatca acttcagatc t 2601 <210> 275 <211> 968 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 275 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 770 775 780 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 785 790 795 800 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 805 810 815 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 820 825 830 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 835 840 845 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 850 855 860 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 865 870 875 880 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 885 890 895 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 900 905 910 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 915 920 925 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 930 935 940 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 945 950 955 960 Asn Gly Glu Ile Asn Phe Arg Ser 965 <210> 276 <211> 2904 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 276 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggacca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaat atcggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgaata acaatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340 aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400 atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460 aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520 tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580 ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640 acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700 gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760 aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820 ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880 aacggcgaga tcaacttcag atct 2904 <210> 277 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 277 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 278 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 278 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaat atcggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgaata acaatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340 cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400 cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460 cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520 acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580 aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640 cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700 atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760 atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820 ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880 accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940 aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000 ttcagatct 3009 <210> 279 <211> 866 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 279 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys 660 665 670 Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr 675 680 685 Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr 690 695 700 Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val 705 710 715 720 Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly 725 730 735 Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp 740 745 750 Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp 755 760 765 Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile 770 775 780 Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe 785 790 795 800 Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln 805 810 815 Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser 820 825 830 Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu 835 840 845 Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 850 855 860 Arg Ser 865 <210> 280 <211> 2598 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 280 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040 gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100 aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160 tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220 gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280 aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340 aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400 aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460 aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520 gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580 gagatcaact tcagatct 2598 <210> 281 <211> 901 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 281 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 660 665 670 Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr 675 680 685 Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln 690 695 700 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 705 710 715 720 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg 725 730 735 Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe 740 745 750 Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys 755 760 765 Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val 770 775 780 Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly 785 790 795 800 Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn 805 810 815 Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val 820 825 830 Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr 835 840 845 Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala 850 855 860 Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala 865 870 875 880 Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu 885 890 895 Ile Asn Phe Arg Ser 900 <210> 282 <211> 2703 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 282 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040 gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100 gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160 ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220 gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280 aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340 gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400 caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460 cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520 agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580 tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640 ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700 tct 2703 <210> 283 <211> 968 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 283 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 770 775 780 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 785 790 795 800 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 805 810 815 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 820 825 830 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 835 840 845 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 850 855 860 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 865 870 875 880 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 885 890 895 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 900 905 910 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 915 920 925 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 930 935 940 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 945 950 955 960 Asn Gly Glu Ile Asn Phe Arg Ser 965 <210> 284 <211> 2904 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 284 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagcc atgatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc caatattggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340 aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400 atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460 aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520 tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580 ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640 acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700 gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760 aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820 ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880 aacggcgaga tcaacttcag atct 2904 <210> 285 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 285 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 286 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 286 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagcc atgatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc caatattggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340 cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400 cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460 cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520 acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580 aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640 cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700 atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760 atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820 ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880 accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940 aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000 ttcagatct 3009 <210> 287 <211> 866 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 287 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys 660 665 670 Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr 675 680 685 Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr 690 695 700 Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val 705 710 715 720 Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly 725 730 735 Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp 740 745 750 Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp 755 760 765 Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile 770 775 780 Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe 785 790 795 800 Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln 805 810 815 Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser 820 825 830 Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu 835 840 845 Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe 850 855 860 Arg Ser 865 <210> 288 <211> 2598 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 288 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgaa taacaatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040 gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100 aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160 tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220 gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280 aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340 aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400 aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460 aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520 gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580 gagatcaact tcagatct 2598 <210> 289 <211> 901 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 289 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile 625 630 635 640 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 645 650 655 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp 660 665 670 Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr 675 680 685 Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln 690 695 700 Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys 705 710 715 720 Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg 725 730 735 Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe 740 745 750 Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys 755 760 765 Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val 770 775 780 Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly 785 790 795 800 Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn 805 810 815 Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val 820 825 830 Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr 835 840 845 Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala 850 855 860 Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala 865 870 875 880 Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu 885 890 895 Ile Asn Phe Arg Ser 900 <210> 290 <211> 2703 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 290 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380 gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgaa taacaatgga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860 cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920 gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980 gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040 gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100 gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160 ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220 gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280 aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340 gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400 caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460 cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520 agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580 tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640 ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700 tct 2703 <210> 291 <211> 832 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 291 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Thr Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu 625 630 635 640 Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro 645 650 655 His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp 660 665 670 Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly 675 680 685 Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile 690 695 700 Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys 705 710 715 720 Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met 725 730 735 Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro 740 745 750 Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe 755 760 765 Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr 770 775 780 Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu 785 790 795 800 Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu 805 810 815 Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 820 825 830 <210> 292 <211> 2496 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 292 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660 aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaaa cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920 ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980 gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040 gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100 gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160 gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220 gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280 agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340 gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400 gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460 cgcaagttca acaacggcga gatcaacttc agatct 2496 <210> 293 <211> 867 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 293 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala 595 600 605 Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His 610 615 620 Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val 625 630 635 640 Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg 645 650 655 Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val 660 665 670 Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys 675 680 685 Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser 690 695 700 Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys 705 710 715 720 Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp 725 730 735 Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val 740 745 750 Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala 755 760 765 Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His 770 775 780 Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu 785 790 795 800 Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala 805 810 815 Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu 820 825 830 Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr 835 840 845 Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn 850 855 860 Phe Arg Ser 865 <210> 294 <211> 2601 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 294 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660 aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800 ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860 acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920 aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980 agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040 tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100 gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160 gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220 acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280 tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340 cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400 ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460 ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520 ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580 ggcgagatca acttcagatc t 2601 <210> 295 <211> 968 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 295 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu 770 775 780 Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu 785 790 795 800 Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met 805 810 815 Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly 820 825 830 Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp 835 840 845 Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu 850 855 860 Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln 865 870 875 880 Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro 885 890 895 Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys 900 905 910 Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys 915 920 925 Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met 930 935 940 Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn 945 950 955 960 Asn Gly Glu Ile Asn Phe Arg Ser 965 <210> 296 <211> 2904 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 296 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340 aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400 atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460 aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520 tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580 ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640 acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700 gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760 aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820 ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880 aacggcgaga tcaacttcag atct 2904 <210> 297 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 297 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 298 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 298 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860 ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920 cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980 attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040 ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100 ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160 ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220 tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280 ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340 cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400 cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460 cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520 acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580 aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640 cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700 atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760 atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820 ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880 accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940 aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000 ttcagatct 3009 <210> 299 <211> 900 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 299 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu 690 695 700 Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu 705 710 715 720 Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn 725 730 735 Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met 740 745 750 Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro 755 760 765 Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile 770 775 780 Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln 785 790 795 800 Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys 805 810 815 His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr 820 825 830 Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys 835 840 845 Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val 850 855 860 Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly 865 870 875 880 Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile 885 890 895 Asn Phe Arg Ser 900 <210> 300 <211> 2700 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 300 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaacatcg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160 aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220 cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280 cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340 tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400 gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460 aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520 ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580 aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640 accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700 <210> 301 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 301 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 302 <211> 2805 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 302 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120 gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180 aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240 attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300 atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360 tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420 ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480 gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540 caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600 ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660 tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720 caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780 caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840 cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900 cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960 atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020 ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080 ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140 ctgactcccg atcaagttgt agcgattgcg agcaacatcg gagggaaaca agcattggag 1200 actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260 gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320 cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380 attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440 cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500 cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560 caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620 ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680 tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740 caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800 caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860 cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920 cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980 attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040 cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100 ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160 agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220 aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280 gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340 aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400 agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460 gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520 agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580 gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640 aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700 agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760 gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805 <210> 303 <211> 8245 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 303 taatacgact cactataggg agacccaagc tggctagctt aagctgatcc actagtccag 60 tgtggtggaa ttcgctagcg ccaccatggc ccccaagaag aagaggaagg tgggaatcga 120 tggggtaccc gccgctgtgg atctacgcac gctcggctac agccagcagc aacaggagaa 180 gatcaaaccg aaggttcgtt cgacagtggc gcagcaccac gaggcactgg tcggccatgg 240 gtttacacac gcgcacatcg ttgcgctcag ccaacacccg gcagcgttag ggaccgtcgc 300 tgtcaagtat caggacatga tcgcagcgtt gccagaggcg acacacgaag cgatcgttgg 360 cgtcggcaaa cagtggtccg gcgcacgcgc cctggaggcc ttgctcacgg tggcgggaga 420 gttgagaggt ccaccgttac agttggacac aggccaactt ctcaagattg caaaacgtgg 480 cggcgtgacc gcagtggagg cagtgcatgc atggcgcaat gcactgacgg gggcccccct 540 gaacctgacc ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct 600 ggagacggtg cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggagca 660 ggtggtggcc atcgccagca atggcggcaa gcaggcgctg gagacggtgc agcggctgtt 720 gccggtgctg tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcaa 780 tattggtggc aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc 840 ccatggcctg accccggagc aggtggtggc catcgccagc aatattggtg gcaagcaggc 900 gctggagacg gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccggc 960 acaggtggtg gccatcgcca gcaatattgg cggcaagcag gcgctggaga cggtgcagcg 1020 gctgttgccg gtgctgcgcc aggcccatgg cctgaccccg gagcaggtcg tggccatcgc 1080 cagcaatggc ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca 1140 ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc agcaatattg gcggcaagca 1200 ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc 1260 ggagcaggtc gtggccatcg ccagccacga tggcggcaag caggcgctgg agacggtgca 1320 gcggctgttg ccggtgctgt gccaggccca tggcctgacc ccggagcagg tggtggccat 1380 cgccagccac gatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct 1440 gtgccaggcc catggcctga ccccggacca ggtggtggcc atcgccagca atggcggtgg 1500 caagcaggcg ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct 1560 gaccccggac caggtggtgg ccatcgccag caatggcggt ggcaagcagg cgctggagac 1620 ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg agcaggtggt 1680 ggccatcgcc agccacgatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc 1740 ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatgg 1800 cggcggcagg ccggcgctgg agagcattgt tgcccagtta tctcgccctg atccggcgtt 1860 ggccgcgtta accaacgacc acctcgtcgc cttggcctgc ctcggcggac gtcctgcgct 1920 ggatgcagtg aaaaagggat tgccgcacgc gccggccttg atcaaaagaa ccaatcgccg 1980 tattcccgaa cgcacatccc atcgcgttgc cgaccacgcg caagtggttc gcgtgctggg 2040 ttttttccag tgccactccc acccagcgca agcatttgat gacgccatga cgcagttcgg 2100 gatgagcagg cacgggttgt tacagctctt tcgcagagtg ggcgtcaccg aactcgaagc 2160 ccgcagtgga acgctccccc cagcctcgca gcgttgggac cgtatcctcc aggcatcagg 2220 gatgaaaagg gccaaaccgt cccctacttc aactcaaacg ccggaccagg cgtctttgca 2280 tgcattcgcc gattcgctgg agcgtgacct tgatgcgccc agcccaacgc acgagggaga 2340 tcagaggcgg gcaagcagcc gtaaacggtc ccgatcggat cgtgctgtca ccggtccctc 2400 cgcacagcaa tcgttcgagg tgcgcgctcc cgaacagcgc gatgcgctgc atttgcccct 2460 cagttggagg gtaaaacgcc cgcgtaccag tatcgggggc ggcctcccgg atcctggtac 2520 gcccacggct gccgacctgg cagcgtccag caccgtgatg cgggaacaag atgaggaccc 2580 cttcgcaggg gcagcggatg atttcccggc attcaacgaa gaggagctcg catggttgat 2640 ggagctattg cctcaggacc gcggccgcgc ccccccgacc gatgtcagcc tgggggacga 2700 gctccactta gacggcgagg acgtggcgat ggcgcatgcc gacgcgctag acgatttcga 2760 tctggacatg ttgggggacg gggattcccc gggtccggga tttacccccc acgactccgc 2820 cccctacggc gctctggata tggccgactt cgagtttgag cagatgttta ccgatgccct 2880 tggaattgac gagtacggtg gcggccgcga ctacaaggac gacgatgaca agtaagcttc 2940 tcgagtctag ctagtttaaa cccgctgatc agcctcgact gtgccttcta gttgccagcc 3000 atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt 3060 cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct 3120 ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc 3180 tggggatgcg gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg 3240 gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3300 cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 3360 tctcgccacg ttcgccggct ttccccgtca agctctaaat cggggcatcc ctttagggtt 3420 ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 3480 tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 3540 taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 3600 tgatttataa gggattttgg ggatttcggc ctattggtta aaaaatgagc tgatttaaca 3660 aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca 3720 ggctccccag gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg 3780 tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 3840 agcaaccata gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc 3900 ccattctccg ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc 3960 tgcctctgag ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa 4020 aaagctcccg ggagcttgta tatccatttt cggatctgat caagagacag gatgaggatc 4080 gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4140 gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4200 gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4260 tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4320 agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4380 ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4440 tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4500 acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 4560 ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4620 gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4680 ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4740 tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4800 ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4860 ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4920 cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4980 ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 5040 ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 5100 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 5160 ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa 5220 tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 5280 cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 5340 attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 5400 tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 5460 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 5520 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 5580 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 5640 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 5700 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 5760 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 5820 caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 5880 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5940 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 6000 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 6060 actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 6120 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 6180 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 6240 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 6300 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 6360 atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 6420 gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 6480 atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 6540 ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 6600 cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 6660 agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 6720 cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 6780 tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 6840 agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 6900 gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 6960 gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 7020 ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 7080 tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 7140 tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 7200 gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 7260 caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 7320 atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 7380 gtcgacggat cgggagatct cccgatcccc tatggtcgac tctcagtaca atctgctctg 7440 atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 7500 gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 7560 tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 7620 attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 7680 atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 7740 acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 7800 tccattgacg tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag 7860 tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 7920 attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 7980 tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 8040 ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 8100 accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 8160 gcggtaggcg tgtacggtgg gaggtctata taagcagagc tctctggcta actagagaac 8220 ccactgctta ctggcttatc gaaat 8245 <210> 304 <211> 1105 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 304 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 130 135 140 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 145 150 155 160 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 165 170 175 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 180 185 190 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 195 200 205 Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 210 215 220 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 225 230 235 240 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 245 250 255 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 260 265 270 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 275 280 285 Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln 290 295 300 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 305 310 315 320 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu 325 330 335 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 340 345 350 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro 355 360 365 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 370 375 380 Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 385 390 395 400 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 405 410 415 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 420 425 430 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 435 440 445 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 450 455 460 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 465 470 475 480 Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 485 490 495 Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 500 505 510 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln 515 520 525 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 530 535 540 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 545 550 555 560 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 565 570 575 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 580 585 590 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 595 600 605 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 610 615 620 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 625 630 635 640 Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile 645 650 655 Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu Glu Thr Val Gln Arg Leu 660 665 670 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 675 680 685 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 690 695 700 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 705 710 715 720 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser 725 730 735 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 740 745 750 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu 755 760 765 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg 770 775 780 Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His 785 790 795 800 Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro 805 810 815 Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg His 820 825 830 Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala 835 840 845 Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu 850 855 860 Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Thr Gln 865 870 875 880 Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg 885 890 895 Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp Gln Arg Arg Ala 900 905 910 Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser 915 920 925 Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln Arg Asp Ala Leu 930 935 940 His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Ser Ile Gly 945 950 955 960 Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp Leu Ala Ala 965 970 975 Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro Phe Ala Gly Ala 980 985 990 Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu Ala Trp Leu Met 995 1000 1005 Glu Leu Leu Pro Gln Asp Arg Gly Arg Ala Pro Pro Thr Asp Val 1010 1015 1020 Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met 1025 1030 1035 Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly 1040 1045 1050 Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala 1055 1060 1065 Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met 1070 1075 1080 Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp 1085 1090 1095 Tyr Lys Asp Asp Asp Asp Lys 1100 1105 <210> 305 <211> 3315 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 305 atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60 gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120 cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180 gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240 tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300 ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360 gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa ccttactccc 420 gaacaagtag tagcgatagc cagtaataac ggaggtaaac aagccttgga gacggtccaa 480 aggttgctcc cggtcttgtg tcaggcacat gggctgacgc ctcaacaggt cgtcgcgata 540 gcgtctaata atggaggaaa gcaagctctg gaaaccgtcc agcgactcct tccggttctg 600 tgccaggctc atggtctgac tccgcagcaa gtcgttgcta tagcgtccaa catcggaggc 660 aaacaggccc tggagaccgt gcagcggttg ttgcctgtgc tttgccaagc ccacgggctt 720 acgcctgagc aagtggtggc gattgccagt aacaacggcg gcaaacaagc ccttgagact 780 gtgcagaggc tcttgccggt actctgccaa gcacacggct tgacccccga gcaggttgta 840 gccatagcta gtcacgacgg gggtaagcaa gcgttggaaa cggtgcaagc acttctcccc 900 gttctctgtc aagcgcatgg acttaccccg gaacaggtgg tcgccattgc aagccatgat 960 ggaggaaagc aggcgctcga aacagtccag gcacttttgc ccgtactttg tcaagctcac 1020 ggtctcaccc cggaacaggt ggtagccatt gcatctaaca tcggaggtaa gcaagcattg 1080 gaaacggttc aggccctgtt gcctgtactt tgccaggcgc acggtctgac acctgagcag 1140 gttgtcgcca tcgctagcaa cggaggtggg aaacaggcac ttgaaactgt gcagaggctt 1200 ctgccggtgc tgtgccaagc gcatggcctt acacccgagc aagtagtggc tattgcgagt 1260 catgatggag gcaagcaagc gctggagact gtccaacgac ttcttccggt cttgtgtcag 1320 gcacatggat tgacccctca acaagtcgtg gcgatagcta gcaacggcgg tggaaaacag 1380 gccctcgaaa ccgtccagcg actgctcccc gtactgtgtc aagcccatgg acttacccca 1440 gaacaagttg tggcgattgc ctctaacaat ggtgggaagc aagctcttga gacggtgcag 1500 gcgttgttgc ccgtgctttg tcaagctcac gggctcacgc cagagcaagt ggtcgctatc 1560 gcgagtaata aagggggcaa acaagccttg gagacagtgc aaaggctcct gccagtgctc 1620 tgccaggctc atggtttgac acccgaacag gtagttgcaa tagcgagtca tgatggcgga 1680 aagcaagctc ttgaaactgt gcagcggctg ttgcctgtac tgtgtcaagc ccacgggctg 1740 acaccggaac aagttgtagc gatcgctagc cacgatggcg ggaaacaagc tctggaaacg 1800 gtacagagac tcctcccagt gctttgtcag gcacacggcc tcacgccaga gcaggttgtc 1860 gccatcgcgt caaacaatgg tggaaagcag gccctggaga cagtccaacg gttgctgccg 1920 gtcctttgcc aggctcacgg gttgaccccc cagcaggtcg tggccattgc ctcaaacaag 1980 ggcggtaggc cagcattgga gacggtgcag aggcttctgc ctgtgctctg ccaagcgcat 2040 ggactcaccc ccgagcaagt ggttgctatc gcaagtaaca acggagggaa acaagcgctc 2100 gaaaccgtgc aaaggttgct ccccgttctc tgtcaggcgc acggtcttac gccacaacag 2160 gtggtggcga ttgcatctaa tggaggcgga cgccctgcct tggagagcat tgtggcccag 2220 ctgtccaggc cggaccctgc cctggccgcg ttaaccaacg accacctcgt cgccttggcc 2280 tgcctcggcg gacgtcctgc gctggatgca gtgaaaaagg gattgccgca cgcgccggcc 2340 ttgatcaaaa gaaccaatcg ccgtattccc gaacgcacat cccatcgcgt tgccgaccac 2400 gcgcaagtgg ttcgcgtgct gggttttttc cagtgccact cccacccagc gcaagcattt 2460 gatgacgcca tgacgcagtt cgggatgagc aggcacgggt tgttacagct ctttcgcaga 2520 gtgggcgtca ccgaactcga agcccgcagt ggaacgctcc ccccagcctc gcagcgttgg 2580 gaccgtatcc tccaggcatc agggatgaaa agggccaaac cgtcccctac ttcaactcaa 2640 acgccggacc aggcgtcttt gcatgcattc gccgattcgc tggagcgtga ccttgatgcg 2700 cccagcccaa cgcacgaggg agatcagagg cgggcaagca gccgtaaacg gtcccgatcg 2760 gatcgtgctg tcaccggtcc ctccgcacag caatcgttcg aggtgcgcgc tcccgaacag 2820 cgcgatgcgc tgcatttgcc cctcagttgg agggtaaaac gcccgcgtac cagtatcggg 2880 ggcggcctcc cggatcctgg tacgcccacg gctgccgacc tggcagcgtc cagcaccgtg 2940 atgcgggaac aagatgagga ccccttcgca ggggcagcgg atgatttccc ggcattcaac 3000 gaagaggagc tcgcatggtt gatggagcta ttgcctcagg accgcggccg cgcccccccg 3060 accgatgtca gcctggggga cgagctccac ttagacggcg aggacgtggc gatggcgcat 3120 gccgacgcgc tagacgattt cgatctggac atgttggggg acggggattc cccgggtccg 3180 ggatttaccc cccacgactc cgccccctac ggcgctctgg atatggccga cttcgagttt 3240 gagcagatgt ttaccgatgc ccttggaatt gacgagtacg gtggcggccg cgactacaag 3300 gacgacgatg acaag 3315 <210> 306 <211> 939 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 306 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile Asp Gly Val Pro Ala 1 5 10 15 Ala Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 20 25 30 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 35 40 45 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 50 55 60 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 65 70 75 80 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 85 90 95 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 100 105 110 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 115 120 125 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 130 135 140 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 145 150 155 160 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 165 170 175 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 180 185 190 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 195 200 205 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 210 215 220 Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 225 230 235 240 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 245 250 255 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 260 265 270 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 275 280 285 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 290 295 300 Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln 305 310 315 320 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 325 330 335 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu 340 345 350 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 355 360 365 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro 370 375 380 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 385 390 395 400 Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 405 410 415 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 420 425 430 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 435 440 445 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 450 455 460 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 465 470 475 480 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 485 490 495 Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 500 505 510 Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 515 520 525 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln 530 535 540 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His 545 550 555 560 Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly 565 570 575 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 580 585 590 Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp 595 600 605 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 610 615 620 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 625 630 635 640 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 645 650 655 Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile 660 665 670 Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu Glu Thr Val Gln Arg Leu 675 680 685 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val 690 695 700 Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 705 710 715 720 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln 725 730 735 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser 740 745 750 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 755 760 765 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu 770 775 780 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg 785 790 795 800 Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His 805 810 815 Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro 820 825 830 Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Gly Ser 835 840 845 Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His 850 855 860 Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp 865 870 875 880 Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe 885 890 895 Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe 900 905 910 Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly 915 920 925 Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys 930 935 <210> 307 <211> 2817 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 307 atggccccca agaagaagag gaaggtggga atcgatgggg tacccgccgc tgtggatcta 60 cgcacgctcg gctacagcca gcagcaacag gagaagatca aaccgaaggt tcgttcgaca 120 gtggcgcagc accacgaggc actggtcggc catgggttta cacacgcgca catcgttgcg 180 ctcagccaac acccggcagc gttagggacc gtcgctgtca agtatcagga catgatcgca 240 gcgttgccag aggcgacaca cgaagcgatc gttggcgtcg gcaaacagtg gtccggcgca 300 cgcgccctgg aggccttgct cacggtggcg ggagagttga gaggtccacc gttacagttg 360 gacacaggcc aacttctcaa gattgcaaaa cgtggcggcg tgaccgcagt ggaggcagtg 420 catgcatggc gcaatgcact gacgggggcc cccctgaacc ttactcccga acaagtagta 480 gcgatagcca gtaataacgg aggtaaacaa gccttggaga cggtccaaag gttgctcccg 540 gtcttgtgtc aggcacatgg gctgacgcct caacaggtcg tcgcgatagc gtctaataat 600 ggaggaaagc aagctctgga aaccgtccag cgactccttc cggttctgtg ccaggctcat 660 ggtctgactc cgcagcaagt cgttgctata gcgtccaaca tcggaggcaa acaggccctg 720 gagaccgtgc agcggttgtt gcctgtgctt tgccaagccc acgggcttac gcctgagcaa 780 gtggtggcga ttgccagtaa caacggcggc aaacaagccc ttgagactgt gcagaggctc 840 ttgccggtac tctgccaagc acacggcttg acccccgagc aggttgtagc catagctagt 900 cacgacgggg gtaagcaagc gttggaaacg gtgcaagcac ttctccccgt tctctgtcaa 960 gcgcatggac ttaccccgga acaggtggtc gccattgcaa gccatgatgg aggaaagcag 1020 gcgctcgaaa cagtccaggc acttttgccc gtactttgtc aagctcacgg tctcaccccg 1080 gaacaggtgg tagccattgc atctaacatc ggaggtaagc aagcattgga aacggttcag 1140 gccctgttgc ctgtactttg ccaggcgcac ggtctgacac ctgagcaggt tgtcgccatc 1200 gctagcaacg gaggtgggaa acaggcactt gaaactgtgc agaggcttct gccggtgctg 1260 tgccaagcgc atggccttac acccgagcaa gtagtggcta ttgcgagtca tgatggaggc 1320 aagcaagcgc tggagactgt ccaacgactt cttccggtct tgtgtcaggc acatggattg 1380 acccctcaac aagtcgtggc gatagctagc aacggcggtg gaaaacaggc cctcgaaacc 1440 gtccagcgac tgctccccgt actgtgtcaa gcccatggac ttaccccaga acaagttgtg 1500 gcgattgcct ctaacaatgg tgggaagcaa gctcttgaga cggtgcaggc gttgttgccc 1560 gtgctttgtc aagctcacgg gctcacgcca gagcaagtgg tcgctatcgc gagtaataaa 1620 gggggcaaac aagccttgga gacagtgcaa aggctcctgc cagtgctctg ccaggctcat 1680 ggtttgacac ccgaacaggt agttgcaata gcgagtcatg atggcggaaa gcaagctctt 1740 gaaactgtgc agcggctgtt gcctgtactg tgtcaagccc acgggctgac accggaacaa 1800 gttgtagcga tcgctagcca cgatggcggg aaacaagctc tggaaacggt acagagactc 1860 ctcccagtgc tttgtcaggc acacggcctc acgccagagc aggttgtcgc catcgcgtca 1920 aacaatggtg gaaagcaggc cctggagaca gtccaacggt tgctgccggt cctttgccag 1980 gctcacgggt tgacccccca gcaggtcgtg gccattgcct caaacaaggg cggtaggcca 2040 gcattggaga cggtgcagag gcttctgcct gtgctctgcc aagcgcatgg actcaccccc 2100 gagcaagtgg ttgctatcgc aagtaacaac ggagggaaac aagcgctcga aaccgtgcaa 2160 aggttgctcc ccgttctctg tcaggcgcac ggtcttacgc cacaacaggt ggtggcgatt 2220 gcatctaatg gaggcggacg ccctgccttg gagagcattg tggcccagct gtccaggccg 2280 gaccctgccc tggccgcgtt aaccaacgac cacctcgtcg ccttggcctg cctcggcgga 2340 cgtcctgcgc tggatgcagt gaaaaaggga ttgccgcacg cgccggcctt gatcaaaaga 2400 accaatcgcc gtattcccga acgcacatcc catcgcgttg ccgaccacgc gcaagtggtt 2460 cgcgtgctgg gttttttcca gtgccactcc cacccagcgc aagcatttga tgacgccatg 2520 acgcagttcg ggatgagcgg atcccgcggc cgcgcccccc cgaccgatgt cagcctgggg 2580 gacgagctcc acttagacgg cgaggacgtg gcgatggcgc atgccgacgc gctagacgat 2640 ttcgatctgg acatgttggg ggacggggat tccccgggtc cgggatttac cccccacgac 2700 tccgccccct acggcgctct ggatatggcc gacttcgagt ttgagcagat gtttaccgat 2760 gcccttggaa ttgacgagta cggtggcggc cgcgactaca aggacgacga tgacaag 2817 <210> 308 <211> 949 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 308 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile Asp Gly Val Pro Ala 1 5 10 15 Ala Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 20 25 30 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 35 40 45 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 50 55 60 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 65 70 75 80 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 85 90 95 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 100 105 110 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 115 120 125 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 130 135 140 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 145 150 155 160 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 165 170 175 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 180 185 190 Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 195 200 205 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 210 215 220 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 225 230 235 240 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 245 250 255 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 260 265 270 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 275 280 285 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 290 295 300 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala 305 310 315 320 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 325 330 335 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 340 345 350 Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile 355 360 365 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 370 375 380 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 385 390 395 400 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 405 410 415 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 420 425 430 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 435 440 445 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 450 455 460 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 465 470 475 480 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 485 490 495 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 500 505 510 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 515 520 525 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 530 535 540 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 545 550 555 560 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro 565 570 575 Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu 580 585 590 Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly 595 600 605 Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala 610 615 620 Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg 625 630 635 640 Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys 645 650 655 His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly 660 665 670 Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr 675 680 685 Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp 690 695 700 Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro 705 710 715 720 Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp 725 730 735 Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp 740 745 750 Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val 755 760 765 Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln 770 775 780 Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg 785 790 795 800 Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala 805 810 815 Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro 820 825 830 Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu 835 840 845 Ala Trp Leu Met Glu Leu Leu Pro Gln Asp Arg Gly Arg Ala Pro Pro 850 855 860 Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val 865 870 875 880 Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 885 890 895 Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala 900 905 910 Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe 915 920 925 Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp Tyr Lys 930 935 940 Asp Asp Asp Asp Lys 945 <210> 309 <211> 2847 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 309 atggccccca agaagaagag gaaggtggga atcgatgggg tacccgccgc tgtggatcta 60 cgcacgctcg gctacagcca gcagcaacag gagaagatca aaccgaaggt tcgttcgaca 120 gtggcgcagc accacgaggc actggtcggc catgggttta cacacgcgca catcgttgcg 180 ctcagccaac acccggcagc gttagggacc gtcgctgtca agtatcagga catgatcgca 240 gcgttgccag aggcgacaca cgaagcgatc gttggcgtcg gcaaacagtg gtccggcgca 300 cgcgccctgg aggccttgct cacggtggcg ggagagttga gaggtccacc gttacagttg 360 gacacaggcc aacttctcaa gattgcaaaa cgtggcggcg tgaccgcagt ggaggcagtg 420 catgcatggc gcaatgcact gacgggggcc cccctgaacc tgaccccgga gcaggtggtg 480 gccatcgcca gcaatattgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 540 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagcaatggc 600 ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc 660 ctgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 720 acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg 780 gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca gcggctgttg 840 ccggtgctgt gccaggccca tggcctgacc ccggcacagg tggtggccat cgccagcaat 900 attggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gcgccaggcc 960 catggcctga ccccggagca ggtcgtggcc atcgccagca atggcggcaa gcaggcgctg 1020 gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggcacag 1080 gtggtggcca tcgccagcaa tattggcggc aagcaggcgc tggagacggt gcagcggctg 1140 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtcgtggc catcgccagc 1200 cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1260 gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gccacgatgg cggcaagcag 1320 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1380 gaccaggtgg tggccatcgc cagcaatggc ggtggcaagc aggcgctgga gacggtgcag 1440 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggaccaggt ggtggccatc 1500 gccagcaatg gcggtggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1560 tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1620 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1680 accccggagc aggtggtggc catcgccagc aatggcggcg gcaggccggc gctggagagc 1740 attgttgccc agttatctcg ccctgatccg gcgttggccg cgttaaccaa cgaccacctc 1800 gtcgccttgg cctgcctcgg cggacgtcct gcgctggatg cagtgaaaaa gggattgccg 1860 cacgcgccgg ccttgatcaa aagaaccaat cgccgtattc ccgaacgcac atcccatcgc 1920 gttgccgacc acgcgcaagt ggttcgcgtg ctgggttttt tccagtgcca ctcccaccca 1980 gcgcaagcat ttgatgacgc catgacgcag ttcgggatga gcaggcacgg gttgttacag 2040 ctctttcgca gagtgggcgt caccgaactc gaagcccgca gtggaacgct ccccccagcc 2100 tcgcagcgtt gggaccgtat cctccaggca tcagggatga aaagggccaa accgtcccct 2160 acttcaactc aaacgccgga ccaggcgtct ttgcatgcat tcgccgattc gctggagcgt 2220 gaccttgatg cgcccagccc aacgcacgag ggagatcaga ggcgggcaag cagccgtaaa 2280 cggtcccgat cggatcgtgc tgtcaccggt ccctccgcac agcaatcgtt cgaggtgcgc 2340 gctcccgaac agcgcgatgc gctgcatttg cccctcagtt ggagggtaaa acgcccgcgt 2400 accagtatcg ggggcggcct cccggatcct ggtacgccca cggctgccga cctggcagcg 2460 tccagcaccg tgatgcggga acaagatgag gaccccttcg caggggcagc ggatgatttc 2520 ccggcattca acgaagagga gctcgcatgg ttgatggagc tattgcctca ggaccgcggc 2580 cgcgcccccc cgaccgatgt cagcctgggg gacgagctcc acttagacgg cgaggacgtg 2640 gcgatggcgc atgccgacgc gctagacgat ttcgatctgg acatgttggg ggacggggat 2700 tccccgggtc cgggatttac cccccacgac tccgccccct acggcgctct ggatatggcc 2760 gacttcgagt ttgagcagat gtttaccgat gcccttggaa ttgacgagta cggtggcggc 2820 cgcgactaca aggacgacga tgacaag 2847 <210> 310 <211> 791 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 310 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 130 135 140 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 145 150 155 160 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 165 170 175 Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala 290 295 300 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 305 310 315 320 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 325 330 335 Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile 340 345 350 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 355 360 365 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 370 375 380 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 385 390 395 400 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 405 410 415 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 420 425 430 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 435 440 445 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 450 455 460 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 465 470 475 480 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 485 490 495 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 500 505 510 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 515 520 525 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 530 535 540 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro 545 550 555 560 Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu 565 570 575 Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly 580 585 590 Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala 595 600 605 Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg 610 615 620 Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys 625 630 635 640 His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly 645 650 655 Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr 660 665 670 Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp 675 680 685 Asp Arg Ile Leu Gln Ala Ser Gly Gly Ser Gly His Arg Gly Arg Ala 690 695 700 Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu 705 710 715 720 Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 725 730 735 Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp 740 745 750 Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln 755 760 765 Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp 770 775 780 Tyr Lys Asp Asp Asp Asp Lys 785 790 <210> 311 <211> 2373 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 311 atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60 gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120 cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180 gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240 tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300 ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360 gtggaggcag tgcatgcatg gcgcaatgca ctgacgggtg cccccctgaa cctgaccccg 420 gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540 gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600 caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660 caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720 ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780 cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840 atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900 ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020 accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140 gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320 ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380 gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440 gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560 cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620 gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680 gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttgacc 1740 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 1800 aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 1860 acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 1920 cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcaggcac 1980 gggttgttac agctctttcg cagagtgggc gtcaccgaac tcgaagcccg cagtggaacg 2040 ctccccccag cctcgcagcg ttgggaccgt atcctccagg catcgggggg atccggccac 2100 cgcggccgcg cccccccgac cgatgtcagc ctgggggacg agctccactt agacggcgag 2160 gacgtggcga tggcgcatgc cgacgcgcta gacgatttcg atctggacat gttgggggac 2220 ggggattccc cgggtccggg atttaccccc cacgactccg ccccctacgg cgctctggat 2280 atggccgact tcgagtttga gcagatgttt accgatgccc ttggaattga cgagtacggt 2340 ggcggccgcg actacaagga cgacgatgac aag 2373 <210> 312 <211> 751 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 312 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 130 135 140 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 145 150 155 160 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 165 170 175 Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala 290 295 300 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 305 310 315 320 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 325 330 335 Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile 340 345 350 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 355 360 365 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 370 375 380 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 385 390 395 400 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 405 410 415 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 420 425 430 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 435 440 445 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 450 455 460 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 465 470 475 480 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 485 490 495 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 500 505 510 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 515 520 525 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 530 535 540 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro 545 550 555 560 Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu 565 570 575 Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly 580 585 590 Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala 595 600 605 Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg 610 615 620 Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys 625 630 635 640 His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly 645 650 655 Met Ser Gly Ser Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly 660 665 670 Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp 675 680 685 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro 690 695 700 Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp 705 710 715 720 Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile 725 730 735 Asp Glu Tyr Gly Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys 740 745 750 <210> 313 <211> 2253 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 313 atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60 gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120 cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180 gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240 tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300 ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360 gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cctgaccccg 420 gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540 gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600 caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660 caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720 ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780 cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840 atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900 ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020 accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140 gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320 ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380 gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440 gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560 cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620 gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680 gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttaacc 1740 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 1800 aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 1860 acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 1920 cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcggatcc 1980 cgcggccgcg cccccccgac cgatgtcagc ctgggggacg agctccactt agacggcgag 2040 gacgtggcga tggcgcatgc cgacgcgcta gacgatttcg atctggacat gttgggggac 2100 ggggattccc cgggtccggg atttaccccc cacgactccg ccccctacgg cgctctggat 2160 atggccgact tcgagtttga gcagatgttt accgatgccc ttggaattga cgagtacggt 2220 ggcggccgcg actacaagga cgacgatgac aag 2253 <210> 314 <211> 679 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 314 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val 130 135 140 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 145 150 155 160 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln 165 170 175 Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala 290 295 300 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 305 310 315 320 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 325 330 335 Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile 340 345 350 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 355 360 365 Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser 370 375 380 His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 385 390 395 400 Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile 405 410 415 Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 420 425 430 Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val 435 440 445 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 450 455 460 Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln 465 470 475 480 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 485 490 495 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro 500 505 510 Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 515 520 525 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu 530 535 540 Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro 545 550 555 560 Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu 565 570 575 Ala Ala Leu Thr Asn Asp His Leu Val Ala Gly Ser Arg Gly Arg Ala 580 585 590 Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu 595 600 605 Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp 610 615 620 Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp 625 630 635 640 Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln 645 650 655 Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp 660 665 670 Tyr Lys Asp Asp Asp Asp Lys 675 <210> 315 <211> 2037 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 315 atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60 gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120 cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180 gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240 tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300 ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360 gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cctgaccccg 420 gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540 gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600 caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660 caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720 ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780 cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840 atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900 ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960 aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020 accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080 gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140 gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200 gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260 ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320 ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380 gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440 gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500 ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560 cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620 gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680 gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttaacc 1740 aacgaccacc tcgtcgccgg atcccgcggc cgcgcccccc cgaccgatgt cagcctgggg 1800 gacgagctcc acttagacgg cgaggacgtg gcgatggcgc atgccgacgc gctagacgat 1860 ttcgatctgg acatgttggg ggacggggat tccccgggtc cgggatttac cccccacgac 1920 tccgccccct acggcgctct ggatatggcc gacttcgagt ttgagcagat gtttaccgat 1980 gcccttggaa ttgacgagta cggtggcggc cgcgactaca aggacgacga tgacaag 2037 <210> 316 <211> 493 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 316 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn Ala Leu Thr Asn Asp His Leu 130 135 140 Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys 145 150 155 160 Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg 165 170 175 Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val 180 185 190 Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe 195 200 205 Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln 210 215 220 Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr 225 230 235 240 Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly 245 250 255 Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln 260 265 270 Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala 275 280 285 Pro Ser Pro Thr His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys 290 295 300 Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser 305 310 315 320 Phe Glu Val Arg Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu 325 330 335 Ser Trp Arg Val Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro 340 345 350 Asp Pro Gly Thr Pro Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val 355 360 365 Met Arg Glu Gln Asp Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe 370 375 380 Pro Ala Phe Asn Glu Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro 385 390 395 400 Gln Asp Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu 405 410 415 Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu 420 425 430 Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro 435 440 445 Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala 450 455 460 Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu 465 470 475 480 Tyr Gly Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys 485 490 <210> 317 <211> 1479 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 317 atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60 gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120 cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180 gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240 tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300 ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360 gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cgcgttaacc 420 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 480 aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 540 acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 600 cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcaggcac 660 gggttgttac agctctttcg cagagtgggc gtcaccgaac tcgaagcccg cagtggaacg 720 ctccccccag cctcgcagcg ttgggaccgt atcctccagg catcagggat gaaaagggcc 780 aaaccgtccc ctacttcaac tcaaacgccg gaccaggcgt ctttgcatgc attcgccgat 840 tcgctggagc gtgaccttga tgcgcccagc ccaacgcacg agggagatca gaggcgggca 900 agcagccgta aacggtcccg atcggatcgt gctgtcaccg gtccctccgc acagcaatcg 960 ttcgaggtgc gcgctcccga acagcgcgat gcgctgcatt tgcccctcag ttggagggta 1020 aaacgcccgc gtaccagtat cgggggcggc ctcccggatc ctggtacgcc cacggctgcc 1080 gacctggcag cgtccagcac cgtgatgcgg gaacaagatg aggacccctt cgcaggggca 1140 gcggatgatt tcccggcatt caacgaagag gagctcgcat ggttgatgga gctattgcct 1200 caggaccgcg gccgcgcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac 1260 ggcgaggacg tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg 1320 ggggacgggg attccccggg tccgggattt accccccacg actccgcccc ctacggcgct 1380 ctggatatgg ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag 1440 tacggtggcg gccgcgacta caaggacgac gatgacaag 1479 <210> 318 <211> 5914 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 318 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctca 240 gaattaaccc tcactaaagg gactagtcct gcaggtttaa acgaattcgc ccttgatact 300 tattaaccat accttggagg ggaaatcaca catgaaaagt gtcatttctt tactaatcat 360 attcatgtct tttctcccca tagcaagaca aagacctgtt ttaaacacat ttacaaccta 420 tatgttgcct tgtactaggt aaaaagttgt acatttctga aataattttg gtatttctgt 480 tcagatcact aaactcaaga atcagcaatt ctctgaggct ttcttttaaa tatacataag 540 gaactttcgg agtgaaggga gagtttgtca ataacttgat gcatgtgaag gggagataaa 600 aaggttgcta tttttcatca acatattttg atttggcttt ctataattga tgggcttaaa 660 agatctaatc tactttaaac agatgccaaa taaatggatg aatcttagac cctctataac 720 agtaacttcc ttttaaaaaa gacctctccc accccacccc cagcccaggc tgtgtatgaa 780 aactaagcca tgtgcacaac tctgactggg tcaccagccc acttgagtcc gtgtcacaag 840 cccacagata tttcctgctc cccagtggat cgggtgtaaa ctgagcttgc tcgctcggga 900 gcctcttgct ggaaaataga acagcatttg cagaagcgtt tggcaatgtg cttttggaag 960 aagactaaga ggtagtttct gaacttctcc ccgacaaagg catagatgat ggggttgatg 1020 cagcagtgcg tcatcccaag agtctctgtc acctgcatag cttggtccaa cctgttagag 1080 ctactgcaat tattcaggcc aaagaattcc tggaaggtgt tcaggagaag gacaatgttg 1140 tagggagccc agaagagaaa ataaacaatc atgatggtga agataagcct cacagccctg 1200 tgcctcttct tctcatttcg acaccgaagc agagttttta ggattcccga gtagcagatg 1260 accatgacaa gcagcggcag gaccagcccc aagatgacta tctttaatgt ctggaaattc 1320 ttccagaatt gatactgact gtatggaaaa tgagagctgc aggtgtaatg aagaccttct 1380 ttttgagatc tggtaaagat gattcctggg agagacgcaa acacagccac cacccaagtg 1440 atcacacttg tcaccacccc aaaggtgacc gtcctggctt ttaaagcaaa cacagcatgg 1500 acgacagcca ggtacctatc gattgtcagg aggatgatga agaagattcc agagaagaag 1560 cctataaaat agagccctgt caagagttga cacattgtat ttccaaagtc ccactgggcg 1620 gcagcatagt gagcccagaa ggggacagta agaaggaaaa acaggtcaga gatggccagg 1680 ttgagcaggt agatgtcagt catgctcttc agccttttgc agttttctag acgaggcatc 1740 cagtccagac gccatcaggg catactcact gatctagatg aggatgacca gcatgttgcc 1800 cacaaaacca aagatgaaca ccagtgagta gagcggaggc aggaggcggg ctgcgatttg 1860 cttcacattg attttttggc agggctccga tgtataataa ttgatgtcat agattggact 1920 tgacacttga taatccatct tgttccaccc tgtgcataaa taaaaagtga tcttttataa 1980 agtcctagaa tgtatttagt tgccctccat gaatgcaaac tgttttatac atcaataggt 2040 ttttaattgc ctacatagat gtctacattg aattaactct ctttttggcc aagcaatgaa 2100 gttttgtagt gaagggaagg tttgctgcta gcttccctgt ccactagatg gagagcttgg 2160 ctctgttggg ggaattcatg aaagcaccat ctcaccaaat aaaatcttgt gctctatagc 2220 accatggagt gaatgaagct ttgacaacaa ttaagggcga attcgcggcc gctaaattca 2280 attcgcccta tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact 2340 gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 2400 ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctatacg 2460 tacggcagtt taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg 2520 tacagagtga tattattgac acgccggggc gacggatggt gatccccctg gccagtgcac 2580 gtctgctgtc agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa 2640 gctggcgcat gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag 2700 tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg 2760 gaatataaat gtcaggcatg agattatcaa aaaggatctt cacctagatc cttttcacgt 2820 agaaagccag tccgcagaaa cggtgctgac cccggatgaa tgtcagctac tgggctatct 2880 ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg cttacatggc 2940 gatagctaga ctgggcggtt ttatggacag caagcgaacc ggaattgcca gctggggcgc 3000 cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 3060 tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga 3120 ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 3180 atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 3240 aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag 3300 acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 3360 acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 3420 tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 3480 ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 3540 agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 3600 atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg 3660 aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3720 gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3780 cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3840 tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3900 agttcttctg aattattaac gcttacaatt tcctgatgcg gtattttctc cttacgcatc 3960 tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg cggaacccct 4020 atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagatt atcaaaaagg 4080 atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 4140 gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 4200 tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 4260 gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 4320 ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 4380 actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 4440 ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4500 tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4560 cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4620 ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4680 ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4740 tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4800 agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4860 atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4920 gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4980 aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 5040 tattgaagca tttatcaggg ttattgtctc atgaccaaaa tcccttaacg tgagttttcg 5100 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5160 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5220 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5280 ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5340 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5400 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5460 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5520 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5580 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5640 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5700 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5760 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5820 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5880 gagcgcagcg agtcagtgag cgaggaagcg gaag 5914 <210> 319 <211> 5052 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 319 ggtaccgagc tcttacgcgt gctagtataa ataccttctg ccttactagt ataaatacct 60 tctgccttgc tagctcgaga tctgcgatct gcatctcaat tagtcagcaa ccatagtccc 120 gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 180 tcgctgacta atttttttta tttatgcaga ggccgaggcc gcctcggcct ctgagctatt 240 ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc ttggcattcc 300 ggtactgttg gtaaagccac catggaagac gccaaaaaca taaagaaagg cccggcgcca 360 ttctatccgc tggaagatgg aaccgctgga gagcaactgc ataaggctat gaagagatac 420 gccctggttc ctggaacaat tgcttttaca gatgcacata tcgaggtgga catcacttac 480 gctgagtact tcgaaatgtc cgttcggttg gcagaagcta tgaaacgata tgggctgaat 540 acaaatcaca gaatcgtcgt atgcagtgaa aactctcttc aattctttat gccggtgttg 600 ggcgcgttat ttatcggagt tgcagttgcg cccgcgaacg acatttataa tgaacgtgaa 660 ttgctcaaca gtatgggcat ttcgcagcct accgtggtgt tcgtttccaa aaaggggttg 720 caaaaaattt tgaacgtgca aaaaaagctc ccaatcatcc aaaaaattat tatcatggat 780 tctaaaacgg attaccaggg atttcagtcg atgtacacgt tcgtcacatc tcatctacct 840 cccggtttta atgaatacga ttttgtgcca gagtccttcg atagggacaa gacaattgca 900 ctgatcatga actcctctgg atctactggt ctgcctaaag gtgtcgctct gcctcataga 960 actgcctgcg tgagattctc gcatgccaga gatcctattt ttggcaatca aatcattccg 1020 gatactgcga ttttaagtgt tgttccattc catcacggtt ttggaatgtt tactacactc 1080 ggatatttga tatgtggatt tcgagtcgtc ttaatgtata gatttgaaga agagctgttt 1140 ctgaggagcc ttcaggatta caagattcaa agtgcgctgc tggtgccaac cctattctcc 1200 ttcttcgcca aaagcactct gattgacaaa tacgatttat ctaatttaca cgaaattgct 1260 tctggtggcg ctcccctctc taaggaagtc ggggaagcgg ttgccaagag gttccatctg 1320 ccaggtatca ggcaaggata tgggctcact gagactacat cagctattct gattacaccc 1380 gagggggatg ataaaccggg cgcggtcggt aaagttgttc cattttttga agcgaaggtt 1440 gtggatctgg ataccgggaa aacgctgggc gttaatcaaa gaggcgaact gtgtgtgaga 1500 ggtcctatga ttatgtccgg ttatgtaaac aatccggaag cgaccaacgc cttgattgac 1560 aaggatggat ggctacattc tggagacata gcttactggg acgaagacga acacttcttc 1620 atcgttgacc gcctgaagtc tctgattaag tacaaaggct atcaggtggc tcccgctgaa 1680 ttggaatcca tcttgctcca acaccccaac atcttcgacg caggtgtcgc aggtcttccc 1740 gacgatgacg ccggtgaact tcccgccgcc gttgttgttt tggagcacgg aaagacgatg 1800 acggaaaaag agatcgtgga ttacgtcgcc agtcaagtaa caaccgcgaa aaagttgcgc 1860 ggaggagttg tgtttgtgga cgaagtaccg aaaggtctta ccggaaaact cgacgcaaga 1920 aaaatcagag agatcctcat aaaggccaag aagggcggaa agatcgccgt gtaattctag 1980 agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga gtttggacaa 2040 accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 2100 ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 2160 atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa 2220 tgtggtaaaa tcgataagga tccgtcgacc gatgcccttg agagccttca acccagtcag 2280 ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg tcttctttat 2340 catgcaactc gtaggacagg tgccggcagc gctcttccgc ttcctcgctc actgactcgc 2400 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 2460 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 2520 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 2580 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2640 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 2700 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 2760 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 2820 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 2880 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 2940 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3000 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3060 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3120 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3180 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3240 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3300 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3360 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3420 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 3480 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3540 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3600 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3660 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 3720 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 3780 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 3840 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 3900 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 3960 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4020 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4080 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4140 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4200 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4260 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg 4320 gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380 ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440 cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500 tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560 cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620 ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680 tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 4740 aaatattaac gcttacaatt tgccattcgc cattcaggct gcgcaactgt tgggaagggc 4800 gatcggtgcg ggcctcttcg ctattacgcc agcccaagct accatgataa gtaagtaata 4860 ttaaggtacg ggaggtactt ggagcggccg caataaaata tctttatttt cattacatct 4920 gtgtgttggt tttttgtgtg aatcgatagt actaacatac gctctccatc aaaacaaaac 4980 gaaacaaaac aaactagcaa aataggctgt ccccagtgca agtgcaggtg ccagaacatt 5040 tctctatcga ta 5052 <210> 320 <211> 2520 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 320 gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60 cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120 atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180 atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240 tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300 ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360 gaggcagtgc atgcatggcg caatgcactg acgggtgccc ccctgaacct gaccccggag 420 caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 480 ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg agcaggtggt ggccatcgcc 540 agcaatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 600 gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatattgg tggcaagcag 660 gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 720 gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 780 cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggcacaggt ggtggccatc 840 gccagcaata ttggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 900 cgccaggccc atggcctgac cccggagcag gtcgtggcca tcgccagcaa tggcggcaag 960 caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 1020 ccggcacagg tggtggccat cgccagcaat attggcggca agcaggcgct ggagacggtg 1080 cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggagca ggtcgtggcc 1140 atcgccagcc acgatggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 1200 ctgtgccagg cccatggcct gaccccggag caggtggtgg ccatcgccag ccacgatggc 1260 ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc 1320 ctgaccccgg accaggtggt ggccatcgcc agcaatggcg gtggcaagca ggcgctggag 1380 acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggaccaggtg 1440 gtggccatcg ccagcaatgg cggtggcaag caggcgctgg agacggtgca gcggctgttg 1500 ccggtgctgt gccaggccca tggcctgacc ccggagcagg tggtggccat cgccagccac 1560 gatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 1620 catggcctga ccccggagca ggtggtggcc atcgccagca atggcggcgg caggccggcg 1680 ctggagagca ttgttgccca gttatctcgc cctgatccgg cgttggccgc gttgaccaac 1740 gaccacctcg tcgccttggc ctgcctcggc ggacgtcctg cgctggatgc agtgaaaaag 1800 ggattgccgc acgcgccggc cttgatcaaa agaaccaatc gccgtattcc cgaacgcaca 1860 tcccatcgcg ttgccgacca cgcgcaagtg gttcgcgtgc tgggtttttt ccagtgccac 1920 tcccacccag cgcaagcatt tgatgacgcc atgacgcagt tcgggatgag caggcacggg 1980 ttgttacagc tctttcgcag agtgggcgtc accgaactcg aagcccgcag tggaacgctc 2040 cccccagcct cgcagcgttg ggaccgtatc ctccaggcat cagggatgaa aagggccaaa 2100 ccgtccccta cttcaactca aacgccggac caggcgtctt tgcatgcatt cgccgattcg 2160 ctggagcgtg accttgatgc gcccagccca acgcacgagg gagatcagag gcgggcaagc 2220 agccgtaaac ggtcccgatc ggatcgtgct gtcaccggtc cctccgcaca gcaatcgttc 2280 gaggtgcgcg ctcccgaaca gcgcgatgcg ctgcatttgc ccctcagttg gagggtaaaa 2340 cgcccgcgta ccagtatcgg gggcggcctc ccggatcctg gtacgcccac ggctgccgac 2400 ctggcagcgt ccagcaccgt gatgcgggaa caagatgagg accccttcgc aggggcagcg 2460 gatgatttcc cggcattcaa cgaagaggag ctcgcatggt tgatggagct attgcctcag 2520 <210> 321 <211> 693 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 321 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 1 5 10 15 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 20 25 30 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 35 40 45 Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala 50 55 60 Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp 65 70 75 80 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu 85 90 95 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala 100 105 110 Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn 115 120 125 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala 130 135 140 Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 145 150 155 160 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val 165 170 175 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 290 295 300 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 305 310 315 320 Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys 325 330 335 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn 340 345 350 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 355 360 365 Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala 370 375 380 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 385 390 395 400 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 405 410 415 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 420 425 430 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 435 440 445 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 450 455 460 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 465 470 475 480 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 485 490 495 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 500 505 510 Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 515 520 525 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 530 535 540 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 545 550 555 560 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 565 570 575 His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly 580 585 590 Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp 595 600 605 Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys 610 615 620 Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His 625 630 635 640 Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr 645 650 655 Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe 660 665 670 Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr 675 680 685 Gln Phe Gly Met Ser 690 <210> 322 <211> 2079 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 322 gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60 cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120 atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180 atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240 tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300 ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360 gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct gacgcctcaa 420 caggtcgtcg cgatagcgtc taataatgga ggaaagcaag ctctggaaac cgtccagcga 480 ctccttccgg ttctgtgcca ggctcatggt ctgactccgc agcaagtcgt tgctatagcg 540 tccaacatcg gaggcaaaca ggccctggag accgtgcagc ggttgttgcc tgtgctttgc 600 caagcccacg ggcttacgcc tgagcaagtg gtggcgattg ccagtaacaa cggcggcaaa 660 caagcccttg agactgtgca gaggctcttg ccggtactct gccaagcaca cggcttgacc 720 cccgagcagg ttgtagccat agctagtcac gacgggggta agcaagcgtt ggaaacggtg 780 caagcacttc tccccgttct ctgtcaagcg catggactta ccccggaaca ggtggtcgcc 840 attgcaagcc atgatggggg taagcaagcg ttggaaacgg tgcaagcact tctccccgtt 900 ctctgtcaag cgcatggact taccccggaa caggtggtcg ccattgcaag ccatgatgga 960 ggaaagcagg cgctcgaaac agtccaggca cttttgcccg tactttgtca agctcacggt 1020 ctcaccccgg aacaggtggt agccattgca tctaacggag ggggcaaaca agccttggag 1080 acagtgcaaa ggctcctgcc agtgctctgc caggctcatg gtttgacacc cgaacaggta 1140 gttgcaatag cgagtcatga tggcggaaag caagctcttg aaactgtgca gcggctgttg 1200 cctgtactgt gtcaagccca cgggctgaca ccggaacaag ttgtagcgat cgctagccac 1260 gatggcggga aacaagctct ggaaacggta cagagactcc tcccagtgct ttgtcaggca 1320 cacggcctca cgccagagca ggttgtcgcc atcgcgtcac atgatggggg caaacaagcc 1380 ttggagacag tgcaaaggct cctgccagtg ctctgccagg ctcatggttt gacacccgaa 1440 caggtagttg caatagcgag tcatgatggc ggaaagcaag ctcttgaaac tgtgcagcgg 1500 ctgttgcctg tactgtgtca agcccacggg ctgacaccgg aacaagttgt agcgatcgct 1560 agccacgatg gcgggaaaca agctctggaa acggtacaga gactcctccc agtgctttgt 1620 caggcacacg gcctcacgcc agagcaggtt gtcgccatcg cgtcaaacgg tggagggaaa 1680 caagcgctcg aaaccgtgca aaggttgctc cccgttctct gtcaggcgca cggtcttacg 1740 ccacaacagg tggtggcgat tgcatctaat ggaggcggac gccctgcctt ggagagcatt 1800 gtggcccagc tgtccaggcc ggaccctgcc ctggccgcgt taaccaacga ccacctcgtc 1860 gccttggcct gcctcggcgg acgtcctgcg ctggatgcag tgaaaaaggg attgccgcac 1920 gcgccggcct tgatcaaaag aaccaatcgc cgtattcccg aacgcacatc ccatcgcgtt 1980 gccgaccacg cgcaagtggt tcgcgtgctg ggttttttcc agtgccactc ccacccagcg 2040 caagcatttg atgacgccat gacgcagttc gggatgagc 2079 <210> 323 <211> 659 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 323 Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile 1 5 10 15 Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val 20 25 30 Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro 35 40 45 Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala 50 55 60 Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp 65 70 75 80 Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu 85 90 95 Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala 100 105 110 Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn 115 120 125 Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala 130 135 140 Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala 145 150 155 160 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 165 170 175 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 180 185 190 Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 195 200 205 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 210 215 220 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 225 230 235 240 Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 245 250 255 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 260 265 270 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 275 280 285 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 290 295 300 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 305 310 315 320 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 325 330 335 Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His 340 345 350 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 355 360 365 Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala 370 375 380 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 385 390 395 400 Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala 405 410 415 Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 420 425 430 Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 435 440 445 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 450 455 460 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu 465 470 475 480 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 485 490 495 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 500 505 510 Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 515 520 525 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 530 535 540 Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 545 550 555 560 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 565 570 575 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 580 585 590 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 595 600 605 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 610 615 620 Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln 625 630 635 640 Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe 645 650 655 Gly Met Ser <210> 324 <211> 1977 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 324 gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60 cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120 atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180 atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240 tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300 ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360 gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct tacacccgag 420 caagtagtgg ctattgcgag taataaaggg ggtaagcaag cgttggaaac ggtgcaagca 480 cttctccccg ttctctgtca agcgcatgga cttaccccgg aacaggtggt cgccattgca 540 agccatgatg gaggaaagca ggcgctcgaa acagtccagg cacttttgcc cgtactttgt 600 caagctcacg gtctcacccc ggaacaggtg gtagccattg catctaacgg agggggcaaa 660 caagccttgg agacagtgca aaggctcctg ccagtgctct gccaggctca tggtttgaca 720 cccgaacagg tagttgcaat agcgagtcat gatggcggaa agcaagctct tgaaactgtg 780 cagcggctgt tgcctgtact gtgtcaagcc cacgggctga caccggaaca agttgtagcg 840 atcgctagca acggcggagg taagcaagca ttggaaacgg ttcaggccct gttgcctgta 900 ctttgccagg cgcacggtct gacacctgag caggttgtcg ccatcgctag caacggaggt 960 gggaaacagg cacttgaaac tgtgcagagg cttctgccgg tgctgtgcca agcgcatggc 1020 cttacacccg agcaagtagt ggctattgcg agtcatgatg gaggcaagca agcgctggag 1080 actgtccaac gacttcttcc ggtcttgtgt caggcacatg gattgacccc tcaacaagtc 1140 gtggcgatag ctagcaacat cggaggcaaa caggccctgg agaccgtgca gcggttgttg 1200 cctgtgcttt gccaagccca cgggcttacg cctgagcaag tggtggcgat tgccagtaac 1260 aacgggggca aacaagcctt ggagacagtg caaaggctcc tgccagtgct ctgccaggct 1320 catggtttga cacccgaaca ggtagttgca atagcgagtc atgatggcgg aaagcaagct 1380 cttgaaactg tgcagcggct gttgcctgta ctgtgtcaag cccacgggct gacaccggaa 1440 caagttgtag cgatcgctag ccacgatggc gggaaacaag ctctggaaac ggtacagaga 1500 ctcctcccag tgctttgtca ggcacacggc ctcacgccag agcaggttgt cgccatcgcg 1560 tcaaacggtg gagggaaaca agcgctcgaa accgtgcaaa ggttgctccc cgttctctgt 1620 caggcgcacg gtcttacgcc acaacaggtg gtggcgattg catctaatgg aggcggacgc 1680 cctgccttgg agagcattgt ggcccagctg tccaggccgg accctgccct ggccgcgtta 1740 accaacgacc acctcgtcgc cttggcctgc ctcggcggac gtcctgcgct ggatgcagtg 1800 aaaaagggat tgccgcacgc gccggccttg atcaaaagaa ccaatcgccg tattcccgaa 1860 cgcacatccc atcgcgttgc cgaccacgcg caagtggttc gcgtgctggg ttttttccag 1920 tgccactccc acccagcgca agcatttgat gacgccatga cgcagttcgg gatgagc 1977 <210> 325 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 325 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 245 250 255 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 326 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 326 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 340 345 350 Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His 515 520 525 Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 327 <211> 935 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 327 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn 515 520 525 Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu 660 665 670 Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu 675 680 685 Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala 690 695 700 Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys 705 710 715 720 Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly 725 730 735 Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg 740 745 750 His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile 755 760 765 Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu 770 775 780 Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser 785 790 795 800 Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr 805 810 815 Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro 820 825 830 Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr 835 840 845 Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser 850 855 860 Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly 865 870 875 880 Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn 885 890 895 Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile 900 905 910 Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn 915 920 925 Gly Glu Ile Asn Phe Arg Ser 930 935 <210> 328 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 328 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr 35 40 45 Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val 50 55 60 Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His 65 70 75 80 Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val 85 90 95 Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala 100 105 110 Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala 115 120 125 Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp 130 135 140 Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val 145 150 155 160 Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn 165 170 175 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 180 185 190 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 195 200 205 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 210 215 220 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 225 230 235 240 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 245 250 255 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 260 265 270 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 275 280 285 Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 290 295 300 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 305 310 315 320 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 325 330 335 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 340 345 350 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 355 360 365 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 370 375 380 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 385 390 395 400 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 405 410 415 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 420 425 430 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 435 440 445 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 450 455 460 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 465 470 475 480 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly 485 490 495 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 500 505 510 Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 515 520 525 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 530 535 540 Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala 545 550 555 560 Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 565 570 575 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 580 585 590 Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 595 600 605 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val 610 615 620 Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val 625 630 635 640 Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp 645 650 655 Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu 660 665 670 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr 675 680 685 Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala 690 695 700 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 705 710 715 720 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 725 730 735 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 740 745 750 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 755 760 765 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 770 775 780 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 785 790 795 800 Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys 805 810 815 Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu 820 825 830 Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met 835 840 845 Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His 850 855 860 Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser 865 870 875 880 Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly 885 890 895 Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu 900 905 910 Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys 915 920 925 Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly 930 935 940 His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile 945 950 955 960 Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly 965 970 975 Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg 980 985 990 Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser 995 1000 <210> 329 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 329 gaccctgcct gctcct 16 <210> 330 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 330 cacctgcagc tgcccag 17 <210> 331 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 331 ggcccttgca gccgt 15 <210> 332 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 332 cagacgctgg cact 14 <210> 333 <211> 34 <212> PRT <213> Xanthomonas sp. <400> 333 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 334 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 334 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 335 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 335 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 336 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 336 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 337 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 337 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 338 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 338 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 339 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 339 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro Asp Leu Cys Gln Asp 20 25 30 His Gly <210> 340 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 340 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Asp 20 25 30 His Gly <210> 341 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 341 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Pro Val Leu Arg Gly Ala 20 25 30 His Gly <210> 342 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 342 ctcctgcctc cgctctactc actggtgttc atctttggtt ttgtgggcaa catgctggtc 60 atcctcatcc tgataaactg caaaaggctg aagagcatga ctgacatcta cctgctcaac 120 ctggccatct ctgacctgtt tttccttctt actgtcccct tctgggctca ctatgctgcc 180 gcccagtggg actttggaaa gatggccgcg aattcgccct taatgatacg gcgaccaccg 240 agatctacac tctttcccta cacgacgctc ttccgatctg gagccatctg gccgggttgg 300 ctggttataa ccgcgcagat tctgttcacg ggactcagag ttgaagctcc tctcccttcc 360 gaacagctcc gcgcaccgcc ccgcgacgca gcccggcgca 400 <210> 343 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 343 cgcggagcca tctggccggg ttggctggtt ataaccgcgc agattctgtt cacgggactc 60 agagttgaag c 71 <210> 344 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 344 cgcggagcca tctggccggg ttggctgata accgcgcaga ttctgttcac gggactcaga 60 gttgaagc 68 <210> 345 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 345 cgcggagcca tctggccggg ttggctgtaa ccgcgcagat tctgttcacg ggactcagag 60 ttgaagc 67 <210> 346 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 346 cgcggagcca tctggccggg ttggttataa ccgcgcagat tctgttcacg ggactcagag 60 ttgaagc 67 <210> 347 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 347 cgcggagcca tctggttata accgcgcaga ttctgttcac gggactcaga gttgaagc 58 <210> 348 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 348 cgcggagcca tctggccggg ttggcgcaga ttctgttcac gggactcaga gttgaagc 58 <210> 349 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 349 cgcggagcca tctggccgcg cagattctgt tcacgggact cagagttgaa gc 52 <210> 350 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 350 cgcggagcca tctggccggg acgggactca gagttgaagc 40 <210> 351 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 351 gcggagccat ctggccgggt tggctggtta taaccgcgca gattctgttc ac 52 <210> 352 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 352 ctgggtacgg atccaagctt cgtcgaccta gcc 33 <210> 353 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 353 gcggagccat ctggccgggt tggctggtta taaccgcgca gattctgttc ac 52 <210> 354 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 354 tggtgtacgg atccaagctt cgtcgaccta gcc 33 <210> 355 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 355 atccaagctt cgtcgaccta gccctggtta taaccgcgca gattctgtt 49 <210> 356 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 356 atccaagctt cgtcgaccta gccctggtta taaccgcgca gattctgtt 49 <210> 357 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 357 atccaagctt cgtcgaccta gccgcgcaga ttctgtt 37 <210> 358 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 358 atccaagctt cgtcgaccta gcctggttat aaccgcgcag attctgtt 48 <210> 359 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 359 atccaagctt cgtcgaccta gcctggttaa ccgcgcagat tctgtt 46 <210> 360 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 360 atccaagctt cgtcgaccta gcctggtata accgcgcaga ttctgtt 47 <210> 361 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 361 atccaagctt cgtcgaccta gcctggtgta cgcagattct gtt 43 <210> 362 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 362 atccaagctt cgtcgacctg gttataaccg cgcagattct gtt 43 <210> 363 <211> 137 <212> PRT <213> Xanthomonas sp. <400> 363 Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys 1 5 10 15 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 20 25 30 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 35 40 45 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 50 55 60 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 65 70 75 80 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 85 90 95 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 100 105 110 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 115 120 125 Asn Ala Leu Thr Gly Ala Pro Leu Asn 130 135 <210> 364 <211> 121 <212> PRT <213> Xanthomonas sp. <400> 364 Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu 1 5 10 15 Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His 20 25 30 Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala 35 40 45 Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln 50 55 60 Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu 65 70 75 80 Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile 85 90 95 Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg 100 105 110 Asn Ala Leu Thr Gly Ala Pro Leu Asn 115 120 <210> 365 <211> 72 <212> PRT <213> Xanthomonas sp. <400> 365 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 20 25 30 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 35 40 45 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 50 55 60 Ala Leu Ile Lys Arg Thr Asn Arg 65 70 <210> 366 <211> 41 <212> PRT <213> Xanthomonas sp. <400> 366 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 20 25 30 Leu Ala Ala Leu Thr Asn Asp His Leu 35 40 <210> 367 <211> 121 <212> PRT <213> Ralstonia sp. <400> 367 Leu Lys Gln Glu Ser Leu Ala Glu Val Ala Lys Tyr His Ala Thr Leu 1 5 10 15 Ala Gly Gln Gly Phe Thr His Ala Asp Ile Cys Arg Ile Ser Arg Arg 20 25 30 Trp Gln Ser Leu Arg Val Val Ala Asn Asn Tyr Pro Glu Leu Met Ala 35 40 45 Ala Leu Pro Arg Leu Thr Thr Ala Gln Ile Val Asp Ile Ala Arg Gln 50 55 60 Arg Ser Gly Asp Leu Ala Leu Gln Ala Leu Leu Pro Val Ala Ala Ala 65 70 75 80 Leu Thr Ala Ala Pro Leu Gly Leu Ser Ala Ser Gln Ile Ala Thr Val 85 90 95 Ala Gln Tyr Gly Glu Arg Pro Ala Ile Gln Ala Leu Tyr Arg Leu Arg 100 105 110 Arg Lys Leu Thr Arg Ala Pro Leu Gly 115 120 <210> 368 <211> 40 <212> PRT <213> Ralstonia sp. <400> 368 Leu Ser Ile Ala Gln Val Ile Ala Ile Ala Cys Ile Gly Gly Arg Gln 1 5 10 15 Ala Leu Thr Ala Ile Glu Met His Met Leu Ala Leu Arg Ala Ala Pro 20 25 30 Tyr Asn Leu Ser Pro Glu Arg Val 35 40 <210> 369 <211> 119 <212> PRT <213> Xanthomonas campestris <400> 369 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 20 25 30 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 35 40 45 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 50 55 60 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 65 70 75 80 Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln 85 90 95 Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe 100 105 110 Gly Met Ser Arg His Gly Leu 115 <210> 370 <211> 15 <212> DNA <213> Homo sapiens <400> 370 gctggtcatc ctcat 15 <210> 371 <211> 15 <212> DNA <213> Homo sapiens <400> 371 ggtcatcctc atcct 15 <210> 372 <211> 15 <212> DNA <213> Homo sapiens <400> 372 catcctcatc ctgat 15 <210> 373 <211> 17 <212> DNA <213> Homo sapiens <400> 373 cctcatcctg ataaact 17 <210> 374 <211> 73 <212> DNA <213> Homo sapiens <400> 374 tggttttgtg ggcaacatgc tggtcatcct catcctgata aactgcaaaa ggctgaagag 60 catgactgac atc 73 <210> 375 <211> 73 <212> DNA <213> Homo sapiens <400> 375 gatgtcagtc atgctcttca gccttttgca gtttatcagg atgaggatga ccagcatgtt 60 gcccacaaaa cca 73 <210> 376 <211> 15 <212> DNA <213> Homo sapiens <400> 376 gctcttcagc ctttt 15 <210> 377 <211> 13 <212> DNA <213> Homo sapiens <400> 377 gctcttcagc ctt 13 <210> 378 <211> 15 <212> DNA <213> Homo sapiens <400> 378 catgctcttc agcct 15 <210> 379 <211> 14 <212> DNA <213> Homo sapiens <400> 379 gtcagtcatg ctct 14 <210> 380 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 380 ttcctgccca gctccatttc cttctcctgg aactaccaga acaacactga a 51 <210> 381 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 381 ttcagtgttg ttctggtagt tccaggagaa ggaaatggag ctgggcagga a 51 <210> 382 <211> 17 <212> DNA <213> Zea maize <400> 382 ttatttgaag aaactat 17 <210> 383 <211> 15 <212> DNA <213> Zea maize <400> 383 ttatttgaag aaact 15 <210> 384 <211> 16 <212> DNA <213> Zea maize <400> 384 tttgaagaac tatatt 16 <210> 385 <211> 59 <212> DNA <213> Zea maize <400> 385 ttatttgaag aaactatatt acagagcata agcttatgca acactcccac tagttgatt 59 <210> 386 <211> 59 <212> DNA <213> Zea maize <400> 386 aatcaactag tgggagtgtt gcataagctt atgctctgta atatagtttc ttcaaataa 59 <210> 387 <211> 14 <212> DNA <213> Zea maize <400> 387 tgggagtgtt gcat 14 <210> 388 <211> 18 <212> DNA <213> Zea maize <400> 388 tggggaggag ggcgtgct 18 <210> 389 <211> 60 <212> DNA <213> Zea maize <400> 389 tggggaggag ggcgtgctgc gcgaaggaag gcgttaagag aggggcgtgg acgagcaagg 60 <210> 390 <211> 60 <212> DNA <213> Zea maize <400> 390 ccttgctcgt ccacgcccct ctcttaacgc cttccttcgc gcagcacgcc ctcctcccca 60 <210> 391 <211> 17 <212> DNA <213> Zea maize <400> 391 tgaactacct ccggccc 17 <210> 392 <211> 18 <212> DNA <213> Zea maize <400> 392 tcctacgacg aggaggat 18 <210> 393 <211> 74 <212> DNA <213> Zea maize <400> 393 ctgaactacc tccggcccaa catcaggcgc ggcaacatct cctacgacga ggaggatctc 60 atgatcatcc gcct 74 <210> 394 <211> 74 <212> DNA <213> Zea maize <400> 394 aggcggatga tcatgagatc ctcctcgtcg taggagatgt tgccgcgcct gatgttgggc 60 cggaggtagt tcag 74 <210> 395 <211> 17 <212> DNA <213> Zea maize <400> 395 tcctcgtcgt aggagat 17 <210> 396 <211> 23 <212> DNA <213> Zea maize <400> 396 ccacaggctc ctcggcaaca ggt 23 <210> 397 <211> 23 <212> DNA <213> Zea maize <400> 397 acctgttgcc gaggagcctg tgg 23 <210> 398 <211> 16 <212> DNA <213> Zea maize <400> 398 ttgccgagga gcctgt 16 <210> 399 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (1)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(13) <223> Any amino acid and these positions are involved in DNA binding <220> <221> MOD_RES <222> (14)..(35) <223> Any amino acid and this region may encompass 20 to 22 residues <400> 399 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 20 25 30 Xaa Xaa Xaa 35 <210> 400 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Gly or Ser <220> <221> MOD_RES <222> (2)..(22) <223> Any amino acid and this region may encompass 19 to 21 residues <400> 400 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa 20 <210> 401 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(4) <223> Any amino acid and this region may encompass 3 to 4 residues <220> <221> MOD_RES <222> (5)..(5) <223> Ala or Thr <220> <221> MOD_RES <222> (6)..(22) <223> Any amino acid and this region may encompass 16 to 17 residues <400> 401 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa 20 <210> 402 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(5) <223> Any amino acid and this region may encompass 4 to 5 residues <220> <221> MOD_RES <222> (6)..(6) <223> Leu or Val <220> <221> MOD_RES <222> (7)..(22) <223> Any amino acid and this region may encompass 15 to 16 residues <400> 402 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa 20 <210> 403 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 403 Leu Thr Pro Asp Gln Val Ala Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 404 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 404 Leu Thr Pro Asp Gln Val Val Leu Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 405 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 405 Leu Thr Pro Asp Gln Val Val Thr Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 406 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 406 Leu Thr Pro Asp Gln Val Val Ala Ala Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 407 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 407 Leu Thr Pro Asp Gln Val Val Ala Val Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 408 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 408 Leu Thr Pro Asp Gln Val Val Ala Ile Leu Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 409 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 409 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ala His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 410 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 410 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 411 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 411 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 412 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 412 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Ala Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 413 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 413 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Ala Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 414 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 414 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Arg Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 415 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 415 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Lys Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 416 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 416 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Trp Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 417 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 417 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 418 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 418 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Ala Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 419 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 419 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Gln Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 420 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 420 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Ala Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 421 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 421 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Ala Val Leu Cys Gln Asp 20 25 30 His Gly <210> 422 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 422 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Leu Val Leu Cys Gln Asp 20 25 30 His Gly <210> 423 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 423 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 424 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 424 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 425 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 425 Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp 20 25 30 His Gly <210> 426 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 426 ctacactctt tccctacacg acgctcttcc gatctggagc ttgatcgacg aga 53 <210> 427 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 427 ctacactctt tccctacacg acgctcttcc gatctctgtg gaggcggatg at 52 <210> 428 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 428 ctacactctt tccctacacg acgctcttcc gatctactac ctccggccca ac 52 <210> 429 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 429 ctacactctt tccctacacg acgctcttcc gatctggccg ctgcagactc tatctcacc 59 <210> 430 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 430 ctacactctt tccctacacg acgctcttcc gatctttccg ctgcagactc tatctcacc 59 <210> 431 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 431 ctacactctt tccctacacg acgctcttcc gatctccggg ctgcagactc tatctcacc 59 <210> 432 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 432 ctacactctt tccctacacg acgctcttcc gatctaaccg ctgcagactc tatctcacc 59 <210> 433 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 433 ctacactctt tccctacacg acgctcttcc gatctccaag ctgcagactc tatctcacc 59 <210> 434 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 434 caagcagaag acggcatacg agctcttccg atctttccct ccatttgcct tc 52 <210> 435 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 435 caagcagaag acggcatacg agctcttccg atctgtgtgt gggtgcaggt tt 52 <210> 436 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 436 caagcagaag acggcatacg agctcttccg atcttcgtcg tcagctcgtg ta 52 <210> 437 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 437 caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52 <210> 438 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 438 caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52 <210> 439 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 439 caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52 <210> 440 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 440 caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52 <210> 441 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 441 caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52 <210> 442 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 442 aatgatacgg cgaccaccga gatctacact ctttccctac acg 43 <210> 443 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 443 caagcagaag acggcata 18 <210> 444 <211> 8152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 444 ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60 taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240 tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300 gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360 acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420 caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480 gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540 aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac 600 ctgttcgttg caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa 660 agcaggctcc gaattcgccc ttttaattaa tgcagtgcag cgtgacccgg tcgtgcccct 720 ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 780 tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttactctac 840 gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 900 cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 960 ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 1020 catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 1080 tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 1140 tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 1200 taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 1260 gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 1320 cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1380 ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1440 gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 1500 cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt 1560 aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca 1620 cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg 1680 ctcgtcctcc cccccccccc ctctctacct tctctagatc ggcgttccgg tccatggtta 1740 gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt gttagatccg 1800 tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact 1860 tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg 1920 atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca 1980 atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt 2040 gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac 2100 ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa 2160 ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta 2220 ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg 2280 cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta 2340 ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat 2400 ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat 2460 gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa 2520 acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca tatgcagcag 2580 ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc 2640 ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc aggactagtc cagtgtggtg 2700 gaattcgcca tggactacaa agaccatgac ggtgattata aagatcatga catcgattac 2760 aaggatgacg atgacaagat ggcccccaag aagaagagga aggtgggcat tcacggggta 2820 cctatggtgg acttgaggac actcggttat tcgcaacagc aacaggagaa aatcaagcct 2880 aaggtcagga gcaccgtcgc gcaacaccac gaggcgcttg tggggcatgg cttcactcat 2940 gcgcatattg tcgcgctttc acagcaccct gcggcgcttg ggacggtggc tgtcaaatac 3000 caagatatga ttgcggccct gcccgaagcc acgcacgagg caattgtagg ggtcggtaaa 3060 cagtggtcgg gagcgcgagc acttgaggcg ctgctgactg tggcgggtga gcttaggggg 3120 cctccgctcc agctcgacac cgggcagctg ctgaagatcg cgaagagagg gggagtaaca 3180 gcggtagagg cagtgcacgc ctggcgcaat gcgctcaccg gggccccctt gaacctgacc 3240 ccagaccagg tagtcgcaat cgcgtcgcat gacgggggaa agcaagccct ggaaaccgtg 3300 caaaggttgt tgccggtcct ttgtcaagac cacggcctta caccggagca agtcgtggcc 3360 attgcatcac atgacggtgg caaacaggct cttgagacgg ttcagagact tctcccagtt 3420 ctctgtcaag cccacgggct gactcccgat caagttgtag cgattgcgag caatggggga 3480 gggaaacaag cattggagac tgtccaacgg ctccttcccg tgttgtgtca agcccacggt 3540 ttgacgcctg cacaagtggt cgccatcgcc tccaatattg gcggtaagca ggcgctggaa 3600 acagtacagc gcctgctgcc tgtactgtgc caggatcatg gactcacccc agaccaggta 3660 gtcgcaatcg cgtcgcatga cgggggaaag caagccctgg aaaccgtgca aaggttgttg 3720 ccggtccttt gtcaagacca cggccttaca ccggatcaag tcgtggccat tgcaaataat 3780 aacggtggca aacaggctct tgagacggtt cagagacttc tcccagttct ctgtcaagcc 3840 cacgggctga ctcccgatca agttgtagcg attgcgagca acatcggagg gaaacaagca 3900 ttggagactg tccaacggct ccttcccgtg ttgtgtcaag cccacggttt gacgcctgca 3960 caagtggtcg ccatcgcctc ccacgacggc ggtaagcagg cgctggaaac agtacagcgc 4020 ctgctgcctg tactgtgcca ggatcatggg ctgaccccag accaggtagt cgcaatcgcc 4080 aacaataacg ggggaaagca agccctggaa accgtgcaaa ggttgttgcc ggtcctttgt 4140 caagaccacg gccttacacc ggagcaagtc gtggccattg catcaaatat cggtggcaaa 4200 caggctcttg agacggttca gagacttctc ccagttctct gtcaagccca cgggctgact 4260 cccgatcaag ttgtagcgat tgcgaataac aatggaggga aacaagcatt ggagactgtc 4320 caacggctcc ttcccgtgtt gtgtcaagcc cacggtttga cgcctgcaca agtggtcgcc 4380 atcgccaaca acaacggcgg taagcaggcg ctggaaacag tacagcgcct gctgcctgta 4440 ctgtgccagg atcatggttt gaccccagac caggtagtcg caatcgcgtc gaacattggg 4500 ggaaagcaag ccctggaaac cgtgcaaagg ttgttgccgg tcctttgtca agaccacggc 4560 cttacaccgg atcaagtcgt ggccattgca aataataacg gtggcaaaca ggctcttgag 4620 acggttcaga gacttctccc agttctctgt caagcccacg ggctgactcc cgatcaagtt 4680 gtagcgattg cgaataacaa tggagggaaa caagcattgg agactgtcca acggctcctt 4740 cccgtgttgt gtcaagccca cggtttgacg cctgcacaag tggtcgccat cgcctccaat 4800 attggcggta agcaggcgct ggaaacagta cagcgcctgc tgcctgtact gtgccaggat 4860 catggcctga cacccgaaca ggtggtcgcc attgctagca acgggggagg acggccagcc 4920 ttggagtcca tcgtagccca attgtccagg cccgatcccg cgttggctgc gttaacgaat 4980 gaccatctgg tggcgttggc atgtcttggt ggacgacccg cgctcgatgc agtcaaaaag 5040 ggtctgcctc atgctcccgc attgatcaaa agaaccaacc ggcggattcc cgagagaact 5100 tcccatcgag tcgcgggatc ccagctggtt aaatcagaac tcgaagaaaa aaagagcgag 5160 ctgcggcata aactcaaata tgtccctcat gagtacatag aactgattga aatcgcccgc 5220 aattccaccc aggatcggat tcttgaaatg aaagtgatgg aattttttat gaaagtttac 5280 ggctatcgcg ggaagcacct tggggggtcg cggaagccgg acggtgctat ttacactgtc 5340 ggttccccga tcgattatgg cgtaattgtt gacacgaaag catattcggg tgggtataat 5400 cttcctattg gtcaggctga tgagatgcag cggtacgttg aagagaatca gacgcggaac 5460 aagcatatta acccaaatga gtggtggaag gtgtatccat catcggtcac cgaatttaag 5520 ttcttgtttg tgtcgggcca ctttaagggg aactacaagg cccaacttac caggttgaat 5580 cacataacca actgtaacgg agctgttctg tcagtagaag agctgttgat aggcggggaa 5640 atgattaaag caggtacatt aacgttggag gaagtacgcc gcaagtttaa taacggcgag 5700 attaacttta gatctgagac ctgataaaca aacacacggt ctcctcgagc tcgcagatcg 5760 ttcaacatct ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 5820 atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 5880 ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 5940 gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 6000 ctagatccga taagcttaag ggcgaattcg acccagcttt cttgtacaaa gttggcatta 6060 taaaaaataa ttgctcatca atttgttgca acgaacaggt cactatcagt caaaataaaa 6120 tcattatttg ccatccagct gatatcccct atagtgagtc gtattacatg gtcatagctg 6180 tttcctggca gctctggccc gtgtctcaaa atctctgatg ttacattgca caagataaaa 6240 atatatcatc atgcctcctc tagaccagcc aggacagaaa tgcctcgact tcgctgctgc 6300 ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagtggacat 6360 aagcctgttc ggttcgtaag ctgtaatgca agtagcgtat gcgctcacgc aactggtcca 6420 gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg 6480 actgtttttt tggggtacag tctatgcctc gggcatccaa gcagcaagcg cgttacgccg 6540 tgggtcgatg tttgatgtta tggagcagca acgatgttac gcagcagggc agtcgcccta 6600 aaacaaagtt aaacatcatg agggaagcgg tgatcgccga agtatcgact caactatcag 6660 aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg 6720 gctccgcagt ggatggcggc ctgaagccac acagtgatat tgatttgctg gttacggtga 6780 ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg 6840 cttcccctgg agagagcgag attctccgcg ctgtagaagt caccattgtt gtgcacgacg 6900 acatcattcc gtggcgttat ccagctaagc gcgaactgca atttggagaa tggcagcgca 6960 atgacattct tgcaggtatc ttcgagccag ccacgatcga cattgatctg gctatcttgc 7020 tgacaaaagc aagagaacat agcgttgcct tggtaggtcc agcggcggag gaactctttg 7080 atccggttcc tgaacaggat ctatttgagg cgctaaatga aaccttaacg ctatggaact 7140 cgccgcccga ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt 7200 acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg gcaatggagc 7260 gcctgccggc ccagtatcag cccgtcatac ttgaagctag acaggcttat cttggacaag 7320 aagaagatcg cttggcctcg cgcgcagatc agttggaaga atttgtccac tacgtgaaag 7380 gcgagatcac caaggtagtc ggcaaataac cctcgagcca cccatgacca aaatccctta 7440 acgtgagtta cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 7500 cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 7560 cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 7620 tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 7680 tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 7740 ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 7800 aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 7860 cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag 7920 ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 7980 agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 8040 ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 8100 acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg tt 8152 <210> 445 <211> 17 <212> DNA <213> Homo sapiens <400> 445 tcattacacc tgcagct 17 <210> 446 <211> 17 <212> DNA <213> Homo sapiens <400> 446 acacctgcag ctctcat 17 <210> 447 <211> 77 <212> DNA <213> Homo sapiens <400> 447 aaaaagaagg tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct 60 ggaagaattt ccagaca 77 <210> 448 <211> 77 <212> DNA <213> Homo sapiens <400> 448 tgtctggaaa ttcttccaga attgatactg actgtatgga aaatgagagc tgcaggtgta 60 atgaagacct tcttttt 77 <210> 449 <211> 13 <212> DNA <213> Homo sapiens <400> 449 tgatactgac tgt 13 <210> 450 <211> 17 <212> DNA <213> Homo sapiens <400> 450 cttccagaat tgatact 17 <210> 451 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 451 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg 1 5 10 15 Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala 20 25 30 Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly 35 40 45 Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro 50 55 60 Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His 65 70 75 80 Arg Val Ala <210> 452 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 452 tgcgccgggc tgcgtcgcgg ggcggtgcgc ggagctgttc ggaagggaga ggagcttcaa 60 ctctgagtcc cgtgaacaga atctgcgcgg ttataaccag ccaacccggc cagatggctc 120 cagatcggaa gagcgtcgtg tagggaaaga gtgtagatct cggtggtcgc cgtatcatta 180 agggcgaatt cgcggccatc tttccaaagt cccactgggc ggcagcatag tgagcccaga 240 aggggacagt aagaaggaaa aacaggtcag agatggccag gttgagcagg tagatgtcag 300 tcatgctctt cagccttttg cagtttatca ggatgaggat gaccagcatg ttgcccacaa 360 aaccaaagat gaacaccagt gagtagagcg gaggcaggag 400 <210> 453 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 453 ggaggcaaga agatggattc 20 <210> 454 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 454 gaatcggcac atgcagatct 20 <210> 455 <211> 14 <212> DNA <213> Homo sapiens <400> 455 tttgtgggca acat 14 <210> 456 <211> 17 <212> DNA <213> Homo sapiens <400> 456 tttgtgggca acatgct 17 <210> 457 <211> 14 <212> DNA <213> Homo sapiens <400> 457 tgctcttcag cctt 14 <210> 458 <211> 16 <212> DNA <213> Homo sapiens <400> 458 tcatgctctt cagcct 16 <210> 459 <211> 15 <212> DNA <213> Homo sapiens <400> 459 tgtcagtcat gctct 15 <210> 460 <211> 17 <212> DNA <213> Homo sapiens <400> 460 tagatgtcag tcatgct 17 <210> 461 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (2)..(2) <223> Thr or unknown amino acid <220> <221> MOD_RES <222> (3)..(3) <223> Pro or Leu <220> <221> MOD_RES <222> (4)..(4) <223> Asp, Ala, Glu, or unknown amino acid <220> <221> MOD_RES <222> (8)..(8) <223> Ala or unknown amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Ser or Asn <220> <221> MOD_RES <222> (12)..(12) <223> Asn or His <220> <221> MOD_RES <222> (13)..(13) <223> Asp, Gly, Ile, Asn, or Ser <220> <221> MOD_RES <222> (15)..(15) <223> Gly or unknown amino acid <220> <221> MOD_RES <222> (22)..(22) <223> Val or unknown amino acid <220> <221> MOD_RES <222> (24)..(24) <223> Arg or unknown amino acid <220> <221> MOD_RES <222> (31)..(31) <223> Gln or unknown amino acid <220> <221> MOD_RES <222> (32)..(32) <223> Asp, Ala, or unknown amino acid <400> 461 Leu Xaa Xaa Xaa Gln Val Val Xaa Ile Ala Xaa Xaa Xaa Gly Xaa Lys 1 5 10 15 Gln Ala Leu Glu Thr Xaa Gln Xaa Leu Leu Pro Val Leu Cys Xaa Xaa 20 25 30 His Gly <210> 462 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 462 gtcttcatta cacctgcagc tctcattttc catacagtca gtatcaattc tggaagaatt 60 tccagacatt 70 <210> 463 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 463 aatgtctgga aattcttcca gaattgatac tgactgtatg gaaaatgaga gctgcaggtg 60 taatgaagac 70 <210> 464 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 464 Ser Gly Gly Ser 1 <210> 465 <211> 18 <212> DNA <213> Zea maize <400> 465 tgaactagtg ggagtgtt 18 <210> 466 <211> 18 <212> DNA <213> Zea maize <400> 466 tcgtccacgc ccctctct 18 <210> 467 <211> 70 <212> DNA <213> Zea maize <400> 467 gagcgcgatg gggaggaggg cgtgctgcgc gaaggaaggc gttaagagag gggcgtggac 60 gagcaaggag 70 <210> 468 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 468 gagcgcgatg gggaggaggg cgtgctgcgc gacgttaaga gaggggcgtg gacgagcaag 60 gag 63 <210> 469 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 469 gagcgcgatg gggaggaggg cgtgctgcgc gaaggagcgt taagagaggg gcgtggacga 60 gcaaggag 68 <210> 470 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 470 gagcgcgatg gggaggaggg cgtgctgcgc gaaaggcgtt aagagagggg cgtggacgag 60 caaggag 67 <210> 471 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 471 gagcgcgatg gggaggaggg cgtgctgcgc gaggcgttaa gagaggggcg tggacgagca 60 aggag 65 <210> 472 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 472 gagcgcgatg gggaggaggg cgtgctgtgc gaaaggcgtt aagagagggg cgtggacgag 60 caaggag 67 <210> 473 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 473 gagcgcgatg gggaggaggg cgtgctgcgc gaaggcgtta agagaggggc gtggacgagc 60 aaggag 66 <210> 474 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 474 gagcgcgatg gggaggaggg cgtgcagcgc gaggcgttaa gagaggggcg tggacgagca 60 aggag 65 <210> 475 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 475 gagcgcgatg gggaggaagg cgttaagaga ggggcgtgga cgagcaagga g 51 <210> 476 <211> 70 <212> DNA <213> Zea maize <400> 476 gagatcctcc tcgtcgtagg agatgttgcc gcgcctgatg ttgggccgga ggtagttcag 60 ccaccgcagc 70 <210> 477 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 477 gagatcctcc tcgtcgtagg agatgttggg ccggaggtag ttcagccacc gcagc 55 <210> 478 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 478 gagatcctcc tcgtcgtagg agatgttgct gatgttgggc cggaggtagt tcagccaccg 60 cagc 64 <210> 479 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 479 gagatcctcc tcgtcgtagg agatgttgcc gcctgatgtt gggccggagg tagttcagcc 60 accgcagc 68 <210> 480 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 480 gagatcctcc tcgtcgtagg agatgttgcc gcctgatgtt gggccggagg tagttcagcc 60 accgcagc 68 <210> 481 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 481 gagatcctcc tcgtcgtagg agatgttgct gatgttgggc cgggggtagt tcagccaccg 60 cagc 64 <210> 482 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 482 gagatcctcc tcgtcgtagg agatgttggg ccggaggtag ttcagccacc gcagc 55 <210> 483 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 483 gagatcctcc tcgtcgtagg agatgttgcc gcgatgttgg gccggaggta gttcagccac 60 cgcagc 66 <210> 484 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 484 gagatcctcc tcgtcgtagg agatgttgcc tgatgttggg ccggaggtag ttcagccacc 60 gcagc 65 <210> 485 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 485 gagatcctcc tcgtcgtagg agatgttgcc ctgatgttgg gccggaggta gttcagccac 60 cgcagc 66 <210> 486 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 486 gagatcctcc tcgtcgtagg agatgttgcc gatgttgggc cggaggtagt tcagccaccg 60 cagc 64 <210> 487 <211> 70 <212> DNA <213> Zea maize <400> 487 ggcaacatct cctacgacga ggaggatctc atcatccgcc tccacaggct cctcggcaac 60 aggtcggtgc 70 <210> 488 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 488 ggcaacatct cctacgacga ggaggatctc atccctccac aggctcctcg gcaacaggtc 60 ggtgc 65 <210> 489 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 489 ggcaacatct cctacgacga ggaggatctc atcgcctcca caggctcctc ggcaacaggt 60 cggtgc 66 <210> 490 <211> 70 <212> DNA <213> Zea maize <400> 490 ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60 gttcattttt 70 <210> 491 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 491 ctcggaagtt atttgaagaa actatattac agagcatata agcttatgca acactcccac 60 tagttcattt tt 72 <210> 492 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 492 ctcggaagtt atttgaagaa actatattaa gcttatgcaa cactcccact agttcatttt 60 t 61 <210> 493 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 493 ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60 tcattttt 68 <210> 494 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 494 ctcggaagtt atttgaagaa actatattac agcttatgca acactcccac tagttcattt 60 tt 62 <210> 495 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 495 ctcggaagct tatgcaacac tcccactagt tcattttt 38 <210> 496 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 496 ctcggaagtt atttgaagaa actatatcaa cactcccact agttcatttt t 51 <210> 497 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 497 ctcggaagtt atttgaagaa actatattgc agcttatgca acactcccac tagttcattt 60 tt 62 <210> 498 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 498 ctcggaagtg gcataagctt atgcaacact cccactagtt cattttt 47 <210> 499 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 499 ctcggaagtt atttgaagaa acttatgcaa cactcccact agttcatttt t 51 <210> 500 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 500 ctcggaagtt atttgaagaa actatattac agagcaacac tcccactagt tcattttt 58 <210> 501 <211> 70 <212> DNA <213> Zea maize <400> 501 ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60 gttcattttt 70 <210> 502 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 502 ctcggaagtt atttgaagaa actatattac aagcttatgc aacactccca ctagttcatt 60 ttt 63 <210> 503 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 503 ctcggaagtt atttgaagaa actatattac agaagcttat gcaacactcc cactagttca 60 ttttt 65 <210> 504 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 504 ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60 tttt 64 <210> 505 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 505 ctcggaagtt atttgaagaa actatattac agcataagct tatgcaacac tcccactagt 60 tcattttt 68 <210> 506 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 506 ctcggaagtt atttgaagaa actatattac agtaagctta tgcaacactc ccactagttc 60 attttt 66 <210> 507 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 507 ctcggaagtt atttgaagaa actatattac taagcttatg caacactccc actagttcat 60 tttt 64 <210> 508 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 508 ctcggaagtt atttgaagaa actatattac aaagcttatg caacactccc actagttcat 60 tttt 64 <210> 509 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 509 ctcggaagtt atttgaagaa actatattac agataagctt atgcaacact cccactagtt 60 cattttt 67 <210> 510 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 510 ctcggaagct tatgcaacac tcccactagt tcattttt 38 <210> 511 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 511 ctcggaagtt atttgaagaa actatattaa aagcttatgc aacactccca ctagttcatt 60 ttt 63 <210> 512 <211> 70 <212> DNA <213> Zea maize <400> 512 ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60 gttcattttt 70 <210> 513 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 513 ctcggaagtt atttgaagaa actatattac catgcaacac tcccactagt tcattttt 58 <210> 514 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 514 ctcggaagtt atttgaagaa actatattta tgcaacactc ccactagttc attttt 56 <210> 515 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 515 ctcggaagtt atttgaagaa actatattac cttatgcaac actcccacta gttcattttt 60 <210> 516 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 516 ctcggaagtt atttgaagaa actatatgca acactcccac tagttcattt tt 52 <210> 517 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 517 ctcggaagtt atttgaagaa actatattat gcaacactcc cactagttca ttttt 55 <210> 518 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 518 ctcggaagtt atttgaagaa actatattac atatgcaaca ctcccactag ttcattttt 59 <210> 519 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 519 ctcggaagtt atttgaagaa actatattac agagcatact tatgcaacac tcccactagt 60 tcattttt 68 <210> 520 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 520 ctcggaagtt atttgaagaa actatattac agatgcaaca ctcccactag ttcattttt 59 <210> 521 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 521 ctcggaagtt atttgaagaa actatattac agagcatatt atgcaacact cccactagtt 60 cattttt 67 <210> 522 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 522 ctcggaagtt atttgaagaa actatattac aatatgcaac actcccacta gttcattttt 60 <210> 523 <211> 70 <212> DNA <213> Zea maize <400> 523 ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60 gttcattttt 70 <210> 524 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 524 ctcggaagtt atttgaagaa actatattac agagagctta tgcaacactc ccactagttc 60 attttt 66 <210> 525 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 525 ctcggaagtt atttgaagaa actatattac agaagcttat gcaacactcc cactagttca 60 ttttt 65 <210> 526 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 526 ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60 tttt 64 <210> 527 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 527 ctcggaagtt atttgaagaa actatattac agagaagctt atgcaacact cccactagtt 60 cattttt 67 <210> 528 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 528 ctcggaagtt atttgaagaa actatattac agagcagctt atgcaacact cccactagtt 60 cattttt 67 <210> 529 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 529 ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60 tcattttt 68 <210> 530 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 530 ctcggaagtt atttgaagaa actatattac agaaagctta tgcaacactc ccactagttc 60 attttt 66 <210> 531 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 531 ctcggaagct tatgcaacac tcccactagt tcattttt 38 <210> 532 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 532 ctcggaagtt atttgaagaa actatattac agagcgctta tgcaacactc ccactagttc 60 attttt 66 <210> 533 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 533 ctcggaagtt atttgaagaa actatattac agaggcttat gcaacactcc cactagttca 60 ttttt 65 <210> 534 <211> 70 <212> DNA <213> Zea maize <400> 534 ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60 gttcattttt 70 <210> 535 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 535 ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60 tttt 64 <210> 536 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 536 ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60 tcattttt 68 <210> 537 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 537 ctcggaagtt atttgaagaa actatattac agagcagctt atgcaacact cccactagtt 60 cattttt 67 <210> 538 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 538 ctcggaagtt atttgaagaa actatattac agagcgctta tgcaacactc ccactagttc 60 attttt 66 <210> 539 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 539 ctcggaagtt atttgaagaa actatattac agagcactta tgcaacactc ccactagttc 60 attttt 66 <210> 540 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 540 ctcggaagtt atttgaagaa actatattac agtatgcaac actcccacta gttcattttt 60 <210> 541 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 541 ctcggaagtt atttgaagaa actatattac agagctatgc aacactccca ctagttcatt 60 ttt 63 <210> 542 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 542 ctcggaagtt atttgaagaa actatattac agatatgcaa cactcccact agttcatttt 60 t 61 <210> 543 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 543 ctcggaagtt atttgaagaa actatattat gcaacactcc cactagttca ttttt 55 <210> 544 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 544 ctcggaagtt atttgaagaa acttatgcaa cactcccact agttcatttt t 51 <210> 545 <211> 74 <212> DNA <213> Homo sapiens <400> 545 gttttgtggg caacatgctg gtcatcctca tcctgataaa ctgcaaaagg ctgaagagca 60 tgactgacat ctac 74 <210> 546 <211> 74 <212> DNA <213> Homo sapiens <400> 546 gtagatgtca gtcatgctct tcagcctttt gcagtttatc aggatgagga tgaccagcat 60 gttgcccaca aaac 74 <210> 547 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 547 tataaatacc ttct 14 <210> 548 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 548 tggagccatc tggccgggt 19 <210> 549 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 549 tgaacagaat ctgcgcggt 19 <210> 550 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 550 gtgaacagaa tctgcgcggt tataaccagc caacccggcc agatggctcc gc 52 <210> 551 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 551 ccagggctag gtcgacgaag cttggatccg tac 33 <210> 552 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 552 gtgaacagaa tctgcgcggt tataaccagc caacccggcc agatggctcc gc 52 <210> 553 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 553 accaggctag gtcgacgaag cttggatccg tac 33 <210> 554 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 554 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly <210> 555 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 555 Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys 1 5 10 15 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala 20 25 30 His Gly

Claims

적어도 하나의 TALE-반복 단위;
N-캡 폴리펩타이드; 및
TALE 단백질의 단편을 포함하는 C-캡 폴리펩타이드
를 포함하는, 단리된 비-천연 발생 DNA 결합 폴리펩타이드.
청구항 1에 있어서, 적어도 하나의 TALE-반복 단위는 비전형적인 반복 가변 2잔기 (RVD)를 포함하는, 단리된 폴리펩타이드.
청구항 2에 있어서, 상기 단백질은 표 27에서 보여진 비전형적인 RVD를 포함하는, 폴리펩타이드.
청구항 1 내지 3 중 어느 한 항에 있어서, 상기 C-캡 폴리펩타이드는 그 길이가 대략 230개 미만의 아미노산인, 폴리펩타이드.
청구항 1 내지 5 중 어느 한 항에 있어서, 상기 C-캡은 TALE 반복 도메인을 포함하는, 폴리펩타이드.
청구항 1 내지 5 중 어느 한 항의 폴리펩타이드, 및 적어도 하나의 기능적 도메인을 포함하는, 융합 단백질.
청구항 6에 있어서, 상기 기능적 도메인은 전사 활성제 또는 전사 억제제인, 융합 단백질.
청구항 7 에 있어서, 상기 기능적 도메인은 뉴클레아제를 포함하는, 융합 단백질.
청구항 8에 있어서, 상기 뉴클레아제는 TypeIIS 엔도뉴클레아제로부터의 적어도 하나의 절단 도메인 또는 절단 반-도메인을 포함하는, 융합 단백질.
청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드 또는 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질을 인코딩하는, 폴리뉴클레오타이드.
청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드, 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 청구항 10에 따른 폴리뉴클레오타이드를 포함하는, 숙주세포.
청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드, 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 청구항 10에 따른 폴리뉴클레오타이드를 포함하는 약제학적 조성물.
세포에서 내인성 유전자의 발현을 조절하는 방법으로서,
상기 방법은 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 상기 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 상기 세포에 도입하는 것을 포함하며, 상기 융합 단백질은 내인성 유전자에서 표적 부위에 결합하는 TALE-반복 도메인을 포함하고, 또한 내인성 유전자의 발현이 조절되는, 방법.
청구항 13에 있어서, 상기 조절은 유전자 활성화를 포함하는, 방법.
청구항 13에 있어서, 상기 조절은 유전자 억제 또는 불활성화를 포함하는, 방법.
청구항 15에 있어서, 상기 융합 단백질은 절단 도메인 또는 절단 반-도메인을 포함하고, 상기 내인성 유전자는 절단에 의해 불활성화되는, 방법.
청구항 16에 있어서, 불활성화는 비-상동 말단 연결 (NHEJ)을 통해 일어나는, 방법.
세포의 게놈에서 관심 영역을 변형시키는 방법으로서,
상기 방법은 청구항 8 또는 9에 따른 적어도 하나의 융합 단백질 또는 상기 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 세포에 도입하는 것을 포함하며, 상기 융합 단백질은 세포의 게놈에서 표적 부위에 결합하는 TALE-반복 도메인을 포함하고, 상기 융합 단백질은 관심 영역에서 게놈을 절단하는, 방법.
청구항 18에 있어서, 상결 변형은 관심 영역에서 결실을 도입하는 것을 포함하는, 방법.
청구항 18에 있어서, 상기 변형은 외인성 핵산을 관심 영역에 도입하는 것을 포함하며, 상기 방법은 상기 외인성 핵산을 세포에 도입하는 것을 추가로 포함하며, 상기 외인성 핵산은 상동 재조합 또는 NHEJ 매개된 말단 포획에 의해 관심 영역에 통합되는, 방법.
청구항 13 내지 20 중 어느 한 항에 있어서, 상기 세포는 식물 세포, 동물 세포, 물고기 세포 및 효모 세포로 이루어진 그룹으로부터 선택된 원핵세포인 방법.