KR20230131178A

KR20230131178A - 변형된 엔도뉴클레아제를 사용한 유전자 편집

Info

Publication number: KR20230131178A
Application number: KR1020237018690A
Authority: KR
Inventors: 브렌트 이 스테드; 토마스 에이 맥머로우; 오디쇼 케이 이스라엘
Original assignee: 스페시픽 바이오로직스 인크.
Priority date: 2020-11-04
Filing date: 2021-11-04
Publication date: 2023-09-12
Also published as: AU2021373368A9; IL302583A; JP2023548391A; EP4240839A4; WO2022097070A9; EP4240839A1; CN116669775A; US20240150796A1; AU2021373368A1; WO2022097070A1; CA3197414A1

Abstract

본 개시내용은 독특한 결합 및 절단 성질을 가진 조작된 뉴클레아제, 및 유전자 편집을 위해 상기 변형된 엔도뉴클레아제를 사용하여 세포 유전자 발현을 변경하는 방법에 관한 것이다.

Description

변형된 엔도뉴클레아제를 사용한 유전자 편집

상호참조

본원은 전체적으로 본원에 참고로 포함되는, 2020년 11월 4일에 출원된 미국 가출원 제63/109,396호의 이익을 주장한다.

세포 요법은 건강한 인간 세포를 주입하여 손상된 조직을 재생하거나, 누락 또는 오작동 효소 또는 단백질을 생성하거나, 암을 비롯한 무수한 질환들에 대한 의학적 치료로서 면역 세포 기능을 활용한다. 암은 평생 동안 미국인의 약 1/3에 영향을 미치며 이 수치는 상승할 것으로 예상된다. 암은 유방, 폐, 전립선, 피부색, 방광 피부 및 혈액을 비롯한 거의 모든 장기 시스템에서 발생할 수 있다. 대부분의 치료는 오프-표적 효과 및 광범위한 부작용을 나타내는 독성 물질(화학요법제 및 방사선)을 다량 투여하고 종종 영향을 받은 조직의 침습적 절제를 포함한다. 면역요법은 환자 자신의 면역 시스템을 사용하여 암 세포를 표적으로 하여 사멸시킨다. 세포 면역요법은 전형적으로 유전자 편집을 통해 환자의 면역 세포를 프로그래밍하여, 이러한 세포를 표적으로 하여 암 세포를 선택적으로 사멸시키는 단계를 포함한다. 종양을 공격하도록 환자의 면역 세포를 변형시키는 것은 효과적이고 덜 침습적인 치료가 될 가능성이 있다. 손상된 조직을 재생하거나 누락 또는 오작동 효소를 생성하기 위한 조작된 세포 요법은 유전자 편집 기술을 통해 프로그래밍된 환자 자신의 세포 및 종종 유도 다분화능 줄기 세포도 사용한다. 유전자 편집 기술의 적용은 환자의 면역 세포 또는 줄기 세포의 변화를 가능하게 하고 다양한 질환 및 병태에 대한 요법 또는 치료의 일부로서 이용될 수 있다.

유전자 편집은 디자이너 뉴클레아제에 의존하여 특정 DNA 서열을 인식하고 절단한 후, 선천성 세포 DNA 복구 경로, 즉 비상동 말단 연결(NHEJ) 및 상동성 유도 복구(HDR)를 이용하여 표적화 변형을 게놈에 도입하는 유전자 치료 접근법이다. 이러한 뉴클레아제는 관심 있는 표적 유전자좌에서 이중 가닥 절단을 정확하게 도입하도록 설계될 수 있다. 유전자 편집은 생체외 및 생체내 환경 둘 다에서 표적화 파괴, 삽입, 절제 및 보정을 가능하게 함으로써 관심 있는 게놈 서열을 영구적으로 변형시킬 수 있는 가능성을 열어준다. 기존 유전자 편집 기술, 예컨대, CRISPR-Cas9(및 Cas9 융합체), 메가뉴클레아제, 징크 핑거 단백질, 제IIS형 제한 엔도뉴클레아제(FokI 및 FokI 융합체) 및 TALENS는 많은 유전 질환들에 대한 치료제로서 의미가 있을 만큼 충분한 수의 세포에서 특정 길이의 유전자 결실을 도입하거나 표적 유전자를 정확하게 복구하는 능력 면에서 제한된다. 더욱이, 고도로 프로그래밍 가능한 RNA-가이드 뉴클레아제, 예컨대, 단량체 Cas9의 경우, 연구는 그의 표적 부위에만 예측 가능하게 결합하고 절단하고 복구하기 위한 특이성이 제한된다고 암시하므로, 환자에서 의도치 않게 2차 질환을 야기할 수 있는, 세포 게놈 DNA의 잠재적인 유해한 변화에 대한 우려가 제기된다.

박테리아의 선천성 면역 시스템을 구성하는 제II형 CRISPR 시스템의 구성요소인 Cas9(CRISPR 관련) 단백질은 그의 사용 용이성으로 인해 게놈 편집 분야에서 패러다임 변화를 야기하였다. 원하는 서열을 절단하도록 Cas9를 프로그래밍하는 것은 표적 부위에 상보적이도록 Cas9 관련 가이드 RNA의 서열을 변경하는 간단한 문제이다. Cas9 표적화 프로그래밍의 용이성은 다른 시약(징크 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성화제 유사 이펙터 뉴클레아제(TALEN))에 필요한 보다 집중적인 단백질 조작과 대조된다. Cas9는 제II형 CRISPR 시스템의 단백질과 함께, 다양한 유기체에서 무수한 게놈 편집 적용에 사용되었으며 현재 인간에서 치료 적용 영역에 진입하고 있다. 스페시픽 바이올로직스(Specific Biologics)(캐나다 온타리오주 토론토)라는 이름으로 공개된 국제 특허 출원(PCT/IB2020/054229, 이의 내용은 본원에 참고로 포함됨)은 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 92, I-TevI 링커 영역의 아미노산 93 내지 169를 포함하는 링커 영역 및 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9("saCas9") 도메인을 포함하는 버전인 이중 절단 키메라 뉴클레아제 TevSaCas9를 설명한다. 이 출원은 TevSaCas9를 제조하는 방법도 설명한다. 관련된 암을 표적으로 하도록 면역 세포를 변형시키기 위한 TevSaCas9의 변형은 암 치료 세포 요법의 효율 및 효과를 더 높일 수 있다. 또한, 줄기 세포를 변형시키기 위한 TevSaCas9의 변형은 손상된 조직의 치료 또는 누락 효소 또는 단백질의 교체의 효과를 더 높일 수 있다.

면역 시스템은 표면 단백질(항원)을 식별함으로써 외래 물질 및/또는 세포를 인식한다. T 세포 표면에 존재하는 수용체는 항원을 표적으로 하고 T 세포를 활성화시킬 뿐만 아니라 다른 다운스트림 면역 경로도 시작한다. 키메라 항원 수용체 T 세포(CAR-T 세포)는 면역요법 및 혈액과 고형 종양의 치료에 사용되는 인공 T 세포 수용체(TCR)를 생성하는 유전적으로 변형된 T 세포이다. CAR-T 세포 요법은 T 세포가 환자로부터 채취되고 암 세포에 특이적인 항원을 인식하도록 유전적으로 변경되는 세포 요법의 일종이다. 변형된 세포는 암 조직을 표적으로 하고 파괴하기 위해 환자에게 다시 주입된다. T 세포는 환자의 혈액(자가) 또는 건강한 공여자의 혈액(동종)으로부터 채취될 수 있다. 항원 인식 시, 자극된 CAR-T 세포는 증식, 세포독성, 및 다른 세포 유형을 활성화시키는 추가 인자, 예컨대, 사이토카인, 인터류킨 및 성장 인자의 분비를 증가시킨다. 세포 고갈, 독성 및 삽입 발암을 제한하기 위해 세포 요법(예컨대, 키메라 항원 수용체 T 세포 요법)에서는 유전자를 넉아웃시키는 것이 바람직하다(Lui J et al., (2019), Front Immunol, 10(456):1-8).

현재 기술은 주로 세포 요법의 생성을 위한 바이러스 벡터의 사용에 의존한다. 바이러스 벡터의 사용은 매우 효율적이지만, 안전성에 관한 의문이 남아 있다. 세포 요법을 변형시키는 데 이용되는 무작위 삽입은 오프-표적 내생성 유전자 기능을 파괴할 수 있고 종양형성(즉, 암) 및 세포 독성을 유발할 수 있다. 효과적인 세포 요법을 생성하기 위해 안전하고 효율적인 도구가 표적 유전자의 정확한 파괴 및 외래 DNA의 통합에 필요하다. CRISPR 기술을 세포 요법에 적용하면 CAR T 세포의 키메라 항원 수용체 및 내생성 유전자를 더 잘 변형시킬 수 있고 현재 T 세포 요법의 한계를 극복할 수 있다. 이러한 발전이 해당 분야에서 전반적으로 혁명을 일으킬 것으로 예상되지만, 현재 유전자 편집 접근법은 변형의 효능, 뉴클레아제의 특이성과 관련된 안전성 문제, 및 표적 세포 유형으로의 유전자 편집 도구의 전달에 의해 제한된다. 본 발명의 첫 번째 단계는 증가된 효율로 (개별적으로 및 동시에) 유전자를 넉아웃시키거나 외생성(exogenous) 유전자, 예컨대, 키메라 항원 수용체(CAR)를 발현시키기 위해 면역 세포(예컨대, T 세포) 또는 유도 다분화능 줄기 세포(iPSC)의 DNA를 변형시켜 이 세포들을 조작하도록 의도적으로 설계되었다. 본 발명은 다른 세포 유형을 조작하는 데 사용될 수도 있다.

본원은 숙주 거부를 제거하고 세포 요법의 효과를 증가시키기 위해 I-TevI 도메인의 변형된 버전, 링커 펩티드, 및 유전자를 표적으로 하도록 설계된 RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9("SaCas9") 도메인의 변형된 버전을 포함하는 키메라 뉴클레아제("TevSaCas9"로서 지칭됨)를 기술한다. 표적화 세포로 전달될 때, 신규 키메라 뉴클레아제는 외생성 공여자 DNA의 존재 하에 DNA 서열을 교체하거나 외생성 공여자 DNA의 부재 하에 DNA를 결실시킨다. 청구된 본 발명의 또 다른 측면은 유전자를 편집하는 방법 및 본원에 기재된 편집된 유전자로 세포 요법을 생성하는 방법에 관한 것이다. 본원은 I-TevI 도메인 및 CasX 또는 Cas12 뉴클레아제로부터 형성된 키메라 뉴클레아제도 기술한다.

본원은 (a) B2M, TRAC1, TRCB1 및/또는 HLA-A 유전자의 특정 부위를 표적으로 하여 아웃-오프-프레임(out-of-frame) 결실을 생성하는 TevSaCas9의 신규 유사체; (b) 전기천공에 적합한 뉴클레아제 및 외생성 공여자 DNA의 제제; (c) 세포에서 동시에 B2M, TRAC1, TRCB1 및/또는 HLA-A 중 하나 이상을 표적으로 하는 뉴클레아제의 제제(다중체화 유전자 파괴); (d) AAVS1 유전자의 안전한 은닉 부위(safe harbor site)로 표적화된 TevSaCas9 뉴클레아제와 함께 전달될 때 뉴클레아제에 의해 표적화된 2개의 부위 사이에 통합될 수 있는 외생성 공여자 DNA를 함유하는 본 발명의 버전; 및 (e) 변형된 I-TevI 도메인, 링커 도메인 및 RNA-가이드 뉴클레아제 도메인을 포함하는 키메라 뉴클레아제의 신규 유사체를 기술한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 생체외 세포 집단에 투여하는 단계를 포함하는, 유전적으로 조작된 세포 조성물을 제조하는 방법을 기술하는 것으로, 이때 상기 세포 집단은 면역 세포 및 다분화능 세포 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 K26R 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 링커는 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 T95S, V117F, K135R, N140S 또는 Q158R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열로부터 선택된 펩티드이다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스트렙토코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 T267A, L325F, V327I, D333G, A336S, I341L, E345D, D348N, K352E, S360A, T368A, N369E, N371E, S372P, E373K, K386T, N393R, H408N, N410S, I414M, A415T, T438S, Y467F, N471K, D485E, M489F, E506K, R409K, T510E, N515K, Y518F, A539P, F550Y, N551H, S596A, T602I, A611S, I617V, T620K, G654E, N667D, R685K, K695Q, I706V, K722T, A723T, K724N, M731T, F732V, K735Q, S739N, P741L, E742G, E746D, Q747D, I754D, T755I, H757R, K760Q, H761S, P778I, E781K, I783V, N784D, D785E, T786L, L787V, Y788H, K792E, D794T, T798R, L799I, V801I, N803S, L804I, N805K, G806N, D813G, K814E, L818I, I819F, S822P, E824G, L841T, G847S, D848N, Y857H, V875I, I876V, N884K, A888V, L890R, D894G, D895H, P897L, V903I, G920D, F924L, N929Y, E936D, N937G, V941I, N942D, S943L, C945A, E947K, K951R, L952Q, S956N, N957E, Q958K, A959S, N974D, G975K, V983A, N984S, N985D, D986G, I991V, V993L, M995F, I996V, T999N, Y1000K, R1001E, E1002D, L1004I, E1005K, N1006M, M1007N, D1009L, K1010S, R1011T, P1012S, P1013F, I1015L, I1016R, A1020G, S1021K, Q1024K, K1027S, E1039K, H1045K, I0148M 또는 K1050M 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 D10E 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함하고, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인은 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 표적 세포의 게놈 DNA로 전달된다. 특정 실시양태에서, 세포 집단은 면역 세포를 포함한다. 특정 실시양태에서, 면역 세포는 T 세포이다. 특정 실시양태에서, 면역 세포는 천연 킬러(NK) 세포이다. 특정 실시양태에서, 세포 집단은 다분화능 세포를 포함한다. 특정 실시양태에서, 다분화능 세포는 유도 다분화능 세포이다. 특정 실시양태에서, 다분화능 세포는 조혈 줄기 세포 또는 이의 전구체를 포함한다. 특정 실시양태에서, 다분화능 세포는 중간엽 줄기 세포 또는 이의 전구체를 포함한다. 특정 실시양태에서, 다분화능 세포는 유도 다분화능 세포이다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 DNA 발현 카세트를 사용함으로써 표적 세포의 게놈 DNA로 전달된다. 특정 실시양태에서, 상기 방법은 바이러스 벡터를 사용하지 않는다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 전기천공을 이용함으로써 상기 생체외 세포 집단에 투여된다. 특정 실시양태에서, 전기천공은 1000 내지 2500 V의 전류에서 적용된다. 특정 실시양태에서, 방법은 공여자 DNA를 세포 집단에 투여하는 단계를 추가로 포함한다. 특정 실시양태에서, 공여자 DNA는 블런트 말단 및 2개의 뉴클레오타이드 3' 오버행 말단을 포함한다. 특정 실시양태에서, 공여자 DNA는 관심 있는 외생성 유전자를 플랭킹하는 5' 및 3' 상동성을 포함한다. 특정 실시양태에서, 상기 공여자 DNA는 외생성 유전자를 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 공여자 DNA의 부재 하에 투여된다. 특정 실시양태에서, 키메라 뉴클레아제는 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 규정된 길이의 게놈 DNA를 결실시킨다. 특정 실시양태에서, 상기 외생성 유전자는 키메라 항원 수용체를 발현한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 B2M 유전자, TRAC1 유전자, TRCB1 유전자, HLA-A 유전자 또는 HLA-B 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 17 또는 서열번호 18, 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 B2M 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 19 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 TRAC1 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 20 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 TRCB1 유전자를 표적화한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 21 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 HLA-A 유전자를 표적으로 하고 절단한다. 특정 실시양태에서, 상기 키메라 뉴클레아제의 가이드 RNA는 서열번호 22 또는 이의 단편을 포함하고; 이때 상기 키메라 뉴클레아제는 AAVS1 유전자를 표적화한다. 특정 실시양태에서, AAVS1 유전자는 외생성 공여자 DNA의 존재 하에 표적화된다. 특정 실시양태에서, 키메라 뉴클레아제는 AAVS1 유전자의 2개의 부위를 표적화한다. 특정 실시양태에서, 외생성 공여자 DNA는 AAVS1 유전자의 2개의 표적화 부위 사이에 통합된다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체(mimetic), 변형된 당 모이어티(moiety) 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스(Planctomycetes) 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아(Deltaproteobacteria)로부터 유래한다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TEVI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TEVI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스(Acidaminococcus) 종 BV3L6으로부터 유래한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, K28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드, 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다. 특정 실시양태에서, 키메라 뉴클레아제는 가이드 RNA를 추가로 포함한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 게놈 표적을 표적화한다. 특정 실시양태에서, 가이드 RNA는 포유동물 세포에서 발암성 돌연변이를 표적화한다. 특정 실시양태에서, 포유동물 세포는 인간 세포이다. 특정 실시양태에서, 가이드 RNA는 박테리아 또는 바이러스 서열을 표적화한다. 특정 실시양태에서, 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함한다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다. 본원은 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산을 기술한다. 특정 실시양태에서, 키메라 뉴클레아제 및/또는 가이드 RNA는 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된다. 특정 실시양태에서, 핵산은 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터이다. 특정 실시양태에서, 키메라 뉴클레아제는 개체에게 투여되도록 제제화된다. 본원은 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물도 기술한다. 본원은 지질 나노입자에 캡슐화된 키메라 뉴클레아제를 포함하는 조성물도 기술한다. 특정 실시양태에서, 지질 나노입자는 양이온성 지질 및/또는 중성 지질을 포함한다.

본 발명의 하기 상세한 설명은 본 발명의 일부를 형성하고 본 발명이 실시될 수 있는 특정 실시양태를 예시적으로 보여주는 첨부된 도면을 참조한다. 이 실시양태는 당분야의 숙련된 자가 본 발명을 실시할 수 있도록 충분히 상세하게 설명된다. 다른 실시양태를 이용할 수 있고, 본 발명의 범위를 벗어나지 않으면서 구조적 및 논리적으로 변화시킬 수 있다. 지금부터 단지 예로서 첨부된 도면을 참조할 것이다.
도 1의 A 내지 F는 TevSaCas9가 다수의 가이드 RNA와 복합체를 형성하고 세포 내로 전기천공되어 내생성 T 세포 수용체를 코딩하는 유전자를 파괴하고 외생성 키메라 항원 수용체(CAR)를 코딩하는 서열을 삽입하는 기작의 도면을 도시한다.
도 2의 A 및 B는 B2M 유전자로 표적화된 TevSaCas9가 B2M 유전자를 절단함을 예증한다.
도 3의 A 및 B는 AAVS1 유전자로 표적화된 TevSaCas9가 AAVS1 유전자를 절단함을 예증한다.
도 4의 A 및 B는 TevSaCas9 절단(검은색) 및 절단 부위 내로의 공여자 복구 주형(회색) 삽입 후 B2M 유전자의 표적 부위를 나타내고 복구가 일어남을 보여주는 도면을 보여준다.
도 5의 A 및 B는 TevSaCas9에 의한 절단 후 게놈 내의 AAVS1 안전한 은닉 부위(검은색)를 도시하는 도면이고, 절단된 부위에 삽입된 GFP 리포터의 발현을 보여준다.
도 6은 서열번호 20의 가이드를 사용함으로써 TRBC1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 TRBC1 표적 부위를 절단함을 예증한다.
도 7의 A는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드가 AAVS1 표적 부위에 삽입됨을 예증한다.
도 8의 A 및 B는 전기천공된 리보핵단백질 TevSaCas9가 포유동물 세포에서 B2M 표적 부위를 편집함을 예증한다.
도 9의 A 및 B는 I-TevI과 Cas12a의 융합체가 가이드 RNA에 의해 활성화되어 이중 가닥 DNA 기질을 절단함을 예증한다.
도 10은 상이한 핵 국소화 신호(NLS)를 가진 HEK293 세포의 TevSaCas9에 의한 B2M 유전자의 절단을 예증한다.

하기 설명에서, 본원에 개시된 본 실시양태의 철저한 이해를 제공하기 위해 특정 양, 크기 등과 같은 특정 세부사항이 기재된다. 그러나, 본 개시내용이 이러한 특정 세부사항 없이 실시될 수 있다는 것은 당분야의 숙련된 자에게 자명할 것이다. 많은 경우, 이러한 고려사항 등에 관한 세부사항은 본 개시내용의 완전한 이해를 얻기 위해 필요하지 않고 관련 분야에서 통상의 기술을 가진 자의 기술 내에 있기 때문에 생략되었다.

생체외 유전자 편집 방법

본 개시내용은 기존 유전자 편집 기술 및 방법에 비해 다음과 같은 이점을 나타내는 키메라 뉴클레아제 및 생체외 유전자 편집 방법을 기술한다. 예를 들어, 뉴클레아제가 2개의 부위에서 절단하는 경우, 이 뉴클레아제는 정확한 길이의 DNA를 절단한다(I-TevI 및 SaCas9에 의해 표적화된 부위에 따라 약 30개 내지 38개 염기). 본원에 기재된 방법은 게놈으로부터 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개 또는 40개 뉴클레오타이드의 정확한 결실을 생성할 수 있다. 따라서, 표적 부위는 세포에서 유전자 아웃-오프-프레임을 녹킹(knocking)할 정확한 길이 결실을 생성하도록 유전자에서 선택될 수 있다. 기재된 뉴클레아제의 한 실시양태에서, 뉴클레아제는 B2M 유전자(서열번호 1)(MHC 클래스 I 분자의 베타 쇄, 베타-2-마이크로글로빈, IMD43으로서도 알려짐)를 표적으로 하고 절단하여, 다수의 아웃-오프-프레임 결실로 B2M의 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 B2M 유전자(서열번호 2)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 TRAC 유전자(서열번호 3)(TRA, IMD7, TCRA, TRCA, T 세포 수용체 알파 유전자좌, TCRD 및 T 세포 수용체 유전자좌로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 실시양태에서, 뉴클레아제는 TRCB 유전자(서열번호 4)(T 세포 수용체 베타 유전자좌, TCRBC1, BV05S1J2.2로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 기재된 뉴클레아제의 또 다른 버전은 HLA-A 유전자(서열번호 5)(주조직적합성 복합체, 클래스 I, A, HLA 클래스 I 조직적합성 항원, A 알파 쇄, HLAA, HLA 클래스 I 조직적합성 항원, A-1 알파 쇄, MHC 클래스 I 항원 HLA-A 중쇄, 백혈구 항원 클래스 I-A 및 인간 백혈구 항원 A로서도 알려짐)를 표적으로 하고 절단하여, 단일 아웃-오프-프레임 결실로 판독 프레임을 파괴한다. 상기 기재된 뉴클레아제들 중 2개 이상의 뉴클레아제의 조합은 세포에서 각각의 유전자의 판독 프레임을 동시에 파괴할 수 있다. 외생성 공여자 DNA의 존재 하에, 기재된 뉴클레아제는 기존 기술 또는 관행보다 더 높은 퍼센트의 세포에서 표적 DNA 서열을 교체하도록 설계된다. 기재된 뉴클레아제의 추가 실시양태는 AAVS1 유전자좌(서열번호 6)(아데노 관련 바이러스 통합 부위 1 및 AAV로서도 알려짐)를 표적으로 하고 절단한다. 본원에 기재된 실시양태의 또 다른 버전, 즉 AAVS1 유전자좌(서열번호 7)를 표적으로 하고 절단하는 뉴클레아제는 표적 DNA 삽입을 위해 뉴클레아제 절단 부위에 상보적인 말단을 가진 이중 가닥 공여자 DNA 부분으로 향한다.

본 개시내용은 게놈 위치에서 뉴클레오타이드 서열을 삽입 변형시키거나, 결실시키거나 교체하기 위해 기재된 뉴클레아제를 사용하여 세포 집단을 유전적으로 조작하는 방법을 기술한다. 단계는 키메라 뉴클레아제 가이드 RNA 복합체를 형성하는 단계 및 키메라 뉴클레아제 가이드 RNA 복합체를 세포에 투여하는 단계를 포함한다. 이 투여는 전기천공 또는 지질 매개 형질감염(예를 들어, 양이온성 지질) 중 하나 이상의 방법을 이용함으로써 일어날 수 있다. 대안적으로, 가이드 RNA 및/또는 키메라 뉴클레아제를 코딩하는 핵산 또는 복수의 핵산은 전기천공, 바이러스 형질도입 및/또는 지질 매개 형질감염으로부터 선택된 방법을 이용함으로써 세포 내로 전달될 수 있다. 게놈을 변경하기 위해 게놈 서열이 추가되는 실시양태에서, 삽입 또는 변경을 달성하기 위해 공여자 DNA도 투여할 수 있다. 공여자 DNA는 선형화된 DNA, 플라스미드 DNA 또는 바이러스 벡터로서 적절하게 제공될 수 있다.

한 측면에서, 본원에 기재된 생체외 유전자 편집 방법을 이용하여 CAR T 또는 CAR NK 세포를 생성한다. 도 1의 A에 예증된 바와 같이, 정제된 TevSaCas9 단백질(1)을 다수의 가이드 RNA(2)와 혼합하여 리보핵단백질 복합체(3)를 형성한다. TevSaCas9에 의해 표적화된 하나 이상의 부위에 상보적인 말단을 함유하는 외생성 공여자 CAR을 코딩하는 공여자 DNA(4)도 리보핵단백질 복합체(3)와 혼합한다. 도 1의 B에 나타낸 바와 같이, 게놈 DNA(7)로부터 발현된 내생성 T 세포 수용체(6)를 코딩하는 T 세포 집단(5)을 리보핵단백질 복합체(3)와 공여자 DNA(4)의 혼합물에 노출시킨다. 도 1의 C에 나타낸 바와 같이, 전기 펄스(8)를 혼합물에 인가하여, 세포막(9)을 투과 가능하게 만든다. 도 1의 D에 도시된 바와 같이, 리보핵단백질 복합체(3) 및 공여자 DNA(4)는 투과 가능한 세포막을 통해 T 세포로 들어간다. 리보핵단백질 복합체(3)는 하나 이상의 핵 국소화 서열("NLS")을 통해 핵(10)으로 표적화된다. 도 1의 E에 나타낸 바와 같이, 리보핵단백질 복합체(3)는 게놈 DNA(7)에서 그의 표적 부위에 결합할 것이다. 도 1의 F에 도시된 바와 같이, 리보핵단백질 복합체(3)는 게놈 DNA(7)를 절단하여 규정된 길이 결실(12)을 생성하거나, 양립 가능한 공여자 DNA(13)가 존재하는 경우, 공여자 DNA(13)를 절단된 부위에 삽입할 것이다. 결실된 게놈 DNA(7)의 영역은 내생성 T 세포 수용체(6)를 코딩하는 유전자를 파괴하고 공여자 DNA(13)는 외생성 CAR(14)을 코딩하여 T 세포를 신규 항원 쪽으로 표적화한다.

청구된 폴리펩티드는 면역 내성 및/또는 외생성 유전자, 예컨대, 키메라 항원 수용체(CAR)의 발현을 위해 면역 세포(예컨대, T 세포), 조혈 줄기 세포, 중간엽 줄기 세포 또는 유도 다분화능 줄기 세포(iPSC)의 DNA를 변형시켜 이 세포를 조작하도록 설계되지만, 이러한 세포 유형으로 제한되지 않는다. 본원에 기재된 방법 및 뉴클레아제에 의해 생체외 변형될 수 있는 세포 유형은 면역 세포, 예컨대, T 세포 또는 NK 세포; 또는 다분화능 세포, 예컨대, 중간엽 줄기 세포, 조혈 줄기 세포, 또는 당분야에 공지된 기법을 이용함으로써 다분화능을 갖도록 유도된 세포를 포함한다.

또한, 본 개시내용은 인간 세포의 게놈에서 DNA 서열의 전부 또는 일부를 표적화 유전자 파괴하여 유전자 아웃-오프-프레임을 녹킹하는 방법으로서, (a) 세포를 생체외에서 뉴클레아제에 노출시키는 단계; 및 (b) 1000 내지 2500 V의 전류를 세포 집단에 인가하여 막을 투과 가능하게 만들어, 청구된 뉴클레아제가 세포 내로 통과할 수 있게 하는 단계를 포함하는 방법에 관한 것이다. 1000 내지 1500 V, 1501 내지 1700 V, 1701 내지 1900 V, 1901 내지 2100 V, 또는 2101 내지 2500 V의 범위의 전류도 인가될 수 있다. 뉴클레아제는 또한 지질감염(lipofection) 또는 중합체 기반 형질감염(transfection)의 이용, 또는 아데노 관련 바이러스 또는 렌티바이러스와 같은 바이러스 벡터의 사용을 통해 세포로 전달될 수 있다. 뉴클레아제는 리보핵단백질 복합체, 뉴클레아제를 코딩하는 DNA 또는 뉴클레아제를 코딩하는 메신저 RNA로서 전달될 수도 있다. 진핵생물 세포에서, 기재된 뉴클레아제(TevSaCas9를 포함함)는 하나 이상의 핵 국소화 서열("NLS")을 통해 세포의 핵을 표적화할 수 있다. 면역 내성 세포 생성의 적용을 위해, B2M, TRAC1, TRBC1, HLA-A 또는 AAVS1(서열번호 1 내지 6) 중 하나 이상을 표적으로 하는 뉴클레아제의 혼합물을 세포 집단에 적용한다. 뉴클레아제를 정확한 게놈 위치로 표적으로 하기 위한 특이적 가이드 RNA는 핵산 또는 메신저 RNA에 의해 코딩되는 뉴클레아제와 함께 포함될 수 있다. DNA의 교체, 복구 또는 삽입을 게놈 위치로 표적으로 하는 적용을 위해, 공여자 DNA는 선형 이중 가닥 DNA, 플라스미드 또는 바이러스 벡터에 의해 단리 및 정제된 핵산으로서 포함될 수도 있다. 공여자 DNA는 뉴클레아제 및 가이드 RNA와 함께 제공될 수 있거나, 별도의 제제로 따로 제공될 수 있거나, 뉴클레아제 및 가이드 RNA의 전달에 비해 상이한 방법에 의해 전달될 수 있다.

본원은 규정된 길이의 DNA 서열을 인간 세포 내로 표적화 삽입하는 방법으로서, (a) 세포를 생체외에서 신규 뉴클레아제에 노출시키는 단계; (b) 1000 내지 2500 V의 전류를 세포 집단에 인가하여 막을 투과 가능하게 만들어, 청구된 뉴클레아제가 세포 내로 통과할 수 있게 하는 단계를 포함하는 방법도 기술한다.

진핵생물 세포에서, 기재된 뉴클레아제(TevSaCas9를 포함함)는 하나 이상의 핵 국소화 서열("NLS")을 통해 세포의 핵을 표적화할 수 있다. 면역 내성 세포 생성의 적용을 위해, B2M, TRAC1, TRBC1, HLA-A 또는 AAVS1(서열번호 1 내지 6) 중 하나 이상을 표적으로 하는 뉴클레아제의 혼합물을 세포 집단에 적용한다.

외생성 공여자 DNA의 존재 하에, 세포는 비상동 말단 연결을 통한 유도 라이게이션(directed-ligation)을 이용하여 표적 게놈 DNA에서 2개의 절단된 부위 사이에 외생성 DNA 서열(전체 또는 일부)을 삽입할 수 있다.

조작된 CAR-T 세포의 적용을 위해, AAVS1 안전한 은닉 부위(서열번호 6)는 키메라 항원 수용체(CAR)를 코딩하는 DNA 서열(서열번호 7)을 함유하는 외생성 공여자 DNA에 의해 표적화된다.

본원은 I-TevI 도메인, 링커 도메인, SaCas9 도메인 및 가이드 RNA의 상이한 조합을 함유하는 키메라 뉴클레아제를 포함하는 신규 변형된 TevSaCas9 뉴클레아제에 관한 것이다. 구체적으로, 키메라 뉴클레아제는 (a) 서열번호 8의 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 I-TevI 도메인; (b) 서열번호 9 내지 14 중 어느 한 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 링커 도메인; 및/또는 서열번호 15 및 16 중 어느 한 아미노산 서열과 동일한 또는 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 saCas9를 포함할 수 있다.

B2M 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 17 또는 서열번호 18의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.

TRAC 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 19의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.

TRBC 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 20의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.

HLA-A 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 21의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.

AAVS1 유전자를 표적으로 하는 키메라 뉴클레아제는 (a) 전술된 바와 같은 키메라 뉴클레아제; 및 (b) 서열번호 22의 서열과 동일한 또는 적어도 약 90%, 95%, 97%, 98%, 99% 동일한 RNA 서열을 포함하는 가이드 RNA를 포함한다.

청구된 발명의 한 실시양태는 면역 내성 세포를 생성하기 위해 다수의 유전자를 동시에 편집하는 데 사용되는 조성물이다. 특히, 이 조성물은 키메라 뉴클레아제에 대해 등몰 비로 서열번호 17 및 19 내지 21의 서열에 따른 가이드 RNA의 혼합물과 조합되는, 이전 단락에서 상기 논의된 키메라 뉴클레아제의 혼합물에 관한 것이다. 또 다른 실시양태에서, 상기 조성물은 키메라 뉴클레아제에 대해 등몰 비로 서열번호 18 내지 21의 서열에 따른 가이드 RNA의 혼합물과 조합되는, 이전 단락에서 상기 논의된 키메라 뉴클레아제의 혼합물에 관한 것이다.

청구된 발명의 한 실시양태는 I-TevI 도메인, 링커 도메인 및 RNA-가이드 뉴클레아제 도메인의 상이한 조합을 함유하는 다른 키메라 뉴클레아제의 조성물이다. 특히, 이 조성물은 서열번호 44 내지 49의 키메라 뉴클레아제에 관한 것이다.

한 측면에서, 본원에 기재된 뉴클레아제는 2개의 상이한 뉴클레아제로부터 형성된 키메라 뉴클레아제이다. 키메라 뉴클레아제는 본원에 기재된 생체외 유전자 편집 적용 및 생체내 적용에 유용하다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아로부터 유래한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스 종 BV3L6으로부터 유래한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, 28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.

본원에 기재된 키메라 뉴클레아제는 본원에 기재된 Cas12, Cas9, CasX 또는 I-TevI 뉴클레아제의 기능성 단편을 포함할 수 있다. 이러한 기능성 단편은 N-말단 결실, C-말단 결실, 또는 뉴클레아제의 N-말단 및 C-말단을 보존하는 개재 결실 중 하나 이상을 포함할 수 있다. I-TevI 뉴클레아제의 이러한 기능성 단편은 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 93, I-TevI 링커 단편의 아미노산 94 내지 150, 징크 핑거 도메인의 아미노산 151 내지 170, 또는 인공 링커 도메인의 아미노산 171 내지 180 중 하나 이상을 포함할 수도 있다. I-TevI 뉴클레아제 도메인의 아미노산 R28은 DNA 절단을 위해 요구된다. 징크 핑거 도메인의 아미노산 C152, C154, C165 및 C168은 I-TevI 뉴클레아제 도메인에 의한 효율적인 DNA 절단을 위해 요구된다. SaCas9 도메인의 이러한 기능성 단편은 하나 이상의 아미노산도 포함할 수 있다. (서열번호 54를 기준으로) 특정 기능성 단편은 뉴클레아제 소엽(lobe)의 아미노산 1 내지 39 및 아미노산 434 내지 1052, 및 인식 소엽의 아미노산 41 내지 424로 본원에 기재되어 있다. 인식 도메인의 기능성 단편은 N-말단 뉴클레아제 소엽에 연결하기 위해 가교 나선 루프를 형성하는 아미노산 41 내지 72를 포함한다. 아미노산 425 내지 433은 인식 루프와 C-말단 뉴클레아제 소엽을 연결하기 위해 링커 루프 도메인을 포함한다. 뉴클레아제 소엽은 RuvC-I 도메인의 아미노산 1 내지 39, RuvC-II 도메인의 아미노산 434 내지 479, RuvC-III 도메인의 아미노산 649 내지 773, HNH 도메인의 아미노산 519 내지 627, 웨지(WED) 도메인의 아미노산 787 내지 908, PAM 상호작용(PI) 도메인의 아미노산 909 내지 1052 중 하나 이상의 기능성 단편을 추가로 포함한다. PAM 상호작용 도메인은 토포이소머라제(Topoisomerase) 상동성(TOPO) 도메인의 아미노산 909 내지 967 및 C-말단 도메인의 아미노산 968 내지 1052의 기능성 단편을 추가로 포함한다. HNH 도메인은 L1 링커 도메인의 아미노산 480 내지 518에 의해 RuvC-II 도메인에 연결되고 L2 링커 도메인의 아미노산 628 내지 648에 의해 RuvC-III 도메인에 연결된다. RuvC-III 도메인과 WED 도메인은 포스페이트 잠긴 루프 도메인의 아미노산 774 내지 786에 의해 연결된다. saCas9 도메인의 아미노산 D10, H557 및 N580은 DNA 절단에 필요하다.

뉴클레아제

일부 실시양태에서, 변형된 TevSaCas9 뉴클레아제의 조성물은 본원에 기재된 바와 같이 I-TevI, SaCas9 도메인 및 가이드 RNA의 상이한 조합을 함유한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, CasX 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 임의로 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 R11K, R12K, V14S, K15A, S17N, N18A, A22V, G23S, T25S, P38D, K41K, E42K, N46K, L47R, N53V, I54M, P57V, T61N, S62A, R63A, A64N, E75K, H82Q, Q89K, P104S, N106K, I113K, N199K, S124T, S125A, C133G, Y137F, N145S, D146E, H151Y, S161A, R165K, N177S, L180A, R202K, N205T, G215A, C219Y, V236I, T241S, L248I, I254V, S269G, I290V, E291D, V297I, Q299R, I314L, E318D, Q323L, L333V, E359D, D360M, K362R, Q366S, N367G, L368V, A369T, G370A, Y371E, H404Y, H409Y, G410A, E411G, Y417F, V428I, E429A, S432T, K433S, L437R, S443A, A451V, I464L, A470M, I502V, L503V, I531L, G537K, L540I, N553S, I559L, S563G, V571L, N579Q, H589T, S607L, L608I, L620I, R623K, R624K, L644V, S646P, M652V, I657V, R679E, L684S, N686G, H689D, S696G, T702A, T737S, L742F, Y744H, Q748H, M751V, I753V, A771T, R777K, P792T, S818T, R823G, V824M, E826V, K827R, A832S, T833D, M836A, I839L, G841N, V846A, N860T, V862E, D864E, V867A, V877G, S883K, S889R, G890D, S894F, K908Q, N913D, F916H, T918V, R936N, Q938N, Y940F, K942S, S963A, R966K, K967R 또는 K968R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, CasX 폴리펩티드는 플랑크토마이세테스 박테리아로부터 유래한다. 특정 실시양태에서, CasX 폴리펩티드는 델타프로테오박테리아로부터 유래한다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, Cas12 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K135R 및 N140S에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커는 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 아시다미노코커스 종 BV3L6으로부터 유래한다. 특정 실시양태에서, Cas12 폴리펩티드는 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, Cas12 폴리펩티드는 T1S, Q2N, E4S, G5E, N8H, L9K, K28E, H29N, I30L, Q31T, E32A, Q33Y, F35M, I36V, E37N, E38D, A41L, N43S, D44E, H45N, E48K, I52V, R55K, T59Y, Y60F, A61I, D62E, Q63E, C64T, Q66K, L67H, Q69A, L70I, N74P, S76Y, A77K, D80T, S81A, Y82F, E85D, E88L, T90N, R91N, N92T, A93N, I95R, E97I, A99D, T100N, Y101C, N103K, A104S, H106A, D107G, I110E, R112K, T113V, D114P, R159K, S169V, S185A, A187S, I192L, D195E, K201I, T212K, R218N, N223T, I228T, S233G, I236L, E237D, V239I, F242V, Q249C, Y257F, V279T, I284V, F305Y, N313S, S324N, I329L, S331A, T337E, L338K, L345I, E349Q, S357L, I358A, N386D, I393V, L396A, I400L, S403N, V408I, Q409E, G427D, K428D, Q436A, L442I, S468V, Q469L, S472A, L473V, L479T, E487D, S488D, A497V, L510I, A516V, K522Q, Q535S, M536N, S541D, V545E, K549Q, N550Q, G552C, V557E, N559E, S586N, Y596Q, A601S, I604L, A613D, S628N, E637T, A657D, K660R, G663N, Q665K, C673H, L683V, L697V, A711G, L717F, Q723E, A733L, E735D, Y740F, K751E, K756A, G766A, I778V, R793P, L844F, I858V, S865T, I874L, H898N, I903V, I916A, L931F, K941N, N945Q, V951I, S958T, V959A, D965E, I938V, H984Q, A1009S, C1024Y, G1037S, T1049E, G1055R, T1056N, Y1068F, L1075A, V1083R, K1085G, L1097I, H1104K, D1106N, D1111N, L1122K, A1134D, V1138I, D1147A, V1160E, P1161F, R1171Q, R1173E, Y1176L, N1205T, D1207N, S1220L, V1221T, A1230E, N1237S, L1243I, M1259K, Q1274L, G1291A, Q1295N, A1299N 또는 L1304K 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다.

한 측면에서, 본원은 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 기술하는 것으로, 이때 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53으로 제시된 비변형 I-TevI 뉴클레아제의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드는 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인은 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 상기 키메라 뉴클레아제는 핵 국소화 신호를 포함한다. 특정 실시양태에서, Cas9 폴리펩티드는 스타필로코커스 아우레우스로부터 유래한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함한다. 특정 실시양태에서, 핵 국소화 신호는 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민 핵 국소화 신호를 포함한다. 특정 실시양태에서, 변형된 I-TevI 링커 도메인은 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 키메라 뉴클레아제는 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진다.

I-TevI 도메인

서열번호 8의 서열은 단백질 안정성을 증가시키고 N-말단 분해를 방해하는 데 도움이 되는 것으로 알려진 위치 2의 글리신 치환을 제외하고 I-TevI의 야생형 버전이다. 본원에서 언급된 특정 치환과 관련하여, 넘버링은 글리신 안정화를 결여하는 단백질의 야생형 버전에 상응한다. 따라서, I-TevI의 안정화된 버전에서 서열번호 8의 위치 27의 라이신은 위치 2의 글리신이 없는 야생형 위치에 상응하는 K26으로서 지칭된다. 다른 I-TevI 돌연변이는 이에 따라 지칭된다. T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V, E81I(I-TevI의 야생형 버전 참조)을 포함하는, I-TevI 뉴클레아제에 거의 영향을 미치지 않는 것으로 알려진 I-TevI 도메인에 대한 여러 I-TevI 치환이 있다. I-TevI의 뉴클레아제 활성은 I-TevI 도메인을 함유하는 키메라 뉴클레아제를, 알려진 I-TevI 표적을 함유하는 선형 DNA와 혼합하고 아가로스 겔에서 절단 반응의 생성물을 분리함으로써 어세이될 수 있다. 예측된 크기의 생성물은 I-TevI 뉴클레아제가 활성을 띠는 경우 존재할 것이다. 특정 실시양태에서, I-TevI에 대한 치환은 야생형 비변형 I-TevI에 비해 적어도 50%, 60%, 70%, 80%, 90% 이상의 I-TevI 뉴클레아제 활성이 보존될 수 있게 한다.

I-TevI 뉴클레아제 도메인의 다른 버전은 I-TevI에 의해 인식되는 서열을 변경하는 돌연변이, 예컨대, K26 및/또는 C39를 포함하는, I-TevI 도메인에 의해 표적화되는 부위 또는 I-TevI 도메인의 활성을 변경하는 돌연변이의 상이한 조합을 함유할 수 있다. 상기 뉴클레아제의 다른 버전은 I-TevI 도메인을 다른 GIY-YIG 뉴클레아제 도메인, 예컨대, I-BmoI, Eco29kI 등으로 치환할 수 있다. I-TevI의 일부 버전은 이. 콜라이에서 발현되었을 때 프로세싱의 결과로서 Met1을 함유하지 않는다.

특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 K26R 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함한다.

링커 도메인

특정 실시양태에서, I-TevI 뉴클레아제 도메인은 링커에 의해 saCas9에 연결된다. 링커는 I-TevI 링커(아미노산 93 내지 150 또는 I-TevI)를 포함할 수 있다. 링커는 대안적으로 또는 추가로 10개 내지 100개의 아미노산을 포함하는 유연한 아미노산 링커를 포함할 수 있다. 이러한 링커는 구조화되지 않을 수 있거나 Gly-Ser 링커를 포함할 수 있다.

특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, 링커는 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 T95S, V117F, K135R, N140S 또는 Q158R 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열로부터 선택된 펩티드이다.

SaCas9 도메인

뉴클레아제의 다른 버전은 SaCas9 도메인을 서열번호 25 내지 28의 다른 비천연 생성 SaCas9 또는 SpCas9 도메인으로 치환할 수 있다. 키메라 뉴클레아제의 다른 버전은 SaCas9 도메인을, 서열번호 44 내지 48의 키메라 뉴클레아제 TevCas12a 또는 서열번호 49의 TevCasX를 포함하는 다른 뉴클레아제로 치환할 수 있다. 키메라 뉴클레아제의 추가 실시양태는 SaCas9 도메인을 다른 클래스 1 또는 클래스 2 CRISPR-Cas 단백질, CRISPR-Cas3, CRISPR-캐스케이드, Cas13d로 치환할 수 있다. 뉴클레아제의 다른 버전은 SaCas9 도메인을, 핵산에 결합할 수 있는 폴리펩티드 서열, 다른 폴리펩티드 서열에 결합할 수 있는 폴리펩티드 서열, 폴리펩티드 표적화 서열을 포함하는 다른 이종 폴리펩티드 서열로 치환할 수 있다. 다른 이종 서열은 1개 내지 10개의 다른 폴리펩티드 도메인을 포함할 수 있다.

특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 T267A, L325F, V327I, D333G, A336S, I341L, E345D, D348N, K352E, S360A, T368A, N369E, N371E, S372P, E373K, K386T, N393R, H408N, N410S, I414M, A415T, T438S, Y467F, N471K, D485E, M489F, E506K, R409K, T510E, N515K, Y518F, A539P, F550Y, N551H, S596A, T602I, A611S, I617V, T620K, G654E, N667D, R685K, K695Q, I706V, K722T, A723T, K724N, M731T, F732V, K735Q, S739N, P741L, E742G, E746D, Q747D, I754D, T755I, H757R, K760Q, H761S, P778I, E781K, I783V, N784D, D785E, T786L, L787V, Y788H, K792E, D794T, T798R, L799I, V801I, N803S, L804I, N805K, G806N, D813G, K814E, L818I, I819F, S822P, E824G, L841T, G847S, D848N, Y857H, V875I, I876V, N884K, A888V, L890R, D894G, D895H, P897L, V903I, G920D, F924L, N929Y, E936D, N937G, V941I, N942D, S943L, C945A, E947K, K951R, L952Q, S956N, N957E, Q958K, A959S, N974D, G975K, V983A, N984S, N985D, D986G, I991V, V993L, M995F, I996V, T999N, Y1000K, R1001E, E1002D, L1004I, E1005K, N1006M, M1007N, D1009L, K1010S, R1011T, P1012S, P1013F, I1015L, I1016R, A1020G, S1021K, Q1024K, K1027S, E1039K, H1045K, I0148M 또는 K1050M 중 어느 하나 이상의 치환으로부터 선택된 치환을 포함한다. 특정 실시양태에서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 D10E 치환을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8을 포함하고, 링커는 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함한다. 특정 실시양태에서, 변형된 I-TevI 뉴클레아제 도메인은 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인은 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인은 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함한다.

공여자 DNA 및 치료 세포 집단

본원에 기재된 방법 및 기법은 생체외에서 세포 집단의 세포를 유전적으로 변형시키는 데 유용하다. 이러한 생체외 변형은 치료 세포의 생성에 유용할 수 있다. 이러한 치료적 변형은 게놈 DNA 서열의 제거 또는 파괴를 포함할 수 있다. 다른 치료적 변형은 게놈 DNA 서열의 교체 또는 복구를 포함할 수 있다. 본원에 기재된 공여자 DNA는 예컨대, 기존 유전자를 교체하거나 복구하기(즉, 질환의 원인이 되는 하나 이상의 유전적 돌연변이를 보정하기) 위해 세포 게놈의 특정 부위로 표적화될 수 있거나, 안전한 은닉 부위, 예컨대, AAVS1 부위로 표적화될 수 있다. 외생성 공여자 DNA는 상동 재조합에 의해 혼입되도록 구성될 수 있다. 상동 재조합에 의해 혼입될 이러한 외생성 공여자 DNA는 제1 플랭킹 상동성 영역, 관심 있는 외생성 폴리뉴클레오타이드 서열 및 제2 플랭킹 상동성 영역을 포함할 수 있다. 대안적으로, 외생성 공여자 DNA는 비상동 말단 연결의 도움으로 단일 이중 가닥 절단 또는 중복 이중 가닥 절단에서 게놈 위치 내로 혼입됨으로써 게놈 위치에 삽입될 수 있다.

치료 세포 또는 치료 세포 집단은 다분화능 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 다분화능 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 다분화능 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 다분화능 세포를 포함하거나 이러한 세포로 구성된다. 상기 다분화능 세포는 동물 조직으로부터 단리될 수 있거나, 다분화능 줄기 세포를 유도하는 공지된 방법을 이용함으로써 유도될 수 있다.

치료 세포 또는 치료 세포 집단은 면역 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 면역 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 인간 면역 세포를 포함하거나 인간 면역 세포로 구성된다.

세포는 이종 면역 세포(예를 들어, 말초 혈액 단핵 세포)의 단리된 세포 집단, 또는 특정 면역 세포, 예컨대, 림프구, T 세포, B 세포 또는 NK 세포의 단리 및 정제된 집단일 수 있다. 이러한 세포 집단은 당분야에 공지된 기법, 예컨대, 자석 비드 선택(양성 또는 음성 선택)에 의해 약 80%, 85%, 90% 또는 95% 초과의 고순도로 단리될 수 있다.

치료 세포 또는 치료 세포 집단은 포유동물 조혈 줄기 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 조혈 줄기 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 인간 조혈 줄기 세포를 포함하거나 이러한 세포로 구성된다.

치료 세포 또는 치료 세포 집단은 포유동물 중간엽 줄기 세포로부터 생성될 수 있다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 뮤린, 개, 고양이, 말, 돼지, 양, 소 또는 인간 중간엽 줄기 세포 중 어느 하나 이상의 세포를 포함하거나 이러한 세포로 구성된다. 특정 실시양태에서, 치료 세포 또는 치료 세포 집단은 중간엽 줄기 세포를 포함하거나 이러한 세포로 구성된다.

특정 실시양태에서, 치료 세포는 CAR T 세포이다. 특정 실시양태에서, 치료 세포는 CAR NK 세포이다. 따라서, 본원에 기재된 키메라 뉴클레아제와 함께 전달될 공여자 DNA는 키메라 항원 수용체(CAR)를 코딩할 수 있다. CAR은 일반적으로 항체로부터 유래한 표적화 모이어티, 막횡단 도메인, 및 T 세포 또는 NK 세포에서 세포독성 활성을 활성화시키는 하나 이상의 세포내 신호전달 도메인을 포함한다.

특정 실시양태에서, 치료 세포는 보편적인 CAR T, 또는 면역원성이 감소된 CAR T이다. 이러한 감소된 면역원성은 하나 이상의 파괴를 T 세포 수용체 알파 쇄, T 세포 수용체 베타 쇄 또는 MHC 유전자(예를 들어, B2M, HLA-A, HLA-B 또는 HLA-C)에 도입함으로써 달성될 수 있다.

TevSaCas9 키메라 뉴클레아제가 이중 가닥 DNA를 절단할 때, Cas9는 블런트 말단을 남기고 I-TevI는 2개의 뉴클레오타이드 3' 오버행을 남긴다. 제공된 공여자 DNA는 블런트 말단, 및 TevSaCas9 절단 부위에서 생성된 3' 오버행에 결합하도록 구성된 2개의 뉴클레오타이드 3' 오버행을 포함할 수 있다.

한 측면에서, 공여자 DNA는 기능성 유전자를 코딩하는 것으로 알려지지 않은 게놈 부위에 삽입되도록 의도된 DNA 서열을 포함한다. 이러한 부위의 예는 AAVS1이다. 공여자 DNA는 표적 게놈 DNA에서 발견되지 않는 DNA 서열도 포함하고, 이 서열은 유용한 유전자 및/또는 다른 DNA 요소를 코딩할 수 있다. 특정 실시양태에서, 공여자 DNA는 뉴클레아제에 의해 절단된 길이와 동일한 길이의 이중 가닥 DNA를 포함하고 TevSaCas9에 의해 절단된 DNA 말단에 상보적인 DNA 말단도 포함한다. 특정 실시양태에서, 공여자 DNA는 인산화된 DNA의 5' 말단을 포함한다. 특정 실시양태에서, 공여자 DNA는 I-TevI 표적 부위 및 SaCas9 표적 부위를 포함하는 원형 이중 가닥 DNA를 포함하고, 이때 이중 가닥 DNA로부터 절단된 생성물은 TevSaCas9에 의해 절단된 말단에 상보적인 말단을 함유한다.

가이드 RNA

가이드 RNA의 다른 버전은 B2M, TRAC, TRBC, HLA-A, AVVS1 유전자에서 DNA의 동일한 영역을 표적화할 수 있으나, 집단에서 유전적 다형성을 설명하기 위해 상이한 서열을 함유할 수 있다. 가이드 RNA의 다른 버전은 B2M, TRAC, TRBC, HLA-A, AVVS1에서 상이한 서열을 표적화할 수 있다. 가이드 RNA의 다른 버전은 뉴클레아제를 hROSA26 및 CCR5와 같은 추가 안전한 은닉 부위로 재표적으로 하기 위해 게놈의 다른 서열을 표적화할 수 있다. 다른 버전은 동일한 유전자 내의 여러 서열을 표적으로 하기 위해 가이드 RNA의 혼합물을 함유할 수 있다. 기재된 발명의 가이드 RNA는 활성(예를 들어, 표적 결합 및 뉴클레아제 결합)에 필요한 모든 요소를 포함하는 단일 가닥을 포함할 수 있다. 대안적으로, 가이드 RNA는 2개 이상의 핵산 사이의 염기 페어링으로 인해 단일 모이어티를 형성하는 2개 이상의 비공유 결합된 핵산을 포함할 수 있다. 가이드 RNA의 다른 버전은 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로아데닌; 8-아미노아데닌; 8-티올아데닌; 8-티오알킬아데닌; 8-하이드록시아데닌; 8-할로구아닌; 8-아미노구아닌; 8-티올구아닌; 8-티오알킬구아닌; 8-하이드록실구아닌; 5-할로우라실; 5-브로모우라실; 5-트리플루오로메틸우라실; 5-할로사이토신; 5-브로모사이토신; 5-트리플루오로메틸사이토신; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신을 포함하나 이들로 제한되지 않는, 안정성을 위한 상이한 핵염기를 포함할 수 있다. 가이드 RNA의 다른 버전은 가교된 핵산 또는 잠긴 핵산과 같은 다른 핵산을 포함할 수 있다.

본원에 기재된 가이드 RNA는 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 추가로 포함할 수 있다. 특정 실시양태에서, 비천연 뉴클레오사이드간 결합은 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함한다. 특정 실시양태에서, 핵산 모방체는 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 당 모이어티는 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함한다. 특정 실시양태에서, 변형된 핵염기는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함한다.

공여자 DNA의 조성: 상기 논의된 이중 가닥 공여자 DNA의 다른 버전은 상이한 5'-말단 화학적 변형, 예컨대, 바이오틴을 함유한다. 공여자 DNA의 다른 버전은 2'-플루오로, 2'-아미노 및 2'-O-메틸을 포함하나 이들로 제한되지 않는, 리보스의 2' 위치에 대한 안정성 변형을 포함할 수 있다. 공여자 DNA의 다른 버전은 3'-말단 변형, 예컨대, 도립 dT 또는 바이오틴을 함유할 수 있다. 공여자 DNA의 다른 버전은 리보스 당의 2'-O 및 4'-C 원자가 메틸렌 가교를 통해 연결되어 있는 잠긴 핵산(LNA)을 포함할 수 있다. 이중 가닥 공여자 DNA의 다른 버전은 TevSaCas9 표적 부위를 함유하는 원형 플라스미드 DNA를 포함할 수 있고, 이때 TevSaCas9를 사용한 절단은 게놈 표적의 DNA 말단에 상보적인 DNA 말단을 생성한다. 이중 가닥 공여자 DNA는 합성 또는 증폭된 선형 이중 가닥 DNA를 포함할 수 있다. 특정 실시양태에서, 공여자 DNA는 바이러스 벡터, 예컨대, 아데노 관련 바이러스 또는 렌티바이러스를 사용함으로써 공급된다.

키메라 뉴클레아제의 생성

본원에 기재된 키메라 뉴클레아제는 국제 공개 제WO2020225719A1호에 기재된 바와 같은 이. 콜라이 발현 시스템의 사용을 포함하는 많은 방식으로 생성될 수 있다. 대안적으로, 키메라 뉴클레아제는 표적 세포에서 뉴클레아제의 발현 및 생성을 유도하는 하나 이상의 유전 벡터를 공급함으로써 변형될 표적 세포에 의해 생성될 수 있다. 추가로, 벡터는 키메라 뉴클레아제를 특정 게놈 영역으로 표적으로 하기 위해 가이드 RNA의 발현을 유도하는 서열을 제공할 수 있다.

본원에 기재된 바와 같은 유전적으로 조작된 세포를 생성하는 예시적인 방법이 이하에 기재되어 있다.

세포 집단을 T 플라스크에서 70% 내지 90% 전면생장률(confluency)까지 생장시킨다. 세포를 원심분리로 수거하고 완충제 T(Invitrogen®, 미국 캘리포니아주 칼스바드)에 밀리리터당 1.0 x 10⁷개 세포(밀리리터당 실제 범위 0.2 내지 2 x 10⁷개 세포)로 재현탁한다. 2000 볼트(실제 범위 1100 내지 2500), 20 밀리초(실제 범위 10 내지 30 밀리초) 및 1 펄스(실제 범위 1 내지 4)에서 Neon® 형질감염 시스템(Thermo Fisher Scientific®, 미국 매사추세츠주 왈쌈)을 사용하여, 서열번호 25 내지 49로부터 선택되고 트리스(하이드록시메틸)아미노메탄 또는 포스페이트 완충 식염수에 제제화된 뉴클레아제를 비롯한 본원에 기재된 뉴클레아제로 세포를 전기천공한다. 0.3 g/L 글루타민 및 2 g/L 글루코스(Sigma-Aldrich®, 영국 어바인), 10% 태아 소 혈청(Sigma-Aldrich®, 캐나다 온타리오주 오크빌), 2 mM L- 글루타민 및 100 유닛 페니실린 및 0.1 mg 스트렙토마이신/㎖(Sigma-Aldrich®, 미국 미주리주 세인트루이스)를 함유하는 RPMI1640에서 24시간 동안 세포를 회복시킨다. 사멸 세포 제거 키트(Miltenyi Biotec®, 미국 매사추세츠주 소머빌)를 사용하여 사멸 세포를 제거한다. 중합효소 연쇄 반응으로 표적 유전자를 증폭하고 표적화 앰플리콘 시퀀싱(GENEWIZ, 미국 뉴저지주 사우쓰 플레인필드)으로 편집된 세포의 비율을 측정함으로써 넉아웃 효율을 측정한다. 앰플리콘 시퀀싱은 특정 게놈 영역의 유전적 변이를 분석할 수 있게 하는 표적화 차세대 시퀀싱 방법이다. 이 방법은 PCR을 이용하여 앰플리콘으로서 지칭되는 DNA 서열을 생성한다. 상이한 샘플로부터의 앰플리콘들은 인덱싱 또는 풀링으로서도 지칭되는 다중체화될 수 있고, 이것은 이들이 식별될 수 있도록 바코드(인덱스)를 샘플에 첨가하는 단계를 수반한다. 다중체화 전, 앰플리콘 시퀀싱에 사용되는 개별 샘플은 어댑터를 첨가하고 PCR 증폭을 통해 표적 영역을 농후화함으로써 라이브러리로 변환되어야 한다. 어댑터는 인덱싱된 앰플리콘의 형성을 허용하고 앰플리콘이 시퀀싱을 위해 플로우 셀에 부착될 수 있게 한다. 앰플리콘 시퀀싱은 전형적으로 세포 집단에서 변이체 검출에 사용된다.

생체외 세포 요법의 제조 방법. 변형된 세포 요법의 제조 방법: 뉴클레아제를 세포로 전달하는 다른 방법, 예컨대, 지질 나노입자, 중합체, 바이러스 벡터 또는 세포 침투 펩티드가 사용될 수 있다. 키메라 뉴클레아제 또는 가이드 RNA는 단일 가닥 또는 이중 가닥 형태의 DNA 또는 RNA로서 개별적으로 또는 조합되어 전달될 수 있다. 또한, 키메라 뉴클레아제는 다음 요소들 중 하나 이상을 함유하는 RNA로서 전달될 수 있다: 5' 캡, 5' 비번역 영역, 코딩 서열, 3' 비번역 영역 및 폴리아데닌(폴리-A) 꼬리. RNA는 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로아데닌; 8-아미노아데닌; 8-티올아데닌; 8-티오알킬아데닌; 8-하이드록시아데닌; 8-할로구아닌; 8-아미노구아닌; 8-티올구아닌; 8-티오알킬구아닌; 8-하이드록실구아닌; 5-할로우라실; 5-브로모우라실; 5-트리플루오로메틸우라실; 5-할로사이토신; 5-브로모사이토신; 5-트리플루오로메틸사이토신; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신을 포함하나 이들로 제한되지 않는, 안정성을 위한 상이한 핵염기를 포함할 수 있다.

또 다른 실시양태에서, 키메라 뉴클레아제는 레트로바이러스 벡터, 렌티바이러스 벡터, 트랜스포존 벡터 및 아데노 관련 바이러스 벡터를 포함하나 이들로 제한되지 않는 통합 벡터로서 전달될 수 있다. 키메라 뉴클레아제는 또한 Nucleofector^TM(Lonza, 스위스 바젤), MaxCyte(미국 메릴랜드주 게이더스버그) 또는 CliniMACS®(독일 베르기쉬 글라드바흐)를 포함하나 이들로 제한되지 않는 다른 전기천공 시스템에 의해 전달될 수 있다.

키메라 뉴클레아제는 약학적으로 허용되는 담체, 희석제 또는 부형제 중 하나 이상을 포함하는 약학 조성물에 추가로 포함될 수 있다. 본원에서 사용된 바와 같이, 용어 "약학적으로 허용되는 부형제"는 본 발명의 약학 조성물의 활성 성분(예를 들어, 본 발명의 화합물)과 양립 가능하고 (바람직하게는 이를 안정화시킬 수 있고) 치료되는 대상체에 유해하지 않는 담체 및 비히클을 의미한다. 예를 들어, 본 발명의 화합물과 함께 더 잘 용해되는 특정 복합체를 형성하는 가용화제는 화합물 전달을 위한 약학 부형제로서 사용될 수 있다. 적합한 담체 및 비히클은 당분야에서 특별한 기술을 가진 자에게 공지되어 있다. 본원에서 사용된 바와 같이, 용어 "부형제"는 모든 이러한 담체, 보조제, 희석제, 용매 또는 다른 불활성 첨가제를 포괄할 것이다. 약학 제제는 당분야에서 통상적으로 사용되는 불활성 희석제, 예를 들어, 물 또는 다른 용매, 가용화제 및 유화제, 예컨대, 에틸 알코올, 이소프로필 알코올, 에틸 카르보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부틸렌 글리콜, 글리세롤, 테트라하이드로푸릴 알코올, 및 소르비탄의 지방산 에스테르, 사이클로덱스트린, 알부민, 히알루론산, 키토산 및 이들의 혼합물을 함유할 수 있다. 폴리에틸렌 글리콜(PEG)은 원하는 성질인 용해도, 안정성, 반감기 및 다른 약학적으로 유리한 성질을 얻기 위해 사용될 수 있다. 안정화 성분의 대표적인 예는 폴리소르베이트 80, L-아르기닌, 폴리비닐피롤리돈, 트레할로스 및 이들의 조합을 포함한다. 사용될 수 있는 다른 부형제, 예컨대, 용액 결합제 또는 항산화제는 부틸화된 하이드록시톨루엔(BHT), 탄산칼슘, 인산칼슘(이염기성), 스테아르산칼슘, 크로스카멜로스, 가교결합된 폴리비닐 피롤리돈, 구연산, 크로스포비돈, 시스테인, 에틸셀룰로스, 젤라틴, 하이드록시프로필 셀룰로스, 하이드록시프로필 메틸셀룰로스, 락토스, 마그네슘 스테아레이트, 말티톨, 만니톨, 메티오닌, 메틸셀룰로스, 메틸 파라벤, 미세결정성 셀룰로스, 폴리비닐 피롤리돈, 포비돈, 전호화 전분, 프로필 파라벤, 레티닐 팔미테이트, 셀락, 이산화규소, 나트륨 카르복시메틸 셀룰로스, 구연산나트륨, 나트륨 전분 글리콜레이트, 소르비톨, 전분(옥수수), 스테아르산, 수크로스, 활석, 이산화티타늄, 비타민 A, 비타민 E(알파-토코페롤), 비타민 C 및 자일리톨을 포함한다.

특정 실시양태

본 개시내용의 특정 넘버링된 실시양태가 기재된다.

1. 변형된 I-TevI 뉴클레아제 도메인, 링커 및 변형된 RNA-가이드 뉴클레아제 도메인을 포함하는 폴리펩티드.

2. 변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제로서, 2개의 활성 뉴클레아제 부위를 가진 키메라 뉴클레아제.

3. 실시양태 2에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8 또는 이의 단편인 키메라 뉴클레아제.

4. 실시양태 2에 있어서, 링커가 서열번호 9 내지 14 중 어느 한 서열로부터 선택된 펩티드 또는 이의 단편인 키메라 뉴클레아제.

5. 실시양태 2에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열 또는 이의 단편인 키메라 뉴클레아제.

6. 실시양태 2에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8 또는 이의 단편이고, 링커가 서열번호 9 내지 14 중 어느 한 서열 또는 이의 단편이고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열 또는 이의 단편인 키메라 뉴클레아제.

7. 실시양태 6에 따른 키메라 뉴클레아제를 투여하는 단계를 포함하는, 표적화 포유동물 유전자를 파괴하는 방법으로서, 표적 세포의 게놈 DNA가 내생성 유전자의 발현을 파괴하도록 변형되는 것인 방법.

8. 실시양태 7에 있어서, 표적화 유전자의 전부가 파괴되는 것인 방법.

9. 실시양태 7에 있어서, 표적화 유전자의 일부가 파괴되는 것인 방법.

10. 실시양태 6에 따른 키메라 뉴클레아제를 투여하는 단계를 포함하는, 세포의 유전적 구성을 편집하는 방법.

11. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 외생성 DNA의 존재 하에 투여되는 것인 방법.

12. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 핵에 투여되는 것인 방법.

13. 실시양태 12에 있어서, 하나 이상의 핵 국소화 서열을 사용하여 키메라 뉴클레아제를 투여하는 것인 방법.

14. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 게놈 DNA로 전달되는 것인 방법.

15. 실시양태 14에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA로 전달되는 것인 방법.

16. 실시양태 15에 있어서, 표적 세포가 면역 세포인 방법.

17. 실시양태 16에 있어서, 면역 세포가 T 세포인 방법.

18. 실시양태 15에 있어서, 표적 세포가 다분화능 세포인 방법.

19. 실시양태 18에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.

20. 실시양태 15에 있어서, DNA 발현 카세트를 사용하여 상기 키메라 뉴클레아제를 표적 세포의 게놈 DNA로 전달하는 것인 방법.

21. 실시양태 10에 있어서, 바이러스 벡터를 사용하지 않는 방법.

22. 실시양태 15에 있어서, 상기 키메라 뉴클레아제를 단리된 표적 세포에 투여하는 것인 방법.

23. 실시양태 22에 있어서, 상기 단리된 표적 세포가 생체외 배양물에서 단리된 것인 방법.

24. 실시양태 23에 있어서, 상기 단리된 표적 세포가 외생성 공여자 세포인 방법.

25. 실시양태 23에 있어서, 키메라 뉴클레아제와 함께 상기 단리된 표적 세포의 생체외 배양물을 전기천공하는 것인 방법.

26. 실시양태 25에 있어서, 전기천공이 1000 내지 2500 V의 전류에서 적용되는 것인 방법.

27. 실시양태 20에 있어서, 상기 키메라 뉴클레아제가 전기천공 후 생체외에서 상기 단리된 표적 세포에 침투하는 것인 방법.

28. 실시양태 14에 있어서, 상기 세포가 동물 세포, 박테리아 세포, 곤충 세포 및 식물 세포로 구성된 군으로부터 단리된 것인 방법.

29. 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는, 규정된 길이의 게놈 DNA를 결실시키는 방법.

30. 실시양태 29에 있어서, 변형된 게놈 DNA가 유전자 아웃-오프-프레임을 녹킹함으로써 내생성 유전자의 발현을 파괴하는 것인 방법.

31. 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는 방법.

32. 실시양태 31에 있어서, 투여된 키메라 뉴클레아제가 외생성 공여자 DNA의 존재 하에 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 것인 방법.

33. 실시양태 32에 있어서, 상기 외생성 공여자 DNA가 표적 세포의 DNA에 삽입되는 것인 방법.

34. 실시양태 31에 있어서, 상기 규정된 길이의 선택된 DNA가 하나 이상의 기능성 유전자 또는 하나 이상의 이의 단편을 포함하는 것인 방법.

35. 표적 세포의 DNA에서 하나 이상의 규정된 길이의 선택된 DNA를 결실시키는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하는 방법.

36. 실시양태 35에 있어서, 키메라 뉴클레아제를 외생성 공여자 DNA의 부재 하에 투여하는 것인 방법.

37. 실시양태 32 또는 35에 있어서, 키메라 뉴클레아제가 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 외생성 유전자를 발현시키는 것인 방법.

38. 표적 세포에서 하나 이상의 규정된 길이의 선택된 게놈 DNA를 결실시키고 하나 이상의 규정된 길이의 선택된 외생성 DNA를 표적 세포의 DNA에 삽입하는 방법으로서, 실시양태 6에 따른 키메라 뉴클레아제를 표적 세포로 전달하는 단계를 포함하고, 상기 선택된 외생성 DNA가 변형된 게놈 DNA의 결실된 부분에 삽입되거나 선택된 게놈 DNA의 상이한 위치에 삽입되는 것인 방법.

39. 실시양태 32, 35 또는 38에 있어서, 상기 외생성 유전자가 키메라 항원 수용체를 발현하는 것인 방법.

40. 실시양태 10에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA 상의 2개의 독립적인 부위를 표적으로 하는 것인 방법.

41. 실시양태 40에 있어서, 표적 세포의 게놈 DNA가 표적 세포의 게놈 DNA 상의 독립적인 부위 중 하나에서 절단되는 것인 방법.

42. 실시양태 40에 있어서, 표적 세포의 게놈 DNA가 표적 세포의 게놈 DNA 상의 2개의 독립적인 부위에서 절단되어, 게놈 DNA에서 2개의 절단된 부위를 생성하는 것인 방법.

43. 실시양태 41 또는 42에 있어서, 절단된 게놈 DNA의 길이가 30개 내지 36개 염기인 방법.

44. 실시양태 42에 있어서, 절단이 외생성 공여자 DNA의 존재 하에 일어나는 것인 방법.

45. 실시양태 44에 있어서, 외생성 공여자 DNA가 2개의 절단된 부위 사이에 삽입되는 것인 방법.

46. 실시양태 45에 있어서, 전체 외생성 공여자 DNA가 2개의 절단된 부위 사이에 삽입되는 것인 방법.

47. 실시양태 45에 있어서, 외생성 공여자 DNA의 일부가 2개의 절단된 부위 사이에 삽입되는 것인 방법.

48. 실시양태 45 내지 47에 있어서, 외생성 공여자 DNA가 2개의 절단된 부위 사이에 특정 배향으로 삽입되는 것인 방법.

49. 실시양태 48에 있어서, 외생성 공여자 DNA가 직접적인 라이게이션, 미세상동성 말단 연결 또는 비상동 말단 연결에 의해 게놈 DNA에 결합되는 것인 방법.

50. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 17 또는 서열번호 18, 또는 이의 단편이고; 상기 키메라 뉴클레아제가 B2M 유전자를 표적으로 하고 절단하는 것인 방법.

51. 실시양태 50에 있어서, 상기 키메라 뉴클레아제가 B2M 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.

52. 실시양태 51에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 B2M 단백질 생성 또는 기능을 억제하는 것인 방법.

53. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 19 또는 이의 단편이고; 상기 키메라 뉴클레아제가 TRAC1 유전자를 표적으로 하고 절단하는 것인 방법.

54. 실시양태 53에 있어서, 상기 키메라 뉴클레아제가 TRAC1 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.

55. 실시양태 54에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 TRAC1 단백질 생성 또는 기능을 억제하는 것인 방법.

56. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 20 또는 이의 단편이고; 상기 키메라 뉴클레아제가 TRCB1 유전자를 표적으로 하는 것인 방법.

57. 실시양태 56에 있어서, 상기 키메라 뉴클레아제가 TRCB1 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.

58. 실시양태 57에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 TRCB1 단백질 생성 또는 기능을 억제하는 것인 방법.

59. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 21 또는 이의 단편이고; 상기 키메라 뉴클레아제가 HLA-A 유전자를 표적으로 하고 절단하는 것인 방법.

60. 실시양태 59에 있어서, 상기 키메라 뉴클레아제가 HLA-A 유전자의 아웃-오프-프레임 돌연변이를 생성하는 것인 방법.

61. 실시양태 60에 있어서, 상기 아웃-오프-프레임 돌연변이가 적절한 HLA-A 단백질 생성 또는 기능을 억제하는 것인 방법.

62. 실시양태 41 또는 42 중 어느 한 실시양태에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 22 또는 이의 단편이고; 상기 키메라 뉴클레아제가 AAVS1 유전자를 표적으로 하는 것인 방법.

63. 실시양태 62에 있어서, AAVS1 유전자가 외생성 공여자 DNA의 존재 하에 표적화되는 것인 방법.

64. 실시양태 63에 있어서, AAVS1 유전자의 안전한 은닉 부위가 표적화되는 것인 방법.

65. 실시양태 63에 있어서, 키메라 뉴클레아제가 AAVS1 유전자의 2개의 부위를 표적으로 하는 것인 방법.

66. 실시양태 65에 있어서, 외생성 공여자 DNA가 AAVS1 유전자의 2개의 표적화 부위 사이에 통합되는 것인 방법.

67. 실시양태 63 내지 66 중 어느 한 실시양태에 있어서, 외생성 공여자 DNA가 키메라 항원 수용체를 발현하는 DNA 서열을 함유하는 것인 방법.

68. 실시양태 67에 있어서, 통합된 외생성 공여자 DNA가 비상동 말단 연결을 통해 유지되는 것인 방법.

69. 실시양태 67에 있어서, 서열번호 7의 CD19를 표적으로 하는 키메라 항원 수용체가 AAVS1 부위에 삽입되는 것인 방법.

70. 실시양태 63에 있어서, LoxP 부위가 AAVS1에 삽입되는 것인 방법.

71. 실시양태 70에 있어서, LoxP 부위가 서열번호 24인 방법.

72. 실시양태 6에 따른 2개 이상의 키메라 뉴클레아제의 혼합물을 투여하는 단계를 포함하는, 면역 내성 세포를 생성하는 방법.

73. 실시양태 72에 따라 키메라 뉴클레아제의 혼합물을 투여하는 단계를 포함하는, 면역 내성 세포를 생성하는 방법으로서, 상기 키메라 뉴클레아제가 B2M, TRAC1, TRBC1, HLA-A 및 AAVS1로 구성된 군으로부터 선택된 하나 이상의 유전자를 표적으로 하는 것인 방법.

74. 실시양태 73에 있어서, 상기 키메라 뉴클레아제의 혼합물이 서열번호 17 또는 18, 19, 20 및 21로 구성된 군으로부터 선택된 다수의 가이드 RNA, 또는 이들의 단편을 함유하는 것인 방법.

75. 실시양태 73에 있어서, 다수의 가이드 RNA를 함유하는 상기 키메라 뉴클레아제의 혼합물을 동시에 투여하는 것인 방법.

76. 실시양태 75에 있어서, 상기 혼합물이 표적 세포의 동일한 외생성 DNA 내의 다수의 서열을 표적으로 하기 위해 다수의 가이드 RNA를 함유하는 것인 방법.

77. 실시양태 75에 있어서, 키메라 뉴클레아제와 가이드 RNA의 비가 등몰인 방법.

78. 서열번호 17 또는 18, 19, 20 및 21로부터 선택된 다수의 가이드 RNA 또는 이들의 단편을 함유하는 키메라 뉴클레아제의 혼합물을 포함하는, 실시양태 2에 따른 키메라 뉴클레아제를 함유하는 제제로서, 상기 키메라 뉴클레아제가 표적 세포의 동일한 외생성 DNA 내의 다수의 서열을 표적으로 하는 것인 제제.

79. 실시양태 76에 있어서, 키메라 뉴클레아제와 가이드 RNA의 비가 등몰인 제제.

80. 실시양태 1에 있어서, 서열번호 29 내지 33 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.

81. 실시양태 1에 있어서, 서열번호 34 내지 38 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.

82. 실시양태 1에 있어서, 서열번호 39 내지 43 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.

83. 실시양태 1에 있어서, 서열번호 44 내지 48 중 어느 한 서열번호의 전체 아미노산 서열 또는 이의 단편을 포함하는 폴리펩티드.

84. 서열번호 29의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.

85. 서열번호 29의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.

86. 서열번호 29의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.

87. 서열번호 29의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.

88. 서열번호 34의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.

89. 서열번호 34의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.

90. 서열번호 34의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.

91. 서열번호 34의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.

92. 서열번호 39의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.

93. 서열번호 39의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.

94. 서열번호 39의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.

95. 서열번호 39의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.

96. 서열번호 44의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.

97. 서열번호 44의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.

98. 서열번호 44의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.

99. 서열번호 44의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.

100. 실시양태 2에 따른 키메라 뉴클레아제를 포함하는 약학적으로 허용되는 제제.

101. 실시양태 6에 따른 키메라 뉴클레아제를 포함하는 약학적으로 허용되는 제제.

102. 실시양태 6에 있어서, 뉴클레아제로 전기천공된 세포를 포함하는 약학적으로 허용되는 제제.

103. 실시양태 100에 있어서, 상기 키메라 뉴클레아제가 서열번호 25 내지 49 중 어느 한 서열인 약학적으로 허용되는 제제.

104. 실시양태 100에 있어서, 외생성 공여자 DNA를 추가로 포함하는 약학적으로 허용되는 제제.

105. 실시양태 102에 따른 약학적으로 허용되는 제제를 투여하는 단계를 포함하는, 질환을 치료하는 방법.

106. 실시양태 103에 있어서, 상기 질환이 암인 방법.

107. 실시양태 72에 따라 면역 세포를 생성하는 단계를 포함하는, 질환을 치료하는 방법으로서, 상기 키메라 뉴클레아제가 면역 세포의 DNA를 변형시키는 것인 방법.

108. 실시양태 105에 있어서, 상기 질환이 암인 방법.

109. 실시양태 102에 따른 약학적으로 허용되는 제제를 투여하는 단계를 포함하는, 인간의 면역 내성을 지지하는 방법.

110. 실시양태 109에 있어서, 실시양태 72에 따라 면역 세포를 생성하는 단계를 포함하는 방법으로서, 상기 키메라 뉴클레아제가 면역 세포의 DNA를 변형시키는 것인 방법.

111. 실시양태 33에 있어서, 상기 외생성 공여자 DNA가 이중 가닥 DNA, 비상보적 말단을 가진 이중 가닥 DNA 또는 원형 이중 가닥 DNA로 구성된 군으로부터 선택된 것인 방법.

112. 실시양태 111에 있어서, 상기 이중 가닥 DNA의 폴리뉴클레오타이드 쇄가 동일한 길이를 갖고 둘 다 실시양태 6에 따른 동일한 키메라 뉴클레아제에 의해 절단된 것인 방법.

113. 실시양태 111에 있어서, 상기 비상보적 DNA 말단이 실시양태 6에 따른 동일한 키메라 뉴클레아제에 의해 절단된 것인 방법.

114. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 둘 다 5' 말단에서 인산화되거나 화학적으로 변형되는 것인 방법.

115. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 하나 이상의 포스포로티오에이트 결합을 함유하는 것인 방법.

116. 실시양태 111에 있어서, 상기 이중 가닥 DNA 또는 비상보적 말단을 가진 상기 이중 가닥 DNA가 바이오틴에 의해 화학적으로 변형되는 것인 방법.

117. 실시양태 111에 있어서, 상기 원형 이중 가닥 DNA가 I-TevI 및 SaCas9 표적 부위를 포함하는 것인 방법.

118. 실시양태 6에 있어서, 상기 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 25 내지 28 중 하나인 키메라 뉴클레아제.

119. 실시양태 6에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 유전적 다형성을 설명하기 위한 서열을 함유하는 것인 키메라 뉴클레아제.

120. 실시양태 6에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 표적 세포에서 게놈 DNA 상의 안전한 은닉 부위를 표적으로 하는 것인 키메라 뉴클레아제.

121. 실시양태 120에 있어서, 안전한 은닉 부위가 hROSA26 및 CCR5인 키메라 뉴클레아제.

122. 실시양태 7에 있어서, 지질 나노입자, 중합체, 바이러스 벡터 또는 세포 침투 펩티드를 사용하여 상기 키메라 뉴클레아제를 전달하는 것인 방법.

123. 실시양태 20에 있어서, 세포가 폐 세포인 방법.

124. 실시양태 20에 있어서, 키메라 뉴클레아제가 서열번호 31의 폴리펩티드인 방법.

125. 실시양태 20에 있어서, 유전 질환을 치료하기 위해 DNA 발현 카세트를 전달하는 것인 방법.

126. 변형된 I-Tevl 뉴클레아제 도메인, 링커 및 제2 뉴클레아제 도메인을 포함하는, 2개의 활성 뉴클레아제 부위를 가진 키메라 뉴클레아제로서, 활성 부위의 뉴클레아제 활성이 조정되는 것인 키메라 뉴클레아제.

127. 실시양태 126에 있어서, 제2 뉴클레아제가 변형된 RNA-가이드 뉴클레아제이고 가이드 RNA를 추가로 포함하는 것인 키메라 뉴클레아제.

128. 실시양태 126에 따른 키메라 뉴클레아제를 세포 또는 유기체에 투여하는 단계를 포함하는, 게놈 DNA를 편집하는 방법.

129. 실시양태 128에 따른 키메라 뉴클레아제를 세포 또는 유기체로 전달하는 단계를 포함하는, 규정된 길이의 DNA 분자를 결실시키는 방법.

130. 실시양태 128에 따른 키메라 뉴클레아제를 세포 또는 유기체로 전달하는 단계를 포함하는, DNA 분자로부터 선택된 서열을 교체하는 방법.

131. 서열번호 49의 아미노산 서열의 적어도 80%를 포함하는 폴리펩티드.

132. 서열번호 49의 아미노산 서열의 적어도 85%를 포함하는 폴리펩티드.

133. 서열번호 49의 아미노산 서열의 적어도 90%를 포함하는 폴리펩티드.

134. 서열번호 49의 아미노산 서열의 적어도 95%를 포함하는 폴리펩티드.

정의 및 약어

달리 정의되지 않는 한, 본원에서 사용된 모든 기술 용어, 표기법 및 다른 과학 용어는 본 개시내용이 속하는 분야의 숙련된 자에 의해 일반적으로 이해되는 의미를 갖도록 의도된다. 일부 경우, 일반적으로 이해되는 의미를 가진 용어는 명료성을 위해 및/또는 즉시 참조를 위해 본원에서 정의되므로; 본원에서 이러한 정의의 포함은 당분야에서 일반적으로 이해되는 것과 실질적인 차이를 나타내는 것으로 해석되어서는 안 된다.

본 설명의 골격 및 후속 청구범위 내에서, 달리 표시된 경우를 제외하고, 양, 수량, 퍼센트 등을 표현하는 모든 숫자는 모든 경우 용어 "약"이 앞에 있는 것으로 이해되어야 한다. 본원에서 사용된 바와 같이, 용어 "약"은 ±10%로서 정의된다. 또한, 모든 범위의 수치는 이하에 구체적으로 표시된 것 이외에 최대 및 최소 수치 값의 모든 가능한 조합과 그 안의 모든 가능한 중간 범위를 포함한다.

본원에서 사용된 용어 "및/또는"은 하나 또는 다른 하나 또는 둘 다를 가질 가능성으로서 정의된다. 예를 들어, "A 및/또는 B"는 A 또는 B만을 갖거나 A와 B의 조합을 가진 시나리오를 제공한다. A 및/또는 B 및/또는 C가 청구항에 기재되어 있는 경우, 조성물은 성분으로서 A 단독, B 단독 또는 C 단독을 포함할 수 있거나, A 및 B를 포함하고 C를 포함하지 않을 수 있거나, B 및 C를 포함하고 A를 포함하지 않을 수 있거나, A 및 C를 포함하고 B를 포함하지 않을 수 있거나, A, B 및 C 모두를 포함할 수 있다.

기준 폴리펩티드 서열에 대한 퍼센트(%) 서열 동일성은 서열 비교 컴퓨터 프로그램 ALIGN-2를 이용하여 계산하였을 때, 서열을 정렬하고 필요하다면 최대 퍼센트 서열 동일성을 달성하기 위해 갭을 도입하고 임의의 보존적 치환을 서열 동일성의 일부로서 간주하지 않은 후, 기준 폴리펩티드 서열의 아미노산 잔기와 동일한 후보 서열의 아미노산 잔기의 퍼센트이다. ALIGN-2 서열 비교 컴퓨터 프로그램은 제넨테크 인코포레이티드(Genentech, Inc.)에 의해 개발되었고, 소스 코드는 미국 저작권청(워싱턴 D.C., 20559)에 사용자 문서로 출원되었고, 이 저작권청에 미국 저작권 등록번호 TXU510087로 등록되어 있다. ALIGN-2 프로그램은 제넨테크 인코포레이티드(캘리포니아주 사우스 샌프란시스코)로부터 공개적으로 입수 가능하거나, 원시 코드로부터 컴파일링될 수 있다. ALIGN-2 프로그램은 디지털 UNIX V4.0D를 포함하는 UNIX 운영 시스템 상에서 사용되도록 컴파일링되어야 한다. 모든 서열 비교 파라미터들은 ALIGN-2 프로그램에 의해 설정되고 변경되지 않는다. ALIGN-2가 아미노산 서열 비교를 위해 사용되는 상황에서, 소정의 아미노산 서열 B에 대한 소정의 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로 소정의 아미노산 서열 B에 대한 특정 % 아미노산 서열 동일성을 갖거나 포함하는 소정의 아미노산 서열 A로서 표현될 수 있음)은 다음과 같이 계산된다: 100 곱하기 분수 X/Y, 이때 X는 A와 B의 그 프로그램 정렬에서 서열 정렬 프로그램 ALIGN-2에 의해 동일한 일치로서 점수화된 아미노산 잔기의 수이고, Y는 B의 아미노산 잔기의 총수이다. 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동등하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성은 A에 대한 B의 % 아미노산 서열 동일성과 동등하지 않을 것임이 인식될 것이다. 구체적으로 달리 언급되어 있지 않은 한, 본원에서 사용된 모든 % 아미노산 서열 동일성 값들은 ALIGN-2 컴퓨터 프로그램을 사용함으로써 직전 단락에 기재된 바와 같이 수득된다.

본원에 기재된 임의의 폴리펩티드, I-TevI 도메인, 링커 도메인 또는 Cas 폴리펩티드 뉴클레아제는 본원에 제공된 서열목록에 기재되어 있는 임의의 나열된 폴리펩티드와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일할 수 있거나 이러한 폴리펩티드와 동일할 수 있다. 특정 실시양태에서, 언급된 서열 동일성을 포함하는 폴리펩티드는 폴리펩티드의 야생형 버전의 뉴클레아제 활성 또는 본원에 기재된 돌연변이들 중 어느 한 돌연변이(예를 들어, Cas9의 D10E 돌연변이; 또는 I-TevI의 (K26R, T95S 및 Q158R 돌연변이), (V117F 돌연변이) (K135R/N140S), (V117F/K135R/N140S))에 의해 부여된 변경된 뉴클레아제 활성을 보존할 수 있다.

일부 실시양태에서, 본원에 제공된 폴리펩티드 및 키메라 뉴클레아제의 아미노산 서열 변이체가 예상된다. 변이체는 전형적으로 하나 이상의 치환, 결실, 추가 및/또는 삽입에 의해 본원에 구체적으로 개시된 폴리펩티드와 상이하다. 이러한 변이체는 천연 생성 변이체일 수 있거나, 예를 들어, 본원에 기재된 폴리펩티드 서열들 중 하나 이상을 변형시키고 본원에 기재된 폴리펩티드의 하나 이상의 생물학적 활성을 평가함으로써 합성적으로 생성될 수 있고/있거나, 다수의 공지된 기법들 중 임의의 기법을 이용함으로써 합성적으로 생성될 수 있다. 최종 구축물이 원하는 특성, 예를 들어, 항원 결합을 보유하는 한, 최종 구축물에 도달하기 위해 결실, 삽입 및 치환의 임의의 조합을 만들 수 있다.

본원에서 사용된 바와 같이, 기준 서열에 비해 아미노산 서열 또는 핵산 서열을 기술하기 위해 본원에서 사용될 때 용어 "상동한", "상동성" 또는 "퍼센트 상동성"은 문헌[Proc. Natl. Acad. Sci. USA 90:5873-5877, 1993]에서와 같이 변형된, 문헌[Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87: 2264-2268, 1990]에 기재된 식을 이용함으로써 측정될 수 있다. 이러한 식은 문헌[Altschul et al., J. Mol. Biol. 215: 403-410, 1990]의 기본 국소 정렬 검색 수단(BLAST) 프로그램에 혼입된다. 서열의 퍼센트 상동성은 본원의 출원일 당시 BLAST의 가장 최신 버전을 이용함으로써 측정될 수 있다. 본원에 기재된 핵산 또는 가이드 RNA 중 임의의 핵산 또는 가이드 RNA는 언급된 서열에 의해 부여된 (예를 들어, 유전자 또는 뉴클레아제에 대한) 적절한 결합 활성을 유지하면서 언급된 서열번호에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 상동성을 포함할 수 있다.

단수 형태는 본원에서 이 형태의 하나 또는 하나 초과(즉, 적어도 하나)의 문법적 객체를 지칭하는 데 사용된다. 본원에서 사용된 용어 "및/또는"은 하나 또는 다른 하나 또는 둘 다를 가질 가능성으로서 정의된다. 예를 들어, "A 및/또는 B"는 A 또는 B만을 갖거나 A와 B의 조합을 가진 시나리오를 제공한다. A 및/또는 B 및/또는 C가 청구항에 기재되어 있는 경우, 조성물은 성분으로서 A 단독, B 단독 또는 C 단독을 포함할 수 있거나, A 및 B를 포함하고 C를 포함하지 않을 수 있거나, B 및 C를 포함하고 A를 포함하지 않을 수 있거나, A 및 C를 포함하고 B를 포함하지 않을 수 있거나, A, B 및 C 모두를 포함할 수 있다.

용어 "투여한다" 및 "투여하는"은 본원에서 약물, 의약 또는 다른 형태의 치료제를, 질환 또는 병태를 앓고 있는 환자에게 분배하거나 적용하는 것을 의미하는 데 사용된다.

본원에서 사용된 바와 같이, "완충제"는 약학적으로 허용되고 원하는 pH 범위 내에서 본 발명의 조성물을 유지할 수 있는 임의의 산 또는 염 조합이다. 개시된 조성물의 완충제는 pH를 약 2 내지 약 8.5, 약 5.0 내지 약 8.0, 약 6.0 내지 약 7.5, 약 6.5 내지 약 7.5, 또는 약 6.5로 유지한다. 적합한 완충제는 상기 pH 범위를 유지할 수 있는 임의의 약학적으로 허용되는 완충제, 예를 들어, 아세테이트, 타르트레이트, 포스페이트 또는 시트레이트 완충제를 포함한다. 한 실시양태에서, 완충제는 포스페이트 완충제이다. 또 다른 실시양태에서, 완충제는 아세테이트 완충제이다. 한 실시양태에서, 완충제는 인산수소이나트륨, 염화나트륨, 염화칼륨 및 일염기성 인산칼륨이다.

본원에서 사용된 바와 같이, 용어 "키메라 항원 수용체"는 면역요법에 사용하기 위한 인공 T 세포 수용체를 생성하도록 유전적으로 조작된 T 세포(CAR T 세포로서도 알려짐)를 지칭한다.

본원에서 사용된 바와 같이, 용어 "키메라 뉴클레아제"는 서열 특이성을 제공하기 위한 하나 이상의 DNA 결합 도메인 및 DNA 절단을 위한 하나 이상의 뉴클레아제 도메인을 포함하는 조작된 단백질을 지칭한다.

본원에서 사용된 바와 같이, 용어 "절단한다" 또는 "절단하기 위한" 또는 "절단된" 또는 "절단"은 DNA 분자의 하나 이상의 포스포디에스테르 결합의 분할을 의미한다. 단일 표적 부위에서의 이중 가닥 DNA의 절단은 비상동 말단 연결 또는 상동성 유도 복구에 의해 복구될 수 있는 2개의 DNA 단편을 생성한다. 2개의 표적 부위에서의 이중 가닥 DNA의 절단은 중간 단편의 상실 또는 결실과 함께 비상동 말단 연결 또는 상동성 유도 복구에 의해 복구될 수 있는 3개의 단편을 생성한다. 본원과 관련하여, 2개의 표적 부위에서의 게놈 DNA의 "절단"은 예측 가능한 길이 결실을 생성할 수 있다.

DNA 또는 RNA 단편 또는 표적 부위와 관련하여 본원에서 사용된 바와 같이, 용어 "규정된"은 특정 뉴클레오타이드 길이 또는 특정 뉴클레오타이드 서열을 가진다는 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "전달한다" 또는 "전달하기 위한" 또는 "전달된" 또는 "전달"은 유전자 편집 도구(예를 들어, 뉴클레아제, gRNA 및/또는 외생성 공여자 DNA)를 표적 세포로 직접 보내어, 생체내 또는 생체외에서 세포의 게놈 DNA의 유전적 변형을 달성하는 것을 의미한다.

용어 "유전적 조작" 및 문법적으로 동등한 용어는 하나 이상의 결실, 삽입 또는 치환을 표적 세포 또는 개체의 게놈 내로 도입하는 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "질환" 또는 "병든"은 인간, 동물 또는 식물의 구조 또는 기능 장애, 특히 특정 징후 또는 증상을 생성하거나 특정 위치에 영향을 미치고 단순히 신체적 상해의 직접적인 결과가 아닌 장애를 의미한다.

본원에서 사용된 바와 같이, 용어 "파괴"는 유전자의 발현 또는 기능이 억제되거나 불활성화되는 임의의 과정을 의미한다. "발현 파괴"는 유전 정보가 종종 단백질인 기능성 유전자 생성물의 합성에 사용되는 과정을 변경하거나, 억제하거나 제거하는 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "도메인" 및 "도메인들"은 단백질 쇄의 나머지 부분과 독립적으로 진화하고 작용하고 존재할 수 있는 소정의 단백질 서열 및 3차 구조의 보존된 부분을 지칭한다. 각각의 도메인은 조밀한 3차원 구조를 형성하며 종종 독립적으로 안정하고 접힐 수 있다. 많은 단백질들은 여러 구조적 도메인들로 구성된다. 하나의 도메인이 다양한 상이한 단백질들에 나타날 수 있다. 분자 진화는 도메인을 구축 블록으로서 사용하고 이들은 상이한 배열로 조합되어 상이한 기능을 가진 단백질을 생성할 수 있다. 일반적으로, 도메인의 길이는 약 50개 아미노산부터 최대 1,500개 아미노산까지 다양하다. 도메인은 종종 기능성 유닛, 예컨대, 칼모듈린의 칼슘 결합 EF 핸드 도메인을 형성한다. 도메인은 독립적으로 안정하기 때문에 유전적 조작에 의해 하나의 단백질과 또 다른 단백질 사이에 "교환"되어 키메라 단백질을 만들 수 있다.

본원에서 사용된 바와 같이, 용어 "편집한다" 또는 "편집하기 위한" 또는 "편집"은 유기체의 게놈 DNA를 변경하는 일군의 기술을 의미한다. 이러한 기술은 유전 물질이 게놈의 특정 위치에서 추가되거나, 제거되거나 변경될 수 있게 한다.

본원에서 사용된 바와 같이, "유효량"은 원하는 반응을 이끌어내기에 충분한 양을 의미한다. 본 발명에서 원하는 생물학적 반응은 T 세포 및 다분화능 줄기 세포를 비롯한 세포의 유전적 변형이다.

본원에서 사용된 바와 같이, 용어 "전기천공"은 세포막의 투과성을 증가시켜, 화학물질, 약물, DNA 또는 단백질이 세포 내로 도입될 수 있게 하기 위해 전기장을 세포에 인가하는 미생물학 기법을 의미한다.

본원에서 사용된 바와 같이, 용어 "내생성"은 유기체 내에서 성장하거나 유기체로부터 유래하는 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "등몰"은 동등한 수의 몰을 의미한다.

본원에서 사용된 바와 같이, 용어 "생체외"는 천연 조건이 최소한으로 변경된 외부 환경에서 유기체로부터의 조직에서 또는 조직에 대해 수행된 실험 또는 측정을 의미한다. 생체외는 시험될 샘플이 유기체로부터 추출되었음을 의미한다. 생체외 실험은 생체내 실험(온전한 유기체)에서 가능한 것보다 더 제어된 조건 하에 유기체의 세포 또는 조직을 사용할 수 있게 한다. 생체외 표본 사용의 예는 (1) 어세이; (2) 유기체의 암 세포에 대해 효과적인 암 치료제의 발견; (3) 특히 생명을 유지하지 못할 수 있는 다양한 환경(예를 들어, 극한의 압력 또는 온도)에서 물리적, 열적, 전기적, 기계적, 광학적 및 다른 조직 성질의 측정; (4) 수술 절차 개발을 위한 현실적인 모델; (5) 상이한 에너지 유형과 조직의 상호작용에 대한 조사를 포함한다. 본 발명에서, 생체외는 편집된 세포 또는 조직을, 이를 필요로 하는 대상체에게 이식하거나 투여할 목적으로 세포 또는 조직을 편집하는 것을 포함한다.

본원에서 사용된 바와 같이, 용어 "공여자 DNA" 또는 "외생성 공여자 DNA"는 임의의 방법, 예컨대, 비상동 말단 연결, 상동성 유도 복구, 미세상동성 유도 복구 또는 이들의 임의의 조합에 의해 게놈에 삽입되도록 의도된, 본원에 기재된 뉴클레아제와 함께 세포에 공급되는 DNA를 지칭한다. 공여자 DNA는 유기체 또는 세포에 천연적으로 존재하지 않는 유전 요소, 예컨대, 개방 판독 프레임, 엑손, 인트론 또는 발현 카세트를 포함하는 뉴클레오타이드 서열을 삽입할 수 있거나, 기존 유전자를 복구하거나 교체할 수 있다. 대안적으로, 공여자 DNA는 미스센스, 프레임 변동 돌연변이 또는 정지 코돈 돌연변이를 코돈 영역 또는 조절 요소(예를 들어, 프로모터, 스플라이스 공여자/수용자)에 도입함으로써 내생성 유전자를 파괴하도록 삽입될 수 있다. 공여자 DNA는 비제한적 예로서 플라스미드, 선형 단일 또는 이중 가닥 DNA, 합성 단일 또는 이중 가닥 DNA, 또는 바이러스 벡터에 의해 본원에 기재된 세포 또는 유기체에 공급될 수 있다. 공여자 DNA는 본원에 기재된 키메라 뉴클레아제 및 가이드 RNA를 코딩하는 핵산 및/또는 전달 벡터와 구별된다.

본원에서 사용된 바와 같이, 용어 "발현 카세트"는 형질감염된 세포에 의해 발현될 조절 서열에 작동 가능하게 연결된 유전자로 구성된 벡터 DNA의 별개의 구성요소를 지칭한다. 각각의 성공적인 형질감염에서, 발현 카세트는 세포의 기구에게 RNA(들)와 단백질(들)을 만들도록 지시한다. 일부 발현 카세트는 동일한 카세트를 쉽게 변경하여 상이한 단백질을 만들 수 있도록 단백질 코딩 서열의 모듈식 클로닝용으로 설계된다. 발현 카세트는 하나 이상의 유전자 및 이의 발현을 조절하는 서열로 구성된다. 발현 카세트는 3개의 구성요소, 즉 프로모터 서열, 개방 판독 프레임, 및 진핵생물에서 통상적으로 폴리아데닐화 부위를 함유하는 3' 비번역 영역을 포함한다. 정확한 조절 서열이 사용되는 한, 상이한 발현 카세트는 박테리아, 효모, 식물 및 포유동물 세포를 비롯한 다른 유기체 내로 형질감염될 수 있다.

본원에서 사용된 바와 같이, 용어 "단편" 또는 "단편들" 또는 "이의 단편"은 더 큰 독립체로부터 잘려진 작은 부분을 지칭한다. Cas 뉴클레아제 또는 I-TevI 뉴클레아제와 같은 뉴클레아제를 언급할 때 본원에 기재된 단편은 N-말단 또는 C-말단으로부터의 아미노산 잔기 결실, 또는 뉴클레아제의 효소 활성을 보존하는 규정된 내부 결실을 포함한다. 결실은 본원에 기재된 폴리펩티드의 N-말단, C-말단 또는 내부 서열로부터의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 아미노산 결실을 포함할 수 있다.

본원에서 사용된 바와 같이, 용어 "기능성 유전자"는 하나의 폴리펩티드 쇄 또는 다른 유전자 생성물을 코딩하는 DNA의 일부를 지칭한다. 따라서, '하나의 유전자/하나의 효소' 가설은 '하나의 시스트론(유전자)/하나의 폴리펩티드' 가설 또는 '하나의 유전자/하나의 기능성 생성물' 가설이 된다.

본원에서 사용된 바와 같이, 용어 "게놈 DNA" 또는 "gDNA"는 유전 물질의 대부분을 나타내는, 유기체의 염색체 DNA를 의미한다. 이것은 박테리아 플라스미드 DNA, 상보적 DNA 또는 미토콘드리아 DNA와 구별된다.

용어 "면역 내성"은 소정의 유기체에서 면역 반응을 이끌어내는 능력을 가진 물질 또는 조직에 대한 면역 시스템의 무반응 상태를 의미한다.

본원에서 사용된 바와 같이, 용어 "포함하는"은 "포함하나 이들로 제한되지 않는"을 의미하는 데 사용된다. "포함하는" 및 "포함하나 이들로 제한되지 않는"은 상호교환 가능하게 사용된다.

본원에서 사용된 바와 같이, 용어 "독립적인 부위"는 또 다른 부위와 연결되거나 서로 연결되지만 동일한 서열이 아니고 별개의 서열로서 간주되는, DNA 분자 또는 단백질/펩티드와 같은 표적 상의 또는 내의 영역을 의미한다.

본원에서 사용된 바와 같이, 용어 "유도 다분화능 줄기 세포"는 체세포로부터 직접 생성될 수 있는 일종의 다분화능 줄기 세포를 의미한다.

본 명세서 및 특히 청구된 발명에서 사용된 바와 같이, 용어 "억제한다" 또는 "억제하기 위한" 또는 "억제하고" 또는 "억제하는" 또는 "억제" 또는 "이의 억제"는 기능을 늦추거나 방해하거나, 효소 또는 다른 작용제의 활성을 감소시키는 능력을 의미한다.

본원에서 사용된 바와 같이, 용어 "삽입"은 전체 유전자 또는 규정된 길이의 DNA 분자를 세포에 추가하는 것, 또는 뉴클레오타이드 서브세트를 유전자에 추가하고/하거나 치환시키는 것을 의미하는 데 사용된다.

본원에서 사용된 바와 같이, 용어 "링커"는 RNA-가이드 뉴클레아제 도메인(Cas9)이 표적 DNA 서열에 결합할 때 아미노산 링커 도메인이 I-TevI 도메인의 이동성을 보장하여 세포 생리학적 조건(전형적으로: pH 약 7.2, 온도 약 37℃, [K+] 약 140 mM, [Na+] 약 5 내지 15 mM, [Cl-] 약 4 mM, [Ca++] 약 0.0001 mM) 하에 그의 표적 서열의 인식, 결합 및 절단을 허용하는 상황을 의미한다. 아미노산 링커의 길이는 Cas9 표적 부위와 I-TevI 표적 부위 사이에 얼마나 많은 뉴클레오타이드가 바람직한지에 영향을 미칠 수 있다. 링커의 특정 아미노산은 TevCas9에 의해 표적화되는 DNA 서열과 특이적으로 접촉할 수도 있다. 이 링커-DNA 접촉은 I-TevI 도메인의 유연성에 영향을 미칠 수 있다. 링커 도메인의 아미노산의 치환은 링커 도메인이 DNA와 접촉하는 능력에 영향을 미칠 수 있다.

본원에서 사용된 바와 같이, 용어 "변형시킨다" 또는 "변형시키기 위한" 또는 "변형시키는" 또는 "변형된" 또는 "변형"은 유기체의 DNA 내에서 원하는 유전자의 뉴클레오타이드를 변경시킴으로써 식물, 동물 또는 미생물의 특성을 변화시키는 기법을 의미한다. 변경은 전체 유전자를 포함하는 뉴클레오타이드 및/또는 이의 단편의 제거 및/또는 추가를 포함할 수 있다. 상기 용어는 신규 기능을 제공하기 위해 기본적 또는 근본적 변화를 만드는 것, 예컨대, 면역 세포(예컨대, T 세포) 또는 유도 다분화능 줄기 세포(iPSC)가 면역 내성을 나타내고/내거나 외생성 유전자, 예컨대, 키메라 항원 수용체(CAR)를 발현하도록 조작함으로써 이 세포의 DNA를 변경하는 것을 의미하지만, 이러한 세포 유형으로 제한되지 않는다. 본원과 관련하여, 이 용어는 일반적으로 세포에서 DNA의 뉴클레오타이드의 추가 또는 결실을 의미한다. 특히, 이 용어는 I-TevI 도메인의 합성된 버전, 링커 펩티드, 및 공지된 세포 요법에서 면역원성을 유발하기 위해 유전자를 표적으로 하도록 설계된 RNA-가이드 뉴클레아제의 변형된 버전을 의미한다.

본원에서 사용된 바와 같이, 용어 "비상동 말단 연결"은 DNA의 이중 가닥 절단을 복구하는 경로를 의미한다. NHEJ는 복구를 안내하기 위해 상동 서열을 요구하는 상동성 유도 복구와 대조적으로 상동 주형을 필요로 하지 않으면서 절단 말단이 직접 라이게이션되기 때문에 "비상동"으로서 지칭된다.

본원에서 사용된 바와 같이, 용어 "뉴클레아제"는 핵산의 뉴클레오타이드 사이의 포스포디에스테르 결합을 절단하는 효소를 지칭한다.

본원에서 사용된 바와 같이, 용어 "뉴클레아제 도메인"은 DNA 가닥의 물리적 절단을 담당하고 단일 가닥 또는 이중 가닥 절단을 도입할 수 있는, 표적 상의 영역을 지칭한다. 예를 들어, 일부 실시양태에서, 뉴클레아제 도메인은 야생형 I-TevI 뉴클레아제 도메인의 아미노산 1 내지 92를 지칭할 수 있거나, 변경된 아미노산 서열 및/또는 결합 또는 뉴클레아제 성질을 가진 이의 변이체를 지칭할 수 있다.

본원에서 사용된 바와 같이, 용어 "아웃-오프-프레임 돌연변이" 또는 "프레임 변동 돌연변이"는 단백질의 생성을 심각하게 파괴하여 완전히 비기능적인 단백질을 생성하거나 단백질을 전혀 생성하지 않게 하는, 하나 이상의 뉴클레오타이드의 제거 또는 추가를 의미한다.

본 방법에 의해 치료될 "환자", "대상체" 또는 "숙주"라는 용어는 인간 또는 비인간 동물을 의미할 수 있다. 비인간 동물은 반려 동물(예를 들어, 고양이, 개) 및 소비를 위해 사육되는 동물(즉, 식용 동물), 예컨대, 소, 돼지 및 닭을 포함한다.

용어 "약학적으로 허용되는 제제"는 당분야에서 인식되어 있고, 임의의 대상 조성물 또는 이의 성분을 하나의 장기 또는 신체의 일부로부터 또 다른 장기 또는 신체의 일부로 운반하거나 수송하는 데 관여하는 약학적으로 허용되는 물질, 조성물 또는 비히클, 예컨대, 액체 또는 고체 충전제, 희석제, 부형제, 용매 또는 캡슐화 물질을 의미한다. 각각의 담체는 대상 조성물 및 이의 성분과 양립 가능하고 환자에게 해롭지 않다는 의미에서 "허용 가능"해야 한다. 약학적으로 허용되는 담체로서 사용될 수 있는 물질의 일부 예는 (1) 당, 예컨대, 덱스트로스, 락토스, 글루코스 및 수크로스; (2) 전분, 예컨대, 옥수수 전분 및 감자 전분; (3) 셀룰로스 및 이의 유도체, 예컨대, 미세결정성 셀룰로스, 나트륨 카르복시메틸 셀룰로스, 메틸 셀룰로스, 에틸 셀룰로스, 하이드록시프로필메틸 셀룰로스(HPMC) 및 셀룰로스 아세테이트; (4) 글리콜, 예컨대, 프로필렌 글리콜; (5) 폴리올, 예컨대, 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; (6) 에스테르, 예컨대, 에틸 올레에이트, 글리세릴 베헤네이트 및 에틸 라우레이트; (7) 완충제, 예컨대, 일염기성 포스페이트 및 이염기성 포스페이트, 트리스/보레이트/EDTA 및 트리스/아세테이트/EDTA; (8) 발열원 무함유 물; (9) 등장성 식염수; (10) 링거 용액; (11) 에틸 알코올; (12) 포스페이트 완충제 용액; (13) 폴리소르베이트; (14) 폴리포스페이트; 및 (15) 약학 제제에 사용되는 다른 무독성 양립 가능한 물질을 포함한다. 개시된 부형제는 하나 이상의 기능을 제공할 수 있다. 예를 들어, 가용화제는 또한 현탁 보조제, 유화제, 방부제 등일 수 있다.

본원에서 사용된 바와 같이, 용어 "다분화능 줄기 세포"는 자가재생되고 신체 조직의 임의의 세포를 생성하는 능력을 가진 세포 유형을 지칭한다.

본원에 기재된 바와 같은 T 세포는 적응성 세포 면역 반응에 관여하는 일종의 면역 세포이다. T 세포는 세포 표면 분자 CD3의 발현에 의해 식별된다. T 세포는 키메라 항원 수용체(CAR)를 발현할 때 치료 세포로서 활용될 수 있다.

본원에 기재된 바와 같은 NK 세포는 면역 반응에 관여하는 일종의 면역 세포이다. NK 세포는 세포 표면 분자 CD56의 발현에 의해 식별된다. NK 세포는 키메라 항원 수용체(CAR)를 발현할 때 치료 세포로서 활용될 수 있다.

본원에 기재된 바와 같은 조혈 줄기 세포(HSC)는 백혈구, 적혈구 및 혈소판을 포함하는 모든 유형의 혈액 세포로 발달할 수 있는 미성숙 세포이다. 조혈 줄기 세포는 말초 혈액과 골수에서 발견된다. 혈액 줄기 세포로서도 지칭된다. 조혈 줄기 세포는 세포 표면 분자 CD34의 발현에 의해 식별된다.

본원에 기재된 바와 같은 중간엽 줄기 세포는 조골세포(골 세포), 연골세포(연골 세포), 근세포(근육 세포) 및 지방세포(지방 세포)를 포함하는 다양한 세포 유형으로 분화할 수 있는 다분화능 간질 세포이다.

본원에서 사용된 바와 같이, 용어 "폴리펩티드"는 단백질 분자의 일부(또는 전체)를 형성하는, 쇄로 함께 결합된 다수의 아미노산 잔기로 구성된 선형 유기 중합체를 의미한다.

단백질 생성 또는 기능과 관련하여 본원에서 사용된 바와 같이, 용어 "적절한"은 생물학적 효과 또는 활성을 실질적으로 보유하거나 본원에 기재된 바와 같은 의도된 용도에 적합한 실질적으로 정상적인 또는 천연 형태의 단백질의 생성을 의미한다.

본원에서 사용된 바와 같이, 용어 "RNA 가이딩" 또는 "가이드 RNA"는 CRISPR 및 Cas9를 이용하는 원핵생물 DNA 편집을 의미한다. 이 원핵생물 DNA 편집 시스템의 경우, RNA-가이드 뉴클레아제는 표적 서열 특이성을 CRISPR-Cas9 시스템에 부여한다. 이 gRNA는 상보적 표적 DNA 서열에 결합하는 비코딩 짧은 RNA 서열이다.

본원에서 사용된 바와 같이, 용어 "선택된 DNA"는 더 많은 수의 DNA 서열로부터 선택되거나 단리된 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "적합한"은 용도 또는 목적에 충분히 맞추어짐을 의미한다.

특히 본 발명과 관련하여 본원에서 사용된 바와 같이, 용어 "표적 부위" 또는 "표적 부위들"은 뉴클레아제로 표적화될 때 뉴클레아제에 의해 결합되고/되거나 절단될 유전자의 위치를 지칭한다. 표적 부위는 다수의 뉴클레오타이드, 예컨대, I-TevI 또는 CRISPR/Cas 뉴클레아제의 절단 부위, 또는 I-TevI 뉴클레아제 또는 CRISPR/Cas 가이드 RNA의 DNA 결합 부위를 포괄할 수 있다. 표적 부위는 다양한 세포 유형 및 유기체 중 임의의 세포 유형 및 유기체의 유전자 또는 유전자간 영역에 있을 수 있다.

본원의 발명과 관련하여 본원에서 사용된 바와 같이, 용어 "표적화한다" 또는 "표적으로 하는" 또는 "표적으로 하기 위한" 또는 "표적화"는 예를 들어, 선택되거나 조작된 DNA 결합 도메인 또는 가이드 RNA를 사용하여 뉴클레아제를 특정 선택된 DNA 서열로 조준하거나 유도하는 것을 의미한다.

본원에서 사용된 바와 같이, 용어 "바이러스 벡터"는 유전 물질을 세포로 전달하는 데 통상적으로 이용되는 도구를 의미한다. 이 과정은 살아있는 유기체 내부(생체내) 또는 세포 배양물(시험관내)에서 수행될 수 있다. 바이러스 벡터의 예는 AAV 벡터, 렌티바이러스 벡터 및 아데노바이러스 벡터를 포함한다.

본원에서 사용된 바와 같이, 용어 "동시에"는 다수의 gRNA를 가진 CRISPR/Cas9 복합체를 동시에 또는 실질적으로 동시에 투여하는 것을 의미한다. 특정 절차는 순차적으로 일어나지만 작은 간격에 의해 떨어져 있는 단계에서 실행될 수 있음을 이해할 것이다. 예를 들어, 세포의 전기천공 후 약 1시간 이내에 공여자 DNA를 투여한다.

본원에서 사용된 바와 같이, 용어 "치환"은 서열 내의 아미노산을 상이한 아미노산으로 교체하는 것을 의미한다. 본원에서 사용된 바와 같이, 약칭 X10Y는 서열의 10번째 위치에서 발견되는 아미노산 X가 아미노산 Y로 "치환"되었음을 표시한다. 예를 들어, W26C는 아미노산 트립토판-26(Trp, W)이 시스테인(Cys)으로 바뀌었음을 의미한다. 유사하게, 표기 AAX는 AA가 X 위치에서 발견된 아미노산을 대체한 아미노산임을 표시한다. 예를 들어, Lys26은 서열에서 26번째 위치의 아미노산이 라이신으로 교체되었음을 의미한다. 어느 한 약칭의 사용은 상호교환 가능하다. 또한, 아미노산에 대한 1-글자 또는 3-글자 약어의 사용도 상호교환 가능하다.

본원에서 사용된 바와 같이, 용어 "치료하는"은 병태, 질환, 장애 등을 개선하는 임의의 효과, 예를 들어, 경감, 감소, 조절 또는 제거를 포함한다. 본원에서 사용된 바와 같이, "치료하는"은 예방적 치료 및 치료적 치료를 둘 다를 포함할 수 있다. 예를 들어, 치료적 치료는 낭포성 섬유증 또는 비소세포 폐암의 진행을 지연시키거나 억제하거나 예방하는 것, 및 낭포성 섬유증 또는 비소세포 폐암과 관련된 증상을 감소시키거나 제거하는 것을 포함할 수 있다. 예방적 치료는 낭포성 섬유증 또는 비소세포 폐암의 발병을 예방하거나, 억제하거나 지연시키는 것을 포함할 수 있다.

약어

본원에서 사용된 약어는 다음과 같이 정의된다:

AA 아미노산

AAVS1 아데노 관련 바이러스 통합 부위 1

B2M 베타-2 마이크로글로불린

CAR 키메라 항원 수용체

Cas9 CRISPR 관련 단백질 9

Cpf1 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1의 CRISPR

CRISPR 클러스터링 조절 이격된 짧은 팔린드로믹 반복부

CFTR 낭포성 섬유증 막횡단 전도도 조절제 유전자

DNA 데옥시리보핵산

이. 콜라이 에스케리키아 콜라이

EDTA 에틸렌디아민테트라아세트산

EGFR 표피 성장 인자 수용체

HDR 상동성 유도 복구

HLA-A 조직적합성 항원, A 알파 쇄

iPSC 유도 다분화능 줄기 세포

NHEJ 비상동 말단 연결

NLS 핵 국소화 신호

PCR 중합효소 연쇄 반응

RNA 리보핵산

saCas9 스타필로코커스 아우레우스 Cas9

scCas9 스트렙토코커스 캐니스 Cas9

spCas9 스트렙토코커스 피오게네스 Cas9

TALEN 전사 활성화제 유사 이펙터 뉴클레아제

TCR T 세포 수용체

TevCas9 변형된 I-TevI 도메인, 링커 펩티드 및 변형된 RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9

TRAC1 T 세포 수용체 알파 쇄 불변

TRBC1 T 세포 수용체 베타 불변 1

ZFN 징크 핑거 뉴클레아제

실시예

하기 예증적인 실시예는 본원에 기재된 조성물 및 방법의 실시양태를 대표하고 어떠한 방식으로든 제한하기 위한 것이 아니다.

실시예 1 - TevSaCas9는 표적 부위를 절단한다 .

도 2의 A는 서열번호 17의 가이드 RNA의 사용을 통해 B2M 유전자로 표적화된 TevSaCas9가 시험관내에서 B2M DNA 기질을 절단함을 예증한다. 시간 경과에 따른 절단 반응의 생성물을 아가로스 겔에서 가시화한다. 도 2의 B는 처리 48시간 후 상 대비(Phase Contrast) 및 Cytation5(Biotek Instruments Inc, 미국 버지니아주)에서의 GFP 영상화를 이용하여, 절단 가능한 GFP 태그에 융합된 TevSaCas9의 플라스미드 DNA 버전으로 형질감염시킨 포유동물 세포를 영상화한 것이다. 도 2의 C는 수거된 세포로부터 추출된 게놈 DNA의 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이에 의해 검출된 바와 같이 플라스미드 DNA에 의해 코딩된 TevSaCas9에 의한 B2M 유전자의 편집을 입증한다. 도 2의 D는 서열번호 17의 B2M 표적화 가이드 RNA와 복합체를 형성하였고 포유동물 세포 내로 형질감염된, 서열번호 29의 정제된 TevSaCas9 단백질 또는 V117F/K135R/N140S 돌연변이를 함유하는 서열번호 32의 TevSaCas9 단백질을 사용하여 B2M 유전자의 편집을 입증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다.

도 3의 A는 서열번호 22의 가이드의 사용에 의해 AAVS1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 AAVS1 표적 부위(온-표적)를 절단하지만 오프-표적 서열을 절단하지 않음을 예증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출한다. 인 실리코(in silico)에서 예측된 상위 5개의 오프-표적 부위에서의 편집도 T7 엔도뉴클레아제 I 절단 어세이에 의해 측정되었으나, 오프-표적은 검출되지 않았다. 도 3의 B는 AAVS1에 대한 온-표적 및 오프-표적 부위의 서열을 보여준다. 회색으로 강조된 서열은 가이드 RNA 표적 부위를 표시한다. 소문자 뉴클레오타이드는 온-표적에 대한 불일치 위치를 표시한다. 밑줄 표시된 서열은 추정 I-TevI 결합 및 절단 부위를 표시한다. 도 3의 C는 포유동물 세포의 AAVS1 유전자에서 서열번호 37의 Tev[KTQ]-SaCas9[D10E] 및 서열번호 33의 Tev[KTQ]-SaCas9[WT]의 활성을 입증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출한다.

도 6은 서열번호 20의 가이드의 사용에 의해 TRBC1 유전자로 표적화된 TevSaCas9가 포유동물 세포의 게놈에서 TRBC1 표적 부위를 절단함을 예증한다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 TRBC1 유전자의 편집을 검출한다.

실시예 2 - TevSaCas9는 공여자 DNA를 특정 게놈 부위에 삽입한다.

도 4의 A는 TevSaCas9 절단(검은색) 및 절단 부위 내로의 공여자 올리고뉴클레오타이드 복구 주형의 삽입(회색) 후 B2M 유전자의 표적 부위를 나타내고 올리고뉴클레오타이드 복구가 일어남을 보여주는 도면을 보여준다. 도 4의 B는 공여자 올리고뉴클레오타이드 복구 주형의 삽입을 예증한다. B2M에 대한 TevSaCas9 및 유일무이한 제한 효소 부위를 가진 복구 주형으로 형질감염시킨 세포의 T7 엔도뉴클레아제 I 절단 어세이("T7E1") 및 제한 효소 분해("RE")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다. 올리고뉴클레오타이드 복구 주형의 삽입을 제한 효소 분해로 측정한다.

도 5의 A 및 B는 TevSaCas9에 의한 절단 후 게놈 내의 AAVS1 안전한 은닉 부위(검은색)를 도시하는 도면이다. TevSaCas9 절단 부위와 양립 가능한 말단을 가진 약 1.2 킬로염기의 녹색 형광 단백질(GFP) 리포터 구축물이 회색으로 표시되어 있다. GFP 형광은 리포터 + TevSaCas9 세포에서 관찰되었으나, 리포터만을 가진 세포에서는 관찰되지 않았다. 도 5의 B는 HEK293 세포에서 AAVS1 부위 내로의 GFP 리포터의 삽입 및 발현을 입증한다. 리포터 구축물과 함께 또는 리포터 구축물 없이 TevSaCas9로 처리한 세포를 공-형질감염 48시간 후에 영상화하였다. GFP 양성 세포의 존재는 GFP 리포터의 발현을 표시한다.

도 7의 A는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드 복구 주형("RT")의 서열의 도면이다. 소문자로 표시된 것은 BglII 제한 효소 부위이고 밑줄로 표시된 것은 단일 LoxP 부위이다. 도 7의 B는 단일 LoxP 부위를 함유하는 이중 가닥 DNA 올리고뉴클레오타이드가 AAVS1 표적 부위 내로 삽입됨을 입증한다. BglII 및 LoxP 부위를 가진 복구 주형(RT)과 함께 또는 이 복구 주형 없이 AAVS1로 표적화된 TevSaCas9로 형질감염시킨 세포의 T7 엔도뉴클레아제 I 절단 어세이("T7E1") 및 제한 효소 분해("RE")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7E1 어세이로 AAVS1 유전자의 편집을 검출한다. 올리고뉴클레오타이드 복구 주형의 삽입을 RE 분해로 측정한다. RT를 포함하는, TevSaCas9로 처리된 세포는 AAVS1 표적 부위에서 RT의 삽입을 표시하는 예상된 크기의 RE 분해 생성물을 보여준다.

도 8의 A는 전기천공된 리보핵단백질 TevSaCas9가 포유동물 세포에서 B2M 표적 부위를 편집함을 예증한다. Neon® 형질감염 시스템(Thermo Fisher Scientific®, 미국 매사추세츠주 왈쌈)에서 각각 20 밀리초의 2회 펄스와 함께 1150 볼트를 사용하여 B2M으로 표적화된 1.5 μM의 TevSaCas9 리보핵단백질 복합체로 HEK293 세포를 전기천공하였다. TevSaCas9로 처리된 전기천공된 세포 또는 모의 전기천공된 세포에 대한 T7 엔도뉴클레아제 I 절단 어세이("T7E1")의 결과가 제시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다. 도 8의 B는 전기천공된 TevSaCas9 리보핵단백질 복합체를 사용하여 공여자 DNA를 B2M 표적 부위에 혼입할 수 있음을 입증한다. 녹색 형광 단백질(GFP) 리포터를 함유하는 2 ㎍의 선형화된 공여자 DNA(RT)가 포함되었다는 점을 제외하고 (A)에서와 같이 HEK293 세포를 전기천공하였다. 그 다음, 형광 활성화 세포 분류를 이용하여 GFP 양성 세포를 단일 세포로 분류하고 세포의 클론 집단을 확장하였다. 게놈 DNA 샘플을 추출하고 B2M 유전자좌를 증폭함으로써 클론에서 GFP 리포터의 존재를 검출하였다. 공여자 DNA 구축물의 크기에 상응하는 아가로스 겔의 밴드(*로 표시됨)가 클론 2에서 관찰되는데, 이는 리포터가 B2M 표적 부위에 성공적으로 통합됨을 시사한다. 도 8의 C는 유도된 공여자 DNA가 다분화능 줄기 세포(iPSC)의 B2M 표적 부위에 혼입될 수 있음을 입증한다. mCherry 형광 리포터를 함유하는 2 ㎍의 선형화된 공여자 DNA("RT")와 함께 또는 이러한 공여자 DNA 없이 B2M으로 표적화된 7.5 ㎍의 TevSaCas9 리보핵단백질 복합체로 iPSC를 전기천공하였다. 세포에 대해서만 모의 전기천공을 수행하였다. 수거된 세포로부터 게놈 DNA를 추출하고 B2M 유전자좌를 PCR로 증폭하였다. 공여자 DNA 구축물의 크기에 상응하는 아가로스 겔의 밴드(*로 표시됨)는 RT의 존재 하에서만 관찰되는데, 이는 공여자 DNA가 B2M 유전자좌에 삽입됨을 시사한다.

실시예 3 - 상이한 핵 국소화 신호(NLS)를 가진 TevSaCas9는 표적 부위를 절단한다 .

도 10은 HEK293 세포에서 상이한 핵 국소화 신호(NLS)를 가진 서열번호 32의 TevSaCas9에 의한 B2M 유전자의 절단을 예증한다. 인간 인플루엔자 헤마글루티닌(HA) 서열("뉴클레오플라스민")에 의해 분리된 서열번호 56의 2개의 C-말단 뉴클레오플라스민 NLS, HA 서열에 의해 분리된 서열번호 55의 2개의 SV40 NLS("이분 SV40"), 또는 2개의 SV40 NLS가 뒤따르는 HA 서열("탠덤 SV40")을 가진, B2M 유전자로 표적화된 TevSaCas9의 T7 엔도뉴클레아제 I 절단 어세이("T7E1")의 결과가 표시되어 있다. 지질감염 시약으로 처리된 세포("모의")도 표시되어 있다. 수거된 세포로부터 게놈 DNA를 추출하고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 B2M 유전자의 편집을 검출한다.

실시예 4 - I-TevI와 Cas12a의 융합체에 의한 이중 가닥 DNA 절단

도 9의 A 및 B는 I-TevI와 서열번호 47의 Cas12a의 융합체가 가이드 RNA에 의해 활성화되어 이중 가닥 DNA 기질을 절단함을 예증한다. 서열번호 50의 가이드 RNA의 사용에 의해 AAVS1 유전자로 표적화된 정제된 Cas12a 및 TevCas12는 시험관내에서 AAVS1 DNA 기질을 절단한다. "C"로 표시된 레인은 단백질 단독 샘플을 표시한다. 시간 경과에 따른 절단 반응의 생성물을 아가로스 겔에서 가시화한다. Cas12a 절단으로부터 비롯된 2개의 밴드는 단일 절단을 표시한다. 예상외로, TevCas12a에서 여러 절단 생성물이 관찰되는데, 이는 TevCas12a가 가이드 RNA의 존재 하에 이중 가닥 DNA를 비특이적으로 절단함을 시사한다. 도 9의 B는 TevCas12a가 세포에서 AAVS1 표적 부위를 절단함을 입증한다. HEK293 세포를 AAVS1로 표적화된 Cas12a 및 TevCas12a로 지질감염시켰다. 수거된 세포로부터 게놈 DNA를 추출하였고 PCR 증폭 및 T7 엔도뉴클레아제 I 절단 어세이로 AAVS1 유전자의 편집을 검출하였다. Cas12a 및 TevCas12a 샘플에 유의미하게 더 많은 생성물이 존재한다는 것은 TevCas12a가 세포에서 AAVS1 유전자를 절단함을 시사한다.

본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태가 단지 예로서 제공된다는 것은 당분야의 숙련된 자에게 자명할 것이다. 비로소 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야의 숙련된 자에게 인식될 것이다. 본원에 기재된 본 발명의 실시양태의 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다.

본 명세서에서 인용된 모든 간행물, 특허 출원, 발행된 특허 및 다른 문헌은 각각의 개별 간행물, 특허 출원, 발행된 특허 또는 다른 문헌이 전체적으로 본원에 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것처럼 본원에 참고로 포함된다. 참고로 포함된 문헌에 함유된 정의는 이 정의가 본 개시내용의 정의와 모순되는 범위 내에서 제외된다.

본 발명의 특정 실시양태가 논의되었지만, 본 명세서는 예시적이며 제한적이지 않다. 본 명세서를 검토할 때 본 발명의 많은 변경이 당분야의 숙련된 자에게 명백해질 것이다. 본 발명의 전체 범위는 균등물의 전체 범위와 함께 청구범위를 참고하고, 이러한 변경과 함께 본 명세서를 참고함으로써 결정되어야 한다.

달리 표시되지 않는 한, 본 명세서 및 청구범위에서 사용된 성분, 반응 조건 등의 양을 표현하는 모든 숫자는 모든 경우 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 반대로 표시되어 있지 않는 한, 본 명세서 및 첨부된 청구범위에 제시된 수치 파라미터는 본 발명에 의해 얻고자 하는 원하는 성질에 따라 달라질 수 있는 근사치이다.

상기 논의는 본 발명의 원리 및 다양한 실시양태를 예시하기 위한 것이다. 일단 상기 개시내용이 완전히 이해되면, 다수의 변경, 조합 및 변형은 당분야의 숙련된 자에게 명백해질 것이다. 하기 청구범위는 모든 이러한 변경 및 변형을 포괄하는 것으로 해석되어야 한다.

SEQUENCE LISTING <110> SPECIFIC BIOLOGICS INC. <120> GENE EDITING WITH A MODIFIED ENDONUCLEASE <130> 61414-702.601 <140> PCT/IB2021/060236 <141> 2021-11-04 <150> 63/109,396 <151> 2020-11-04 <160> 67 <170> PatentIn version 3.5 <210> 1 <211> 1675 <212> DNA <213> Homo sapiens <400> 1 attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60 gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120 tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180 catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240 cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300 acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360 aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420 tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480 acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540 ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600 ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660 tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720 ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780 tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840 ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900 ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960 ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020 gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080 ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140 acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200 ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260 ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320 ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380 ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440 tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500 aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560 ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620 actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675 <210> 2 <211> 1675 <212> DNA <213> Homo sapiens <400> 2 attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60 gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120 tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180 catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240 cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300 acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360 aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420 tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480 acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540 ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600 ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660 tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720 ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780 tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840 ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900 ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960 ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020 gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080 ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140 acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200 ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260 ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320 ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380 ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440 tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500 aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560 ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620 actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675 <210> 3 <211> 1508 <212> DNA <213> Homo sapiens <400> 3 ttttgaaacc cttcaaaggc agagacttgt ccagcctaac ctgcctgctg ctcctagctc 60 ctgaggctca gggcccttgg cttctgtccg ctctgctcag ggccctccag cgtggccact 120 gctcagccat gctcctgctg ctcgtcccag tgctcgaggt gatttttacc ctgggaggaa 180 ccagagccca gtcggtgacc cagcttggca gccacgtctc tgtctctgaa ggagccctgg 240 ttctgctgag gtgcaactac tcatcgtctg ttccaccata tctcttctgg tatgtgcaat 300 accccaacca aggactccag cttctcctga agtacacatc agcggccacc ctggttaaag 360 gcatcaacgg ttttgaggct gaatttaaga agagtgaaac ctccttccac ctgacgaaac 420 cctcagccca tatgagcgac gcggctgagt acttctgtgc tgtgagtgat ctcgaaccga 480 acagcagtgc ttccaagata atctttggat cagggaccag actcagcatc cggccaaata 540 tccagaaccc tgaccctgcc gtgtaccagc tgagagactc taaatccagt gacaagtctg 600 tctgcctatt caccgatttt gattctcaaa caaatgtgtc acaaagtaag gattctgatg 660 tgtatatcac agacaaaact gtgctagaca tgaggtctat ggacttcaag agcaacagtg 720 ctgtggcctg gagcaacaaa tctgactttg catgtgcaaa cgccttcaac aacagcatta 780 ttccagaaga caccttcttc cccagcccag aaagttcctg tgatgtcaag ctggtcgaga 840 aaagctttga aacagatacg aacctaaact ttcaaaacct gtcagtgatt gggttccgaa 900 tcctcctcct gaaagtggcc gggtttaatc tgctcatgac gctgcggctg tggtccagct 960 gagatctgca agattgtaag acagcctgtg ctccctcgct ccttcctctg cattgcccct 1020 cttctccctc tccaaacaga gggaactctc ctacccccaa ggaggtgaaa gctgctacca 1080 cctctgtgcc cccccggtaa tgccaccaac tggatcctac ccgaatttat gattaagatt 1140 gctgaagagc tgccaaacac tgctgccacc ccctctgttc ccttattgct gcttgtcact 1200 gcctgacatt cacggcagag gcaaggctgc tgcagcctcc cctggctgtg cacattccct 1260 cctgctcccc agagactgcc tccgccatcc cacagatgat ggatcttcag tgggttctct 1320 tgggctctag gtcctggaga atgttgtgag gggtttattt ttttttaata gtgttcataa 1380 agaaatacat agtattcttc ttctcaagac gtggggggaa attatctcat tatcgaggcc 1440 ctgctatgct gtgtgtctgg gcgtgttgta tgtcctgctg ccgatgcctt cattaaaatg 1500 atttggaa 1508 <210> 4 <211> 1221 <212> DNA <213> Homo sapiens <400> 4 gggctccagg ctgctctgtt gggtgctgct ttgtctcctg ggagcaggcc cagtaaaggc 60 tggagtcact caaactccaa gatatctgat caaaacgaga ggacagcaag tgacactgag 120 ctgctcccct atctctgggc ataggagtgt atcctggtac caacagaccc caggacaggg 180 ccttcagttc ctctttgaat acttcagtga gacacagaga aacaaaggaa acttccctgg 240 tcgattctca gggcgccagt tctctaactc tcgctctgag atgaatgtga gcaccttgga 300 gctgggggac tcggcccttt atctttgcgc cagcagccgg acagggggcg taaagaattc 360 acccctccac tttgggaacg ggaccaggct cactgtgaca gaggacctga acaaggtgtt 420 cccacccgag gtcgctgtgt ttgagccatc agaagcagag atctcccaca cccaaaaggc 480 cacactggtg tgcctggcca caggcttctt ccctgaccac gtggagctga gctggtgggt 540 gaatgggaag gaggtgcaca gtggggtcag cacggacccg cagcccctca aggagcagcc 600 cgccctcaat gactccagat actgcctgag cagccgcctg agggtctcgg ccaccttctg 660 gcagaacccc cgcaaccact tccgctgtca agtccagttc tacgggctct cggagaatga 720 cgagtggacc caggataggg ccaaacccgt cacccagatc gtcagcgccg aggcctgggg 780 tagagcagac tgtggcttta cctcggtgtc ctaccagcaa ggggtcctgt ctgccaccat 840 cctctatgag atcctgctag ggaaggccac cctgtatgct gtgctggtca gcgcccttgt 900 gttgatggcc atggtcaaga gaaaggattt ctgaaggcag ccctggaagt ggagttagga 960 gcttctaacc cgtcatggtt tcaatacaca ttcttctttt gccagcgctt ctgaagagct 1020 gctctcacct ctctgcatcc caatagatat ccccctatgt gcatgcacac ctgcacactc 1080 acggctgaaa tctccctaac ccagggggac cttagcatgc ctaagtgact aaaccaataa 1140 aaatgttctg gtctggcctg aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1200 aaaaaaaaaa aaaaaaaaaa a 1221 <210> 5 <211> 1434 <212> DNA <213> Homo sapiens <400> 5 gatggccgtc atggcgcccc gaaccctcct cctgctactc tcgggggccc tggccctgac 60 ccagacctgg gcgggctccc actccatgag gtatttcttc acatccgtgt cccggcccgg 120 ccgcggggag ccccgcttca tcgccgtggg ctacgtggac gacacgcagt tcgtgcggtt 180 cgacagcgac gccgcgagcc agaagatgga gccgcgggcg ccgtggatag agcaggaggg 240 gccggagtat tgggaccagg agacacggaa tatgaaggcc cactcacaga ctgaccgagc 300 gaacctgggg accctgcgcg gctactacaa ccagagcgag gacggttctc acaccatcca 360 gataatgtat ggctgcgacg tggggccgga cgggcgcttc ctccgcgggt accggcagga 420 cgcctacgac ggcaaggatt acatcgccct gaacgaggac ctgcgctctt ggaccgcggc 480 ggacatggca gctcagatca ccaagcgcaa gtgggaggcg gtccatgcgg cggagcagcg 540 gagagtctac ctggagggcc ggtgcgtgga cgggctccgc agatacctgg agaacgggaa 600 ggagacgctg cagcgcacgg acccccccaa gacacatatg acccaccacc ccatctctga 660 ccatgaggcc accctgaggt gctgggccct gggcttctac cctgcggaga tcacactgac 720 ctggcagcgg gatggggagg accagaccca ggacacggag ctcgtggaga ccaggcctgc 780 aggggatgga accttccaga agtgggcggc tgtggtggtg ccttctggag aggagcagag 840 atacacctgc catgtgcagc atgagggtct gcccaagccc ctcaccctga gatgggagct 900 gtcttcccag cccaccatcc ccatcgtggg catcattgct ggcctggttc tccttggagc 960 tgtgatcact ggagctgtgg tcgctgccgt gatgtggagg aggaagagct cagatagaaa 1020 aggagggagt tacactcagg ctgcaagcag tgacagtgcc cagggctctg atgtgtctct 1080 cacagcttgt aaagtgtgag acagctgcct tgtgtgggac tgagaggcaa gagttgttcc 1140 tgcccttccc tttgtgactt gaagaaccct gactttgttt ctgcaaaggc acctgcatgt 1200 gtctgtgttc gtgtaggcat aatgtgagga ggtggggaga gcaccccacc cccatgtcca 1260 ccatgaccct cttcccacgc tgacctgtgc tccctctcca atcatctttc ctgttccaga 1320 gaggtggggc tgaggtgtct ccatctctgt ctcaacttca tggtgcactg agctgtaact 1380 tcttccttcc ctattaaaat tagaacctga gtataaaaaa aaaaaaaaaa aaaa 1434 <210> 6 <211> 4427 <212> DNA <213> Homo sapiens <400> 6 gtcagcgccc cccgcccggc gtctcccggg gccaggtcca ccctctgctg cgccacctgg 60 ggcatcctcc ttccccgttg ccagtctcga tccgccccgt cgttcctggc cctgggcttt 120 gccaccctat gctgacaccc cgtcccagtc ccccttacca ttccccttcg accaccccac 180 ttccgaattg gagccgcttc aactggccct gggcttagcc actctgtgct gaccactctg 240 ccccaggcct ccttaccatt ccccttcgac ctactctctt ccgcattgga gtcgctttaa 300 ctggccctgg ctttggcagc ctgtgctgac ccatgcagtc ctccttacca tccctccctc 360 gacttcccct cttccgatgt tgagcccctc cagccggtcc tggactttgt ctccttccct 420 gccctgccct ctcctgaacc tgagccagct cccatagctc agtctggtct atctgcctgg 480 ccctggccat tgtcactttg cgctgccctc ctctcgcccc cgagtgccct tgctgtgccg 540 ccggaactct gccctctaac gctgccgtct ctctcctgag tccggaccac tttgagctct 600 actggcttct gcgccgcctc tggcccactg tttccccttc ccaggcaggt cctgctttct 660 ctgacctgca ttctctcccc tgggcctgtg ccgctttctg tctgcagctt gtggcctggg 720 tcacctctac ggctggccca gatccttccc tgccgcctcc ttcaggttcc gtcttcctcc 780 actccctctt ccccttgctc tctgctgtgt tgctgcccaa ggatgctctt tccggagcac 840 ttccttctcg gcgctgcacc acgtgatgtc ctctgagcgg atcctccccg tgtctgggtc 900 ctctccgggc atctctcctc cctcacccaa ccccatgccg tcttcactcg ctgggttccc 960 ttttccttct ccttctgggg cctgtgccat ctctcgtttc ttaggatggc cttctccgac 1020 ggatgtctcc cttgcgtccc gcctcccctt cttgtaggcc tgcatcatca ccgtttttct 1080 ggacaacccc aaagtacccc gtctccctgg ctttagccac ctctccatcc tcttgctttc 1140 tttgcctgga caccccgttc tcctgtggat tcgggtcacc tctcactcct ttcatttggg 1200 cagctcccct acccccctta cctctctagt ctgtgctagc tcttccagcc ccctgtcatg 1260 gcatcttcca ggggtccgag agctcagcta gtcttcttcc tccaacccgg gcccctatgt 1320 ccacttcagg acagcatgtt tgctgcctcc agggatcctg tgtccccgag ctgggaccac 1380 cttatattcc cagggccggt taatgtggct ctggttctgg gtacttttat ctgtcccctc 1440 caccccacag tggggccact agggacagga ttggtgacag aaaagcccca tccttaggcc 1500 tcctccttcc tagtctcctg atattgggtc taacccccac ctcctgttag gcagattcct 1560 tatctggtga cacaccccca tttcctggag ccatctctct ccttgccaga acctctaagg 1620 tttgcttacg atggagccag agaggatcct gggagggaga gcttggcagg gggtgggagg 1680 gaaggggggg atgcgtgacc tgcccggttc tcagtggcca ccctgcgcta ccctctccca 1740 gaacctgagc tgctctgacg cggccgtctg gtgcgtttca ctgatcctgg tgctgcagct 1800 tccttacact tcccaagagg agaagcagtt tggaaaaaca aaatcagaat aagttggtcc 1860 tgagttctaa ctttggctct tcacctttct agtccccaat ttatattgtt cctccgtgcg 1920 tcagttttac ctgtgagata aggccagtag ccagccccgt cctggcaggg ctgtggtgag 1980 gaggggggtg tccgtgtgga aaactccctt tgtgagaatg gtgcgtccta ggtgttcacc 2040 aggtcgtggc cgcctctact ccctttctct ttctccatcc ttctttcctt aaagagtccc 2100 cagtgctatc tgggacatat tcctccgccc agagcagggt cccgcttccc taaggccctg 2160 ctctgggctt ctgggtttga gtccttggca agcccaggag aggcgctcag gcttccctgt 2220 cccccttcct cgtccaccat ctcatgcccc tggctctcct gccccttccc tacaggggtt 2280 cctggctctg ctcttcagac tgagccccgt tcccctgcat ccccgttccc ctgcatcccc 2340 cttcccctgc atcccccaga ggccccaggc cacctacttg gcctggaccc cacgagaggc 2400 caccccagcc ctgtctacca ggctgccttt tgggtggatt ctcctccaac tgtggggtga 2460 ctgcttggca aactcactct tcggggtatc ccaggaggcc tggagcattg gggtgggctg 2520 gggttcagag aggagggatt cccttctcag gttacgtggc caagaagcag gggagctggg 2580 tttgggtcag gtctgggtgt ggggtgacca gcttatgctg tttgcccagg acagcctagt 2640 tttagcactg aaaccctcag tcctaggaaa acagggatgg ttggtcactg tctctgggtg 2700 actcttgatt cccggccagt ttctccacct ggggctgtgt ttctcgtcct gcatccttct 2760 ccaggcaggt ccccaagcat cgcccccctg ctgtggctgt tcccaagttc ttagggtacc 2820 ccacgtgggt ttatcaacca cttggtgagg ctggtaccct gcccccattc ctgcacccca 2880 attgccttag tggctagggg gttgggggct agagtaggag gggctggagc caggattctt 2940 agggctgaac agagaagagc tgggggcctg ggctcctggg tttgagagag gaggggctgg 3000 ggcctggact cctgggtccg agggaggagg ggctggggcc tggactcctg ggtctgaggg 3060 tggagggact gggggcctgg actcctgggt ccgagggagg aggggctggg gcctggactc 3120 gtgggtctga gggaggaggg gctgggggcc tggacttctg ggtcttaggg aggcggggct 3180 gggcctggac ccctgggtct gaatggggag aggctggggg cctggactcc ttcatctgag 3240 ggcggaaggg ctggggcctg gcctcctggg ttgaatgggg aggggttggg cctggactct 3300 ggagtccctg gtgcccaggc ctcaggcatc tttcacaggg atgcctgtac tgggcaggtc 3360 cttgaaaggg aaaggcccat tgctctcctt gcccccctcc cctatcgcca tgacaactgg 3420 gtggaaataa acgagccgag ttcatcccgt tcccagggca cgtgcggccc cttcacagcc 3480 cgagtttcca tgacctcatg ctcttggccc tcgtagctcc ctcccgcctc ctccagatgg 3540 gcagctttgg agaggtgagg gacttggggg gtaatttatc ccgtggatct aggagtttag 3600 cttcactcct tcctcagctc cagttcaggt cccggagccc acccagtgtc cacaaggcct 3660 ggggcaagtc cctcctccga ccccctggac ttcggctttt gtccccccaa gttttggacc 3720 cctaagggaa gaatgagaaa cggtggcccg tgtcagcccc tggctgcagg gccccgtgca 3780 gagggggcct cagtgaactg gagtgtgaca gcctggggcc caggcacaca ggtgtgcagc 3840 tgtctcaccc ctctgggagt cccgcccagg cccctgagtc tgtcccagca cagggtggcc 3900 ttcctccacc ctgcatagcc ctgggcccac ggcttcgttc ctgcagagta tctgctgggg 3960 tggtttccga gcttgaccct tggaaggacc tggctgggtt taaggcagga ggggctgggg 4020 gccaggactc ctggctctga aggaggaggg gctggaacct cttccctagt ctgagcactg 4080 gaagcgccac ctgtgggtgg tgacgggggt tttgccgtgt ctaacaggta ccatgtgggg 4140 ttcccgcacc cagatgagaa gccccctccc ttccccgttc acttcctgtt tgcagatagc 4200 caggagtcct ttcgtggttt ccactgagca ctgaaggcct ggccggcctg accactgggc 4260 aaccaggcgt atcttaaaca gccagtggcc agaggctgtt gggtcatttt ccccactgtc 4320 ctagcaccgt gtccctggat ctgttttcgt ggctccctct ggagtcccga cttgctggga 4380 caccgtggct ggggtaggtg cggctgacgg ctgtttccca cccccag 4427 <210> 7 <211> 1707 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60 ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120 gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180 tttttcgcaa cgggtttgcc gccagaacac aggtgtcgtg acgcgggatc cgccaccatg 240 cttctcctgg tgacaagcct tctgctctgt gagttaccac acccagcatt cctcctgatc 300 ccagacatcc agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc 360 accatcagtt gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa 420 ccagatggaa ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca 480 tcaaggttca gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag 540 caagaagata ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga 600 ggggggacta agttggaaat aacaggctcc acctctggat ccggcaagcc cggatctggc 660 gagggatcca ccaagggcga ggtgaaactg caggagtcag gacctggcct ggtggcgccc 720 tcacagagcc tgtccgtcac atgcactgtc tcaggggtct cattacccga ctatggtgta 780 agctggattc gccagcctcc acgaaagggt ctggagtggc tgggagtaat atggggtagt 840 gaaaccacat actataattc agctctcaaa tccagactga ccatcatcaa ggacaactcc 900 aagagccaag ttttcttaaa aatgaacagt ctgcaaactg atgacacagc catttactac 960 tgtgccaaac attattacta cggtggtagc tatgctatgg actactgggg tcaaggaacc 1020 tcagtcaccg tctcctcagc ggccgcaatt gaagttatgt atcctcctcc ttacctagac 1080 aatgagaaga gcaatggaac cattatccat gtgaaaggga aacacctttg tccaagtccc 1140 ctatttcccg gaccttctaa gcccttttgg gtgctggtgg tggttggggg agtcctggct 1200 tgctatagct tgctagtaac agtggccttt attattttct gggtgaggag taagaggagc 1260 aggctcctgc acagtgacta catgaacatg actccccgcc gccccgggcc cacccgcaag 1320 cattaccagc cctatgcccc accacgcgac ttcgcagcct atcgctccag agtgaagttc 1380 agcaggagcg cagacgcccc cgcgtaccag cagggccaga accagctcta taacgagctc 1440 aatctaggac gaagagagga gtacgatgtt ttggacaaga gacgtggccg ggaccctgag 1500 atggggggaa agccgagaag gaagaaccct caggaaggcc tgtacaatga actgcagaaa 1560 gataagatgg cggaggccta cagtgagatt gggatgaaag gcgagcgccg gaggggcaag 1620 gggcacgatg gcctttacca gggtctcagt acagccacca aggacaccta cgacgccctt 1680 cacatgcagg ccctgccccc tcgctaa 1707 <210> 8 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala 85 90 <210> 9 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 9 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser 65 70 75 80 Gly Gly Ser <210> 10 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser 65 70 75 80 Gly Gly Ser <210> 11 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 11 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser 65 70 75 80 Gly Gly Ser <210> 12 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser 65 70 75 80 Gly Gly Thr Gly Gly Ser 85 <210> 13 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 13 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Gly 65 70 75 80 Gly Ser Gly Gly Gly Gly Ser 85 <210> 14 <211> 95 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Lys Glu Ser 65 70 75 80 Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser Leu Asp 85 90 95 <210> 15 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 15 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 16 <211> 1053 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Met Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 17 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 cgcuacucuc ucuuucuggc c 21 <210> 18 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 agcgcgagca cagcuaaggc c 21 <210> 19 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 uuuugucugu gauauacaca u 21 <210> 20 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 cuugacagcg gaagugguug c 21 <210> 21 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 ugggucaggg ccagggcccc c 21 <210> 22 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 cccugcucug ggcuucuggg u 21 <210> 23 <211> 1707 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60 ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120 gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180 tttttcgcaa cgggtttgcc gccagaacac aggtgtcgtg acgcgggatc cgccaccatg 240 cttctcctgg tgacaagcct tctgctctgt gagttaccac acccagcatt cctcctgatc 300 ccagacatcc agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc 360 accatcagtt gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa 420 ccagatggaa ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca 480 tcaaggttca gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag 540 caagaagata ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga 600 ggggggacta agttggaaat aacaggctcc acctctggat ccggcaagcc cggatctggc 660 gagggatcca ccaagggcga ggtgaaactg caggagtcag gacctggcct ggtggcgccc 720 tcacagagcc tgtccgtcac atgcactgtc tcaggggtct cattacccga ctatggtgta 780 agctggattc gccagcctcc acgaaagggt ctggagtggc tgggagtaat atggggtagt 840 gaaaccacat actataattc agctctcaaa tccagactga ccatcatcaa ggacaactcc 900 aagagccaag ttttcttaaa aatgaacagt ctgcaaactg atgacacagc catttactac 960 tgtgccaaac attattacta cggtggtagc tatgctatgg actactgggg tcaaggaacc 1020 tcagtcaccg tctcctcagc ggccgcaatt gaagttatgt atcctcctcc ttacctagac 1080 aatgagaaga gcaatggaac cattatccat gtgaaaggga aacacctttg tccaagtccc 1140 ctatttcccg gaccttctaa gcccttttgg gtgctggtgg tggttggggg agtcctggct 1200 tgctatagct tgctagtaac agtggccttt attattttct gggtgaggag taagaggagc 1260 aggctcctgc acagtgacta catgaacatg actccccgcc gccccgggcc cacccgcaag 1320 cattaccagc cctatgcccc accacgcgac ttcgcagcct atcgctccag agtgaagttc 1380 agcaggagcg cagacgcccc cgcgtaccag cagggccaga accagctcta taacgagctc 1440 aatctaggac gaagagagga gtacgatgtt ttggacaaga gacgtggccg ggaccctgag 1500 atggggggaa agccgagaag gaagaaccct caggaaggcc tgtacaatga actgcagaaa 1560 gataagatgg cggaggccta cagtgagatt gggatgaaag gcgagcgccg gaggggcaag 1620 gggcacgatg gcctttacca gggtctcagt acagccacca aggacaccta cgacgccctt 1680 cacatgcagg ccctgccccc tcgctaa 1707 <210> 24 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 tcttaagatc tttgctttcc cttctctata acttcgtata gcatacatta tacgaagtta 60 tattcgtct 69 <210> 25 <211> 1053 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 26 <211> 1053 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 27 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 27 Met Asp Lys Lys Tyr Ser Ile Gly Leu Glu Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 28 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Asp Lys Lys Tyr Ser Ile Gly Leu Glu Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 29 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 29 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 30 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 31 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 31 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 32 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 33 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 34 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 35 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 36 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 37 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 38 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Glu Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 39 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 39 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 40 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 41 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 42 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 43 <211> 1232 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile 180 185 190 Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile 195 200 205 Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu 210 215 220 Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg 225 230 235 240 His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu 245 250 255 Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val 260 265 270 Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu 275 280 285 Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu 290 295 300 Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn 305 310 315 320 Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg 325 330 335 Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr 340 345 350 Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala 355 360 365 Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu 370 375 380 Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe 385 390 395 400 Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys 405 410 415 Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala 420 425 430 Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg 435 440 445 Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu 450 455 460 Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys 465 470 475 480 Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser 485 490 495 Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys 500 505 510 Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp 515 520 525 Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln 530 535 540 Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu 545 550 555 560 Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu 565 570 575 Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn 580 585 590 Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp 595 600 605 Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile 610 615 620 Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile 625 630 635 640 Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu 645 650 655 Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu 660 665 670 Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile 675 680 685 Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys 690 695 700 Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile 705 710 715 720 Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala 725 730 735 Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val 740 745 750 Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe 755 760 765 Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys 770 775 780 Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr 785 790 795 800 Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val 805 810 815 Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr 820 825 830 Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu 835 840 845 Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg 850 855 860 Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His 865 870 875 880 Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu 885 890 895 Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe 900 905 910 Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu 915 920 925 Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp 930 935 940 Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg 945 950 955 960 Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly 965 970 975 Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn 980 985 990 Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met 995 1000 1005 Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met 1010 1015 1020 Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu 1025 1030 1035 Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly 1040 1045 1050 Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 1055 1060 1065 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val 1070 1075 1080 Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 1085 1090 1095 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile 1100 1105 1110 Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu 1115 1120 1125 Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala 1130 1135 1140 Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 1145 1150 1155 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val 1160 1165 1170 Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 1175 1180 1185 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1190 1195 1200 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1205 1210 1215 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1220 1225 1230 <210> 44 <211> 1486 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val 180 185 190 Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys 195 200 205 His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp 210 215 220 His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr 225 230 235 240 Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser 245 250 255 Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn 260 265 270 Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr 275 280 285 Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His 290 295 300 Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys 305 310 315 320 Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala 325 330 335 Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr 340 345 350 Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile 355 360 365 Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys 370 375 380 His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His 385 390 395 400 Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile 405 410 415 Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr 420 425 430 Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala 435 440 445 Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile 450 455 460 Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg 465 470 475 480 Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser 485 490 495 Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe 500 505 510 Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala 515 520 525 Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe 530 535 540 Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His 545 550 555 560 Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu 565 570 575 Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu 580 585 590 Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys 595 600 605 Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His 610 615 620 Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln 625 630 635 640 Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu 645 650 655 Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp 660 665 670 Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro 675 680 685 Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro 690 695 700 Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala 705 710 715 720 Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe 725 730 735 Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly 740 745 750 Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly 755 760 765 Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile 770 775 780 Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr 785 790 795 800 His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu 805 810 815 Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys 820 825 830 Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr 835 840 845 Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser 850 855 860 Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser 865 870 875 880 Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu 885 890 895 Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp 900 905 910 Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp 915 920 925 Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp 930 935 940 Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu 945 950 955 960 Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg 965 970 975 Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp 980 985 990 Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr 995 1000 1005 Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 1010 1015 1020 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile 1025 1030 1035 Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro 1040 1045 1050 Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn 1055 1060 1065 Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile 1070 1075 1080 Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val 1085 1090 1095 Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 1100 1105 1110 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys 1115 1120 1125 Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile 1130 1135 1140 Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile 1145 1150 1155 Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn 1160 1165 1170 Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 1175 1180 1185 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1190 1195 1200 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1205 1210 1215 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1220 1225 1230 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1235 1240 1245 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1250 1255 1260 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1265 1270 1275 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1280 1285 1290 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1295 1300 1305 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1310 1315 1320 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1325 1330 1335 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1340 1345 1350 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1355 1360 1365 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1370 1375 1380 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1385 1390 1395 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1400 1405 1410 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1415 1420 1425 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1430 1435 1440 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1445 1450 1455 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1460 1465 1470 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1475 1480 1485 <210> 45 <211> 1486 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val 180 185 190 Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys 195 200 205 His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp 210 215 220 His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr 225 230 235 240 Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser 245 250 255 Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn 260 265 270 Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr 275 280 285 Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His 290 295 300 Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys 305 310 315 320 Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala 325 330 335 Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr 340 345 350 Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile 355 360 365 Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys 370 375 380 His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His 385 390 395 400 Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile 405 410 415 Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr 420 425 430 Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala 435 440 445 Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile 450 455 460 Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg 465 470 475 480 Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser 485 490 495 Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe 500 505 510 Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala 515 520 525 Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe 530 535 540 Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His 545 550 555 560 Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu 565 570 575 Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu 580 585 590 Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys 595 600 605 Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His 610 615 620 Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln 625 630 635 640 Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu 645 650 655 Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp 660 665 670 Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro 675 680 685 Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro 690 695 700 Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala 705 710 715 720 Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe 725 730 735 Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly 740 745 750 Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly 755 760 765 Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile 770 775 780 Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr 785 790 795 800 His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu 805 810 815 Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys 820 825 830 Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr 835 840 845 Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser 850 855 860 Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser 865 870 875 880 Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu 885 890 895 Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp 900 905 910 Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp 915 920 925 Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp 930 935 940 Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu 945 950 955 960 Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg 965 970 975 Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp 980 985 990 Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr 995 1000 1005 Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 1010 1015 1020 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile 1025 1030 1035 Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro 1040 1045 1050 Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn 1055 1060 1065 Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile 1070 1075 1080 Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val 1085 1090 1095 Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 1100 1105 1110 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys 1115 1120 1125 Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile 1130 1135 1140 Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile 1145 1150 1155 Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn 1160 1165 1170 Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 1175 1180 1185 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1190 1195 1200 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1205 1210 1215 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1220 1225 1230 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1235 1240 1245 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1250 1255 1260 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1265 1270 1275 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1280 1285 1290 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1295 1300 1305 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1310 1315 1320 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1325 1330 1335 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1340 1345 1350 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1355 1360 1365 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1370 1375 1380 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1385 1390 1395 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1400 1405 1410 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1415 1420 1425 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1430 1435 1440 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1445 1450 1455 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1460 1465 1470 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1475 1480 1485 <210> 46 <211> 1486 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val 180 185 190 Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys 195 200 205 His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp 210 215 220 His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr 225 230 235 240 Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser 245 250 255 Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn 260 265 270 Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr 275 280 285 Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His 290 295 300 Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys 305 310 315 320 Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala 325 330 335 Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr 340 345 350 Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile 355 360 365 Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys 370 375 380 His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His 385 390 395 400 Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile 405 410 415 Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr 420 425 430 Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala 435 440 445 Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile 450 455 460 Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg 465 470 475 480 Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser 485 490 495 Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe 500 505 510 Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala 515 520 525 Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe 530 535 540 Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His 545 550 555 560 Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu 565 570 575 Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu 580 585 590 Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys 595 600 605 Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His 610 615 620 Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln 625 630 635 640 Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu 645 650 655 Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp 660 665 670 Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro 675 680 685 Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro 690 695 700 Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala 705 710 715 720 Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe 725 730 735 Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly 740 745 750 Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly 755 760 765 Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile 770 775 780 Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr 785 790 795 800 His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu 805 810 815 Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys 820 825 830 Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr 835 840 845 Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser 850 855 860 Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser 865 870 875 880 Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu 885 890 895 Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp 900 905 910 Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp 915 920 925 Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp 930 935 940 Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu 945 950 955 960 Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg 965 970 975 Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp 980 985 990 Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr 995 1000 1005 Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 1010 1015 1020 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile 1025 1030 1035 Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro 1040 1045 1050 Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn 1055 1060 1065 Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile 1070 1075 1080 Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val 1085 1090 1095 Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 1100 1105 1110 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys 1115 1120 1125 Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile 1130 1135 1140 Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile 1145 1150 1155 Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn 1160 1165 1170 Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 1175 1180 1185 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1190 1195 1200 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1205 1210 1215 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1220 1225 1230 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1235 1240 1245 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1250 1255 1260 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1265 1270 1275 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1280 1285 1290 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1295 1300 1305 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1310 1315 1320 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1325 1330 1335 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1340 1345 1350 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1355 1360 1365 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1370 1375 1380 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1385 1390 1395 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1400 1405 1410 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1415 1420 1425 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1430 1435 1440 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1445 1450 1455 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1460 1465 1470 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1475 1480 1485 <210> 47 <211> 1486 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Phe Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Arg Pro Gly Ser Lys Ser Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val 180 185 190 Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys 195 200 205 His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp 210 215 220 His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr 225 230 235 240 Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser 245 250 255 Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn 260 265 270 Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr 275 280 285 Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His 290 295 300 Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys 305 310 315 320 Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala 325 330 335 Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr 340 345 350 Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile 355 360 365 Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys 370 375 380 His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His 385 390 395 400 Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile 405 410 415 Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr 420 425 430 Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala 435 440 445 Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile 450 455 460 Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg 465 470 475 480 Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser 485 490 495 Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe 500 505 510 Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala 515 520 525 Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe 530 535 540 Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His 545 550 555 560 Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu 565 570 575 Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu 580 585 590 Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys 595 600 605 Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His 610 615 620 Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln 625 630 635 640 Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu 645 650 655 Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp 660 665 670 Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro 675 680 685 Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro 690 695 700 Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala 705 710 715 720 Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe 725 730 735 Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly 740 745 750 Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly 755 760 765 Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile 770 775 780 Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr 785 790 795 800 His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu 805 810 815 Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys 820 825 830 Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr 835 840 845 Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser 850 855 860 Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser 865 870 875 880 Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu 885 890 895 Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp 900 905 910 Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp 915 920 925 Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp 930 935 940 Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu 945 950 955 960 Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg 965 970 975 Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp 980 985 990 Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr 995 1000 1005 Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 1010 1015 1020 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile 1025 1030 1035 Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro 1040 1045 1050 Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn 1055 1060 1065 Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile 1070 1075 1080 Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val 1085 1090 1095 Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 1100 1105 1110 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys 1115 1120 1125 Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile 1130 1135 1140 Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile 1145 1150 1155 Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn 1160 1165 1170 Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 1175 1180 1185 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1190 1195 1200 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1205 1210 1215 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1220 1225 1230 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1235 1240 1245 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1250 1255 1260 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1265 1270 1275 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1280 1285 1290 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1295 1300 1305 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1310 1315 1320 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1325 1330 1335 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1340 1345 1350 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1355 1360 1365 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1370 1375 1380 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1385 1390 1395 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1400 1405 1410 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1415 1420 1425 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1430 1435 1440 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1445 1450 1455 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1460 1465 1470 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1475 1480 1485 <210> 48 <211> 1486 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Arg Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Ser 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Arg Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gly Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val 180 185 190 Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys 195 200 205 His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp 210 215 220 His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr 225 230 235 240 Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser 245 250 255 Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn 260 265 270 Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr 275 280 285 Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His 290 295 300 Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys 305 310 315 320 Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala 325 330 335 Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr 340 345 350 Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile 355 360 365 Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys 370 375 380 His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His 385 390 395 400 Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile 405 410 415 Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr 420 425 430 Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala 435 440 445 Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile 450 455 460 Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg 465 470 475 480 Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser 485 490 495 Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe 500 505 510 Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala 515 520 525 Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe 530 535 540 Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His 545 550 555 560 Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu 565 570 575 Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu 580 585 590 Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys 595 600 605 Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His 610 615 620 Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln 625 630 635 640 Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu 645 650 655 Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp 660 665 670 Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro 675 680 685 Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro 690 695 700 Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala 705 710 715 720 Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe 725 730 735 Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly 740 745 750 Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly 755 760 765 Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile 770 775 780 Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr 785 790 795 800 His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu 805 810 815 Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys 820 825 830 Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr 835 840 845 Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser 850 855 860 Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser 865 870 875 880 Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu 885 890 895 Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp 900 905 910 Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp 915 920 925 Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp 930 935 940 Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu 945 950 955 960 Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg 965 970 975 Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp 980 985 990 Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr 995 1000 1005 Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 1010 1015 1020 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile 1025 1030 1035 Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro 1040 1045 1050 Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn 1055 1060 1065 Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile 1070 1075 1080 Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val 1085 1090 1095 Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr 1100 1105 1110 Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys 1115 1120 1125 Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile 1130 1135 1140 Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile 1145 1150 1155 Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn 1160 1165 1170 Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 1175 1180 1185 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1190 1195 1200 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1205 1210 1215 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1220 1225 1230 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1235 1240 1245 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1250 1255 1260 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1265 1270 1275 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1280 1285 1290 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1295 1300 1305 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1310 1315 1320 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1325 1330 1335 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1340 1345 1350 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1355 1360 1365 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1370 1375 1380 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1385 1390 1395 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1400 1405 1410 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1415 1420 1425 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1430 1435 1440 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1445 1450 1455 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1460 1465 1470 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1475 1480 1485 <210> 49 <211> 1156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 49 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr 85 90 95 Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys 100 105 110 Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp 115 120 125 Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp 130 135 140 Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr 145 150 155 160 Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser Gly Gly Thr 165 170 175 Gly Gly Ser Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu 180 185 190 Val Lys Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys 195 200 205 Thr Leu Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu 210 215 220 Asn Leu Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr 225 230 235 240 Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys 245 250 255 Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val 260 265 270 Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln 275 280 285 Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser 290 295 300 Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu 305 310 315 320 Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg 325 330 335 Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys 340 345 350 Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly 355 360 365 Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn 370 375 380 His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser 385 390 395 400 Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala 405 410 415 Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val 420 425 430 Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser 435 440 445 Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His 450 455 460 Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val 465 470 475 480 Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp 485 490 495 Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu 500 505 510 Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn 515 520 525 Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp 530 535 540 Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu 545 550 555 560 Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln 565 570 575 Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp 580 585 590 Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu 595 600 605 Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp 610 615 620 Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser 625 630 635 640 Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg 645 650 655 Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro 660 665 670 Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser 675 680 685 Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys 690 695 700 Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg 705 710 715 720 Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr 725 730 735 Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe 740 745 750 Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys 755 760 765 Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr 770 775 780 Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr 785 790 795 800 Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr 805 810 815 Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn 820 825 830 Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu 835 840 845 Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly 850 855 860 Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln 865 870 875 880 Arg Thr Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly 885 890 895 Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met 900 905 910 Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp 915 920 925 Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly 930 935 940 Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp 945 950 955 960 Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu 965 970 975 Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly 980 985 990 Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys 995 1000 1005 Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu 1010 1015 1020 Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln 1025 1030 1035 Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu 1040 1045 1050 Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser 1055 1060 1065 Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro 1070 1075 1080 Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His 1085 1090 1095 Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 1100 1105 1110 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 1115 1120 1125 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe 1130 1135 1140 Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 1145 1150 1155 <210> 50 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 uaauuucuac ucuuguagau 20 <210> 51 <211> 1306 <212> PRT <213> Unknown <220> <223> Description of Unknown: Cas12a sequence <400> 51 Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu 1 5 10 15 Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu 20 25 30 Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu 35 40 45 Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys 50 55 60 Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp 65 70 75 80 Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu 85 90 95 Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg 100 105 110 Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr 115 120 125 Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln 130 135 140 Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser 145 150 155 160 Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys 165 170 175 Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile 180 185 190 Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr 195 200 205 Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val 210 215 220 Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe 225 230 235 240 Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu 245 250 255 Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys 260 265 270 Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp 275 280 285 Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu 290 295 300 Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu 305 310 315 320 Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys 325 330 335 Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe 340 345 350 Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys 355 360 365 Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu 370 375 380 Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile 385 390 395 400 Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp 405 410 415 Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu 420 425 430 Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala 435 440 445 Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu 450 455 460 Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu 465 470 475 480 Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser 485 490 495 Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe 500 505 510 Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu 515 520 525 Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp 530 535 540 Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly 545 550 555 560 Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala 565 570 575 Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met 580 585 590 Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser 595 600 605 Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro 610 615 620 Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu 625 630 635 640 Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr 645 650 655 Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu 660 665 670 Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys 675 680 685 Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys 690 695 700 Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile 705 710 715 720 Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr 725 730 735 Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly 740 745 750 His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe 755 760 765 Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala 770 775 780 Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg 785 790 795 800 Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro 805 810 815 Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg 820 825 830 Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val 835 840 845 Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr 850 855 860 Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala 865 870 875 880 Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys 885 890 895 Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn 900 905 910 Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln 915 920 925 Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp 930 935 940 Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val 945 950 955 960 Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His 965 970 975 Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu 980 985 990 Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys 995 1000 1005 Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val 1025 1030 1035 Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys 1040 1045 1050 Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr 1055 1060 1065 Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val 1070 1075 1080 Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu 1085 1090 1095 Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile 1100 1105 1110 Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu 1115 1120 1125 Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu 1130 1135 1140 Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg 1145 1150 1155 Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg 1160 1165 1170 Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys 1175 1180 1185 Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu 1190 1195 1200 Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile 1205 1210 1215 Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu 1220 1225 1230 Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe 1235 1240 1245 Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn 1265 1270 1275 His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser 1280 1285 1290 Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 52 <211> 977 <212> PRT <213> Unknown <220> <223> Description of Unknown: CasX sequence <400> 52 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val 195 200 205 Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu 225 230 235 240 Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys 245 250 255 Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly 260 265 270 Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys 305 310 315 320 Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 53 <211> 169 <212> PRT <213> Unknown <220> <223> Description of Unknown: I-TevI nuclease domain and linker domain sequence <400> 53 Met Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys Val 1 5 10 15 Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His Phe 20 25 30 Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg Ser 35 40 45 Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu Ile 50 55 60 Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile Lys 65 70 75 80 Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala Asp Ala Thr Phe 85 90 95 Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu Ile Ile Lys Lys 100 105 110 Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu Gly Pro Asp Gly 115 120 125 Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn Gly Arg Trp Asn 130 135 140 Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg Ile Gln Thr Ser 145 150 155 160 Ala Tyr Thr Cys Ser Lys Cys Arg Asn 165 <210> 54 <211> 1052 <212> PRT <213> Unknown <220> <223> Description of Unknown: CAS9 sequence <400> 54 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 55 <211> 7 <212> PRT <213> Simian virus 40 <400> 55 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 56 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: Nucleoplasmin nuclear localization sequence <400> 56 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 57 <211> 77 <212> PRT <213> Unknown <220> <223> Description of Unknown: I-TevI linker fragment sequence <400> 57 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn 65 70 75 <210> 58 <211> 93 <212> PRT <213> Unknown <220> <223> Description of Unknown: ITev-I nuclease domain sequence <400> 58 Met Gly Lys Ser Gly Ile Tyr Gln Ile Lys Asn Thr Leu Asn Asn Lys 1 5 10 15 Val Tyr Val Gly Ser Ala Lys Asp Phe Glu Lys Arg Trp Lys Arg His 20 25 30 Phe Lys Asp Leu Glu Lys Gly Cys His Ser Ser Ile Lys Leu Gln Arg 35 40 45 Ser Phe Asn Lys His Gly Asn Val Phe Glu Cys Ser Ile Leu Glu Glu 50 55 60 Ile Pro Tyr Glu Lys Asp Leu Ile Ile Glu Arg Glu Asn Phe Trp Ile 65 70 75 80 Lys Glu Leu Asn Ser Lys Ile Asn Gly Tyr Asn Ile Ala 85 90 <210> 59 <211> 83 <212> PRT <213> Unknown <220> <223> Description of Unknown: ITev-I linker domain sequence <400> 59 Asp Ala Thr Phe Gly Asp Thr Cys Ser Thr His Pro Leu Lys Glu Glu 1 5 10 15 Ile Ile Lys Lys Arg Ser Glu Thr Val Lys Ala Lys Met Leu Lys Leu 20 25 30 Gly Pro Asp Gly Arg Lys Ala Leu Tyr Ser Lys Pro Gly Ser Lys Asn 35 40 45 Gly Arg Trp Asn Pro Glu Thr His Lys Phe Cys Lys Cys Gly Val Arg 50 55 60 Ile Gln Thr Ser Ala Tyr Thr Cys Ser Lys Cys Arg Asn Gly Gly Ser 65 70 75 80 Gly Gly Ser <210> 60 <211> 1709 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 60 ttagcgaggg ggcagggcct gcatgtgaag ggcgtcgtag gtgtccttgg tggctgtact 60 gagaccctgg taaaggccat cgtgcccctt gcccctccgg cgctcgcctt tcatcccaat 120 ctcactgtag gcctccgcca tcttatcttt ctgcagttca ttgtacaggc cttcctgagg 180 gttcttcctt ctcggctttc cccccatctc agggtcccgg ccacgtctct tgtccaaaac 240 atcgtactcc tctcttcgtc ctagattgag ctcgttatag agctggttct ggccctgctg 300 gtacgcgggg gcgtctgcgc tcctgctgaa cttcactctg gagcgatagg ctgcgaagtc 360 gcgtggtggg gcatagggct ggtaatgctt gcgggtgggc ccggggcggc ggggagtcat 420 gttcatgtag tcactgtgca ggagcctgct cctcttactc ctcacccaga aaataataaa 480 ggccactgtt actagcaagc tatagcaagc caggactccc ccaaccacca ccagcaccca 540 aaagggctta gaaggtccgg gaaatagggg acttggacaa aggtgtttcc ctttcacatg 600 gataatggtt ccattgctct tctcattgtc taggtaagga ggaggataca taacttcaat 660 tgcggccgct gaggagacgg tgactgaggt tccttgaccc cagtagtcca tagcatagct 720 accaccgtag taataatgtt tggcacagta gtaaatggct gtgtcatcag tttgcagact 780 gttcattttt aagaaaactt ggctcttgga gttgtccttg atgatggtca gtctggattt 840 gagagctgaa ttatagtatg tggtttcact accccatatt actcccagcc actccagacc 900 ctttcgtgga ggctggcgaa tccagcttac accatagtcg ggtaatgaga cccctgagac 960 agtgcatgtg acggacaggc tctgtgaggg cgccaccagg ccaggtcctg actcctgcag 1020 tttcacctcg cccttggtgg atccctcgcc agatccgggc ttgccggatc cagaggtgga 1080 gcctgttatt tccaacttag tcccccctcc gaacgtgtac ggaagcgtat taccctgttg 1140 gcaaaagtaa gtggcaatat cttcttgctc caggttgcta atggtgagag aataatctgt 1200 tccagaccca ctgccactga accttgatgg gactcctgag tgtaatcttg atgtatggta 1260 gatcaggagt ttaacagttc catctggttt ctgctgatac caatttaaat atttactaat 1320 gtcctgactt gccctgcaac tgatggtgac tctgtctccc agagaggcag acagggagga 1380 tgtagtctgt gtcatctgga tgtctgggat caggaggaat gctgggtgtg gtaactcaca 1440 gagcagaagg cttgtcacca ggagaagcat ggtggcggat cccgcgtcac gacacctgtg 1500 ttctggcggc aaacccgttg cgaaaaagaa cgttcacggc gactactgca cttatatacg 1560 gttctccccc accctcggga aaaaggcgga gccagtacac gacatcactt tcccagttta 1620 ccccgcgcca ccttctctag gcaccggttc aattgccgac ccctcccccc aacttctcgg 1680 ggactgtggg cgatgtgcgc tctgccccc 1709 <210> 61 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 agacgaatat aacttcgtat aatgtatgct atacgaagtt atagagaagg gaaagcaaag 60 atcttaagac c 71 <210> 62 <211> 46 <212> DNA <213> Homo sapiens <400> 62 agagcagggt cccgcttccc taaggccctg ctctgggctt ctgggt 46 <210> 63 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 accacatcat atcttggttg caagggcctg ggctgggctt ctgggt 46 <210> 64 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 cccaggaacc atgcttccca ggctcccttg cccttggctt ctgggt 46 <210> 65 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 actgggagct ggtgctgtat catgcccctg ctctgagatt ctgggt 46 <210> 66 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 tgattgagct ttgcagcaaa tgttttcctt ctcttgactt ctgggt 46 <210> 67 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 ataacatgta gcaattataa aaattacctt ctctgaactt ctgggt 46

Claims

변형된 I-TevI 뉴클레아제 도메인, 링커, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9 도메인 및 가이드 RNA를 포함하는 키메라 뉴클레아제를 생체외 세포 집단에 투여하는 단계를 포함하는, 유전적으로 조작된 세포 조성물을 제조하는 방법.
제1항에 있어서, 세포 집단이 면역 세포 및 다분화능 세포 중 하나 이상을 포함하는 것인 방법.
제1항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 T11V, V16I, N14G, E25D, K26R, R27A, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 K26R 치환을 포함하는 것인 방법.
제1항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8을 포함하는 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 서열번호 9 내지 14, 또는 59 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 T95S, S101Y, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 또는 S165G로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 T95S, V117F, K135R, N140S 또는 Q158R로 구성된 군으로부터 선택된 적어도 하나의 치환을 포함하는 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 링커가 서열번호 9 내지 14, 또는 59로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함하는 것인 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 D10A, D10E, H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
제12항에 있어서, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 D10E 치환을 포함하는 것인 방법.
제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 D10E, 및 H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 D10A, 및 H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
제11항 또는 제12항에 있어서, 스타필로코커스 아우레우스 Cas9 도메인이 치환 H557A, 및 N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8을 포함하고, 링커가 서열번호 9 내지 14, 또는 59 중 어느 한 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열을 포함하는 것인 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 8과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, 링커 도메인이 서열번호 9 내지 14 중 어느 한 서열과 동일한 또는 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하고, RNA-가이드 뉴클레아제 스타필로코커스 아우레우스 Cas9 도메인이 서열번호 15, 16, 26, 27 또는 28 중 어느 한 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 방법.
제1항 내지 제19항 중 어느 한 항에 있어서, 키메라 뉴클레아제가 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 것인 방법.
제1항 내지 제19항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제가 표적 세포의 게놈 DNA로 전달되는 것인 방법.
제1항 내지 제21항 중 어느 한 항에 있어서, 세포 집단이 면역 세포를 포함하는 것인 방법.
제22항에 있어서, 면역 세포가 T 세포인 방법.
제22항에 있어서, 면역 세포가 천연 킬러(NK) 세포인 방법.
제1항 내지 제24항 중 어느 한 항에 있어서, 세포 집단이 다분화능 세포를 포함하는 것인 방법.
제25항에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.
제25항에 있어서, 다분화능 세포가 조혈 줄기 세포 또는 이의 전구체를 포함하는 것인 방법.
제25항에 있어서, 다분화능 세포가 중간엽 줄기 세포 또는 이의 전구체를 포함하는 것인 방법.
제25항에 있어서, 다분화능 세포가 유도 다분화능 세포인 방법.
제1항 내지 제29항 중 어느 한 항에 있어서, DNA 발현 카세트를 사용하여 상기 키메라 뉴클레아제를 표적 세포의 게놈 DNA로 전달하는 것인 방법.
제1항 내지 제30항 중 어느 한 항에 있어서, 바이러스 벡터를 사용하지 않는 방법.
제1항 내지 제31항 중 어느 한 항에 있어서, 전기천공을 이용하여 상기 키메라 뉴클레아제를 상기 생체외 세포 집단에 투여하는 것인 방법.
제32항에 있어서, 전기천공을 1000 내지 2500 V의 전류에서 인가하는 것인 방법.
제1항 내지 제33항 중 어느 한 항에 있어서, 공여자 DNA를 세포 집단에 투여하는 단계를 추가로 포함하는 방법.
제34항에 있어서, 상기 공여자 DNA가 관심 있는 외생성(exogenous) 유전자를 포함하는 것인 방법.
제34항 또는 제35항에 있어서, 공여자 DNA가 블런트 말단 및 2개의 뉴클레오타이드 3' 오버행 말단을 포함하는 것인 방법.
제34항 또는 제35항에 있어서, 공여자 DNA가 관심 있는 외생성 유전자를 플랭킹하는 5' 및 3' 상동성을 포함하는 것인 방법.
제1항 내지 제33항 중 어느 한 항에 있어서, 키메라 뉴클레아제를 공여자 DNA의 부재 하에 투여하는 것인 방법.
제1항 내지 제38항 중 어느 한 항에 있어서, 키메라 뉴클레아제가 표적 세포의 게놈 DNA를 변형시켜 하나 이상의 규정된 길이의 게놈 DNA를 결실시키는 것인 방법.
제36항 또는 제37항에 있어서, 상기 외생성 유전자가 키메라 항원 수용체를 발현하는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제가 B2M 유전자, TRAC1 유전자, TRCB1 유전자, HLA-A 유전자 또는 HLA-B 유전자를 표적으로 하고 절단하는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 17 또는 서열번호 18, 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 B2M 유전자를 표적으로 하고 절단하는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 20 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 TRCB1 유전자를 표적으로 하는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 21 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 HLA-A 유전자를 표적으로 하고 절단하는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 키메라 뉴클레아제의 가이드 RNA가 서열번호 22 또는 이의 단편을 포함하고; 상기 키메라 뉴클레아제가 AAVS1 유전자를 표적으로 하는 것인 방법.
제45항에 있어서, AAVS1 유전자가 외생성 공여자 DNA의 존재 하에 표적화되는 것인 방법.
제45항 또는 제46항에 있어서, 키메라 뉴클레아제가 AAVS1 유전자의 2개의 부위를 표적으로 하는 것인 방법.
제47항에 있어서, 외생성 공여자 DNA가 AAVS1 유전자의 2개의 표적화 부위 사이에 통합되는 것인 방법.
제1항 내지 제48항 중 어느 한 항에 있어서, 가이드 RNA가 비천연 뉴클레오사이드간 결합, 핵산 모방체(mimetic), 변형된 당 모이어티(moiety) 및 변형된 핵염기 중 하나 이상을 포함하는 것인 방법.
제49항에 있어서, 비천연 뉴클레오사이드간 결합이 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함하는 것인 방법.
제49항에 있어서, 핵산 모방체가 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제49항에 있어서, 변형된 당 모이어티가 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제49항에 있어서, 변형된 핵염기가 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 CasX 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 Cas12 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 및 Cas9 폴리펩티드를 포함하는 키메라 뉴클레아제로서, 임의로 가이드 RNA 및/또는 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
제54항 또는 제55항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 K26, T95, V117, K135, N140 및 Q158에 상응하는 하나 이상의 아미노산 잔기에서 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 V117에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 TevI 서열번호 53의 V117F에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 V117, K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인 링커가 서열번호 53의 V117F, K135R 및 N140S에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커가 서열번호 53의 K135 및 N140에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K135R 및 N140S에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K26, T95 및 Q158에 상응하는 아미노산에서 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제57항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 링커가 서열번호 53의 K26R, T95S 및 Q158R에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제64항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제56항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 53의 잔기 1 내지 92, 및 임의로 T11V, V16I, N14G, E25D, K26R, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I에 상응하는 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제56항 중 어느 한 항에 있어서, I-TevI 링커 도메인이 서열번호 53의 잔기 93 내지 169, 및 임의로 T95S, S101Y, V117F, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 및 S165G로 구성된 군으로부터 선택된 적어도 하나의 변형을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제56항 중 어느 한 항에 있어서, (a) 변형된 I-TevI 뉴클레아제 도메인이 서열번호 53의 잔기 1 내지 92, 및 임의로 T11V, V16I, N14G, E25D, K26R, E36S, K37N, G38N, C39V, S41H, L45F, F49Y, I60V 및 E81I에 상응하는 변형을 포함하고; (b) I-TevI 링커 도메인이 서열번호 53의 잔기 93 내지 169, 및 임의로 T95S, S101Y, V117F, A119D, K120N, K135N, K135R, P126S, D127K, N140S, T147I, Q158R, A161V 및 S165G로 구성된 군으로부터 선택된 적어도 하나의 변형을 포함하는 것인 키메라 뉴클레아제.
제54항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, CasX 폴리펩티드가 서열번호 52와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제54항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, CasX 폴리펩티드가 델타프로테오박테리아(Deltaproteobacteria)로부터 유래한 것인 키메라 뉴클레아제.
제55항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, Cas12 폴리펩티드가 아시다미노코커스(Acidaminococcus) 종 BV3L6으로부터 유래한 것인 키메라 뉴클레아제.
제55항, 및 제57항 내지 제66항 중 어느 한 항에 있어서, Cas12 폴리펩티드가 서열번호 51과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 서열번호 15와 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스타필로코커스 아우레우스로부터 유래한 것인 키메라 뉴클레아제.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 도메인이 D10A, D10E, H557A, N580A, H840A, D1135E, R1335Q 및 T1337R로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 서열번호 15를 포함하는 것인 방법.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 서열번호 27 또는 28과 동일한 또는 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터 유래한 것인 키메라 뉴클레아제.
제56항 내지 제66항 중 어느 한 항에 있어서, Cas9 도메인이 D10A, D10E, D1135E, R1335Q, T1337R 및 H840A로 구성된 군으로부터 선택된 적어도 하나의 치환을 가진 야생형 스트렙토코커스 피오게네스 Cas9 서열을 포함하는 것인 방법.
제55항 내지 제64항 중 어느 한 항에 있어서, 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 키메라 뉴클레아제.
변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인, 변형된 Cas9 폴리펩티드, 및 임의적 가이드 RNA를 포함하는 키메라 뉴클레아제로서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53의 K26R, T95S 및 Q158R에 상응하는 적어도 하나의 아미노산 변형을 포함하고, 변형된 Cas9 폴리펩티드가 서열번호 54로 제시된 비변형 Cas9의 D10E에 상응하는 아미노산 변형을 포함하는 것인 키메라 뉴클레아제.
제81항에 있어서, 변형된 I-TevI 뉴클레아제 도메인 및/또는 I-TevI 링커 도메인이 서열번호 53과 동일한 또는 적어도 약 80%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제81항 또는 제82항에 있어서, 핵 국소화 신호를 포함하는 키메라 뉴클레아제.
제81항 내지 제83항 중 어느 한 항에 있어서, Cas9 폴리펩티드가 스타필로코커스 아우레우스로부터 유래한 것인 키메라 뉴클레아제.
제54항 내지 제84항 중 어느 한 항에 있어서, 핵 국소화 신호가 서열번호 55의 아미노산 서열(PKKKRKV)을 포함하는 SV40 핵 국소화 신호를 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제84항 중 어느 한 항에 있어서, 핵 국소화 신호가 서열번호 56의 아미노산 서열(KRPAATKKAGQAKKKK)을 포함하는 뉴클레오플라스민(Nucleoplasmin) 핵 국소화 신호를 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제86항 중 어느 한 항에 있어서, 변형된 I-TevI 링커 도메인이 서열번호 57과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제54항 내지 제87항 중 어느 한 항에 있어서, 변형된 I-TevI 뉴클레아제 도메인이 서열번호 58과 적어도 약 85%, 90%, 95%, 97%, 98%, 99% 동일한 아미노산 서열을 포함하는 것인 키메라 뉴클레아제.
제49항 내지 제82항 중 어느 한 항에 있어서, 이중 가닥 DNA의 I-TevI 인식 부위에 대한 절단 활성을 가진 키메라 뉴클레아제.
제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 포유동물 세포에서 게놈 표적을 표적으로 하는 것인 키메라 뉴클레아제.
제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 포유동물 세포에서 발암성 돌연변이를 표적으로 하는 것인 키메라 뉴클레아제.
제91항에 있어서, 포유동물 세포가 인간 세포인 키메라 뉴클레아제.
제49항 내지 제88항 중 어느 한 항에 있어서, 가이드 RNA가 박테리아 또는 바이러스 서열을 표적으로 하는 것인 키메라 뉴클레아제.
제49항 내지 제93항 중 어느 한 항에 있어서, 가이드 RNA가 비천연 뉴클레오사이드간 결합, 핵산 모방체, 변형된 당 모이어티 및 변형된 핵염기 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제94항에 있어서, 비천연 뉴클레오사이드간 결합이 포스포로티오에이트, 포스포라미데이트, 비-포스포디에스테르, 헤테로원자, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트, 아미노알킬포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제94항에 있어서, 핵산 모방체가 펩티드 핵산(PNA), 모르폴리노 핵산, 사이클로헥세닐 핵산(CeNAs) 또는 잠긴 핵산(LNA) 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제94항에 있어서, 변형된 당 모이어티가 2'-O-(2-메톡시에틸), 2'-디메틸아미노옥시에톡시, 2'-디메틸아미노에톡시에톡시, 2'-O-메틸 및 2'-플루오로 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제94항에 있어서, 변형된 핵염기가 5-메틸사이토신; 5-하이드록시메틸 사이토신; 크산틴; 하이포크산틴; 2-아미노아데닌; 아데닌의 6-메틸 유도체; 구아닌의 6-메틸 유도체; 아데닌의 2-프로필 유도체; 구아닌의 2-프로필 유도체; 2-티오우라실; 2-티오타이민; 2-티오사이토신; 5-할로우라실; 5-할로사이토신; 5-프로피닐 우라실; 5-프로피닐 사이토신; 6-아조 우라실; 6-아조 사이토신; 6-아조 타이민; 슈도우라실; 4-티오우라실; 8-할로; 8-아미노; 8-티올; 8-티오알킬; 8-하이드록실; 5-할로; 5-브로모; 5-트리플루오로메틸; 5-치환된 우라실; 5-치환된 사이토신; 7-메틸구아닌; 7-메틸아데닌; 2-F-아데닌; 2-아미노-아데닌; 8-아자구아닌; 8-아자아데닌; 7-데아자구아닌; 7-데아자아데닌; 3-데아자구아닌; 3-데아자아데닌; 삼환형 피리미딘; 페녹사진 사이티딘; 페노티아진 사이티딘; 치환된 페녹사진 사이티딘; 카르바졸 사이티딘; 피리도인돌 사이티딘; 7-데아자-아데닌; 7-데아자구아노신; 2-아미노피리딘; 2-피리돈; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6 또는 O-6 치환된 푸린; 2-아미노프로필아데닌; 5-프로피닐우라실; 및 5-프로피닐사이토신 중 하나 이상을 포함하는 것인 키메라 뉴클레아제.
제49항 내지 제93항 중 어느 한 항의 키메라 뉴클레아제 및/또는 가이드 RNA를 코딩하는 핵산 또는 복수의 핵산.
제99항에 있어서, 키메라 뉴클레아제 및/또는 가이드 RNA가 진핵생물 프로모터, 인핸서 또는 폴리아데닐화 부위 중 하나 이상에 작동 가능하게 커플링된 것인 핵산.
제99항 또는 제100항에 있어서, 플라스미드, 렌티바이러스 벡터, 아데노 관련 바이러스 벡터 및 아데노바이러스 벡터로부터 선택된 발현 벡터인 핵산.
제49항 내지 제98항 중 어느 한 항에 있어서, 개체에게 투여되도록 제제화된 키메라 뉴클레아제.
제49항 내지 제98항 중 어느 한 항의 키메라 뉴클레아제 및 약학적으로 허용되는 부형제, 희석제 또는 담체를 포함하는 조성물.
지질 나노입자에 캡슐화된 제49항 내지 제98항 중 어느 한 항의 키메라 뉴클레아제를 포함하는 조성물.
제104항에 있어서, 지질 나노입자가 양이온성 지질 및/또는 중성 지질을 포함하는 것인 조성물.