KR20220112283A

KR20220112283A - Hunter 질환 치료용 아데노-연합된 바이러스 벡터

Info

Publication number: KR20220112283A
Application number: KR1020227022896A
Authority: KR
Inventors: 비비안 초이; 싱 리
Original assignee: 다케다 야쿠힌 고교 가부시키가이샤
Priority date: 2019-12-10
Filing date: 2020-12-09
Publication date: 2022-08-10
Also published as: JP2023505851A; TW202136515A; AU2020401116A1; BR112022011332A2; US11981912B2; MX2022007135A; CO2022009604A2; CA3164189A1; WO2021119053A1; IL293684A; US20210332383A1; EP4072595A1; AR120709A1

Abstract

본 명세서는 그 중에서도, AAV8 또는 AAV9 캡시드 및 코돈-최적화된 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다. 본 명세서는 또한 Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법을 제공하는데, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된다.

Description

HUNTER 질환 치료용 아데노-연합된 바이러스 벡터

관련 출원에 대한 상호-참조

본 출원은 2019년 12월 10일자로 출원된 U.S. 일련 번호 62/945,920의 우선권의 이익을 주장하며, 그 내용은 전문이 본원에 편입된다.

배경

점맥다당증 유형 II (MPS II)라고도 알려진 Hunter 증후군은 이두로네이트-2-설파타제(I2S) 효소의 결핍 또는 부재로 인해 발생하는 리소좀 축적 질환이다. 이두로네이트-2-설파타제는 글리코사미노글리칸 또는 GAG로도 알려진 특이적 점액다당류의 분해 및 재활용에 관여한다. 결과적으로, Hunter 증후군에서 GAG는 전신 세포에 축적되어, 이는 다시 신체의 다양한 세포와 기관의 정상적인 기능을 방해함으로써, 여러 심각한 증상을 유발한다. Hunter 증후군의 많은 경우에 있어서, 이 병에 걸린 개체의 신경 세포 및 뇌막에 다량의 GAGs의 축적이 있고, 이는 다양한 형태의 중추 신경계(CNS) 증상, 인지 능력 손상 및 발달 지체로 이어진다.

효소 대체 요법(ERT)을 비롯한, 다양한 치료 옵션이 헌터 증후군 관리에 사용되어 왔었다. 승인된 치료적 ERT 치료에는 재조합 I2S 효소의 정맥내 투여가 내포된다. 그러나, 정맥으로 투여된 I2S 효소는 CNS의 세포 및 조직으로의 분포가 잘 되지 않고, 심장, 폐, 뼈와 같은 심부 체세포의 세포로의 분포가 잘 되지 않는 것을 비롯하여, 다양한 제약을 갖는다. Hunter 증후군의 치료는 여전히 과제로 남아 있다.

질환의 치료에 있어서 생체 내에서 치료요법적 단백질을 생산하는 벡터의 사용이 바람직하지만, 그러나 생체 내에서 원하는 치료요법적 단백질이 잘 만들어지지 않는 것을 비롯하여 다양한 요인들에 의해 제한적이다.

요약

본 발명은 I2S (본 명세서를 통하여 I2S 또는 IDS로 지칭됨)를 인코드하는 효과적이고, 강력한 재조합 아데노-연합된 바이러스 (rAAV) 벡터들을 제공한다. 본 발명은 I2S 서열을 포함하는 최적화된 rAAV 벡터가 생체내에서 강력한 I2S 발현을 초래한다는 놀라운 발견에 부분적으로 기초한다.

일부 측면들에 있어서, 본 발명은 AAV8 캡시드 및 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다.

일부 측면들에 있어서, 본 발명은 AAV9 캡시드 및 인간 이두로네이트-2 설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다.

일부 구체예들에서, 상기 rAAV는 코돈-최적화된 인간 I2S 효소를 인코드한다. 일부 구체예들에서, 상기 코돈-최적화된 인간 I2S는 서열 식별 번호: 11 또는 12로부터 선택된 뉴클레오티드 서열을 갖는다.

일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호:6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 인간 I2S 효소는 서열 식별 번호:6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성의 뉴클레오티드 서열에 의해 인코드된다. 일부 구체예들에서, 상기 인간 I2S 효소는 서열 식별 번호: 6의 뉴클레오티드 서열에 의해 인코드된다.

일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 1에 대해 동일한 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 1에 대해 동일한 서열이다.

일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호:2에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.

일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 2에 대해 동일한 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 2에 대해 동일한 서열이다.

일부 구체예들에서, 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열을 포함한다.

일부 구체예들에서, 상기 벡터는 간-특이적 프로모터를 더 포함한다.

일부 구체예들에서, 상기 간-특이적 프로모터는 트랜스레틴(transthyretin) 프로모터 (TTR)이다.

일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR), I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함한다.

일부 구체예들에서, 상기 벡터는 산재된(ubiquitous) 프로모터를 더 포함한다.

일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부, I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함한다.

일부 구체예들에서, 상기 rAAV 벡터는 설파타제 변형 인자 1 (SUMF1)을 포함한다.

일부 구체예들에서, SUMF1 앞에는 내부 리보솜 진입 부위 (IRES)가 있다.

일부 구체예들에서, 상기 벡터는 WPRE 서열을 더 포함한다. 일부 구체예들에서, 상기 WPRE 서열은 변이체 WPRE 서열 또는 최적화된 WPRE 서열이다. 일부 구체예들에서, 상기 WPRE 서열은 서열 식별 번호:7에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성의 뉴클레오티드 서열에 의해 인코드된다. 일부 구체예들에서, 상기 WPRE 서열은 서열 식별 번호: 7을 갖는 뉴클레오티드 서열에 의해 인코드된다.

일부 구체예들에서, 상기 인트론은 마우스의 극미한(minute) 바이러스 (MVM) 또는 SV40 인트론이다. 일부 구체예들에서, 상기 인트론은 β-글로빈/IgG 키메라 인트론이다.

일부 구체예들에서, 상기 CRM은 간-특이적 CRM이다.

일부 구체예들에서, 상기 CRM은 신경-특이적 CRM이다. 일부 구체예들에서, 상기 CRM은 근육-특이적 CRM이다.

일부 구체예들에서, 상기 CRM은 CRM8이다.

일부 구체예들에서, 상기 벡터는 적어도 세 개의 CRMs을 포함한다.

일부 측면들에 있어서, 본 발명은 AAV8 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 rAAV 벡터를 제공하며, 전술한 벡터는 다음을 포함한다: a) 5' 역전된 말단 반복부 (ITR); b.) 시스-작용 조절 모듈 (CRM); c.) 간 특이적 프로모터; d) 마우스의 극미한 바이러스 (MVM); e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열; f.) woodchuck 간염 바이러스 전사-후 조절 요소 (WPRE); 그리고 g.) 3' ITR.

일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열이다.

일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 6에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 서열이다. 일부 구체예들에서, 인간 I2S를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 6과 동일하다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 11 또는 12에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 서열이다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열이다.

일부 구체예들에서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 포함하는 서열을 포함한다.

일부 측면들에 있어서, 본 발명은 AAV9 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 rAAV 벡터를 제공하며, 전술한 벡터는 다음을 포함한다: a.) 5' 역전된 말단 반복부 (ITR); b.) 시스-작용 조절 모듈 (CRM); c) 산재된 프로모터; d.) 마우스의 극미한 바이러스 (MVM); e.) 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열; f.) woodchuck 간염 바이러스 전사-후 조절 요소(WPRE); 그리고 g.) 3' ITR.

일부 구체예들에서, 상기 rAAV 벡터는 ApoB를 포함하지 않는다.

Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법, 이 방법은 전술한 청구항들중 임의의 한 항에 따른 rAAV를 이를 필요로 하는 대상체에게 투여하는 것을 포함한다.

Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된다.

일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 혈청에서 검출된다.

일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 간에서 검출된다.

일부 구체예들에서, I2S 활성은 중추 신경계 (CNS)에서 증가된다.

일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 뇌에서 검출된다.

일부 구체예들에서, I2S 활성의 증가는 해마, 시상, 뇌량, 피질, 소뇌 또는 뇌의 선조체(stratum)에서 검출된다.

일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 신장 등에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 심장에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 폐에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 골수에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 신장에서 검출된다.

일부 구체예들에서, I2S 활성의 증가는 단일 투여 후, 적어도 30일, 60일, 90일, 120일, 150일, 180일 또는 그 이상 동안 유지된다.

일부 구체예들에서, I2S 활성 수준은 헤파린 설페이트 분석으로 측정된다.

일부 구체예들에서, I2S 활성 수준은 데르마탄 설페이트 분석으로 측정된다.

일부 구체예들에서, 상기 AAV의 투여로 글리코사미노글리칸 (GAG)의 수준이 해당 대상체에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 혈청에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 상기 해당 대상체의 간에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 신장 등에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 심장에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 폐에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 골수에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 신장에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 CNS에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 뇌에서 감소된다.

일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 감소된다.

일부 구체예들에서, 상기 AAV는 정맥내로 투여된다.

일부 구체예들에서, 상기 AAV는 경막 내로 투여된다.

일부 구체예들에서, 상기 AAV는 약 5 x 10⁹ vg의 투여분량으로 투여된다.

일부 구체예들에서, 상기 rAAV 투여로 면역 반응이 야기되지 않는다.

본 발명의 각종 측면들을 다음의 단락들에서 상세하게 설명한다. 섹션의 사용으로 본 발명을 제한하려는 것이 아니다. 각 섹션은 본 발명의 모든 측면에 적용될 수 있다. 본 출원에서, "또는"이란 명시적으로 다른 언급이 없는 한, "및/또는"을 말한다. 본원에서 사용된 바와 같이, 단수("a", "an" 및 "the")형은 다른 명시적인 언급이 없는 한, 단수 개념 및 복수 개념 모두가 내포된다.

도면의 간단한 설명
도 1A는 hIDS 발현시키는 벡터를 위한 발현 구조체를 나타내는 도식이다. 도 1B는 hIDS-WPRE의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (WHV) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 2는 hIDS-IRES-SUMF1의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (HWP) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 3은 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 총 I2S 농도를 보여주는 그래프다. 상기 hI2S 농도는 ELISA에 의해 측정되었다.
도 4A는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 I2S 활성을 보여주는 그래프다. 도 4B는 마우스 조직에서 I2S 농도를 보여주는 그래프다. 도 4C는 마우스 조직에서 I2S 활성을 보여주는 그래프다. 도 4D는 야생형과 비교하여, hIDS 발현시키는 벡터가 투여된 동물에서 상대적인 I2S 활성을 보여주는 그래프다.
도 5A는 마우스 뇌에서 GAG 수준을 보여주는 그래프다. 도 5B는 마우스 간에서 GAG 수준을 보여주는 그래프다. 도 5C는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스 신장에서 GAG 수준을 보여주는 그래프다.
도 6A는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스의 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) GAG 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. **P<0.01, ***P<0.001.
도 6B는 확인된 rAAV 벡터들을 주사한 후 12주차에서 대조군 동물과 비교하여, 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) 수준의 감소 퍼센트를 보여주는 그래프다.
도 7A는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 간에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃 동물에 대해 수행되었다. ***는 P<0.001을 나타낸다. 도 7B는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 뇌에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. *P<0.05, **P<0.01, ***P<0.001.
도 8은 hI2S 및 SUMF1을 발현시키는 벡터들을 주사한-후, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 총 hI2S 농도를 보여주는 그래프다
도 9는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 hI2S 활성을 보여주는 그래프다.
도 10은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다. 도 11은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다.
도 12A는 hI2S를 투여한 마우스에서 혈청 및 조직에서 12 개월에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 12B는 마우스 혈청 및 조직에서 I2S 활성을 보여주는 그래프다. 도 12C는 마우스 조직에서 GAG 수준을 보여주는 그래프다. 도 12D는 마우스 조직에서 GAG 수준의 감소 퍼센트를 보여주는 그래프다. 도 12E은 리소좀 저장 구획의 바이오마커인, LAMP1 착색 그래프다. 통계는 Dunnett 방법을 사용하여 다중 비교를 통해, 처리되지 않은 녹-아웃(knockout) 동물에 대해 일-원 ANOVA을 이용하여 수행되었다. *P<0.05, **P<0.01, ***P<0.001, ns=유의미적이지 않음.
도 13A는 대조군 동물에 비해 I2S가 투여된 마우스에서 마이크로CT에 의해 측정된 바와 같이, 완골의 골 부피 그래프를 나타내고, 도 13B는 관골궁(zygomatic arch)의 골 부피 그래프를 나타낸다.
도 14A는 낮은 투여분량의 hI2S를 투여한 마우스에서 혈청에서 90일에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 14B는 혈청에서 I2S 활성 그래프다. 도 14C는 마우스 조직에서 I2S 농도 그래프다. 도 14D는 마우스 조직에서 I2S 활성 그래프다. 도 14E는 야생형 동물과 비교하여, 낮은 투여분량의 hI2S가 투여된 동물에서 상대적 I2S 활성 그래프다.
도 14F는 hI2S를 투여한 마우스의 간, 비장, 심장 및 신장을 비롯한, 체세포 조직에서 LAMP1 착색 수준을 보여주는 그래프다. 도 14G는 뇌에서 LAMP1 착색 수준을 보여주는 그래프다.
도 15A는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15B는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 15C는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15D는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 16은 인간이 아닌 영장류 개체에서 I2S 농도 및 효소 활성 프로파일, 그리고 동일한 동물에서및 항-I2S ADA 활성 프로파일을 나타낸다.
도 17A는 낮은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다. 도 17B는 높은은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다.
도 18A는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 신장에서 hI2S 농도를 나타낸다. 도 18B는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 비장에서 hI2S 농도를 나타낸다. 도 18C는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 폐에서 hI2S 농도를 나타낸다. 도 18D는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 심장에서 hI2S 농도를 나타낸다. 도 18E는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 골수에서 hI2S 농도를 나타낸다.

정의

아데노-연합된 바이러스 (AAV): 본원에서 사용된 바와 같이, 용어 "아데노-연합된 바이러스" 또는 "AAV" 또는 재조합 AAV ("rAAV")에는 AAV 유형 1, AAV 유형 2, AAV 유형 3 (유형 3A 및 3B을 비롯한), AAV 유형 4, AAV 유형 5, AAV 유형 6, AAV 유형 7, AAV 유형 8, AAV 유형 9, AAV 유형 10, AAV 유형 11, 조류 AAV, 소 AAV, 갯과 AAV, 말의 AAV, 및 양의 AAV (예를 들자면, Fields et al., Virology, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers); Gao et al., J. Virology 78:6381-6388 (2004); Mori et al., Virology 330:375-383 (2004) 참고)이 내포되나, 그러나 이에 국한되지 않는다. 일반적으로, AAV는 분열 세포와 비-분열 세포를 모두 감염시킬 수 있으며, 숙주 세포의 게놈에 통합되지 않고 염색체외 상태로 존재할 수 있다. AAV 벡터들이 흔히 유전자 요법에 이용된다.

투여: 본원에서 사용된 바와 같이, 용어 "투여하는", 또는 "도입하는"이란 rAAV 벡터의 효과적으로 전달하게 되는 방법 또는 경로를 통하여, I2S를 인코딩하는 rAAV 벡터들을 대상체로 전달하는 내용에서 호환사용된다. 예를 들면, 정맥내, 피하로 또는 경피를 비롯한, rAAV 벡터를 투여하기 위한 다양한 방법이 당업계에 공지되어 있다. rAAV 벡터의 경피 투여는 "유전자 총" 또는 생물학적 입자 전달 시스템을 사용하여 수행될 수 있다. 일부 구체예들에서, 상기 rAAV 벡터들 및/또는 이식유전자 발현 카세트 및/또는 최적화된 IDS 이식유전자 서열들 및/또는 상기 유전자 발현 카세트의 임의의 조성물은 비-바이러스성 화학 입자들, 이를 테면, 지질 나노입자, 비-바이러스성 생물학적 분자들, 이를 테면, 엑소좀 및/또는 세포외 소포체를 통하여 투여된다.

동물: 본원에서 사용된 바와 같이, "동물"이라는 용어는 동물 왕국의 모든 구성원을 지칭한다. 일부 구체예들에서, "동물"은 임의의 발생 단계에 있는 인간을 지칭한다. 일부 구체예들에서, "동물"은 임의의 발생 단계에 있는 인간이 아닌 동물을 지칭한다. 특정 구체예들에서, 상기 인간이 아닌 동물은 포유류 (예를 들자면, 설치류, 마우스, 렛(rat), 토끼, 원숭이, 개, 고양이, 양, 소, 영장류 및/또는 돼지)다. 일부 구체예들에서, 동물에는 포유동물, 새, 파충류, 양서류, 어류, 곤충 및/또는 벌레가 내포되지만, 이에 국한되지는 않는다. 일부 구체예들에서, 동물은 유전자삽입된(transgenic) 동물, 유전적으로-조작된 동물 및/또는 클론일 수 있다.

인지된 면역글로불린 폴리펩티드에는 카파 및 람다 경쇄, 그리고 알파, 감마 (IgG1, IgG2, IgG3, IgG4), 델타, 입실론 및 뮤 중쇄 또는 다른 종에서의 등가물이 내포된다. 전장의 면역글로불린 "경쇄" (약 25 kDa 또는 약 214 아미노산)는 NH2-말단의 약 110개 아미노산의 가변 영역과 COOH-말단에 있는 카파 또는 람다 불변 영역을 포함한다. 전장의 면역글로불린 "중쇄" (약 50 kDa 또는 약 446개 아미노산)는 유사하게, 가변 영역 (약 116개 아미노산) 및 전술한 중쇄 불변 영역중 하나, 예를 들자면, 감마 (약 330개 아미노산)를 포함한다.

대략적으로 또는 약(about): 본원에서 사용된 바와 같이, 하나 이상의 관심 값에 적용되는 용어 "대략적으로" 또는 "약(about)"이란 명시된 기준 값과 유사한 값을 나타낸다. 특정 구체예에서, 특정 구체예들에서, 용어 "대략적으로" 또는 "약"이란 달리 언급되지 않거나 또는 문맥상 명백하지 않은 한, 언급된 기준 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 미만의 상위 또는 하위 값 (더 크거나 또는 더 작은) (그러한 숫자가 가능한 값의 100%를 초과하는 경우를 제외하고) 범위 안에 속하는 값의 범위를 지칭한다.

생물학적 활성: 본원에서 사용된 바와 같이, "생물학적 활성"이라는 구절은 생물학적 시스템, 특히 유기체에서 활성을 갖는 임의의 제제의 특성을 지칭한다. 예를 들어, 유기체에 투여될 때, 그 유기체에 생물학적 영향을 미치는 제제는 생물학적 활성으로 간주된다. 특정 구체예들에서, 펩티드가 생물학적으로 활성인 경우, 펩티드의 적어도 하나의 생물학적 활성을 공유하는 해당 펩티드의 부분은 일반적으로 "생물학적 활성" 부분으로 지칭된다.

기능적 등가물 또는 유도체: 본원에서 사용된 바와 같이, "기능적 등가물" 또는 "기능적 유도체"라는 용어는 아미노산 서열의 기능적 유도체와 관련하여, 원래 서열의 활성과 실질적으로 유사한 생물학적 활성(기능 또는 구조적)을 유지하는 분자를 의미한다. 기능적 유도체 또는 등가물은 천연 유도체일 수 있거나, 또는 합성으로 만들어질 수 있다. 예시적인 기능적 유도체에는 단서조건으로 단백질의 생물학적 활성이 보존된다면, 하나 또는 그 이상의 아미노산의 치환, 결실 또는 부가를 갖는 아미노산 서열이 내포된다. 치환 아미노산은 바람직하게는 치환 아미노산과 유사한 화학적-물리적 속성을 갖는다. 바람직한 유사한 화학적-물리적 속성에는 전하의 유사성, 부피, 소수성, 친수성 및 이와 유사한 것들이 내포된다.

시험관내: 본원에 사용된 바와 같이, 용어 "시험관내"란 다-세포 유기체 안이 아닌 인위적 환경, 예를 들어, 테스트 튜브 또는 반응 용기, 세포 배양 등에서 일어나는 사건을 지칭한다.

생체내: 본원에 사용된 바와 같이, 용어 "생체내"란 다중-세포 유기체, 이를 테면, 인간과 비-인간 동물 안에서 일어나는 사건을 지칭한다. 세포-기반 시스템의 맥락에서, 상기 용어는 살아있는 세포 내(예를 들어, 시험관내 시스템과 반대되는) 에서 발생하는 사건을 지칭하는 데 사용될 수 있다.

IRES: 본원에서 사용된 바와 같이, 용어 "IRES"는 임의의 적합한 내부 리보솜 진입 부위 서열을 지칭한다.

단리된: 본원에 사용된 바와 같이, 용어 "단리된"이란 (1) 최초로 만들어질 때(자연적이건 및/또는 실험 설정에서이건), 이것과 연합된 성분들중 적어도 일부와 분리된, 및/또는 (2) 사람의 손으로 생산, 준비 및/또는 제작된 물질 및/또는 엔터티를 지칭한다. 단리된 물질 및/또는 엔터티는 이것이 최초로 연합된 다른 성분들로부터 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%, 약 98%, 약 99%, 실질적으로 100%, 또는 100% 분리될 수 있다. 일부 구체예들에서, 단리된 제제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 이상으로 순수하거나, 또는 실질적으로 100%, 또는 100% 순수하다. 본원에 사용된 바와 같이, 물질에서 다른 성분이 실질적으로 없는 경우, 해당 물질은 "순수"하다. 본원에서 사용된 바와 같이, 용어 "단리된 세포"는 다중-중심 유기체에 함유안된 세포를 지칭한다.

폴리펩티드: 본원에서 사용된 바와 같이, 용어 "폴리펩티드"란 펩티드 결합에 의해 서로 연계된 아미노산의 순차적인 쇄를 지칭한다. 이 용어는 임의의 길이의 아미노산 쇄를 나타내기 위해 사용되지만, 당업자는 이 용어가 긴 쇄에 국한되지 않고, 펩티드를 통해 함께 연계된 2개의 아미노산을 포함하는 최소 쇄를 나타낼 수 있음을 이해할 것이다. 당업자에게 공지된 바와 같이, 폴리펩티드는 가공 및/또는 변형될 수 있다.

단백질: 본원에서 사용된 바와 같이, 용어 "단백질"은 별개의 단위로 기능하는 하나 또는 그 이상 폴리펩티드를 지칭한다. 단일 폴리펩티드가 별개의 기능 단위이고, 별개의 기능 단위를 형성하기 위해 다른 폴리펩티드와 영구적 또는 일시적인 물리적 결합을 필요로 하지 않는 경우, 용어 "폴리펩티드" 및 "단백질"은 호환적으로 사용될 수 있다. 별개 기능 단위가 서로 물리적으로 연합하는 하나 이상의 폴리펩티드로 구성된 경우, 용어 "단백질"은 물리적으로 커플링되고, 별개의 단위로서 함께 기능하는 다중 폴리펩티드를 지칭한다.

조절 요소: 본원에서 사용된 바와 같이, 용어 "조절 요소"란 유전자의 전사를 조절 및/또는 제어할 수 있는 전사 조절 요소, 특히 넌-코딩 시스-작용 전사 조절 요소를 지칭한다. 조절 요소들은 적어도 하나의 전사 인자 결합 부위, 예를 들면, 조직 특이적 전사 인자를 위한 적어도 한 개의 결합 부위를 포함한다. 본원에 기술된 구체예들에서, 조절 요소들은 간-특이적 전사 인자를 위한 적어도 한 개의 결합 부위를 갖는다. 전형적으로, 조절 요소들은 조절 요소들 없이, 프로모터 단독으로부터 유전자의 전사와 비교하였을 때, 프로모터-구동된 유전자 발현을 증가 또는 강화시킨다. 따라서, 조절 요소들은 특히 인핸서 서열들을 포함하는데, 전사를 향상시키는 조절 요소들은 전형적으로 멀리 있는 상류 인핸서 서열에 국한되지 않고, 이들이 조절하는 유전자로부터 임의의 거리에 발생할 수 있음을 이해해야 한다. 당업계에서 이해되는 바와 같이, 전사 조절 서열들은 생체내에서 조절되는 유전자의 상류 (예를 들자면, 프로모터 영역에) 또는 하류 (예를 들자면, 3'UTR에)에 위치할 수 있고, 해당 유전자의 바로 근처에 위치하거나 또는 훨씬 더 멀리 위치할 수 있다. 조절 요소들은 자연 발생적 서열, 이러한 조절 요소들(이의 일부분)의 조합, 또는 조절 요소의 몇 개 복사본, 예를 들자면, 비-자연 발생적 서열들을 포함할 수 있다. 따라서, 조절 요소들에는 원하는 발현 수준을 얻기 위해 자연발생적이고, 최적화된 조절 요소, 또는 공작된 조절 요소들이 내포된다.

대상체: 본원에서 사용된 바와 같이, 용어 "대상체"는 인간 또는 임의의 인간이 아닌 동물 (예를 들자면, 마우스, 렛(rat), 토끼, 개, 고양이, 소, 돼지, 양, 말 또는 영장류)을 지칭한다. 인간은 출생-전 형태와 출생-후 형태가 내포된다. 많은 구체예들에서, 대상체는 인간이다. 대상체는 환자일 수 있고, 이때 환자란 질환의 진단 또는 치료를 위해 의료 제공자에게 보여주는 인간을 말한다. 용어 "대상체"는 "개체" 또는 "환자"와 본원에서 호환사용된다. 대상체는 질환 또는 장애에 걸리거나, 또는 이에 취약할 수 있지만, 그러나 해당 질환 또는 장애의 증상을 나타내거나 또는 나타내지 않을 수 있다.

실질적으로: 본원에서 사용된 바와 같이, "실질적으로(substantially)"라는 용어는 관심대상의 특성 또는 속성의 전체 또는 거의-전체 범위 또는 정도를 나타내는 질적 조건을 나타낸다. 생물학 분야의 통상의 기술자는 생물학적 및 화학적 현상이 거의 완료되지 않거나 또는 완전하게 진행되거나 완전한 결과를 달성하거나 회피하는 경우가 거의 없다는 것을 이해할 것이다. 따라서, 용어 "실질적으로"는 많은 생물학적 및 화학적 현상에 고유한 완전성의 잠재적인 결여를 포착하기 위해 본원에서 사용된다.

실질적 상동성: 구절 "실질적 상동성"은 본원에서 아미노산 또는 핵산 서열들 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 두 개의 서열에서 상응하는 위치에 상동성 잔기를 함유하는 경우, 이들은 일반적으로 "실질적으로 상동"인 것으로 간주된다. 상동 잔기는 동일한 잔기일 수 있다. 대안적으로, 상동 잔기는 동일하지 않은 잔기일 수 있으며, 적절하게 유사한 구조 및/또는 기능적 특성을 가질 것이다. 예를 들어, 당업자에게 잘 알려진 바와 같이, 특정 아미노산은 전형적으로 "소수성" 또는 "친수성" 아미노산으로 분류되고, 및/또는 "극성" 또는 "비-극성" 측쇄를 갖는 것으로 분류된다. 동일한 유형의 또다른 아미노산을 하나의 아미노산으로의 치환은 종종 "상동성" 치환으로 간주될 수 있다.

당분야에서 잘 알려진 바와 같이, 아미노산 또는 핵산 서열들은 다양한 알고리즘 중 임의의 것, 예를 들면, 뉴클레오티드 서열의 경우 BLASTN, 아미노산 서열의 경우 BLASTP, gapped BLAST 및 PSI-BLAST을 비롯한 이용가능한 상용 컴퓨터 프로그램을 사용하여 비교할 수 있다. 이러한 프로그램의 예시들이 다음에 설명되어 있다: Altschul, et al., basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, et al., Methods in Enzymology; Altschul, et al., "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis, et al., Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 그리고 Misener, et al., (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999. 상동 서열을 확인하는 것 외에도, 위에서 언급한 프로그램은 일반적으로 상동성 정도의 표시를 제공한다. 일부 구체예들에서, 두 서열이 만약 상응하는 잔기들의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이 잔기의 관련 구간(stretch)에 걸쳐 상동성이라면, 이들 두 서열은 실질적으로 상동성인 것으로 간주된다. 일부 구체예들에서, 상기 관련 구간은 온전한 서열이다. 일부 구체예들에서, 상기 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 이상 잔기들이다.

실질적 동일성: 구절 "실질적 동일성"은 본원에서 아미노산 또는 핵산 서열들 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 두 개의 서열에서 상응하는 위치에 동일 잔기를 함유하는 경우, 이들은 일반적으로 "실질적으로 동일"인 것으로 간주된다. 당분야에서 잘 알려진 바와 같이, 아미노산 또는 핵산 서열들은 다양한 알고리즘 중 임의의 것, 예를 들면, 뉴클레오티드 서열의 경우 BLASTN, 아미노산 서열의 경우 BLASTP, gapped BLAST 및 PSI-BLAST을 비롯한 이용가능한 상용 컴퓨터 프로그램을 사용하여 비교할 수 있다. 이러한 프로그램의 예시들이 다음에 설명되어 있다: Altschul, et al., Basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, et al., Methods in Enzymology; Altschul et al., Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis et al., Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 그리고 Misener, et al., (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999. 동일 서열을 확인하는 것 외에도, 위에서 언급한 프로그램은 일반적으로 동일성 정도의 표시를 제공한다. 일부 구체예들에서, 두 서열이 만약 상응하는 잔기들의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이 잔기의 관련 구간(stretch)에 걸쳐 동일하다면, 이들 두 서열은 실질적으로 동일성인 것으로 간주된다. 일부 구체예들에서, 상기 관련 구간은 온전한 서열이다. 일부 구체예들에서, 상기 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 이상 잔기들이다.

~를 앓고 있는: 질환, 장애 및/또는 병태를 "앓고"있는 개체는 해당 질환, 장애 및/또는 병태의 하나 또는 그 이상의 증상으로 진단받았거나 또는 이를 나타낸다.

치료요법적으로 효과량: 본원에서 사용된 바와 같이, 치료요법제의 "치료요법적으로 효과량"이라는 용어는 질환, 장애 및/또는 병태를 앓고 있거나, 이에 민감한 대상체에게 투여될 때, 해당 질환, 장애 및/또는 병태의 증상(들)의 치료하고, 진단하고, 예방하고 및/또는 발병을 지연시키기에 충분한 양을 의미한다. 치료요법적으로 효과량은 적어도 하나의 단위 투여분량을 포함하는 투여 요법을 통해 전형적으로 투여된다는 것이 당업자에 의해 이해될 것이다.

치료하는: 본원에서 사용된 바와 같이, 용어 "치료하다", "치료", 또는 "치료하는"이란 특정 질환, 장애, 및/또는 병태의 하나 또는 그 이상의 증상 또는 특징을 부분적으로 또는 완전하게 완화시키고, 개선시키고, 경감시키고, 억제시키고, 예방하고, 발병을 지연시키고, 중증도 감소시키고 및/또는 발병률을 감소시키는데 사용되는 임의의 방법을 지칭한다. 해당 질환과 연합된 병리 발생 위험을 감소시킬 목적으로, 해당 질환의 징후를 나타내지 않는 대상체 및/또는 해당 질환의 초기 징후만을 나타내는 대상체에게 치료제가 투여될 수 있다.

본 명세서에서 종점에 의한 수치 범위의 언급은 그 범위 내에 포함된 모든 숫자 및 분수가 내포된다 (예를 들어, 1 ~ 5에는 1, 1.5, 2, 2.75, 3, 3.9, 4 및 5가 내포된다). 모든 숫자 및 이의 분획은 "약(about)"이라는 용어에 의해 수정된 것으로 추정된다는 것이 또한 이해되어야 한다.

본 발명의 각종 측면들을 다음의 단락들에서 상세하게 설명한다. 섹션의 사용으로 본 발명을 제한하려는 것이 아니다. 각 섹션은 본 발명의 모든 측면에 적용될 수 있다. 본 출원에서, "또는"이란 명시적으로 다른 언급이 없는 한, "및/또는"을 말한다.

상세한 설명

본 명세서는 I2S 결핍과 연합된 질환, 이를 테면, Hunter 증후군 치료를 위해 I2S의 생체내 생성용으로 효과적이고, 강력한 재조합 아데노-연합된 바이러스 (rAAV) 벡터들을 기술한다.

뮤코다당증 유형 II (MPS II, Hunter 증후군)는 효소 이두로네이트-2-설파타제 (I2S)의 결핍으로 인해 발생되는 X-염색체-연계된 열성 리소좀 축적 장애다. I2S는 글리코사미노글리칸(GAG) 데르마탄 설페이트 및 헤파란 설페이트에서 말단 2-O-설페이트 모이어티를 절단시킨다. Hunter 증후군 환자들에서 I2S 효소가 없거나 또는 이 효소의 결함이 있기 때문에, GAG는 다양한 세포 유형의 리소좀에 점진적으로 축적되고, 이로 인하여 세포 울혈(engorgement), 기관 비대, 조직 파괴 및 기관 시스템 기능 장애로 이어진다.

일반적으로, Hunter 증후군 집단의 신체적 현시에는 신체 증상과 신경 증상이 모두 내포된다. 예를 들면, Hunter 증후군의 경우, 중추 신경계(CNS) 관련이 발달 지연과 신경계 문제로 이어진다. 예를 들면, 신경변성, 정신지체 등의 증상은 소아기에 나타나며, 신경영향으로 고통받는 Hunter 증후군 환자들은 뇌의 장기 손상으로 조기 사망하는 경우가 흔히 있다. 유사하게, GAG의 축적은 신체의 기관 시스템에 악영향을 미칠 수 있다. 처음에는 심장, 폐, 기도의 벽이 두꺼워지고, 그리고 간, 비장, 신장이 비정상적으로 비대해지는 것으로 나타나며, 이러한 심각한 변화는 궁극적으로 광범위한 장기 부전으로 이어질 수 있다. 결과적으로, 헌터 증후군은 항상 심각하고, 진행성이 있으며, 시한부 삶이 된다.

효소 대체 요법(ERT)은 Hunter 증후군(MPS II) 치료용으로 승인된 치료법으로, Hunter 증후군 환자에게 외생성 대체 I2S 효소를 투여하는 것과 관련된다. 그러나, ERT에는 다양한 결점이 연루되어 있는데, 그 중에서도, 예를 들면, 다양한 표적 기관으로 I2S의 분포가 한정적이라는 것이다.

본원에 기술된 벡터는 예를 들어, 간, 신장, 비장, 심장, 폐 및 중추신경계를 비롯한 다양한 기관에서 I2S의 강력한 발현을 제공한다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 간에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 신장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 비장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 심장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 폐에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 중추신경계에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 혈장에서 I2S가 발현된다.

rAAV I2S 벡터 디자인

일부 측면들에 있어서, 이두로네이트-2-설파타제 (I2S) 단백질을 인코딩하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터가 본원에서 제공된다. 본 명세서의 예시적인 rAAV 벡터를 예시하는 개략도가 도 1B에 예시되어 있다. 도 1B에 나타낸 것과 같이, 일부 구체예들에서, 본 명세서의 rAAV 벡터는 간 특이적 프로모터, 5' 및 3' 역전된 말단 반복부 (ITR), 시스-작용 조절 모듈 (CRM), 인트론, 및 WPRE 서열을 포함한다.

일부 구체예들에서, 상기 벡터에는 또한 설파타제 변형 인자 1 (SUMF) 유전자가 내포된다. 일부 구체예들에서, 상기 벡터는 내부 리보솜 진입 부위 (IRES)를 포함한다.

상기 벡터의 이두로네이트-2-술파타제 (I2S)는 야생형 또는 코돈-최적화된 변이체일 수 있다. 따라서, 일부 구체예들에서, 상기 rAAV 벡터는 야생형 I2S 뉴클레오티드 서열을 포함한다. 일부 구체예들에서, 코돈-최적화된 I2S 서열을 포함한다.

본 발명을 위해 적합한 I2S는 자연-발생적 이두로네이트-2-설파타제 (I2S) 단백질의 적어도 부분적 활성을 대체하고, 또는 I2S-결핍과 연합된 하나 또는 그 이상의 표현형 또는 증상을 구조하는 임의의 단백질 또는 단백질의 일부분이다. 본원에서 사용된 바와 같이, 용어 "I2S 효소" 및 "I2S 단백질" 그리고 문법적으로 이의 등가체는 호환-사용된다.

전형적으로, 상기 인간 I2S 단백질은 전구체 형태로 만들어진다. 인간 I2S의 전구체 형태는 신호 펩티드 (상기 전장의 전구체의 아미노산 잔기 1-25), 프로-펩티드 (상기 전장의 전구체의 아미노산 잔기 26-33), 그리고 42 kDa 쇄(상기 전장의 전구체의 잔기 34-455)와 14 kDa 쇄(전장의 전구체의 잔기 446-550)로 추가 프로세싱될 수 있는 쇄를 함유한다. 전형적으로, 상기 전구체 형태를 전장의 전구체 또는 전장의 I2S 단백질로 또한 지칭할 수 있는데, 이것은 550개 아미노산을 함유한다. 상기 신호 펩티드는 제거되고, 전형적인 야생형 또는 자연-발생적 인간 I2S 단백질의 전장의 전구체 (서열 식별 번호:2)를 갖는 완전 발달된 형태의 아미노산 서열 (서열 식별 번호: 1)이 표 1에 제시된다. 상기 신호 펩티드는 밑줄로 표시된다.

표 1. 인간 이두로네이트-2-설파타제

다양한 종류의 프로모터가 본원에 기재된 rAAV 벡터에서 사용될 수 있다. 여기에는 예를 들면, 산재된, 조직-특이적, 및 조절가능한 (가령, 유도가능한, 또는 억제가능한) 프로모터가 내포된다. 일부 구체예들에서, 상기 프로모터는 간-특이적 프로모터다. 당분야에는 간-특이적 프로모터들이 공지되어 있고, 예를 들면, 인간 트란스티레틴 프로모터 (TTR), α-항-트립신 프로모터, 인간 인자 IX 프로/간 전사 인자-응답 올리고머, LSP, 및 기본 알부민 프로모터가 내포된다. 간 특이적 프로모터들은 예를 들면, Zhijian Wu et al., Molecular Therapy vol 16, no 2, February 2008에서 기술되며, 그 내용은 그 전문이 본원의 참고자료에 편입된다.

일부 구체예들에서, 상기 프로모터는 산재된 프로모터다. 일부 구체예들에서, 상기 프로모터는 닭 베타 액틴 프로모터다.

일부 구체예들에서, 상기 rAAV 벡터는 mRNA의 전사 및/또는 해독을 촉진시키기 위한 추가적인 인핸서 또는 조절 요소들 (예를 들자면, 인핸서 서열들, Kozak 서열들, 폴리아데닐화 서열들, 전사 종료 서열들, IRES 및 이와 유사한 것들)을 함유한다. 일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR)를 포함한다. 일부 구체예들에서, 상기 벡터는 하나 또는 그 이상의 인핸서 요소들을 포함한다. 일부 구체예들에서, 상기 벡터는 poly(A) 꼬리를 포함한다.

일부 구체예들에서, 상기 rAAV 벡터는 하나 또는 그 이상의 작은 요소들, 이를 테면, 인트론을 포함한다. 다양한 인트론들이 당분야에 공지되어 있다. 본원에 기술된 rAAV 벡터용으로 적합한 인트론에는 예를 들면, MVM 인트론, 절두된 F.IX 인트론, 키메라 β 글로빈 SD/면역글로불린 중쇄 SA 인트론, SV40 및/또는 알파 글로빈 첫번째 인트론이 내포된다. 일부 구체예들에서, 상기 rAAV 벡터는 MVM 인트론을 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 SV40 인트론을 포함한다.

일부 구체예들에서, 상기 rAAV 벡터는 woodchuck 간염 바이러스 전사-후 제어 요소 (WPRE)를 포함한다. WPRE의 다양한 최적화된 또는 변이체 형태들이 당분야에 공지되어 있고, 그 중에는 WPRE3, WPREmut6delATG이 내포된다. 기타 변이체 WPRE 형태에는 예를 들면, WPRE2, WPRE_wt (GenBank 수탁 번호. J04514); WPRE_wt (GenBank 수탁 번호. J02442) 및 WPREmut6이 내포된다.

일부 구체예들에서, 상기 rAAV 벡터는 시스-액틴 조절 모듈 (CRM)을 포함한다. 본원에 기술된 벡터에서 사용에 적합한 다양한 종류의 CRM이 있으며, 예를 들면, 간-특이적 CRM, 신경-특이적 CRM이 내포된다. 일부 구체예들에서, 본원에 기술된 벡터에는 간세포-특이적 CRM, 예를 들면, CRM8이 내포된다. 일부 구체예들에서, 상기 벡터에는 하나 이상의 CRM이 내포된다. 예를 들면, 일부 구체예들에서, 상기 벡터는 두 개, 세 개, 네 개, 다섯 개 또는 여섯 개의 CRM을 포함한다. 일부 구체예들에서, 상기 벡터는 세 개의 CRM, 예를 들면, 세 개의 CRM8을 포함한다.

일부 구체예들에서, 상기 rAAV 벡터는 더욱 효과적인 해독을 위해 전사체 안정성을 증가시키고, 면역원성은 감소되도록 최적화된 서열이다. 일부 구체예들에서, I2S는 서열 최적화된다.

일부 구체예들에서, 상기 rAAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11 벡터이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 1이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 2이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 3이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 4이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 5이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 6이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 7이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 8이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 9이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 10이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 11이다.

예시적인 요소 서열들은 하기 표 2에 나타낸다. 일부 구체예들에서, 상기 rAAV 벡터는 표 2에 나타낸 벡터 요소 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 rAAV 벡터 요소를 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 표 2에 나타낸 벡터 요소의 뉴클레오티드 서열과 동일한 벡터 요소 뉴클레오티드 서열을 포함한다. 이 표에서, Xn (60-100)는 60-100개 뉴클레오티드를 포함하는 DNA 역가 테그를 의미한다.

표 2. 예시적인 I2S rAAV 요소 서열들

일부 구체예들에서, 상기 rAAV I2S 벡터는 하기 표 3에 나타낸 뉴클레오티드 서열에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 일부 구체예에서, 상기 rAAV I2S 벡터는 하기 표 3에 나타낸 뉴클레오티드 서열과 동일한 서열을 포함한다.

표 3: 예시적인 rAAV I2S 벡터 뉴클레오티드 서열들

질환 치료를 위한 I2S를 인코드하는 rAAV 벡터들의 용도

I2S 효소 결핍과 연합된 질환을 치료하는 방법들이 본원에서 기술된다. 따라서, 일부 구체예들에서, 본원에 기술된 rAAV 벡터들은 I2S 결핍, 이를 테면, Hunter 증후군 (MPSII)이 있는 대상체 치료에 적합하다. 치료 방법에는 본원에 기술된 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것이 내포된다.

본원에 기술된 rAAV 벡터를 이용하여 I2S 결핍 또는 장애와 연합된 임의의 질환을 치료할 수 있다.

일부 구체예들에서, 상기 rAAV 벡터는 이를 필요로 하는 대상체에게 투여 후, 에피좀으로 유지된다. 일부 구체예들에서, 상기 rAAV 벡터는 이를 필요로 하는 대상체에게 투여 후, 에피좀에 남아있지 않는다. 예를 들면, 일부 구체예들에서, 상기 rAAV 벡터는 해당 대상체의 게놈으로 통합된다. 이러한 통합은 예를 들면, 다양한 유전자-편집 기술, 이를 테면, 아연 핑거 뉴클레아제 (ZFNs), 전사 활성자-유사 작동체 뉴클레아제 (TALENS), ARCUS 게놈 편집, 및/또는 CRISPR-Cas 시스템을 이용하여 이루어질 수 있다.

일부 구체예들에서, 본원에 기술된 rAAV 벡터를 포함하는 약제학적 조성물을 이용하여 이를 필요로 하는 대상체를 치료할 수 있다. 본 발명의 rAAV 벡터 또는 입자를 함유하는 상기 약제학적 조성물은 약제학적으로 수용가능한 부형제, 희석제 또는 담체를 함유한다. 적합한 약제학적 담체의 예는 당업계에 잘 알려져 있으며, 인산염 완충 식염수 용액, 물, 에멀젼, 예를 들어 오일/물 에멀젼, 다양한 유형의 습윤제, 멸균 용액 및 이와 유사한 것들이 내포된다. 이러한 담체는 통상적인 방법에 의해 제형화될 수 있고, 치료요법적으로 유효량으로 대상체에게 투여된다.

상기 rAAV 벡터는 이를 필요로 하는 대상체에게 적합한 경로를 통하여 투여된다. 구체예들에서, 상기 rAAV 벡터는 정맥내, 복강내, 피하, 또는 내피 경로에 의해 투여된다. 구체예들에서, 상기 rAAV 벡터는 정맥내로 투여된다. 구체예들에서, 상기 내피 투여는 "유전자 총" 또는 생물학적 입자 전달 시스템을 사용하는 투여를 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 비-바이러스성 지질 나노입자를 통하여 투여된다. 예를 들면, 상기 rAAV 벡터를 포함하는 조성물은 하나 또는 그 이상의 희석제, 완충제, 리포솜, 지질, 지질 복합체를 포함할 수 있다. 일부 구체예들에서, 상기 rAAV 벡터는 미소구 또는 나노입자, 이를 테면, 지질 나노입자 내에 포함된다. 일부 구체예들에서, 상기 rAAV 벡터들 및/또는 이식유전자 발현 카세트 및/또는 최적화된 IDS 이식유전자 서열들 및/또는 상기 유전자 발현 카세트의 임의의 조성물은 비-바이러스성 화학 입자들, 이를 테면, 지질 나노입자, 비-바이러스성 생물학적 분자들, 이를 테면, 엑소좀 및/또는 세포외 소포체를 통하여 투여된다.

일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 약 2 ~ 6 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 2 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 3 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 4 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 5 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 6 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 약 2 ~ 6 주 시점에서 해당 대상체의 간 세포에서 검출가능하다.

일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 개월, 6 개월, 12 개월, 2 년, 3 년, 4 년, 5 년, 6 년, 7 년, 8 년, 9 년, 또는 10 년 시점에서 해당 대상체의 혈장에서 검출가능하다. 따라서, 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 6 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 12 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 2 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 4 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 5 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 6 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 7 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 8 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 9 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 10 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후, 해당 대상체의 남은 여생 동안 해당 대상체의 혈장 또는 혈청에서 검출가능하다.

일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 정맥내로 전달된 정제된 I2S 단백질의 투여-후 발견되는 것과 동일한 정도로 활성 I2S가 생성된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 정맥내로 전달된 정제된 I2S 단백질 투여와 비교하였을 때, 더 많은 양의 활성 I2S가 생성된다.

일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 글리코사미노글리칸 (GAG)의 감소를 초래한다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, I2S를 포함하는 상기 rAAV 투여 전 해당 대상체의 기준 GAG 수준과 비교하였을 때, 해당 대상체에서 GAG가 약 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 또는 약 10% 감소된다. 따라서, 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 95% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 90% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 85% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 80% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 75% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 70% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 65% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 60% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 55% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 50% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 45% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 40% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 35% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 30% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 25% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 20% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 15% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 10% 감소된다.

일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 적어도 약 2 주, 1 개월, 2 개월, 3 개월, 4 개월, 5 개월, 6 개월, 12 개월, 1 년, 2 년, 3 년, 4 년, 5 년, 또는 5년 이상 동안 해당 대상체에서 GAG가 감소된다.

일부 구체예들에서, 대상체에게 AAV 벡터를 투여한 후, 순환계에서 검출가능한 기능을 하는 I2S의 수준은 I2S를 포함하는 rAAV의 투여-전 해당 대상체에서 검출가능한 기능을 하는 I2S의 양보다 약 2배 ~ 10배 더 많다.

일부 구체예들에서, 해당 대상체에게 AAV 벡터를 투여한 후, 검출가능한 활성 I2S의 수준은 인간의 치료요법적 수준을 충족하거나 또는 이를 초과한다. 일부 구체예들에서, 상기 rAAV 벡터를 투여한 후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 2 ~ 35배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 2배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 3배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 4배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 5배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 6배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 6배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 7배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 8배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 9배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 10배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 15배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 20배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 25배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 30배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 35배이다.

따라서, I2S를 포함하는 rAAV 벡터의 투여는 정제된 I2S를 이를 필요로 하는 대상체에게 단일 투여한 것과 비교하여 지속적인 강력한 발현을 초래한다.

일부 구체예들에서, 상기 rAAV I2S 벡터는 각 대상체에게 단일 투여분량으로 전달된다. 일부 구체예들에서, 해당 대상체에게 최소 효과 투여분량 (MED)으로 전달된다. 본원에서 사용된 바와 같이, MED는 해당 대상체에서 GAG 수준 감소를 초래하는 I2S 활성을 얻는데 요구되는 rAAV I2S 벡터 투여분량을 나타낸다.

벡터 역가는 벡터 조제물의 DNA 함량을 기준으로 결정된다. 일부 구체예들에서, 정량적 PCR 또는 최적화된 정량적 PCR을 사용하여 rAAV I2S 벡터 조제물의 DNA 함량을 결정한다. 한 구체예에서, 상기 용량은 약 1 x 10¹¹ 벡터 게놈 (vg)/체중 (kg) ~ 약 1 x 10¹³ vg/kg(양 끝점 포함)이다.

한 구체예에서, 상기 용량은 1 x 10⁹ vg/kg ~ 3 x 10¹⁵ vg/kg(예를 들면, 1 x 10⁹ vg/kg, 3 x 10⁹ vg/kg, 1 x 10¹⁰ vg/kg, 3 x 10¹⁰ vg/kg, 1 x 10¹¹ vg/kg, 3 x 10¹¹ vg/kg, 1 x 10¹² vg/kg, 3 x 10¹² vg/kg, 1 x 10¹³ vg/kg, 3 x 10¹³ vg/kg, 1 x 10¹⁴ vg/kg, 3 x 10¹⁴ vg/kg, 1 x 10¹⁵ vg/kg, 3 x 10¹⁵ vg/kg) 범위에서 선택된다. 일부 구체예들에서, 상기 용량은 5 x 10¹³ vg/kg이다. 또다른 구체예에서, 상기 용량은 5 x l0¹² vg/kg이다. 특이적 구체예에서, 대상체에게 투여되는 rAAV 투여분량은 적어도 5 x 10¹¹ vg/kg, 1 x 10¹² vg/kg, 1.5 x 10¹² vg/kg, 2.0 x 10¹² vg/kg, 2.5 x 10¹² vg/kg, 3.0 x 10¹² vg/kg, 3.5 x 10¹² vg/kg, 4.0 x 10¹² vg/kg, 4.5 x 10¹² vg/kg, 5.0 x 10¹² vg/kg, 5.5 x 10¹² vg/kg, 6.0 x 10¹² vg/kg, 6.5 x 10¹² vg/kg, 7.0 x 10¹² vg/kg, 또는 7.5 x 10¹² vg/kg이다.

일부 구체예들에서, 상기 rAAV I2S 벡터 조성물은 약 1.0 x 10⁹ vg ~ 약 1.0 x 10¹⁵ vg 범위인 복제-결함 바이러스의 양을 함유하도록 용량 단위로 제형화될 수 있다. 본원에서 사용된 바와 같이, 용어 "용량(dosage)"은 치료 과정에서 해당 대상체에게 전달되는 총 용량, 또는 단일(다회) 투여로 전달되는 양을 나타낼 수 있다.

일부 구체예들에서, 상기 용량은 해당 환자의 혈장 GAG 수준을 25% 또는 그 이상 감소시키기에 충분하다. 일부 구체예들에서, rAAV I2S는 Hunter 증후군 치료를 위한 하나 또는 그 이상의 요법과 함께 투여된다.

rAAV 바이러스 벡터들의 생산

대상체에게 전달하기에 적합한 AAV 바이러스 벡터를 만들고, 단리하는 방법은 당업계에 공지되어 있다. 예를 들자면, US 특허 7790449; US 특허 7282199; WO 2003/042397; WO 2005/033321, WO 2006/1 10689; 그리고 US 7588772 B2 참고. 한 시스템에서, 생산자 세포주에 ITRs이 측면에 있는 이식유전자를 인코딩하는 구조체와 rep 및 cap을 인코딩하는 구조체로 일시적으로 형질감염시킨다. 두 번째 시스템에서, rep 및 cap을 안정적으로 공급하는 패키징 세포주에 ITRs이 측면에 있는 이식유전자를 인코딩하는 구조체로 일시적으로 형질감염시킨다. 이들 각각의 시스템에서, AAV 비리온은 헬퍼 아데노바이러스 또는 헤르페스바이러스 감염에 대한 반응으로 생성되며, 오염 바이러스로부터 rAAV를 분리해야 한다. 보다 최근에는, AAV를 복구하기 위해 헬퍼 바이러스(예: 아데노바이러스 E1, E2a, VA 및 E4 또는 헤르페스바이러스 UL5, UL8, UL52 및 UL29) 감염을 필요로 하지 않는 시스템이 개발되었고, 헤르페스바이러스 중합효소 또한 이 시스템에 의해 트랜스로 공급된다. 이러한 새로운 시스템에서, 헬퍼 기능은 요구되는 헬퍼 기능을 인코딩하는 구조체로 세포를 일시적인 형질감염을 통해 공급될 수 있거나, 또는 세포는 헬퍼 기능을 인코드하는 유전자를 안정적으로 함유하도록 조작될 수 있으며, 그 유전자의 발현은 전사 또는 전사 후 수준에서 제어될 수 있다.

일부 구체예들에서, ITRs 및 rep/cap 유전자 측면 발현 카세트는 배큘로바이러스-기반 벡터를 이용한 감염에 의해 원하는 세포 또는 세포주로 도입된다.

일부 구체예들에서, ITRs 및 rep/cap 유전자 측면 발현 카세트는 배큘로바이러스-기반 벡터를 이용한 감염에 의해 곤충 세포로 도입된다. 이들 생산 시스템에 대한 검토를 위해, 일반적으로, 예를 들자면, Zhang et al, 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929를 참고하며, 이의 내용은 이의 전문이 본원에 참고자료에 편입된다. 이들 및 기타 AAV 생산 시스템을 만들고, 사용하는 방법들은 다음의 미국 특허들에도 설명되어 있으며, 그 각각의 내용은 전체가 본원의 참조에 편입된다: 5, 139,941 ; 5,741,683; 6,057, 152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7, 172,893; 7,201,898; 7,229,823; 그리고 7,439,065. 전반적으로, 예를 들자면, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al, 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med 10:717-733; 그리고 하기 언급된 참조자료 참고, 이들 각각은 전체가 본원의 참조에 편입된다.

본 발명의 임의의 구체예들을 구축하기 위해 사용된 방법들은 핵산 조작의 숙련가에게 공지되어 있고, 유전 공학, 재조합 공학 및 합성 기술들이 내포된다. 예를 들자면, Green and Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참고. 유사하게, rAAV 비리온을 생성하는 방법들이 잘 알려져 있고, 적합한 방법의 선택이 본 발명을 국한시키는 것은 아니다. 예를 들자면, K. Fisher et al, (1993) J. Virol, 70:520-532 및 US 특허 번호 5,478,745 참고.

본 발명에 따라 사용될 수 있는 많은 플라스미드 및 기타 클로닝 및 발현 벡터는 잘 알려져 있고, 당업자에게 용이하게 이용가능하다. 더욱이, 당업자는 본 발명에 사용하기에 적합한 임의의 수의 다른 플라스미드를 쉽게 구축할 수 있다. 본 발명에서 이러한 플라스미드, 뿐만 아니라 다른 벡터의 속성, 구축 및 용도는 본 개시내용으로부터 당업자에게 용이하게 명백할 것이다.

한 구체예에서, 상기 생산 플라스미드는 본원에 기술된 것, 또는 WO2012/158757에 기술된 바와 같으며, 이는 본원의 참고자료에 편입된다. 다양한 플라스미드가 rAAV 벡터들 생성에 사용하기 위해 당업계에 공지되어 있고, 본 발명에서 유용하다. 상기 생산 플라스미드는 AAV cap 및/또는 rep 단백질들을 발현시키는 숙주 세포에서 배양된다. 상기 숙주 세포에서, 각각의 rAAV 게놈은 구조되고, 캡시드 단백질 또는 외피 단백질로 패키징되어, 감염성 바이러스 입자들이 형성된다.

특정 구체예들에서, 상기 rAAV 발현 카세트, 상기 벡터 (이를 테면, rAAV 벡터), 상기 바이러스 (이를 테면, rAAV), 상기 생산 플라스미드는 AAV 역전된 말단 반복부 서열들, IDS 및/또는 SUMF-1을 인코드하는 코돈 최적화된 핵산 서열 그리고 숙주 세포에서 상기 인코드된 단백질의 발현을 지시하는 발현 제어 서열들을 포함한다. 다른 구체예들에서, 상기 rAAV 발현 카세트, 상기 바이러스, 상기 벡터 (이를 테면, rAAV 벡터), 상기 생산 플라스미드는 인트론, Kozak 서열, polyA, 전사-후 조절 요소들과 기타 다른 것들중 하나 또는 그 이상을 더 포함한다. 한 구체예에서, 상기 전사-후 조절 요소는 Woodchuck 간염 바이러스 (WHP) 전사-후 조절 요소 (WPRE)이다.

AAV 벡터의 생산 및 정제와 관련된 다양한 방법이 당업계에 공지되어 있다. 예를 들자면, Mizukami, Hiroaki, et al. A Protocol for AAV vector production and purification; U.S. 특허 공개 번호 US20070015238 및 US20120322861 참고. 예를 들면, 관심대상 유전자를 포함하는 플라스미드는 하나 또는 그 이상의 헬퍼 플라스미드, 예를 들자면, rep 유전자 (예를 들자면, Rep78, Rep68, Rep52 및 Rep40을 인코딩하는) 및 cap 유전자 (본원에서 기술된 바와 같은 변형된 VP2 영역을 비롯하여, VP1, VP2, 및 VP3을 인코딩하는)를 함유하는 플라스미드와 복합될 수 있고, 재조합 세포로 형질감염되어, 상기 rAAV는 패키지되고, 후속적으로 정제될 수 있다.

일부 구체예들에서, 상기 패키징은 포유동물 세포 또는 곤충 세포와 같은 헬퍼 세포 또는 생산자 세포에서 수행된다. 예시적인 포유류 세포에는 HEK293 세포, COS 세포, HeLa 세포, BHK 세포, 또는 CHO 세포 (예를 들자면, ATCC® CRL-1573™, ATCC® CRL-1651™, ATCC® CRL-1650™, ATCC® CCL-2, ATCC® CCL-10™, 또는 ATCC® CCL-61™)이 내포되나, 이에 국한되지 않는다. 예시적인 곤충 세포에는 Sf9 세포 (예를 들자면, ATCC® CRL-1711™ 참고)가 내포되나, 이에 국한되지 않는다. 헬퍼 세포는 본 명세서에 기재된 방법에 사용하기 위한 Rep 단백질 및/또는 Cap 단백질을 인코딩하는 rep 및/또는 cap 유전자를 포함할 수 있다. 일부 구체예들에서, 상기 패키징은 시험관내에서 실행된다.

일부 구체예들에서, 관심대상 유전자를 포함하는 플라스미드는 하나 또는 그 이상의 헬퍼 플라스미드, 예를 들자면, 제 1 혈청형의 rep 유전자 및 동일한 혈청형 또는 상이한 혈청형의 cap 유전자를 함유하는 플라스미드와 복합될 수 있고, 재조합 세포로 형질감염되어, 상기 rAAV는 패키징된다.

일부 구체예들에서, 상기 하나 또는 그 이상의 헬퍼 플라스미드에는 rep 유전자 및 cap 유전자를 포함하는제 1 헬퍼 플라스미드, 그리고 다음의 헬퍼 유전자중 하나 또는 그 이상을 포함하는 제 2의 헬퍼 플라스미드가 내포된다: Ela 유전자, Elb 유전자, E4 유전자, E2a 유전자, 및 VA 유전자. 명확성을 위해, 헬퍼 유전자는 헬퍼 단백질 Ela, Elb, E4, E2a 및 VA를 인코딩하는 유전자다. 일부 구체예들에서, 상기 cap 유전자는 단백질 VP1, VP2 및 VP3 중 하나 또는 그 이상이 발현되지 않도록 변형된다. 일부 구체예들에서, 상기 cap 유전자는 VP2가 발현되지 않도록 변형된다. 이러한 변형을 만드는 방법은 당업계에 알려져 있다 (Lux et al. (2005), J Virology, 79: 11776-87).

헬퍼 플라스미드, 및 이러한 플라스미드를 만드는 방법은 당분야에 공지되어 있고, 일반적으로 상업적으로 이용가능하다 (예를 들자면, pDF6, pRep, pDM, pDG, pDPlrs, pDP2rs, pDP3rs, pDP4rs, pDP5rs, pDP6rs, pDG(R484E/R585E), 및 pDP8.ape 플라스미드(PlasmidFactory, Bielefeld, Germany 참고); 기타 생산품 및 서비스는 Vector Biolabs, Philadelphia, PA; Cellbiolabs, San Diego, CA; Agilent Technologies, Santa Clara, Ca; and Addgene, Cambridge, MA에서 이용가능하다; pxx6; Grimm et al. (1998), Novel Tools for Production and Purification of Recombinant Adeno associated Virus Vectors, Human Gene Therapy, Vol. 9, 2745-2760; Kem, A. et al. (2003), Identification of a Heparin-Binding Motif on Adeno- Associated Virus Type 2 Capsids, Journal of Virology, Vol. 77, 11072-11081.; Grimm et al. (2003), Helper Virus-Free, Optically Controllable, and Two-Plasmid-Based Production of Adeno-associated Virus Vectors of Serotypes 1 to 6, Molecular Therapy, Vol. 7, 839-850; Kronenberg et al. (2005).

실시예들

본 발명의 다른 속성들, 목적 및 이점은 다음의 실시예들로부터 자명하다. 그러나, 본 발명의 구체예들을 나타내는 실시예들은 단지 예시로서 제공된다는 것을 이해해야 하며, 이에 국한시킨다는 의도가 아니다. 본 발명의 범위 안에 있는 다양한 변화 및 변형들은 실시예로부터 당업자에게 자명하기 때문에, 오로지 설명을 위하여 제공되는 것으로 이해되어야 한다.

실시예 1. 벡터 디자인

인간 이두로네이트 2-설파타제 (IDS 또는 I2S)의 코딩 서열 및 이의 변이를 포함하는 rAAV 발현 구조체(rAAV 벡터)을 생성하는 예시적인 방법 및 디자인이 본 실시예에서 제공된다. 본 연구에서, 재조합 AAV 벡터 (rAAV8)가 이용되었다. rAAV 벡터의 기본 디자인은 역전된 말단 반복부(ITRs): 5'-ITR 및 3'-ITR 측면에 있는 발현 카세트를 포함한다. 이러한 ITRs는 벡터 생산자 세포에서 AAV 복제 단백질 Rep 및 관련 인자들에 의한 벡터 게놈의 복제 및 패키징을 매개한다. 전형적으로, 발현 카세트는 도 1A에 도시된 바와 같이 프로모터, 코딩 서열, polyA 꼬리 및/또는 태그를 함유한다. 인간 IDS(hIDS)를 인코딩하는 발현 구조체는 표준 분자 생물학 기술을 사용하여 설계 및 준비되었다. hIDS에 대한 코딩 서열은 프로모터, hTTR (인간 트랜스티레틴 프로모터)의 하류에 삽입되었다. 추가적으로, 간-특이적 시스-작용 조절 모듈 (CRM)은 상기 프로모터의 상류에 삽입되었고, 마우스의 극미한 바이러스 (MVM) 인트론 서열은 상기 프로모터의 하류에 삽입되었다. 이 조절 및 프로모터 조합은 다음 예에서 볼 수 있듯이 높은 형질도입 수준에 대해 테스트되었다. 또한, WPRE 서열은 코딩 영역의 하류에 삽입되었다. 이론에 얽매이지 않고, 이 요소는 mRNA 안정성을 증가시키는 3차 구조를 창출한다. 예를 들어, 전사 종결 개선 및 mRNA 핵 방출 촉진을 포함하여 WPRE에 대한 다른 기능 메커니즘이 기술되었다. 도 1B는 위에서 설명한 발현 구조체의 개략도를 보여준다. 그런 다음, 상기 발현 구조체를 AAV 플라스미드 백본으로 클로닝하고, 시퀀싱으로 확인했다. 벡터를 바이러스 입자에 패키징하고, 보관하였다.

위 구성에서 다수의 변형을 수행할 수 있다. 도 2와 같이, WPRE 서열을 내부 리보솜 진입 부위(IRES)가 앞에 오는 SUMF1(설파타제 수정 인자 1) 코딩 서열로 교체하여, 대체 구조체를 얻을 수 있다. 공개된 데이터(Fraldi A et al. 2007. Biochem J. 403:305-312)에 기초하여, 시험관내 세포 기반 분석에서 테스트될 때 SUMF1이 존재하면 I2S 활성이 증가된다. 동일한 연구에서 발표된 추가 생체 내 데이터는 SUMF1이 있을 때 설파미다제 (SGSH) 활성이 더 크게 개선되었음을 보여주었다. 단서조건으로, SUMF1은 소포체에서 IDS를 비롯한, 기질의 포르밀 글리신 촉매 잔기 활성화에 필요하다면, 동일한 벡터로부터의 IDS 및 SUMF1의 공동-발현은 세포 수준에서 IDS 양 증가를 위해 증가된 양의 SUMF1이 있음을 보장할 수 있고, 따라서, 활성화된 IDS가 리소좀으로 트래피킹되기 전에 처리되거나, 또는 업데이트를 위해 다른 세포로 이동하기 위해 세포를 벗어나갈 확률이 증가한다.

코돈 최적화.

또한, IDS 또는 SUMF1에 대한 코딩 서열은 코돈 채택 지수(CAI), CpG 부위 계수, GC 함량 및 반복성 염기 서열과 같은 여러 매개변수를 기반으로 코돈- 최적화되었다. 더 자주 사용되는 코돈을 활용하고, 잠재적으로 이 벡터로부터의 이식유전자 산물 발현 수준을 증가시키기 위해 높은 CAI는 선호되었다. 면역 반응을 유발할 수 있는 CpG 부위들은 감소했다. 반복성 염기들도 제거되었다. 이를 위해 COOL(Codon Optimization Online)이라는 합성 유전자 설계용 웹-기반 다중-목표 최적화 플랫폼과 내부 코돈 사용 빈도 테이블이 사용되었다. 추가적으로, 잠재적인 스플라이싱(splicing) 부위를 수작업으로 제거했다. 최적화된 hIDS 및 SUMF1 코딩 서열들의 특징들은 표 4에 요약하였고, hIDS-WPRE 및 hIDS-IRES-SUMF1의 대표적인 구조체에 대한 개략도는 각각 도 1B 및 도 2에서 제공된다. 위 구성에서 다수의 변형을 수행할 수 있다. 예를 들면, 하나 이상의 프로모터가 사용될 수 있고, 및/또는 IRES 서열이 코딩 영역의 상류에 도입될 수 있다. 추가적으로, 조절 영역, 프로모터 및 인트론의 다양한 조합이 고려될 수 있다.

표 4: 최적화된 hIDS 및 SUMF1 코딩 서열들의 예시적인 특징들

실시예 2. 생체내에서 rAAV-구동된 hIDS-WPRE 발현의 발현

본 실시예는 생체내에서 rAAV-구동된 IDS 발현에 최적화된 구조체의 효능을 설명한다. 마우스에게 대조군 벡터 (rAAV-XL032) (그룹 A); 또는 테스트 샘플 rAAV-XL024 (hIDS wt-WPRE) 구조체 (그룹 B) 또는 rAAV-XL026 (hIDS-AUSopt-WPRE) 구조체 (그룹 C) (도 1A 및 도 1B에 도시됨)을 주사하였다. 6주령의 마우스들은 꼬리 정맥을 통하여 200μl 용적으로 5x 10⁹ vg의 벡터들을 제공받았고, 혈청 샘플을 주사-후 2 일차, 7 일차, 21 일차, 8 주차, 및 12 주차 시점에 수거하였다. 마우스를 12 주차에 희생시키고, 조직 샘플을 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 실험 기획안은 하기 표 5에서 요약된다.

표 5. hIDS를 인코드하는 rAAV 벡터들을 이용한 예시적인 생체내 연구

벡터-매개된 발현량은 B85 항체를 사용하는 ELISA에 의해 결정되었다. 도 3에 결과를 도시한다. 최적화된 구조체의 rAAV 벡터, rAAV-XL024 (그룹 B) 및 rAAV-XL026 (그룹 C)를 주사한 마우스들은 대조군 벡터인 rAAV-XL032 (그룹 A)[CpG 부위를 감소시키지 않는 상이한 알고리즘에 의해 코돈-최적화된 hIDS 그리고 더 짧은 형태의 야생형 WPRE 서열을 인코드하는 벡터]와 비교하였을 때, 혈청에 hIDS 농도가 더 높았다. 벡터들 (그룹 A-C)을 주사한 모든 그룹의 경우, 단일 주사 후, hIDS 농도는 21일차 시점까지 증가되었고, hIDS 수준은 최대 12 주 (84 일)까지 유지되었다. 모든 WT 및 IDS-KO 그룹은 인간 IDS를 발현시키지 않으므로, hIDS는 검출되지 않았다.

도 4A에 나타낸 것과 같이, hIDS 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. 벡터들 (그룹 A-C)을 주사한 모든 그룹의 경우, 상기 활성 수준은 21일차 까지 증가한다. 발현 결과와 유사하게, 최적화된 구조체의 rAAV 벡터들을 주사한 마우스 그룹 (그룹 B 및 그룹 C)에서 hIDS 활성은 대조군 벡터 rAAV-XL032 (그룹 A)를 주사맞은 마우스 그룹보다 더 높았다. WT 마우스 그룹의 hIDS 활성 수준은 연구 기간을 통하여 상대적으로 안정적이었다. 본 실시예에서 이용된 rAAV 벡터는 rAAV8이었다.

조직에서, hI2S는 ELISA를 이용하여 측정되었다(도 4B에 나타냄). rAAV-XL024 (그룹 B)의 경우, 간 및 신장에서 hI2S가 검출가능하였지만, 뇌에서는 아니다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 간, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였다. rAAV-XL032 (그룹 A)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다.

조직에서, hI2S는 활성을 이용하여 측정되었다(도 4C에 나타냄). rAAV-XL024 (그룹 B)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 간, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였다. rAAV-XL032 (그룹 A)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. 효소 활성 수준은 WT 그룹과 비교하였다(도 4D에 나타냄). 혈청 및 체세포 조직에서, 모든 벡터 투여 그룹은 WT보다 큰 활성 수준을 함유하였다. 뇌에서, rAAV-XL026 및 rAAV-XL032 수준은 WT보다 더 작았다.

실시예 3. hIDS-WPRE 구조체를 이용한 유전자 요법에 의한 GAG 제거

효소 이두로네이트-2-설파타제 (IDS)는 글리코사미노글리칸 (GAGs), 데르마탄 및 헤파린 설페이트로부터 설페이트 그룹을 제거하고, 이것이 없는 경우, 또는 비활성인 경우 뮤코다당증 유형 II (MPSII), 또는 Hunter 증후군, 리소좀 축적 장애가 발생된다. 따라서, 최적화된 rAAV 구조체에 의해 발현되는 hIDS의 효능을 평가하기 위해, GAG 제거를 측정했다. 표 5에 나타낸 마우스 그룹으로부터 12주차 시점에서 뇌, 간, 및 신장 조직을 추출하였고, 각 조직에서 GAG 수준이 측정되었다.

도 5A에 나타낸 것과 같이, 처리안된 IDS-KO 마우스와 비교하였을 때, rAAV-XL026 (그룹 C) 및 rAAV-XL032 (그룹 A)의 경우 뇌에서 GAG 수준이 약간 더 감소했다. 도 5B 및 도 5C에 나타낸 것과 같이, 마우스에게 hIDS를 인코딩하는 rAAV 벡터를 주사하였을 때, 간 및 신장에서 GAG 수준이 상당히 감소하였다. GAG 수준은 처리안된 WT 마우스에서 발견된 GAG 수준과 유사하였다.

실시예 4. hIDS-WPRE 구조체를 이용한 유전자 요법에 의해 헤파린 설페이트(HS)와 데르마탄 설페이트(DS)의 감소

본 실시예는 마우스에서 hIDS 발현에 의해 헤파린 설페이트 및 데르마탄 설페이트 수준의 감소를 설명한다. 효소 이두로네이트-2-설파타제 (IDS)는 글리코사미노글리칸 (GAGs), 데르마탄 및 헤파린 설페이트로부터 설페이트 그룹을 제거하고, 이것이 없는 경우, 또는 비활성인 경우 GAGs가 축적되어 뮤코다당증 유형 II (MPSII), 또는 Hunter 증후군, 리소좀 축적 장애가 발생된다.

최적화된 rAAV 구조체에 의해 발현되는 hI2S의 효능을 평가하기 위해, GAG 제거를 측정하였다.

표 5에 나타낸 마우스 그룹으로부터 12주차 시점에서 추출된 간, 신장, 심장, 비장, 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. 결과는 도 6A-B에 나타낸다.

rAAV-XL024 (그룹 B)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간 및 신장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간, 신장, 심장, 비장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다. rAAV-XL032 (그룹 A)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간 및 신장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다.

HS 및 DS GAG 수준은 도 6B와 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다.

전반적으로, 모든 벡터 투여 그룹은 체세포에서 HS 및 DS GAGs의 감소%, 그리고 뇌 HS 및 DS GAGs의 GAG 감소%를 보여주었다. 결과는 I2S의 발현이 마우스 조직에서 GAG 수준 감소를 초래한다는 것을 보여주었다.

실시예 5. 마우스에서 hIDS-WPRE 구조체를 이용한 유전자 요법에서 리소좀 축적 격실의 감소

본 실시예는 마우스에서 hIDS-WPRE 구조체를 이용한 효소 대체 요법, 예를 들면, 뮤코다당증(MPSII)의 치료시 LAMP1 착색에 의해 검출하였을 때, 리소좀 축적 격실에서 감소를 설명한다.

간단히 말해서, LAMP1 착색을 사용하여 마우스의 리소좀 축적 구획을 측정했다. 간 및 뇌 해마, 시상, 뇌량, 피질, 소뇌 및 지층과 같은 다양한 조직을 착색하였다. 본 실시예에서, 대조군 마우스 그룹에게 실험 기간 동안 0일차, 7일차, 14일차, 21일차 및 28일차 (표 5에서 그룹 F)에 5차례 척추강내(IT)로 I2S 효소를 투여하였다. 감소된 LAMP1 착색은 기질 감소, 즉 KO 마우스의 병리학의 개선을 나타낸다.

도 7A 및 도 7B에 결과를 나타낸다. LAMP1의 상당한 감소는 도 7A에서 볼 수 있는 바와 같이, 벡터가 주사된 마우스의 간 조직에서 관찰되었다. 간에서의 효과는 WT 마우스 및 ERT로 처리된 마우스 그룹과 필적했다.

도 7B에는 뇌를 나타낸다. 처리안된 KO (그룹 E)과 비교하였을 때, LAMP1 착색의 양성적 감소는 rAAV-XL026의 경우 해마에서, rAAV-XL024 및 rAAV-XL026의 경우 뇌량에서, 그리고 rAAV-XL024 및 rAAV-XL026의 경우 시상에서 통계학적으로 유의성에 도달하였다.

전체적으로, 결과에서 마우스 간 및 뇌 조직에서, IDS를 투여하면, LAMP1 착색에 의해 측정하였을 때, 리소좀 축적 격실이 감소되었다.

실시예 6. 생체내에서 rAAV-구동된 hIDS-IRES-SUMF1 발현의 발현

본 실시예는 마우스에서 hIDS-WPRE 벡터와 비교하여, hIDS-IRES-SUMF1 벡터 투여에서 hIDS의 생체내 발현 및 활성을 비교한다.

SUMF1은 IDS의 FGly 촉매 잔기를 활성화하는 데 필요하므로, hIDS-WPRE를 발현시키는 벡터에 대비하여, hIDS 및 SUMF1을 발현하는 벡터를 사용하여 비교했다.

마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026; 그룹 C), hIDS-IRES-SUMF1 구조체 (rAAV-XL027; 그룹 G, 및 XL029; 그룹 H)를 발현시키는 rAAV 벡터를 주사하고, 또는 음성 대조군으로 SUMF1 구조체 (rAAV-XL030; 그룹 I)를 발현시키는 벡터를 주사하였다. 이들 구조체의 개략도는 도 1B 및 도 2에서 도시된다.

6주령의 마우스들은 꼬리 정맥을 통하여 200μl 용적으로 5x 10⁹ vg의 벡터들을 제공받았고, 혈청 샘플을 주사-후 2 일, 7 일 및 21 일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 6에서 요약된다.

표 6. hIDS 및 WPRE와 비교하여, hIDS 및 SUMF1을 인코드하는 rAAV 벡터들을 이용한 예시적인 생체내 연구

혈청내 IDS 발현 수준은 ELISA에 의해 정량화되었다. 도 8에 그 결과를 도시한다. 예상외로, hIDS 및 SUMF1 둘 모두를 발현시키는 rAAV-XL027 및 rAAV-XL029를 주사한 마우스는 오로지 hIDS만 발현시키는 rAAV-XL026 벡터(그룹 C)가 주사된 마우스와 비교하여, 21일차 시점에 혈청내 hI2S 농도가 더 낮은 것으로 나타났다.

도 9에 나타낸 것과 같이, hI2S 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. hIDS와 SUMF1을 모두 발현시키는 벡터를 주사한 모든 그룹(그룹 G-H)에서, 상기 활성 수준은 hIDS-WPRE를 발현하는 벡터를 주사한 그룹(그룹 C)보다 더 낮았다. 특정 이론에 얽매이지 않고, rAAV-XL026 벡터의 WPRE 요소는 mRNA 안정성을 증가시키고, 후속적으로 단백질 발현을 더 많이 하고, 따라서 활성이 증가되도록 하는 3차 구조를 창출하는 것으로 여겨진다. 예를 들어, 전사 종결 개선 및 mRNA 핵 방출 촉진을 포함하여 WPRE에 대한 다른 기능 메커니즘이 기술되었다. 반면에, SUMF1은 보다 활성이 큰 형태의 hIDS를 생성하지만, WPRE 요소에 의해 발현되는 hIDS의 양은 훨씬 더 많다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.

결과에서 hIDS-IRES-SUMF1 벡터에 비해, hIDS-WPRE 벡터의 발현 시, IDS 효소 수준 및 활성이 더 높음을 보여주었다.

실시예 7. 마우스의 생체 내 혈청 및 조직에서 rAAV 구동된 hIDS-WPRE의 장기적-발현

본 실시예는 hIDS-WPRE의 3가지 투여분량 중 하나가 투여된 마우스에서 hIDS의 생체내 발현 및 활성을 비교한다. 발현 수준 및 활성은 혈청 및 조직에서 약 12-13개월에 걸쳐 평가되었다.

마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026)를 발현시키는 rAAV 벡터를 5x 10⁹vg (그룹 D), 2.5x 10¹⁰vg (그룹 E), 1.25x 10¹¹vg (그룹 F)의 투여분량으로 주사하였고, 그리고 음성 대조군으로 무효(null) 벡터 구조체 rAAV-MY011를 1.25x 10¹¹vg (그룹 G)의 투여분량으로 마우스에게 주사하였다. 이들 구조체의 개략도는 도 1B 및 도 2에서 도시된다.

5~7-주령의 마우스에게 꼬리 정맥을 통하여 200μl의 용적으로 벡터를 제공하였고, 주사-후 혈청 샘플은 7일, 14일, 28일, 56일, 84일, 112일, 140일, 168일, 196일, 224일, 252일, 280일, 308일, 336일, 및 364일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 7에서 요약된다.

표 7. rAAV 벡터들을 이용하고, 12개월에 걸쳐 모니터링된 예시적인 생체내 연구

혈청 hI2S 수준 및 활성: 혈청 hI2S의 발현 수준은 ELISA에 의해 측정되었다. 도 10에 그 결과를 도시한다. hI2S의 농도는 rAAV-XL026 벡터(그룹 D, E, F)의 투여분량이 증가함에 따라 증가했으며, hI2S는 주사-후 364일차의 최종 시점까지 검출 가능한 상태로 유지되었다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.

도 11에 나타낸 것과 같이, hI2S 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. hI2S의 활성 농도는 rAAV-XL026 벡터(그룹 D, E, F)의 투여분량이 증가함에 따라 증가했으며, hI2S 활성은 주사-후 364일차의 최종 시점까지 검출 가능한 상태로 유지되었다.

조직 hI2S 수준 및 활성: 조직에서, hI2S는 ELISA를 이용하여 측정되었다(도 12A에 나타냄). rAAV-XL026 (그룹 D, E, F)의 경우, 간, 비장, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였고, 그리고 투여분량 증가에 따라 증가되었다.

조직에서, hI2S 활성은 도 12B에서 나타낸 바와 같이 측정되었다. rAAV-XL026 (그룹 D, E, F)의 경우, 간, 비장, 신장, 심장, 비장, 및 뇌에서 hI2S 활성이 검출가능하였고, 그리고 투여분량 증가에 따라 증가되었다.

표 7에 나타낸 마우스 그룹으로부터 364일차 시점에서 추출된 간, 신장, 심장, 비장, 폐 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. 결과는 도 12C에 나타낸다.

체세포 조직에서, 모든 투여분량(그룹 D, E, F)에서 rAAV-XL026은 HS 및 DS GAG 수준을 크게 감소시켰다. HS 및 DS GAG 수준은 도 12D와 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다. 3가지 투여 분량 모두에서, rAAV-XL026(그룹 D, E, F)은 모두 체세포 조직에서 HS 및 DS GAG의 100% 감소를 보여주었다. 뇌 HS에서, GAG는 rAAV-XL026 그룹 D의 경우 17% 감소되었고, rAAV-XL026 그룹 E의 경우 38% 감소되었고, 그리고, rAAV-XL026 그룹 F의 경우 50% 감소되었다.

다양한 조직, 이를 테면, 간 및 뇌 해마, 시상, 백질, 피질, 소뇌 및 선조체를 LAMP1에 대해 착색시켰다. 도 12E에서 뇌를 나타낸다. 처리안된 KO (그룹 H)와 비교하였을 때, LAMP1 양성 착색의 감소에 있어서, 해마의 경우 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F에서, 선조체의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 백질의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 시상의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 피질의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 그리고 소뇌의 경우 rAAV-XL026 그룹 E 및 그룹 F에서 통계적으로 유의미하였다.

골 용적: 마이크로-컴퓨터 단층 촬영(마이크로-CT)을 사용하여 신체 구조를 조사했다. 도 13A 및 도 13B에 나타낸 바와 같이, 마이크로-CT를 사용하여 마우스의 7-월령, 9-월령, 11-월령 및 13월령에서 시간 경과에 따른 골 용적을 측정하였다.

도 13A 및 도 13B에서, 라인 A는 rAAV-XL026 그룹 D에 해당되며, 라인 B는 rAAV-XL026 그룹 E에 해당되며, 라인 C는 rAAV-XL026 그룹 F에 해당되며, 라인 D는 rAAV-MY011 그룹 G-음성 대조군-에 해당되며, 라인 E는 처리안된 IDS-KO 그룹 H-음성 대조군-에 해당되며, 그리고 라인 F는 처리안된 야생형 그룹 I-양성 대조군에 해당된다.

상완골(도 13A)에서, 양성 대조군 야생형 그룹 I에 대해 rAAV-XL026 그룹 D, 그룹 E 및 그룹 F의 골 용적을 겹쳐 놓았고, 그리고 이들 군의 골 용적은 음성 대조군 rAAV-MY011 그룹 G 및 처리되지 않은 IDS-KO 그룹 H보다 더 낮다.

13개월 시점에서 두개골의 관골궁 에서(도 13B), 양성 대조군 야생형 그룹 I에 대해 rAAV-XL026 그룹 D, 그룹 E 및 그룹 F의 골 용적을 겹쳐 놓았고, 그리고 이들 군의 골 용적은 음성 대조군 rAAV-MY011 그룹 G 및 처리되지 않은 IDS-KO 그룹 H보다 더 낮다.

이러한 결과는 I2S 발현 시 상완골과 관골궁 에서 골 용적이 더 낮았는데, 이것은 13개월 동안 유지되었다.

전반적으로, 이 결과에서 골 용적에 대한 혈청 및 조직 I2S 발현 및 활성 수준의 영향은 약 12-13개월 동안 유지되었음을 보여주었다.

실시예 8. 마우스에서 낮은 투여분량 투여-후, 3개월 동안 생체내에서 rAAV-구동된 hIDS-WPRE 발현 모니터링

본 실시예는 5 x 10⁶- 5 x 10⁹ vg의 투여분량으로 3개월에 걸쳐 hI2S를 투여한 마우스에서 hI2S의 생체내 발현 및 활성을 설명한다.

마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026)를 발현시키는 rAAV 벡터를 5x 10⁶vg (그룹 C), 5x 10⁷vg (그룹 D), 5x 10⁸vg (그룹 E), 5x 10⁹vg (그룹 F)의 투여분량으로 주사하였고, 그리고 음성 대조군으로 무효 벡터 구조체 rAAV-MY011를 5x 10⁹vg (그룹 B)의 투여분량으로 마우스에게 주사하였다.

5~7-주령의 마우스에게 꼬리 정맥을 통하여 200μl의 벡터를 제공하였고, 주사-후 혈청 샘플은 14일, 28일, 56일, 및 84일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 8에서 요약된다.

표 8. rAAV 벡터들을 이용하고, 3개월에 걸쳐 모니터링된 예시적인 생체내 연구

혈청 IDS 수준 및 활성: 낮은-투여분량의 hIDS-WPRE 벡터가 투여된 마우스의 혈청에서 hIDS의 발현 수준을 ELISA에 의해 결정하였고, 도 14A에 나타내었다. hI2S의 농도는 그룹 D, 그룹 E, 그룹 F의 경우, rAAV-XL026 벡터의 투여분량 감소에 따라 감소했으며, hI2S는 그룹 C에 대해 검출할 수 없었다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.

혈청 I2S 활성 수준은 도 14B에서와 같이 측정되었다. hI2S의 농도는 그룹 D, 그룹 E, 그룹 F의 경우, rAAV-XL026 벡터의 투여분량 감소에 따라 감소했으며, hI2S는 그룹 C에 대해 검출할 수 없었다.

전반적으로, 5 x 10⁸ vg 및 5 x 10⁹ vg의 투여분량이 투여된 그룹 D 및 그룹 E는 처리안된 마우스와 비교하여I2S 발현 및 활성이 증가되었고, I2S 수준 및 활성은 84 일 또는 3 개월에 걸쳐 유지되었다.

조직 I2S 수준 및 활성: ELISA로 측정하였을 때, 간, 비장, 신장, 심장, 폐, 골수, 대퇴사두근 및 뇌에서, 처리안된 KO (그룹 A) 및 처리안된 WT (그룹 J) 및 음성 대조군 rAAV-MY011(그룹 B) 그룹은 검출 가능한 인간 I2S (hI2S) 단백질을 함유하지 않았다 (도 14C). 5x 10⁷ vg ~ 5x 10⁹vg에서, 상기 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F는 투여분량의 증가에 따라 조직에서 증가된 hI2S 농도를 함유하였다.

I2S 활성은 도 14D에서 나타낸 바와 같이 간, 비장, 신장, 심장, 폐, 골수, 사두근, 및 뇌에서 측정되었다. 상기 rAAV-MY011 (그룹 B)은 모든 조직에서, 처리안된 KO (그룹 A)와 유사한 I2S 활성을 함유하였다. 5x 10⁷ vg ~ 5x10⁹에서, 상기 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F는 투여분량의 증가에 따라 조직에서 증가된 I2S 활성 농도를 함유하였다. 투여된 KO 마우스의 각 조직에서 I2S 활성 수준은 도 14E에 나타낸 바와 같이, 처리되지 않은 WT 수준과 비교될 수 있다.

조직 I2S수준 및 활성은 hI2S-WPRE를 포함하는 rAAV 벡터의 낮은-투여분량이 투여된 마우스에서 투여분량-의존적 방식으로 증가되었다.

조직 GAG 수준: 표 8에 나타낸 마우스 그룹으로부터 84일차 시점에서 추출된 간, 비장, 신장, 심장, 폐, 골수, 사두근, 피부, 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. HS 및 DS GAG 수준은 표 9 및 표 10과 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다.

5x 10⁸ vg의 rAAV-XL026의 그룹 E에서 측정된 모든 체세포 조직에서 HS 및 GAG 수준은 >90%까지 감소되었다. 뇌에서, 5x 10⁸ vg의 rAAV-XL026 그룹 E에서 뇌의 HS 및 GAG 수준은 차례로 8.8% 및 41%까지 감소되었다. 5x 10⁹ vg의 rAAV-XL026의 그룹 F에서 측정된 모든 체세포 조직에서 HS 및 GAG 수준은 >95%까지 감소되었다. 뇌에서, 5x 10⁹ vg의 rAAV-XL026 그룹 F에서 뇌의 HS 및 GAG 수준은 차례로 39% 및 78%까지 감소되었다.

HS 및 GAG 수준은 IDS-WPRE를 함유하는 5 x 10⁷, 5 x 10⁸ 또는 5 x 10⁹ vg의 rAAV 투여 시, 체세포 조직 및 뇌에서 감소했다.

표 9. 정규화된 HS GAG 감소

표 10. 정규화된 DS GAG 감소

리소좀 축적: 다양한 조직, 이를 테면, 간, 비장, 신장, 심장 및 뇌 해마, 시상, 백질, 피질, 소뇌 및 선조체를 LAMP1에 대해 착색시켰다. 체세포 조직은 도 14F에 나타낸다. 간, 비장 및 심장을 비롯한 체세포 조직에서, LAMP1 IHC 양성 착색은 rAAV-XL026 5x10⁷ vg 용량 그룹 D, 5x10⁸ vg 용량 그룹 E 및 5x10⁹ vg 용량 그룹 F에 대한 나이브(

) KO 대조군과 비교하여 유의미하게 감소했다. 신장에서, LAMP1 양성 착색은 rAAV-XL026 5x10⁸ vg 용량 그룹 E 및 5x10⁹ vg 용량 그룹 F에 대한 나이브 KO 대조군과 비교하여 유의미하게 감소했다.

뇌 영역에서의 LAMP1 IHC 착색은 도 14G에 나타나있다. 뇌에서, LAMP1 양성 착색은 해마, 선조체, 시상, 백질, 피질 및 소뇌에서 측정되었다. 이들 모든 영역에서, rAAV-XL026 투여분량 그룹 C, 그룹 D, 그룹 E 및 그룹 F에 대한 LAMP1 양성 착색은 처리안된 KO 대조군 A와 유의미적으로 상이하지 않았다.

이들 결과에서 IDS-WPRE 낮은-투여분량 투여 시, 체세포 조직에서 리소좀 축적이 감소했지만, 뇌에서는 유의미적으로 감소하지 않았음을 보여주었다.

전반적으로, 상기 결과에서는 마우스에서 hIDS-WPRE를 포함하는 낮은-투여분량의 rAAV 투여 시, 혈청 및 조직 I2S 발현 및 활성이 약 3개월에 걸쳐 유지되었고, 그리고 LAMP에 의해 결정된 바와 같이, 체세포 조직에서 리소좀 축적이 감소되었음을 보여주었다.

실시예 9. 인간이 아닌 영장류 (NHPs)에서 hI2S 이식유전자 산물의 혈청 발현 수준

본 실시예는 hI2S 이식유전자 산물이 투여된 인간이 아닌 영장류에서 예시적인 PK/분포 연구를 설명한다.

약 1.8세~ 2세의 인간이 아닌 수컷 영장류의 정맥내 주입을 통해 hI2S 산물을 투여했다. 낮은-투여분량 코호트 동물은 1.25 x 10¹² vg/kg(n=3)의 낮은-투여분량 hI2S를 제공받았고, 높은-투여분량 코호트 동물은 6.25 x 10¹² vg/kg(n=6)의 높은-투여분량 hI2S를 제공받았다. 대조군 동물은 오로지 제형 완충액만을 제공받았다.

혈청 샘플은 hI2S 이식유전자를 투여하기-전, 사전-투여분량부터 시작하여, 최대 240일차까지 매 20일마다 다양한 시점에서 샘플링으로 수집되었다. 낮은-투여분량 코호트 및 높은-투여분량 코호트로부터 각각 3마리의 동물을 3개월 시점에 희생시켰다.

도 15A는 NHP 혈청 투여-후 1일~3개월 부검에서 낮은-투여분량 코호트로부터의 hI2S 이식유전자 산물 혈청 농도를 도시한다. hI2S 이식유전자 산물의 지속적인 농도는 1.25 x 12 vg/kg(낮은-투여분량)에서 관찰되었다.

상응하게, 도 15B에서, 혈청 내 hI2S 이식유전자 산물 효소 활성은 최대 3개월까지 지속된 수준을 나타내었다. 3개월에서, 오로지 제형 완충액만을 받은 대조군 동물에서 측정된 NHP 내생성 I2S 활성 수준에 비해, 약 5-배 더 높은 수준의 I2S 효소 활성이 관찰되었다.

도 15C는 3개의 NHP 투여-후 1일 ~ 약 90일차 또는 3개월 부검에서, 높은-투여분량 코호트로부터의 hI2S 이식유전자 산물의 혈청 농도를 나타내는데, 투여-후 1일차~ 약 240일차 또는 8개월까지 3가지 높은-투여분량 동물에서 유지된다.

개별 동물들은 hI2S 이식유전자 산물의 가변적인 프로파일을 보여주었으며, 달성된 초기 최대 혈청 농도 수준에서 가변성이 관찰되었다. hI2S 이식유전자 산물 혈청 농도의 급격한 감소가 동물에서 관찰되었고, 이는 3-개월 부검까지 추적관찰되었다. 혈청에서 상응하는 hI2S 효소 활성은 증가를 나타내었다가, 그 다음 21일차 이후 약 5200-7500 nmol/hr/mL의 안정기 수준으로 감소하였고 (도 15D), I2S 이식유전자 산물 농도가 3개월차 시점에 종료된 3마리의 동물에서 감소되었음에도 불구하고, 혈청에서 지속적인 hI2S 효소 활성을 입증했다.

혈청 hI2S 이식유전자 산물 농도 및 혈청 I2S 활성을 ~ 약 240 일 (8 개월)까지 추적한 동물들은 이들의 hI2S 이식유전자 산물 농도 프로파일에서 가변성을 보였다. 2마리의 동물에서 약 8개월까지 I2S 이식유전자 산물 농도가 약 100ng/mL 이하로 감소하는 것으로 나타났다. 이것은 hI2S 효소 활성이 약 8개월까지 내생성 수준(제제 완충액)까지 관찰된 감소와 또한 관련있었다. 이 연구에서 동물 중 한 마리 동물은 약 8개월까지 지속적인 hI2S 이식유전자 산물 농도와 효소 활성을 보여주었다.

전반적으로, 이들 데이터에서 면역억제제가 없는 경우에도, hI2S 이식유전자 산물의 지속적인 발현이 인간이 아닌 영장류에서 달성되었음을 입증되었다.

실시예 10. 항-이식유전자 산물 항체 (a.k.a. 항-hI2S ADA (항-약물 항체)) 및 항-AAV8 ADA 적덩에 대해 낮은-투여분량 및 높은-투여분량의 인간이 아닌 영장류에서 hI2S 이식유전자 산물의 혈청 농도 및 I2S 효소 활성 비교

본 실시예는 hI2S 이식유전자 생성물 농도 및 효소 활성으로 플롯팅된 개별 인간이 아닌 영장류로부터의 항-hI2S ADA와 항-AAV8 ADA 데이터 간의 비교를 설명한다.

개별 동물로부터의 항-hI2S ADA 및 항-AAV8 ADA 데이터를 hI2S 이식유전자 산물 농도 및 효소 활성에 대해 플롯팅하였다 (도 16). 이 그래프에는 최대 3개월의 ADA 데이터만 표시되었다. hI2S 수준의 초기 감소는 일부 동물(2001, 3002, 4003, 4001 및 4002)에서 항-hI2S ADA가 없는 상태에서, 첫 달 이내에 관찰되었다. hI2S 수준의 감소는 투여분량-의존적이지 않았다. NHP 혈청에서 hI2S 이식유전자 산물 농도의 초기 감소(첫 달 이내)는 동물마다 다양했다(10% - 80%).

평형 상태 후, 혈청에서 hI2S 이식유전자 산물의 감소는 높은-투여분량의 hI2S를 제공받았던 코호트에서 항-hI2S ADA의 존재와 상관관계가 있었다. "평형 상태" 또는 "재-확립된 상태"란 I2S 효소 또는 I2S 효소 활성의 "항정 상태(steady state)" 또는 정점(plateau) 수준을 지칭한다. 일부 동물 (3002 및 4001)에서 항-AAV8 ADA의 존재는 재-투여를 막을 수 있다. 낮은-투여분량 코호트의 동물 중 어느 동물의 혈청에서도 항-hI2S ADA가 존재하지 않았다.

이들 결과는 혈청 I2S 수준의 감소가 hIDS-WPRE를 포함하는 높은-투여분량의 rAAV-XL026을 제공받았던 인간이 아닌 영장류에서 항-hI2S ADA의 존재와 상관관계가 있음을 보여주었다.

실시예 11. 개별 인간이 아닌 영장류의 간 hI2S 이식유전자 산물 농도 프로파일

본 실시예는 인간이 아닌 영장류의 간에서 hI2S 이식유전자 산물 농도 프로파일을 도시한다.

1개월 및 2개월 시점에 낮은-투여분량 (도 17A) 및 높은-투여분량 (도 17B) 동물 모두에서 간 생검을 수행하였고, 3개월차 시점에서 최종 간 샘플을 수집하였다. 12개월차 부검이 계획된 높은-투여분량 코호트로부터 3마리 동물은 3개월 및 6개월차에 생검을 받았다.

각 생검은 좌측 엽과 우측 엽에서 수행되었다. 낮은-투여분량 코호트의 간에서 좌엽과 우엽 사이의 평균 hI2S 이식유전자 산물 농도는 1개월~3개월 사이에 평균 38.2ng/mL~42.5ng/mL 범위였다.

높은-투여분량 코호트의 간에서 hI2S 이식유전자 산물 농도는 1개월 시점에서 175.1ng/mL~367.6ng/mL 범위였다. 동물 중 한 마리 동물(동물 3001)은 좌엽(101.8ng/mL)과 우엽(528.3ng/mL) 간에 큰 차이를 보였다.

2개월 시점에서, 두 동물(동물 3001 및 동물 3002)들이 1개월에서 2개월까지 간 hI2S 이식유전자 산물 농도의 급격한 감소를 나타냈다. 동물 3003을 비롯한, 다른 동물들도 2개월에서 6개월까지 감소했지만, 그 정도는 적었다.

전반적으로, 이러한 결과들은 rAAV-XL026의 투여-후, 1 개월 내지 3개월 시점의 인간이 아닌 영장류 조직에서 I2S 이식유전자 산물의 개별 농도 프로파일을 보여주었다.

실시예 12. 인간이 아닌 영장류 조직에서 hI2S 이식유전자 산물의 농도 비교 프로파일

본 실시예는 인간이 아닌 영장류 조직에서 hI2S 이식유전자 산물의 농도 비교 프로파일을 설명한다.

3개월차 시점에 낮은-투여분량 코호트의 동물과 높은-투여분량 코호트로부터 3마리 동물에 대해 조직 부검을 수행했다.

hI2S 이식유전자 산물 농도는 신장, 비장, 폐, 심장 및 골수를 비롯한, 다양한 기관의 조직 균질액에서 ELISA에 의해 측정되었다. 3개월차 시점에서, 높은-투여분량 코호트의 혈청 내 hI2S 이식유전자 산물 농도는 낮은-투여분량 코호트(>640ng/mL)와 비교할 때, 항-hI2S ADA의 존재 하에 유의하게 더 낮은 수준(<250ng/mL)을 나타내었지만, 신장(도 18A) 및 비장(도 18B)에서 평균 hI2S 농도는 더 낮은-투여분량 코호트보다 높은-투여분량 코호트에서 더 높은 수준을 나타냈다.

항-hI2S ADA 존재 하에서, 높은-투여분량 코호트의 3마리 동물은 폐(도 18C) 및 심장(도 18D)에서 더 낮은 hI2S 이식유전자 생성물 농도를 나타내었고, 한편으로, 골수에서(도 18E), 높은-투여분량 코호트와 낮은-투여분량 코호트의 동물간에 hI2S 조직 농도는 필적하였다. 상기 조직들이 건강한 NHP에서 유래했기 때문에, 내생성 I2S는 예를 들어, 폐의 제형 완충액 그룹에서 검출된다.

이들 결과는 rAAV-XL026로 처리-후, 인간이 아닌 영장류의 상이한 조직들에서 I2S의 농도 비교 프로파일을 보여주었다.

실시예 13. IDS 녹아웃 마우스와 비교하여, 인간이 아닌 영장류에서 hI2S 조직 노출 비교

본 실시예는 인간이 아닌 영장류와 IDS KO 마우스들간의 다양한 표적 조직에서 I2S 농도 및 효소 활성을 비교-설명한다.

IDS KO 마우스에서 2.5x10¹¹vg/kg 및 2.5x10¹⁰vg/kg에서 hI2S 조직 효소 활성 및 상응하는 HS GAG 감소 백분율을 표 11에 나타낸다.

마우스에서, 약 91%의 감소가 관찰된 신장을 제외하고, 대부분의 조직들의 경우, 약 2.5x10¹⁰ vg/kg의 투여분량에서 95% 이상의 HS GAG 감소가 관찰되었다. 심장 및 골수에서, 인간이 아닌 영장류의 낮은-투여분량 코호트 데이터는 2.5x10¹⁰ vg/kg에서 IDS KO 마우스보다 더 높은 hI2S 조직 농도와 효소 활성을 보여주었다.

IDS KO 마우스의 폐 조직에서, WT I2S 효소 활성은 겨우 30%이었지만, 여전히 이 수준은 97%의 HS GAG 감소를 보여주었다. 인간이 아닌 영장류에서, 낮은 투여분량의 hI2S가 투여될 때, 폐에서 효소 활성은 40%를 나타내고, 이것은 WT hI2S 효소 활성보다 더 큰 %이었다. 1.25 x 10¹²vg/kg로 IV 주입을 통하여 NHP에게 rAAV-XL026을 투여함으로써, 폐에 hI2S 이식유전자 산물을 충분히 노출시키면, 이 질환 모델에서 HS GAG를 ≥95%로 감소시킬 수 있다.

표 11. 녹아웃 마우스와 인간이 아닌 영장류에서 hI2S 농도와 효소 활성 및 GAG 감소의 비교.

균등물 및 범위

당업자는 일상적인 실험을 사용하여 본 명세서에 기재된 본 발명의 특정 구체예에 대한 많은 등가물을 인식하거나 또는 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명에 제한되지 않으며, 그보다는 첨부한 청구범위에 제시된 바와 같다:

SEQUENCE LISTING <110> TAKEDA PHARMACEUTICAL COMPANY LIMITED <120> Adeno Associated Virus Vectors for the Treatment of Hunter Disease <130> 3817.147PC01 <140> PCT/US20/63887 <141> 2020-12-09 <150> 62/945,920 <151> 2019-12-10 <160> 24 <170> PatentIn version 3.5 <210> 1 <211> 525 <212> PRT <213> Homo sapiens <400> 1 Ser Glu Thr Gln Ala Asn Ser Thr Thr Asp Ala Leu Asn Val Leu Leu 1 5 10 15 Ile Ile Val Asp Asp Leu Arg Pro Ser Leu Gly Cys Tyr Gly Asp Lys 20 25 30 Leu Val Arg Ser Pro Asn Ile Asp Gln Leu Ala Ser His Ser Leu Leu 35 40 45 Phe Gln Asn Ala Phe Ala Gln Gln Ala Val Cys Ala Pro Ser Arg Val 50 55 60 Ser Phe Leu Thr Gly Arg Arg Pro Asp Thr Thr Arg Leu Tyr Asp Phe 65 70 75 80 Asn Ser Tyr Trp Arg Val His Ala Gly Asn Phe Ser Thr Ile Pro Gln 85 90 95 Tyr Phe Lys Glu Asn Gly Tyr Val Thr Met Ser Val Gly Lys Val Phe 100 105 110 His Pro Gly Ile Ser Ser Asn His Thr Asp Asp Ser Pro Tyr Ser Trp 115 120 125 Ser Phe Pro Pro Tyr His Pro Ser Ser Glu Lys Tyr Glu Asn Thr Lys 130 135 140 Thr Cys Arg Gly Pro Asp Gly Glu Leu His Ala Asn Leu Leu Cys Pro 145 150 155 160 Val Asp Val Leu Asp Val Pro Glu Gly Thr Leu Pro Asp Lys Gln Ser 165 170 175 Thr Glu Gln Ala Ile Gln Leu Leu Glu Lys Met Lys Thr Ser Ala Ser 180 185 190 Pro Phe Phe Leu Ala Val Gly Tyr His Lys Pro His Ile Pro Phe Arg 195 200 205 Tyr Pro Lys Glu Phe Gln Lys Leu Tyr Pro Leu Glu Asn Ile Thr Leu 210 215 220 Ala Pro Asp Pro Glu Val Pro Asp Gly Leu Pro Pro Val Ala Tyr Asn 225 230 235 240 Pro Trp Met Asp Ile Arg Gln Arg Glu Asp Val Gln Ala Leu Asn Ile 245 250 255 Ser Val Pro Tyr Gly Pro Ile Pro Val Asp Phe Gln Arg Lys Ile Arg 260 265 270 Gln Ser Tyr Phe Ala Ser Val Ser Tyr Leu Asp Thr Gln Val Gly Arg 275 280 285 Leu Leu Ser Ala Leu Asp Asp Leu Gln Leu Ala Asn Ser Thr Ile Ile 290 295 300 Ala Phe Thr Ser Asp His Gly Trp Ala Leu Gly Glu His Gly Glu Trp 305 310 315 320 Ala Lys Tyr Ser Asn Phe Asp Val Ala Thr His Val Pro Leu Ile Phe 325 330 335 Tyr Val Pro Gly Arg Thr Ala Ser Leu Pro Glu Ala Gly Glu Lys Leu 340 345 350 Phe Pro Tyr Leu Asp Pro Phe Asp Ser Ala Ser Gln Leu Met Glu Pro 355 360 365 Gly Arg Gln Ser Met Asp Leu Val Glu Leu Val Ser Leu Phe Pro Thr 370 375 380 Leu Ala Gly Leu Ala Gly Leu Gln Val Pro Pro Arg Cys Pro Val Pro 385 390 395 400 Ser Phe His Val Glu Leu Cys Arg Glu Gly Lys Asn Leu Leu Lys His 405 410 415 Phe Arg Phe Arg Asp Leu Glu Glu Asp Pro Tyr Leu Pro Gly Asn Pro 420 425 430 Arg Glu Leu Ile Ala Tyr Ser Gln Tyr Pro Arg Pro Ser Asp Ile Pro 435 440 445 Gln Trp Asn Ser Asp Lys Pro Ser Leu Lys Asp Ile Lys Ile Met Gly 450 455 460 Tyr Ser Ile Arg Thr Ile Asp Tyr Arg Tyr Thr Val Trp Val Gly Phe 465 470 475 480 Asn Pro Asp Glu Phe Leu Ala Asn Phe Ser Asp Ile His Ala Gly Glu 485 490 495 Leu Tyr Phe Val Asp Ser Asp Pro Leu Gln Asp His Asn Met Tyr Asn 500 505 510 Asp Ser Gln Gly Gly Asp Leu Phe Gln Leu Leu Met Pro 515 520 525 <210> 2 <211> 550 <212> PRT <213> Homo sapiens <400> 2 Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val 1 5 10 15 Leu Ser Ser Val Cys Val Ala Leu Gly Ser Glu Thr Gln Ala Asn Ser 20 25 30 Thr Thr Asp Ala Leu Asn Val Leu Leu Ile Ile Val Asp Asp Leu Arg 35 40 45 Pro Ser Leu Gly Cys Tyr Gly Asp Lys Leu Val Arg Ser Pro Asn Ile 50 55 60 Asp Gln Leu Ala Ser His Ser Leu Leu Phe Gln Asn Ala Phe Ala Gln 65 70 75 80 Gln Ala Val Cys Ala Pro Ser Arg Val Ser Phe Leu Thr Gly Arg Arg 85 90 95 Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn Ser Tyr Trp Arg Val His 100 105 110 Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr Phe Lys Glu Asn Gly Tyr 115 120 125 Val Thr Met Ser Val Gly Lys Val Phe His Pro Gly Ile Ser Ser Asn 130 135 140 His Thr Asp Asp Ser Pro Tyr Ser Trp Ser Phe Pro Pro Tyr His Pro 145 150 155 160 Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr Cys Arg Gly Pro Asp Gly 165 170 175 Glu Leu His Ala Asn Leu Leu Cys Pro Val Asp Val Leu Asp Val Pro 180 185 190 Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr Glu Gln Ala Ile Gln Leu 195 200 205 Leu Glu Lys Met Lys Thr Ser Ala Ser Pro Phe Phe Leu Ala Val Gly 210 215 220 Tyr His Lys Pro His Ile Pro Phe Arg Tyr Pro Lys Glu Phe Gln Lys 225 230 235 240 Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala Pro Asp Pro Glu Val Pro 245 250 255 Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro Trp Met Asp Ile Arg Gln 260 265 270 Arg Glu Asp Val Gln Ala Leu Asn Ile Ser Val Pro Tyr Gly Pro Ile 275 280 285 Pro Val Asp Phe Gln Arg Lys Ile Arg Gln Ser Tyr Phe Ala Ser Val 290 295 300 Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu Leu Ser Ala Leu Asp Asp 305 310 315 320 Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala Phe Thr Ser Asp His Gly 325 330 335 Trp Ala Leu Gly Glu His Gly Glu Trp Ala Lys Tyr Ser Asn Phe Asp 340 345 350 Val Ala Thr His Val Pro Leu Ile Phe Tyr Val Pro Gly Arg Thr Ala 355 360 365 Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe Pro Tyr Leu Asp Pro Phe 370 375 380 Asp Ser Ala Ser Gln Leu Met Glu Pro Gly Arg Gln Ser Met Asp Leu 385 390 395 400 Val Glu Leu Val Ser Leu Phe Pro Thr Leu Ala Gly Leu Ala Gly Leu 405 410 415 Gln Val Pro Pro Arg Cys Pro Val Pro Ser Phe His Val Glu Leu Cys 420 425 430 Arg Glu Gly Lys Asn Leu Leu Lys His Phe Arg Phe Arg Asp Leu Glu 435 440 445 Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg Glu Leu Ile Ala Tyr Ser 450 455 460 Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln Trp Asn Ser Asp Lys Pro 465 470 475 480 Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr Ser Ile Arg Thr Ile Asp 485 490 495 Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn Pro Asp Glu Phe Leu Ala 500 505 510 Asn Phe Ser Asp Ile His Ala Gly Glu Leu Tyr Phe Val Asp Ser Asp 515 520 525 Pro Leu Gln Asp His Asn Met Tyr Asn Asp Ser Gln Gly Gly Asp Leu 530 535 540 Phe Gln Leu Leu Met Pro 545 550 <210> 3 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 3 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120 aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180 ccccagttat cggaggagca aacaggggct aagtccac 218 <210> 4 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 4 aaatgaccta ttaagaatat ttcatagaac gaatgttccg atgctctaat ctctctagac 60 aaggttcata tttgtatggg ttacttattc tctctttgtt gactaagtca ataatcagaa 120 tcagcaggtt tgcagtcaga ttggcaggga taagcagcct agctcaggag aagtgagtat 180 aaaagcccca ggctgggagc agccatcaca gaagtccact cattcttggc agg 233 <210> 5 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 5 ctaaggtaag ttggcgccgt ttaagggatg gttggttggt ggggtattaa tgtttaatta 60 ccttttttac aggcctg 77 <210> 6 <211> 1653 <212> DNA <213> Homo sapiens <400> 6 atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60 tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120 ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180 tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240 caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300 cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360 cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420 atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480 tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540 aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600 agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660 ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720 ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780 cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840 atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900 tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960 cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020 gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080 ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140 ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200 gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260 cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320 cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380 attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440 agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500 gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560 gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620 ggtggagatc ttttccagtt gttgatgcct tga 1653 <210> 7 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 7 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctttgttgct 60 ccttttacgc tttgtggata cgctgcttta ttgcctttgt atcttgctat tgcttcccgt 120 ttggctttca ttttctcctc cttgtataaa tcctggttgc tgtctctttt tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca tc 592 <210> 8 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 8 cctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 60 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 120 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 180 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggaa 234 <210> 9 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 9 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag aga 133 <210> 10 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 10 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 11 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Synethetic Polynucleotide <400> 11 atgccaccac ctaggacagg caggggcctg ctttggcttg gactggtgct gagctctgtc 60 tgtgttgccc tgggctccga gacccaagcc aactctacaa ccgatgctct caatgttctg 120 ctcatcatag tggatgacct gcggccctct ctaggctgct atggagacaa gttggtgcgg 180 agccccaaca tagaccagct agcctctcac tccctgctgt tccagaatgc cttcgcccag 240 caagctgtgt gcgccccctc tagagtgtct ttcctgaccg ggagaaggcc tgatacaaca 300 aggctgtatg actttaacag ctactggagg gtgcacgcag gcaacttctc cactatcccc 360 caatacttca aggagaatgg ctatgtgacc atgagcgtgg gcaaggtctt ccaccctgga 420 atctcctcca accacactga tgatagtccc tactcttggt cttttcctcc ctatcaccct 480 agcagtgaga agtatgagaa caccaaaacc tgcagaggcc ctgatgggga gctgcatgct 540 aacctcctgt gtcctgtaga tgtgctggac gtcccagagg gcaccttgcc agataagcag 600 tctactgagc aggctatcca gctgcttgag aaaatgaaga cttctgcatc tcccttcttt 660 ctggctgttg gctaccacaa gcctcacatc cccttcaggt accctaagga gttccaaaag 720 ctctatcctc tggaaaacat cacacttgcc cccgatcctg aggtccctga cggcctccca 780 ccagtagcct acaatccttg gatggacatt aggcagagag aggatgtcca ggctctgaat 840 atttctgtgc cctatgggcc catcccggtg gacttccagc gcaaaatcag acagtcctac 900 tttgcctctg tgagctatct ggacacccag gttgggaggc tcctctccgc ccttgacgac 960 ctccagttgg ccaacagcac cattatagcc ttcacctctg accacggctg ggcactgggg 1020 gaacacgggg agtgggctaa gtactctaac tttgatgtgg ccacccacgt gcccctcatc 1080 ttttatgtgc ctggcaggac tgccagcctg cccgaagctg gggaaaaact gtttccatac 1140 ctggaccctt ttgacagtgc ttctcagctc atggaacctg gccgtcagag catggatctg 1200 gtggagctag tgtccctctt cccaaccttg gctggccttg ctggtctcca ggtgcctcct 1260 agatgcccag tcccctcctt ccatgttgaa ctctgccgtg aggggaagaa tctgctgaag 1320 cacttcagat tcagagactt ggaggaggac ccctaccttc ctgggaaccc cagggagttg 1380 attgcatact cccagtatcc caggccaagt gacattcccc agtggaactc cgacaaacca 1440 agtctgaagg acatcaagat catggggtac agcatcagga ccattgacta cagatacaca 1500 gtgtgggttg gatttaaccc agatgagttc ttggcaaact tttctgacat ccatgcaagt 1560 cagttgtatt ttgtggacag cgaccctctg caggatcaca acatgtacaa tgacagccag 1620 ggtggggacc tctttcaact cctcatgcca tag 1653 <210> 12 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 12 atgccacccc cccggaccgg gagaggcctc ttgtggttgg gcctggtgct gagcagcgtg 60 tgcgtggccc tgggcagtga gacccaggct aactctacaa cagatgcctt gaatgtgctg 120 ctgatcattg tggatgacct gaggccaagt ctgggctgct atggggacaa attggtgagg 180 tcccccaaca tcgaccagtt ggcctcccac tctctcctat tccaaaatgc tttcgcccag 240 caggcagttt gtgccccctc tagggtgagc ttcctcactg gcaggcgccc tgacaccact 300 agactgtatg actttaacag ctattggagg gtgcacgcag gaaacttctc cacaatccct 360 caatacttca aggagaatgg ttatgtgaca atgtctgtgg gcaaggtgtt ccaccctggc 420 atcagcagca accacaccga tgactcaccc tatagttggt cttttccccc ctaccatcct 480 tcatctgaga aatatgaaaa cacaaaaacc tgccgaggcc cagacgggga actgcatgcc 540 aacctactct gtcctgttga tgtactggac gtgcccgagg gcaccctccc tgataagcag 600 tccacagaac aggccattca gctgcttgaa aagatgaaga cctccgcatc ccccttcttc 660 ttggctgtcg gctaccacaa gccccatatc ccctttagat accccaagga attccagaaa 720 ctgtacccac tggagaacat cacacttgct cctgaccctg aagtgcctga cggactgcct 780 ccagtggcct ataacccttg gatggacatc cggcagcgcg aggatgtgca ggctctgaac 840 attagtgtgc cttatgggcc catccctgtg gactttcaga ggaagattcg ccagtcctac 900 tttgcctctg tatcctacct ggacacacag gtgggacgcc tgctgtctgc ccttgatgat 960 ctgcaactgg ccaacagcac cattatagct ttcacatcag accatgggtg ggctcttggg 1020 gagcatggtg aatgggctaa gtactccaac ttcgatgtgg caacccatgt ccctctgatc 1080 ttctatgtgc caggaaggac cgcctctctg ccagaggcag gtgagaagct gttcccctat 1140 ctggaccctt ttgactccgc cagccagctg atggagcctg gccgacagtc tatggacctg 1200 gttgagctgg tcagcctgtt tcccacactc gctggactgg ctggcctgca agtaccccca 1260 cgctgcccag tgccctcctt ccatgtggag ctttgcaggg aggggaagaa cctcctcaag 1320 cacttcaggt tcagggacct agaggaggat ccttatctgc ctggaaaccc cagagagctt 1380 attgcttact cccagtatcc aaggcctagt gacattcccc aatggaactc agacaaacca 1440 agcctgaaag acatcaagat catgggatac tctatcagga ccattgacta caggtacact 1500 gtgtgggttg gcttcaaccc ggatgagttc ctggctaatt tctctgacat acatgctggc 1560 gagctgtact tcgtggacag tgaccccctg caggatcaca acatgtacaa tgattcccag 1620 gggggtgacc tcttccagct tctgatgccc taa 1653 <210> 13 <211> 575 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 13 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360 acgttgtgag ttggatagtt gtggaaagag tcaaatggct cacctcaagc gtattcaaca 420 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480 gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540 ggacgtggtt ttcctttgaa aaacacgatg ataat 575 <210> 14 <211> 1125 <212> DNA <213> Homo sapiens <400> 14 atggctgcgc ccgcactagg gctggtgtgt ggacgttgcc ctgagctggg tctcgtcctc 60 ttgctgctgc tgctctcgct gctgtgtgga gcggcaggga gccaggaggc cgggaccggt 120 gcgggcgcgg ggtcccttgc gggttcttgc ggctgcggca cgccccagcg gcctggcgcc 180 catggcagtt cggcagccgc tcaccgatac tcgcgggagg ctaacgctcc gggccccgta 240 cccggagagc ggcaactcgc gcactcaaag atggtcccca tccctgctgg agtatttaca 300 atgggcacag atgatcctca gataaagcag gatggggaag cacctgcgag gagagttact 360 attgatgcct tttacatgga tgcctatgaa gtcagtaata ctgaatttga gaagtttgtg 420 aactcaactg gctatttgac agaggctgag aagtttggcg actcctttgt ctttgaaggc 480 atgttgagtg agcaagtgaa gaccaatatt caacaggcag ttgcagctgc tccctggtgg 540 ttacctgtga aaggcgctaa ctggagacac ccagaagggc ctgactctac tattctgcac 600 aggccggatc atccagttct ccatgtgtcc tggaatgatg cggttgccta ctgcacttgg 660 gcagggaagc ggctgcccac ggaagctgag tgggaataca gctgtcgagg aggcctgcat 720 aatagacttt tcccctgggg caacaaactg cagcccaaag gccagcatta tgccaacatt 780 tggcagggcg agtttccggt gaccaacact ggtgaggatg gcttccaagg aactgcgcct 840 gttgatgcct tccctcccaa tggttatggc ttatacaaca tagtggggaa cgcatgggaa 900 tggacttcag actggtggac tgttcatcat tctgttgaag aaacgcttaa cccaaaaggt 960 cccccttctg ggaaagaccg agtgaagaaa ggtggatcct acatgtgcca taggtcttat 1020 tgttacaggt atcgctgtgc tgctcggagc cagaacacac ctgatagctc tgcttcgaat 1080 ctgggattcc gctgtgcagc cgaccgcctg cccactatgg actga 1125 <210> 15 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 15 atggctgctc ctgccctggg gctggtgtgt ggaagatgtc ctgaactggg cctggttctg 60 ttactgcttc tgctcagcct gctctgtggt gctgccggca gccaagaggc aggcactggc 120 gctggagctg gaagcctggc tgggtcttgt ggatgtggca caccacagag gccaggggct 180 catggctcct ctgctgcagc tcataggtac agcagagaag ccaatgctcc aggcccagtg 240 cctggagaga gacagctggc tcacagcaag atggtgccca tccctgctgg ggtgttcaca 300 atgggaacag atgatcccca gatcaagcag gatggggagg cgcctgccag gagggtgacc 360 attgatgcat tctatatgga tgcctatgag gtgagcaata cagaatttga gaagtttgtg 420 aactctactg gctacctgac tgaggctgaa aaatttggag actcttttgt gtttgaagga 480 atgcttagtg aacaggttaa gaccaacatc cagcaggctg ttgcagcagc cccctggtgg 540 ttgcctgtca agggagctaa ctggaggcac cctgagggac cagattctac aatcctgcat 600 agacctgatc atcctgttct gcatgtgtct tggaatgatg ctgtggctta ctgtacctgg 660 gcaggaaaaa ggctgccaac agaagctgag tgggaatact cttgcagagg aggcctgcac 720 aatagactgt tcccatgggg caacaagctg caacccaagg gccagcacta tgctaacatc 780 tggcagggag aattccctgt gacaaacaca ggagaggacg gcttccaggg aactgcccct 840 gtagatgctt tccctcctaa tggctatggc ctgtataaca ttgttggcaa cgcctgggag 900 tggacttctg attggtggac agtgcaccac tctgttgagg agacactgaa tcctaagggg 960 ccaccttctg gaaaggatag agtgaagaag gggggaagct acatgtgcca caggtcttat 1020 tgttacagat acaggtgcgc tgctaggtct cagaacaccc ctgatagcag tgctagcaat 1080 ctgggcttca ggtgtgccgc tgacagactg cctaccatgg attaa 1125 <210> 16 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 16 atggctgccc ctgctctggg attggtttgt ggcagatgtc ctgagcttgg tctggtgctg 60 ttgctccttc tgttgtctct gctgtgtgga gcagctgggt ctcaggaagc tggcacaggc 120 gctggggctg gctctctggc cgggtcatgt ggctgtggaa ctccccagcg gcctggagcc 180 catggcagct ctgccgcagc acacaggtat tctagggaag ccaatgcccc aggccctgtg 240 cctggggaga gacagctagc tcattctaag atggtgccta tcccagccgg ggtttttaca 300 atgggcactg atgatcctca gattaagcag gatggagagg cccccgccag aagagtgacc 360 attgatgctt tctacatgga tgcatatgaa gtgtccaaca cagagtttga gaaatttgtg 420 aactctactg gatacttgac cgaggctgag aagtttggag attcctttgt ctttgaaggc 480 atgctgtctg agcaggtcaa gaccaacatt cagcaagcag tggccgctgc accttggtgg 540 cttcctgtga agggcgccaa ctggagacat ccagaggggc cagatagtac catcctccac 600 agacctgatc acccagtcct tcatgtttcc tggaatgatg cagttgctta ctgcacttgg 660 gccggcaaga ggctccctac tgaggcagag tgggaatact cctgcagagg aggcctgcac 720 aacagactgt tcccttgggg gaacaagctt cagcccaaag gccagcacta tgctaacatc 780 tggcagggtg agtttccagt caccaataca ggggaggacg gattccaggg aaccgcacca 840 gtagatgcct tccctcctaa tggctatggc ctgtataata ttgtgggcaa tgcatgggag 900 tggacctctg actggtggac tgtgcaccac tcagtggagg aaaccctgaa ccctaaggga 960 cccccttcag gcaaagatag agtcaaaaag ggagggagct atatgtgtca cagatcctat 1020 tgctacagat atagatgtgc agccaggtcc cagaacaccc ctgactcttc tgctagcaac 1080 ctgggctttc ggtgtgctgc tgatagactg cccaccatgg actaa 1125 <210> 17 <211> 9854 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 17 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccgccaccc cggaccggcc 720 gaggccttct ctggctgggt ctggttctga gctccgtctg cgtcgccctc ggatccgaaa 780 cgcaggccaa ctcgaccaca gatgctctga acgttcttct catcatcgtg gatgacctgc 840 gcccctccct gggctgttat ggggataagc tggtgaggtc cccaaatatt gaccaactgg 900 catcccacag cctcctcttc cagaatgcct ttgcgcagca agcagtgtgc gccccgagcc 960 gcgtttcttt cctcactggc aggagacctg acaccacccg cctgtacgac ttcaactcct 1020 actggagggt gcacgctgga aacttctcca ccatccccca gtacttcaag gagaatggct 1080 atgtgaccat gtcggtggga aaagtctttc accctgggat atcttctaac cataccgatg 1140 attctccgta tagctggtct tttccacctt atcatccttc ctctgagaag tatgaaaaca 1200 ctaagacatg tcgagggcca gatggagaac tccatgccaa cctgctttgc cctgtggatg 1260 tgctggatgt tcccgagggc accttgcctg acaaacagag cactgagcaa gccatacagt 1320 tgttggaaaa gatgaaaacg tcagccagtc ctttcttcct ggccgttggg tatcataagc 1380 cacacatccc cttcagatac cccaaggaat ttcagaagtt gtatcccttg gagaacatca 1440 ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac aacccctgga 1500 tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg tatggtccaa 1560 ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg tcatatttgg 1620 atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc aacagcacca 1680 tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa tgggccaaat 1740 acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct ggaaggacgg 1800 cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt gattccgcct 1860 cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg tctctttttc 1920 ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt ccttcatttc 1980 acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc cgtgacttgg 2040 aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc cagtatcccc 2100 ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat ataaagatca 2160 tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc ttcaatcctg 2220 atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt gtggattctg 2280 acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt ttccagttgt 2340 tgatgccttg aggtaccaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400 ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460 ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520 ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580 ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640 tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700 ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760 cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820 acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880 ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940 ccccgcatcg gtaccgtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180 aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360 atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420 gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480 ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540 gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600 caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660 tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720 gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780 tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840 agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900 aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960 ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020 agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080 aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140 ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200 ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260 cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320 ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380 cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440 gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500 acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560 gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620 gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680 tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740 acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800 cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860 aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920 gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980 ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040 gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100 gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160 attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220 gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280 tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340 aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400 gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460 gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520 tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360 tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420 tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480 ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540 cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600 catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660 ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720 ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780 tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840 caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900 cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960 tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020 gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080 tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140 gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200 ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260 ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320 aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380 ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440 gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500 gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560 cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620 taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680 ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740 ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800 ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860 aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920 gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980 atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040 atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100 ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160 cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220 aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280 tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340 taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400 cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460 atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520 tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580 atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760 gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940 gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540 tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600 tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720 ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780 ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840 actcggggct cgag 9854 <210> 18 <211> 9854 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 18 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccacccccc cggaccggga 720 gaggcctctt gtggttgggc ctggtgctga gcagcgtgtg cgtggccctg ggcagtgaga 780 cccaggctaa ctctacaaca gatgccttga atgtgctgct gatcattgtg gatgacctga 840 ggccaagtct gggctgctat ggggacaaat tggtgaggtc ccccaacatc gaccagttgg 900 cctcccactc tctcctattc caaaatgctt tcgcccagca ggcagtttgt gccccctcta 960 gggtgagctt cctcactggc aggcgccctg acaccactag actgtatgac tttaacagct 1020 attggagggt gcacgcagga aacttctcca caatccctca atacttcaag gagaatggtt 1080 atgtgacaat gtctgtgggc aaggtgttcc accctggcat cagcagcaac cacaccgatg 1140 actcacccta tagttggtct tttcccccct accatccttc atctgagaaa tatgaaaaca 1200 caaaaacctg ccgaggccca gacggggaac tgcatgccaa cctactctgt cctgttgatg 1260 tactggacgt gcccgagggc accctccctg ataagcagtc cacagaacag gccattcagc 1320 tgcttgaaaa gatgaagacc tccgcatccc ccttcttctt ggctgtcggc taccacaagc 1380 cccatatccc ctttagatac cccaaggaat tccagaaact gtacccactg gagaacatca 1440 cacttgctcc tgaccctgaa gtgcctgacg gactgcctcc agtggcctat aacccttgga 1500 tggacatccg gcagcgcgag gatgtgcagg ctctgaacat tagtgtgcct tatgggccca 1560 tccctgtgga ctttcagagg aagattcgcc agtcctactt tgcctctgta tcctacctgg 1620 acacacaggt gggacgcctg ctgtctgccc ttgatgatct gcaactggcc aacagcacca 1680 ttatagcttt cacatcagac catgggtggg ctcttgggga gcatggtgaa tgggctaagt 1740 actccaactt cgatgtggca acccatgtcc ctctgatctt ctatgtgcca ggaaggaccg 1800 cctctctgcc agaggcaggt gagaagctgt tcccctatct ggaccctttt gactccgcca 1860 gccagctgat ggagcctggc cgacagtcta tggacctggt tgagctggtc agcctgtttc 1920 ccacactcgc tggactggct ggcctgcaag tacccccacg ctgcccagtg ccctccttcc 1980 atgtggagct ttgcagggag gggaagaacc tcctcaagca cttcaggttc agggacctag 2040 aggaggatcc ttatctgcct ggaaacccca gagagcttat tgcttactcc cagtatccaa 2100 ggcctagtga cattccccaa tggaactcag acaaaccaag cctgaaagac atcaagatca 2160 tgggatactc tatcaggacc attgactaca ggtacactgt gtgggttggc ttcaacccgg 2220 atgagttcct ggctaatttc tctgacatac atgctggcga gctgtacttc gtggacagtg 2280 accccctgca ggatcacaac atgtacaatg attcccaggg gggtgacctc ttccagcttc 2340 tgatgcccta aggtaccaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400 ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460 ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520 ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580 ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640 tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700 ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760 cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820 acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880 ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940 ccccgcatcg gtaccgtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180 aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360 atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420 gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480 ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540 gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600 caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660 tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720 gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780 tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840 agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900 aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960 ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020 agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080 aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140 ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200 ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260 cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320 ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380 cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440 gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500 acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560 gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620 gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680 tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740 acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800 cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860 aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920 gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980 ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040 gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100 gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160 attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220 gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280 tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340 aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400 gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460 gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520 tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360 tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420 tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480 ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540 cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600 catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660 ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720 ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780 tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840 caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900 cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960 tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020 gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080 tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140 gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200 ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260 ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320 aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380 ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440 gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500 gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560 cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620 taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680 ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740 ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800 ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860 aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920 gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980 atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040 atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100 ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160 cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220 aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280 tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340 taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400 cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460 atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520 tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580 atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760 gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940 gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540 tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600 tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720 ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780 ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840 actcggggct cgag 9854 <210> 19 <211> 10968 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 19 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccgccaccc cggaccggcc 720 gaggccttct ctggctgggt ctggttctga gctccgtctg cgtcgccctc ggatccgaaa 780 cgcaggccaa ctcgaccaca gatgctctga acgttcttct catcatcgtg gatgacctgc 840 gcccctccct gggctgttat ggggataagc tggtgaggtc cccaaatatt gaccaactgg 900 catcccacag cctcctcttc cagaatgcct ttgcgcagca agcagtgtgc gccccgagcc 960 gcgtttcttt cctcactggc aggagacctg acaccacccg cctgtacgac ttcaactcct 1020 actggagggt gcacgctgga aacttctcca ccatccccca gtacttcaag gagaatggct 1080 atgtgaccat gtcggtggga aaagtctttc accctgggat atcttctaac cataccgatg 1140 attctccgta tagctggtct tttccacctt atcatccttc ctctgagaag tatgaaaaca 1200 ctaagacatg tcgagggcca gatggagaac tccatgccaa cctgctttgc cctgtggatg 1260 tgctggatgt tcccgagggc accttgcctg acaaacagag cactgagcaa gccatacagt 1320 tgttggaaaa gatgaaaacg tcagccagtc ctttcttcct ggccgttggg tatcataagc 1380 cacacatccc cttcagatac cccaaggaat ttcagaagtt gtatcccttg gagaacatca 1440 ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac aacccctgga 1500 tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg tatggtccaa 1560 ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg tcatatttgg 1620 atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc aacagcacca 1680 tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa tgggccaaat 1740 acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct ggaaggacgg 1800 cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt gattccgcct 1860 cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg tctctttttc 1920 ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt ccttcatttc 1980 acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc cgtgacttgg 2040 aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc cagtatcccc 2100 ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat ataaagatca 2160 tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc ttcaatcctg 2220 atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt gtggattctg 2280 acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt ttccagttgt 2340 tgatgccttg acaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400 cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460 tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520 ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580 ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640 acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700 ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760 ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820 tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880 ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata atcatatggc 2940 caccatggct gcgcccgcac tagggctggt gtgtggacgt tgccctgagc tgggtctcgt 3000 cctcttgctg ctgctgctct cgctgctgtg tggagcggca gggagccagg aggccgggac 3060 cggtgcgggc gcggggtccc ttgcgggttc ttgcggctgc ggcacgcccc agcggcctgg 3120 cgcccatggc agttcggcag ccgctcaccg atactcgcgg gaggctaacg ctccgggccc 3180 cgtacccgga gagcggcaac tcgcgcactc aaagatggtc cccatccctg ctggagtatt 3240 tacaatgggc acagatgatc ctcagataaa gcaggatggg gaagcacctg cgaggagagt 3300 tactattgat gccttttaca tggatgccta tgaagtcagt aatactgaat ttgagaagtt 3360 tgtgaactca actggctatt tgacagaggc tgagaagttt ggcgactcct ttgtctttga 3420 aggcatgttg agtgagcaag tgaagaccaa tattcaacag gcagttgcag ctgctccctg 3480 gtggttacct gtgaaaggcg ctaactggag acacccagaa gggcctgact ctactattct 3540 gcacaggccg gatcatccag ttctccatgt gtcctggaat gatgcggttg cctactgcac 3600 ttgggcaggg aagcggctgc ccacggaagc tgagtgggaa tacagctgtc gaggaggcct 3660 gcataataga cttttcccct ggggcaacaa actgcagccc aaaggccagc attatgccaa 3720 catttggcag ggcgagtttc cggtgaccaa cactggtgag gatggcttcc aaggaactgc 3780 gcctgttgat gccttccctc ccaatggtta tggcttatac aacatagtgg ggaacgcatg 3840 ggaatggact tcagactggt ggactgttca tcattctgtt gaagaaacgc ttaacccaaa 3900 aggtccccct tctgggaaag accgagtgaa gaaaggtgga tcctacatgt gccataggtc 3960 ttattgttac aggtatcgct gtgctgctcg gagccagaac acacctgata gctctgcttc 4020 gaatctggga ttccgctgtg cagccgaccg cctgcccact atggactgag tcgaccctag 4080 agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260 ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320 aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440 agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500 ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560 agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620 ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680 ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740 tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800 gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860 cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920 accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980 cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040 cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100 ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160 ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220 cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280 tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340 ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400 ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460 ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520 ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580 actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640 taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700 ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760 gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820 aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880 tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940 aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000 ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060 tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120 gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180 tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240 tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300 gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360 aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420 ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480 taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540 attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600 cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660 gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260 tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500 cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560 tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620 tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680 acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740 gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800 ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860 tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920 gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980 agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040 atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100 ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160 atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220 ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280 gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580 gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640 caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700 ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760 tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820 cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880 acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940 cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000 aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060 cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120 cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180 atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240 catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300 gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360 ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420 ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480 taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540 catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600 cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660 atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720 gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840 tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900 ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140 tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200 atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260 gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320 tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380 atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440 agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500 gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560 cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620 tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680 agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740 ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800 gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860 agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920 gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968 <210> 20 <211> 10968 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 20 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccaccacct aggacaggca 720 ggggcctgct ttggcttgga ctggtgctga gctctgtctg tgttgccctg ggctccgaga 780 cccaagccaa ctctacaacc gatgctctca atgttctgct catcatagtg gatgacctgc 840 ggccctctct aggctgctat ggagacaagt tggtgcggag ccccaacata gaccagctag 900 cctctcactc cctgctgttc cagaatgcct tcgcccagca agctgtgtgc gccccctcta 960 gagtgtcttt cctgaccggg agaaggcctg atacaacaag gctgtatgac tttaacagct 1020 actggagggt gcacgcaggc aacttctcca ctatccccca atacttcaag gagaatggct 1080 atgtgaccat gagcgtgggc aaggtcttcc accctggaat ctcctccaac cacactgatg 1140 atagtcccta ctcttggtct tttcctccct atcaccctag cagtgagaag tatgagaaca 1200 ccaaaacctg cagaggccct gatggggagc tgcatgctaa cctcctgtgt cctgtagatg 1260 tgctggacgt cccagagggc accttgccag ataagcagtc tactgagcag gctatccagc 1320 tgcttgagaa aatgaagact tctgcatctc ccttctttct ggctgttggc taccacaagc 1380 ctcacatccc cttcaggtac cctaaggagt tccaaaagct ctatcctctg gaaaacatca 1440 cacttgcccc cgatcctgag gtccctgacg gcctcccacc agtagcctac aatccttgga 1500 tggacattag gcagagagag gatgtccagg ctctgaatat ttctgtgccc tatgggccca 1560 tcccggtgga cttccagcgc aaaatcagac agtcctactt tgcctctgtg agctatctgg 1620 acacccaggt tgggaggctc ctctccgccc ttgacgacct ccagttggcc aacagcacca 1680 ttatagcctt cacctctgac cacggctggg cactggggga acacggggag tgggctaagt 1740 actctaactt tgatgtggcc acccacgtgc ccctcatctt ttatgtgcct ggcaggactg 1800 ccagcctgcc cgaagctggg gaaaaactgt ttccatacct ggaccctttt gacagtgctt 1860 ctcagctcat ggaacctggc cgtcagagca tggatctggt ggagctagtg tccctcttcc 1920 caaccttggc tggccttgct ggtctccagg tgcctcctag atgcccagtc ccctccttcc 1980 atgttgaact ctgccgtgag gggaagaatc tgctgaagca cttcagattc agagacttgg 2040 aggaggaccc ctaccttcct gggaacccca gggagttgat tgcatactcc cagtatccca 2100 ggccaagtga cattccccag tggaactccg acaaaccaag tctgaaggac atcaagatca 2160 tggggtacag catcaggacc attgactaca gatacacagt gtgggttgga tttaacccag 2220 atgagttctt ggcaaacttt tctgacatcc atgcaagtca gttgtatttt gtggacagcg 2280 accctctgca ggatcacaac atgtacaatg acagccaggg tggggacctc tttcaactcc 2340 tcatgccata gcaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400 cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460 tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520 ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580 ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640 acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700 ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760 ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820 tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880 ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata atcatatggc 2940 caccatggct gctcctgccc tggggctggt gtgtggaaga tgtcctgaac tgggcctggt 3000 tctgttactg cttctgctca gcctgctctg tggtgctgcc ggcagccaag aggcaggcac 3060 tggcgctgga gctggaagcc tggctgggtc ttgtggatgt ggcacaccac agaggccagg 3120 ggctcatggc tcctctgctg cagctcatag gtacagcaga gaagccaatg ctccaggccc 3180 agtgcctgga gagagacagc tggctcacag caagatggtg cccatccctg ctggggtgtt 3240 cacaatggga acagatgatc cccagatcaa gcaggatggg gaggcgcctg ccaggagggt 3300 gaccattgat gcattctata tggatgccta tgaggtgagc aatacagaat ttgagaagtt 3360 tgtgaactct actggctacc tgactgaggc tgaaaaattt ggagactctt ttgtgtttga 3420 aggaatgctt agtgaacagg ttaagaccaa catccagcag gctgttgcag cagccccctg 3480 gtggttgcct gtcaagggag ctaactggag gcaccctgag ggaccagatt ctacaatcct 3540 gcatagacct gatcatcctg ttctgcatgt gtcttggaat gatgctgtgg cttactgtac 3600 ctgggcagga aaaaggctgc caacagaagc tgagtgggaa tactcttgca gaggaggcct 3660 gcacaataga ctgttcccat ggggcaacaa gctgcaaccc aagggccagc actatgctaa 3720 catctggcag ggagaattcc ctgtgacaaa cacaggagag gacggcttcc agggaactgc 3780 ccctgtagat gctttccctc ctaatggcta tggcctgtat aacattgttg gcaacgcctg 3840 ggagtggact tctgattggt ggacagtgca ccactctgtt gaggagacac tgaatcctaa 3900 ggggccacct tctggaaagg atagagtgaa gaagggggga agctacatgt gccacaggtc 3960 ttattgttac agatacaggt gcgctgctag gtctcagaac acccctgata gcagtgctag 4020 caatctgggc ttcaggtgtg ccgctgacag actgcctacc atggattaag tcgaccctag 4080 agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260 ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320 aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440 agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500 ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560 agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620 ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680 ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740 tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800 gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860 cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920 accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980 cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040 cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100 ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160 ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220 cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280 tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340 ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400 ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460 ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520 ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580 actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640 taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700 ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760 gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820 aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880 tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940 aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000 ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060 tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120 gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180 tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240 tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300 gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360 aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420 ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480 taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540 attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600 cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660 gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260 tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500 cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560 tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620 tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680 acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740 gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800 ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860 tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920 gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980 agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040 atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100 ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160 atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220 ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280 gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580 gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640 caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700 ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760 tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820 cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880 acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940 cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000 aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060 cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120 cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180 atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240 catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300 gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360 ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420 ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480 taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540 catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600 cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660 atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720 gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840 tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900 ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140 tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200 atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260 gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320 tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380 atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440 agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500 gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560 cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620 tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680 agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740 ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800 gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860 agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920 gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968 <210> 21 <211> 10968 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 21 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccacccccc cggaccggga 720 gaggcctctt gtggttgggc ctggtgctga gcagcgtgtg cgtggccctg ggcagtgaga 780 cccaggctaa ctctacaaca gatgccttga atgtgctgct gatcattgtg gatgacctga 840 ggccaagtct gggctgctat ggggacaaat tggtgaggtc ccccaacatc gaccagttgg 900 cctcccactc tctcctattc caaaatgctt tcgcccagca ggcagtttgt gccccctcta 960 gggtgagctt cctcactggc aggcgccctg acaccactag actgtatgac tttaacagct 1020 attggagggt gcacgcagga aacttctcca caatccctca atacttcaag gagaatggtt 1080 atgtgacaat gtctgtgggc aaggtgttcc accctggcat cagcagcaac cacaccgatg 1140 actcacccta tagttggtct tttcccccct accatccttc atctgagaaa tatgaaaaca 1200 caaaaacctg ccgaggccca gacggggaac tgcatgccaa cctactctgt cctgttgatg 1260 tactggacgt gcccgagggc accctccctg ataagcagtc cacagaacag gccattcagc 1320 tgcttgaaaa gatgaagacc tccgcatccc ccttcttctt ggctgtcggc taccacaagc 1380 cccatatccc ctttagatac cccaaggaat tccagaaact gtacccactg gagaacatca 1440 cacttgctcc tgaccctgaa gtgcctgacg gactgcctcc agtggcctat aacccttgga 1500 tggacatccg gcagcgcgag gatgtgcagg ctctgaacat tagtgtgcct tatgggccca 1560 tccctgtgga ctttcagagg aagattcgcc agtcctactt tgcctctgta tcctacctgg 1620 acacacaggt gggacgcctg ctgtctgccc ttgatgatct gcaactggcc aacagcacca 1680 ttatagcttt cacatcagac catgggtggg ctcttgggga gcatggtgaa tgggctaagt 1740 actccaactt cgatgtggca acccatgtcc ctctgatctt ctatgtgcca ggaaggaccg 1800 cctctctgcc agaggcaggt gagaagctgt tcccctatct ggaccctttt gactccgcca 1860 gccagctgat ggagcctggc cgacagtcta tggacctggt tgagctggtc agcctgtttc 1920 ccacactcgc tggactggct ggcctgcaag tacccccacg ctgcccagtg ccctccttcc 1980 atgtggagct ttgcagggag gggaagaacc tcctcaagca cttcaggttc agggacctag 2040 aggaggatcc ttatctgcct ggaaacccca gagagcttat tgcttactcc cagtatccaa 2100 ggcctagtga cattccccaa tggaactcag acaaaccaag cctgaaagac atcaagatca 2160 tgggatactc tatcaggacc attgactaca ggtacactgt gtgggttggc ttcaacccgg 2220 atgagttcct ggctaatttc tctgacatac atgctggcga gctgtacttc gtggacagtg 2280 accccctgca ggatcacaac atgtacaatg attcccaggg gggtgacctc ttccagcttc 2340 tgatgcccta acaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400 cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460 tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520 ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580 ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640 acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700 ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760 ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820 tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880 ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata ataccggtgc 2940 caccatggct gcccctgctc tgggattggt ttgtggcaga tgtcctgagc ttggtctggt 3000 gctgttgctc cttctgttgt ctctgctgtg tggagcagct gggtctcagg aagctggcac 3060 aggcgctggg gctggctctc tggccgggtc atgtggctgt ggaactcccc agcggcctgg 3120 agcccatggc agctctgccg cagcacacag gtattctagg gaagccaatg ccccaggccc 3180 tgtgcctggg gagagacagc tagctcattc taagatggtg cctatcccag ccggggtttt 3240 tacaatgggc actgatgatc ctcagattaa gcaggatgga gaggcccccg ccagaagagt 3300 gaccattgat gctttctaca tggatgcata tgaagtgtcc aacacagagt ttgagaaatt 3360 tgtgaactct actggatact tgaccgaggc tgagaagttt ggagattcct ttgtctttga 3420 aggcatgctg tctgagcagg tcaagaccaa cattcagcaa gcagtggccg ctgcaccttg 3480 gtggcttcct gtgaagggcg ccaactggag acatccagag gggccagata gtaccatcct 3540 ccacagacct gatcacccag tccttcatgt ttcctggaat gatgcagttg cttactgcac 3600 ttgggccggc aagaggctcc ctactgaggc agagtgggaa tactcctgca gaggaggcct 3660 gcacaacaga ctgttccctt gggggaacaa gcttcagccc aaaggccagc actatgctaa 3720 catctggcag ggtgagtttc cagtcaccaa tacaggggag gacggattcc agggaaccgc 3780 accagtagat gccttccctc ctaatggcta tggcctgtat aatattgtgg gcaatgcatg 3840 ggagtggacc tctgactggt ggactgtgca ccactcagtg gaggaaaccc tgaaccctaa 3900 gggaccccct tcaggcaaag atagagtcaa aaagggaggg agctatatgt gtcacagatc 3960 ctattgctac agatatagat gtgcagccag gtcccagaac acccctgact cttctgctag 4020 caacctgggc tttcggtgtg ctgctgatag actgcccacc atggactaag tcgaccctag 4080 agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260 ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320 aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440 agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500 ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560 agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620 ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680 ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740 tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800 gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860 cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920 accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980 cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040 cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100 ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160 ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220 cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280 tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340 ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400 ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460 ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520 ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580 actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640 taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700 ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760 gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820 aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880 tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940 aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000 ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060 tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120 gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180 tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240 tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300 gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360 aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420 ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480 taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540 attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600 cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660 gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260 tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500 cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560 tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620 tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680 acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740 gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800 ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860 tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920 gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980 agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040 atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100 ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160 atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220 ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280 gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340 cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400 tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460 tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520 tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580 gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640 caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700 ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760 tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820 cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880 acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940 cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000 aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060 cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120 cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180 atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240 catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300 gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360 ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420 ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480 taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540 catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600 cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660 atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720 gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840 tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900 ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140 tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200 atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260 gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320 tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380 atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440 agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500 gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560 cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620 tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680 agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740 ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800 gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860 agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920 gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968 <210> 22 <211> 8722 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 22 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat ggctgcgccc gcactagggc 720 tggtgtgtgg acgttgccct gagctgggtc tcgtcctctt gctgctgctg ctctcgctgc 780 tgtgtggagc ggcagggagc caggaggccg ggaccggtgc gggcgcgggg tcccttgcgg 840 gttcttgcgg ctgcggcacg ccccagcggc ctggcgccca tggcagttcg gcagccgctc 900 accgatactc gcgggaggct aacgctccgg gccccgtacc cggagagcgg caactcgcgc 960 actcaaagat ggtccccatc cctgctggag tatttacaat gggcacagat gatcctcaga 1020 taaagcagga tggggaagca cctgcgagga gagttactat tgatgccttt tacatggatg 1080 cctatgaagt cagtaatact gaatttgaga agtttgtgaa ctcaactggc tatttgacag 1140 aggctgagaa gtttggcgac tcctttgtct ttgaaggcat gttgagtgag caagtgaaga 1200 ccaatattca acaggcagtt gcagctgctc cctggtggtt acctgtgaaa ggcgctaact 1260 ggagacaccc agaagggcct gactctacta ttctgcacag gccggatcat ccagttctcc 1320 atgtgtcctg gaatgatgcg gttgcctact gcacttgggc agggaagcgg ctgcccacgg 1380 aagctgagtg ggaatacagc tgtcgaggag gcctgcataa tagacttttc ccctggggca 1440 acaaactgca gcccaaaggc cagcattatg ccaacatttg gcagggcgag tttccggtga 1500 ccaacactgg tgaggatggc ttccaaggaa ctgcgcctgt tgatgccttc cctcccaatg 1560 gttatggctt atacaacata gtggggaacg catgggaatg gacttcagac tggtggactg 1620 ttcatcattc tgttgaagaa acgcttaacc caaaaggtcc cccttctggg aaagaccgag 1680 tgaagaaagg tggatcctac atgtgccata ggtcttattg ttacaggtat cgctgtgctg 1740 ctcggagcca gaacacacct gatagctctg cttcgaatct gggattccgc tgtgcagccg 1800 accgcctgcc cactatggac tgagtcgacc ctagagctcg ctgatcagcc tcgactgtgc 1860 cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag 1920 gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta 1980 ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag 2040 acaatagcag gcatgctggg gaatctagag tttaaacatt taaataggaa cccctagtga 2100 tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 2160 tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagt 2220 atacatcgat gtgagttcgc gggtggctgg ggggccctgg gctgcgaccg cccccgaacc 2280 gcgtctacga gccttgcggg ctccgggtct ttgcagtcgt atgggggcag ggtagctgtt 2340 ccccgcaagg agagctcaag gtcagcgctc ggacctggcg gagccccgca cccaggctgt 2400 ggcgccctgt gcagctccgc ccttgcggcg ccatctgccc ggagcctcct tcccctagtc 2460 cccagaaaca ggaggtccct actcccgccc gagatcccga cccggacccc taggtggggg 2520 acgctttctt tcctttcgcg ctctgcgggg tcacgtgtcg cagaggagcc cctcccccac 2580 ggcctccggc accgcaggcc ccgggatgct agtgcgcagc gggtgcatcc ctgtccggat 2640 gctgcgcctg cggtagagcg gccgccatgt tgcaaccggg aaggaaatga atgggcagcc 2700 gttaggaaag cctgccggtg actaaccctg cgctcctgcc tcgatgggtg gagtcgcgtg 2760 tggcggggaa gtcaggtgga gcgaggctag ctggcccgat ttctcctccg ggtgatgctt 2820 ttcctagatt attctctggt aaatcaaaga agtgggttta tggaggtcct cttgtgtccc 2880 ctccccgcag aggtgtggtg gctgtggcat ggtgccaagc cgggagaagc tgagtcatgg 2940 gtagttggaa aaggacattt ccaccgcaaa atggcccctc tggtggtggc cccttcctgc 3000 agcgccggct cacctcacgg ccccgccctt cccctgccag cctagcgttg acccgacccc 3060 aaaggccagg ctgtaaatgt caccgggagg attgggtgtc tgggcgcctc ggggaacctg 3120 cccttctccc cattccgtct tccggaaacc agatctccca ccgcaccctg gtctgaggtt 3180 aaatatagct gctgaccttt ctgtagctgg gggcctgggc tggggctctc tcccatccct 3240 tctccccaca cacatgcact tacctgtgct cccactcctg atttctggaa aagagctagg 3300 aaggacaggc aacttggcaa atcaaagccc tgggactagg gggttaaaat acagcttccc 3360 ctcttcccac ccgccccagt ctctgtccct tttgtaggag ggacttagag aaggggtggg 3420 cttgccctgt ccagttaatt tctgaccttt actcctgccc tttgagtttg atgatgctga 3480 gtgtacaagc gttttctccc taaagggtgc agctgagcta ggcagcagca agcattcctg 3540 gggtggcata gtggggtggt gaataccatg tacaaagctt gtgcccagac tgtgggtggc 3600 agtgccccac atggccgctt ctcctggaag ggcttcgtat gactgggggt gttgggcagc 3660 cctggagcct tcagttgcag ccatgcctta agccaggcca gcctggcagg gaagctcaag 3720 ggagataaaa ttcaacctct tgggccctcc tgggggtaag gagatgctgc attcgccctc 3780 ttaatgggga ggtggcctag ggctgctcac atattctgga ggagcctccc ctcctcatgc 3840 cttcttgcct cttgtctctt aggcatgcaa aagagtcgaa taagggcgac acaaaattta 3900 ttctaaatgc ataataaata ctgataacat cttatagttt gtattatatt ttgtattatc 3960 gttgacatgt ataattttga tatcaaaaac tgattttccc tttattattt tcgagattta 4020 ttttcttaat tctctttaac aaactagaaa tattgtatat acaaaaaatc ataaataata 4080 gatgaatagt ttaattatag gtgttcatca atcgaaaaag caacgtatct tatttaaagt 4140 gcgttgcttt tttctcattt ataaggttaa ataattctca tatatcaagc aaagtgacag 4200 gcgcccttaa atattctgac aaatgctctt tccctaaact ccccccataa aaaaacccgc 4260 cgaagcgggt ttttacgtta tttgcggatt aacgattact cgttatcaga accgcccagg 4320 gggcccgagc ttaagactgg ccgtcgtttt acaacacaga aagagtttgt agaaacgcaa 4380 aaaggccatc cgtcaggggc cttctgctta gtttgatgcc tggcagttcc ctactctcgc 4440 cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 4500 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 4560 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 4620 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 4680 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 4740 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 4800 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 4860 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 4920 actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 4980 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggg 5040 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 5100 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 5160 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 5220 tgatcttttc tacggggtct gacgctcagt ggaacgacgc gcgcgtaact cacgttaagg 5280 gattttggtc atgagcttgc gccgtcccgt caagtcagcg taatgctctg cttaggtggc 5340 ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag 5400 agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc 5460 gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc 5520 gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acttgggcag 5580 aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa 5640 tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt 5700 ggctacgtca ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg 5760 gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt 5820 agggcgactg ccctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac 5880 ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata 5940 acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga 6000 ccagttgcgt gagcgcattt ttttttcctc ctcggcgttt acgccccgcc ctgccactca 6060 tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc acagacggca 6120 tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata atatttgccc 6180 atagtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc aaaactggtg 6240 aaactcaccc agggattggc gctgacgaaa aacatattct caataaaccc tttagggaaa 6300 taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag aaactgccgg 6360 aaatcgtcgt gtgcactcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 6420 cagctcaccg tctttcattg ccatacggaa ctccggatga gcattcatca ggcgggcaag 6480 aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 6540 cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 6600 aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 6660 ctccattttt ttttcctcct ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 6720 ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 6780 aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 6840 cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 6900 aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagtttatg catttctttc 6960 cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 7020 ccgttattca ttcgtgattg cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga 7080 caattacaaa caggaatcga gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 7140 ttttcacctg aatcaggata ttcttctaat acctggaacg ctgtttttcc ggggatcgca 7200 gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagtggc 7260 ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 7320 cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa gcgatagatt 7380 gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 7440 atgttggaat ttaatcgcgg cctcgacgtt tcccgttgaa tatggctcat ttttttttcc 7500 tcctttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7560 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7620 gccccagcgc tgcgatgata ccgcgagaac cacgctcacc ggctccggat ttatcagcaa 7680 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7740 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7800 gcaacgttgt tgccatcgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7860 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcacgt 7920 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 7980 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 8040 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 8100 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 8160 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 8220 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 8280 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatattctt 8340 cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 8400 tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt acaaccaatt aaccaattct 8460 gaacattatc gcgagcccat ttatacctga atatggctca taacacccct tgtttgcctg 8520 gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 8580 gcgccgatgg tagtgtgggg actccccatg cgagagtagg gaactgccag gcatcaaata 8640 aaacgaaagg ctcagtcgaa agactgggcc tttcgcccgg gctaattgag gggtgtcgcc 8700 cttattcgac tcggggctcg ag 8722 <210> 23 <211> 10269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 23 cgcgttgtag ttaatgatta acccgccatg ctacttatct acgtagccat gctctaggaa 60 gatcggaatt cgcccttaag ctagcaggtt aatttttaaa aagcagtcaa aagtccaagt 120 ggcccttggc agcatttact ctctctgttt gctctggtta ataatctcag gagcacaaac 180 attccagatc caggttaatt tttaaaaagc agtcaaaagt ccaagtggcc cttggcagca 240 tttactctct ctgtttgctc tggttaataa tctcaggagc acaaacattc cagatccggc 300 gcgccagggc tggaagctac ctttgacatc atttcctctg cgaatgcatg tataatttct 360 acagaaccta ttagaaagga tcacccagcc tctgcttttg tacaactttc ccttaaaaaa 420 ctgccaattc cactgctgtt tggcccaata gtgagaactt tttcctgctg cctcttggtg 480 cttttgccta tggcccctat tctgcctgct gaagacactc ttgccagcat ggacttaaac 540 ccctccagct ctgacaatcc tctttctctt ttgttttaca tgaagggtct ggcagccaaa 600 gcaatcactc aaagttcaaa ccttatcatt ttttgctttg ttcctcttgg ccttggtttt 660 gtacatcagc tttgaaaata ccatcccagg gttaatgctg gggttaattt ataactaaga 720 gtgctctagt tttgcaatac aggacatgct ataaaaatgg aaagatgttg ctttctgaga 780 gactgcagaa gttggtcgtg aggcactggg caggtaagta tcaaggttac aagacaggtt 840 taaggagacc aatagaaact gggcttgtcg agacagagaa gactcttgcg tttctgatag 900 gcacctattg gtcttactga catccacttt gcctttctct ccacaggtgt ccaggcggcc 960 gcatgccccc gccccgcacc ggccgcggcc tgctgtggct gggcctggtg ctgagcagcg 1020 tgtgcgtggc cctgggcagc gagacccagg ccaacagcac caccgacgcc ctgaacgtgc 1080 tgctgatcat cgtggacgac ctgcgcccca gcctgggctg ctacggcgac aagctggtgc 1140 gcagccccaa catcgaccag ctggccagcc acagcctgct gttccagaac gccttcgccc 1200 agcaggccgt gtgcgccccc agccgcgtga gcttcctgac cggccgccgc cccgacacca 1260 cccgcctgta cgacttcaac agctactggc gcgtgcacgc cggcaacttc agcaccatcc 1320 cccagtactt caaggagaac ggctacgtga ccatgagcgt gggcaaggtg ttccaccccg 1380 gcatcagcag caaccacacc gacgacagcc cctacagctg gagcttcccc ccctaccacc 1440 ccagcagcga gaagtacgag aacaccaaga cctgccgcgg ccccgacggc gagctgcacg 1500 ccaacctgct gtgccccgtg gacgtgctgg acgtgcccga gggcaccctg cccgacaagc 1560 agagcaccga gcaggccatc cagctgctgg agaagatgaa gaccagcgcc agccccttct 1620 tcctggccgt gggctaccac aagccccaca tccccttccg ctaccccaag gagttccaga 1680 agctgtaccc cctggagaac atcaccctgg cccccgaccc cgaggtgccc gacggcctgc 1740 cccccgtggc ctacaacccc tggatggaca tccgccagcg cgaggacgtg caggccctga 1800 acatcagcgt gccctacggc cccatccccg tggacttcca gcgcaagatc cgccagagct 1860 acttcgccag cgtgagctac ctggacaccc aggtgggccg cctgctgagc gccctggacg 1920 acctgcagct ggccaacagc accatcatcg ccttcaccag cgaccacggc tgggccctgg 1980 gcgagcacgg cgagtgggcc aagtacagca acttcgacgt ggccacccac gtgcccctga 2040 tcttctacgt gcccggccgc accgccagcc tgcccgaggc cggcgagaag ctgttcccct 2100 acctggaccc cttcgacagc gccagccagc tgatggagcc cggccgccag agcatggacc 2160 tggtggagct ggtgagcctg ttccccaccc tggccggcct ggccggcctg caggtgcccc 2220 cccgctgccc cgtgcccagc ttccacgtgg agctgtgccg cgagggcaag aacctgctga 2280 agcacttccg cttccgcgac ctggaggagg acccctacct gcccggcaac ccccgcgagc 2340 tgatcgccta cagccagtac ccccgcccca gcgacatccc ccagtggaac agcgacaagc 2400 ccagcctgaa ggacatcaag atcatgggct acagcatccg caccatcgac taccgctaca 2460 ccgtgtgggt gggcttcaac cccgacgagt tcctggccaa cttcagcgac atccacgccg 2520 gcgagctgta cttcgtggac agcgaccccc tgcaggacca caacatgtac aacgacagcc 2580 agggcggcga cctgttccag ctgctgatgc cctagaagcc tggatccaat caacctctgg 2640 attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 2700 gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 2760 tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca 2820 ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg 2880 ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg 2940 aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca 3000 attccgtggt gttgtcgggg aagctgacgt cctttccatg gctgctcgcc tgtgttgcca 3060 cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc 3120 ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcga gatctgcctc 3180 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 3240 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 3300 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 3360 ttgggaagac aatagcaggc atgctgggga ctcgagttaa gggcgaattc ccgattagga 3420 tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt aactacagtt 3480 taaacattta aataggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3540 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3600 tcagtgagcg agcgagcgcg cagagagtat acatcgatgt gagttcgcgg gtggctgggg 3660 ggccctgggc tgcgaccgcc cccgaaccgc gtctacgagc cttgcgggct ccgggtcttt 3720 gcagtcgtat gggggcaggg tagctgttcc ccgcaaggag agctcaaggt cagcgctcgg 3780 acctggcgga gccccgcacc caggctgtgg cgccctgtgc agctccgccc ttgcggcgcc 3840 atctgcccgg agcctccttc ccctagtccc cagaaacagg aggtccctac tcccgcccga 3900 gatcccgacc cggaccccta ggtgggggac gctttctttc ctttcgcgct ctgcggggtc 3960 acgtgtcgca gaggagcccc tcccccacgg cctccggcac cgcaggcccc gggatgctag 4020 tgcgcagcgg gtgcatccct gtccggatgc tgcgcctgcg gtagagcggc cgccatgttg 4080 caaccgggaa ggaaatgaat gggcagccgt taggaaagcc tgccggtgac taaccctgcg 4140 ctcctgcctc gatgggtgga gtcgcgtgtg gcggggaagt caggtggagc gaggctagct 4200 ggcccgattt ctcctccggg tgatgctttt cctagattat tctctggtaa atcaaagaag 4260 tgggtttatg gaggtcctct tgtgtcccct ccccgcagag gtgtggtggc tgtggcatgg 4320 tgccaagccg ggagaagctg agtcatgggt agttggaaaa ggacatttcc accgcaaaat 4380 ggcccctctg gtggtggccc cttcctgcag cgccggctca cctcacggcc ccgcccttcc 4440 cctgccagcc tagcgttgac ccgaccccaa aggccaggct gtaaatgtca ccgggaggat 4500 tgggtgtctg ggcgcctcgg ggaacctgcc cttctcccca ttccgtcttc cggaaaccag 4560 atctcccacc gcaccctggt ctgaggttaa atatagctgc tgacctttct gtagctgggg 4620 gcctgggctg gggctctctc ccatcccttc tccccacaca catgcactta cctgtgctcc 4680 cactcctgat ttctggaaaa gagctaggaa ggacaggcaa cttggcaaat caaagccctg 4740 ggactagggg gttaaaatac agcttcccct cttcccaccc gccccagtct ctgtcccttt 4800 tgtaggaggg acttagagaa ggggtgggct tgccctgtcc agttaatttc tgacctttac 4860 tcctgccctt tgagtttgat gatgctgagt gtacaagcgt tttctcccta aagggtgcag 4920 ctgagctagg cagcagcaag cattcctggg gtggcatagt ggggtggtga ataccatgta 4980 caaagcttgt gcccagactg tgggtggcag tgccccacat ggccgcttct cctggaaggg 5040 cttcgtatga ctgggggtgt tgggcagccc tggagccttc agttgcagcc atgccttaag 5100 ccaggccagc ctggcaggga agctcaaggg agataaaatt caacctcttg ggccctcctg 5160 ggggtaagga gatgctgcat tcgccctctt aatggggagg tggcctaggg ctgctcacat 5220 attctggagg agcctcccct cctcatgcct tcttgcctct tgtctcttag gcatgcaaaa 5280 gagtcgaata agggcgacac aaaatttatt ctaaatgcat aataaatact gataacatct 5340 tatagtttgt attatatttt gtattatcgt tgacatgtat aattttgata tcaaaaactg 5400 attttccctt tattattttc gagatttatt ttcttaattc tctttaacaa actagaaata 5460 ttgtatatac aaaaaatcat aaataataga tgaatagttt aattataggt gttcatcaat 5520 cgaaaaagca acgtatctta tttaaagtgc gttgcttttt tctcatttat aaggttaaat 5580 aattctcata tatcaagcaa agtgacaggc gcccttaaat attctgacaa atgctctttc 5640 cctaaactcc ccccataaaa aaacccgccg aagcgggttt ttacgttatt tgcggattaa 5700 cgattactcg ttatcagaac cgcccagggg gcccgagctt aagactggcc gtcgttttac 5760 aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt 5820 ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc 5880 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 5940 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 6000 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 6060 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 6120 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 6180 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 6240 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 6300 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 6360 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 6420 ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt 6480 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 6540 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 6600 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 6660 aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 6720 agtcagcgta atgctctgct taggtggcgg tacttgggtc gatatcaaag tgcatcactt 6780 cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt 6840 gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg 6900 cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct 6960 cactacgcgg ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt 7020 cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat 7080 cggagtccgg ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat 7140 caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc 7200 ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc 7260 tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag 7320 gcatagactg tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac 7380 caccgctgcg ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct 7440 cggcgtttac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 7500 gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 7560 cttgtcgcct tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat 7620 attggccacg tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa 7680 catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 7740 ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt 7800 aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaact 7860 ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 7920 tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 7980 tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 8040 caacggtggt atatccagtg atttttttct ccattttttt ttcctccttt agaaaaactc 8100 atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg 8160 aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag 8220 atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc 8280 ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga 8340 gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc cattacgctc 8400 gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag 8460 gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt gcaaccggcg 8520 caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac 8580 ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg 8640 gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta gtctgaccat 8700 ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc 8760 atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat tatcgcgagc 8820 ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc tcgacgtttc 8880 ccgttgaata tggctcattt ttttttcctc ctttaccaat gcttaatcag tgaggcacct 8940 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 9000 actacgatac gggagggctt accatctggc cccagcgctg cgatgatacc gcgagaacca 9060 cgctcaccgg ctccggattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 9120 agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 9180 gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg 9240 gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 9300 gttacatgat cccccatgtt gtgcacgttg tcagaagtaa gttggccgca gtgttatcac 9360 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 9420 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 9480 gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 9540 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 9600 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 9660 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 9720 cacggaaatg ttgaatactc atattcttcc tttttcaata ttattgaagc atttatcagg 9780 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 9840 tcagtgttac aaccaattaa ccaattctga acattatcgc gagcccattt atacctgaat 9900 atggctcata acaccccttg tttgcctggc ggcagtagcg cggtggtccc acctgacccc 9960 atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggac tccccatgcg 10020 agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 10080 tcgcccgggc taattgaggg gtgtcgccct tattcgactc ggggctcgag ctgcgcgctc 10140 gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg 10200 cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 10260 ttaattaaa 10269 <210> 24 <211> 9854 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 24 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180 ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240 aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420 ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480 aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540 gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600 gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660 ttaattacct tttttacagg cctgggcgcg ccgccaccat gccaccacct aggacaggca 720 ggggcctgct ttggcttgga ctggtgctga gctctgtctg tgttgccctg ggctccgaga 780 cccaagccaa ctctacaacc gatgctctca atgttctgct catcatagtg gatgacctgc 840 ggccctctct aggctgctat ggagacaagt tggtgcggag ccccaacata gaccagctag 900 cctctcactc cctgctgttc cagaatgcct tcgcccagca agctgtgtgc gccccctcta 960 gagtgtcttt cctgaccggg agaaggcctg atacaacaag gctgtatgac tttaacagct 1020 actggagggt gcacgcaggc aacttctcca ctatccccca atacttcaag gagaatggct 1080 atgtgaccat gagcgtgggc aaggtcttcc accctggaat ctcctccaac cacactgatg 1140 atagtcccta ctcttggtct tttcctccct atcaccctag cagtgagaag tatgagaaca 1200 ccaaaacctg cagaggccct gatggggagc tgcatgctaa cctcctgtgt cctgtagatg 1260 tgctggacgt cccagagggc accttgccag ataagcagtc tactgagcag gctatccagc 1320 tgcttgagaa aatgaagact tctgcatctc ccttctttct ggctgttggc taccacaagc 1380 ctcacatccc cttcaggtac cctaaggagt tccaaaagct ctatcctctg gaaaacatca 1440 cacttgcccc cgatcctgag gtccctgacg gcctcccacc agtagcctac aatccttgga 1500 tggacattag gcagagagag gatgtccagg ctctgaatat ttctgtgccc tatgggccca 1560 tcccggtgga cttccagcgc aaaatcagac agtcctactt tgcctctgtg agctatctgg 1620 acacccaggt tgggaggctc ctctccgccc ttgacgacct ccagttggcc aacagcacca 1680 ttatagcctt cacctctgac cacggctggg cactggggga acacggggag tgggctaagt 1740 actctaactt tgatgtggcc acccacgtgc ccctcatctt ttatgtgcct ggcaggactg 1800 ccagcctgcc cgaagctggg gaaaaactgt ttccatacct ggaccctttt gacagtgctt 1860 ctcagctcat ggaacctggc cgtcagagca tggatctggt ggagctagtg tccctcttcc 1920 caaccttggc tggccttgct ggtctccagg tgcctcctag atgcccagtc ccctccttcc 1980 atgttgaact ctgccgtgag gggaagaatc tgctgaagca cttcagattc agagacttgg 2040 aggaggaccc ctaccttcct gggaacccca gggagttgat tgcatactcc cagtatccca 2100 ggccaagtga cattccccag tggaactccg acaaaccaag tctgaaggac atcaagatca 2160 tggggtacag catcaggacc attgactaca gatacacagt gtgggttgga tttaacccag 2220 atgagttctt ggcaaacttt tctgacatcc atgcaagtca gttgtatttt gtggacagcg 2280 accctctgca ggatcacaac atgtacaatg acagccaggg tggggacctc tttcaactcc 2340 tcatgccata gcaattgaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400 ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460 ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520 ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580 ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640 tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700 ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760 cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820 acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880 ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940 ccccgcatcc aattggtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180 aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360 atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420 gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480 ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540 gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600 caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660 tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720 gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780 tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840 agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900 aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960 ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020 agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080 aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140 ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200 ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260 cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320 ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380 cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440 gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500 acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560 gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620 gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680 tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740 acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800 cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860 aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920 gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980 ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040 gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100 gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160 attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220 gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280 tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340 aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400 gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460 gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520 tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360 tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420 tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480 ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540 cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600 catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660 ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720 ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780 tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840 caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900 cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960 tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020 gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080 tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140 gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200 ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260 ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320 aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380 ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440 gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500 gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560 cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620 taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680 ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740 ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800 ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860 aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920 gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980 atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040 atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100 ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160 cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220 aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280 tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340 taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400 cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460 atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520 tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580 atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760 gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940 gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540 tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600 tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720 ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780 ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840 actcggggct cgag 9854

Claims

AAV8 캡시드 및 코돈-최적화된 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
AAV9 캡시드 및 코돈-최적화된 인간 이두로네이트-2 설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
청구항 1 또는 2에 있어서, 이때 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함하는, 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
청구항 3에 있어서, 이때 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열을 포함하는, rAAV 벡터.
청구항 1에 있어서, 이때 상기 벡터는 간-특이적 프로모터를 더 포함하는, rAAV 벡터.
청구항 5에 있어서, 이때 상기 간-특이적 프로모터는 트랜스레틴 프로모터 (TTR)인, rAAV 벡터.
청구항 5 또는 6에 있어서, 이때 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR), I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함하는, rAAV 벡터.
청구항 2에 있어서, 이때 상기 벡터는 산재된 프로모터를 더 포함하는, rAAV 벡터.
청구항 8에 있어서, 이때 상기 벡터는 5' 및 3' 역전된 말단 반복부, I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함하는, rAAV 벡터.
선술한 청구항들중 임의의 한 항에 있어서, 이때 상기 rAAV 벡터는 설파타제 변형 인자 1 (SUMF1)을 포함하는, rAAV 벡터.
청구항 10에 있어서, 이때 상기 SUMF1의 앞에 내부 리보솜 진입 부위 (IRES)가 있는, rAAV 벡터.
선술한 청구항들중 임의의 한 항에 있어서, 이때 상기 벡터는 WPRE 서열을 더 포함하는, rAAV 벡터.
청구항 7 또는 9에 있어서, 이때 상기 인트론은 마우스의 극미한 바이러스 (MVM) 또는 SV40 인트론인, rAAV 벡터.
청구항 7 또는 9에 있어서, 이때 상기 CRM은 간-특이적 CRM인, rAAV 벡터.
청구항 7 또는 9에 있어서, 이때 상기 CRM은 신경-특이적 CRM인, rAAV 벡터.
청구항 7 또는 9에 있어서, 이때 상기 CRM은 CRM8인, rAAV 벡터.
청구항 7 또는 9에 있어서, 이때 상기 벡터는 적어도 세 개의 CRMs를 포함하는, rAAV 벡터.
AAV8 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 다음을 포함하는 rAAV 벡터:
a. 5' 역전된 말단 반복부 (ITR);
b. 시스-작용 조절 모듈 (CRM);
c. 간 특이적 프로모터;
d. 마우스의 극미한 바이러스 (MVM);
e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열;
f. woodchuck 간염 바이러스 전사-후 조절 요소 (WPRE); 그리고
g. 3' ITR.
청구항 18에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열인, rAAV.
청구항 19에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 6과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 코돈-최적화된 서열인, rAAV.
청구항 18에 있어서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 인코딩하는 서열을 더 포함하는 rAAV.
AAV9 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 다음을 포함하는 rAAV 벡터:
a. 5' 역전된 말단 반복부 (ITR);
b. 시스-작용 조절 모듈 (CRM);
c. 산재된 프로모터;
d. 마우스의 극미한 바이러스 (MVM);
e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열;
f. woodchuck 간염 바이러스 전사-후 조절 요소(WPRE); 그리고
g. 3' ITR.
청구항 22에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열인, rAAV.
청구항 23에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 6과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 코돈-최적화된 서열인, rAAV.
청구항 22에 있어서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 인코딩하는 서열을 더 포함하는 rAAV.
전술한 청구항들중 임의의 한 항에 있어서, 이때 상기 rAAV 벡터는 ApoB를 포함하지 않는, rAAV.
Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법에 있어서, 이 방법은 전술한 청구항들중 임의의 한 항의 rAAV를 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법.
Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법에 있어서, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된, 방법.
청구항 28에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 혈청에서 검출되는, 방법.
청구항 28-29중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 간에서 검출되는, 방법.
청구항 28-30중 임의의 한 항에 있어서, 이때 상기 I2S 활성은 중추 신경계 (CNS)에서 검출되는, 방법.
청구항 28-31중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 뇌에서 검출되는, 방법.
청구항 28-32중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 검출되는, 방법.
청구항 28-33중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 신장에서 검출되는, 방법.
청구항 28-34중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 단일 투여 후, 적어도 30일, 60일, 90일, 120일, 150일, 180일 또는 그 이상 동안 유지되는, 방법.
청구항 28-35중 임의의 한 항에 있어서, 이때 I2S 활성 수준은 헤파린 설페이트 분석에 의해 측정되는, 방법.
청구항 28-35중 임의의 한 항에 있어서, 이때 I2S 활성 수준은 데르마탄 설페이트 분석에 의해 측정되는, 방법.
청구항 28-37중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체에서 글리코사미노글리칸 (GAG)의 수준이 감소되는, 방법.
청구항 38에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 혈청에서 GAG 수준이 감소되는, 방법.
청구항 38-39중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 간에서 GAG 수준이 감소되는, 방법.
청구항 38-40중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 신장에서 GAG 수준이 감소되는, 방법.
청구항 38-41중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 CNS에서 GAG 수준이 감소되는, 방법.
청구항 38-41중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 뇌에서 GAG 수준이 감소되는, 방법.
청구항 43에 있어서, 이때 상기 AAV의 투여로 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 GAG 수준이 감소되는, 방법.
청구항 28-44중 임의의 한 항에 있어서, 이때 상기 AAV는 정맥내로 투여되는, 방법.
청구항 30-44중 임의의 한 항에 있어서, 이때 상기 AAV는 경막 내로 투여되는, 방법.
청구항 45 또는 46에 있어서, 이때 상기 AAV는 약 5 x 10⁹ vg의 투여분량으로 투여되는, 방법.
청구항 30-47중 임의의 한 항에 있어서, 이때 상기 AAV 투여로 면역 반응이 야기되지 않는, 방법.