KR20180099719A

KR20180099719A - 눈 장애에 대한 유전자 요법

Info

Publication number: KR20180099719A
Application number: KR1020187019811A
Authority: KR
Inventors: 진 베네트; 쟈네트 베니첼리; 준웨이 선
Original assignee: 더 트러스티스 오브 더 유니버시티 오브 펜실바니아
Priority date: 2015-12-14
Filing date: 2016-12-13
Publication date: 2018-09-05
Also published as: CA3008264A1; JP2022088656A; CN109069668A; MX2022010959A; MX2018007230A; AU2016370487C1; EP3389724B1; HK1258518A1; WO2017106202A3; RU2018125468A3; WO2017106202A2; AU2016370487A1; CN109069668B; US20210330816A1; EP3389724A2; BR112018011838A2; RU2018125468A; JP2019502378A; ES2826384T3; US11090392B2

Abstract

대상체의 눈 장애를 치료하기 위한 조성물 및 방법이 제공된다. 한 측면으로, CNGA3을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 다른 측면으로, CNGB3을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 측면으로, REP-1을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 바람직한 구체예에서, 대상체는 인간, 고양이, 개, 양 또는 비-인간 영장류이다.

Description

눈 장애에 대한 유전자 요법

본 발명은 눈 장애에 대한 유전자 요법에 관한 것이다.

전자 형태로 제출된 자료의 참조에 의한 통합

출원인은 전자 형태로 별첨하여 제출된 서열 목록 자료를 참조로 통합한다. 이 파일의 제목은 "16-7660PCT_Seq_Listing_ST25.txt"이다.

범맥락막 위축 (CHM)은 광수용체, 망막 색소 상피 (RPE) 및 맥락막 모세혈관층의 변성을 특징으로 하는 X-결합된 유전성 망막 질환이다. 증상은 생애 중 십대 또는 이십대 안에 불량한 야간 시야 (야맹증) 및 주변 시야의 점진적 상실의 합병증과 함께 나타난다. 이것은 결국 중심 시야 (시력)의 상실 및 생애 중 사십대에 조기 실명으로 끝이 난다. CHM 유전자의 140개 이상의 돌연변이가 범맥락막 위축을 유발하는 것으로 밝혀졌다. 돌연변이는 비정상적으로 작은, 비기능성 및/또는 불안정한 Rab 에스코트(Escort) 단백질-1 (REP-1) 단백질의 생성, 단백질 기능의 감소 또는 REP-1 단백질 생성의 상실을 유발할 수 있다. 정상적인 REP-1의 부족은 세포내 교환을 보조하는 Rab 단백질의 능력을 파괴한다. 세포 내에서 단백질 및 소기관의 고정은 세포가 불량하게 기능하고 시기상조로 사멸하는 것을 유발한다.

범맥락막 위축 유전자, CHM은 막 교환의 조절에 포함된 653개의 아미노산 단백질인 Rab 에스코트 단백질-1 (REP-1)을 암호화한다. CHM 유전자좌가 X-염색체상에 있기 때문에, 범맥락막 위축은 전형적으로 남성에서만 진단된다. 비록 질환의 여성 보균자가 보통은 무증상이긴 하지만, 망막 검사는 때로 망막 및 RPE의 군데군데의 변성을 드러내고 여성 개인은 정상 X 염색체의 X-비활성화 (라이온화(lyonization))정도에 따라 영향을 받을 수 있다. Coussa, RG, Traboulsi, EI (2012) Choroidermia: a review of general findings and pathogenesis, Ophthalmic Genet 33(2):57-65 (본원에 참조로 포함됨). 또한 Vasireddy et al, AAV-mediated gene therapy for Choroidermia: preclinical studies in personalized models. PLoS One. 2013 May 7;8(5):e61396 참조 (본원에 참조로 포함됨).

색맹은 조기에 시작된 시력 감소, 손상된 또는 완전한 색맹, 안구진탕증, 광선 공포증(photoa버전) 및 추상체 광수용체 기능의 상실을 특징으로 하는 상염색체 열성 유전성 망막 질환의 이질적 그룹이다. 색맹 환자의 약 80%가 추상체 광수용체의 cGMP 조절된 양이온 채널 고리형 뉴클레오타이드-게이트 채널 (CNG)의 알파 또는 베타 하위유닛 (A3 및 B3)의 돌연변이를 보인다. 인간 질환과 상동하게, Cnga3 결핍 마우스들은 질병에 걸린 추상체 광수용체의 기능 부전 및 변성을 유발하는 추상체 특이적 기능성의 상실을 나타낸다.

그러므로 인간 대상체에서 CNGA3 또는 CNGB3을 발현하는데 유용한 조성물이 요구된다.

범맥락막 위축 (CHM)은 야맹증 및 주변 시야의 상실을 유발하는 생애의 10대 또는 20대에 증상을 보이는 X-결합된 망막 변성이다. 질환은 중년기를 통해 진행되고, 대부분의 환자가 그때에 실명하게 된다. CHM은 질환이 CHM 유전자에 의해 암호화되는, 망막 세포 건강에 필요한 단백질인 Rab 에스코트 단백질 1 (REP1)의 기능의 상실로 인한 것이기 때문에, 유전자 증대 요법에 대해 선호되는 표적이다. CHM cDNA는 인간 유전자 요법 연구에서 수립된 실적이 있는 재조합 아데노-관련 바이러스 (rAAV)에서 포장될 수 있다. 또한, REP1 활성을, 그것이 Rab27과 같은 Rab 단백질을 프레닐화하고 REP-1 결핍 세포에서 프레닐화의 부족으로 인한 Rab27 정위 및 교환에서의 결함을 보정하는 능력을 포함하여 증명하기 위한 민감하고 정량적인 검정법이 있다.

한 측면으로, Rab 에스코트 단백질-1 (REP-1)을 암호화하는 코돈 최적화된 cDNA 서열이 제공된다. 한 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 3의 변종이다. 다른 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 1의 변종이다. 또 다른 구체예에서, cDNA 서여른 인간에서의 발현을 위해 코돈 최적화된다.

다른 측면으로, 발현 카세트는 REP-1을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 1의 cDNA 서열을 포함한다. 또 다른 구체예에서, REP-1 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다. 한 구체예에서, 벡터 게놈은 5' ITR 및 3' ITR을 포함하여 그 사이의 모든 핵산 서열을 포함한다.

다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 Rab 에스코트 단백질-1 (REP-1)을 암호화하는 핵산 서열, 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, REP-1 서열은 전체 길이 REP-1 단백질을 암호화한다. 한 구체예에서, REP-1 서열은 SEQ ID NO: 2의 단백질 서열이다.

한 측면으로, 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 cDNA 서열이 제공된다. 한 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 13 또는 SEQ ID NO: 15의 변종이다. 다른 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 9 또는 SEQ ID NO: 11이다. 또 다른 구체예에서, cDNA 서열은 인간에서의 발현을 위해 코돈 최적화된다.

다른 측면으로, 발현 카세트는 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, 또는 SEQ ID NO: 15의 cDNA 서열을 포함한다. 또 다른 구체예에서, CNGA3 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다.

또 다른 측면으로, 발현 카세트는 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGB3)을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 19 또는 SEQ ID NO: 21 또는 SEQ ID NO: 23의 cDNA 서열을 포함한다. 또 다른 구체예에서, CNGB3 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다.

또 다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 CNGA3을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, CNGA3 서열은 전체 길이 CNGA3 단백질을 암호화한다. 한 구체예에서, CNGA3 서열은 SEQ ID NO: 10, SEQ ID NO: 12 또는 SEQ ID NO: 14의 단백질 서열이다.

또 다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 CNGB3을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, CNGB3 서열은 전체 길이 CNGB3 단백질을 암호화한다. 한 구체예에서, CNGB3 서열은 SEQ ID NO: 20의 단백질 서열이다.

다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다.

또 다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다.

또 다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGB3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다.

다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다.

또 다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다.

또 다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGB3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다.

다른 측면으로, 제약학적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제 및 적어도 본원에서 기술된 바이러스 벡터를 포함하는 제약학적 조성물이 제공된다.

추가의 측면으로, 제약학적 조성물은 제약학적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제 및 본원에서 구체적으로 기술된 핵산 서열, 플라스미드, 벡터, 또는 바이러스 벡터, 예컨대 rAAV를 포함한다.

다른 측면으로, 범맥락막 위축을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 REP-1을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.

또 다른 측면으로, 색맹을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 CNGA3을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.

또 다른 측면으로, 색맹을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 CNGB3을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.

또 다른 측면으로, AAV 벡터의 제조를 위한 플라스미드가 제공된다. 한 구체예에서, 플라스미드는 본원에서 기술된 REP-1을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 다른 구체예에서, 플라스미드는 본원에 기술된 CNGA3을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 또 다른 구체예에서, 플라스미드는 SEQ ID NO: 19 또는 SEQ ID NO: 21과 적어도 70%의 동일성을 공유하는 서열인 CNGB3을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 한 구체예에서, 플라스미드는 모듈식이다.

다른 측면으로, rAAV 바이러스를 생성하는 방법이 제공된다. 방법은 유전자 발현 카세트 바이러스 게놈을 감염성 AAV 엔벨로프 또는 캡시드 안으로 포장하는 것을 허용하는 충분한 바이러스 서열의 존재하에 본원에서 기술된 플라스미드를 지닌 포장 세포를 배양하는 단계를 포함한다. 다른 측면에서, 그 방법에 따라 제조된 재조합 AAV가 제공된다.

발명의 다른 측면 및 장점들은 이어지는 발명의 상세한 설명으로부터 쉽게 드러날 것이다.

도 1A 및 도 1B는 배양된 84-31 HEK 세포의 트랜스펙션 후에 시험관내에서의 REP-1 단백질 발현을 보여주는 겔이다. 각 겔의 제 1 레인은 플라스미드 p944로부터 발현된, 본원에 기술된 코돈-최적화된 REP-1의 발현을 나타낸다. 제 2 레인은 플라스미드 p742로부터의 천연 REP-1의 발현을 나타낸다. 제 3 레인은 플라스미드로 트랜스펙션되지 않은 84-31 세포에 의한 REP-1의 내인성 발현을 나타낸다. 마지막 레인은 블랭크이다. 겔은 본원에 기술된 코돈-최적화된 REP-1 서열이 REP-1 서열보다 높은 수준의 단백질 발현을 초래하고, 외인성으로 트랜스펙션된 플라스미드로부터의 발현 수준이 내인성 REP-1 발현보다 수-배 더 높은 것을 증명한다.
도 2는 SEQ ID NO: 1의 천연 REP-1 코딩 서열 대비 SEQ ID NO: 3의 코돈 최적화된 REP-1 코딩 서열의 배열을 도시한다.
도 3은 SEQ ID NO: 13의 천연 CNGA3 코딩 서열 대비 SEQ ID NO: 9의 코돈 최적화된 CNGA3 코딩 서열의 배열을 도시한다.
도 4는 CNGB3 천연 ORF (SEQ ID NO: 19) 대비 CNGB3 변형된 ORF (SEQ ID NO: 21) 대비 변형된 단부를 가진 CNGB3 변형된 orf (SEQ ID NO: 23)의 배열을 도시한다. 점 돌연변이가 강조된다.
도 5는 본원에 기술된 p584의 플라스미드 지도를 도시한다. p584의 서열은 SEQ ID NO: 7에 나타낸다.
도 6은 본원에 기술된 AAV.hCHMco.버전 2a의 플라스미드 지도를 도시한다. 버전 2a의 서열은 SEQ ID NO: 25에 나타낸다.
도 7은 본원에 기술된 AAV.hCHMco.버전 2b의 플라스미드 지도를 도시한다. 버전 2b의 서열은 SEQ ID NO: 26에 나타낸다.
도 8은 본원에 기술된 AAV.hCHMco.버전 3a의 플라스미드 지도를 도시한다. 버전 3a의 서열은 SEQ ID NO: 27에 나타낸다.
도 9는 본원에 기술된 AAV.hCHMco.버전 3b의 플라스미드 지도를 도시한다. 버전 3b의 서열은 SEQ ID NO: 28에 나타낸다.
도 10은 본원에 기술된 AAV.hCHM.버전 1의 플라스미드 지도를 도시한다. 버전 1의 서열은 SEQ ID NO: 29에 나타낸다.
도 11은 AAV 생성물 불순물에 대한 람다 삽입물의 효과를 그래프로 도시한다. 모든 a-버전 (람다 함유) 벡터를 qPCR 테스트로부터 훨씬 감소된 Kan+ 신호를 가진다.
도 12A는 5E9 (고용량) 벡터 게놈 복사물의 AAV8.2b로 주입된 CD-1 마우스의 눈 조직에서 ~75 내지 80 kDa의 단백질의 인간 항-REP-1 항체 검출을 보여주는 웨스턴 블롯을 도시한다. 5E8 (저용량)의 AAV8.2b로 주입된 동물들은 ~75 내지 80 kDa에서 매우 희미한 단백질 밴드를 나타냈다. 도 12B는 항-REP-1 항체로 검출된 AAV8.3b 주입된 CD1 (2마리 마우스/그룹)의 눈 조직의 웨스턴 블롯 분석을 도시하는데, 분석은 저용량으로 주입된 한 눈에서 및 고용량의 AAV8.3b로 주입된 양 눈에서 ~75 내지 80 kDa의 단백질의 존재를 나타냈다. 미주입 마우스의 눈 조직에서는 REP-1 발현이 검출되지 않았다.

본원에 기술된 방법 및 조성물은 눈의 장애, 주로 범맥락막 위축과 같은, 실명에 이르는 질환의 치료를 위해 포유류 대상체에게 REP-1을 암호화하는 최적화된 CHM을 전달하기 위한 조성물 및 방법을 포함한다. 또한, 본원에 기술된 방법 및 조성물은 눈의 장애, 주로 색맹과 같은 실명에 이르는 질환의 치료를 위해 포유류 대상체에게 최적화된 CNGA3 또는 CNGB3을 전달하기 위한 조성물 및 방법을 포함한다. 한 구체예에서, 그러한 조성물은 REP-1, CNGA3 또는 CNGB3 코딩 서열의 코돈 최적화를 포함한다. 이 특징들은 생성물의 효능을 증가시키고, 저용량의 시약이 사용되기 때문에, 안전성을 증가시킨다. 도입유전자 카세트의 이런 최적화는 내인성 서열을 사용하여 생성될 수 있는 수준과 비교하여 실험 단백질의 생성 수준을 이론적으로는 최대화시킬 수 있을 것으로 예상된다. 그러나, 또한 본원에는 SEQ ID NO: 3, SEQ ID NO: 13 및 SEQ ID NO: 19에서 각각 나타난 것과 같은 천연 REP1, CNGA3, 및 CNGB3 코딩 서열을 포함하는 조성물이 포함된다. 구체예가 REP-1, CNGA3 또는 CNGB3 중 어느 하나에 대해 기술될 때 유사한 구체예는 다른 것에 인용될 것으로 의도된다는 것이 인지되어야 한다.

본원에서 사용된 기술적이고 과학적인 용어들은 본 발명이 속하는 기술분야의 숙련자에 의해 통상적으로 이해되는 것과 같은 의미를 가지며, 공개된 텍스트를 참조로, 기술분야의 숙련자에게 본 출원에서 사용되는 많은 용어들에 대한 일반적인 가이드를 제공한다. 본 명세서에 포함된 정의는 본원의 성분 및 조성물을 기술함에 있어 명료함을 위해 제공되며 청구된 발명을 제한하려는 의도는 아니다.

범맥락막 위축 유전자, CHM는 막 교환에 포함된 것으로 여겨지는 653개의 아미노산 단백질인 Rab 에스코트 단백질-1 (REP-1)을 암호화한다. 본원에서 사용되는 용어 "REP-1" 및 "CHM"은 코딩 서열을 언급할 때에는 상호교환적으로 사용된다. CHM 유전자좌가 X-염색체 상에 있기 때문에, 범맥락막 위축은 전형적으로 남성에서만 진단된다. 비록 질환의 여성 보균자는 보통 무증상이긴 하지만, 망막 검사는 때로 망막 및 RPE의 군데군데의 변성을 드러내고 여성 개인은 정상 X 염색체의 X-비활성화 (라이온화)정도에 따라 영향을 받을 수 있다. 상기 인용된 Coussa 참조. 인간 REP-1을 암호화하는 천연 아미노산 서열은 GenBank 승인 번호 P24386으로 기록되고, 본원에서는 SEQ ID NO: 2로 재생된다. CHM의 천연 인간 핵산 서열은 본원에서 SEQ ID NO: 3 (승인 번호 NM_000390.2)으로 재생된다.

고리형 뉴클레오타이드-게이트 (CNG) 이온 채널은 망막 및 후각 수용체에서 신호 변환 기저에 있는 핵심 매개체이다. 추상체 CNG 채널의 2개의 구조적으로 관련된 하위유닛을 암호화하는, CNGA3 및 CNGB3의 유전적 결함은 색맹을 유발하는 것으로 알려져 있다. CNGA3은 694개의 아미노산 단백질이다. CNGB는 809개의 아미노산 단백질이다.

색맹은 조기에 시작된 추상체 광수용체 기능부전, 심각하게 감소된 시력, 손상된 또는 완전한 색맹 및 광선공포증을 나타내는 선천성, 상염색체 열성 망막 장애의 이질적 그룹이다. 인간 CNGA3을 암호화하는 천연 핵산 서열은 GenBank 승인 번호 XM_011210554.1로 기록되고, SEQ ID NO: 13으로 재생된다. 인간 CNGA3을 암호화하는 천연 핵산 서열은 GenBank 승인 번호 XM_011210554.1로 기록되고, SEQ ID NO: 13으로 재생된다. 추가의 엑손을 포함하는, 인간 CNGA3 X1 변종에 대한 천연 핵산 서열은 GenBank 승인 번호 NM_001298.2로 기록되고, SEQ ID NO: 15로 재생된다. 인간 CNGB3을 암호화하는 천연 핵산 서열은 SEQ ID NO: 19로 재생된다.

본 발명의 특정 구체예에서, 대상체는 그것의 치료를 위해 본 발명의 성분, 조성물 및 방법이 디자인되는 "눈 장애"를 가진다. 본원에서 사용되는 용어 "대상체"는 본원에서 포유류 동물, 이를테면 인간, 수의학적 또는 사육 동물, 가축 또는 애완동물, 및 임상 연구를 위해 정상적으로 사용된 동물을 의미한다. 한 구체예에서, 이 방법 및 조성물들의 대상체는 인간이다. 또 다른 적합한 대상체는, 제한 없이, 쥐과, 래트, 개, 고양이, 돼지, 소, 양, 비-인간 영장류 등이다. 본원에서 사용되는 용어 "대상체"는 "환자"와 상호교환적으로 사용된다.

본원에서 사용되는 "눈 장애"는 추상체-간상체 이영양증 및 망막 질환, 이를테면 제한 없이, 스타트가르트병 (상염색체 우성 또는 상염색체 열성), 색소성 망막염, 무늬 이상증을 포함한다. 한 구체예에서, 대생체는 색맹을 가진다. 다른 구체예에서, 대상체는 범맥락막 위축 또는 X-결합 유전성 망막 변성을 가진다. 그러한 눈 질환의 임상적 신호는, 한정하는 것은 아니지만, 감소된 주변 시야, 감소된 중심 (독서) 시야, 감소된 야간 시야, 색 지각의 상실, 시력의 감소, 감소된 광수용체 기능, 색소 변화 및 궁극적으로 실명을 포함한다.

본원에서 사용되는 용어 "치료" 또는 "치료하는"는 대상체에게 하나 이상의 눈 질환 증상의 개선을 목적으로 본원에 기술된 하나 이상의 화합물 또는 조성물을 투여하는 것을 포함하는 것으로 정의된다. 그러므로 "치료"는 주어진 대상체의 눈 질환의 시작 또는 진행의 감소, 질환의 예방, 질환 증상의 심각성의 감소, 또는 실명의 진행을 포함하여 그것들의 진행의 지연, 질환 증상의 제거, 질환의 시작의 지연 또는 질환의 진행 또는 치료법의 효능의 모니터링 중 하나 이상을 포함할 수 있다.

핵산 서열 또는 단백질을 기술하기 위해 사용된 용어 "외인성"은 핵산 또는 단백질이 그것이 염색체, 또는 숙주 세포에 존재하는 위치에서 자연적으로 발생하지 않는 것을 의미한다. 외인성 핵산 서열은 또한 동일한 숙주 세포 또는 대상체로부터 유래되고 삽입되지만, 비-천연 상태, 예컨대 상이한 복사물 수로 존재하거나, 상이한 조절 요소의 제어 하에 있는 서열을 나타낸다.

핵산 서열 또는 단백질을 기술하기 위해 사용된 용어 "이종성"은 핵산 또는 단백질이 그것이 발현되는 숙주 세포 또는 대상체보다는 상이한 유기체로부터 또는 동일한 유기체의 상이한 종으로부터 유래되는 것을 의미한다. 용어 "이종성"은 플라스미드, 발현 카세트 또는 벡터의 단백질 또는 핵산을 참조로 사용될 때, 단백질 또는 핵산이 문제의 그 단백질 또는 핵산이 자연적으로 서로 동일한 관계에서 발견되지 않는 또 다른 서열 또는 하위서열과 함께 존재하는 것을 가리킨다.

용어 "퍼센트 (%) 동일성", "서열 동일성", "퍼센트 서열 동일성" 또는 "동일한 퍼센트"는 핵산 서열의 맥락에서 상응성을 위해 배열될 때 동일한 두 서열의 염기를 나타낸다. 퍼센트 동일성은 비교될 서열에 걸쳐 최적의 조건 하에서 배열된 두 서열을 비교함으로써 측정된다. 서열 동일성 비교의 길이는 REP-1, CNGA3 또는 CNGB3 코딩 서열의 전체 길이에 걸쳐 있거나, 또는 적어도 약 100 내지 150개의 뉴클레오타이드의 단편, 또는 원하는 대로일 수 있다. 그러나, 예컨대 적어도 약 9개의 뉴클레오타이드, 보통 적어도 약 20 내지 24개의 뉴클레오타이드, 적어도 약 28 내지 32개의 뉴클레오타이드, 적어도 약 36개 이상의 뉴클레오타이드의 더 작은 단편들 사이의 동일성이 또한 바람직할 수 있다. 다중 서열 배열 그로프갬 또한 핵산 서열에 대해 이용할 수 있다. 그러한 프로그램의 예로는 "Clustal W", "CAP 서열 어셈블리", "BLAST", "MAP" 및 "MEME"을 포함하고, 그것들은 인터넷 상에서 웹 서버를 통해 접근 가능하다. 그런 프로그램들에 대한 다른 공급원은 기술분야의 숙련자들에게 알려져 있다. 다르게는, 벡터 NTI 유틸리티가 또한 사용된다. 기술분야에는 상기 기술된 프로그램들에 함유된 것들을 포함하여, 뉴클레오타이드 서열 동일성을 측정하기 위해 사용될 수 있는 많은 알고리즘이 알려져 있다. 다른 예로서, 폴리뉴클레오타이드 서열은 GCG 버전 6.1의 프로그램인 Fasta^TM을 사용하여 비교될 수 있다. 흔하게 이용할 수 있는 서열 분석 소프트웨어, 보다 구체적으로, BLAST 또는 공공 데이터베이스에 의해 제공된 분석 도구가 또한 사용될 수 있다.

용어 "분리된"은 물질이 그것의 원래의 환경 (예컨대 자연적으로 발생한 것이라면 자연 환경)으로부터 제거된 것을 의미한다. 예를 들어, 살아있는 동물에 존재하는 자연적으로 발생하는 폴리뉴클레오타이드 또는 폴리펩타이드는 분리되지 않지만, 자연계에서 공존하는 물질의 일부 또는 전부로부터 분리된 동일한 폴리뉴클레오타이드 또는 폴리펩타이드는, 계속해서 자연계로 재도입된다 하더라도 분리된다. 그러한 폴리뉴클레오타이드는 벡터의 일부가 되거나 및/또는 그러한 폴리뉴클레오타이드 또는 폴리펩타이드는 조성물의 일부가 될 수 있고, 그러한 벡터 또는 조성물이 그것의 자연적 환경의 일부가 아니라는 점에서 분리될 수 있다.

"엔지니어링된"은 본원에 기술된 REP-1 또는 CNGA3 또는 CNGB3 단백질을 암호화하는 핵산 서열이 조립되고, 예컨대 비-바이러스 전달 시스템 (예컨대 RNA-기반 시스템, 네이키드 DNA 등)을 생성하기 위해 또는 포장 숙주 세포에서 바이러스 벡터를 생성하거나 및/또는 대상체의 숙주 세포에의 전달을 위해 그 위에 담긴 EP-1 또는 CNGA3 또는 CNGB3 서열을 숙주 세포에 전달하는, 임의의 적합한 유전자 요소, 예컨대 네이키드 DNA, 파지, 트랜스포존, 코스미드, 에피좀 등에 놓이는 것을 의미한다. 한 구체예에서, 유전자 요소는 플라스미드이다. 그러한 엔지니어링된 구성물을 제조하기 위해 사용된 방법은 핵산 조작에 능숙한 사람들에게 알려져 있고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.

본원에서 사용된 용어 "도입유전자"는 발현 카세트, rAAV 게놈, 재조합 플라스미드 또는 제조 플라스미드, 벡터, 또는 본 명세서에서 기술된 숙주 세포에서 프로모터 또는 발현 제어 서열의 제어 하에 있는 외인성 또는 엔지니어링된 단백질-암호화 핵산 서열을 의미한다. 특정 구체예에서, 도입유전자는 기능성 REP-1 단백질을 암호화하는 인간 CHM (REP-1) 서열이다. 일부 구체예에서, 도입유전자는 SEQ ID NO: 2에 나타낸 EP-1 아미노산 서열을 암호화하는 코돈 최적화된 핵산 CHM (REP-1)이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 1에 나타낸 서열에 의해 암호화된다. 특정 구체예에서, REP-1 도입유전자는 SEQ ID NO: 5에 나타낸 서열에 의해 암호화된다. SEQ ID NO: 5는 변형된 단부를 포함하는데, 그것은 플라스미드, 예컨대 본원에서 기술된 제조 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함한다.

특정 구체예에서, 도입유전자는 기능성 CNGA3 단백질을 암호화하는 인간 CNGA3 서열이다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGA3 암호화 서열 SEQ ID NO: 10이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 9에 나타낸 서열에 의해 암호화된다. 한 구체예에서, 도입유전자는 플라스미드, 예컨대 본원에서 기술된 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함하는, SEQ ID NO: 16, SEQ IDNO 17 또는 SEQ ID NO: 18에 나타낸 것과 같은 변형된 단부를 포함한다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGA3 암호화 서열 SEQ ID NO: 12이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 11에 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 13에 나타낸, CNGA3의 천연 코딩 서열에 의해 암호화된다.

특정 구체예에서, 도입유전자는 기능성 CNGB3 단백질을 암호화하는 인간 CNGB3 서열이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 19 또는 21과 적어도 70%의 동일성을 공유하는 서열인 코돈 최적화된 CNGB3 암호화 서열이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 23에 의해 나타낸 서열에 의해 암호화된다. SEQ ID NO: 23은 플라스미드, 예컨대 본원에서 기술된 제조 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함하는 변형된 단부를 포함한다. SEQ ID NO: 23의 뉴클레오타이드 13 내지 2448은 CNGB3에 대한 ORF를 제공한다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGB3 암호화 서열 SEQ ID NO: 20이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 19에 의해 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 21에 의해 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 플라스미드, 예컨대 본원에서 기술된 플라스미드 안으로 클로닝하기 위한 변형된 단부를 포함한다. SEQ ID NO: 21은 천연 코딩 서열에 대해 특정 침묵 돌연변이가 만들어져 있는 신규한 cDNA 서열이다. 본원에서 기술되는, 천연 서열에 대한 추가의 변형들이 발명에 의해 포함된다.

한 구체예에서, REP-1, CNGA 또는 CNGB를 암호화하는 핵산 서열은 추가로 그것에 공유 결합된 태그 폴리펩타이드를 암호화하는 핵산을 포함한다. 태그 폴리펩타이드는 제한 없이, myc 태그 폴리펩타이드, 글루타티온-S-트란스페라제 태그 폴리펩타이드, 녹색 형광 단백질 태그 폴리펩타이드, myc-피루베이트 키나아제 태그 폴리펩타이드, His6 태그 폴리펩타이드, 인플루엔자 바이러스 헤마글루티닌 태그 폴리펩타이드, 플래그(flag) 태그 폴리펩타이드, 및 말토오스 결합 단백질 태그 폴리펩타이드를 포함하여, 공지된 "에피토프 태그"로부터 선택될 수 있다.

본원에서 사용된 "벡터"는 외인성 또는 이종성 또는 엔지니어링된 핵산 도입유전자가 삽입된 후 적절한 숙주 세포로 도입될 수 있는 핵산 분자이다. 벡터는 바람직하게 하나 이상의 복제 기원, 및 재조합 DNA가 삽입될 수 있는 하나 이상의 부위를 가진다. 벡터는 자주 벡터를 가진 세포가 벡터가 없는 세포로부터 선택될 수 있는 편리한 수단을 가지는데, 예컨대 벡터는 약물 내성 유전자를 암호화한다. 통상적인 벡터는 플라스미드, 바이러스 게놈, 및 (주로 효모 및 박테리아에서) "인공 염색체"를 포함한다. 특정 플라스미드는 본원에서 기술된다.

"바이러스 벡터"는 외인성 또는 이종성 CHM (REP-1) 또는 CNGA3 또는 CNGB3 핵산 도입유전자(들)를 함유하는 복제 결핍 바이러스로서 규정된다. 한 구체예에서, 본원에서 기술된 발현 카세트는 약물 전달 또는 바이러스 벡터의 제조를 위해 사용된 플라스미드 위에서 엔지니어링될 수 있다. 적합한 바이러스 벡터는 바람직하게는 복제 결핍성이고 눈 세포를 표적으로 하는 것들 중에서 선택된다. 바이러스 벡터는 한정하는 것은 아니지만 아데노바이러스; 헤르페스 바이러스; 렌티바이러스; 레트로바이러스; 파르보바이러스 등을 포함하여, 유전자 요법에 적합한 임의의 바이러스를 포함할 수 있다. 그러나, 이해를 쉽게 하기 위해, 본원에서 아데노-관련 바이러스가 예시의 바이러스 벡터로서 참조된다.

"복제-결핍 바이러스" 또는 "바이러스 벡터"는 관심의 유전자를 함유한 발현 카세트가 바이러스 캡시드 또는 엔벨로프에 포장되는 합성 또는 재조합 바이러스 입자를 나타내고고, 이때 또한 바이러스 캡시드 또는 엔벨로프 내에 포장된 임의의 바이러스 게놈 서열은 복제-결핍성이다; 즉 그것들은 자손 비리온을 생성할 수 없지만 표적 세포를 감염시키는 능력을 보유한다. 한 구체예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소들을 암호화하는 유전자를 포함하지 않지만 (게놈은 "거트리스(gutless)"가 되도록 엔지니어링될 수 있다 - 인공 게놈의 증폭 및 포장에 필요한 신호들이 양 옆에 있는 관심의 도입유전자를 함유함), 이 유전자들은 제조 중에 공급될 수 있다. 그러므로, 자손 비리온에 의한 복제 및 감염은 복제에 필요한 바이러스 효소의 존재하에 있는 것을 제외하고 일어날 수 없기 때문에 유전자 요법에 사용하기에 안전한 것으로 보인다.

또 다른 구체예에서, 본원에서 기술된 것들 중 임의의 것을 포함하는 발현 카세트가 재조합 AAV 게놈을 생성하기 위해 사용된다.

본원에서 사용되는 용어 "숙주 세포"는 재조합 AAV가 제조 플라스미드로부터 제조되는 포장 세포주를 나타낼 수 있다. 다르게는, 용어 "숙주 세포"는 도입유전자의 발현이 바람직한 임의의 표적 세포를 나타낼 수 있다. 그러므로, "숙주 세포"는 임의의 수단, 예컨대 전기천공법, 인산칼슘 침전법, 마이크로주입, 형질전환, 바이러스 감염, 트랜스펙션, 리포좀 전달, 막융합 기법, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질 융합에 의해 세포 안으로 도입된 외인성 또는 이종성 DNA를 함유하는 원핵 또는 진핵 세포를 나타낸다.

본원의 특정 구체예에서, 용어 "숙주 세포"는 본원에 기술된 조성물의 시험관내 평가를 위한 다양한 포유류 종의 눈 세포의 배양물을 나타낸다. 본원의 다른 구체예에서, 용어 "숙주 세포"는 바이러스 벡터 또는 재조합 바이러스를 생성하고 포장하기 위해 사용된 세포를 나타낸다. 다른 구체예에서, 용어 "숙주 세포"는 눈 질환에 대해 생체내에서 치료되는 대상체의 눈 세포를 참조하기 위한 것으로 의도된다.

본원에서 용어 "눈 세포"는 눈의 임의의 세포, 또는 눈의 기능과 관련된 임의의 세포를 나타낸다. 용어는 간상체 광수용체, 추상체 광수용체 및 감광성 신경절 세포, 망막 색소 상피 (RPE) 세포, 뮐러 세포, 맥락막 세포, 양극성 세포, 수평 세포 및 무축삭 세포를 포함하여, 광수용체 세포 중 임의의 것을 나타낼 수 있다. 한 구체예에서, 눈 세포는 광수용체 세포이다. 다른 구체예에서, 눈 세포는 RPE 세포이다.

"플라스미드"는 일반적으로 본원에서 기술분야의 숙련자들에게 친숙한 표준 명명 관례에 따라, 소문자 p가 앞에 있고 및/또는 이어서 대문자 및/또는 번호로 본원에서 지정된다. 본 발명에 따라 사용될 수 있는 많은 플라스미드 및 다른 클로닝 및 발현 벡터들이 잘 알려져 있고 기술분야의 숙련자들에게 쉽게 이용될 수 있다. 더욱이, 숙련자들은 본 발명에 사용하기에 적합한 임의의 수의 다른 플라스미드를 쉽게 구성할 수 있다. 본 발명에서 그러한 플라스미드, 뿐만 아니라 다른 벡터의 특성, 구성 및 사용은 본 개시로부터 숙련자들에게 쉽게 드러날 것이다.

본원에서 사용되는 용어 "전사 제어 서열" 또는 "발현 제어 서열"은 그것들이 작동 가능하게 연결된 단백질 암호화 핵산 서열의 전사를 유도, 억제 또는 그렇지 않으면 제어하는 DNA 서열, 예컨대 개시자 서열, 인핸서 서열 및 프로모터 서열을 나타낸다.

본원에서 사용되는 용어 "작동 가능하게 연결된" 또는 "작동 가능하게 결합된"은 둘 다 REP-1 또는 CNGA3을 암호화하는 핵산 서열 및/또는 그것의 전사 및 발현을 제어하기 위하여 트란스로 또는 떨어져서 작용하는 발현 제어 서열과 연속적인 발현 제어 서열을 나타낸다.

본원에서 사용된 용어 "AAV" 또는 "AAV 혈청형"은 수십 개의 자연적으로 발생하는 및 이용 가능한 아데노-관련 바이러스, 뿐만 아니라 인공 AAV를 나타낸다. 인간 또는 비-인간 영장류 (NHP)로부터 분리되거나 엔지니어링되고 특성화가 잘 되어 있는 AAV 중에서, 인간 AAV2가 유전자 전달 벡터로서 개발된 첫 번째 AAV이다; 그것은 상이한 표적 조직 및 동물 모델에서 효과적인 유전자 전달 실험을 위해 광범위하게 사용되었다. 다르게 명시되지 않는 한, AAV 캡시드, ITR, 및 본원에서 기술된 다른 선택된 AAV 성분들은, 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV8bp, AAV7M8 및 AAVAnc80, 공지된 또는 언급된 AAV의 변종 또는 아직 발견되지 않은 AAV 또는 그것들의 변종 또는 혼합물을 포함하여, 임의의 AAV로부터 쉽게 선택될 수 있다. 예컨대 WO 2005/033321 (본원에 참조로 포함됨) 참조. 다른 구체예에서, AAV 캡시드는 우선적으로 양극서 세포를 표적으로 하는 AAV8bp 캡시드이다. WO 2014/024282 (본원에 참조로 포함됨) 참조. 다른 구체예에서, AAV 캡시드는 외망막에 우선적으로 전달되는 것으로 나타난 AAV7m8 캡시드이다. Dalkara et al, In Vivo-Directed Evolution of a New Adeno-Associated Virus for Therapeutic Outer Retinal Gene Delivery from the Vitreous, Sci Transl Med 5, 189ra76 (2013) (본원에 참조로 포함됨) 참조. 한 구체예에서, AAV 캡시드는 AAV8 캡시드이다. 다른 구체예에서, AAV 캡시드는 AAV9 캡시드이다. 또 다른 구체예에서, AAV 캡시드는 AAV5 캡시드이다. 또 다른 구체예에서, AAV 캡시드는 AAV2 캡시드이다.

AAV와 관련하여, 본원에서 사용된 용어 변종은 아미노산 또는 핵산 서열에 걸쳐 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 그 이상의 서열 동일성을 공유하는 것들을 포함하여, 공지된 AAV 서열로부터 유래된 임의의 AAV 서열을 의미한다. 다른 구체에에서, AAV 캡시드는 임의의 기술된 또는 공지된 AAV 캡시드 서열로부터 최대 약 10% 편차를 포함할 수 있는 변종을 포함한다. 즉, AAV 캡시드는 본원에 제공된 및/또는 기술분야에 공지된 AAV 캡시드에 대해 약 90% 동일성 내지 약 99.9% 동일성, 약 95% 내지 약 99% 동일성 또는 약 97% 내지 약 97% 동일성을 공유한다. 한 구체예에서, AAV 캡시드는 AAV 캡사드와 적어도 95%의 동일성을 공유한다. AAV 캡시드의 퍼센트 동일성을 측정할 때, 비교는 가변 단백질 (예컨대 vp1, vp2, 또는 vp3)의 어느 것에 대해 이루어질 수 있다. 한 구체예에서, AAV 캡시드는 AAV8 vp3과 적어도 95%의 동일성을 공유한다. 다른 구체예에서, 자체-상보성 AAV가 사용된다.

ITR 또는 다른 AAV 성분은 기술분야의 숙련자들이 입수 가능한 기법들을 사용하여 AAV로부터 쉽게 분리되거나 엔지니어링될 수 있다. 그러한 AAV는 학구적, 상업적 또는 공공연한 공급원 (예컨대 아메리칸 타입 컬춰 콜렉션, Manassas, VA)으로부터 분리되거나, 엔지니어링되거나 또는 얻어질 수 있다. 다르게는, AAV 서열은 합성 또는 다른 적합한 수단을 통해 문헌에서 또는 예컨대 GenBank, PubMed, 등과 같은 데이터베이스에서 입수 가능한 것과 같은 공개된 서열을 참조로 하여 엔지니어링될 수 있다. AAV 바이러스는 종래의 분자 생물학 기법에 의해 엔지니어링될 수 있어서, 핵산 서열의 세포 특이적 전달을 위해, 면역원성을 최소화하기 위해, 안정성 및 입자 수명을 조율하기 위해, 효과적인 분해를 위해, 핵으로의 정확한 전달을 위해서, 등에 이 입자들을 최적의 상태로 만다는 것이 가능하다.

본원에서 사용된 "인공 AAV"는, 제한 없이 자연적으로 발생하지 않는 캡시드 단백질을 가진 AAV를 의미한다. 그러한 인공 캡시드는 임의의 적합한 기법에 의하여, 선택된 AAV 서열 (예컨대 vp1 캡시드 단백질의 단편)을 상이한 선택된 AAV, 동일한 AAV의 비-연속성 부분, 비-AAV 바이러스 공급원 또는 비-바이러스 공급원으로부터 얻어질 수 있는 이종성 서열과 조합하여 사용하여 생성될 수 있다. 인공 AAV는, 제한 없이, 위형 (pseudotyped) AAV, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화된" AAV 캡시드일 수 있다. 한 AAV의 캡시드가 이종성 캡시드 단백질로 대체되어 있는 위형 벡터는 본 발명에 유용하다. 한 구체예에서, AAV2/5 및 AAV2/8이 예시의 위형 벡터이다.

"자체-상보성 AAV"는 재조합 AAV 핵산 서열에 의해 지니게 된 코딩 영역이 분자내 이중-가닥 DNA 주형을 형성하기 위해 디자인되어 있는 발현 카세트를 가지는 플라스미드 또는 벡터를 나타낸다. 감염시, 제 2 가닥의 세포 매개된 합성을 기다리기보다는 scAAV의 두 상보성 절반은 회합하여 즉각적인 복제 및 전사의 준비가 된 하나의 이중 가닥 DNA (dsDNA) 유닛을 형성할 것이다. 예컨대 D M McCarty et al, "Self-complementary recombinant aden-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254 참조. 자체-조립성 AAV는 예컨대 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683에서 기술되고, 이것들은 각각 본원에 그 전문이 참조로 포함된다.

방법에 사용된 "투여하는"은 눈 질환을 특징으로 하는 선택된 표적 세포에 조성물을 전달하는 것을 의미한다. 한 구체예에서, 방법은 RPE, 광수용체 세포 또는 다른 눈 세포에 망막밑 주입에 의해 조성물을 전달하는 것을 포함한다. 다른 구체예에서, 눈 세포에 대한 유리체강내 주입이 사용된다. 또 다른 방법에서, 안검 정맥을 통해 눈 세포에의 주입이 사용될 수 있다. 또 다른 투여 방법은 본 개시에서 기술분야의 숙련자에 의해 선택될 수 있다. "투여하는" 또는 "투여 경로"에 의해 제약학적 담체 또는 부형제와 함께 또는 그것들 없이, 본원에 기술된 조성물이 대상체에 전달된다. 투여 경로는 필요에 따라 조합될 수 있다. 일부 구체예에서, 투여는 주기적으로 반복된다. 본원에 기술된 제약학적 조성물은 임의의 적합한 경로 또는 상이한 경로들의 조합에 의해 그것을 필요로 하는 대상체에의 전달을 위해 디자인된다. 눈으로의 직접 전달 (선택적으로 눈 전달, 망막밑 주입, 망막내 주입, 유리체강내, 국소적 경로를 통해), 또는 전신성 경로를 통한 전달, 예컨대 동맥내, 안내 (intra ocular), 정맥내, 근육내, 피하, 피내, 및 다른 비경구 투여 경로. 본원에 기술된 핵산 분자 및/또는 벡터는 단일 조성물로 또는 다중 조성물로 전달될 수 있다. 선택적으로, 둘 이상의 상이한 AAV가 전달되거나, 또는 다중 바이러스가 전달될 수 있다 [예컨대 WO20 2011/126808 및 WO 2013/049493 참조]. 다른 구체예에서, 다중 바이러스는 상이한 복제-결핍 바이러스 (예컨대 AAV 및 아데노바이러스)를 단독으로 또는 단백질과 조합하여 함유할 수 있다.

본원에 기술된 특정 조성물은 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 신규한 코돈-최적화된 서열을 제공하는 분리된, 또는 합성적으로 또는 재조합적으로 엔지니어링된 핵산 서열이다. 한 구체예에서, 인간 REP-1을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 1이다. 다른 구체예에서, 코돈 최적화된 서열은 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 한 구체예에서, 예컨대 SEQ ID NO: 5에서 개시된 REP-1 코딩 서열은 Kozak 공통 서열에 더불어 N-말단 NotI 제한 부위 및 C-말단 BamHI 제한 부위를 포함한다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때, 코돈 최적화된 REP-1은 임의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 REP-1은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다. 한 구체예에서, 천연 핵산 서열 SEQ ID NO: 3과 배열될 때, 코돈 최적화된 REP-1 (SEQ ID NO: 1)은 단지 74%의 퍼센트 서열 동일성을 가지는 것으로 나타난다 (도 2 참조).

다른 구체예에서, 인간 CNGA3을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 9이다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 11에 나타낸 CNGA3 변종이다. 다른 구체예에서, 코돈 최적화된 서열은 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 한 구체예에서, CNGA3 코딩 서열은 Kozak 공통 서열에 더불어, N-말단 NotI 제한 부위 및 C-말단 BglII 제한 부위를 포함한다. 그러한 변형을 포함하는 CNGA3 서열의 예는 SEQ ID NO: 16, SEQ ID NO: 17 및 SEQ ID NO: 18에서 찾을 수 있다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때, 코돈 최적화된 CNGA3은 임의의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 CNGA3은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다. 한 구체예에서, 천연 핵산 서열 SEQ ID NO: 13과 배열될 때, 코돈 최적화된 CNGA3 (SEQ ID NO: 9)은 단지 80%의 퍼센트 서열 동일성을 가지는 것으로 나타난다 (도 3 참조).

다른 구체예에서, 인간 CNGB3을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 19 또는 SEQ ID NO: 21과 적어도 70%의 동일성을 공유하는 서열이다. 다른 구체예에서, 코돈 최적화된 서열은 SEQ ID NO: 23에 나타낸 것과 같이, 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때 (SEQ ID NO: 19에 나타낸 것과 같이), 코돈 최적화된 CNGB3은 임의의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 CNGB3은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다.

한 구체예에서, 본원에 기술된 REP-1 또는 CNGA3 구성물을 암호화하는 최적화된 핵산 서열은 예컨대 DNA 또는 RNA, 바이러스 벡터를 지닌 나노입자를 포장 숙주 세포에서 생성하기 위해 및/또는 대상체의 숙주 세포에 전달하기 위해 그 위에 담긴 REP-1 또는 CNGA3 서열을 숙주 세포에 전달하는 임의의 적합한 유전자 요소, 예컨대 네이키드 DNA, 파지, 트랜스포존, 코스미드, RNA 분자 (예컨대 mRNA), 에피좀 등에 엔지니어링된다. 한 구체예에서, 유전자 요소는 플라스미드이다.

선택된 유전자 요소는 트랜스펙션, 전기천공법, 리포좀 전달, 막 융합 기법, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질 융합을 포함하여, 임의의 적합한 방법에 의해 전달될 수 있다. 그러한 구성물을 만들기 위해 사용된 방법은 핵산 조작에 숙련된 사람들에게 알려져 있고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.

REP-1 단백질의 발현을 위해 SEQ ID No. 1 또는 5를 사용하는 다양한 발현 카세트가 제공된다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 25에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 26에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 27에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 28에 나타난다. 본원에서 사용되는 "벡터 게놈"은 ITR 자체를 포함하여, 5'와 3' ITR 사이에 포장된 핵산 서열이다. 일부 구체예에서, 용어 "벡터 게놈"은 "발현 카세트"와 상호교환적으로 사용된다. 그러므로, 한 구체예에서, 벡터 게놈은 5' ITR, CMV 인핸서, 닭의 베타-액틴 프로모터, CBA 엑손 1 및 인트론, Kozak 서열, 코돈 최적화된 CHM, bGH 폴리 A 및 3' ITR을 포함한다. 한 구체예에서, 벡터 게놈은 SEQ ID NO: 25의 nt 1 내지 4233을 포함한다. 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 26의 nt 1 내지 4233을 포함한다. 또 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 27의 nt 1 내지 4233을 포함한다. 또 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 28의 nt 1 내지 4233을 포함한다.

다른 구체예에서, CNGA3 단백질의 발현을 위해 SEQ ID No. 9, 11 또는 13을 사용하는 다양한 발현 카세트가 제공된다. 다른 구체예에서, CNGAB 단백질의 발현을 위해 SEQ ID No. 19, 21 또는 23을 사용하는 다양한 발현 카세트가 제공된다. 본원에서 사용되는 "발현 카세트"는 최적화된 REP-1 또는 CNGA3 또는 CNGB3 단백질, 프로모터에 대한 코딩 서열들을 포함하고, 그것에 대한 다른 조절 서열을 포함할 수 있는 핵산 분자를 나타내며, 카세트는 유전자 요소 또는 플라스미드로 엔지니어링될 수 있고, 및/또는 바이러스 벡터의 캡시드 안으로 포장될 수 있다 (예컨대 바이러스 입자). 한 구체예에서, 발현 카세트는 REP-1을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 REP-1을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 REP-1을 제공한다.

다른 구체예에서, 발현 카세트는 CNGA3을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 CNGA3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 CNGA3을 제공한다.

다른 구체예에서, 발현 카세트는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 CNGB3을 제공한다.

다른 구체예에서, AAV 벡터에 사용하기 위한 발현 카세트가 제공된다. 그 구체예에서, AAV 발현 카세트는 적어도 하나의 AAV 역 말단 반복부 (ITR) 서열을 포함한다. 다른 구체예에서, 발현 카세트는 5' ITR 서열 및 3' ITR 서열을 포함한다. 한 구체예에서, 5' 및 3' ITR은 선택적으로 숙주 세포에서 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 추가의 서열과 함께, REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 양 옆에 있다. 그러므로, 본원에서 기술된 것과 같이, AAV 발현 카세트는 그것의 5' 단부 옆에 5'AAV 역 말단 반복부 서열 (ITR)이 있고 그것의 3' 단부 옆에 3' AAV ITR이 있는 상기 기술된 발현 카세트를 묘사하는 것을 의미한다. 그러므로, 이 rAAV 게놈은 발현 카세트를 AAV 바이러스 입자 안에 포장하기 위해 필요한 최소 서열, 즉 AAV 5' 및 3' ITR을 함유한다. AAV ITR은 본원에 기술된 것과 같은, 임의의 AAV의 ITR 서열로부터 얻어질 수 있다. 이런 ITR은 결과적으로 생성되는 재조합 AAV에 사용된 캡시드와 동일한 AAV 기원의 것이거나, 또는 상이한 AAV 기원의 것 (AAV 위형을 제조하기 위함)일 수 있다. 한 구체예에서, AAV2로부터의 ITR 서열, 또는 그것 (ITR)의 삭제된 버전이 조절 승인을 편리를 위해 및 규제 승인을 가속화하기 위해 사용된다. 그러나, 다른 AAV 공급원으로부터의 ITR이 선택될 수도 있다. 각각의 rAAV 게놈은 그런 다음 제조 플라스미드에 도입될 수 있다. 한 구체예에서, 제조 플라스미드는 본원에서 기술되거나 WO2012/158757 (참조로 본원에 포함됨)에서 기술된 것과 같다. rAAV 벡터를 제조하는 데 사용하기 위한, 그리고 본원에서 유용한 다양한 플라스미드가 기술분야에 알려져 있다. 제조 플라스미드는 AAV cap 및/또는 rep 단백질을 발현하는 숙주 세포에서 배양된다. 숙주 세포에서, 각각의 rAAV 게놈은 구제(rescue)되고 캡시드 단백질 또는 엔벨로프 단백질에 포장되어 감염성 바이러스 입자가 형성된다.

제조 플라스미드의 한 유형은 SEQ ID NO: 7에 나타낸 것으로, p584로 명명된다. 이 플라스미드는 rAAV-REP-1 벡터의 생성을 위해 실시예에서 사용된다. 그러한 플라스미드는 5' AAV ITR 서열; 선택된 프로모터; 폴리A 서열; 및 3' ITR을 포함하고; 추가적으로, 또한 스터퍼(stuffer) 서열, 예컨대 람다를 함유한다. 한 구체예에서, 비-코딩 람다 스터퍼 영역은 벡터 골격에 포함된다. REP-1, CNGA3 또는 CNGB2를 암호화하는 핵산 서열은 선택된 프로모터와 폴리A 서열, 또는 유사한 플라스미드 사이에 대신 삽입된다. REP-1 암호화 서열을 포함하는 p584의 예는 SEQ ID NO: 8에서 찾을 수 있다. 다른 구체예에서, 제조 플라스미드는 최적화된 벡터 플라스미드 제조 효율을 위해 변형된다. 그러한 변형은 다른 중립적인 서열(neutral sequence)의 첨가, 또는 벡터 플라스미드의 슈퍼코일 수준을 조절하기 위하여 람다 스터퍼 서열의 부분(들) 또는 전체의 결실을 포함한다. 그러한 변형은 본원에서 고려된다. 다른 구체예에서, 터미네이터 및 다른 서열들이 플라스미드에 포함된다.

추가의 구체예에서, 본원에서 기술된 REP-1, CNGA3 및 CNGB3 구성물 및 최적화된 서열의 전달을 위해 재조합 아데노-관련 바이러스 (AAV) 벡터가 제공된다. 아데노-관련 바이러스 (AAV) 바이러스 벡터는 그 안에 표적 세포로의 전달을 위해 핵산 서열이 포장되어 있는 AAV 단백질 캡시드를 가지는 AAV Dnase-내성 입자이다. AAV 캡시드는 60개의 캡시드 (cap) 단백질 하위유닛, VP1, VP2, 및 VP3으로 구성되며, 그것들은 선택된 AAV에 따라 대략 1:1:10 내지 1:1:20의 비율로 정20면체 대칭으로 배열된다. AAV는 상기에서 확인된 것과 같이 AAV 바이러스 벡터의 캡시드에 대한 공급원으로서 선택될 수 있다. 예컨대 미국 공개 특허 출원 번호 2007-0036760-A1; 미국 공개 특허 출원 번호 2009-0197338-A1; EP 1310571 참조. 또한, WO 2003/042397 (AAV7 및 다른 유인원 AAV), 미국 특허 7790449 및 미국 특허 및 미국 특허 7282199 (AAV8), WO 2005/033321 및 US 7,906,111 (AAV9), 및 WO 2006/110689, 및 WO 2003/042397 (rh.10) 참조. 이 문서들은 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 기술하고 참조로 포함된다. 일부 구체예에서, 바이러스 벡터에 사용하기 위한 AAV cap은 상기 언급된 AAV 캡시드 또는 그것의 암호화 핵산들 중 하나의 돌연변이생성에 의해 (즉, 삽입, 결실 또는 치환에 의해) 생성될 수 있다. 일부 구체예에서, AAV 캡시드는 상기 언급된 AAV 캡시드 단백질 중 둘 또는 셋 또는 넷 이상으로부터의 도메인들을 포함하는, 키메릭이다. 일부 구체예에서, AAV 캡시드는 둘 또는 세 개의 상이한 AAV 또는 재조합 AAV로부터의 Vp1, Vp2 및 Vp3 모노머의 모자이크이다. 일부 구체예에서, rAAV 조성물은 하나 이상의 상기 언급된 Cap을 포함한다.

다른 구체예에서, AAV 캡시드는 임의의 기술된 또는 공지의 AAV 캡시드 서열로부터 최대 약 10%의 변화를 포함할 수 있는 변종을 포함한다. 즉, AAV 캡시드는 본원에 제공된 및/또는 기술분야에 공지된 AAV 캡시드에 대해 약 90% 동일성 내지 약 99.9 % 동일성, 약 95% 내지 약 99% 동일성 또는 약 97% 내지 약 98% 동일성을 공유한다. 한 구체예에서, AAV 캡시드는 AAV 캡시드와 적어도 95% 동일성을 공유한다. AAV 캡시드의 퍼센트 동일성을 측정할 때, 비교는 가변 단백질들 (예컨대 vp1, vp2, 또는 vp3) 중 임의의 것에 대해 이루어질 수 있다. 한 구체예에서, AAV 캡시드는 AAV8 vp3과 적어도 95% 동일성을 공유한다. 다른 구체예에서, 자체-상보성 AAV가 사용된다. 한 구체예에서, 원하는 표적 세포, 예컨대 광수용체, RPE 또는 다른 눈 세포에 대해 향성을 보이는 AAV 캡시드를 활용하는 것이 바람직하다. 한 구체예에서, AAV 캡시드는 특정 표면 노출된 티로신 잔기가 페닐알라닌 (F)으로 치환된 티로신 캡시드-돌연변이체이다. 그러한 AAV 변종은 예컨대 Mowat et al, Tyrosine capsid-mutant AAV vectors for gene delivery to the canine retina from a subretinal or intravitreal approach, Gene Therapy 21, 96-105 (January 2014) (본원에 참조로 포함됨)에서 기술된다.

발현 카세트 또는 rAAV 게놈 또는 제조 플라스미드의 비리온으로의 포장을 위해, 도입유전자와 동일한 구성물에서 시스로 필요한 유일한 AAV 성분은 ITR이다. 한 구체예에서, 복제 (rep) 및/또는 캡시드 (cap)를 위한 코딩 서열은 AAV 게놈으로부터 제거되고 AAV 벡터를 생성하기 위하여 트란스로 또는 포장 세포주에 의해 공급된다. 예를 들어, 상기 기술된 것과 같이, 위형 AAV는 AAV 캡시드의 공급원과는 상이한 공급원으로부터의 ITR을 함유할 수 있다. 추가적으로 또는 다르게는, 키메라 캡시드가 이용될 수 있다. 또 다른 AAV 성분이 선택될 수도 있다. 그러한 AAV 서열의 공급원들은 본원에서 기술되고 또한 학구적, 상업적 또는 공공연한 공급원 (예컨대 아메리칸 타입 컬춰 콜렉션, Manassas, VA)으로부터 분리되거나 엔지니어링되거나 얻어질 수 있다. 다르게는, AAV 서열은 문헌에서 또는 GenBank®, PubMed®, 등과 같은 데이터베이스에서 이용할 수 있는 것과 같은 공개된 서열을 참조로 합성 또는 다른 적합한 수단을 통해 얻어질 수 있다.

대상체에게 전달하기에 적합한 AAV 바이러스 벡터를 생성하고 분리하는 방법은 기술분야에 공지되어 있다. 예컨대 미국 특허 779044; 미국 특허 7282199; WO 2003/042397; WO 2005/033321, WO 2006/110689; 및 US 7588772 B2 참조. 한 시스템에서, 생성자 세포주는 ITR이 양옆에 있는 도입유전자를 암호화하는 구성물 및 rep와 cap을 암호화하는 구성물(들)로 일시적으로 트랜스펙션된다. 두 번째 시스템에서, rep 및 cap을 안정하게 공급하는 포장 세포주는 양옆에 ITR을 가진 도입유전자를 암호화하는 구성물로 일시적으로 트랜스펙션된다. 이 각각의 시스템에서, AAV 비리온은 헬퍼 아데노바이러스 또는 헤르페스바이러스로의 감염에 대한 반응으로 생성되고, 오염시키는 바이러스로부터의 rAAV의 분리를 필요로 한다. 보다 최근에, AAV를 회수하기 위하여 헬퍼 바이러스로의 감염 - 필요한 헬퍼 기능을 필요로 하지 않는 시스템 (즉 아데노바이러스 E1, E2a, VA 및 E4 또는 헤르페스바이러스 UL5, UL8, UL52 및 UL29, 및 헤르페스바이러스 중합효소)이 개발되었다 (즉 또한, 트란스로, 시스템에 의해 공급된다). 이런 더 새로운 시스템들에서, 헬퍼 기능은 필요한 헬퍼 기능을 암호화하는 구성물로의 세포의 일시적 트랜스펙션에 의해 공급되거나, 또는 세포는 헬퍼 기능을 암호화하는 유전자를 안정적으로 함유하기 위해 엔지니어링될 수 잇으며, 그것의 발현은 전사 또는 번역후 수준에서 제어될 수 있다.

또 다른 시스템에서, 양옆에 ITR 및 rep/cap 유전자가 있는 도입유전자는 배큘로바이러스-기반 벡터로의 감염에 의해 곤충 세포에 도입된다. 이 제조 시스템에 대한 리뷰를 위해서는, 일반적으로, 예컨대 Zhang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated 바이러스 production," Human Gene Therapy 20:922-929를 참조하며, 그것의 내용은 그 전문이 본원에 참조로 포함된다. 이것들 및 다른 AAV 제조 시스템을 제조 및 사용하는 방법은 또한 다음의 미국 특허에서 기술되며, 각각의 내용은 그 전문이 참조로 본원에 포함된다.5,139,941; 5,741,683; 6,057,152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7,172,893; 7,201,898; 7,229,823; 및 7,439,065. 일반적으로, 예컨대 Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy Vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 및 하기 인용된 참고문헌을 참고하고, 각각은 그 전문이 참조로 본원에 포함된다.

본 발명의 임의의 구체예를 구성하기 위해 사용된 방법은 핵산 조작분야에 숙련된 사람들에게 공지이고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조. 유사하게, rAAV 비리온의 생성 방법도 잘 알려져 있고 적합한 방법의 선택은 본 발명에 대한 제한 사항이 아니다. 예컨대 K. Fisher et al, (1993) J. Virol., 70:520-532 및 미국 특허 번호 5,478,745 참조.

rAAV 벡터는 AAV 캡시드 및 상기 기술된 것과 같이 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 서열들을 포함하는 AAV 발현 카세트를 포함한다. 특정 구체예에서, 발현 카세트는 AAV 역 말단 반복부 서열, REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다. rAAV 발현 카세트는, 다른 구체예에서, 추가로 하나 이상의 인트론, Kozak 서열, 폴리A 및 전사 후 조절 요소들을 포함한다. 눈에 전달하기 위한 제약학적 조성물에 사용하기 위한 그러한 rAAV 벡터는 상기 확인된 많은 공지된 AAV 중 임의의 것으로부터의 캡시드를 사용할 수 있다.

발현 카세트 및 벡터의 다른 종래의 성분들은 예컨대 본원에서 기술된 코돈 최적화를 포함하여, 기술분야에서 공지되어 있는 기법들을 사용하여 특이적 종에 최적화될 수 있는 다른 성분들을 포함한다. 본원에 기술된 카세트, 벡터, 플라스미드 및 바이러스 또는 다른 조성물의 성분들은 발현 제어 서열의 일부로서 프로모터 서열을 포함한다. 다른 구체예에서, 프로모터는 세포-특이적이다. 용어 "세포-특이적"은 재조합 백터를 위해 선택된 특정 프로모터가 특정한 눈 세포 유형에서 최적화된 REP-1 또는 CNGA3 또는 CNGB3 도입유전자의 발현을 지시할 수 있는 것을 의미한다. 한 구체예에서, 프로모터는 광수용체 세포에서 도입유전자의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 간상체 및 추상체에서의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 간상체에서의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 추상체에서의 발현에 대해 특이적이다. 한 구체예에서, 광수용체-특이적 프로모터는 인간 로돕신 키나아제 프로모터이다. 로돕신 키나아제 프로모터는 간상체 및 추상체 둘 다에서 활성적인 것으로 나타났다. 예컨대 Sun et al, Gene Therapy with a Promoter Targeting Both Rods and Cones Rescues Retinal Degeneration Caused by AIPL1 Mutations, Gene Ther. 2010 January; 17(1): 117-131 (그 전문이 참조로 본원에 포함됨) 참조. 한 구체예에서, 프로모터는 클로닝을 용이하게 하기 위해 하나 이상의 제한 부위를 첨가하도록 변형된다.

다른 구체예에서, 프로모터는 인간 로돕신 프로모터이다. 한 구체예에서, 프로모터는 클로닝을 위한 제한 부위를 단부들에 포함하도록 변형된다. 예컨대 Nathans and Hogness, Isolation and nucleotide sequence of the gene encoding human rhodopsin, PNAS, 81:4851-5 (August 1984) (그 전문이 참조로 본원에 포함됨) 참조. 다른 구체예에서, 프로모터는 인간 로돕신 프로모터의 일부 또는 단편이다. 다른 구체예에서, 프로모터는 인간 로돕신 프로모터의 변종이다.

다른 예시의 프로모터는 인간 G-단백질-결합된 수용체 단백질 키나아제 1 (GRK1) 프로모터 (Genbank 승인 번호 AY327580)를 포함한다. 다른 구체예에서, 프로모터는 GRK1 프로모터의 292 nt 단편 (위치 1793 내지 2087)이다 (Beltran et al, Gene Therapy 2010 17:1162-74 참조, 전문이 참조로 본원에 포함됨). 다른 바람직한 구체예에서, 프로모터는 인간 광수용체간 레티노이드-결합 단백질 근접(proximal) (IRBP) 프로모터이다. 한 구체예에서, 프로모터는 hIRBP 프로모터의 235 nt 단편이다. 한 구체예에서, 프로모터는 RPGR 근접 프로모터이다 (Shu et al, IOVS, May 2102, 그 전문이 팜조로 포함됨). 발명에 유용한 다른 프로모터로는, 제한 없이 간상체 옵신 프로모터, 적녹색 옵신 프로모터, 청색 옵신 프로모터, cGMP-β-포스포다이에스테라제 프로모터 (Qgueta et al, IOVS, Invest Ophthalmol Vis Sci. 2000 Dec;41(13):4059-63), 마우스 옵신 프로모터 (Beltran et al 2010, 상기 인용됨), 로돕신 프로모터 (Mussolino et al, Gene Ther, July 2011, 18(7):637-45); 추상체 트랜스듀신의 알파-하위유닛 (Morrissey et al, BMC Dev, Biol, Jan 2011, 11:3); 베타 포스포다이에스테라제 (PDE) 프로모터; 색소성 망막염 (RP1) 프로모터 (Nicord et al, J. Gene Med, Dec 2007, 9(12):1015-23); NXNL2/NXNL1 프로모터 (Lambard et al, PloS One, Oct. 2010, 5(10):e13025), RPE65 프로모터; 느린 망막 변성/페리페린 2 (Rds/perph2) 프로모터 (Cai et al, Exp Eye Res. 2010 Aug;91(2):186-94); 및 VMD2 프로모터 (Kachi et al, Human Gene Therapy, 2009 (20:31-9))를 포함한다. 상기 문헌들은 각각 그 전문이 본원에 참조로 포함된다. 다른 구체예에서, 프로모터는 인간 인간 EF1α 프로모터, 로돕신 프로모터, 로돕신 키나아제, 광수용체간 결합 단백질 (IRBP), 간상체 옵신 프로모터 (적녹색, 청색), 적녹색 추상체 유전자좌 제어 영역을 함유하는 추상체 옵신 상류 서열, 추상체 형질도입, 및 전사 인자 프로모터 (신경 망막 류신 지퍼 (Nrl) 및 광수용체-특이적 핵 수용체 Nr2e3, bZIP)로부터 선택된다.

다른 구체예에서, 프로모터는 아주 흔하거나 구성적 프로모터이다. 적합한 프로모터의 예는 사이토메갈로바이러스 (CMV) 인핸서 요소를 가진 하이브리드 닭 β-액틴 (CBA) 프로모터이다. 다른 구체예에서, 프로모터는 CB7 프로모터이다. 다른 적합한 프로모터는 인간 β-액틴 프로모터, 인간 신장 인자-1α 프로모터, 사이토메갈로바이러스 (CMV) 프로모터, 유인원 바이러스 40 프로모터, 및 단순 헤르페스 바이러스 티미딘 키나아제 프로모터를 포함한다. 예컨대 Damdindorj et al, (August 2014) A Comparative Analysis of Constitutive Promoters Located in Adeno-Associated Viral Vectors. PloS ONE 9(8): e106472 참조. 또 다른 적합한 프로모터는 바이러스 프로모터, 구성적 프로모터, 조절 가능한 프로모터를 포함한다 [예컨대 WO 2011/126808 및 WO 2013/04943 참조]. 다르게는 생리적 신호에 반응하는 프로모터는 본원에서 기술된 발현 카세트, rAAV 게놈, 벡터, 플라스미드 및 바이러스에서 이용될 수 있다. 한 구체예에서, 프로모터는 AAV 벡터의 크기 제한으로 인해, 1000 bp 아래의 작은 크기의 것이다. 다른 구체예에서, 프로모터는 400 bp 아래이다. 다른 프로모터들은 기술분야의 숙련자에 의해 선택될 수 있다. 한 구체예에서, REP-1 구성물은 편재하는 프로모터를 포함한다. 다른 구체예에서, CNGA3 구성물은 광수용체-특이적 프로모터를 포함한다. 한 구체예에서, REP-1 구성물은 CMV 인핸서 요소를 가진 CBA 프로모터를 포함한다.

다른 구체예에서, 프로모터는 유도성 프로모터이다. 유도성 프로모터는 라파마이신/라파로그 프로모터, 엑디손 프로모터, 에스트로겐-반응성 프로모터, 및 테트라사이클린-반응성 프로모터, 또는 헤테로다이머 억제자 스위치를 포함하여, 공지의 프로모터로부터 선택될 수 있다. Sochor et al, An Autogenously Regulated Expression System for Gene Therapeutic Ocular Applications. Scientific Reports, 2015 Nov 24;5:17105 및 Daber R, Lewis M., A novel molecular switch. J Mol Biol. 2009 Aug 28;391(4):661-70, Epub 2009 Jun 21 참조 (둘 다 그 전문이 참조로 본원에 포함됨).

다른 구체예에서, 본원에 기술된 카세트, 벡터, 플라스미드 및 바이러스 구성물은 다른 적절한 전사 개시, 종결, 인핸서 서열, 효율적인 RNA 처리 신호, 예컨대 스플라이싱 및 폴리아데닐화(폴리A) 신호; TATA 서열; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 향상시키는 서열 (즉 Kozak 공통 서열); 인트론; 단백질 안정성을 향상시키는 서열; 및 필요하다면 암호화된 생성물의 분비를 향상시키는 서열을 함유한다. 발현 카세트 또는 벡터는 본원에 기술된 요소들 중 아무것도 함유하지 않거나, 하나 이상을 함유할 수 있다. 적합한 폴리A 서열의 예는, 예컨대 SV40, 소 성장 호르몬 (bGH) 및 TK 폴리A를 포함한다. 적합한 인핸서의 예는 예컨대, 다른 것들 중에서도 CMV 인핸서, RSV 인핸서, 알파 피토단백질 인핸서, TTR 최소 프로모터/인핸서, LSP (TH-결합 글로불린 프로모터/알파1-마이크로블로불린/비쿠닌(bikunin) 인핸서)를 포함한다. 한 구체예에서, Kozak 서열은 정확한 개시 코돈으로부터의 번혁을 향상시키기 DLN하여 도입유전자 코딩 서열의 상류에 포함된다. 다른 구체예에서, CBA 엑손 1 및 인트론은 발현 카세트에 포함된다. 한 구체예에서, 도입유전자는 하이브리드 닭 β 액틴 (CBA) 프로모터의 제어하에 놓인다. 이 프로모터는 사이토메갈로바이러스 (CMV) 즉시 조기 인핸서, 근접 닭 β 액틴 프로모터, 및 양옆에 인트론 1 서열이 있는 CBA 엑손 1로 구성된다.

한 구체예에서, 발현 카세트는 5' ITR, CBA 프로모터, CMV 인핸서, CBA 엑손 1 및 인트론, kozak 서열, 인간 코돈 최적화된 CHM 서열 (SEQ ID NO: 1), bGH 폴리 A 및 3' ITR을 함유한다.

또 다른 측면으로, 이 핵산 서열, 벡터, 발현 카세트 및 rAAV 바이러스 벡터 들은 제약학적 조성물에 유용하며, 조성물은 또한 제약학적으로 허용되는 담체, 완충제, 희석제 및/또는 보조제, 등을 포함한다. 그러한 제약학적 조성물은 눈 세포에서 그러한 재조합적으로 엔지니어링된 AAV 또는 인공 AAV에 의한 전달을 통해 최적화된 REP-1 또는 CNGA3 또는 CNGB3을 발현하기 위해 사용된다.

핵산 서열s, 벡터s, 발현 카세트 및 rAAV 바이러스 벡터를 함유하는 이 제약학적 조성물을 제조하기 위하여, 서열 또는 벡터 또는 바이러스 벡터가 바람직하게 종래 방법에 의해 오염에 대해 평가된 후 눈에 투여하기에 적합한 제약학적 조성물로 제제화된다. 그러한 제제는 적절한 생리적 수준으로 pH를 유지하기 위하여, 제약학적으로 및/또는 생리적으로 허용되는 비히클 또는 담체, 특히 눈에 투여하기에 적합한 비히클 또는 담체, 예컨대 완충된 식염수 또는 다른 완충제, 예컨대 HEPES, 및 선택적으로 다른 의학적 작용제, 약학적 작용제, 안정화제, 완충제, 담체, 보조제, 희석제, 등의 사용을 포함한다. 주입을 위해, 담체는 전형적으로 액체일 것이다. 예시의 생리적으로 허용되는 담체는 멸균된, 발열원-없는 물 및 멸균된, 발열원-없는 인산염 완충된 식염수를 포함한다. 다양한 그러한 공지의 담체들은 미국 특허 공개 번호 7,629,322 (참조로 본원에 포함됨)에 제공된다. 한 구체예에서, 담체는 등장성 염화나트륨 용액이다. 다른 구체예에서, 담체는 균형잡힌 염 용액이다. 한 구체예에서, 담체는 트윈(tween)을 포함한다. 만약 바이러스가 장기간 보관되어야 한다면, 글리세롤 또는 트윈20의 존재하에 냉동될 수 있다.

한 예시의 특정 구체예에서, 담체 또는 부형제의 조성물은 0.0001% - 0.01% 플루로닉 F68 (PF68)이 첨가된 180 mM NaCl, 10 mM NaPi, pH7.3을 함유한다. 완충제의 식염수 성분의 정확한 조성은 160 mM 내지 180 mM NaCl의 범위이다. 선택적으로, 상이한 pH 완충제 (잠재적으로 HEPES, 중탄산 나트륨, TRIS)가 특이적으로 기술된 완충제 대신 사용된다. 또 다르게는, 0.9% NaCl을 함유한 완충제가 유용하다.

선택적으로, 발명의 조성물은 rAAV 및/또는 변종 및 담체(들)에 더불어, 다른 종래의 제약학적 성분들, 예컨대 보존제, 또는 화학적 안정화제를 함유할 수 있다. 적합한 예시의 보존제는 클로로부탄올, 소르브산 칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.

본원에 기술된 것과 같이, 적어도 하나의 복제-결핍 rAAV 바이러스를 함유하는 제약학적 조성물은 유전자 전달 및 유전자 요법 적용에 사용하기 위해 생리적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제와 함께 제제화될 수 있다. AAV 바이러스 벡터의 경우, 게놈 복사물 ("GC"), 벡터 게놈 ("VG"), 또는 바이러스 입자의 정량은 제제 또는 현탁액에 함유된 용량의 척도로서 사용될 수 있다. 기술분야에 공지된 임의의 방법이 발명의 복제-결핍 바이러스 조성물의 게놈 복사물 (GC) 수를 측정하기 위해 사용될 수 있다. AAV GC 수 적정을 수행하기 위한 한 가지 방법은 다음과 같다: 정제된 AAV 벡터 샘플이 먼저 Dnase로 처리되어 캡시드화되지 않은 AAV 게놈 DNA 또는 오염 플라스미드 DNA가 제조 과정으로부터 제거된다. Dnase 내성 입자들은 다음에 열 처리 대상이 되어 캡시드로부터 게놈이 방출된다. 방출된 게놈은 다음에 실시간 PCR에 의하여 바이러스 게놈의 특정 영역 (통상적으로 폴리 A 신호)을 표적화하는 프라이머/프로브 세트를 사용하여 정량된다. 다른 방법으로 최적화된 REP-1 또는 CNGA3 도입유전자를 암호화하는 핵산 서열을 지닌 유효 용량의 재조합 아데노-관련 바이러스가 S.K. McLaughlin et al, 1988 J. Virol., 62:1963 (그 전문이 참조로 포함됨)에서 기술된 것과 같이 측정된다.

본원에서 사용되는 바, 용어 "투여량"은 치료 과정에서 대상체에게 전달된 총 투여량, 또는 단일 단위 (또는 다중 단위 또는 스틀릿 투여량) 투여로 전달된 양을 나타낼 수 있다. 제약학적 바이러스 조성물은 본원에 기술된 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열을 지닌, 범위 내의 모든 정수 또는 분수의 양을 포함하여, 약 1.0 x 10⁹ GC 내지 약 1.0 x 10¹⁵ GC의 범위의 양의 복제-결핍 바이러스를 함유하기 위한 투약 단위로 제제화될 수 있다. 한 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10⁹, 2x10⁹, 3x10⁹, 4x10⁹, 5x10⁹, 6x10⁹, 7x10⁹, 8x10⁹, 또는 9x10⁹GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹⁰, 2x10¹⁰,3x10¹⁰, 4x10¹⁰, 5x10¹⁰, 6x10¹⁰, 7x10¹⁰, 8x10¹⁰, 또는 9x10¹⁰ GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹¹, 2x10¹¹, 3x10¹¹, 4x10¹¹, 5x10¹¹, 6x10¹¹, 7x10¹¹, 8x10¹¹, 또는 9x10¹¹GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹², 2x10¹², 3x10¹², 4x10¹², 5x10¹², 6x10¹², 7x10¹², 8x10¹², 또는 9x10¹² GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹³, 2x10¹³, 3x10¹³, 4x10¹³, 5x10¹³, 6x10¹³, 7x10¹³, 8x10¹³, 또는 9x10¹³ GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹⁴, 2x10¹⁴, 3x10¹⁴, 4x10¹⁴, 5x10¹⁴, 6x10¹⁴, 7x10¹⁴, 8x10¹⁴, 또는 9x10¹⁴ GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x10¹⁵, 2x10¹⁵, 3x10¹⁵, 4x10¹⁵, 5x10¹⁵, 6x10¹⁵, 7x10¹⁵, 8x10¹⁵, 또는 9x10¹⁵ GC를 함유하도록 제제화된다. 한 구체예에서, 인간 적용을 위해 용량은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 1x10¹⁰ 내지 약 1x10¹² GC의 범위일 수 있다. 모든 용량은 예컨대 M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2):115-25. Doi: 10.1089/hgtb.2013.131에 기술된 oqPCR 또는 디지털 드로플렛 PCR (ddPCR)에 의해 측정되는 것을 포함하여, 임의의 공지의 방법에 의해 측정될 수 있다.

이런 상기의 용량들은 치료될 구역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 따라, 범위 내의 모든 수를 포함하여, 약 25 to 약 1000 마이크로리터의, 다양한 부피의 담체, 부형제 또는 완충제 제제로 투여될 수 있다. 한 구체예에서, 담체, 부형제 또는 완충제의 부피는 적어도 약 25 μL이다. 한 구체예에서, 부피는 약 50 μL이다. 다른 구체예에서, 부피는 약 75 μL이다. 다른 구체예에서, 부피는 약 100 μL이다. 다른 구체예에서, 부피는 약 125 μL이다. 다른 구체예에서, 부피는 약 150 μL이다. 다른 구체예에서, 부피는 약 175 μL이다. 또 다른 구체예에서, 부피는 약 200 μL이다. 다른 구체예에서, 부피는 약 225 μL이다. 또 다른 구체예에서, 부피는 약 250 μL이다. 또 다른 구체예에서, 부피는 약 275 μL이다. 또 다른 구체예에서, 부피는 약 300 μL이다. 또 다른 구체예에서, 부피는 약 325 μL이다. 다른 구체예에서, 부피는 약 350 μL이다. 다른 구체예에서, 부피는 약 375 μL이다. 다른 구체예에서, 부피는 약 400 μL이다. 다른 구체예에서, 부피는 약 450 μL이다. 다른 구체예에서, 부피는 약 500 μL이다. 다른 구체예에서, 부피는 약 550 μL이다. 다른 구체예에서, 부피는 약 600 μL이다. 다른 구체예에서, 부피는 약 650 μL이다. 다른 구체예에서, 부피는 약 700 μL이다. 다른 구체예에서, 부피는 약 700 내지 1000 μL이다.

한 구체예에서, 바이러스 구성물은 마우스같은 작은 동물 대상체에 대해 약 1μL 내지 약 3 μL의 부피로 적어도 1x10⁹ 내지 약 최소한 1x10¹¹GC의 용량으로 전달될 수 있다. 인간의 눈과 동일한 크기 정도의 눈을 가지는 더 큰 수의학적 대상체에 대해서는, 상기 진술된 것보다 더 큰 인간 투여량 및 부피가 유용하다. 다양한 수의학적 동물에 대한 피하 투여를 위한 양호한 실시의 논의에 대해 예컨대 Diehl et al, J. Applied Toxicology, 21:15-23 (2001) 참조. 상기 문서는 참조로 본원에 포함된다.

바람직하지 못한 효과, 예컨대 독성, 망막 이형성 및 분리의 위험을 감소시키기 위하여 바이러스 또는 다른 전달 비히클의 최저 유효 농도가 이용될 수 있는 것이 바람직하다. 이 범위의 또 다른 투여량이 담당의사에 의해, 치료받는 대상체, 바람직하게는 인간의 신체적 상태, 대상체의 나이, 특정 눈 장애 및 그 장애가 진행성이라면 발달된 정도를 고려하여 선택될 수 있다.

본원에서 기술된 또 다른 측면은 범맥락막 위축을 가진, 또는 그것에 걸릴 위험이 있는 포유류 대상체에서 실명의 진행을 치료, 지연 또는 중단시키는 방법이다. 한 구체예에서, 바람직하게는 생리적으로 부합하는 담체, 희석제, 부형제 및/또는 보조제에 현탁된, REP-1 코돈 최적화된 서열을 지닌 rAAV가 인간 대상체를 포함하여 원하는 대상체에 투여될 수 있다. 이 방법은 핵산 서열, 발현 카세트, rAAV 게놈, 플라스미드, 벡터 또는 rAAV 벡터 또는 그것을 함유하는 조성물 중 임의의 것을 그것을 필요로 하는 대상체에 투여하는 단계를 포함한다. 한 구체예에서, 조성물은 망막밑으로 전달된다. 다른 구체예에서, 조성물은 유리체강내로 전달된다. 또 다른 구체예에서, 조성물은 눈 질환의 치료를 위해 적합한 투여 경로들의 조합을 사용하여 전달되고, 또한 안검 정맥 또는 다른 정맥내 또는 종래의 투여 경로를 통한 투여를 포함할 수 있다.

본원에서 기술된 또 다른 측면은 색맹을 가진, 또는 색맹을 나타낼 위험이 있는 포유류 대상체에서 실명의 진행을 치료, 지연 또는 중단시키는 방법이다. 한 구체예에서, 바람직하게는 생리적으로 부합하는 담체, 희석제, 부형제 및/또는 보조제에 현탁된, CNGA3 또는 CNGB3 천연, 변형된 또는 코돈 최적화된 서열을 지닌 rAAV가 인간 대상체를 포함하여 원하는 대상체에 투여될 수 있다. 이 방법은 핵산 서열, 발현 카세트, rAAV 게놈, 플라스미드, 벡터 또는 rAAV 벡터 또는 그것을 함유하는 조성물 중 임의의 것을 그것을 필요로 하는 대상체에 투여하는 단계를 포함한다. 한 구체예에서, 조성물은 망막밑으로 전달된다. 다른 구체예에서, 조성물은 유리체강내로 전달된다. 또 다른 구체예에서, 조성물은 눈 질환의 치료를 위해 적합한 투여 경로들의 조합을 사용하여 전달되고, 또한 안검 정맥 또는 다른 정맥내 또는 종래의 투여 경로를 통한 투여를 포함할 수 있다.

이 방법들에 사용하기 위하여, 각 투여량의 부피 및 바이러스 역가가 본원에서 추가로 기술되는 것과 같이 개별적으로 측정되고, 동일한, 또는 반대쪽 눈에서 수행된 다른 치료와 동일하거나 상이할 수 있다. 투여량, 투여 및 처방은 본 명세서의 교시를 참조로 담당의에 의해 결정될 수 있다. 한 구체예에서, 조성물은 상기 열거된 것들로부터 선택된 단일 투여량으로 질병에 걸린 단일한 눈에 투여된다. 다른 구체예에서, 조성물은 질병에 걸린 두 눈에 상기 열거된 것들로부터 선택된 단일 투여량으로서, 동시에 또는 순차적으로 투여된다. 순차적 투여는 분, 시간, 일, 주 또는 개월의 간격으로 한 눈에서 다른 눈으로 투여되는 시간 갭을 함축할 수 있다. 다른 구체예에서, 방법은 둘 이상의 투여량 (예컨대 스플릿 투여량)으로 한 눈에 조성물을 투여하는 것을 포함한다. 다른 구체예에서, 다중 주입이 동일한 눈의 상이한 부분에서 이루어진다. 다른 구체예에서, 선택된 발현 카세트 (예컨대, CHM 함유 카세트)를 포함하는 rAAV의 제 2 투여는 후기 시점에서 수행된다. 그러한 시점은 제 1 투여 후 수 주, 수 개월 또는 수 년 후일 수 있다. 그러한 제 2 투여는, 한 구체예에서, 제 1 투여로부터의 rAAV와는 상이한 캡시드를 가지는 rAAV로 수행된다. 다른 구체예에서, 제 1 및 제 2 투여로부터의 rAAV는 동일한 캡시드를 가진다.

또 다른 구체예에서, 본원에서 기술된 조성물은 단일 조성물 또는 다중 조성물로 전달될 수 있다. 선택적으로, 둘 이상의 상이한 AAV가 전달되거나, 또는 다중 바이러스가 전달될 수 있다 [예컨대 WO 2011/126808 및 WO 2013/049493]. 다른 구체예에서, 다중 바이러스는 상이한 복제-결핍 바이러스들을 함유할 수 있다 (예컨대 AAV 및 아데노바이러스).

발명의 특정 구체예에서, 치료법에 대해 표적화된 간상체 및 추상체 광수용체의 구역을 확인하기 위하여 비-침습성 망막 영상화 및 기능적 연구를 수행하는 것이 바람직하다. 이런 구체예에서, 임상적인 진단 테스트가 하나 이상의 망막밑 주입(들)에 대한 정확한 위치(들)을 결정하기 위해 사용된다. 이 테스트들은 치료되는 대상체의 종, 그들의 신체 상태 및 건강 및 투여량에 따라, 망막전위도검사 (ERG), 시야 측정, 망막층의 위상학적 지도작성 및 공초점 주사 레이저 검안경 검사 (cSLO) 및 광간섭 단층촬영 (OCT)에 의한 그 층의 두께의 측정, 보정 광학 (AO)을 통한 추상체 밀도의 위상학적 지도작성, 기능적 눈 검사, 등을 포함할 수 있다. 지도작성 및 기능적 연구의 관점에서, 발명의 일부 구체예에서, 병에 걸린 눈의 상이한 구역을 표적으로 하기 위해 하나 이상의 주입이 동일한 눈에 수행된다. 각 주입의 부피 및 바이러스 역가는 추가로 본원에서 기술되는 것과 같이 개별적으로 결정되며, 동일한, 또는 반대쪽 눈에서 수행된 다른 주입과 동일하거나 상이할 수 있다. 다른 구체예에서, 단일한, 더 큰 부피의 주입이 전체 눈을 치료하기 위해 이루어진다. 한 구체예에서, rAAV 조성물의 부피 및 농도는 손상된 눈 세포의 영역만이 영향을 받도록 선택된다. 다른 구체예에서, rAAV 조성물의 부피 및 농도는 손상되지 않은 광수용체를 포함하여, 눈의 더 큰 부분에 도달하기 위해, 더 많은 양이다.

본원에 기술된 방법의 한 구체예에서, 본원에 기술된 조성물의 1회 안내 전달, 예컨대 최적화된 REP-1 카세트의 AAV 전달은 범맥락막 위축이 발생할 위험이 있는 대상체에서 시력 상실 및 실명을 예방하는 데 유용하다. 본원에 기술된 방법의 다른 구체예에서, 본원에 기술된 조성물의 1회 안내 전달, 예컨대 최적화된 CNGA3 또는 CNGB3 카세트의 rAAV 전달은 색맹이 발생할 위험이 있는 대상체에서 시력 상실 및 실명을 예방하는 데 유용하다.

그러므로, 한 구체예에서, 조성물은 질환이 시작되기 전에 투여된다. 다른 구체예에서, 조성물은 시력 손상 또는 상실이 시작되기 전에 투여된다. 다른 구체예에서, 조성물은 시력 손상 또는 상실이 시작된 후에 투여된다. 또 다른 구체예에서, 조성물은 질환이 없는 눈과 비교하여 간상체 및/또는 추상체 또는 광수용체의 90% 미만이 기능하거나 남아있을 때 투여된다.

다른 구체예에서, 방법은 추가의 연구, 예컨대 치료의 효능을 측정하기 위해 기능적 및 영상화 연구를 수행하는 단계를 포함한다. 동물에서의 조사를 위해, 그러한 테스트는 간상체 및 추상체 광수용체 기능을 살피는 망막전위도검사 (ERG), 시운동성 안진, 동공측정, 수중 미로 검사, 명암 선호도, 광간섭 단층촬영 (망막의 다양한 층의 두께를 측정하기 위함), 조직학 (망막 두께, 외핵층의 핵의 열, 도입유전자 발현을 증명하기 위한 면역형광, 추상체 광수용체 계수, 땅콩 응집소 (peanut agglutinin)를 가진 망막 부분의 염색 (추상체 광수용체 싸개를 확인함)을 통한 망막 및 시기능 평가를 포함한다.

인간 대상체에 대해 특이적으로, 본 명세서에서 기술된 조성물의 투여량의 투여 후에, 대상체는 간상체 및 추상체 광수용체 기능을 살피는 망막전위도검사 (ERG), 동공측정 시력, 대비 민감도 색각 검사, 시계 검사 (Humphrey 시계/Goldmann 시계), 시야측정 기동성 검사 (장애물 코스), 및 독서 속도 테스트를 사용하여 치료 효능에 대해 테스트된다. 본원에 기술된 제약학적 조성물로 치료한 후에 대상체가 노출되는 다른 유용한 치료 후 효능 테스트는 기능적 자기 공명 영상화 (fMRI), 전장 (full-field) 광민감도 검사, 광간섭 단층촬영을 포함한 망막 구조 연구, 안저촬영, 펀더스 자동형광, 적응제어 광학 레이저 주사 검안경 검사, 기동성 검사, 독서 속도 및 정확도 테스트, 미세 시야측정 및/또는 검안경 검사이다. 이것들 및 다른 효능 테스트는 미국 특허 번호 8,147,823; 공동 계류중인 국제 특허 출원 공개 WO 2014/011210 또는 WO 2014/124282 (참조로 포함됨)에서 기술된다.

또 다른 구체예에서, 상기 기술된 방법들 중 어느 것이라도 다른, 또는 이차 치료법과 조합되어 수행된다. 또 다른 구체예에서, 이 눈 질환들의 치료 방법은 다른 치료법, 예컨대 항생물질 치료, 통증 완화 치료, 등과 조합하여 본원에서 상세하게 기술된 조성물로 대상체를 치료하는 단계를 포함한다. 추가의 치료법은 이들 돌연변이 또는 결함 또는 그것들과 관련된 효과 중 어느 것이라도 예방, 저지 또는 개선하는 것을 돕는 임의의, 현재 알려져 있는, 또는 아직은 알려져 있지 않은 치료법일 수 있다. 이차 치료법은 상기 기술된 조성물의 투여 전에, 동시에 또는 투여 후에 투여될 수 있다. 한 구체예에서, 이차 치료법은 망막 세포의 건강을 유지하기 위한 비-특이적 접근법, 예컨대 신경영양 인자, 항-산화제, 세포사멸 방지제의 투여를 포함한다. 비-특이적 접근법은 단백질, 재조합 DNA, 재조합 바이러스 벡터, 줄기 세포, 또는 유전자적으로 변형된 세포의 주입을 통해 이루어진다. 후자는 캡슐화된 유전자적으로 변형된 세포를 포함할 수 있을 것이다.

한 구체예에서, 재조합 rAAV의 생성 방법은 상기 기술된 AAV 발현 카세트를 함유하는 플라스미드를 얻는 단계 및 그 플라스미드를 지닌 포장 세포를 AAV 바이러스 게놈의 감염성 AAV 엔벨로프 또는 캡시드 안으로 포장하는 것을 허용하기에 충분한 바이러스 서열의 존재하에 배양하는 단계를 포함한다. rAAV 벡터 생성의 특이적 방법은 상기 기술되며 상기에서 및 하기 실시예에서 기술된 발현 카세트 및 게놈에 코돈 최적화된 REP-1 또는 CNGA3 또는 CNGB3을 전달할 수 있는 rAAV 벡터를 생성하는 데 사용될 수 있다.

또 다른 구체예에서, 본원에 기술된 발현 카세트들 중 임의의 발현 카세트를 포함하는 벡터가 제공된다. 상기에서 기술된 것과 같이, 그러한 벡터는 다양한 기원의 플라스미드일 수 있고 본원에서 추가로 기술되는 재조합 복제 결핍 바이러스들의 생성을 위한 특정 구체예에 유용하다.

하나의 다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 REP-1을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.

다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 CNGA3을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.

다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 CNGB3을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.

"하나"를 나타내는 용어는 하나 이상을 나타내는 것이 주지되어야 한다. 그러므로, 용어 "하나"를 지칭하는 단어, "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용된다.

단어 "포함하다 (복수형 포함)" 및 "포함하는"은 배타적이기보다는 포괄적으로 해석되어야 한다. 단어 "구성되다", "구성되는" 및 그것의 변형은 포괄적이기보다는 배타적으로 해석되어야 한다. 명세서에서 다양한 구체예들이 "포함하는"이란 언어를 사용하여 제공되는 한편으로, 다른 상황 하에서, 관련된 구체예는 또한 "구성되는" 또는 "본질적으로 구성되는"이란 언어를 사용하여 해석되고 기술되어야 하는 것으로 의도된다.

본원에서 사용되는 용어 "약"은 다르게 명시되지 않는 한, 제공된 기준으로부터 10%의 가변성을 의미한다.

본원에서 사용되는 용어 "조절" 또는 그것의 변형은 생물학적 경로의 하나 이상의 성분을 억제하는 조성물의 능력을 나타낸다.

본 명세서에서 다르게 정의되지 않는 한, 본원에서 사용된 기술적이고 과학적인 용어는 기술분야에 통상의 지식을 가진 자가 공개된 텍스트를 참조로 통상적으로 이해하는 것과 동일한 의미를 가지며, 기술분야의 숙련자에게 본 출원에서 사용된 많은 용어들에 대한 일반적인 가이드를 제공한다.

다음의 실시예는 단지 예시적인 것이고 본 발명을 제한하려는 의도가 아니다.

실시예 1 - 다능성 줄기 세포의 RPE로의 분화

범맥락막 위축은 관련된 마우스 모델이 없고 개과의 모델이 없으므로, 형질도입 및 발현을 질환의 인간 망막 세포 모델에서 테스트한다. 망막 세포를 살아있는 환자로부터 얻는 것이 불가능하기 때문에, RPE를 유도된 다능성 줄기 세포로부터 생성한다. 다능성 줄기 세포는 Buchholz et al, Rapid and Efficient Directed Differentiation of Human Pluripotent Stem Cells Into Retinal Pigmented Epithelium, Stem Cells Translational Medicine, 2013;2:384-393 (그 전문이 참조로 포함됨)에 의해 기술된 프로토콜을 사용하여 RPE에 대해 지시된다. 또한, Cereso et al, Proof of concept for AAV2/5-mediated gene therapy in iPSC-derived retinal pigment epithelium of a choroideremia patient, Molecular Therapy ― Methods & Clinical Development (2014) 1, 14011 (그 전문이 참조로 포함됨) 참조. RPE를 제조하기 위한 다른 방법들은 기술분야에 알려져 있다.

간단히 설명하면, 인간 유도 다능성 줄기 세포주를 미토마이신 C-처리된 또는 방사선 조사된 마우스 배아 섬유모세포 공급기 층에서 둘베코 변형 이글스 배지: 2 mM GlutaMAX-I, 20% 녹아웃 혈청 대체물, 0.1 mM 변형 이글스 배지 비-필수 아미노산 (MEM NEAA), 0.1 mM β-머캡토에탄올 및 4 ng/ml의 bFGF를 함유한 영양 혼합물 F-12 (DMEM/F12)에서 유지하였다.

다능성 줄기 세포를 1X B27, 1X N2 및 1X NEAA (Invitrogen)가 포함된 DMEM/F2에서 Matrigel (BD Biosciences) 위로 직접 통과시킨다. 0일부터 제 2일까지, 50 ng/ml Noggin, 10 ng/ml Dkk1, 10 ng/ml IGF1 및 10mM 니코틴아마이드를 베이스 배지에 첨가한다. 제 2일부터 제 4일까지, 10 ng/ml Noggin, 10 ng/ml Dkk1, 10 ng/ml IGF1, 5 ng/ml bFGF 및 10 mM 니코틴아마이드를 베이스 배지에 첨가한다. 제 4일부터 제 6일까지, 10 ng/ml Dkk1, 10 ng/ml IGF1 및 100 ng/ml Activin A (R&D Systems)를 베이스 배지에 첨가한다. 제 6일부터 제 14일까지, 00 ng/ml Activin A, 10 μM SU5402 (EMD Millipore, Darmstadt, Germany), 및 1 mM VIP를 베이스 배지에 첨가한다. 대조 실험을 베이스 배지 단독에서 수행한다 (DMEM/F12, B27, N2, 및 NEAA).

세포를 비-RPE 형태를 가진 세포를 긁어냄으로써 기계적으로 풍부화한다. 계속해서, 남아 있는 RPE를 TrypLE Express (Invitrogen)를 사용하여 5분 동안 37℃에서 소화시킨다. 세포를 30-μm 단일-세포 스트레이너를 통해 통과시키고 Matrigel-코팅된 조직 배양 플라스틱, 트랜스웰 막 또는 CC2-처리된 챔버 슬라이드 위로 시딩한다. 풍부해진 세포를 1% 소 태아 혈청 (FBS), GlutaMAX 및 피루브산 나트륨이 첨가된 DMEM-고글루코오스에서 30일 동안 배양한다.

실시예 2 - AAV-REP-1으로 형질도입된 세포

간단히 설명하면, REP-1 코돈 최적화된 서열을 통합하는 AAV2/8CMV.CBA-REP-1 바이러스 벡터를 HEK293 세포의 일시적 트랜스펙션에 의해 제조하고, 바이러스 입자를 폴리에틸렌 글리콜을 사용하여 상층액으로부터 침전시킨다. 예컨대 Guo et al, Rapid and simplified purification of recombinant adeno-associated virus, J Virol Methods. 2012 Aug; 183(2): 139-146 (본원에 참조로 포함됨) 참조. 벡터를 이중 CsCl 원심분리에 의해 정제하고, 투석한 후, 돗트 블롯 검정에 의해 적정한다.

프레닐화 실험을 위해, RPE를 24-웰 플레이트에 시딩하고, 1.2x10⁶ 세포를 집밀도로 추정한다. 세포를 세포당 100,000 vg로 형질도입시키고, 프레닐화 검정을 형질도입 후 4주 후에 수행한다. 실험을 삼중으로 수행한다.

실시예 3 - 프레닐화

시험관내 프레닐화 검정을 상기에서 인용된 Vasireddy et al, PloS One. 2013 May 7;8(5):e61396에서 기술한 것과 같이, [3H]-게라닐게라닐 피로포스페이트 (GGPP) (Perkin Elmer, Boston, MA, USA)를 프레닐기 도너로서 사용하여, 재조합 Rab 게라닐게라닐 트랜스퍼라제 및 RAB27의 존재하에 수행한다. 방사성 표지된 프레닐기의 RAB27 단백질 안으로의 통합을 신틸레이션 카운팅에 의해 측정한다. 일관성을 위해 대조군 값을 100으로 표준화하고 기준 값으로서 사용한다. 모든 실험을 삼중으로 수행하고, 실험군과 대조군 사이의 프레닐화의 통계학적 비교를 양측 일방 스튜던트 t-테스트 (two-tailed unpaired student's t-test)를 사용하여 평가한다.

간단히 설명하면, 형질도입 후 48시간 후, 형질도입된 REP 세포를 저온 PBS로 세척한다. 세포 펠릿을 수집하고 저온 PBS로 철저하게 세척한다. 세포를 얼음에서 30분 동안 RIPA + 프로테아제 억제제를 사용하여 용해시킨다. 다른 프로토콜에서는, 세포를 음파처리한다. 용해물을 75,000 내지 100,000 g에서 1 내지 2시간 동안 4℃에서 원심분리함으로써 시토졸 분획을 수집한다.

프레닐화 반응을 위해 스톡을 다음과 같이 제조한다.

프레닐화에 사용한 최종 반응 부피는 25 μL이다.

반응 혼합물을 37℃에서 30분 동안 인큐베이션한다. 반응을 9:1 에탄올/HCL을 첨가함으로써 중단시키고, 30분 동안 인큐베이션한다. 단백질을 진공 여과 (0.1 ml)에 의하여 유리 섬유 필터지 (Whatman papers)에서 수집한다. 필터를 저온 포스페이트 완충제로 조심스럽게 3회 세척하여 미결합 물질을 제거한다. 막을 조심스럽게 건조시킨다. 필터를 5 ml 신틸레이션 칵테일에 넣고 신틸레이션 카운팅을 수행한다. 또한, Tolmachova et al, CHM/REP1 cDNA delivery by lentivirus vectors provides functional expression of the transgene in the retinal pigment epithelium of choroideremia mice, The Journal of Gene Medicine, 2012; 14-158-68 (그 전문이 참조로 본원에 포함됨) 참조.

CNGA3 또는 CNGB3 개념 입증을 위한 검정은 자발적 돌연변이 동물 모델 (예를 들어, Cnga3-/- 마우스 또는 Awassi 양)의 사용을 포함할 수 있다. 마우스 모델은 이중 녹아웃을 얻기 위해 "모든-추상체" 광수용체 마우스, Nrl-/- 마우스로 사육될 수 있을 것이다. 후자의 (Cnga3-/-Nrl-/-) 마우스가 효능의 확인을 더 신속하게 처리할 수 있다. 효능은 동공측정, 시력 및 대비의 측정 (예를 들어 시선이동을 사용함), 망막전위도, 및 시각적 행동에 의해 측정될 수 있을 것이다. 궁극적으로, 조직학이 다른 척도에 대한 개선된 결과로 도입유전자의 발현을 증명할 것이다. 조직학적 접근법 또한 추상체 광수용체 (추상체 광수용체의 총 수, 밀도, 위치 등)에 대한 발명의 임의의 효과를 증명하기 위해 사용될 것이다.

상기 논의된 범맥락막 위축과 유사하게, CNGA3- 또는 CNGB3-관련된 색맹에 대한 유전자 증대 치료법에 대한 개념 입증을 위한 검정은 유도된 다능성 줄기 세포 (Ipsc) 모델의 사용을 포함할 수 있다. CNGA3 또는 CNGB3 돌연변이로 인한 색맹을 가진 환자들로부터 생성된 iPSC 모델은 시험관내에서 망막 전구체 및/또는 광수용체 세포로 분화될 것이다. 야생형 CNGA3 (또는 CNGB3) cDNA가 재조합 AAV를 사용하여 이들 세포에 전달될 것이고, 세포는 이들 하위유닛에 의해 구성된 관련된 (고리형 뉴클레오타이드-게이트, CNG) 채널의 기능의 생물발생 및 보존에 대해 분석될 것이다. 채널 기능은 막 패치상에서의 전기생리학에 의해 평가될 것이다. 채널의 복원은 cGMP-활성화된 전류를 구제해야 한다. 추가 연구는 야생형 CNG cDNA의 생리적 리간드로의 전달 전 및 후의 채널 기능의 민감도에 대해 테스트할 수 있다.

실시예 4: AAV.코돈-최적화된 인간 CHM의 시험관내 발현

이 연구의 목적은 84-31 및 COS-7 세포주에서 코돈 최적화된 CHM 유전자 (SEQ ID NO: 1)를 암호화하는 일련의 차세대 AAV 2 및 AAV8 벡터를 사용한 유전자 전달 후에 AAV 매개된 CHM 발현의 능력을 평가하는 것이었다.

CHM의 발현을 최대화하기 위하여, 코돈 최적화된 CHM 서열(SEQ ID NO: 1)을 제조하였다. 코돈 최적화된 플라스미드를 합성하여 모든 차세대 CHM 도입유전자 발현 카세트의 생성에 사용하였다. 비-기능적 AAV 게놈의 오염의 잠재적 문제를 극복하기 위하여, 비-코딩 람다 스터퍼 영역을 벡터 골격에 포함시켰다. 스터퍼의 통합은 플라스미드의 길이를 증가시킬뿐 아니라, 플라스미드 DNA 골격 오염의 가능성을 감소시키는 한편, AAV를 포장한다. 플라스미드 DNA 불순물을 제거하기 위한 스터퍼 영역의 벡터 골격에의 통합의 영향은 독립적인 연구로서 수행하였다. 두 재조합 AAV 프로바이러스 플라스미드 (높고 낮은 복사물) 골격을 사용하여 상이한 구성물을 생성하였다. 높은 복사물 플라스미드를 pUC 플라스미드 기원을 기반으로 디자인하였다. 낮은 복사물 플라스미드를 p15A 기원을 기반으로 디자인하였다. 정확한 개시 코돈으로부터의 번역을 추가로 향상시키기 위하여, 출발 코돈의 상류에 Kozak 서열을 통합시켰다.

총 4개의 플라스미드를 현재의 연구를 위해 엔지니어링하였고 그것들을 다음의 실시예에서 기술하였다 (표 1). 또한, 임상 실험에 현재 사용되고 있는, CHM 천연 서열을 지닌 플라스미드를 또한 생성하였다 (버전 1). 버전 2a, 2b, 3a 및 3b, 및 버전 1의 각각에 대한 플라스미드 지도를 각각 도 6 내지 10에 도시한다.

플라스미드 특징

명칭	REP 서열	람다 스터퍼	Kozak 서열	기원	복사물 수	프로모터 /인트론
버전 1 (V1)	천연	존재함	부재	pUC	높은 복사물	CMV-CBA 프로모터+인핸서 연장
버전 2a (V2a)	코돈- 최적화됨	존재함	존재함	pUC	높은 복사물	CMV-CBA 프로모터+인핸서 연장
버전 2b (V2b)	코돈- 최적화됨	존재하지 않음	존재함	pUC	높은 복사물	CMV-CBA 프로모터+인핸서 연장
버전 3a (V3a)	코돈- 최적화됨	존재함	존재함	p15A	낮은 복사물	CMV-CBA 프로모터+인핸서 연장
버전 3b (V3b)	코돈- 최적화됨	존재하지 않음	존재함	p15A	낮은 복사물	CMV-CBA 프로모터+인핸서 연장

이 구성물들의 시험관내 발현을 COS-7 및 84-31 세포주에서 테스트하였다. 차세대 CHM 구성물의 엔지니어링된 특징은 표 1에 나타낸다.

재조합 AAV 프로바이러스 높은 및 낮은 복사물 플라스미드를 코돈 최적화된 인간 CHM cDNA (hCHM) (SEQ ID NO: 1)를 도입유전자 카세트에 클로닝함으로써 생성하였다. 도입유전자를 하이브리드 닭 β 액틴 (CBA) 프로모터의 제어하에 놓았다. 이 프로모터는 사이토메갈로바이러스 (CMV) 즉시 조기 인핸서, 근접 닭 β 액틴 프로모터, 및 양 옆에 인트론 1 서열이 있는 CBA 엑손 1로 구성된다. 프로바이러스 높은 및 낮은 복사물 수 플라스미드 또한 AAV 역 말단 반복부 및 폴리A 서열을 함유한다. 본 연구에서 사용한 차세대 플라스미드 골격은 람다 파지 단편 스터퍼와 이어서 카나마이신 박테리아 선택 유전자를 함유한다. 추가의 플라스미드는 스터퍼가 결핍되었지만 카나마이신 선택 유전자를 함유한다. 높은-복사물 수 벡터는 pUC 플라스미드 (~300 복사물/박테리아 세포)의 그것과 유사하다. 낮은 복사물 수 플라스미드 (~10 복사물/박테리아 세포)는 p15A의 기원을 가진다. 정확한 개시 코돈으로부터의 번역을 향상시키기 위하여, 모든 차세대 구성물은 출발 코돈, ATG의 상류에 KOZAK 공통 서열을 함유한다. 생성된 플라스미드는 프로모터+인핸서 연장 서열 및 코돈 최적화된 CHM 서열 중 어느 하나를 특이적으로 표적화할 수 있는 프라이머를 사용하여 서열이 확인된다. 5개의 모든 구성물의 플라스미드 지도 및 서열을 도 6 내지 10에 나타낸다. 칼슘 포스페이트로의 표준 삼중 트랜스펙션을 사용하여 하기에 열거하는 AAV 벡터를 생성하였다 (벡터 자격에 대해서는 표 2 참조). 결과를 보장하기 위해 생성된 벡터의 AAV 및 AAVB 혈청형은 둘 다 혈청형-독립적이다.

생성된 AAV2 및 AAV8 벡터의 요약 및 바이러스 스톡의 농도

명칭	혈청형	플라스미드 명칭	롯트 번호	트톡 농도 (vg/ml)
AAV2.V1	AAV2	버전 1 (V1)	KA892*	4.47E+12
AAV2.V2a	AAV2	버전 2a (V2a)	CT239	2.16E+12
AAV2.V2b	AAV2	버전 2b (V2b)	CT238	7.40E+12
AAV2.V3a	AAV2	버전 3a (V3a)	CT258	4.82E+12
AAV2.V3b	AAV2	버전 3b (V3b)	CT256	5.91E+12
AAV8.V1	AAV8	버전 1 (V1)	KA808*	1.39E+13
AAV8.V2a	AAV8	버전 2a (V2a)	CT245	1.04E+13
AAV8.V2b	AAV8	버전 2b (V2b)	CT244	1.11E+13
AAV8.V3a	AAV8	버전 3a (V3a)	CT259	8.67E+12
AAV8.V3b	AAV8	버전 3b (V3b)	CT255	1.36E+13

84-31 세포주는 293 HEK 세포주 (인간 배아 신장 세포)의 하위클론이고 AAV 바이러스의 형질도입을 향상시키기 위하여 아데노바이러스 E4 단백질을 구성적으로 발현한다. COS-7 세포는 원숭이 신장 조직으로부터 유래된 세푸주와 같이 섬유모세포이다. 84-31 세포 및 COS-7 세포를 둘 다, 별도로 6-웰 세포 배양 플레이트에 플레이팅하고 10개의 테스트물 (AAV2 또는 AAV8 중 하나) 중 하나로 5가지의 상이한 감염 다중도 (MOI)로 형질도입하였다. 36 내지 48시간 후, 세포를 수득하고, 용해시키고 단백질 샘플을 SDS-PAGE를 위해 준비하고, 이어서 웨스턴 블롯 분석에 의해 외인성 CHM의 발현을 검출하였다.

84-31 세포 및 COS-7 세포를 둘 다 10% 소 태아 혈청 및 1% 페니실린/스트렙토마이신이 첨가된 둘베코 변형 이글 배지 (DMEM)-고글르코오스에서 37℃에서 5% CO2가 공급된 환경에서 배양하였다. 형질도입 전날 (18 내지 24시간 전) 세포를 3E5의 밀도로 6-웰 세포 배양 접시의 각 웰에서 2 ml의 세포 배양 배지에 시딩하였다. 시딩한 세포를 37℃에서 5% CO2가 공급된 환경에서 인큐베이션하였다. 84-31 세포 및 COS-7 세포 둘 다의 웰을 하기 열거하는 AAV 벡터로 다양한 감염 다중도 (MOI) (표 3 및 표 4)로 감염시켰다. 네거티브 대조군 세포 (형질도입되지 않은 세포)에는 바이러스를 첨가하지 않았다. 간단히 설명하면, 조직 배양 배지를 제거하고 신선한 2 ml의 배지 분취액을 6 웰 배양 접시의 각 웰에 첨가하였다. 그런 다음 소정량의 AAV 벡터를 측정하고 (스톡으로부터 직접) 각 웰에 첨가하였다 (표 3 및 4). 1E4의 MOI를 위해, 1 μL의 각각의 바이러스 스톡을 세포 배양 배지로 10 μL 로 희석하였다. 이 용액으로부터, 소정 부피의 바이러스를 각각의 웰에 첨가하였다 (표 3 및 4). 세포를 AAV 바이러스와 함께 36 내지 48시간 동안 37℃에서 5% CO2에서 수득할 때까지 인큐베이션하였다. 세포를 현미경으로 관찰한 후 수득하여 비정상을 조사하였다.

COS-7 세포에서 4개의 차세대 AAV2 및 AAV8 hCHM 벡터의 감염 용량

사용한 벡터	세포주	세포 밀도	사용한 벡터 (μL)	MOI
AAV 없음	COS-7	3E5	-	-
AAV2.V2a	COS-7	3E5	1.5	1E4
	COS-7	3E5	15	1E5
	COS-7	3E5	45	3E5
	COS-7	3E5	75	5E5
	COS-7	3E5	150	1E6
AAV2.V2b	COS-7	3E5	4.2 (스톡의 1 내지 10 회 희석)	1E45
	COS-7	3E5	4.2	1E5
	COS-7	3E5	12.6	3E5
	COS-7	3E5	21	5E5
	COS-7	3E5	42	1E6
AAV8.V2a	COS-7	3E5	2.9 (스톡의 1 내지 10 회 희석)	1E4
	COS-7	3E5	2.88	1E5
	COS-7	3E5	8.65	3E5
	COS-7	3E5	14.42	5E5
	COS-7	3E5	28.85	1E6
AAV8.V2b	COS-7	3E5	2.7 (스톡의 1 내지 10 회 희석)	1E4
	COS-7	3E5	2.7	1E5
	COS-7	3E5	8.1	3E5
	COS-7	3E5	13.5	5E5
	COS-7	3E5	27	1E6

84-31 세포에서 4개의 차세대 AAV2 및 AAV8 hCHM 벡터의 감염률

사용한 벡터	세포주	세포 밀도	사용한 벡터 (uL)	MOI
No AAV	84-31	3E5	-	-
AAV2.V2a	84-31	3E5	1.5	1E4
	84-31	3E5	15	1E5
	84-31	3E5	45	3E5
	84-31	3E5	75	5E5
	84-31	3E5	150	1E6
AAV2.V2b	84-31	3E5	4.2 (스톡의 1 내지 10 회 희석)	1E4
	84-31	3E5	4.2	1E5
	84-31	3E5	12.6	3E5
	84-31	3E5	21	5E5
	84-31	3E5	42	1E6
AAV8.V2a	84-31	3E5	2.9 (스톡의 1 내지 10 회 희석)	1E4
	84-31	3E5	2.88	1E5
	84-31	3E5	8.65	3E5
	84-31	3E5	14.42	5E5
	84-31	3E5	28.85	1E6
AAV8.V2b	84-31	3E5	2.7 (스톡의 1 내지 10 회 희석)	1E4
	84-31	3E5	2.7	1E5
	84-31	3E5	8.1	3E5
	84-31	3E5	13.5	5E5
	84-31	3E5	27	1E6

먼저, 두, COS7 및 84-31 세포주를 사용하여 CHM의 시험관내 발현이 세포주 독립적인지를 테스트하였다. 일단 독립성이 수립되면, 모든 후속 실험을 AAV로 월등한 형질도입 효율을 보였던 84-31 세포에서만 수행하였다. 84-31 세포의 웰을 하기 열거한 AAV 벡터로 다양한 MOI로 감염시켰다 (표 3 및 4 참조).

웨스턴 블롯 분석: 1. 세포 용해물을 제조하였다. 미처리된 대조군 세포와 함께 AAV 형질도입된 세포를 감염 후 36 내지 48시간 후 수득하고 PBS로 철저하게 세척하였다. 그런 다음 세포를 프로테아제 억제제를 포함한 RIPA 완충제를 사용하여 얼음에서 용해시켰다. 세포 용해물을 13,000 rpm에서의 10분 동안의 원심분리에 의하여 정화시켰다. 2. 단백질의 정량 및 제조. 세포 용해물의 단백질 정량을 ThermoFisher Micro BCATM 단백질 검정 키트를 제조자의 설명서를 따라 사용하여 수행하였다. 단배질 농도를 562 nm에서의 OD 판독을 취함으로써 측정하였다. CHM의 시험관내 발현을 평가하기 위하여, 40 내지 60 ug의 측정된 단백질을 4 내지 12% Bis-Tris 겔에 로딩하였다. 3. SDS-PAGE 및 블롯팅 SDS-PAGE 및 웨스턴 블롯 분석을 공지의 프로토콜에 따라 수행하였다. 간단히 설명하면, 단백질 겔은 니트로셀룰로오스 막에 옮기고, 밀크로 차단한 후 일차 항체와 함께 인큐베이션하였다. 항인간 REP-1 2F1 항체 (2F1, 1:1000 희석) 및 다음: 항-GAPDH 항체 (1:1000 희석), 항 액틴 항체 (1:1000 희석) 및 항-튜불린 항체 (1:5000 희석) 중 하나를 각 블롯에 대한 일차 항체로서 사용하였다. 블롯을 세척한 후, 1:5000의 농도의 HRP 콘쥬게이트된 항-마우스 IgG 항체 및/또는 항-토끼 IgG 항체를 이차 항체로서 사용하였다. 블롯을 ECL 시약을 제조자의 설명에 따라 사용하여 화학발광에 의해 전개시켰다. 대조군: 1. 로딩 대조군: 다음: 항-액틴 항체, 항-튜불린 항체 및 항-GAPDH 항체 중 하나를 겔의 각 웰에서 단백질의 동등한 로딩을 증명하기 위한 로딩 대조군으로서 사용하였다. 항- 튜불린 항체는 ~51 kDa의 단백질을 검출한다. 항-액틴 항체는 ~42 kDa의 단백질을 검출하고, 항-GAPDH 항체는 ~39 kDa의 단백질을 검출한다. 초기 블롯을 항- 튜불린 항체 및 항-액틴 항체 및 항- GAPDH 항체 중 하나로 그것들의 이용도에 따라 프로빙하였다. 초기 실험 후에, 일관성이 있도록, 항-GAPDH 항체를 로딩 대조군으로서 사용하였다. 2. 포지티브 대조군: AAV2.V2a 형질도입된 COS-7 세포에서 수립된 hREP-1 단백질의 제조 후에, AAV2.V2a- Cos-7 세포 용해물을 후자의 웨스턴 블롯 실험에서 포지티브 대조군으로서 사용하였다. 3. 네거티브 대조군: 미처리 세포를 네거티브 대조군으로서 사용하였다. 다양한 세포주에서의 REP-1 단백질 제조의 웨스턴 블롯 결과의 분석을 표 5에 요약한다.

명칭	혈청형	세포주	도면	사용한 MOI	CHM 발현 (관찰)
AAV2.V2a	AAV2	COS-7	도 1	1E4- 1E6	테스트된 모든 MOI에서 CHM의 검출 가능한 발현
AAV2.V2a	AAV2	84-31	도 1	1E4- 1E6
AAV2.V2b	AAV2	COS-7	도 2	1E4- 1E6
AAV2.V2b	AAV2	84-31	도 2	1E4- 1E6
AAV2.V3a	AAV2	84-31	도 3	1E4- 1E6
AAV2.V3b	AAV2	84-31	도 3	1E4- 1E6
AAV8.V2a	AAV8	COS-7	도 4	1E4- 1E6	1E5-1E6의 MOI에서 CHM의 검출 가능한 발현
AAV8.V2a	AAV8	84-31	도 4	1E4- 1E6	1E5-1E6의 MOI에서 CHM의 검출 가능한 발현
AAV8.V2b	AAV8	COS-7	도 5	1E4- 1E6	3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현
AAV8.V2b	AAV8	84-31	도 5	1E4- 1E6	3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현
AAV8.V3a	AAV8	84-31	도 6	1E4- 1E6	3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현
AAV8.V3b	AAV8	84-31	도 6	1E4- 1E6	3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현

차세대 AAV2.copt.CHM/ AAV8.copt.CHM으로 형질도입된 세포에서 하나의 ~ 75 내지 80 kDa hREP-1 단백질인, 단클론성 인간 REP-1-특이적 항체. 75 내지 80 kDa 밴드는 미처리된 대조군 세포의 세포 용해물에서는 관찰되지 않았다. 항-액틴/항튜불린/항-GAPDH 항체 중 하나로의 블롯의 프로빙은 미처리 대조군을 포함하여 웨스턴 블롯의 모든 레인에서 동일한 밀도의 밴드를 나타냈다. 항-액틴 항체는 ~42 kDa에서 단백질 분자량 밴드를 검출하였고, 항-튜불린 항체는 ~ 51 kDa에서 단백질을 검출하였으며, 항-GAPDH 항체는 ~39 kDa에서 단백질을 검출하였다. 모든 항체는 예상된 크기 분자량의 특이적 밴드만을 검출하였다. 블롯의 어느 곳에서도 특이적이지 않은 밴드가 관찰되지 않았다. 사전-염색된 분자량 마커를 사용하여 관심의 단백질의 분자량을 비교하였다.

간단히 설명하면, REP-1 단백질을 AAV2.V2a, AAV2.V2b, AAV2.hCHM.V3a 및 AAV2.hCHM.V3b로 형질도입된 COS-7 및 84-31 세포에서 예상된 크기에서 관찰하였다. 미처리 대조군은 예상된 크기의 인간 REP-1 단백질의 존재를 나타내지 않았다. 항-액틴 항체로의 블롯의 표지화는 겔의 모든 레인에서 ~ 42 kDa에서 동일한 강도의 단백질 밴드를 검출하였다. 사전-염색된 단백질 래더(ladder)를 사용하여 REP-1 및 액틴의 분자량을 비교하였다. 데이터는 제시하지 않음.

결과는 차세대 플라스미드들을 함유한 AAV2 및 AAV8 혈청형 벡터가 84-31 및 COS-7 세포를 효율적으로 형질도입할 수 있음을 나타낸다. 차세대 플라스미드에서 CHM의 발현은 검출가능한 범위에 있었고, 용량 의존적 경향을 입증하였다. 세포의 차세대 hCHM 바이러스들로의 형질도입은 예측된 크기의 REP-1 단백질의 생성을 초래하였다.

실시예 5: AAV 천연.인간 CHM과 AAV.코돈-최적화된.인간 CHM의 시험관내 단백질 발현의 비교

이 연구의 목적은 다양한 버전의 CHM-함유 도입유전자 카세트를 함유한 AAV 벡터 (혈청형 2 및 8)의 형질도입 효율을 84-31 세포주 기반 연구 모델에서 REP-1 단백질의 수준을 측정함으로써 기술하는 것이었다.

플라스미드 및 벡터: 총 5개의 도입유전자 플라스미드를 AAV2 및 AAV8에서 비교하였다: 버전 1 (앞서 진행중인 임상 실험에서 사용되고 있음) 및 4개의 차세대 버전 (V2a, V2b, V3a 및 V3b). 플라스미드를 실시예 4에서 기술한 것과 같이 엔지니어링하였고, 그것의 특징을 표 1에 나타낸다. 상기 표 2는 생성된 AAV2 및 AAV8 벡터의 요약 및 바이러스 스톡의 농도를 나타낸다.

연구 디자인 (예컨대 치료 그룹)

1. 파일럿 실험으로, COS-7 및 84-31 세포를 AAV2.hCHM.버전1, 버전2a 및 버전 2b로 형질도입시켰다. 웨스턴 블롯을 수행하여 두 세포주에서 형질도입 효율 수준을 비교하였다.

2. 6-웰 플레이트에 플레이팅한 84-31 세포를 10개의 테스트물 (AAV2 및 AAV8 배경 중 어느 하나의 버전 1, 2a, 2b, 3a 및 3b) 중 하나로 3E5의 MOI에서 형질도입하였다. 36 내지 48시간 후, 세포를 수득하고 용해시켰다. 용해물을 SDS-PAGE에 로딩하고, 추가로 웨스턴 블롯 분석을 수행하였다. 두 개의 별도의 용해물을 각각의 AAV2.CHM 및 AAV8.CHM 실험에 대해 구성하고, 별도로 분석하였다.

테스트 물질 투여

3.4.1 세포 배양

83-41 세포 및 COS-7를 둘 다, 10% 소 태아 혈청 및 1% 페니실린/스트렙토마이신이 첨가된 둘베코 변형 이글 배지 (DMEM)-고 글루코오스에서 37℃에서 5% CO2가 첨가된 환경에서 배양하였다.

3.4.2 형질도입을 위한 세포의 제조:

형질도입 전날 (18 내지 24시간 전)에 83-41 및 COS-7 세포를 6-웰 세포 배양 접시에서 웰당 2 ml의 세포 배양 배지에 3E5의 밀도로 시딩하였다. 시딩한 세포를 37℃에서 5% CO2가 첨가된 환경에서 인큐베이션하였다.

3.4.3 형질도입:

83-41 세포 및 COS-7의 웰을 하기에서 기술된 것과 같이 AAV 벡터로 3E5의 MOI에서 감염시켰다 (파일럿 실험에 대해 표 6 참조 및 실험의 제 2 세트에 대해 표 7 참조). 네거티브 (미처리) 대조군에는 바이러스를 첨가하지 않았다. 간단히 설명하면, 먼저, 6 웰 세포 배양 접시의 각 웰에서 조직 배양 배지를 제거하고 2 ml의 신선한 배지/웰로 교체하였다. 그런 다음 소정량의 AAV 벡터 (형질도입을 위해 사용한 벡터 부피에 대해서는 표 2 참조)를 측정하고 (스톡으로부터) 직접 각 웰에 첨가하였다. 세포를 AAV 바이러스와 함께 36 내지 48시간 동안 37℃에서 5% CO2에서 수득할 때까지 인큐베이션하였다. 세포를 현미경으로 관찰한 후 수득하여 임의의 비정상을 조사하였다. 웨스턴 블롯 분석을 실시예 4에서 기술한 것과 같이 수행하였다.

파일럿 실험: 84-31 및 COS-7 세포에서 AAV2.hCHM.V1, 2a, 2b의 감염 용량

사용한 벡터	세포주	세포 밀도	사용한 벡터 (μL)	MOI
없음	84-31	3E5	0
AAV2.V1	84-31	3E5	13.42	3E5
AAV2.V2b	84-31	3E5	8.11	3E5
AAV2.V2a	84-31	3E5	27.78	3E5
AAV2.V1	COS-7	3E5	13.42	3E5
AAV2.V2b	COS-7	3E5	8.11	3E5
AAV2.V2a	COS-7	3E5	27.78	3E5
없음	COS-7	3E5	0	0

84-31 세포에서 AAV.hCHM 차세대 벡터 및 V1(AAV2 및 AAV8)의 감염 용량

사용한 벡터	세포주	세포 밀도	사용한 벡터 (μL)	MOI
없음	84-31	3E5	0	0
AAV8.V2a	84-31	3E5	5.77	3E5
AAV8.V2b	84-31	3E5	5.41	3E5
AAV8.V3a1	84-31	3E5	6.92	3E5
AAV8.V3b	84-31	3E5	4.41	3E5
AAV8.V1	84-31	3E5	4.32	3E5
없음	84-31	3E5	0	0
AAV2.V2a	84-31	3E5	27.78	3E5
AAV2.V2b	84-31	3E5	8.11	3E5
AAV2.V3a	84-31	3E5	12.45	3E5
AAV2.V3b	84-31	3E5	10.15	3E5
AAV2.V1	84-31	3E5	13.42	3E5

결과: 84-31 및 COS-7 세포에서 천연 hCHM (AAV2.hCHM.V1) 대비 코돈-최적화된 CHM AAV2a 및 2b 벡터의 발현의 비교

이 실험에서 84-31 및 COS-7 세포를 벡터 없이 (미처리 대조군), AAV2.hCHM.버전1, AAV2.hCHM.버전2a 또는 Aav2.hCHM.버전2b로 형질도입시켰다. 항-인간 REP-1 항체로의 웨스턴 블롯 분석은 REP-1 단백질 수준이 모든 AAV2 (V1, V2a, V2b) 형질도입된 샘플 및 둘 다의 세포주에서 ~ 75 내지 80 kDa에서 검출 가능하였음을 나타냈다 (데이터는 제시하지 않음). 약간 더 나은 단백질 발현을 84-31 세포주에서 볼 수 있었다 (표 8). 항-REP1 항체는 미처리 세포에서 무시할 정도의 양의 REP-1 단백질을 검출하였다. GAPDH 항체로의 블롯의 표지화는 미처리 세포를 포함한 모든 세포 용해물에서 ~39 kDa에서 밴드를 검출하였다.

ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가 (단백질 수준의 정량)는, 내인성 GAPDH 단백질의 발현에 대한 값을 표준화한 후에, 형질도입 효율이 84-31 및 COS-7 세포에서 유사하였음을 증명하였다. (결과에 대해서는 표 8 참조). 이것을 기반으로, 인간 기원으로부터의 84-31 세포주를 추가의 실험에 사용하였다.

결론적으로, AAV2.V1, AAV2.V2a 및 Aav2.V2b는 84-31 및 COS-7 세포 둘 다에서, REP-1 단백질의 생성을 유사한 형질도입 효율로 유도하였다.

웨스턴 블롯의 밀도측정에 의한 평가

		REP-1	GAPDH	V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
84-31	AAV2.V1	23416.844	19350.773	1	23416.844	100
	AAV2.V2b	36626.765	20357.894	1.011	36203.838	154.605
	AAV2.V2a	31114.844	20315.945	1.009	30819.0684	131.610
분자량 마커
COS-7	AAV2.V1	12880.459	15479.288	1	12880.459	100
	AAV2.V2b	14321.167	14321.167	0.711	26991.925	209.557
	AAV2.V2a	13145.924	13145.924	0.849	17818.595	138.338

84-31 세포에서 천연 CHM 대비 코돈-최적화된 CHM AAV2 벡터의 발현의 비교: 항-인간 REP-1 항체를 사용하여, AAV2.hCHM.V2a, V3a, V2b, V3b 및 V1로 형질도입된 84-31 세포의 웨스턴 블롯 분석은 모든 조건에서 ~ 75 내지 80 kDa에서 밴드를 검출하였다 (데이터는 제시하지 않음). 항-REP1 항체는 미처리 세포에서 무시할정도의 양의 REP-1 단백질을 검출하엿다. GAPDH 항체로의 블롯의 표지화는 미처리 세포를 포함한 모든 세포 용해물에서 ~ 39 kDa에서 밴드를 검출하였다. ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는, 내인성 GAPDH 단백질의 생성에 대한 값을 표준화한 후에, AAV2.hCHM.V1과 비교하여 AAV2.hCHM.V2a, 3a, 2b 및 3b의 발현의 증가를 증명하였다. 결과에 대해서는 표 9 및 10을 참조한다.

플레이트 1에 대한 AAV2.hCHM. V1, Va, V2b, V3a 또는 V3b로의 형질도입 후 84-31 세포에서 REP-1 단백질의 값 (웨스턴 블롯은 제시되지 않음)

구성물		원래의 값		V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
명칭	레인 번호	REP-1	GAPDH	V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
AAV2.V1	1	23367.593	15155.602	1	23367.593	100
AAV2.V2a	3	26949.421	10969.581	0.723797115	37233.39103	159.3377248
AAV2.V3a	5	29867.714	14595.894	0.963069233	31013.0497	132.7182038
AAV2.V2b	7	32728.128	14133.551	0.932562824	35094.82381	150.1858741
AAV2.V3b	9	33986.543	13670.066	0.901981063	37679.88531	161.2484662

플레이트 2에 대한 AAV2.hCHM. V1, V2a, V2b, V3a 또는 V3b로의 형질도입 후 84-31 세포에서 REP-1 단백질의 값 (웨스턴 블롯은 제시되지 않음)

구성물		원래의 값		V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
명칭	레인 번호	REP-1	GAPDH	V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
AAV2.V1	2	23128.593	11993.823	1	23128.593	100
AAV2.V2a	4	23623.836	10982.798	0.915704526	25798.53582	111.5439051
AAV2.V3a	6	28832.543	13176.359	1.098595419	26244.91465	113.473892
AAV2.V2b	8	31349.229	16028.329	1.336381986	23458.28463	101.4254721
AAV2.V3b	10	33273.856	14760	1.230633469	27037.99047	116.9028763

84-31 세포에서 AAV8.V1, V2a, V3a, V2b, V3b 벡터의 천연 CHM 대비 코돈-최적화된 CHM의 발현의 비교: AAV8.V1, AAV8.V2a, AAV8.V3a, AAV8.2b, AAV8.3b로, 항-인간 REP-1 항체로 형질도입된 세포들의 분석은 모든 형질도입된 세포에서 ~75 내지 80 kDa에서 밴드를 검출하였다 (데이터는 제시하지 않음). 항-REP1 항체는 미처리 세포에서 무시해도 좋을 양의 REP-1 단백질을 검출하였다. 블롯의 GAPDH 항체로의 표지화는 미처리 세포를 포함하여, 모든 세포 용해물에서 ~ 39 kDa에서 밴드를 검출하였다. ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가는 AAV8.V1에 비교하여 AAV8.hCHM.V2a; 3a; 2b; 3b의 더 높은 발현을 증명하였다. 값들은 각각의 내인성 GAPDH 단백질의 발현에 대하여 CHM 값을 먼저 표준화한 훼, 버전 1의 평균 발현 수준에 대해 표준화하였다. 결과에 대해서는 표 11 및 표 12를 참조한다.

AAV8 hCHM 버전 1, 2a, 2b, 3a 및 3b로의 형질도입 후 84-31 세포에서 REP-1 단백질 발현의 값 - 플레이트 1 (데이터는 제시하지 않음)

구성물		원래의 값		V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
명칭	레인 번호	REP-1	GAPDH	V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
AAV8.V1	11	3630.589	20309.924	1	3630.589	100
AAV8.V2a	13	7133.439	17051.48	0.839	8496.599	234.028
AAV8.V3a	15	5828.418	15801.045	0.777	7491.575	206.346
AAV8.V2b	17	11411.702	19249.681	0.947	12040.241	331.633
AAV8.V3b	19	17610.066	18727.024	0.922	19098.555	526.045

AAV8 hCHM 버전 1, 2a, 2b, 3a 및 3b로의 형질도입 후 84-31 세포에서 REP-1 단백질 발현의 값 - 플레이트 2 (데이터는 제시하지 않음)

구성물		원래의 값		V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
명칭	레인 번호	REP-1	GAPDH	V1의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP-1	V1의 REP-1에 대해 표준화된 REP-1 (%)
AAV8.V1	12	3507.468	19082.681	1	3507.468	100
AAV8.V2a	14	4369.296	13274.731	0.695642871	6266.571801	178.6636913
AAV8.V3a	16	6533.246	20720.246	1.0858142	6016.909708	171.5456765
AAV8.V2b	18	13962.045	17842.167	0.934992677	14932.7854	425.7425983
AAV8.V3b	20	16049.823	13836.368	0.725074637	22135.40811	631.0936581

결론: 비슷한 발현 연구는 차세대 AAV. hCHM. 버전 2a, 2b, 3a 및 3b를 지닌 AAV 벡터의 적용이 84-31 세포에서 AAV2 및 AAV8 혈청형 벡터 둘 다의 버전 1 (현재 임상 시험에서 사용됨)과 비교하여 REP-1 단백질의 증가된 생성을 유도하였음을 증명하였다.

실시예 6: qPCR 역가 분석에 의한 AAV 벡터 생성에 미치는 람다 스터퍼 효과의 평가

단일 qPCR (정량적 중합효소 사슬 반응) 작동을, DNA 불순물의 양에 미치는 람다 스터퍼 서열의 효과를 평가하기 위하여, 상기 표 2에 나타낸 8개의 모든 AAV 벡터에서 수행하였다. 선형화된 AAV 플라스미드 표준을 사용하여 검정 표준을 생성하였다. 프라이머-프로브 세트를 적절하게 포장된 AAV 게놈의 정량을 위해 CMV/CBA 프로모터 영역에 대해 또는 역 포장을 위해 카나마이신 내성 (KanR) 암호화 영역에 대해 디자인하였다. 표준 및 벡터 샘플을 두 세트에서 작동시켰는데, 하나에는 CMV/CBA 프라이머-프로브 세트가 있고 다른 하나에는 kANr 세트가 있었다. 벡터 샘플 값 (mL당 바이러스 게놈 복사물)을 각각의 표준 곡선으로부터 측정하였다. CMV/CBA 함유 서열에 반하는 각 벡터 로트의 KanR-함유 불순물의 상대적인 양을 비교함으로써 스터퍼 서열의 효과를 평가하였다.

시약:

도입유전자-함유 바이러스 벡터 역가:

기준: CMV-CBA 프로모터

프라이머: CMV-F: CCC ACT TGG CAG TAC ATC AA

CMV-R: GCC AAG 태그 GAA AGT CCC ATA A

FAM-프로브: /56-FAM/CA TAA TGC C/ZEN/A GGC GGG CCA TTT AC/3IABkFQ/

불순물-함유 바이러스 벡터 역가:

기준: 카나마이신 내성 유전자

프라이머:

KAN-F: GAT GGT CGG AAG TGG CAT AA

KAN-R: TGC GCC AGA GTT GTT TCT

FAM-프로브: /56-FAM/CC GTC AGC C/ZEN/A GTT 태그 TCT GAC CA/3IABkFQ/

희석 시약: 희석제 Q (뉴클레아제 유리 물 중의 0.001% PF-68): 멸균수로 100-배 희석된 1% PF-68 용액. 희석제 S: 희석제 Q + 2 ng/μL 연어 정자 DNA (Agilent technologies Cat# 201190)

ABI TaqManTM Universal 마스터 믹스 (Applied Biosystems 4304437/4326708)

Qiagen PCR 생성물 정제 키트 (Qiagen 28104)

* ABI QuantStudio 6 Flex 시스템

샘플 제조

Dnase 소화 용액을 다음을 조합함으로써 제조하였다: Dnase 완충제 (10X) 5 μL, 뉴클레아제-유리 H2O 30 μL, Dnase I (Invitrogen, 18068-015) 5 μL.

10 μL의 각각의 AAV 벡터 샘플을 혼합하고 주변 온도에서 10분 동안 인큐베이션하였다. 소화 혼합물을 50 μL의 SDS/EDTA/NaCl 용액 (0.2% SDS/5mM EDTA/0.2M NaCl)을 첨가하고 95℃에서 10분 동안 인큐베이션함으로써 비활성화하였다. 각각의 AAV 벡터 샘플을 qPCR 분석을 위해 희석제 S로 10 내지 100,000배 희석하였다.

qPCR 표준 제조

기준 표준 DNA (선형화됨)를 플라스미드 p1008 (스터퍼 없는 저 복사물 도입유전자 플라스미드)을 XhoI로 소화시키고 Qiagen PCR 정제 키트로 정제함으로써 준비하였다. 정제된 물질을 아가로오스 겔에서 분석하여 정체를 확인하고, Nanodrop에 의해 정량하였다. DNA 복사물 수를 다음의 등가물: 1 bp = 1.096E-21 g를 사용하여 스톡 농도로부터 측정하였다. qPCR 표준을 다음 표에 따라 제조하였다:

DNA 표준	농도 [복사물/10 μL]	희석
표준 스톡	2 x 10⁹	NA
S1	1 x 10⁸	10 μL 스톡 + 190 μL 희석제 S
S2	1 x 10⁷	10 μL S1 + 90 μL 희석제 S
S3	1 x 10⁶	10 μL S2 + 90 μL 희석제 S
S4	1 x 10⁵	10 μL S3 + 90 μL 희석제 S
S5	1 x 10⁴	10 μL S4 + 90 μL 희석제 S
S6	1 x 10³	10 μL S5 + 90 μL 희석제 S

PCR 반응 구성

추출한 DNA 샘플을 삼중으로 (3 웰) 단일 qPCR 작동으로 분석하였다. 작동은 삼중의 기준 DNA 표준을 웰당 103 내지 108 복사물 범위로 포함하였다. 주형이 없는 대조군 (NTC)을 음성 대조군으로서 포함시켰다. 각각의 AAV 벡터 제제를 CMV/CBA 및 KanR 프라이머/프로브 세트 두 가지로 분석하였다. 유사하게, 각 세트의 정량을 위해, 표준을 또한 CMV/CBA 및 KanR 프라이머/프로브 세트로 분석하였다.

PCR 반응 구성

시약	반응의 최종 농도	25 μL 반응당 부피
유니버살 마스터 믹스 (2x)	1x	12.5 μL
최적화된 프라이머 믹스 (20 μM)	0.8 μM	1.0 μL
Taqman 프로브 (10 μM)	0.2 μM	0.5 μL
뉴클레아제-유리 물	NA	1.0 μL
샘플/표준	NA	10.0 μL

PCR 반응 서열을 다음과 같이 구성하였다: 50℃ 2분 1 사이클; 95℃ 10분 1 사이클; 95℃ 15초 40 사이클; 60℃ 1분 40 사이클.

작동 성능. 표준을 준비하여 웰당 103 내지 108 DNA 복사물로 작동시켰다. 검정 민감도가 이 실험에 대해서는 중요한 인자가 아니었기 때문에 검정의 하한선을 1000 복사물로 설정하였다. 표준 곡선을 표준의 표준 복사물 수 및 CT (한계 사이클) 값을 사용하여 작동에 대해 생성하였다. 표준의 선형 회귀를 ABI 소프트웨어를 사용하여 수행하였다 (데이터는 제시하지 않음). 표준 곡선 맞춤은 0.998 이상의 상관 계수 (R2 값)를 가졌고, 그것은 믿을만한 맞춤 모델임을 가리킨다. 표준 곡선의 기울기는 -3.5였다. 기울기를 증폭 반응의 효율을 계산하기 위해 사용하였고, -3.2 내지 -3.6의 값은 90% 내지 110%의 증폭 효율을 나타냈다. 두 표준 곡선은 92.6 내지 93.8% 효율로 작동되었다. 삼중 웰들의 정확도 범위는 2 내지 10%였는데, 그것은 복제물들 중에서 양호한 일치를 가리킨다. 주형이 없는 대조군 (NTC)은 검정의 하한선 아래의 정량할 수 없는 증폭을 초래하였다.

표준 곡선 맞춤의 요약

리포터	표적	기울기	Y-절편	R	효율 (%)
FAM	CMV	-3.513	41.896	0.998	92.597
FAM	KAN	-3.481	39.968	1.000	93.761

결과:

샘플 값 측정: 샘플 값 (AAV 게놈 및 역-포장 복사물 수)을 각각의 매칭 표준 곡선 (CMV/CBA 또는 KanR)으로부터, CT 값을 사용하여 내삽하였다. 내삽된 DNA 복사물 수를 초기 희석 및/또는 소화 희석에 대해 교정하였다. 2의 추가의 교정 인자를 샘플 중의 이중-가닥 DNA 표준과 단일-가닥 DNA 사이의 차이를 설명하기 위해 적용하였다.

8개의 AAV 벡터에 대한 분석 결과를, 도입유전자-함유 AAV 농도 (CMV/CBA)와 KanR-함유 불순물 농도 사이의 정량적 비교를 포함하여, 하기 표에 요약한다. 결과의 분석은 람다 스터퍼의 도입유전자 플라스미드로의 삽입이 AAV 생성 중에 플라스미드-골격 DNA (즉 KanR) 포장의 발생을 ~7 내지 20배나 효율적으로 감소시켰음을 증명한다 (도 11).

백분율로 표시된 카나마이신 대비 CMV/CBA의 qPCR 증폭

샘플 명칭	람다 스터퍼	CMV/CBA qPCR (vg/ml)	KanR qPCR (vg/ml)	Kan 대비 CMV/CBA (%)
AAV2.V2b	없음	1.23E+13	6.46E+11	5.25%
AAV2.V2a	있음	4.61E+12	3.60E+10	0.78%
AAV8.V2b	없음	3.19E+13	1.43E+12	4.48%
AAV8.V2a	있음	2.90E+13	1.19E+11	0.41%
AAV2.V3b	없음	1.26E+13	6.69E+11	5.31%
AAV2.V3a	있음	6.33E+12	4.56E+10	0.72%
AAV8.V3b	없음	5.19E+13	3.07E+12	5.92%
AAV8.V3a	있음	2.60E+13	8.00E+10	0.31%

실시예 6: 웨스턴 블롯에 의한 iPS 세포에서 차세대 AAV8 벡터의 시험관내 발현.

이 연구의 목적은 유도된 다능성 세포주 (iPSC)에서 코돈 최적화된 REP-1-암호화 유전자를 지닌 일련의 차세대 AAV2 및 AAV8 벡터를 사용한 유전자 전달 후에 AAV 매개된 CHM 발현의 능력을 평가하는 것이었다.

유도된 다능성 줄기 (iPS) 세포 기술은 눈 질환을 포함한 여러 개념 입증 및 유전자 요법 연구에서 유전자 요법 벡터를 시험하기 위한 플랫폼으로서 성공적으로 이용되어 왔다. 이런 환자-특이적 iPS 세포들은 질환 발병을 연구하고 관련된 동물 모델이 활용될 수 없는 유전자 요법의 개념 입증을 테스트하기 위한 모델을 수립하기 위한 가치있는 시험관내 모델 시스템을 제공한다. 범맥락막 위축 (CHM)에 대한 본 발명자들의 AAV-매개된 유전자 증대 요법을 테스트하기 위한 예비 단계로서, 본 발명자들은 Rab 에스코트 단백질 1 (REP-1)을 암호화하는, 원인이 되는 유전자, CHM에 돌연변이를 은닉하고 있는 인간 환자로부터 iPS 세포를 생성하였다 (실시예 1 참조)(방법은 NCP.003에서 기술됨). 생성된 iPS 세포를 본 발명자들의 차세대 AAV.코돈 최적화된.CHM 구성물의 시험관내 발현을 평가하기 위해 사용하였다.

플라스미드 및 벡터를 실시예 4에서 기술한 것과 같았다. 유도된 다능성 줄기 (iPS) 세포는 실험실에서, 다능성 상태로 역 리프로그래밍된 체세포, 말초혈 단핵 세포로부터 생성된 줄기 세포이다. 혈액 세포의 리프로그래밍은 치료 적용을 위해 개인화된 시험관내 세포 모델의 발생을 가능하게 한다. 이 보고서에서, CHM에 의해 영향을 받은 개체로부터의 iPS 세포를 웨스턴 블롯 분석을 통해 REP-1 단백질의 시험관내 생성을 테스트하기 위해 사용하였다. 다음의 표 (표 17)는 연구된 iPS 세포 및 그것들의 각각의 CHM 질환-유발 돌연변이의 상세한 설명을 기술한다.

CHM 돌연변이를 가진 환자로부터 생성된 iPS 세포의 개요

세포주	영향 여부	CHM의 돌연변이	iPSC 생성 방법
JB 588	영향을 받음	Arg 555 중단	Sendai 바이러스 매개 리프로그래밍
JB 527*	영향을 받음	엑손 2 내지 4 결실	Sendai 바이러스 매개 리프로그래밍
JB 500*	영향을 받음	Ex 10c.1327_1327 del AT (확인 필요)	Sendai 바이러스 매개 리프로그래밍

* iPS 세포주 정량 테스트는 진행 중이다.

연구 디자인 (예컨대 치료 그룹)

1. 12 웰 세포 배양 플레이트에 플레이팅된 iPS 세포를 AAV2. hCHM 버전 1, 버전 2a; 버전 2b; 버전 3a; 버전 3b (AAV2.V1; V2a; V2b; V3a; V3b)로 1E5 또는 3E5 중 어느 하나의 MOI로 감염시킨다. 24시간 동안의 형질도입 후에, 1 ml의 iPS 세포 배양 배지를 세포에 첨가하였다. 36 내지 48시간의 형질도입 후에, 세포를 수득하고, 용해시킨 후 SDS-PAGE와 이어서 웨스턴 블롯 분석에 대해 처리하였다. REP-1 단백질의 생성을 모든 버전의 구성물로 형질도입된 세포에서 평가하고 미처리 대조군과 비교하였다.

2. 파일럿 실험으로서, 12 웰 세포 배양 플레이트에 플레이팅된 3개의 상이한 iPS 세포주를 AAV8. hCHM 버전 1 및 AAV8. hCHM 버전 2a (AAV8.V1; AAV8.V2a)로 1E6의 MOI로 형질도입시킨다. iPS 세포주를 REP1 유전자에 미관련 돌연변이를 가진, 3명의 CHM 영향을 받은 개체로부터 취하여 이 목적에 대한 별도의 플레이트에 플레이팅하였다. 36 내지 48시간 후에, 세포를 수득하고 용해시켜서 웨스턴 블롯 분석을 수행한 후 미처리 세포 용해물과 비교하였다.

테스트 물질 투여

3.4.1 세포 배양

CHM 환자로부터 iPS 세포의 배양. 간단히 설명하면, iPS 세포를 5% CO2 및 5% O2가 보충된 환경에서 iPS 세포 배양 배지에서 37℃에서 마우스 배아 섬유모세포 (MEF, 공급자)에서 배양하였다.

3.4.2 형질도입을 위한 세포의 제조

세포를 시딩하기 전날에, 12-웰 접시를 참조 NCP.003 (NCP.003: CHM 환자 및 대조군으로부터의 iPS 세포의 배양)에서 기술한 것과 같이 Matrigel로 코팅하였다. iPS 세포를 각각의 AAV2 또는 AAV8 바이러스 벡터로 형질도입하기 전에, MEF에서 배양한 세포를 MEF가 없는 Matrigel에 시딩하였다 (공급자 없는 배양). 세포를 12-웰 세포 배양 접시의 각 웰에서 1 ml의 iPS 세포 배양 배지에 4.5+E5 내지 6+E5의 밀도로 시딩하였다. 시딩한 세포를 37℃에서 5% CO2, 5% O2가 보충된 환경에서 인큐베이션하였다.

3.4.3 형질도입

iPS 세포를 바이러스 벡터로 감염시키기 위하여, 세포를 대략 50 내지 60%의 집밀도까지 성장시켰다. (이것은 공급자 없는 조건에서 2 내지 4일이 걸릴 수 있다). 일단 50 내지 60%의 집밀도가 이루어지면, 12-웰 중 한개의 웰을 분리하고 세포 카운트를 수행하여 웰당 세포의 총 수를 측정한다. 그런 다음 iPS 세포의 웰을 소정의 MOI에서 하기 열거한 AAV 벡터로 감염시킨다 (표 18 및 19 참조). 형질도입 전에, 오래된 iPS 세포 배양 배지를 플레이트로부터 제거하고 신선한 1 ml의 iPS 세포 배양 배지를 각 웰에 첨가하였다. 스톡으로부터의 소정 부피의 바이러스를 직접 각 웰에 첨가하였다. 표 18 및 표 19 참조. 감염된 세포의 총수, 감염에 사용된 바이러스의 MOI 및 부피에 대한 정보에 대해. 세포를 다음에 37℃에서 5% CO2, 5% O2가 보충된 환경에서 18 내지 24시간 동안 인큐베이션하였다. 18 내지 24시간의 형질도입 후에, 세포를 현미경 하에서 임의의 비정상 또는 세포 사망에 대해 관찰하였다. 이 지점에서, 1 ml의 신선한 iPS 세포 배양 배지를 다시 감염 및 비감염 세포를 함유하고 있는 각 웰에 첨가하고, 추가로 37℃에서 5% CO2, 5% O2가 보충된 환경에서 추가의 18 내지 24시간 동안 인큐베이션하였다. 세포를 수득 전에 임의의 세포 사망 또는 비정상 출현에 대해 현미경 하에서 관찰하였다.

CHM 환자-유래 iPS 세포에서 차세대 AAV2.hCHMV2a, 2B, 3a, 3b 벡터 및 AAV2.hCHM.V1 벡터의 감염 상세 및 MOI

사용한 벡터	세포주	세포주 번호	세포 밀도	바이러스 스톡 농도 (vg/ml)	사용한 벡터 (μL)	MOI
AAV2.V2a	iPSC	JB 588	6E5	2.16E+12	30	1E5
AAV2.V2a	iPSC	JB 588	6E5	2.16E+12	90	3E5
AAV2.V2b	iPSC	JB 588	6E5	7.4 E+12	8.1	1E5
AAV2.V2b	iPSC	JB 588	6E5	7.4 E+12	24.3	3E5
AAV2.V3a	iPSC	JB 588	6E5	4.82E+12	12.4	1E5
AAV2.V3a	iPSC	JB 588	6E5	4.82E+12	37.3	3E5
AAV2.V3b	iPSC	JB 588	6E5	5.91E+12	10.2	1E5
AAV2.V3b	iPSC	JB 588	6E5	5.91E+12	30.5	3E5
AAV2.V1	iPSC	JB 588	6E5	4.47E+12	30.6	1E5
AAV2.V1	iPSC	JB 588	6E5	4.47E+12	40.9	3E5

3명의 상이한 CHM 환자로부터 유래된 3개의 iPS 세포주에서 AAV8.V2a 및 AAV8.V1 벡터의 감염 용량

사용한 벡터	세포주	세포주 번호	세포 밀도	바이러스 스톡 농도(vg/ml)	사용한 벡터 (μL)	MOI
미처리	iPSC	JB 588	4.5 E5
AAV8.V2a	iPSC	JB 588	4.5 E5	1.04 E+13	43	1E6
미처리	iPSC	JB 500	4.5 E5
AAV8.V1	iPSC	JB 500	4.5 E5	1.39 E+13	32	1E6
미처리	iPSC	JB 527	4.5 E5
AAV8.V1	iPSC	JB 527	4.5 E5	1.39 E+13	32	1E6
AAV8.2a	iPSC	JB 527	4.5 E5	1.04 E+13	43	1E6

결과 측정 방법 - 웨스턴 블롯 분석을 본원에서 기술한 것과 같이 수행하였다.

결과

5.1 JB588 iPS 세포주에서 AAV2-hCHM V1, V2a, V2b, V3a, V3b의 발현: 단클론성 인간 REP-1-특이적 항체는 형질도입된 JB 588 iPS 세포에서 ~75 내지 80 kDa의 hREP-1 단백질을 검출하였다 (데이터는 제시하지 않음). 미처리 대조군의 경우에 밴드는 관찰되지 않았고, 그것은 질환의 존재를 확인해 주었다 (데이터는 제시하지 않음). 3E5의 MOI에서 REP-1 단백질 밴드의 강도는 1E5의 MOI에 비교하여 모든 벡터에서 더 강력한 것으로 관찰되었다. iPS 세포로의 hCHM 유전자의 재조합 AAV2. hCHM 바이러스 매개된 전달은 REP-1 단백질의 용량-의존성 생성을 초래하였다. 블롯의 GAPDH 항체로의 프로빙(probing)은 모든 용해물에서 동일한 밀도의 밴드를 나타냈다. GAPDH는 ~39 kDa에서 단백질을 검출하였다. REP-1 및 GAPDH 항체는 둘 다 예상한 분자량의 유일한 특이적 밴드를 검출하였다. 블롯에서 비특이적인 밴드는 관찰되지 않았다.

iPS 세포에서 AAV8 -hCHM. V1, V2a의 발현: 단클론성 인간 REP-1-특이적 항체는 형질도입된 JB527, JB500 및 JB588 환자 유래된 iPS 세포에서 하나의 단일한 ~75 내지 80 kDa의 REP-1 단백질을 검출하였다 (데이터는 제시하지 않음). 미처리 대조군의 경우에 밴드는 관찰되지 않았다 (데이터는 제시하지 않음). 블롯의 GAPDH 항체로의 프로빙은 미처리 세포로부터의 세포 용해물을 포함하여 모든 세포 용해물에서 동일한 밀도의 밴드를 나타냈다. 항-GAPDH 항체는 특이적인 ~39 kDa 단백질 밴드를 검출하였다. REP-1 및 GAPDH 항체는 둘 다 예상한 크기의 분자량에서 유일한 특이적 단백질 밴드를 검출하였다. 블롯에서 검출 가능한 비특이적 단백질 밴드는 관찰되지 않았다.

결론

현재 보고서에서 제공된 예비 결과는 다음의 관찰사항을 드러냈다: 웨스턴 블롯 분석은 3명의 환자-유래된 iPSC (JB588, JB500, JB527)의 각각에서 CHM의 존재 (REP-1 단백질의 결핍)를 확인해주었다. 시험관내 발현 연구는 CHM 환자로부터의 iPS 세포를 AAV2.hCHM. 버전 2a, 2b, 3a, 3b 및 AAV2.hCHM 버전 1 (현재 임상 시험 후보)로 감염시키는 것이 테스트된 모든 MOI에서 REP-1 단백질의 생성을 유도하였음을 증명하였다. iPS 세포를 1E6의 MOI에서 AAV8. hCHM.버전 2a 및 AAV8.hCHM 버전 1로 감염시키는 것은 3개의 모든 CHM iPS 세포주에서 REP1 단백질의 생성을 초래하였다. REP1 생성 수준은 AAV8.hCHM.V1보다 AAV8.hCHM.V2a로 감염된 iPS에서 더 높았다.

실시예 7: AAV8.코돈 최적화된.인간 CHM 대비 AAV.천연.인간 CHM의 생체내 발현의 비교

많은 망막 질환에 대한 유전자 요법은 적절한 표적 세포, 범맥락막 위축에 대해서는, 망막 색소 상피 (REP) 세포 및 광수용체 세포의 효율적인 형질도입에 의존한다. 이 연구 보고서는 천연 CHM 서열 기반 구성물, (버전 1) 및 야생형 마우스에서 AAV8 골격에 포장된 4개의 차세대 도입유전자 카세트에 의해 유도된 생체내 발현의 비교에 초점을 맞춘다. 여기서 본 발명자들은 광수용체 세포로의 유전자 전달을 개선할 목적으로 AAV8 혈청형을 평가하였다.

본 발명자들의 실험을 다음의 질문들에 답하기 위해 디자인하였다: a. 이 벡터들은 광수용체의 생체내 형질도입에 대해 어떻게 비교할 것인가? 특히, 차세대 AAV8. CHM은 각각의 테스트물의 망막밑 주입 후에 버전1.b와 비교하여 얼마나 효율적으로 광수용체를 형질도입시키는가? b. 용량 반응: 차세대 AAV8. CHM 및 AAV8. CHM-버전1 벡터는 유전자 발현의 용량 반응에서 상이할 것인가?

실험의 상세:

플라스미드 및 벡터는 실시예 4에서 기술한 것과 같았다. 마우스 (동물): 야생형, CD1 마우스를 REP-1 단백질의 생성에 의해 평가되는 것과 같이 CHM의 생체내 발현을 테스트하기 위해 사용하였다. CD1 마우스 스트레인은 이계교배된 스위스 마우스 스트레인이고, 본 발명자들은 내부에서 그 집단을 유지하였다. 연구의 상세는 CAROT 연구 프로토콜 PCPR02.01 하에 기술한다.

3.3 연구 디자인 (예컨대 치료 그룹)

3.3.1 동물 사육: 체중이 ~20 내지 30 그램인 수컷 및 암컷 마우스들 (~ 3 내지 4개월령)을 기술된 테스트물로 주입하였다. 동물들을 펜실베니아 대학교 (University of Pennsylvania)의 존 모르간 유니버시티 실험실 동물 자원 (John Morgan University Laboratory Animal Resources (ULAR)) 시설에서 펜실베니아 대학의 ULAR 규정에 따라 수용하였다. 마우스들을 12시간-빛/12시간-어둠 사이클로 유지하였다. 사료 및 물은 마음대로 먹을 수 있도록 제공하였다. 모든 동물을 귀의 태그 번호로 식별하였다.

3.4 테스트 물질 투여: CAROT Vector Core에 의해 제공된 테스트물 제제를 용량 투여를 위해 사용하였다. 테스트 물질을 -60 내지 -80℃에서 보관하였다. 테스트 물질을 투약 전에 얼음에서 해동시켰다. 안내 주입을 위해, 테스트물을 제제 표 20에 기술된 것과 같이 포스페이트-완충된 식염수로 표적 농도로 희석하였다. 총 60 μl의 마스터 믹스를 제조하였다.

테스트물의 망막밑 주입을 위한 용량 제제 표.

확인	롯트 번호	벡터 농도 (vg/ml)	총 60 μl에 대한 부피(μl)	총 60 μl에 대한 PBS의 부피(μl)	주입된 농도 (vg)	총 부피 주입 (μl)
AAV8.V2a	CT245	1.04E+13	1.92	58.1	5E8	1.5 μl
AAV8.V2a	CT245	1.04E+13	19.2	40.8	5E9	1.5 μl
AAV8.V2b	CT244	1.11E+13	1.8	58.2	5E8	1.5 μl
AAV8.V2b	CT244	1.11E+13	18	42	5E9	1.5 μl
AAV8.V3a	CT259	8.67E+12	2.31	57.7	5E8	1.5 μl
AAV8.V3a	CT259	8.67E+12	23.1	36.9	5E9	1.5 μl
AAV8.V3b	CT255	1.36E+13	1.47	58.53	5E8	1.5 μl
AAV8.V3b	CT255	1.36E+13	14.7	45.3	5E9	1.5 μl
AAV8.V1	KA808	1.39E+13	1.44	58.6	5E8	1.5 μl
AAV8.V1	KA808	1.39E+13	14.4	45.6	5E9	1.5 μl

망막밑 주입 전 주입 로그의 제조:

주입 로그를 테스트물의 망막밑 주입 전에 다음의 정보로 유지하였다:

* 케이지 번호/마우스 번호

* 연구 식별

* 스트레인

* 출생일

* 주입일

* 연구자/주입자 이름

* 주입된 눈 (좌측 또는 우측)

* 주입 물질 (벡터/혈청형)

* 용량 및 부피

* 투여 경로 (ROA)

망막밑 주입: 주입을 외과의사에 의해 망막밑 주입에 의해 수행하였다. 간단히 설명하면, 동물을 주입 전에 마취시켰다. 테스트물의 망막밑 주입을 Hamilton 33G 주사기를 사용하여 수행하였다. 테스트물 및 주입의 상세는 표 21에 기술한다. 제조된 주입 마스트 믹스로부터, 주입당 1.5 μl의 부피를 투여하였다. 동물 당 한 눈에 5E8 vg/눈으로 주입하고 반대쪽 눈에는 5E9 vg/눈으로 주입하였다.

망막밑 주입 계획 및 주입 용량

Gr. 번호	동물의 최소 수	ROA	테스트 물질 확인	벡터 용량 (vg/ml)		용량 부피 (μL/눈)		투약일 (PD)
Gr. 번호	동물의 최소 수	ROA	테스트 물질 확인	좌안	우안	좌안	우안	투약일 (PD)
1	2	망막밑	AAV8.V2a	5+E8	5+E9	1.5 μL	1.5 μL	90 내지 120일
2	2	망막밑	AAV8.V2b	5+E8	5+E9	1.5 μL	1.5 μL	90 내지 120일
3	2	망막밑	AAV8.V3a	5+E8	5+E9	1.5 μL	1.5 μL	90 내지 120일
4	2	망막밑	AAV8.V3b	5+E8	5+E9	1.5 μL	1.5 μL	90 내지 120일
5	2	망막밑	AAV8.V1	5+E8	5+E9	1.5 μL	1.5 μL	90 내지 120일
6	2	주입하지 않음	적용할 수 없음(N/A)	N/A	N/A	N/A	N/A	N/A

결과 측정 방법

동물 희생; a. 테스트물을 동물에 주입한 후, 모든 동물을 48시간 동안 주입 후 관련 비정상에 대해 관찰하였다. B. 주입 후 21 내지 35일 동안, 동물을 검안경 검사에 의해 눈 비정상에 대해 관찰하였다. C. 주입 후 90 내지 12-일에 동물을 희생시키고 눈 조직을 수집하여 SDS-PAGE와 이어서 웨스턴 블롯 분석에 의해 외인성 REP-1 단백질의 생성을 평가하였다.

눈 조직의 수집: 웨스턴 블롯 분석을 위한 눈 조직을 예리한 수술용 칼을 사용하여 눈으로부터 수정체를 제거한 후에 수집하였다. 눈 (수정체 없음)을 적절하게 표지한 냉동기 튜브에 수집하였다.

웨스턴 블롯 분석

간단하게: 1. 조직 용해물의 제조

a. 차세대 AAV8. CHM 및 AAV8.V1의 2가지 상이한 용량을 주입한 동물들의 눈 조직을, 미주입 대조군 동물 조직과 함께, 주입 후 21 내지 35일 후에 동물을 희생시킴으로써 수집하였다. B. 그런 다음 조직을 프로테아제 억제제가 포함된 RIPA 완충액을 사용하여 얼음에서 용해시켰다.

c. 조직 용해물을 13,000 rpm에서 10분 동안의 원심분리에 의해 정화하였다.

2. 단백질의 정량 및 제조

a. 세포 용해물의 단백질 정량을 ThermoFisher Micro BCATM 단백질 검정 키트를 제조자의 설명을 따라 사용하여 수행하였다. B. 단백질 농도를 562 nm에서의 OD 판독값을 취함으로써 측정하였다. C. CHM의 생체내 발현을 평가하기 위하여, 20 내지 40 ug의 측정된 단백질을 4 내지 12%의 Bis-Tris 겔에 로딩하였다.

3. SDS-PAGE 및 웨스턴 블롯

단백질 겔을 니트로셀룰로오스 막에 옮기고, 우유로 차단한 후 일차 항체와 함께 인큐베이션하였다. 항-인간 REP-1 2F1 항체 (2F1, 1:1000 희석) 및/또는 항-GAPDH 항체 (1:1000 희석)를 일차 항체로서 사용하였다. 블롯을 세척한 후에, 1:5000의 농도의 HRP 콘쥬게이트된 항-마우스 IgG 항체 및/또는 항-토끼 IgG 항체를 이차 항체로서 사용하였다. 블롯을 ECL 시약을 제조자의 설명을 따라 사용하여 화학발광에 의해 전개시켰다.

4. 대조군

a) 로딩 대조군: 항-GAPDH 항체를 겔의 각 웰에서 단백질의 동등한 로딩을 증명하기 위한 로딩 대조군으로서 사용하였다. 항-GAPDH 항체는 ~39 kDa의 단백질을 검출한다. B) 양성 대조군: AAV2.V2a 형질도입된 COS-7 세포 용해물을 양성 대조군으로서 사용하였다. C) 음성 대조군: 미주입 동물의 눈 조직을 음성 대조군으로서 사용하였다.

샘플 값 측정

Image J 소프트웨어를 사용하는 웨스턴 블롯 분석의 정량. 간단히 설명하면, 이 보고서에서 제공된 밀도측정에 의한 평가는 먼저, 상응하는 샘플의 GAPDH 단백질의 내인성 발현 수준에 대해 표준화한다. 그런 다음 발현 수준은 다시 미주입 대조군의 평균 REP-1 발현 수준에 대해 표준화한다.

밀도측정에 의한 평가 및 REP-1 단백질의 발현을 나타내기 위한 배수 변화 계산의 상세를 표 22 및 23에 제시한다.

간단한 설명:

1. 표 22 및 23에서, 제 2 열은 GAPDH 단백질의 원래의 값을 나타내고 제 3 열은 REP-1 단백질의 원래의 값을 나타낸다.

2. 각 샘플의 GAPDH 값을 먼저 AAV8.V1의 동물-1의 GAPDH 값에 대해 표준화하였고, 표 22에서 네 번째 열에 나타낸다.

3. 각 샘플의 값을 또한 AAV8.V1의 동물-2의 GAPDH 값에 대해 표준화하였고, 표 22에서 다섯 번째 열에 나타낸다.

4. 그런 다음 REP-1 값 (제 3 열)을 동물 1에 대해 표준화된 GAPDH (제 4 열) 또는 앞서 동물 2에 대해 표준화된 GAPDH (제 5 열)에 대해 표준화한다. 이것들을 각각 제 6 및 제 7 열에 나타낸다.

5. 그런 다음 표준화된 REP-1 값을 배수 변화로 전환시킨다.

6. 각각의 REP-1 값을 AAV8.V1 주입된 그룹의 동물 1 또는 동물 2에서의 REP-1 발현에 대해 표준화하고 배수 변화로서 표시한다 (제 8 및 9 열).

7. 제 10 열은 REP-1 단백질 발현의 평균 배수 변화를 나타낸다.

결과

천연 CHM AAV8.V1 대비 코돈 최적화된 CHM 벡터: AAV8.V2a, V2b, V3a 및 V3b를 사용하는 CHM 발현의 비교: 야생형 마우스들을 2가지 상이한 용량: 5E9 vg/눈의 고용량 및 5E8 vg/눈의 저용량의 각각의 AAV8 벡터으로 주입하였다. 다음은 고용량 및 저용량의 AAV8.V1, AAV8.V2a 및 AAV8.V3a로 주입된 후의 REP1 단백질의 수준을 기술한다.

고용량 (5E9 vg/눈)의 바이러스 벡터로 주입된 동물에서 AAV8.V1 대비 AAV8.V2a 및 AAV8.V3a (스터퍼를 포함한 벡터)의 발현의 비교. 인간 항 REP-1 항체로의 웨스턴 블롯 분석은 차세대 AAV8.V2a 또는 V3a 또는 원래의 AAV8.버전1로 처리된 각 동물의 두 (저 및 고용량 주입) 눈 조직에서 ~ 75 내지 80 kDa hREP-1 단백질 밴드를 검출하였다. 매우 희미한 (최소) 밴드가 둘 다의 미주입 대조군 마우스의 경우에 관찰된다. 버전.1로 형질도입된 조직과 비교하여 증가된 강도의 밴드를 차세대 벡터 (AAV8V.2a 및 AAV8.V3a)로 형질도입된 조직에서 관찰하였다. 항-GAPDH 항체는 미주입 대조군을 포함하여 웨스턴 블롯의 모든 레인에서 동등한 밀도의 ~39 kDa 밴드를 나타냈다. 사전-염색된 단백질 마커를 관심의 단백질의 분자량을 비교하기 위해 사용한다. ImageJ 소프트웨어를 사용하는 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는 REP-1의 생성이 차세대 AAV8. 고용량 및 저용량 구성물 (V2a 또는 V3a) 중 하나로 주입된 동물에서 증가한 것을 증명하였다. (값에 대해 표 22 참조).

고용량 (5E9 vg) AAV8 V1, V2a 및 V2b로의 치료에 대한 정량된 REP-1 단백질 생성 결과

	GAPDH	REP-1	버전1 동물 1의 GAPDH에 대해 표준화된 GAPDH	버전1 동물 2의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP1(동물 1에 대해 표준화됨)	각각의 GAPDH에 대해 표준화된 REP1(동물 2에 대해 표준화됨)	REP-1의 배수 변화 (동물 1에 대해 표준화됨)	REP-1의 배수 변화 (동물 2에 대해 표준화됨)	REP-1 발현의 평균 배수 변화
AAV8.V2a	12768.589	10058.359	1.055	1.190	9533.571	8450.521	2.335	3.742	3.038
AAV8.V2a	11885.518	13247.510	0.982	1.108	13489.242	11956.812	3.303	5.294	4.299
AAV8.V3a	12139.418	15542.551	1.003	1.132	15495.152	13734.843	3.794	6.081	4.938
AAV8.V3a	11113.640	7274.388	0.918	1.036	7921.575	7021.653	1.940	3.109	2.524
AAV8.V1	12102.397	4083.761	1.000	1.128	4083.761	3619.830	1.000
AAV8.V1	10727.518	2258.477	0.886	1.000	2547.932	2258.477		1.000

미처리 동물의 REP-1 발현 값은 무시할만 하였다, 하기 값 참조:

저용량 (5E8 vg) AAV8 V1, V2a 및 V2b로의 치료에 대한 정량된 REP-1 단백질 생성 결과

	GAPDH	REP-1	버전1 동물 1의 GAPDH에 대해 표준화된 GAPDH	버전1 동물 2의 GAPDH에 대해 표준화된 GAPDH	각각의 GAPDH에 대해 표준화된 REP1(동물 1에 대해 표준화됨)	각각의 GAPDH에 대해 표준화된 REP1(동물 2에 대해 표준화됨)	REP-1의 배수 변화 (동물 1에 대해 표준화됨)	REP-1의 배수 변화 (동물 2에 대해 표준화됨)	REP-1 발현의 평균 배수 변화
AAV8.V2a	11815.489	11194.037	0.809	0.934	13844.203	11984.286	11.123	29.133	20.128
AAV8.V2a	12889.418	7162.924	0.882	1.019	8120.634	7029.658	6.524	17.089	11.806
AAV8.V3a	13088.418	1516.506	0.896	1.035	1693.128	1465.663	1.360	3.563	2.462
AAV8.V3a	9201.075	593.192	0.630	0.727	942.084	815.519	0.757	1.982	1.370
AAV8.V1	14612.782	1244.678	1.000	1.155	1244.678	1077.460	1.000
AAV8.V1	12649.610	411.364	0.866	1.000	475.206	411.364		1.000

저용량 (5E8 vg/눈)의 바이러스 벡터로 주입된 동물에서 AAV8.V1 대비 AAV8.V2a 및 AAV8.V3a의 발현의 비교

인간 항 REP-1 항체, 5E8의 용량의 차세대 AAV8.V2a,V3a 및 AAV8.버전1로 주입된 동물의 눈 조직의 웨스턴 블롯 분석은 주입된 마우스의 조직에서 ~ 75 내지 80 kDa hREP-1 단백질 밴드를 검출하였다. REP-1의 희미한 (최소) 밴드가 둘 다의 미주입 대조군 마우스의 눈 조직 용해물에서 관찰되었다. 증가된 강도의 밴드가 버전 1로 형질도입된 용해물과 비교하여 차세대 벡터로 형질도입된 조직 용해물에서 관찰되었다. 항-GAPDH 항체는 모든 세포 용해물에서 ~39 kDa의 동등한 강도 단백질 밴드를 검출하였다. 이 데이터는 AAV8을 통한 차세대 V2a CHM 의 전달이 AAV8.V3a or AAV8.V1의 주입 후에 생성된 수준과 비교하여 REP-1 단백질의 왕성한 수준을 초래하였음을 증명한다.

ImageJ 소프트웨어를 사용하는 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는 버전 1과 비교하여 차세대 AAV8.CHM 구성물 (특히 V2a)로 주입된 동물에서 REP-1의 생성의 증가를 추가로 증명한다. 값에 대해 표 23 참조.

CD1 마우스에서 AAV8.V2b의 발현

이 현재의 연구 및 qPCR 역가 분석에 의한 AAV 벡터 생성에 미치는 람다 스터퍼의 평가를 동시에 수행하였다. 본 발명자들은 연구 프로토콜 PCPR.02에서 기술한 것과 같이 생체내 발현 연구를 위해 모든 동물 주입을 수행하였고 모든 샘플을 수득하였다. 람다 스터퍼 요소에 대한 qPCR 연구를 결론지은 후 (상기 기술함), 본 발명자들은 AAV8.2b 및 AAV8.3b와 같은 스터퍼가 없는 AAV 벡터의 발현을 테스트하기 위해서만 웨스턴 블롯 실험을 수행하기로 결정하였고, 그것들을 추가의 분석 (예컨대 버전 1과의 비교)에서 배제하였다.

인간 항-REP-1 항체는 5E9 (고용량) 벡터 게놈 복사물의 AAV8.2b로 주입된 CD-1 마우스의 눈 조직에서 ~75 내지 80 kDa의 단백질을 검출하였다 (도 12A). 5E8 (저용량)의 AAV8.2b로 주입된 동물은 ~75 내지 80 kDa에서 매우 희미한 단백질 밴드를 보였다 (도 12A). 미주입 대조군 동물로부터의 눈 조직의 용해물은 REP-1 단백질의 존재를 나타내지 않았다. 항-GAPDH 항체는 미처리 대조군을 포함하여 모든 눈 조직 용해물에서 ~39 kDa의 단백질을 검출하였다. 이 데이터는 AAV8.2b에 대한 최소 용량을 수립할 수 있다.

CD1 마우스에서 AAV8.3b의 발현

본 발명자들은 AAV8.3b 주입된 CD1 마우스 (2마리 마우스/그룹)의 눈 조직에 대한 웨스턴 블롯 분석을 항-REP-1 항체로 수행하였고, 저용량으로 주입된 한 눈에서 및 고용량의 AAV8.3b로 주입된 양 눈에서 ~75 내지 80 kDa의 단백질의 존재가 드러났다. 미주입 마우스의 눈 조직에서는 REP-1 발현 이 검출되지 않았다 (도 12 B). 생성된 REP-1의 수준은 AAV8.3b로 주입된 동물에서 용량 의존적이었다. 고용량의 AAV8.3b (5E9 벡터 게놈)의 주입은 자용량 (5E8 벡터 게놈) 주입된 눈과 비교하여 더 높은 양의 REP-1을 유도하였다. 항-GAPDH 항체는 모든 주입 및 미주입 동물의 눈 조직 용해물에서 ~39 kDa의 단백질을 검출하였다.

이 결과들은 다음의 관찰사항을 드러냈다:

1) 차세대 벡터 AAV8.버전2a, 2b, 3a 및 3b는 눈 조직을 효율적으로 형질도입시킬 수 있다. 2) 도입유전자 (코돈 최적화된 CHM)의 발현은 모든 차세대 벡터에 대해 검출 가능하였다. 3) 도입유전자 (코돈 최적화된 CHM)의 발현은 용량 의존적이다. 4) AAV8.버전2a 및 AAV8.버전.2b는 CD-1 마우스의 눈 조직에서 AAV8.버전 1과 비교하여 REP-1 단백질의 증가된 생성을 유도하였다. 5) 동일한 용량으로 주입된 눈 사이에서 형질도입을 유발하는 단백질 생성의 정확한 수준은 변동이 있고 그것은 수술적 전달 과정에서의 가변성을 반영한다. 그러나, 수준의 차이는 저용량 (5E8)과 고용량 (5E9) 사이에서 크다. 6) AAV8.CHM.V2a 및 AAV8.V3a는 마우스에서 망막밑으로의 고용량 (5E9 vg) 벡터의 생체내 투여 후에 AAV8.V1보다 훨씬 더 높은 수준의 REP-1 단백질 생성을 초래한다.

본 명세서에서 인용된 모든 간행물은, 2015년 12월 14일에 출원된 가특허 출원 번호 62/266,789를 포함하여, 그 전문이 본원에 참조로 포함된다. 유사하게, 본원에서 언급되고 첨부된 서열목록에서 나타난 SEQ ID NO들은 참조로 포함된다. 발명이 특정 구체예를 참조하여 기술된 한편으로, 발명의 사상으로부터 벗어나지 않으면서 변형이 이루어질 수 있다는 것이 인지될 것이다. 그러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.

서열 목록 자유 텍스트

SEQUENCE LISTING <110> Trustees of the University of Pennsylvania <120> AAV-REP-1 FOR GENE THERAPY FOR CHOROIDEREMIA AND ACHROMATOPSIA <130> UPN-16-7660 <150> US 62/266,789 <151> 2015-12-14 <160> 29 <170> PatentIn version 3.5 <210> 1 <211> 1962 <212> DNA <213> Artificial Sequence <220> <223> codon optimized sequence <220> <221> CDS <222> (1)..(1962) <400> 1 atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg att gga acc 48 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr 1 5 10 15 gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg tcc ggt cgg 96 Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg 20 25 30 cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg aat tgg gcc 144 Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala 35 40 45 tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag tat cag gag 192 Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu 50 55 60 aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac cag atc ctg 240 Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu 65 70 75 80 gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag acc atc cag 288 Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln 85 90 95 cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat gag gac gtg 336 His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val 100 105 110 gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg acc tcc gct 384 Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala 115 120 125 aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc gag gat gaa 432 Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu 130 135 140 tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag act ccg agc 480 Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser 145 150 155 160 tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa gtg acc ggc 528 Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly 165 170 175 gaa aag gag aac cat tgc gac gac aag act tgt gtc cca tcc act tcc 576 Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser 180 185 190 gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac acc acc gaa 624 Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu 195 200 205 cag ccc aag aag aac aga atc acg tac agc cag atc atc aag gag ggg 672 Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly 210 215 220 cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac agc cgc ggt 720 Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly 225 230 235 240 ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga tac gcc gag 768 Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu 245 250 255 ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga aga gtg gaa 816 Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu 260 265 270 caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag caa ctt acc 864 Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr 275 280 285 atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc tgc atg gag 912 Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu 290 295 300 tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa att act ttc 960 Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe 305 310 315 320 tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg cag tac att 1008 Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile 325 330 335 gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc tcg acc atc 1056 Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile 340 345 350 gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg ggg cgc tac 1104 Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr 355 360 365 ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga gag ctg cct 1152 Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro 370 375 380 cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc tac tgt ctc 1200 Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu 385 390 395 400 cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc agg aag tgc 1248 Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys 405 410 415 aaa gcc att att gac cag ttc gga caa cgg atc att tcc gag cac ttt 1296 Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe 420 425 430 ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct cgg gtc cag 1344 Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln 435 440 445 tat cga cag att tcc agg gcg gtg ctc att act gac cgg agc gtc ctc 1392 Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu 450 455 460 aag acc gat agc gac cag cag atc tcc atc ctg acc gtg ccg gcg gaa 1440 Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu 465 470 475 480 gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc tca tcc acc 1488 Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr 485 490 495 atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg tgc acc tca 1536 Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser 500 505 510 tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa aag ctg ttc 1584 Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe 515 520 525 gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg gag aag ccc 1632 Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro 530 535 540 cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc tcc gat atc 1680 Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile 545 550 555 560 tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac gtc tgc tcc 1728 Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser 565 570 575 ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag cag gcg gaa 1776 Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu 580 585 590 aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc ccg ccc ccc 1824 Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro 595 600 605 cca aac ccc gag gat atc atc ttg gac gga gac agc ctg cag cca gaa 1872 Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu 610 615 620 gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa acc ttc aag 1920 Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys 625 630 635 640 gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa tga 1962 Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 645 650 <210> 2 <211> 653 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr 1 5 10 15 Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg 20 25 30 Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala 35 40 45 Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu 50 55 60 Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu 65 70 75 80 Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln 85 90 95 His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val 100 105 110 Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala 115 120 125 Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu 130 135 140 Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser 145 150 155 160 Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly 165 170 175 Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser 180 185 190 Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu 195 200 205 Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly 210 215 220 Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly 225 230 235 240 Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu 245 250 255 Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu 260 265 270 Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr 275 280 285 Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu 290 295 300 Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe 305 310 315 320 Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile 325 330 335 Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile 340 345 350 Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr 355 360 365 Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro 370 375 380 Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu 385 390 395 400 Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys 405 410 415 Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe 420 425 430 Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln 435 440 445 Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu 450 455 460 Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu 465 470 475 480 Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr 485 490 495 Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser 500 505 510 Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe 515 520 525 Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro 530 535 540 Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile 545 550 555 560 Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser 565 570 575 Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu 580 585 590 Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro 595 600 605 Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu 610 615 620 Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys 625 630 635 640 Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 645 650 <210> 3 <211> 1962 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(1962) <400> 3 atg gcg gat act ctc cct tcg gag ttt gat gtg atc gta ata ggg acg 48 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr 1 5 10 15 ggt ttg cct gaa tcc atc att gca gct gca tgt tca aga agt ggc cgg 96 Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg 20 25 30 aga gtt ctg cat gtt gat tca aga agc tac tat gga gga aac tgg gcc 144 Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala 35 40 45 agt ttt agc ttt tca gga cta ttg tcc tgg cta aag gaa tac cag gaa 192 Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu 50 55 60 aac agt gac att gta agt gac agt cca gtg tgg caa gac cag atc ctt 240 Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu 65 70 75 80 gaa aat gaa gaa gcc att gct ctt agc agg aag gac aaa act att caa 288 Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln 85 90 95 cat gtg gaa gta ttt tgt tat gcc agt cag gat ttg cat gaa gat gtc 336 His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val 100 105 110 gaa gaa gct ggt gca ctg cag aaa aat cat gct ctt gtg aca tct gca 384 Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala 115 120 125 aac tcc aca gaa gct gca gat tct gcc ttc ctg cct acg gag gat gag 432 Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu 130 135 140 tca tta agc act atg agc tgt gaa atg ctc aca gaa caa act cca agc 480 Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser 145 150 155 160 agc gat cca gag aat gcg cta gaa gta aat ggt gct gaa gtg aca ggg 528 Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly 165 170 175 gaa aaa gaa aac cat tgt gat gat aaa act tgt gtg cca tca act tca 576 Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser 180 185 190 gca gaa gac atg agt gaa aat gtg cct ata gca gaa gat acc aca gag 624 Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu 195 200 205 caa cca aag aaa aac aga att act tac tca caa att att aaa gaa ggc 672 Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly 210 215 220 agg aga ttt aat att gat tta gta tca aag ctg ctg tat tct cga gga 720 Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly 225 230 235 240 tta cta att gat ctt cta atc aaa tct aat gtt agt cga tat gca gag 768 Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu 245 250 255 ttt aaa aat att acc agg att ctt gca ttt cga gaa gga cga gtg gaa 816 Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu 260 265 270 cag gtt ccg tgt tcc aga gca gat gtc ttt aat agc aaa caa ctt act 864 Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr 275 280 285 atg gta gaa aag cga atg cta atg aaa ttt ctt aca ttt tgt atg gaa 912 Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu 290 295 300 tat gag aaa tat cct gat gaa tat aaa gga tat gaa gag atc aca ttt 960 Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe 305 310 315 320 tat gaa tat tta aag act caa aaa tta acc ccc aac ctc caa tat att 1008 Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile 325 330 335 gtc atg cat tca att gca atg aca tca gag aca gcc agc agc acc ata 1056 Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile 340 345 350 gat ggt ctc aaa gct acc aaa aac ttt ctt cac tgt ctt ggg cgg tat 1104 Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr 355 360 365 ggc aac act cca ttt ttg ttt cct tta tat ggc caa gga gaa ctc ccc 1152 Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro 370 375 380 cag tgt ttc tgc agg atg tgt gct gtg ttt ggt gga att tat tgt ctt 1200 Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu 385 390 395 400 cgc cat tca gta cag tgc ctt gta gtg gac aaa gaa tcc aga aaa tgt 1248 Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys 405 410 415 aaa gca att ata gat cag ttt ggt cag aga ata atc tct gag cat ttc 1296 Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe 420 425 430 ctc gtg gag gac agt tac ttt cct gag aac atg tgc tca cgt gtg caa 1344 Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln 435 440 445 tac agg cag atc tcc agg gca gtg ctg att aca gat aga tct gtc cta 1392 Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu 450 455 460 aaa aca gat tca gat caa cag att tcc att ttg aca gtg cca gca gag 1440 Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu 465 470 475 480 gaa cca gga act ttt gct gtt cgg gtc att gag tta tgt tct tca acg 1488 Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr 485 490 495 atg aca tgc atg aaa ggc acc tat ttg gtt cat ttg act tgc aca tct 1536 Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser 500 505 510 tct aaa aca gca aga gaa gat tta gaa tca gtt gtg cag aaa ttg ttt 1584 Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe 515 520 525 gtt cca tat act gaa atg gag ata gaa aat gaa caa gta gaa aag cca 1632 Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro 530 535 540 aga att ctg tgg gct ctt tac ttc aat atg aga gat tcg tca gac atc 1680 Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile 545 550 555 560 agc agg agc tgt tat aat gat tta cca tcc aac gtt tat gtc tgc tct 1728 Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser 565 570 575 ggc cca gat tgt ggt tta gga aat gat aat gca gtc aaa cag gct gaa 1776 Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu 580 585 590 aca ctt ttc cag gaa atc tgc ccc aat gaa gat ttc tgt ccc cct cca 1824 Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro 595 600 605 cca aat cct gaa gac att atc ctt gat gga gac agt tta cag cca gag 1872 Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu 610 615 620 gct tca gaa tcc agt gcc ata cca gag gct aac tcg gag act ttc aag 1920 Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys 625 630 635 640 gaa agc aca aac ctt gga aac cta gag gag tcc tct gaa taa 1962 Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 645 650 <210> 4 <211> 653 <212> PRT <213> Homo sapiens <400> 4 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr 1 5 10 15 Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg 20 25 30 Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala 35 40 45 Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu 50 55 60 Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu 65 70 75 80 Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln 85 90 95 His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val 100 105 110 Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala 115 120 125 Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu 130 135 140 Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser 145 150 155 160 Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly 165 170 175 Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser 180 185 190 Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu 195 200 205 Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly 210 215 220 Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly 225 230 235 240 Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu 245 250 255 Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu 260 265 270 Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr 275 280 285 Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu 290 295 300 Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe 305 310 315 320 Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile 325 330 335 Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile 340 345 350 Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr 355 360 365 Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro 370 375 380 Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu 385 390 395 400 Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys 405 410 415 Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe 420 425 430 Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln 435 440 445 Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu 450 455 460 Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu 465 470 475 480 Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr 485 490 495 Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser 500 505 510 Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe 515 520 525 Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro 530 535 540 Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile 545 550 555 560 Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser 565 570 575 Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu 580 585 590 Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro 595 600 605 Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu 610 615 620 Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys 625 630 635 640 Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 645 650 <210> 5 <211> 1985 <212> DNA <213> Artificial Sequence <220> <223> constructed plasmid <220> <221> misc_feature <222> (1)..(8) <223> NotI restriction site for subcloning into proviral plasmid <220> <221> misc_feature <222> (4)..(16) <223> Kozak consensus sequence <220> <221> CDS <222> (13)..(1971) <223> codon-optimized open reading frame (ORF) <220> <221> misc_feature <222> (1972)..(1977) <223> BclI restriction site with embedded stop codon/ site to add optional epitope tag <220> <221> misc_feature <222> (1980)..(1985) <223> BamHI restriction site for subcloning into proviral plasmid <400> 5 gcggccgcca cc atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg 51 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val 1 5 10 att gga acc gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg 99 Ile Gly Thr Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg 15 20 25 tcc ggt cgg cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg 147 Ser Gly Arg Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly 30 35 40 45 aat tgg gcc tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag 195 Asn Trp Ala Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu 50 55 60 tat cag gag aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac 243 Tyr Gln Glu Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp 65 70 75 cag atc ctg gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag 291 Gln Ile Leu Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys 80 85 90 acc atc cag cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat 339 Thr Ile Gln His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His 95 100 105 gag gac gtg gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg 387 Glu Asp Val Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val 110 115 120 125 acc tcc gct aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc 435 Thr Ser Ala Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr 130 135 140 gag gat gaa tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag 483 Glu Asp Glu Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln 145 150 155 act ccg agc tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa 531 Thr Pro Ser Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu 160 165 170 gtg acc ggc gaa aag gag aac cat tgc gac gac aag act tgt gtc cca 579 Val Thr Gly Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro 175 180 185 tcc act tcc gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac 627 Ser Thr Ser Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp 190 195 200 205 acc acc gaa cag ccc aag aag aac aga atc acg tac agc cag atc atc 675 Thr Thr Glu Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile 210 215 220 aag gag ggg cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac 723 Lys Glu Gly Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr 225 230 235 agc cgc ggt ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga 771 Ser Arg Gly Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg 240 245 250 tac gcc gag ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga 819 Tyr Ala Glu Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly 255 260 265 aga gtg gaa caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag 867 Arg Val Glu Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys 270 275 280 285 caa ctt acc atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc 915 Gln Leu Thr Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe 290 295 300 tgc atg gag tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa 963 Cys Met Glu Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu 305 310 315 att act ttc tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg 1011 Ile Thr Phe Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu 320 325 330 cag tac att gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc 1059 Gln Tyr Ile Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser 335 340 345 tcg acc atc gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg 1107 Ser Thr Ile Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu 350 355 360 365 ggg cgc tac ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga 1155 Gly Arg Tyr Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly 370 375 380 gag ctg cct cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc 1203 Glu Leu Pro Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile 385 390 395 tac tgt ctc cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc 1251 Tyr Cys Leu Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser 400 405 410 agg aag tgc aaa gcc att att gac cag ttc gga caa cgg atc att tcc 1299 Arg Lys Cys Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser 415 420 425 gag cac ttt ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct 1347 Glu His Phe Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser 430 435 440 445 cgg gtc cag tat cga cag att tcc agg gcg gtg ctc att act gac cgg 1395 Arg Val Gln Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg 450 455 460 agc gtc ctc aag acc gat agc gac cag cag atc tcc atc ctg acc gtg 1443 Ser Val Leu Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val 465 470 475 ccg gcg gaa gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc 1491 Pro Ala Glu Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys 480 485 490 tca tcc acc atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg 1539 Ser Ser Thr Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr 495 500 505 tgc acc tca tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa 1587 Cys Thr Ser Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln 510 515 520 525 aag ctg ttc gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg 1635 Lys Leu Phe Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val 530 535 540 gag aag ccc cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc 1683 Glu Lys Pro Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser 545 550 555 tcc gat atc tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac 1731 Ser Asp Ile Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr 560 565 570 gtc tgc tcc ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag 1779 Val Cys Ser Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys 575 580 585 cag gcg gaa aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc 1827 Gln Ala Glu Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys 590 595 600 605 ccg ccc ccc cca aac ccc gag gat atc atc ttg gac gga gac agc ctg 1875 Pro Pro Pro Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu 610 615 620 cag cca gaa gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa 1923 Gln Pro Glu Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu 625 630 635 acc ttc aag gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa 1971 Thr Phe Lys Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 640 645 650 tgatcatagg atcc 1985 <210> 6 <211> 653 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr 1 5 10 15 Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg 20 25 30 Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala 35 40 45 Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu 50 55 60 Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu 65 70 75 80 Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln 85 90 95 His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val 100 105 110 Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala 115 120 125 Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu 130 135 140 Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser 145 150 155 160 Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly 165 170 175 Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser 180 185 190 Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu 195 200 205 Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly 210 215 220 Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly 225 230 235 240 Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu 245 250 255 Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu 260 265 270 Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr 275 280 285 Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu 290 295 300 Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe 305 310 315 320 Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile 325 330 335 Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile 340 345 350 Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr 355 360 365 Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro 370 375 380 Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu 385 390 395 400 Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys 405 410 415 Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe 420 425 430 Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln 435 440 445 Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu 450 455 460 Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu 465 470 475 480 Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr 485 490 495 Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser 500 505 510 Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe 515 520 525 Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro 530 535 540 Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile 545 550 555 560 Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser 565 570 575 Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu 580 585 590 Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro 595 600 605 Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu 610 615 620 Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys 625 630 635 640 Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu 645 650 <210> 7 <211> 9187 <212> DNA <213> Artificial Sequence <220> <223> constructed plasmid <220> <221> misc_feature <222> (1)..(145) <223> 5' ITR <220> <221> promoter <222> (169)..(1786) <223> CMV.CBA promoter <220> <221> misc_feature <222> (1787)..(1794) <223> Not I cloning site, cuts at 1789 <220> <221> misc_feature <222> (1805)..(1810) <223> BamHI cloning site, cuts at 1806 <220> <221> polyA_signal <222> (1850)..(2052) <223> BGH PolyA <220> <221> misc_feature <222> (2109)..(2252) <223> 3' ITR <220> <221> misc_feature <222> (2571)..(6624) <223> lambda stuffer <220> <221> misc_feature <222> (7314)..(8126) <223> Kanamycin resistance (complementary) <220> <221> misc_feature <222> (8485)..(9128) <223> Origin of replication (complementary) <400> 7 tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480 cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540 tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600 gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660 ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720 gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740 tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgcatagta 1800 ctgcggatcc tgcagatctc gagccgaatt cctgcagccc gggggatcag cctcgactgt 1860 gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1920 aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 1980 taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2040 agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac 2100 cagctggggc tcgagatcca ctagggccgc aggaacccct agtgatggag ttggccactc 2160 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2220 gctttgcccg ggcggcctca gtgagcgagc gacctgcagg ggcagcttga aggaaatact 2280 aaggcaaagg tactgcaagt gctcgcaaca ttcgcttatg cggattattg ccgtagtgcc 2340 gcgacgccgg gggcaagatg cagagattgc catggtacag gccgtgcggt tgatattgcc 2400 aaaacagagc tgtgggggag agttgtcgag aaagagtgcg gaagatgcaa aggcgtcggc 2460 tattcaagga tgccagcaag cgcagcatat cgcgctgtga cgatgctaat cccaaacctt 2520 acccaaccca cctggtcacg cactgttaag ccgctgtatg acgctctggt ggtgcaatgc 2580 cacaaagaag agtcaatcgc agacaacatt ttgaatgcgg tcacacgtta gcagcatgat 2640 tgccacggat ggcaacatat taacggcatg atattgactt attgaataaa attgggtaaa 2700 tttgactcaa cgatgggtta attcgctcgt tgtggtagtg agatgaaaag aggcggcgct 2760 tactaccgat tccgcctagt tggtcacttc gacgtatcgt ctggaactcc aaccatcgca 2820 ggcagagagg tctgcaaaat gcaatcccga aacagttcgc aggtaatagt tagagcctgc 2880 ataacggttt cgggattttt tatatctgca caacaggtaa gagcattgag tcgataatcg 2940 tgaagagtcg gcgagcctgg ttagccagtg ctctttccgt tgtgctgaat taagcgaata 3000 ccggaagcag aaccggatca ccaaatgcgt acaggcgtca tcgccgccca gcaacagcac 3060 aacccaaact gagccgtagc cactgtctgt cctgaattca ttagtaatag ttacgctgcg 3120 gccttttaca catgaccttc gtgaaagcgg gtggcaggag gtcgcgctaa caacctcctg 3180 ccgttttgcc cgtgcatatc ggtcacgaac aaatctgatt actaaacaca gtagcctgga 3240 tttgttctat cagtaatcga ccttattcct aattaaatag agcaaatccc cttattgggg 3300 gtaagacatg aagatgccag aaaaacatga cctgttggcc gccattctcg cggcaaagga 3360 acaaggcatc ggggcaatcc ttgcgtttgc aatggcgtac cttcgcggca gatataatgg 3420 cggtgcgttt acaaaaacag taatcgacgc aacgatgtgc gccattatcg cctggttcat 3480 tcgtgacctt ctcgacttcg ccggactaag tagcaatctc gcttatataa cgagcgtgtt 3540 tatcggctac atcggtactg actcgattgg ttcgcttatc aaacgcttcg ctgctaaaaa 3600 agccggagta gaagatggta gaaatcaata atcaacgtaa ggcgttcctc gatatgctgg 3660 cgtggtcgga gggaactgat aacggacgtc agaaaaccag aaatcatggt tatgacgtca 3720 ttgtaggcgg agagctattt actgattact ccgatcaccc tcgcaaactt gtcacgctaa 3780 acccaaaact caaatcaaca ggcgccggac gctaccagct tctttcccgt tggtgggatg 3840 cctaccgcaa gcagcttggc ctgaaagact tctctccgaa aagtcaggac gctgtggcat 3900 tgcagcagat taaggagcgt ggcgctttac ctatgattga tcgtggtgat atccgtcagg 3960 caatcgaccg ttgcagcaat atctgggctt cactgccggg cgctggttat ggtcagttcg 4020 agcataaggc tgacagcctg attgcaaaat tcaaagaagc gggcggaacg gtcagagaga 4080 ttgatgtatg agcagagtca ccgcgattat ctccgctctg gttatctgca tcatcgtctg 4140 cctgtcatgg gctgttaatc attaccgtga taacgccatt acctacaaag cccagcgcga 4200 caaaaatgcc agagaactga agctggcgaa cgcggcaatt actgacatgc agatgcgtca 4260 gcgtgatgtt gctgcgctcg atgcaaaata cacgaaggag ttagctgatg ctaaagctga 4320 aaatgatgct ctgcgtgatg atgttgccgc tggtcgtcgt cggttgcaca tcaaagcagt 4380 ctgtcagtca gtgcgtgaag ccaccaccgc ctccggcgtg gataatgcag cctccccccg 4440 actggcagac accgctgaac gggattattt caccctcaga gagaggctga tcactatgca 4500 aaaacaactg gaaggaaccc agaagtatat taatgagcag tgcagataga gttgcccata 4560 tcgatgggca actcatgcaa ttattgtgag caatacacac gcgcttccag cggagtataa 4620 atgcctaaag taataaaacc gagcaatcca tttacgaatg tttgctgggt ttctgtttta 4680 acaacatttt ctgcgccgcc acaaattttg gctgcatcga cagttttctt ctgcccaatt 4740 ccagaaacga agaaatgatg ggtgatggtt tcctttggtg ctactgctgc cggtttgttt 4800 tgaacagtaa acgtctgttg agcacatcct gtaataagca gggccagcgc agtagcgagt 4860 agcatttttt tcatggtgtt attcccgatg ctttttgaag ttcgcagaat cgtatgtgta 4920 gaaaattaaa caaaccctaa acaatgagtt gaaatttcat attgttaata tttattaatg 4980 tatgtcaggt gcgatgaatc gtcattgtat tcccggatta actatgtcca cagccctgac 5040 ggggaacttc tctgcgggag tgtccgggaa taattaaaac gatgcacaca gggtttagcg 5100 cgtacacgta ttgcattatg ccaacgcccc ggtgctgaca cggaagaaac cggacgttat 5160 gatttagcgt ggaaagattt gtgtagtgtt ctgaatgctc tcagtaaata gtaatgaatt 5220 atcaaaggta tagtaatatc ttttatgttc atggatattt gtaacccatc ggaaaactcc 5280 tgctttagca agattttccc tgtattgctg aaatgtgatt tctcttgatt tcaacctatc 5340 ataggacgtt tctataagat gcgtgtttct tgagaattta acatttacaa cctttttaag 5400 tccttttatt aacacggtgt tatcgttttc taacacgatg tgaatattat ctgtggctag 5460 atagtaaata taatgtgaga cgttgtgacg ttttagttca gaataaaaca attcacagtc 5520 taaatctttt cgcacttgat cgaatatttc tttaaaaatg gcaacctgag ccattggtaa 5580 aaccttccat gtgatacgag ggcgcgtagt ttgcattatc gtttttatcg tttcaatctg 5640 gtctgacctc cttgtgtttt gttgatgatt tatgtcaaat attaggaatg ttttcactta 5700 atagtattgg ttgcgtaaca aagtgcggtc ctgctggcat tctggaggga aatacaaccg 5760 acagatgtat gtaaggccaa cgtgctcaaa tcttcataca gaaagatttg aagtaatatt 5820 ttaaccgcta gatgaagagc aagcgcatgg agcgacaaaa tgaataaaga acaatctgct 5880 gatgatccct ccgtggatct gattcgtgta aaaaatatgc ttaatagcac catttctatg 5940 agttaccctg atgttgtaat tgcatgtata gaacataagg tgtctctgga agcattcaga 6000 gcaattgagg cagcgttggt gaagcacgat aataatatga aggattattc cctggtggtt 6060 gactgatcac cataactgct aatcattcaa actatttagt ctgtgacaga gccaacacgc 6120 agtctgtcac tgtcaggaaa gtggtaaaac tgcaactcaa ttactgcaat gccctcgtaa 6180 ttaagtgaat ttacaatatc gtcctgttcg gagggaagaa cgcgggatgt tcattcttca 6240 tcacttttaa ttgatgtata tgctctcttt tctgacgtta gtctccgacg gcaggcttca 6300 atgacccagg ctgagaaatt cccggaccct ttttgctcaa gagcgatgtt aatttgttca 6360 atcatttggt taggaaagcg gatgttgcgg gttgttgttc tgcgggttct gttcttcgtt 6420 gacatgaggt tgccccgtat tcagtgtcgc tgatttgtat tgtctgaagt tgtttttacg 6480 ttaagttgat gcagatcaat taatacgata cctgcgtcat aattgattat ttgacgtggt 6540 ttgatggcct ccacgcacgt tgtgatatgt agatgataat cattatcact ttacgggtcc 6600 tttccggtga tccgacaggt tacggcctga tgcggtattt tctccttacg catctgtgcg 6660 gtatttcaca ccgcatacgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag 6720 cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 6780 cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 6840 tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 6900 aaaacttgat ttgggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 6960 ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 7020 actcaaccct atctcgggct attcttttga tttagacctg caggcatgca agcttactgg 7080 ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 7140 cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 7200 cccaacagtt gcgcagcctg aatggcgaat gcgatttatt caacaaagcc gccgtcccgt 7260 caagtcagcg taatgctctg ccagtgttac aaccaattaa ccaattctga ttagaaaaac 7320 tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt 7380 tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca 7440 agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc 7500 ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt 7560 gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc 7620 tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg 7680 agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg 7740 cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat 7800 acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta 7860 cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc 7920 atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc 7980 gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga 8040 gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg cttcgagcaa 8100 gacgtttccc gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac 8160 agttttattg ttcatgatga tatattttta tcttgtgcaa tgtaacatca gagattttga 8220 gacacaacgt ggctttgttg aataaatcga acttttgctg agttgaagga tcagatcacg 8280 catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat caccaactgg 8340 tccacctaca acaaagctct catcaaccgt ggctccctca ctttctggct ggatgatggg 8400 gcgattcagg cctggtatga gtcagcaaca ccttcttcac gaggcagacc tctcgacgga 8460 tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 8520 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 8580 ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 8640 ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta 8700 gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 8760 aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 8820 ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 8880 agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 8940 aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 9000 aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 9060 ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 9120 cggttcctgg ccttttgctg gccttttgct cacatgtcct gcaggcagct gcgcgccagc 9180 tgcgcgc 9187 <210> 8 <211> 11148 <212> DNA <213> Artificial Sequence <220> <223> constructed plasmid <400> 8 tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480 cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540 tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600 gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660 ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720 gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740 tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgccaccat 1800 ggctgatacc ctgccctctg aattcgacgt gattgtgatt ggaaccggac tccctgaatc 1860 gatcatcgcc gcggcctgtt cccggtccgg tcggcgcgtg ctgcacgtcg attcgagaag 1920 ctactacgga gggaattggg cctcattctc cttctccgga ctgctctcct ggctgaagga 1980 gtatcaggag aactccgaca ttgtctccga ctcacctgtg tggcaggacc agatcctgga 2040 aaacgaggaa gcaatagccc tgagccggaa ggacaagacc atccagcacg tggaggtgtt 2100 ctgttatgcc tcccaagacc tccatgagga cgtggaagag gctggagcgt tgcagaagaa 2160 tcatgccctc gtgacctccg ctaactccac cgaggcagcc gacagcgcct tcctgccgac 2220 cgaggatgaa tccctgtcaa ctatgtcgtg cgaaatgctg accgaacaga ctccgagctc 2280 cgaccccgaa aacgccctgg aagtgaacgg agcggaagtg accggcgaaa aggagaacca 2340 ttgcgacgac aagacttgtg tcccatccac ttccgcggag gacatgtccg agaatgtgcc 2400 tatcgccgag gacaccaccg aacagcccaa gaagaacaga atcacgtaca gccagatcat 2460 caaggagggg cggaggttta acatcgatct ggtgtcgaag ctgctgtaca gccgcggtct 2520 gctgatcgat ctgctcatta agtcgaacgt gtcgagatac gccgagttca agaacatcac 2580 aaggattctc gccttccggg aaggaagagt ggaacaagtg ccgtgctccc gggccgacgt 2640 gttcaactca aagcaactta ccatggtgga aaagcgcatg ctgatgaaat tcctgacctt 2700 ctgcatggag tacgaaaagt accctgatga gtacaagggt tacgaagaaa ttactttcta 2760 cgagtacctc aagacccaga agctgacccc gaatctgcag tacattgtga tgcactcaat 2820 cgcaatgacc tccgaaaccg cctcctcgac catcgacggg ctcaaggcca ccaagaactt 2880 cctgcactgt ttggggcgct acggcaacac tccgttcctc ttcccgctgt acggccaggg 2940 agagctgcct cagtgtttct gccggatgtg cgccgtgttc ggcggaatct actgtctccg 3000 ccactcggtc cagtgcctgg tggtggacaa ggaatccagg aagtgcaaag ccattattga 3060 ccagttcgga caacggatca tttccgagca ctttcttgtg gaggactcat acttcccgga 3120 gaacatgtgc tctcgggtcc agtatcgaca gatttccagg gcggtgctca ttactgaccg 3180 gagcgtcctc aagaccgata gcgaccagca gatctccatc ctgaccgtgc cggcggaaga 3240 acccggcact tttgccgtgc gcgtgatcga gctttgctca tccaccatga cttgcatgaa 3300 aggcacttac ctggtgcacc tgacgtgcac ctcatcgaaa accgctagag aggacctgga 3360 atccgtcgtc caaaagctgt tcgtgcctta caccgagatg gaaattgaaa acgaacaagt 3420 ggagaagccc cgcatccttt gggccctgta ctttaacatg cgcgattcct ccgatatctc 3480 gcggtcctgc tataacgact tgccttcgaa cgtctacgtc tgctccgggc cagactgcgg 3540 tcttggcaac gacaatgccg tgaagcaggc ggaaacactg ttccaagaga tctgccctaa 3600 cgaggatttt tgcccgcccc ccccaaaccc cgaggatatc atcttggacg gagacagcct 3660 gcagccagaa gcatccgagt ccagcgccat cccggaggcc aacagcgaaa ccttcaagga 3720 gagcactaac ctgggcaacc tggaagagtc cagcgaatga tcataggatc ctgcagatct 3780 cgagccgaat tcctgcagcc cgggggatca gcctcgactg tgccttctag ttgccagcca 3840 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3900 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3960 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4020 ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctcgagatcc 4080 actagggccg caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4140 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4200 agtgagcgag cgacctgcag gggcagcttg aaggaaatac taaggcaaag gtactgcaag 4260 tgctcgcaac attcgcttat gcggattatt gccgtagtgc cgcgacgccg ggggcaagat 4320 gcagagattg ccatggtaca ggccgtgcgg ttgatattgc caaaacagag ctgtggggga 4380 gagttgtcga gaaagagtgc ggaagatgca aaggcgtcgg ctattcaagg atgccagcaa 4440 gcgcagcata tcgcgctgtg acgatgctaa tcccaaacct tacccaaccc acctggtcac 4500 gcactgttaa gccgctgtat gacgctctgg tggtgcaatg ccacaaagaa gagtcaatcg 4560 cagacaacat tttgaatgcg gtcacacgtt agcagcatga ttgccacgga tggcaacata 4620 ttaacggcat gatattgact tattgaataa aattgggtaa atttgactca acgatgggtt 4680 aattcgctcg ttgtggtagt gagatgaaaa gaggcggcgc ttactaccga ttccgcctag 4740 ttggtcactt cgacgtatcg tctggaactc caaccatcgc aggcagagag gtctgcaaaa 4800 tgcaatcccg aaacagttcg caggtaatag ttagagcctg cataacggtt tcgggatttt 4860 ttatatctgc acaacaggta agagcattga gtcgataatc gtgaagagtc ggcgagcctg 4920 gttagccagt gctctttccg ttgtgctgaa ttaagcgaat accggaagca gaaccggatc 4980 accaaatgcg tacaggcgtc atcgccgccc agcaacagca caacccaaac tgagccgtag 5040 ccactgtctg tcctgaattc attagtaata gttacgctgc ggccttttac acatgacctt 5100 cgtgaaagcg ggtggcagga ggtcgcgcta acaacctcct gccgttttgc ccgtgcatat 5160 cggtcacgaa caaatctgat tactaaacac agtagcctgg atttgttcta tcagtaatcg 5220 accttattcc taattaaata gagcaaatcc ccttattggg ggtaagacat gaagatgcca 5280 gaaaaacatg acctgttggc cgccattctc gcggcaaagg aacaaggcat cggggcaatc 5340 cttgcgtttg caatggcgta ccttcgcggc agatataatg gcggtgcgtt tacaaaaaca 5400 gtaatcgacg caacgatgtg cgccattatc gcctggttca ttcgtgacct tctcgacttc 5460 gccggactaa gtagcaatct cgcttatata acgagcgtgt ttatcggcta catcggtact 5520 gactcgattg gttcgcttat caaacgcttc gctgctaaaa aagccggagt agaagatggt 5580 agaaatcaat aatcaacgta aggcgttcct cgatatgctg gcgtggtcgg agggaactga 5640 taacggacgt cagaaaacca gaaatcatgg ttatgacgtc attgtaggcg gagagctatt 5700 tactgattac tccgatcacc ctcgcaaact tgtcacgcta aacccaaaac tcaaatcaac 5760 aggcgccgga cgctaccagc ttctttcccg ttggtgggat gcctaccgca agcagcttgg 5820 cctgaaagac ttctctccga aaagtcagga cgctgtggca ttgcagcaga ttaaggagcg 5880 tggcgcttta cctatgattg atcgtggtga tatccgtcag gcaatcgacc gttgcagcaa 5940 tatctgggct tcactgccgg gcgctggtta tggtcagttc gagcataagg ctgacagcct 6000 gattgcaaaa ttcaaagaag cgggcggaac ggtcagagag attgatgtat gagcagagtc 6060 accgcgatta tctccgctct ggttatctgc atcatcgtct gcctgtcatg ggctgttaat 6120 cattaccgtg ataacgccat tacctacaaa gcccagcgcg acaaaaatgc cagagaactg 6180 aagctggcga acgcggcaat tactgacatg cagatgcgtc agcgtgatgt tgctgcgctc 6240 gatgcaaaat acacgaagga gttagctgat gctaaagctg aaaatgatgc tctgcgtgat 6300 gatgttgccg ctggtcgtcg tcggttgcac atcaaagcag tctgtcagtc agtgcgtgaa 6360 gccaccaccg cctccggcgt ggataatgca gcctcccccc gactggcaga caccgctgaa 6420 cgggattatt tcaccctcag agagaggctg atcactatgc aaaaacaact ggaaggaacc 6480 cagaagtata ttaatgagca gtgcagatag agttgcccat atcgatgggc aactcatgca 6540 attattgtga gcaatacaca cgcgcttcca gcggagtata aatgcctaaa gtaataaaac 6600 cgagcaatcc atttacgaat gtttgctggg tttctgtttt aacaacattt tctgcgccgc 6660 cacaaatttt ggctgcatcg acagttttct tctgcccaat tccagaaacg aagaaatgat 6720 gggtgatggt ttcctttggt gctactgctg ccggtttgtt ttgaacagta aacgtctgtt 6780 gagcacatcc tgtaataagc agggccagcg cagtagcgag tagcattttt ttcatggtgt 6840 tattcccgat gctttttgaa gttcgcagaa tcgtatgtgt agaaaattaa acaaacccta 6900 aacaatgagt tgaaatttca tattgttaat atttattaat gtatgtcagg tgcgatgaat 6960 cgtcattgta ttcccggatt aactatgtcc acagccctga cggggaactt ctctgcggga 7020 gtgtccggga ataattaaaa cgatgcacac agggtttagc gcgtacacgt attgcattat 7080 gccaacgccc cggtgctgac acggaagaaa ccggacgtta tgatttagcg tggaaagatt 7140 tgtgtagtgt tctgaatgct ctcagtaaat agtaatgaat tatcaaaggt atagtaatat 7200 cttttatgtt catggatatt tgtaacccat cggaaaactc ctgctttagc aagattttcc 7260 ctgtattgct gaaatgtgat ttctcttgat ttcaacctat cataggacgt ttctataaga 7320 tgcgtgtttc ttgagaattt aacatttaca acctttttaa gtccttttat taacacggtg 7380 ttatcgtttt ctaacacgat gtgaatatta tctgtggcta gatagtaaat ataatgtgag 7440 acgttgtgac gttttagttc agaataaaac aattcacagt ctaaatcttt tcgcacttga 7500 tcgaatattt ctttaaaaat ggcaacctga gccattggta aaaccttcca tgtgatacga 7560 gggcgcgtag tttgcattat cgtttttatc gtttcaatct ggtctgacct ccttgtgttt 7620 tgttgatgat ttatgtcaaa tattaggaat gttttcactt aatagtattg gttgcgtaac 7680 aaagtgcggt cctgctggca ttctggaggg aaatacaacc gacagatgta tgtaaggcca 7740 acgtgctcaa atcttcatac agaaagattt gaagtaatat tttaaccgct agatgaagag 7800 caagcgcatg gagcgacaaa atgaataaag aacaatctgc tgatgatccc tccgtggatc 7860 tgattcgtgt aaaaaatatg cttaatagca ccatttctat gagttaccct gatgttgtaa 7920 ttgcatgtat agaacataag gtgtctctgg aagcattcag agcaattgag gcagcgttgg 7980 tgaagcacga taataatatg aaggattatt ccctggtggt tgactgatca ccataactgc 8040 taatcattca aactatttag tctgtgacag agccaacacg cagtctgtca ctgtcaggaa 8100 agtggtaaaa ctgcaactca attactgcaa tgccctcgta attaagtgaa tttacaatat 8160 cgtcctgttc ggagggaaga acgcgggatg ttcattcttc atcactttta attgatgtat 8220 atgctctctt ttctgacgtt agtctccgac ggcaggcttc aatgacccag gctgagaaat 8280 tcccggaccc tttttgctca agagcgatgt taatttgttc aatcatttgg ttaggaaagc 8340 ggatgttgcg ggttgttgtt ctgcgggttc tgttcttcgt tgacatgagg ttgccccgta 8400 ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac gttaagttga tgcagatcaa 8460 ttaatacgat acctgcgtca taattgatta tttgacgtgg tttgatggcc tccacgcacg 8520 ttgtgatatg tagatgataa tcattatcac tttacgggtc ctttccggtg atccgacagg 8580 ttacggcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 8640 tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8700 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8760 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8820 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 8880 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 8940 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 9000 tattcttttg atttagacct gcaggcatgc aagcttactg gccgtcgttt tacaacgtcg 9060 tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 9120 cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 9180 gaatggcgaa tgcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 9240 gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 9300 actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 9360 atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 9420 cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 9480 tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 9540 gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 9600 catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 9660 tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 9720 catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 9780 cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 9840 tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 9900 tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 9960 atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 10020 aatcagcatc catgttggaa tttaatcgcg gcttcgagca agacgtttcc cgttgaatat 10080 ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgatg 10140 atatattttt atcttgtgca atgtaacatc agagattttg agacacaacg tggctttgtt 10200 gaataaatcg aacttttgct gagttgaagg atcagatcac gcatcttccc gacaacgcag 10260 accgttccgt ggcaaagcaa aagttcaaaa tcaccaactg gtccacctac aacaaagctc 10320 tcatcaaccg tggctccctc actttctggc tggatgatgg ggcgattcag gcctggtatg 10380 agtcagcaac accttcttca cgaggcagac ctctcgacgg atcgttccac tgagcgtcag 10440 accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 10500 gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 10560 caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 10620 tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 10680 ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 10740 tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 10800 gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 10860 tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 10920 gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 10980 gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 11040 ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 11100 ggccttttgc tcacatgtcc tgcaggcagc tgcgcgccag ctgcgcgc 11148 <210> 9 <211> 2085 <212> DNA <213> Artificial Sequence <220> <223> codon optimized sequence <220> <221> CDS <222> (1)..(2085) <223> codon-optimized ORF <400> 9 atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 ttc act gga cag ggt att gcc cgg ctg agc aga ctg atc ttc ctg ctt 240 Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu 65 70 75 80 cgc cgc tgg gcg gcc aga cac gtg cac cat cag gac cag gga cct gat 288 Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp 85 90 95 agc ttc ccc gac cgc ttt agg gga gcc gag ctg aaa gaa gtg tca agc 336 Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser 100 105 110 cag gag tca aac gcg cag gcc aac gtc ggc agc caa gag cct gca gac 384 Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp 115 120 125 cgg gga cgc tcg gca tgg ccg ctc gca aag tgc aac act aac act tcc 432 Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser 130 135 140 aac aac acc gaa gag gaa aag aaa acc aag aag aag gat gca att gtg 480 Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val 145 150 155 160 gtg gac cct tcc tcc aac ctg tac tac cgc tgg ttg acc gcc atc gcc 528 Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala 165 170 175 ctc ccg gtc ttt tac aat tgg tat ctc ctt atc tgc cgg gcc tgc ttc 576 Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe 180 185 190 gac gaa ctg caa tca gag tac ctg atg ctg tgg ctg gtg ctg gac tat 624 Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr 195 200 205 agc gcc gat gtg ctc tac gtc ctg gat gtg ctc gtg cgc gcc cgg acc 672 Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr 210 215 220 gga ttc ttg gaa caa ggc ctg atg gtg tcc gac acg aat aga ctg tgg 720 Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp 225 230 235 240 cag cac tat aag acc aca acc cag ttc aag ctt gac gtg ctc agc ctt 768 Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu 245 250 255 gtg ccg act gac ctg gcc tac ctg aaa gtc gga act aac tac ccg gaa 816 Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu 260 265 270 gtc aga ttc aac cga ctc ctg aag ttc agc agg ctg ttc gag ttc ttt 864 Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe 275 280 285 gac cgc acc gag act cgg acc aac tac cct aac atg ttc cgg atc gga 912 Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly 290 295 300 aat ctg gtg ctc tac ata ctg att atc atc cat tgg aac gcc tgt atc 960 Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile 305 310 315 320 tat ttc gcc att tcg aag ttc atc ggt ttc gga acc gat tcc tgg gtg 1008 Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val 325 330 335 tac ccc aac atc tcg atc ccc gaa cac ggt cgc ctg tcc cgg aag tac 1056 Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr 340 345 350 atc tac tcc ctg tac tgg tcc act ctg act ctg acc acg atc ggg gaa 1104 Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu 355 360 365 acc cct cca ccc gtg aag gac gaa gag tac ctg ttc gtg gtg gtg gac 1152 Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp 370 375 380 ttc ctg gtc gga gtg ttg att ttc gcc acc att gtg gga aac gtg ggc 1200 Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly 385 390 395 400 tcc atg atc tcc aac atg aac gcg tcg aga gct gag ttc caa gcc aag 1248 Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys 405 410 415 atc gac tcc att aag cag tac atg cag ttc aga aag gtc acc aag gac 1296 Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp 420 425 430 ctg gaa acc agg gtc atc cgc tgg ttc gac tac ctg tgg gcc aac aaa 1344 Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys 435 440 445 aag act gtg gac gaa aag gaa gtg ctg aag tcg ctg ccg gat aag ctg 1392 Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu 450 455 460 aag gcc gaa atc gcc att aac gtg cac ctt gac acc ctg aag aaa gtc 1440 Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val 465 470 475 480 cgg atc ttc caa gac tgt gaa gcc ggc ctc ctg gtg gag ctc gtg ctc 1488 Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu 485 490 495 aag ctg cgg ccc acc gtg ttc agc ccg gga gat tac att tgc aag aag 1536 Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys 500 505 510 ggc gat atc ggc aaa gag atg tac atc atc aac gag gga aag ctg gcc 1584 Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala 515 520 525 gtg gtc gcg gac gac ggc gtg acc cag ttc gtg gtg ctg tcc gac gga 1632 Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly 530 535 540 tcc tac ttc ggt gaa atc tca atc ctc aac atc aag ggg tcc aag tcc 1680 Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser 545 550 555 560 ggc aac cgg aga act gcc aac att cgc tcc atc gga tac agc gac ctg 1728 Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu 565 570 575 ttt tgc ctg tcc aag gat gac ctg atg gag gct ctg act gag tac cct 1776 Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro 580 585 590 gaa gcg aag aag gct ttg gag gaa aag ggg cgg cag att ctg atg aag 1824 Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys 595 600 605 gac aat ttg atc gac gag gag ctc gca cgg gcc ggc gcc gac ccc aag 1872 Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys 610 615 620 gat ctc gaa gag aag gtc gaa cag ctg ggt tct tcg ctt gat acc ctg 1920 Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu 625 630 635 640 caa acc cga ttc gcg cgg ctg ctc gcc gag tac aac gcg acc cag atg 1968 Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met 645 650 655 aag atg aag cag aga ctg tca cag ttg gaa tcc caa gtc aag ggc gga 2016 Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly 660 665 670 ggc gac aag ccg ctg gcg gac ggg gaa gtg ccc ggg gac gcc acc aag 2064 Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys 675 680 685 act gag gac aag cag cag tga 2085 Thr Glu Asp Lys Gln Gln 690 <210> 10 <211> 694 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu 65 70 75 80 Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp 85 90 95 Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser 100 105 110 Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp 115 120 125 Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser 130 135 140 Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val 145 150 155 160 Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala 165 170 175 Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe 180 185 190 Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr 195 200 205 Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr 210 215 220 Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp 225 230 235 240 Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu 245 250 255 Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu 260 265 270 Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe 275 280 285 Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly 290 295 300 Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile 305 310 315 320 Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val 325 330 335 Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr 340 345 350 Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu 355 360 365 Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp 370 375 380 Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly 385 390 395 400 Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys 405 410 415 Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp 420 425 430 Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys 435 440 445 Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu 450 455 460 Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val 465 470 475 480 Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu 485 490 495 Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys 500 505 510 Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala 515 520 525 Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly 530 535 540 Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser 545 550 555 560 Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu 565 570 575 Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro 580 585 590 Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys 595 600 605 Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys 610 615 620 Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu 625 630 635 640 Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met 645 650 655 Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly 660 665 670 Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys 675 680 685 Thr Glu Asp Lys Gln Gln 690 <210> 11 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> codon optimized sequence <220> <221> CDS <222> (1)..(2250) <223> codon-optimized ORF <400> 11 atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 ttc act gga cag ggt att gcc cgg ttc ggg cgg att cag aag aag tcc 240 Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser 65 70 75 80 cag ccg gag aag gtc gtg cgg gct gcc agc agg ggc agg cca ctc att 288 Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile 85 90 95 ggt tgg aca cag tgg tgc gct gag gat ggt gga gat gaa tcg gaa atg 336 Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met 100 105 110 gca ctg gcc ggc tct ccc gga tgc agc tcg ggc ccc caa ggg aga ctg 384 Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu 115 120 125 agc aga ctg atc ttc ctg ctt cgc cgc tgg gcg gcc aga cac gtg cac 432 Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His 130 135 140 cat cag gac cag gga cct gat agc ttc ccc gac cgc ttt agg gga gcc 480 His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala 145 150 155 160 gag ctg aaa gaa gtg tca agc cag gag tca aac gcg cag gcc aac gtc 528 Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val 165 170 175 ggc agc caa gag cct gca gac cgg gga cgc tcg gca tgg ccg ctc gca 576 Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala 180 185 190 aag tgc aac act aac act tcc aac aac acc gaa gag gaa aag aaa acc 624 Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr 195 200 205 aag aag aag gat gca att gtg gtg gac cct tcc tcc aac ctg tac tac 672 Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr 210 215 220 cgc tgg ttg acc gcc atc gcc ctc ccg gtc ttt tac aat tgg tat ctc 720 Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu 225 230 235 240 ctt atc tgc cgg gcc tgc ttc gac gaa ctg caa tca gag tac ctg atg 768 Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met 245 250 255 ctg tgg ctg gtg ctg gac tat agc gcc gat gtg ctc tac gtc ctg gat 816 Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp 260 265 270 gtg ctc gtg cgc gcc cgg acc gga ttc ttg gaa caa ggc ctg atg gtg 864 Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val 275 280 285 tcc gac acg aat aga ctg tgg cag cac tat aag acc aca acc cag ttc 912 Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe 290 295 300 aag ctt gac gtg ctc agc ctt gtg ccg act gac ctg gcc tac ctg aaa 960 Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys 305 310 315 320 gtc gga act aac tac ccg gaa gtc aga ttc aac cga ctc ctg aag ttc 1008 Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe 325 330 335 agc agg ctg ttc gag ttc ttt gac cgc acc gag act cgg acc aac tac 1056 Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr 340 345 350 cct aac atg ttc cgg atc gga aat ctg gtg ctc tac ata ctg att atc 1104 Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile 355 360 365 atc cat tgg aac gcc tgt atc tat ttc gcc att tcg aag ttc atc ggt 1152 Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly 370 375 380 ttc gga acc gat tcc tgg gtg tac ccc aac atc tcg atc ccc gaa cac 1200 Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His 385 390 395 400 ggt cgc ctg tcc cgg aag tac atc tac tcc ctg tac tgg tcc act ctg 1248 Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu 405 410 415 act ctg acc acg atc ggg gaa acc cct cca ccc gtg aag gac gaa gag 1296 Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu 420 425 430 tac ctg ttc gtg gtg gtg gac ttc ctg gtc gga gtg ttg att ttc gcc 1344 Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala 435 440 445 acc att gtg gga aac gtg ggc tcc atg atc tcc aac atg aac gcg tcg 1392 Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser 450 455 460 aga gct gag ttc caa gcc aag atc gac tcc att aag cag tac atg cag 1440 Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln 465 470 475 480 ttc aga aag gtc acc aag gac ctg gaa acc agg gtc atc cgc tgg ttc 1488 Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe 485 490 495 gac tac ctg tgg gcc aac aaa aag act gtg gac gaa aag gaa gtg ctg 1536 Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu 500 505 510 aag tcg ctg ccg gat aag ctg aag gcc gaa atc gcc att aac gtg cac 1584 Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His 515 520 525 ctt gac acc ctg aag aaa gtc cgg atc ttc caa gac tgt gaa gcc ggc 1632 Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly 530 535 540 ctc ctg gtg gag ctc gtg ctc aag ctg cgg ccc acc gtg ttc agc ccg 1680 Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro 545 550 555 560 gga gat tac att tgc aag aag ggc gat atc ggc aaa gag atg tac atc 1728 Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile 565 570 575 atc aac gag gga aag ctg gcc gtg gtc gcg gac gac ggc gtg acc cag 1776 Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln 580 585 590 ttc gtg gtg ctg tcc gac gga tcc tac ttc ggt gaa atc tca atc ctc 1824 Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu 595 600 605 aac atc aag ggg tcc aag tcc ggc aac cgg aga act gcc aac att cgc 1872 Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg 610 615 620 tcc atc gga tac agc gac ctg ttt tgc ctg tcc aag gat gac ctg atg 1920 Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met 625 630 635 640 gag gct ctg act gag tac cct gaa gcg aag aag gct ttg gag gaa aag 1968 Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys 645 650 655 ggg cgg cag att ctg atg aag gac aat ttg atc gac gag gag ctc gca 2016 Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala 660 665 670 cgg gcc ggc gcc gac ccc aag gat ctc gaa gag aag gtc gaa cag ctg 2064 Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu 675 680 685 ggt tct tcg ctt gat acc ctg caa acc cga ttc gcg cgg ctg ctc gcc 2112 Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala 690 695 700 gag tac aac gcg acc cag atg aag atg aag cag aga ctg tca cag ttg 2160 Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu 705 710 715 720 gaa tcc caa gtc aag ggc gga ggc gac aag ccg ctg gcg gac ggg gaa 2208 Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu 725 730 735 gtg ccc ggg gac gcc acc aag act gag gac aag cag cag tga 2250 Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln 740 745 <210> 12 <211> 749 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser 65 70 75 80 Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile 85 90 95 Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met 100 105 110 Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu 115 120 125 Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His 130 135 140 His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala 145 150 155 160 Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val 165 170 175 Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala 180 185 190 Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr 195 200 205 Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr 210 215 220 Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu 225 230 235 240 Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met 245 250 255 Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp 260 265 270 Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val 275 280 285 Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe 290 295 300 Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys 305 310 315 320 Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe 325 330 335 Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr 340 345 350 Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile 355 360 365 Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly 370 375 380 Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His 385 390 395 400 Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu 405 410 415 Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu 420 425 430 Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala 435 440 445 Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser 450 455 460 Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln 465 470 475 480 Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe 485 490 495 Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu 500 505 510 Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His 515 520 525 Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly 530 535 540 Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro 545 550 555 560 Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile 565 570 575 Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln 580 585 590 Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu 595 600 605 Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg 610 615 620 Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met 625 630 635 640 Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys 645 650 655 Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala 660 665 670 Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu 675 680 685 Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala 690 695 700 Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu 705 710 715 720 Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu 725 730 735 Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln 740 745 <210> 13 <211> 2085 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(2085) <223> native open reading frame (ORF) <400> 13 atg gcc aag atc aac acc caa tac tcc cac ccc tcc agg acc cac ctc 48 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 aag gta aag acc tca gac cgg gat ctc aat cgc gct gaa aat ggc ctc 96 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 agc aga gcc cac tcg tca agt gag gag aca tcg tca gtg ctg cag ccg 144 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 ggg atc gcc atg gag acc aga gga ctg gct gac tcc ggg cag ggc tcc 192 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 ttc acc ggc cag ggg atc gcc agg ctg tcg cgc ctc atc ttc ttg ctg 240 Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu 65 70 75 80 cgc agg tgg gct gcc agg cat gtg cac cac cag gac cag gga ccg gac 288 Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp 85 90 95 tct ttt cct gat cgt ttc cgt gga gcc gag ctt aag gag gtg tcc agc 336 Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser 100 105 110 caa gaa agc aat gcc cag gca aat gtg ggc agc cag gag cca gca gac 384 Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp 115 120 125 aga ggg aga agc gcc tgg ccc ctg gcc aaa tgc aac act aac acc agc 432 Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser 130 135 140 aac aac acg gag gag gag aag aag acg aaa aag aag gat gcg atc gtg 480 Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val 145 150 155 160 gtg gac ccg tcc agc aac ctg tac tac cgc tgg ctg acc gcc atc gcc 528 Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala 165 170 175 ctg cct gtc ttc tat aac tgg tat ctg ctt att tgc agg gcc tgt ttc 576 Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe 180 185 190 gat gag ctg cag tcc gag tac ctg atg ctg tgg ctg gtc ctg gac tac 624 Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr 195 200 205 tcg gca gat gtc ctg tat gtc ttg gat gtg ctt gta cga gct cgg aca 672 Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr 210 215 220 ggt ttt ctt gag caa ggc tta atg gtc agt gat acc aac agg ctg tgg 720 Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp 225 230 235 240 cag cat tac aag acg acc acg cag ttc aag ctg gat gtg ttg tcc ctg 768 Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu 245 250 255 gtc ccc acc gac ctg gct tac tta aag gtg ggc aca aac tac cca gaa 816 Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu 260 265 270 gtg agg ttc aac cgc cta ctg aag ttt tcc cgg ctc ttt gaa ttc ttt 864 Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe 275 280 285 gac cgc aca gag aca agg acc aac tac ccc aat atg ttc agg att ggg 912 Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly 290 295 300 aac ttg gtc ttg tac att ctc atc atc atc cac tgg aat gcc tgc atc 960 Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile 305 310 315 320 tac ttt gcc att tcc aag ttc att ggt ttt ggg aca gac tcc tgg gtc 1008 Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val 325 330 335 tac cca aac atc tca atc cca gag cat ggg cgc ctc tcc agg aag tac 1056 Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr 340 345 350 att tac agt ctc tac tgg tcc acc ttg acc ctt acc acc att ggt gag 1104 Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu 355 360 365 acc cca ccc ccc gtg aaa gat gag gag tat ctc ttt gtg gtc gta gac 1152 Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp 370 375 380 ttc ttg gtg ggt gtt ctg att ttt gcc acc att gtg ggc aat gtg ggc 1200 Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly 385 390 395 400 tcc atg atc tcg aat atg aat gcc tca cgg gca gag ttc cag gcc aag 1248 Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys 405 410 415 att gat tcc atc aag cag tac atg cag ttc cgc aag gtc acc aag gac 1296 Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp 420 425 430 ttg gag acg cgg gtt atc cgg tgg ttt gac tac ctg tgg gcc aac aag 1344 Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys 435 440 445 aag acg gtg gat gag aag gag gtg ctc aag agc ctc cca gac aag ctg 1392 Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu 450 455 460 aag gct gag atc gcc atc aac gtg cac ctg gac acg ctg aag aag gtt 1440 Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val 465 470 475 480 cgc atc ttc cag gac tgt gag gca ggg ctg ctg gtg gag ctg gtg ctg 1488 Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu 485 490 495 aag ctg cga ccc act gtg ttc agc cct ggg gat tat atc tgc aag aag 1536 Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys 500 505 510 gga gat att ggg aag gag atg tac atc atc aac gag ggc aag ctg gcc 1584 Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala 515 520 525 gtg gtg gct gat gat ggg gtc acc cag ttc gtg gtc ctc agc gat ggc 1632 Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly 530 535 540 agc tac ttc ggg gag atc agc att ctg aac atc aag ggg agc aag tcg 1680 Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser 545 550 555 560 ggg aac cgc agg acg gcc aac atc cgc agc att ggc tac tca gac ctg 1728 Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu 565 570 575 ttc tgc ctc tca aag gac gat ctc atg gag gcc ctc acc gag tac ccc 1776 Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro 580 585 590 gaa gcc aag aag gcc ctg gag gag aaa gga cgg cag atc ctg atg aaa 1824 Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys 595 600 605 gac aac ctg atc gat gag gag ctg gcc agg gcg ggc gcg gac ccc aag 1872 Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys 610 615 620 gac ctt gag gag aaa gtg gag cag ctg ggg tcc tcc ctg gac acc ctg 1920 Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu 625 630 635 640 cag acc agg ttt gca cgc ctc ctg gct gag tac aac gcc acc cag atg 1968 Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met 645 650 655 aag atg aag cag cgt ctc agc caa ctg gaa agc cag gtg aag ggt ggt 2016 Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly 660 665 670 ggg gac aag ccc ctg gct gat ggg gaa gtt ccc ggg gat gct aca aaa 2064 Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys 675 680 685 aca gag gac aaa caa cag tga 2085 Thr Glu Asp Lys Gln Gln 690 <210> 14 <211> 694 <212> PRT <213> Homo sapiens <400> 14 Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu 1 5 10 15 Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu 20 25 30 Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro 35 40 45 Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser 50 55 60 Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu 65 70 75 80 Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp 85 90 95 Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser 100 105 110 Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp 115 120 125 Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser 130 135 140 Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val 145 150 155 160 Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala 165 170 175 Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe 180 185 190 Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr 195 200 205 Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr 210 215 220 Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp 225 230 235 240 Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu 245 250 255 Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu 260 265 270 Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe 275 280 285 Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly 290 295 300 Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile 305 310 315 320 Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val 325 330 335 Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr 340 345 350 Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu 355 360 365 Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp 370 375 380 Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly 385 390 395 400 Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys 405 410 415 Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp 420 425 430 Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys 435 440 445 Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu 450 455 460 Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val 465 470 475 480 Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu 485 490 495 Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys 500 505 510 Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala 515 520 525 Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly 530 535 540 Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser 545 550 555 560 Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu 565 570 575 Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro 580 585 590 Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys 595 600 605 Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys 610 615 620 Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu 625 630 635 640 Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met 645 650 655 Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly 660 665 670 Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys 675 680 685 Thr Glu Asp Lys Gln Gln 690 <210> 15 <211> 2085 <212> DNA <213> Homo sapiens <400> 15 atggccaaga tcaacaccca atactcccac ccctccagga cccacctcaa ggtaaagacc 60 tcagaccgag atctcaatcg cgctgaaaat ggcctcagca gagcccactc gtcaagtgag 120 gagacatcgt cagtgctgca gccggggatc gccatggaga ccagaggact ggctgactcc 180 gggcagggct ccttcaccgg ccaggggatc gccaggctgt cgcgcctcat cttcttgctg 240 cgcaggtggg ctgccaggca tgtgcaccac caggaccagg gaccggactc ttttcctgat 300 cgtttccgtg gagccgagct taaggaggtg tccagccaag aaagcaatgc ccaggcaaat 360 gtgggcagcc aggagccagc agacagaggg agaagcgcct ggcccctggc caaatgcaac 420 actaacacca gcaacaacac ggaggaggag aagaagacga aaaagaagga tgcgatcgtg 480 gtggacccgt ccagcaacct gtactaccgc tggctgaccg ccatcgccct gcctgtcttc 540 tataactggt atctgcttat ttgcagggcc tgtttcgatg agctgcagtc cgagtacctg 600 atgctgtggc tggtcctgga ctactcggca gatgtcctgt atgtcttgga tgtgcttgta 660 cgagctcgga caggttttct cgagcaaggc ttaatggtca gtgataccaa caggctgtgg 720 cagcattaca agacgaccac gcagttcaag ctggatgtgt tgtccctggt ccccaccgac 780 ctggcttact taaaggtggg cacaaactac ccagaagtga ggttcaaccg cctactgaag 840 ttttcccggc tctttgaatt ctttgaccgc acagagacaa ggaccaacta ccccaatatg 900 ttcaggattg ggaacttggt cttgtacatt ctcatcatca tccactggaa tgcctgcatc 960 tactttgcca tttccaagtt cattggtttt gggacagact cctgggtcta cccaaacatc 1020 tcaatcccag agcatgggcg cctctccagg aagtacattt acagtctcta ctggtccacc 1080 ttgaccctta ccaccattgg tgagacccca ccccccgtga aagatgagga gtatctcttt 1140 gtggtcgtag acttcttggt gggtgttctg atttttgcca ccattgtggg caatgtgggc 1200 tccatgatct cgaatatgaa tgcctcacgg gcagagttcc aggccaagat tgattccatc 1260 aagcagtaca tgcagttccg caaggtcacc aaggacttgg agacgcgggt tatccggtgg 1320 tttgactacc tgtgggccaa caagaagacg gtggatgaga aggaggtgct caagagcctc 1380 ccagacaagc tgaaggctga gatcgccatc aacgtgcacc tggacacgct gaagaaggtt 1440 cgcatcttcc aggactgtga ggcagggctg ctggtggagc tggtgctgaa gctgcgaccc 1500 actgtgttca gccctgggga ttatatctgc aagaagggag atattgggaa ggagatgtac 1560 atcatcaacg agggcaagct ggccgtggtg gctgatgatg gggtcaccca gttcgtggtc 1620 ctcagcgatg gcagctactt cggggagatc agcattctga acatcaaggg gagcaagtcg 1680 gggaaccgca ggacggccaa catccgcagc attggctact cagacctgtt ctgcctctca 1740 aaggacgatc tcatggaggc cctcaccgag taccccgaag ccaagaaggc cctggaggag 1800 aaaggacggc agatcctgat gaaagacaac ctgatcgatg aggagctggc cagggcgggc 1860 gcggacccca aggaccttga ggagaaagtg gagcagctgg ggtcctccct ggacaccctg 1920 cagaccaggt ttgcacgcct cctggctgag tacaacgcca cccagatgaa gatgaagcag 1980 cgtctcagcc aactggaaag ccaggtgaag ggtggtgggg acaagcccct ggctgatggg 2040 gaagttcccg gggatgctac aaaaacagag gacaaacaac agtga 2085 <210> 16 <211> 2107 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 16 gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60 aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120 tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180 ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggct gagcagactg 240 atcttcctgc ttcgccgctg ggcggccaga cacgtgcacc atcaggacca gggacctgat 300 agcttccccg accgctttag gggagccgag ctgaaagaag tgtcaagcca ggagtcaaac 360 gcgcaggcca acgtcggcag ccaagagcct gcagaccggg gacgctcggc atggccgctc 420 gcaaagtgca acactaacac ttccaacaac accgaagagg aaaagaaaac caagaagaag 480 gatgcaattg tggtggaccc ttcctccaac ctgtactacc gctggttgac cgccatcgcc 540 ctcccggtct tttacaattg gtatctcctt atctgccggg cctgcttcga cgaactgcaa 600 tcagagtacc tgatgctgtg gctggtgctg gactatagcg ccgatgtgct ctacgtcctg 660 gatgtgctcg tgcgcgcccg gaccggattc ttggaacaag gcctgatggt gtccgacacg 720 aatagactgt ggcagcacta taagaccaca acccagttca agcttgacgt gctcagcctt 780 gtgccgactg acctggccta cctgaaagtc ggaactaact acccggaagt cagattcaac 840 cgactcctga agttcagcag gctgttcgag ttctttgacc gcaccgagac tcggaccaac 900 taccctaaca tgttccggat cggaaatctg gtgctctaca tactgattat catccattgg 960 aacgcctgta tctatttcgc catttcgaag ttcatcggtt tcggaaccga ttcctgggtg 1020 taccccaaca tctcgatccc cgaacacggt cgcctgtccc ggaagtacat ctactccctg 1080 tactggtcca ctctgactct gaccacgatc ggggaaaccc ctccacccgt gaaggacgaa 1140 gagtacctgt tcgtggtggt ggacttcctg gtcggagtgt tgattttcgc caccattgtg 1200 ggaaacgtgg gctccatgat ctccaacatg aacgcgtcga gagctgagtt ccaagccaag 1260 atcgactcca ttaagcagta catgcagttc agaaaggtca ccaaggacct ggaaaccagg 1320 gtcatccgct ggttcgacta cctgtgggcc aacaaaaaga ctgtggacga aaaggaagtg 1380 ctgaagtcgc tgccggataa gctgaaggcc gaaatcgcca ttaacgtgca ccttgacacc 1440 ctgaagaaag tccggatctt ccaagactgt gaagccggcc tcctggtgga gctcgtgctc 1500 aagctgcggc ccaccgtgtt cagcccggga gattacattt gcaagaaggg cgatatcggc 1560 aaagagatgt acatcatcaa cgagggaaag ctggccgtgg tcgcggacga cggcgtgacc 1620 cagttcgtgg tgctgtccga cggatcctac ttcggtgaaa tctcaatcct caacatcaag 1680 gggtccaagt ccggcaaccg gagaactgcc aacattcgct ccatcggata cagcgacctg 1740 ttttgcctgt ccaaggatga cctgatggag gctctgactg agtaccctga agcgaagaag 1800 gctttggagg aaaaggggcg gcagattctg atgaaggaca atttgatcga cgaggagctc 1860 gcacgggccg gcgccgaccc caaggatctc gaagagaagg tcgaacagct gggttcttcg 1920 cttgataccc tgcaaacccg attcgcgcgg ctgctcgccg agtacaacgc gacccagatg 1980 aagatgaagc agagactgtc acagttggaa tcccaagtca agggcggagg cgacaagccg 2040 ctggcggacg gggaagtgcc cggggacgcc accaagactg aggacaagca gcagtgatca 2100 tagatct 2107 <210> 17 <211> 2272 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 17 gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60 aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120 tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180 ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggtt cgggcggatt 240 cagaagaagt cccagccgga gaaggtcgtg cgggctgcca gcaggggcag gccactcatt 300 ggttggacac agtggtgcgc tgaggatggt ggagatgaat cggaaatggc actggccggc 360 tctcccggat gcagctcggg cccccaaggg agactgagca gactgatctt cctgcttcgc 420 cgctgggcgg ccagacacgt gcaccatcag gaccagggac ctgatagctt ccccgaccgc 480 tttaggggag ccgagctgaa agaagtgtca agccaggagt caaacgcgca ggccaacgtc 540 ggcagccaag agcctgcaga ccggggacgc tcggcatggc cgctcgcaaa gtgcaacact 600 aacacttcca acaacaccga agaggaaaag aaaaccaaga agaaggatgc aattgtggtg 660 gacccttcct ccaacctgta ctaccgctgg ttgaccgcca tcgccctccc ggtcttttac 720 aattggtatc tccttatctg ccgggcctgc ttcgacgaac tgcaatcaga gtacctgatg 780 ctgtggctgg tgctggacta tagcgccgat gtgctctacg tcctggatgt gctcgtgcgc 840 gcccggaccg gattcttgga acaaggcctg atggtgtccg acacgaatag actgtggcag 900 cactataaga ccacaaccca gttcaagctt gacgtgctca gccttgtgcc gactgacctg 960 gcctacctga aagtcggaac taactacccg gaagtcagat tcaaccgact cctgaagttc 1020 agcaggctgt tcgagttctt tgaccgcacc gagactcgga ccaactaccc taacatgttc 1080 cggatcggaa atctggtgct ctacatactg attatcatcc attggaacgc ctgtatctat 1140 ttcgccattt cgaagttcat cggtttcgga accgattcct gggtgtaccc caacatctcg 1200 atccccgaac acggtcgcct gtcccggaag tacatctact ccctgtactg gtccactctg 1260 actctgacca cgatcgggga aacccctcca cccgtgaagg acgaagagta cctgttcgtg 1320 gtggtggact tcctggtcgg agtgttgatt ttcgccacca ttgtgggaaa cgtgggctcc 1380 atgatctcca acatgaacgc gtcgagagct gagttccaag ccaagatcga ctccattaag 1440 cagtacatgc agttcagaaa ggtcaccaag gacctggaaa ccagggtcat ccgctggttc 1500 gactacctgt gggccaacaa aaagactgtg gacgaaaagg aagtgctgaa gtcgctgccg 1560 gataagctga aggccgaaat cgccattaac gtgcaccttg acaccctgaa gaaagtccgg 1620 atcttccaag actgtgaagc cggcctcctg gtggagctcg tgctcaagct gcggcccacc 1680 gtgttcagcc cgggagatta catttgcaag aagggcgata tcggcaaaga gatgtacatc 1740 atcaacgagg gaaagctggc cgtggtcgcg gacgacggcg tgacccagtt cgtggtgctg 1800 tccgacggat cctacttcgg tgaaatctca atcctcaaca tcaaggggtc caagtccggc 1860 aaccggagaa ctgccaacat tcgctccatc ggatacagcg acctgttttg cctgtccaag 1920 gatgacctga tggaggctct gactgagtac cctgaagcga agaaggcttt ggaggaaaag 1980 gggcggcaga ttctgatgaa ggacaatttg atcgacgagg agctcgcacg ggccggcgcc 2040 gaccccaagg atctcgaaga gaaggtcgaa cagctgggtt cttcgcttga taccctgcaa 2100 acccgattcg cgcggctgct cgccgagtac aacgcgaccc agatgaagat gaagcagaga 2160 ctgtcacagt tggaatccca agtcaagggc ggaggcgaca agccgctggc ggacggggaa 2220 gtgcccgggg acgccaccaa gactgaggac aagcagcagt gatcatagat ct 2272 <210> 18 <211> 2107 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 18 gcggccgcca ccatggccaa gatcaacacc caatactccc acccctccag gacccacctc 60 aaggtaaaga cctcagaccg ggatctcaat cgcgctgaaa atggcctcag cagagcccac 120 tcgtcaagtg aggagacatc gtcagtgctg cagccgggga tcgccatgga gaccagagga 180 ctggctgact ccgggcaggg ctccttcacc ggccagggga tcgccaggct gtcgcgcctc 240 atcttcttgc tgcgcaggtg ggctgccagg catgtgcacc accaggacca gggaccggac 300 tcttttcctg atcgtttccg tggagccgag cttaaggagg tgtccagcca agaaagcaat 360 gcccaggcaa atgtgggcag ccaggagcca gcagacagag ggagaagcgc ctggcccctg 420 gccaaatgca acactaacac cagcaacaac acggaggagg agaagaagac gaaaaagaag 480 gatgcgatcg tggtggaccc gtccagcaac ctgtactacc gctggctgac cgccatcgcc 540 ctgcctgtct tctataactg gtatctgctt atttgcaggg cctgtttcga tgagctgcag 600 tccgagtacc tgatgctgtg gctggtcctg gactactcgg cagatgtcct gtatgtcttg 660 gatgtgcttg tacgagctcg gacaggtttt cttgagcaag gcttaatggt cagtgatacc 720 aacaggctgt ggcagcatta caagacgacc acgcagttca agctggatgt gttgtccctg 780 gtccccaccg acctggctta cttaaaggtg ggcacaaact acccagaagt gaggttcaac 840 cgcctactga agttttcccg gctctttgaa ttctttgacc gcacagagac aaggaccaac 900 taccccaata tgttcaggat tgggaacttg gtcttgtaca ttctcatcat catccactgg 960 aatgcctgca tctactttgc catttccaag ttcattggtt ttgggacaga ctcctgggtc 1020 tacccaaaca tctcaatccc agagcatggg cgcctctcca ggaagtacat ttacagtctc 1080 tactggtcca ccttgaccct taccaccatt ggtgagaccc caccccccgt gaaagatgag 1140 gagtatctct ttgtggtcgt agacttcttg gtgggtgttc tgatttttgc caccattgtg 1200 ggcaatgtgg gctccatgat ctcgaatatg aatgcctcac gggcagagtt ccaggccaag 1260 attgattcca tcaagcagta catgcagttc cgcaaggtca ccaaggactt ggagacgcgg 1320 gttatccggt ggtttgacta cctgtgggcc aacaagaaga cggtggatga gaaggaggtg 1380 ctcaagagcc tcccagacaa gctgaaggct gagatcgcca tcaacgtgca cctggacacg 1440 ctgaagaagg ttcgcatctt ccaggactgt gaggcagggc tgctggtgga gctggtgctg 1500 aagctgcgac ccactgtgtt cagccctggg gattatatct gcaagaaggg agatattggg 1560 aaggagatgt acatcatcaa cgagggcaag ctggccgtgg tggctgatga tggggtcacc 1620 cagttcgtgg tcctcagcga tggcagctac ttcggggaga tcagcattct gaacatcaag 1680 gggagcaagt cggggaaccg caggacggcc aacatccgca gcattggcta ctcagacctg 1740 ttctgcctct caaaggacga tctcatggag gccctcaccg agtaccccga agccaagaag 1800 gccctggagg agaaaggacg gcagatcctg atgaaagaca acctgatcga tgaggagctg 1860 gccagggcgg gcgcggaccc caaggacctt gaggagaaag tggagcagct ggggtcctcc 1920 ctggacaccc tgcagaccag gtttgcacgc ctcctggctg agtacaacgc cacccagatg 1980 aagatgaagc agcgtctcag ccaactggaa agccaggtga agggtggtgg ggacaagccc 2040 ctggctgatg gggaagttcc cggggatgct acaaaaacag aggacaaaca acagtgatca 2100 tagatct 2107 <210> 19 <211> 2430 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(2430) <400> 19 atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu 1 5 10 15 aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96 Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His 20 25 30 cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144 Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly 35 40 45 gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192 Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu 50 55 60 cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240 Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly 65 70 75 80 gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288 Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly 85 90 95 aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336 Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn 100 105 110 agc cca caa aac aaa ccg cct gca gct cct gtt ata aat gag tat gcc 384 Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala 115 120 125 gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432 Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala 130 135 140 ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480 Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala 145 150 155 160 agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528 Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser 165 170 175 gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576 Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val 180 185 190 aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624 Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn 195 200 205 agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672 Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu 210 215 220 gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720 Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu 225 230 235 240 gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768 Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala 245 250 255 gac atc ata tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816 Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln 260 265 270 ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864 Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn 275 280 285 gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912 Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val 290 295 300 gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960 Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn 305 310 315 320 cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008 Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu 325 330 335 ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056 Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg 340 345 350 gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104 Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala 355 360 365 tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152 Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg 370 375 380 tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200 Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp 385 390 395 400 gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248 Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr 405 410 415 tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296 Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe 420 425 430 gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344 Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala 435 440 445 aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392 Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala 450 455 460 tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440 Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg 465 470 475 480 act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488 Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser 485 490 495 gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536 Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile 500 505 510 gat gtg aac ttc agc atc atc agc aaa gtc gac ttg ttc aag ggt tgt 1584 Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys 515 520 525 gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632 Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu 530 535 540 tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680 Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu 545 550 555 560 atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728 Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp 565 570 575 ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776 Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu 580 585 590 atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824 Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val 595 600 605 gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872 Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu 610 615 620 caa gaa att cta gtg cat tat cca gat tct gaa agg atc ctc atg aag 1920 Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys 625 630 635 640 aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968 Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr 645 650 655 cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016 Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr 660 665 670 ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064 Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu 675 680 685 gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112 Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu 690 695 700 aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160 Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln 705 710 715 720 aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208 Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu 725 730 735 aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256 Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp 740 745 750 aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304 Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His 755 760 765 tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352 Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu 770 775 780 att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400 Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr 785 790 795 800 att gaa gtc aaa gaa aag gct aag caa taa 2430 Ile Glu Val Lys Glu Lys Ala Lys Gln 805 <210> 20 <211> 809 <212> PRT <213> Homo sapiens <400> 20 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu 1 5 10 15 Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His 20 25 30 Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly 35 40 45 Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu 50 55 60 Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly 65 70 75 80 Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly 85 90 95 Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn 100 105 110 Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala 115 120 125 Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala 130 135 140 Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala 145 150 155 160 Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser 165 170 175 Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val 180 185 190 Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn 195 200 205 Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu 210 215 220 Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu 225 230 235 240 Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala 245 250 255 Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln 260 265 270 Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn 275 280 285 Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val 290 295 300 Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn 305 310 315 320 Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu 325 330 335 Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg 340 345 350 Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala 355 360 365 Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg 370 375 380 Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp 385 390 395 400 Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr 405 410 415 Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe 420 425 430 Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala 435 440 445 Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala 450 455 460 Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg 465 470 475 480 Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser 485 490 495 Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile 500 505 510 Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys 515 520 525 Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu 530 535 540 Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu 545 550 555 560 Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp 565 570 575 Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu 580 585 590 Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val 595 600 605 Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu 610 615 620 Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys 625 630 635 640 Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr 645 650 655 Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr 660 665 670 Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu 675 680 685 Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu 690 695 700 Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln 705 710 715 720 Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu 725 730 735 Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp 740 745 750 Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His 755 760 765 Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu 770 775 780 Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr 785 790 795 800 Ile Glu Val Lys Glu Lys Ala Lys Gln 805 <210> 21 <211> 2430 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> CDS <222> (1)..(2430) <400> 21 atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu 1 5 10 15 aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96 Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His 20 25 30 cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144 Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly 35 40 45 gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192 Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu 50 55 60 cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240 Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly 65 70 75 80 gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288 Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly 85 90 95 aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336 Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn 100 105 110 agc cca caa aac aaa ccg cca gca gct cct gtt ata aat gag tat gcc 384 Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala 115 120 125 gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432 Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala 130 135 140 ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480 Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala 145 150 155 160 agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528 Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser 165 170 175 gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576 Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val 180 185 190 aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624 Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn 195 200 205 agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672 Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu 210 215 220 gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720 Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu 225 230 235 240 gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768 Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala 245 250 255 gac atc atc tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816 Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln 260 265 270 ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864 Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn 275 280 285 gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912 Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val 290 295 300 gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960 Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn 305 310 315 320 cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008 Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu 325 330 335 ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056 Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg 340 345 350 gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104 Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala 355 360 365 tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152 Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg 370 375 380 tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200 Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp 385 390 395 400 gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248 Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr 405 410 415 tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296 Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe 420 425 430 gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344 Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala 435 440 445 aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392 Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala 450 455 460 tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440 Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg 465 470 475 480 act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488 Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser 485 490 495 gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536 Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile 500 505 510 gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc aag ggt tgt 1584 Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys 515 520 525 gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632 Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu 530 535 540 tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680 Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu 545 550 555 560 atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728 Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp 565 570 575 ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776 Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu 580 585 590 atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824 Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val 595 600 605 gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872 Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu 610 615 620 caa gaa att cta gtg cat tat cca gat tct gaa aga atc ctc atg aag 1920 Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys 625 630 635 640 aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968 Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr 645 650 655 cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016 Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr 660 665 670 ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064 Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu 675 680 685 gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112 Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu 690 695 700 aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160 Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln 705 710 715 720 aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208 Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu 725 730 735 aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256 Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp 740 745 750 aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304 Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His 755 760 765 tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352 Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu 770 775 780 att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400 Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr 785 790 795 800 att gaa gtc aaa gaa aag gct aag caa tga 2430 Ile Glu Val Lys Glu Lys Ala Lys Gln 805 <210> 22 <211> 809 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 22 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu 1 5 10 15 Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His 20 25 30 Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly 35 40 45 Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu 50 55 60 Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly 65 70 75 80 Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly 85 90 95 Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn 100 105 110 Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala 115 120 125 Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala 130 135 140 Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala 145 150 155 160 Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser 165 170 175 Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val 180 185 190 Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn 195 200 205 Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu 210 215 220 Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu 225 230 235 240 Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala 245 250 255 Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln 260 265 270 Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn 275 280 285 Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val 290 295 300 Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn 305 310 315 320 Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu 325 330 335 Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg 340 345 350 Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala 355 360 365 Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg 370 375 380 Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp 385 390 395 400 Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr 405 410 415 Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe 420 425 430 Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala 435 440 445 Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala 450 455 460 Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg 465 470 475 480 Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser 485 490 495 Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile 500 505 510 Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys 515 520 525 Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu 530 535 540 Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu 545 550 555 560 Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp 565 570 575 Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu 580 585 590 Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val 595 600 605 Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu 610 615 620 Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys 625 630 635 640 Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr 645 650 655 Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr 660 665 670 Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu 675 680 685 Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu 690 695 700 Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln 705 710 715 720 Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu 725 730 735 Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp 740 745 750 Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His 755 760 765 Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu 770 775 780 Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr 785 790 795 800 Ile Glu Val Lys Glu Lys Ala Lys Gln 805 <210> 23 <211> 2454 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(12) <223> modified end with NotI site and Kozak <220> <221> misc_feature <222> (1)..(8) <223> NotI site for subcloning <220> <221> CDS <222> (13)..(2448) <223> ORF with silent mutations (stop codon and restriction sites BamHI, PstI, SalI, and NdeI) <220> <221> misc_feature <222> (2440)..(2442) <223> modifed stop codon <220> <221> misc_feature <222> (2440)..(2445) <223> BclI site to facilitate addition of epitope tag <220> <221> misc_feature <222> (2446)..(2448) <223> additional stop codon <220> <221> misc_feature <222> (2449)..(2454) <223> PstI site for subcloning <400> 23 gcggccgcca cc atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct 51 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro 1 5 10 ata gga gag aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa 99 Ile Gly Glu Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu 15 20 25 ggc tct cac cca agt aat cag tct cag caa acc aca gca cag gaa gaa 147 Gly Ser His Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu 30 35 40 45 aac aaa ggt gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg 195 Asn Lys Gly Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr 50 55 60 tct gaa gag cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat 243 Ser Glu Glu Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn 65 70 75 tcc tct gga gat ctg acc aca aac cct gac cct caa aat gca gca gaa 291 Ser Ser Gly Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu 80 85 90 cca act gga aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa 339 Pro Thr Gly Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu 95 100 105 ggt cca aac agc cca caa aac aaa ccg cca gca gct cct gtt ata aat 387 Gly Pro Asn Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn 110 115 120 125 gag tat gcc gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa 435 Glu Tyr Ala Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln 130 135 140 aga aca gcc ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca 483 Arg Thr Ala Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser 145 150 155 ccc gaa gcc agc cca caa act gca aag ccc acg gct gta cca cca gta 531 Pro Glu Ala Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val 160 165 170 aaa gaa agc gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg 579 Lys Glu Ser Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp 175 180 185 ttc aaa gtc aaa aag atg cct tta aca gag tac tta aag cga att aaa 627 Phe Lys Val Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys 190 195 200 205 ctt cca aac agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg 675 Leu Pro Asn Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp 210 215 220 ctc ttg ctt gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca 723 Leu Leu Leu Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro 225 230 235 ctg cgc ctc gtc ttc cca tat caa acc gca gac aac ata cac tac tgg 771 Leu Arg Leu Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp 240 245 250 ctt att gcg gac atc atc tgt gat atc atc tac ctt tat gat atg cta 819 Leu Ile Ala Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu 255 260 265 ttt atc cag ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg 867 Phe Ile Gln Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val 270 275 280 285 gat tca aat gag cta agg aaa cac tac agg act tct aca aaa ttt cag 915 Asp Ser Asn Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln 290 295 300 ttg gat gtc gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt 963 Leu Asp Val Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe 305 310 315 ggg ttt aat cca atg ttt aga gca aat agg atg tta aag tac act tca 1011 Gly Phe Asn Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser 320 325 330 ttt ttt gaa ttt aat cat cac cta gag tct ata atg gac aaa gca tat 1059 Phe Phe Glu Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr 335 340 345 atc tac aga gtt att cga aca act gga tac ttg ctg ttt att ctg cac 1107 Ile Tyr Arg Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His 350 355 360 365 att aat gcc tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc 1155 Ile Asn Ala Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly 370 375 380 act act aga tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt 1203 Thr Thr Arg Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys 385 390 395 tat tat tgg gca gtt cga act tta att acc att ggt ggc ctt cca gaa 1251 Tyr Tyr Trp Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu 400 405 410 cca caa act tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct 1299 Pro Gln Thr Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser 415 420 425 gga gtt ttt gtg ttc tcc agt tta att ggt cag atg aga gat gtg att 1347 Gly Val Phe Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile 430 435 440 445 gga gca gct aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac 1395 Gly Ala Ala Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp 450 455 460 acc att gcc tac atg aac aat tac tcc att cct aaa ctt gtg caa aag 1443 Thr Ile Ala Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys 465 470 475 cga gtt cgg act tgg tat gaa tat aca tgg gac tct caa aga atg cta 1491 Arg Val Arg Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu 480 485 490 gat gag tct gat ttg ctt aag acc cta cca act acg gtc cag tta gcc 1539 Asp Glu Ser Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala 495 500 505 ctc gcc att gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc 1587 Leu Ala Ile Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe 510 515 520 525 aag ggt tgt gat aca cag atg att tat gac atg ttg cta aga ttg aaa 1635 Lys Gly Cys Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys 530 535 540 tcc gtt ctc tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att 1683 Ser Val Leu Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile 545 550 555 ggc aag gaa atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga 1731 Gly Lys Glu Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly 560 565 570 ggc cct gat ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg 1779 Gly Pro Asp Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val 575 580 585 ttt gga gaa atc agc ctt cta gca gca gga gga gga aac cgt cga act 1827 Phe Gly Glu Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr 590 595 600 605 gcc aat gtg gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa 1875 Ala Asn Val Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys 610 615 620 aag acc ctc caa gaa att cta gtg cat tat cca gat tct gaa aga atc 1923 Lys Thr Leu Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile 625 630 635 ctc atg aag aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca 1971 Leu Met Lys Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala 640 645 650 gaa gca acc cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa 2019 Glu Ala Thr Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys 655 660 665 gaa gag aca ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa 2067 Glu Glu Thr Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys 670 675 680 685 gca agt ctt gca aga cta ctc aaa ttg aag cga gag caa gca gct cag 2115 Ala Ser Leu Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln 690 695 700 aag aaa gaa aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa 2163 Lys Lys Glu Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu 705 710 715 gat aaa caa aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa 2211 Asp Lys Gln Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys 720 725 730 gga aaa gaa aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag 2259 Gly Lys Glu Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys 735 740 745 cca ctg gac aga cct gaa tgt aca gca agt cct att gca gtg gag gaa 2307 Pro Leu Asp Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu 750 755 760 765 gaa ccc cac tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt 2355 Glu Pro His Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg 770 775 780 caa tca ctc att atc agc atg gct cct tct gct gag ggc gga gaa gag 2403 Gln Ser Leu Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu 785 790 795 gtt ctt act att gaa gtc aaa gaa aag gct aag caa tga tca taa 2448 Val Leu Thr Ile Glu Val Lys Glu Lys Ala Lys Gln Ser 800 805 810 ctgcag 2454 <210> 24 <211> 809 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu 1 5 10 15 Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His 20 25 30 Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly 35 40 45 Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu 50 55 60 Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly 65 70 75 80 Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly 85 90 95 Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn 100 105 110 Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala 115 120 125 Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala 130 135 140 Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala 145 150 155 160 Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser 165 170 175 Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val 180 185 190 Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn 195 200 205 Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu 210 215 220 Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu 225 230 235 240 Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala 245 250 255 Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln 260 265 270 Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn 275 280 285 Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val 290 295 300 Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn 305 310 315 320 Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu 325 330 335 Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg 340 345 350 Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala 355 360 365 Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg 370 375 380 Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp 385 390 395 400 Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr 405 410 415 Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe 420 425 430 Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala 435 440 445 Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala 450 455 460 Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg 465 470 475 480 Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser 485 490 495 Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile 500 505 510 Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys 515 520 525 Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu 530 535 540 Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu 545 550 555 560 Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp 565 570 575 Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu 580 585 590 Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val 595 600 605 Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu 610 615 620 Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys 625 630 635 640 Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr 645 650 655 Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr 660 665 670 Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu 675 680 685 Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu 690 695 700 Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln 705 710 715 720 Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu 725 730 735 Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp 740 745 750 Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His 755 760 765 Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu 770 775 780 Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr 785 790 795 800 Ile Glu Val Lys Glu Lys Ala Lys Gln 805 <210> 25 <211> 11714 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (241)..(544) <223> CMV enhancer <220> <221> misc_feature <222> (546)..(823) <223> chicken beta-actin promoter <220> <221> misc_feature <222> (824)..(1795) <223> CBA exon 1 and intron <220> <221> misc_feature <222> (1859)..(1864) <223> kozak <220> <221> misc_feature <222> (1865)..(3826) <223> human codon optimized CHM (REP-1) <220> <221> misc_feature <222> (3847)..(4054) <223> bGH poly(A) signal <220> <221> misc_feature <222> (4104)..(4233) <223> 3' ITR <400> 25 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020 cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080 gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140 gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200 tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260 gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320 gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380 gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440 ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500 gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560 tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620 ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680 ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740 cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800 caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860 caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920 tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980 gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040 gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100 cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160 ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220 gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280 gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340 gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400 gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460 tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520 gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580 cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640 catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700 cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760 gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820 tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880 ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940 gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000 ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060 tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120 tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180 cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240 tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300 ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360 catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420 cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480 acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540 tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600 ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660 ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720 cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780 caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020 aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080 tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200 ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260 tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320 cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380 cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620 aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680 ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740 aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800 tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860 gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920 tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980 tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040 tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100 tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160 gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220 ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280 agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340 ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400 taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360 cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420 cgattcatta atgcaggcgc ctgttgattt gagttttggg tttagcgtga caagtttgcg 6480 agggtgatcg gagtaatcag taaatagctc tccgcctaca atgacgtcat aaccatgatt 6540 tctggttttc tgacgtccgt tatcagttcc ctccgaccac gccagcatat cgaggaacgc 6600 cttacgttga ttattgattt ctaccatctt ctactccggc ttttttagca gcgaagcgtt 6660 tgataagcga accaatcgag tcagtaccga tgtagccgat aaacacgctc gttatataag 6720 cgagattgct acttagtccg gcgaagtcga gaaggtcacg aatgaaccag gcgataatgg 6780 cgcacatcgt tgcgtcgatt actgtttttg taaacgcacc gccattatat ctgccgcgaa 6840 ggtacgccat tgcaaacgca aggattgccc cgatgccttg ttcctttgcc gcgagaatgg 6900 cggccaacag gtcatgtttt tctggcatct tcatgtctta cccccaataa ggggatttgc 6960 tctatttaat taggaataag gtcgattact gatagaacaa atccaggcta ctgtgtttag 7020 taatcagatt tgttcgtgac cgatatgcac gggcaaaacg gcaggaggtt gttagcgcga 7080 cctcctgcca cccgctttca cgaaggtcat gtgtaaaagg ccgcagcgta actattacta 7140 atgaattcag gacagacagt ggctacggct cagtttgggt tgtgctgttg ctgggcggcg 7200 atgacgcctg tacgcatttg gtgatccggt tctgcttccg gtattcgctt aattcagcac 7260 aacggaaaga gcactggcta accaggctcg ccgactcttc acgattatcg actcaatgct 7320 cttacctgtt gtgcagatat aaaaaatccc gaaaccgtta tgcaggctct aactattacc 7380 tgcgaactgt ttcgggattg cattttgcag acctctctgc ctgcgatggt tggagttcca 7440 gacgatacgt cgaagtgacc aactaggcgg aatcggtagt aagcgccgcc tcttttcatc 7500 tcactaccac aacgagcgaa ttaacccatc gttgagtcaa atttacccaa ttttattcaa 7560 taagtcaata tcatgccgtt aatatgttgc catccgtggc aatcatgctg ctaacgtgtg 7620 accgcattca aaatgttgtc tgcgattgac tcttctttgt ggcattgcac caccagagcg 7680 tcatacagcg gcttaacagt gcgtgaccag gtgggttggg taaggtttgg gattagcatc 7740 gtcacagcgc gatatgctgc gcttgctggc atccttgaat agccgacgcc tttgcatctt 7800 ccgcactctt tctcgacaac tctcccccac agctctgttt tggcaatatc aaccgcacgg 7860 cctgtaccat ggcaatctct gcatcttgcc cccggcgtcg cggcactacg gcaataatcc 7920 gcataagcga atgttgcgag cacttgcagt acctttgcct tagtatttcc ttcaagcttt 7980 gccacaccac ggtatttccc cgataccttg tgtgcaaatt gcatcagata gttgatagcc 8040 ttttgtttgt cgttctggct gagttcgtgc ttaccgcaga atgcagccat accgaatccg 8100 gcttgtgatt gcgccatccc catagcagcc atcacatcag taccggaaag agagtcagaa 8160 gccgtggccc gtggtgagtc gctcatcatc gggctttttg gcgaatgaaa tttagctacg 8220 ctttcgagtc tcatgcgcct tctccctgta cctgaatcaa tgttaggttt ccgcagaaca 8280 ctgcgccggt atcgatatac atttggttgg caaacttgag tggtttcact gctggcgtat 8340 gaccaaagat gaacgtgtcc gcgcctttga tttctttcac gatcccgttt tgtgagttgc 8400 tgattcgttc gcggttccag attacctgct gatgatcaac tggctttcca aactcgtatt 8460 cgtcaaaggg ataatcggcg tggcagataa catatttttt atctttgctc accagttcga 8520 tgattaacgg aagttcatct gctttatggg caagagcttt agccagaatt tctttgtcgt 8580 aatcgagatt aaagaaccag ccaccgccat taagcagcca gtgattaacg tttccacgct 8640 ctgataagcc atcaatcatc atttgctcat ggtttccacg tacagctctg aaccagggga 8700 atgtgattaa ttccaggcat tcaacgttct ctgcaccacg atcaaccaaa tcgcccaccg 8760 agataagcag gtcttttttg ttgtcgaatc caatcgtatc cagtttgttc atcaggttcg 8820 tgtagcatcc gtgcagatcg ccaactaccc aaatatttcg gtatttgctg ccatcaattt 8880 tttcgtaata gcgcatctct ttcactccat ccgcgatgaa ccatgagaac gtcgttgacg 8940 atggcgtgca ttttcccgtc tttatcatca acgtattttc tgaccgtacc gcgactacat 9000 ttcagtctgc gtgctacttc tgtctgattt ccgtatgctt caacgagcat gtctggaatg 9060 gtttttactg agaacgtcat gcggcctcac ttctgctatt tcgcaggtct ttgagtttct 9120 gttggtactc tgccttgatc gccttgcact cttcgatagt ccagcgatgg cggttatggt 9180 ttgattcgat ttcgtctact gcttcctgcc cgatgcggct aatcagttcg acgcgatacg 9240 gaacgagatt tccgcttttg tgctggttgc acaccacgca ttgcttgtga atattgcgtt 9300 cattaaatcg gagttgaggt gccgcagcag ttgtccggta atgtccggca tcccactgag 9360 cagacgtgag cgttccgcac gagatacatg gtaagtcgcg gtctctttct ctgatgaagg 9420 cgtttacggc ttgttgggct tgtttaatcc agtaactgcg gggctttaag gcgagttttc 9480 gaatcttaag tttatctttc tgtttctgct cctctcgtcg tcgtttcttc tctgctgctt 9540 tttccgcttt ttcgcgttct ttacttcgtc gttcgagtgc tatcttggtt ccacactctg 9600 gagagcacca ccactgatta gcgaatgcag ggtgaaacca ttcccggcat tcatcgtttt 9660 tacatcgtct tcgcgctggt ttagccatca tcttcttcct cgtgcatcga gctattcgga 9720 tcgctcatca gttctgcgca gcagtgctca cacacgtgaa cttccagcac atgcagcttc 9780 tgaccgcagt tagcgcacgt taaagctcgc tcgacgcttt cttgttcgta acttcgattt 9840 tggtcaatca ccttgttttc ctcgcacgac gtcttagcca ccggatatcc cacaggtgag 9900 ccgtgtagtt gaaggttttt acgtcagatt cttttgggat tggcttgggt ttatttctgg 9960 tgcgtttcgt tggaaggtat ttgcagtttt cgcagattat gtcggtgata cttcgtcgct 10020 gtctcgccac acgtcctcct tttcctgcgg tagtggtaac acccctgttg gtgttctttc 10080 acaccggaga caccatcgat tccagtaagg ttgatttggt cggaagcggt tatcttcttt 10140 gcattcaccg caccgataac atcgcatcat gcagcttccc tcccgaagtc gaaatcaagc 10200 tgccctccaa atatttcgca tgactcagaa caagagccgg tatcgaatct tttagctcgt 10260 accatgtcct gatacagggc ttgataatca ttttctgaat acattttcgc gataccgtcc 10320 agcgacattc ttcctcggta cataatctcc tttggcgttt cccgatgtcc gtcacgcaca 10380 tgggatcccg tgatgacctc attaaaaaca cgctgcaatc cctcctcatc tttgcaggca 10440 agtccgattt tttgcgttga ttttttaatg cagaatatgc agttaccgag atgttccggt 10500 atttgcaaat cgaatggttg ttgcttccac catgcgagga tatcttcctt ctcaaagtct 10560 gacagttcag caagatatct gattccaggc tttggcttta gccgcttcgg ttcatcagct 10620 ctgatgccaa tccacgtggt gtaattccct cgcccgaaat ggtcatcaca gtatttggtg 10680 aagggaacga gttttaatct gtcagtgcag aacgcgccgc cgacgtatgg agtgccatat 10740 ttctttacca tatcgataaa tggcttcaga acaggcattc gcgtctgaat atcctttggt 10800 tcccataccg tataaccatt tggctgtcca agctccgggt tgatatcaac ctgcaatacg 10860 gtgagcggta tatcccagaa cttcacaact tccctgacaa accgatatgt cattggatgt 10920 tcacaacctg tatccatgaa aacgtaatgc acgtctttac ctgcccgtcg cttttgctcc 10980 attagccaga gcaaatatgc tgacgtcctg ccaccggaga aactaacgac atttatcatg 11040 cagccctgtc tccccatctc gctttccact ccagagccag tctcgcttcg tctgaccact 11100 taacgccacg ctctgtaccg aatgcctgta taagctctaa tagctccgca aattcgccta 11160 cacgcatcct gctggttgac tggcctatta ccacaaagcc attcccggca aggttaggaa 11220 caacatcctg ctgctttaat gctgcggtaa acacacactt ccagctttct gcatccagcc 11280 agcgaccatg ccattcaacc tgacgagaga cgtcacctaa gcaggcccat agcttcctgt 11340 tttggtctaa gctgcggttg cgttcctgaa tggttactac gattggtttg gttgggtctg 11400 gaaggatttg ctgtactgcg tgaatagcgt tttgctgatg tgctggagat cgaatttcaa 11460 aggttagttt tttcatgact tccctctccc ccaaataaaa aggctggcac gacaggtttc 11520 ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg 11580 caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat 11640 aacaatttca cacaggaaac agctatgacc atgattacgc caagctgtcg actctagagg 11700 atcccctaat aagg 11714 <210> 26 <211> 6647 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (241)..(544) <223> CMV enhancer <220> <221> misc_feature <222> (546)..(823) <223> chicken beta-actin promoter <220> <221> misc_feature <222> (824)..(1795) <223> CBA exon 1 and intron <220> <221> misc_feature <222> (1859)..(1864) <223> Kozak <220> <221> misc_feature <222> (1865)..(3826) <223> human codon optimized CHM (REM-1) <220> <221> misc_feature <222> (3847)..(4054) <223> bGH poly(A) signal <220> <221> misc_feature <222> (4104)..(4233) <223> 3' ITR <400> 26 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020 cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080 gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140 gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200 tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260 gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320 gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380 gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440 ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500 gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560 tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620 ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680 ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740 cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800 caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860 caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920 tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980 gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040 gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100 cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160 ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220 gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280 gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340 gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400 gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460 tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520 gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580 cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640 catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700 cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760 gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820 tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880 ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940 gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000 ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060 tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120 tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180 cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240 tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300 ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360 catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420 cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480 acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540 tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600 ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660 ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720 cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780 caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020 aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080 tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200 ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260 tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320 cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380 cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620 aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680 ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740 aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800 tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860 gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920 tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980 tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040 tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100 tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160 gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220 ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280 agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340 ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400 taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180 gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360 cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420 cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 6480 acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 6540 cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 6600 accatgatta cgccaagctg tcgactctag aggatcccct aataagg 6647 <210> 27 <211> 11971 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (241)..(544) <223> CMV Enhancer <220> <221> misc_feature <222> (546)..(823) <223> chicken beta-actin promoter <220> <221> misc_feature <222> (824)..(1795) <223> CBA exon 1 and intron <220> <221> misc_feature <222> (1859)..(1864) <223> kozak <220> <221> misc_feature <222> (1865)..(3826) <223> human codon optimized CHM (REP-1) <220> <221> misc_feature <222> (3847)..(4054) <223> bGH poly(A) signal <220> <221> misc_feature <222> (4104)..(4233) <223> 3' ITR <400> 27 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020 cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080 gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140 gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200 tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260 gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320 gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380 gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440 ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500 gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560 tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620 ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680 ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740 cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800 caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860 caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920 tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980 gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040 gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100 cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160 ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220 gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280 gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340 gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400 gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460 tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520 gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580 cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640 catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700 cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760 gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820 tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880 ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940 gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000 ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060 tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120 tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180 cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240 tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300 ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360 catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420 cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480 acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540 tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600 ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660 ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720 cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780 caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020 aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080 tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200 ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260 agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320 cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380 tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440 ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500 cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560 ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620 caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680 aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740 aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800 gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860 agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920 gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980 ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040 ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100 caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160 ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220 taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280 ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400 cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460 taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520 ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580 ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640 ctccttttta tttgggggag agggaagtca tgaaaaaact aacctttgaa attcgatctc 5700 cagcacatca gcaaaacgct attcacgcag tacagcaaat ccttccagac ccaaccaaac 5760 caatcgtagt aaccattcag gaacgcaacc gcagcttaga ccaaaacagg aagctatggg 5820 cctgcttagg tgacgtctct cgtcaggttg aatggcatgg tcgctggctg gatgcagaaa 5880 gctggaagtg tgtgtttacc gcagcattaa agcagcagga tgttgttcct aaccttgccg 5940 ggaatggctt tgtggtaata ggccagtcaa ccagcaggat gcgtgtaggc gaatttgcgg 6000 agctattaga gcttatacag gcattcggta cagagcgtgg cgttaagtgg tcagacgaag 6060 cgagactggc tctggagtgg aaagcgagat ggggagacag ggctgcatga taaatgtcgt 6120 tagtttctcc ggtggcagga cgtcagcata tttgctctgg ctaatggagc aaaagcgacg 6180 ggcaggtaaa gacgtgcatt acgttttcat ggatacaggt tgtgaacatc caatgacata 6240 tcggtttgtc agggaagttg tgaagttctg ggatataccg ctcaccgtat tgcaggttga 6300 tatcaacccg gagcttggac agccaaatgg ttatacggta tgggaaccaa aggatattca 6360 gacgcgaatg cctgttctga agccatttat cgatatggta aagaaatatg gcactccata 6420 cgtcggcggc gcgttctgca ctgacagatt aaaactcgtt cccttcacca aatactgtga 6480 tgaccatttc gggcgaggga attacaccac gtggattggc atcagagctg atgaaccgaa 6540 gcggctaaag ccaaagcctg gaatcagata tcttgctgaa ctgtcagact ttgagaagga 6600 agatatcctc gcatggtgga agcaacaacc attcgatttg caaataccgg aacatctcgg 6660 taactgcata ttctgcatta aaaaatcaac gcaaaaaatc ggacttgcct gcaaagatga 6720 ggagggattg cagcgtgttt ttaatgaggt catcacggga tcccatgtgc gtgacggaca 6780 tcgggaaacg ccaaaggaga ttatgtaccg aggaagaatg tcgctggacg gtatcgcgaa 6840 aatgtattca gaaaatgatt atcaagccct gtatcaggac atggtacgag ctaaaagatt 6900 cgataccggc tcttgttctg agtcatgcga aatatttgga gggcagcttg atttcgactt 6960 cgggagggaa gctgcatgat gcgatgttat cggtgcggtg aatgcaaaga agataaccgc 7020 ttccgaccaa atcaacctta ctggaatcga tggtgtctcc ggtgtgaaag aacaccaaca 7080 ggggtgttac cactaccgca ggaaaaggag gacgtgtggc gagacagcga cgaagtatca 7140 ccgacataat ctgcgaaaac tgcaaatacc ttccaacgaa acgcaccaga aataaaccca 7200 agccaatccc aaaagaatct gacgtaaaaa ccttcaacta cacggctcac ctgtgggata 7260 tccggtggct aagacgtcgt gcgaggaaaa caaggtgatt gaccaaaatc gaagttacga 7320 acaagaaagc gtcgagcgag ctttaacgtg cgctaactgc ggtcagaagc tgcatgtgct 7380 ggaagttcac gtgtgtgagc actgctgcgc agaactgatg agcgatccga atagctcgat 7440 gcacgaggaa gaagatgatg gctaaaccag cgcgaagacg atgtaaaaac gatgaatgcc 7500 gggaatggtt tcaccctgca ttcgctaatc agtggtggtg ctctccagag tgtggaacca 7560 agatagcact cgaacgacga agtaaagaac gcgaaaaagc ggaaaaagca gcagagaaga 7620 aacgacgacg agaggagcag aaacagaaag ataaacttaa gattcgaaaa ctcgccttaa 7680 agccccgcag ttactggatt aaacaagccc aacaagccgt aaacgccttc atcagagaaa 7740 gagaccgcga cttaccatgt atctcgtgcg gaacgctcac gtctgctcag tgggatgccg 7800 gacattaccg gacaactgct gcggcacctc aactccgatt taatgaacgc aatattcaca 7860 agcaatgcgt ggtgtgcaac cagcacaaaa gcggaaatct cgttccgtat cgcgtcgaac 7920 tgattagccg catcgggcag gaagcagtag acgaaatcga atcaaaccat aaccgccatc 7980 gctggactat cgaagagtgc aaggcgatca aggcagagta ccaacagaaa ctcaaagacc 8040 tgcgaaatag cagaagtgag gccgcatgac gttctcagta aaaaccattc cagacatgct 8100 cgttgaagca tacggaaatc agacagaagt agcacgcaga ctgaaatgta gtcgcggtac 8160 ggtcagaaaa tacgttgatg ataaagacgg gaaaatgcac gccatcgtca acgacgttct 8220 catggttcat cgcggatgga gtgaaagaga tgcgctatta cgaaaaaatt gatggcagca 8280 aataccgaaa tatttgggta gttggcgatc tgcacggatg ctacacgaac ctgatgaaca 8340 aactggatac gattggattc gacaacaaaa aagacctgct tatctcggtg ggcgatttgg 8400 ttgatcgtgg tgcagagaac gttgaatgcc tggaattaat cacattcccc tggttcagag 8460 ctgtacgtgg aaaccatgag caaatgatga ttgatggctt atcagagcgt ggaaacgtta 8520 atcactggct gcttaatggc ggtggctggt tctttaatct cgattacgac aaagaaattc 8580 tggctaaagc tcttgcccat aaagcagatg aacttccgtt aatcatcgaa ctggtgagca 8640 aagataaaaa atatgttatc tgccacgccg attatccctt tgacgaatac gagtttggaa 8700 agccagttga tcatcagcag gtaatctgga accgcgaacg aatcagcaac tcacaaaacg 8760 ggatcgtgaa agaaatcaaa ggcgcggaca cgttcatctt tggtcatacg ccagcagtga 8820 aaccactcaa gtttgccaac caaatgtata tcgataccgg cgcagtgttc tgcggaaacc 8880 taacattgat tcaggtacag ggagaaggcg catgagactc gaaagcgtag ctaaatttca 8940 ttcgccaaaa agcccgatga tgagcgactc accacgggcc acggcttctg actctctttc 9000 cggtactgat gtgatggctg ctatggggat ggcgcaatca caagccggat tcggtatggc 9060 tgcattctgc ggtaagcacg aactcagcca gaacgacaaa caaaaggcta tcaactatct 9120 gatgcaattt gcacacaagg tatcggggaa ataccgtggt gtggcaaagc ttgaaggaaa 9180 tactaaggca aaggtactgc aagtgctcgc aacattcgct tatgcggatt attgccgtag 9240 tgccgcgacg ccgggggcaa gatgcagaga ttgccatggt acaggccgtg cggttgatat 9300 tgccaaaaca gagctgtggg ggagagttgt cgagaaagag tgcggaagat gcaaaggcgt 9360 cggctattca aggatgccag caagcgcagc atatcgcgct gtgacgatgc taatcccaaa 9420 ccttacccaa cccacctggt cacgcactgt taagccgctg tatgacgctc tggtggtgca 9480 atgccacaaa gaagagtcaa tcgcagacaa cattttgaat gcggtcacac gttagcagca 9540 tgattgccac ggatggcaac atattaacgg catgatattg acttattgaa taaaattggg 9600 taaatttgac tcaacgatgg gttaattcgc tcgttgtggt agtgagatga aaagaggcgg 9660 cgcttactac cgattccgcc tagttggtca cttcgacgta tcgtctggaa ctccaaccat 9720 cgcaggcaga gaggtctgca aaatgcaatc ccgaaacagt tcgcaggtaa tagttagagc 9780 ctgcataacg gtttcgggat tttttatatc tgcacaacag gtaagagcat tgagtcgata 9840 atcgtgaaga gtcggcgagc ctggttagcc agtgctcttt ccgttgtgct gaattaagcg 9900 aataccggaa gcagaaccgg atcaccaaat gcgtacaggc gtcatcgccg cccagcaaca 9960 gcacaaccca aactgagccg tagccactgt ctgtcctgaa ttcattagta atagttacgc 10020 tgcggccttt tacacatgac cttcgtgaaa gcgggtggca ggaggtcgcg ctaacaacct 10080 cctgccgttt tgcccgtgca tatcggtcac gaacaaatct gattactaaa cacagtagcc 10140 tggatttgtt ctatcagtaa tcgaccttat tcctaattaa atagagcaaa tccccttatt 10200 gggggtaaga catgaagatg ccagaaaaac atgacctgtt ggccgccatt ctcgcggcaa 10260 aggaacaagg catcggggca atccttgcgt ttgcaatggc gtaccttcgc ggcagatata 10320 atggcggtgc gtttacaaaa acagtaatcg acgcaacgat gtgcgccatt atcgcctggt 10380 tcattcgtga ccttctcgac ttcgccggac taagtagcaa tctcgcttat ataacgagcg 10440 tgtttatcgg ctacatcggt actgactcga ttggttcgct tatcaaacgc ttcgctgcta 10500 aaaaagccgg agtagaagat ggtagaaatc aataatcaac gtaaggcgtt cctcgatatg 10560 ctggcgtggt cggagggaac tgataacgga cgtcagaaaa ccagaaatca tggttatgac 10620 gtcattgtag gcggagagct atttactgat tactccgatc accctcgcaa acttgtcacg 10680 ctaaacccaa aactcaaatc aacaggcgca gcttttagaa aaactcatcg agcatcaaat 10740 gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 10800 gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 10860 ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 10920 ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 10980 tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 11040 tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 11100 cgctgttaaa aggacaatta caaacaggaa tcgagtgcaa ccggcgcagg aacactgcca 11160 gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aacgctgttt 11220 ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 11280 tggtcggaag tggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 11340 cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 11400 acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 11460 ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 11520 tcatattctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 11580 gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt acaaccaatt 11640 aaccaattct gaacattatc gcgagcccat ttatacctga atatggctca taacacccct 11700 tgtttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 11760 aaacgccgta gcgccgatgg tagtgtgggg actccccatg cgagagtagg gaactgccag 11820 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgcccgg gctaattagg 11880 gggtgtcgcc cttattcgac tctataggga agttcctatt ctctagaaag tataggaact 11940 tctgaagggg ggtcgatcga cttaattaag g 11971 <210> 28 <211> 6900 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(130) <223> 5' ITR <220> <221> misc_feature <222> (241)..(544) <223> CMV enhancer <220> <221> misc_feature <222> (546)..(823) <223> chicken beta actin promoter <220> <221> misc_feature <222> (824)..(1795) <223> CBA exon 1 and intron <220> <221> misc_feature <222> (1859)..(1864) <223> kozak <220> <221> misc_feature <222> (1865)..(3826) <223> human codon optimized CHM (REP-1) <220> <221> misc_feature <222> (3847)..(4054) <223> bGH poly(A) signal <220> <221> misc_feature <222> (4104)..(4233) <223> 3' ITR <400> 28 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020 cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080 gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140 gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200 tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260 gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320 gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380 gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440 ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500 gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560 tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620 ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680 ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740 cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800 caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860 caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920 tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980 gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040 gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100 cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160 ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220 gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280 gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340 gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400 gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460 tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520 gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580 cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640 catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700 cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760 gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820 tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880 ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940 gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000 ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060 tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120 tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180 cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240 tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300 ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360 catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420 cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480 acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540 tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600 ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660 ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720 cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780 caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840 cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020 aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080 tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200 ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260 agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320 cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380 tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440 ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500 cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560 ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620 caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680 aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740 aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800 gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860 agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920 gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980 ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040 ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100 caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160 ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220 taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280 ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400 cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460 taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520 ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580 ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640 cttttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 5700 aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 5760 ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 5820 acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 5880 gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 5940 ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6000 ttgcgcctga gcgaggcgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 6060 cgagtgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 6120 atattcttct aatacctgga acgctgtttt tccggggatc gcagtggtga gtaaccatgc 6180 atcatcagga gtacggataa aatgcttgat ggtcggaagt ggcataaatt ccgtcagcca 6240 gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 6300 aaacaactct ggcgcatcgg gcttcccata caagcgatag attgtcgcac ctgattgccc 6360 gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 6420 cggcctcgac gtttcccgtt gaatatggct catattcttc ctttttcaat attattgaag 6480 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 6540 acaaataggg gtcagtgtta caaccaatta accaattctg aacattatcg cgagcccatt 6600 tatacctgaa tatggctcat aacacccctt gtttgcctgg cggcagtagc gcggtggtcc 6660 cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt agtgtgggga 6720 ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc tcagtcgaaa 6780 gactgggcct ttcgcccggg ctaattaggg ggtgtcgccc ttattcgact ctatagggaa 6840 gttcctattc tctagaaagt ataggaactt ctgaaggggg gtcgatcgac ttaattaagg 6900 <210> 29 <211> 12074 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 29 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960 cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020 cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080 gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140 gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200 tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260 gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320 gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380 gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440 ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500 gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560 tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620 ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680 ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740 cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800 caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860 atggcggata ctctcccttc ggagtttgat gtgatcgtaa tagggacggg tttgcctgaa 1920 tccatcattg cagctgcatg ttcaagaagt ggccggagag ttctgcatgt tgattcaaga 1980 agctactatg gaggaaactg ggccagtttt agcttttcag gactattgtc ctggctaaag 2040 gaataccagg aaaacagtga cattgtaagt gacagtccag tgtggcaaga ccagatcctt 2100 gaaaatgaag aagccattgc tcttagcagg aaggacaaaa ctattcaaca tgtggaagta 2160 ttttgttatg ccagtcagga tttgcatgaa gatgtcgaag aagctggtgc actgcagaaa 2220 aatcatgctc ttgtgacatc tgcaaactcc acagaagctg cagattctgc cttcctgcct 2280 acggaggatg agtcattaag cactatgagc tgtgaaatgc tcacagaaca aactccaagc 2340 agcgatccag agaatgcgct agaagtaaat ggtgctgaag tgacagggga aaaagaaaac 2400 cattgtgatg ataaaacttg tgtgccatca acttcagcag aagacatgag tgaaaatgtg 2460 cctatagcag aagataccac agagcaacca aagaaaaaca gaattactta ctcacaaatt 2520 attaaagaag gcaggagatt taatattgat ttagtatcaa agctgctgta ttctcgagga 2580 ttactaattg atcttctaat caaatctaat gttagtcgat atgcagagtt taaaaatatt 2640 accaggattc ttgcatttcg agaaggacga gtggaacagg ttccgtgttc cagagcagat 2700 gtctttaata gcaaacaact tactatggta gaaaagcgaa tgctaatgaa atttcttaca 2760 ttttgtatgg aatatgagaa atatcctgat gaatataaag gatatgaaga gatcacattt 2820 tatgaatatt taaagactca aaaattaacc cccaacctcc aatatattgt catgcattca 2880 attgcaatga catcagagac agccagcagc accatagatg gtctcaaagc taccaaaaac 2940 tttcttcact gtcttgggcg gtatggcaac actccatttt tgtttccttt atatggccaa 3000 ggagaactcc cccagtgttt ctgcaggatg tgtgctgtgt ttggtggaat ttattgtctt 3060 cgccattcag tacagtgcct tgtagtggac aaagaatcca gaaaatgtaa agcaattata 3120 gatcagtttg gtcagagaat aatctctgag catttcctcg tggaggacag ttactttcct 3180 gagaacatgt gctcacgtgt gcaatacagg cagatctcca gggcagtgct gattacagat 3240 agatctgtcc taaaaacaga ttcagatcaa cagatttcca ttttgacagt gccagcagag 3300 gaaccaggaa cttttgctgt tcgggtcatt gagttatgtt cttcaacgat gacatgcatg 3360 aaaggcacct atttggttca tttgacttgc acatcttcta aaacagcaag agaagattta 3420 gaatcagttg tgcagaaatt gtttgttcca tatactgaaa tggagataga aaatgaacaa 3480 gtagaaaagc caagaattct gtgggctctt tacttcaata tgagagattc gtcagacatc 3540 agcaggagct gttataatga tttaccatcc aacgtttatg tctgctctgg cccagattgt 3600 ggtttaggaa atgataatgc agtcaaacag gctgaaacac ttttccagga aatctgcccc 3660 aatgaagatt tctgtccccc tccaccaaat cctgaagaca ttatccttga tggagacagt 3720 ttacagccag aggcttcaga atccagtgcc ataccagagg ctaactcgga gactttcaag 3780 gaaagcacaa accttggaaa cctagaggag tcctctgaat aaggatctgc ctcgactgtg 3840 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 3900 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 3960 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 4020 gacaatagca ggcatgctgg ggactcgagt tctacgtaga taagtagcat ggcgggttaa 4080 tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4140 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4200 cagtgagcga gcgagcgcgc agccttaatt aacctaagga aaatgaagtg aagttcctat 4260 actttctaga gaataggaac ttctatagtg agtcgaataa gggcgacaca aaatttattc 4320 taaatgcata ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt 4380 gacatgtata attttgatat caaaaactga ttttcccttt attattttcg agatttattt 4440 tcttaattct ctttaacaaa ctagaaatat tgtatataca aaaaatcata aataatagat 4500 gaatagttta attataggtg ttcatcaatc gaaaaagcaa cgtatcttat ttaaagtgcg 4560 ttgctttttt ctcatttata aggttaaata attctcatat atcaagcaaa gtgacaggcg 4620 cccttaaata ttctgacaaa tgctctttcc ctaaactccc cccataaaaa aacccgccga 4680 agcgggtttt tacgttattt gcggattaac gattactcgt tatcagaacc gcccaggggg 4740 cccgagctta acctttttat ttgggggaga gggaagtcat gaaaaaacta acctttgaaa 4800 ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc cttccagacc 4860 caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac caaaacagga 4920 agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt cgctggctgg 4980 atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat gttgttccta 5040 accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg cgtgtaggcg 5100 aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc gttaagtggt 5160 cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg gctgcatgat 5220 aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc taatggagca 5280 aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt gtgaacatcc 5340 aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc tcaccgtatt 5400 gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat gggaaccaaa 5460 ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa agaaatatgg 5520 cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc ccttcaccaa 5580 atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca tcagagctga 5640 tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac tgtcagactt 5700 tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc aaataccgga 5760 acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg gacttgcctg 5820 caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat cccatgtgcg 5880 tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt cgctggacgg 5940 tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca tggtacgagc 6000 taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag ggcagcttga 6060 tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga atgcaaagaa 6120 gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg gtgtgaaaga 6180 acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg agacagcgac 6240 gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa cgcaccagaa 6300 ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac acggctcacc 6360 tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg accaaaatcg 6420 aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg gtcagaagct 6480 gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga gcgatccgaa 6540 tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga tgtaaaaacg 6600 atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc tctccagagt 6660 gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg gaaaaagcag 6720 cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag attcgaaaac 6780 tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta aacgccttca 6840 tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg tctgctcagt 6900 gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt aatgaacgca 6960 atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc gttccgtatc 7020 gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa tcaaaccata 7080 accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac caacagaaac 7140 tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa aaaccattcc 7200 agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac tgaaatgtag 7260 tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg ccatcgtcaa 7320 cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac gaaaaaattg 7380 atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc tacacgaacc 7440 tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt atctcggtgg 7500 gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc acattcccct 7560 ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta tcagagcgtg 7620 gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc gattacgaca 7680 aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta atcatcgaac 7740 tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt gacgaatacg 7800 agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga atcagcaact 7860 cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt ggtcatacgc 7920 cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc gcagtgttct 7980 gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg aaagcgtagc 8040 taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca cggcttctga 8100 ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac aagccggatt 8160 cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac aaaaggctat 8220 caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg tggcaaagct 8280 tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt atgcggatta 8340 ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta caggccgtgc 8400 ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt gcggaagatg 8460 caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg tgacgatgct 8520 aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt atgacgctct 8580 ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg cggtcacacg 8640 ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga cttattgaat 8700 aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta gtgagatgaa 8760 aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat cgtctggaac 8820 tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt cgcaggtaat 8880 agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg taagagcatt 8940 gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc cgttgtgctg 9000 aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg tcatcgccgc 9060 ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat tcattagtaa 9120 tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag gaggtcgcgc 9180 taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg attactaaac 9240 acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa tagagcaaat 9300 ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg gccgccattc 9360 tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg taccttcgcg 9420 gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg tgcgccatta 9480 tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat ctcgcttata 9540 taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt atcaaacgct 9600 tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg taaggcgttc 9660 ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac cagaaatcat 9720 ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca ccctcgcaaa 9780 cttgtcacgc taaacccaaa actcaaatca acaggcgctt aagactggcc gtcgttttac 9840 aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt 9900 ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc 9960 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 10020 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 10080 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 10140 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 10200 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 10260 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 10320 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 10380 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 10440 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 10500 ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt 10560 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10620 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10680 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10740 aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 10800 agtcagcgta atgctctgct tttagaaaaa ctcatcgagc atcaaatgaa actgcaattt 10860 attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga 10920 aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac 10980 tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga 11040 gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagtttat gcatttcttt 11100 ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa 11160 accgttattc attcgtgatt gcgcctgagc gaggcgaaat acgcgatcgc tgttaaaagg 11220 acaattacaa acaggaatcg agtgcaaccg gcgcaggaac actgccagcg catcaacaat 11280 attttcacct gaatcaggat attcttctaa tacctggaac gctgtttttc cggggatcgc 11340 agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagtgg 11400 cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct 11460 acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca agcgatagat 11520 tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc 11580 catgttggaa tttaatcgcg gcctcgacgt ttcccgttga atatggctca tattcttcct 11640 ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 11700 atgtatttag aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa 11760 cattatcgcg agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg 11820 gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg 11880 ccgatggtag tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa 11940 cgaaaggctc agtcgaaaga ctgggccttt cgcccgggct aattaggggg tgtcgccctt 12000 attcgactct atagtgaagt tcctattctc tagaaagtat aggaacttct gaagtggggt 12060 cgacttaatt aagg 12074

Claims

Rab 에스코트 단백질-1 (REP-1)을 암호화하는 코돈 최적화된 cDNA 서열.
제 1 항의 cDNA 서열을 포함하는 발현 카세트.
제 2 항에 있어서, SEQ ID NO: 1을 포함하는 것을 특징으로 하는 발현 카세트.
아데노-관련 바이러스 (AAV) 벡터로서, AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 Rab 에스코트 단백질-1 (REP-1)을 암호화하는 핵산 서열, 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함하는 바이러스 벡터.
제 4 항에 있어서, REP-1 서열은 전체 길이 REP-1 단백질을 암호화하는 것을 특징으로 하는 바이러스 벡터.
제 4 항 또는 제 5 항에 있어서, REP-1 서열은 SEQ ID NO: 2의 단백질 서열을 암호화하는 것을 특징으로 하는 바이러스 벡터.
제 4 항 내지 제 6 항 중 어느 한 항에 있어서, REP-1 서열은 SEQ ID NO: 3의 핵산 서열 또는 그것의 변종을 포함하는 것을 특징으로 하는 바이러스 벡터.
제 7 항에 있어서, 변종은 인간에서의 발현을 위해 최적화된, SEQ ID NO: 3의 코돈 최적화된 변종인 것을 특징으로 하는 바이러스 벡터.
제 8 항에 있어서, 코돈 최적화된 변종은 SEQ ID NO: 1인 것을 특징으로 하는 바이러스 벡터.
고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 cDNA 서열.
제10 항의 cDNA 서열을 포함하는 발현 카세트.
제 11 항에 있어서, SEQ ID NO: 9 또는 11을 포함하는 것을 특징으로 하는 발현 카세트.
아데노-관련 바이러스 (AAV) 벡터로서, AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함하는 바이러스 벡터.
제 13 항에 있어서, CNGA3 서열은 전체 길이 단백질을 암호화하는 것을 특징으로 하는 바이러스 벡터.
제 13 항 또는 제 14 항에 있어서, CNGA3 서열은 SEQ ID NO: 10의 단백질 서열을 암호화하는 것을 특징으로 하는 바이러스 벡터.
제 13 항 내지 제 15항 중 어느 한 항에 있어서, CNGA3 서열은 SEQ ID NO: 13의 핵산 서열, 또는 그것의 변종을 포함하는 것을 특징으로 하는 바이러스 벡터.
제 16 항에 있어서, 변종은 인간에서의 발현을 위해 최적화된, SEQ ID NO: 13의 코돈 최적화된 변종인 것을 특징으로 하는 바이러스 벡터.
제 17 항에 있어서, 코돈 최적화된 변종은 SEQ ID NO: 9 또는 SEQ ID NO: 11인 것을 특징으로 하는 바이러스 벡터.
제 4 항 내지 제 9 항 또는 제 13 항 내지 제 18 항 중 어느 한 항에 있어서, 발현 제어 서열은 프로모터를 포함하는 것을 특징으로 하는 바이러스 벡터.
제 19 항에 있어서, 프로모터는 로돕신 프로모터인 것을 특징으로 하는 바이러스 벡터.
제 19 항에 있어서, 프로모터는 로돕신 키나아제 프로모터인 것을 특징으로 하는 바이러스 벡터.
제 19 항에 있어서, 프로모터는 눈 세포-특이적 프로모터인 것을 특징으로 하는 바이러스 벡터.
제 19 항에 있어서, 프로모터는 인간 EF1α 프로모터, 대사자극성 글루타메이트 수용체 6 (mGluR6) 프로모터, 로돕신 프로모터, 추상체 옵신 프로모터, 및 전사 인자 프로모터 (신경 망막 류신 지퍼 (Nrl) 및 광수용체-특이적 핵 수용체 Nr2e3, bZIP)로부터 선택되는 것을 특징으로 하는 바이러스 벡터.
제 19 항에 있어서, 프로모터는 유도성 프로모터, 구성성 프로모터 또는 조직 특이적 프로모터인 것을 특징으로 하는 AAV.
제 24 항에 있어서, 프로모터는 라파마이신/라파로그 프로모터, 엑디손 프로모터, 에스트로겐-반응성 프로모터, 및 테트라사이클린-반응성 프로모터, 또는 헤테로다이머 억제자 스위치로부터 선택된 유도성 프로모터인 것을 특징으로 하는 AAV.
제4 항 내지 제 9 항 또는 제 13 항 내지 제 25 항 중 어느 한 항에 있어서, 인트론, Kozak 서열, 폴리 A, 및 전사 후 조절 요소들 중 하나 이상을 추가로 포함하는 것을 특징으로 하는 바이러스 벡터.
제4 항 내지 제 9 항 또는 제 13 항 내지 제 26 항 중 어느 한 항에 있어서, 벡터는 AAV2, AAV5, AAV8, AAV9, AAV8bp, AAV7m8 및 그것들의 변종으로부터 선택된 캡시드를 가지는 rAAV인 것을 특징으로 하는 바이러스 벡터.
제4 항 내지 제 9 항 또는 제 13 항 내지 제 27 항 중 어느 한 항에 있어서, ITR 서열은 캡시드 단백질을 공급하는 것과는 상이한 AAV로부터 유래되는 것을 특징으로 하는 바이러스 벡터.
제4 항 내지 제 9 항 또는 제 13 항 내지 제 28 항 중 어느 한 항에 있어서, ITR 서열은 AAV2로부터 유래되는 것을 특징으로 하는 바이러스 벡터.
아데노-관련 바이러스 (AAV) 벡터로서, AAV8 캡시드 및 재조합 (rAAV) 게놈을 포함하고, 상기 rAAV 게놈은 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함하는 아데노-관련 바이러스 (AAV) 벡터.
아데노-관련 바이러스 (AAV) 벡터로서, AAV8 캡시드 및 발현 카세트를 포함하고, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함하는 아데노-관련 바이러스 (AAV) 벡터.
제약학적으로 허용되는 담체 및 제4 항 내지 제 9 항 또는 제 13 항 내지 제 31 항 중 어느 한 항에 따르는 적어도 하나의 바이러스 벡터를 포함하는 제약학적 조성물.
제 32 항의 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하는, 범맥락막 위축의 치료 방법.
제 32 항의 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하는, 색맹의 치료 방법.
제 33 항 또는 제 34 항에 있어서, 상기 조성물은 망막밑으로 투여되는 것을 특징으로 하는 방법.
제 33 항 또는 제 34 항에 있어서, 상기 조성물은 유리체강내로, 정맥내로 또는 맥락막에 투여되는 것을 특징으로 하는 방법.
제 33 항 내지 제 36 항 중 어느 한 항에 있어서, 상기 대상체는 포유류인 것을 특징으로 하는 방법.
제 37 항에 있어서, 상기 대상체는 인간인 것을 특징으로 하는 방법.
제 33 항 내지 제 38 항 중 어느 한 항에 있어서, 상기 조성물은 다른 치료법과 조합되어 투여되는 것을 특징으로 하는 방법.
제 33 항 내지 제 39 항 중 어느 한 항에 있어서, 상기 조성물은 약 10⁹ 내지 약 10¹³ 벡터 게놈 (VG)의 투여량으로 투여되는 것을 특징으로 하는 방법.
제 33 항 내지 제 40 항 중 어느 한 항에 있어서, 상기 조성물은 약 100 μL 내지 약 500 μL의 부피로 투여되는 것을 특징으로 하는 방법.
제 33 항 내지 제 41 항 중 어느 한 항에 있어서, 상기 조성물은 1회를 초과하여 투여되는 것을 특징으로 하는 방법.
AAV 벡터를 제조하기 위한 플라스미드로서, SEQ ID NO: 1 또는 SEQ ID NO: 9 또는 SEQ ID NO: 25, 또는 SEQ ID NO: 26, 또는 SEQ ID NO: 27 또는 SEQ ID NO: 28, 또는 그것들과 적어도 80%의 동일성을 공유하는 서열을 포함하는 플라스미드.
rAAV 바이러스의 생성 방법으로서, 유전자 발현 카세트 바이러스 게놈의 감염성 AAV 엔벨로프 또는 캡시드 안으로의 포장을 허용하기에 충분한 바이러스 서열의 존재하에 제 43 항의 플라스미드를 지닌 포장 세포를 배양하는 단계를 포함하는 방법.
제 44 항의 방법에 따라 제조된 재조합 AAV.
SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27 또는 SEQ ID NO:28의 nt 1 내지 4233을 포함하는 벡터 게놈을 포함하는 바이러스 벡터.
5' ITR, CMV 인핸서, 닭 베타-액틴 프로모터, CBA 엑손 1 및 인트론, Kozak 서열, 코돈 최적화된 CHM, bGH 폴리 A 및 3' ITR을 포함하는 벡터 게놈을 포함하는 바이러스 벡터.
제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터를 포함하는, 범맥락막 위축의 치료 방법에 사용하기 위한 조성물.
제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터를 포함하는, 색맹의 치료 방법에 사용하기 위한 조성물.
제 48 항 또는 제 49 항에 있어서, 상기 조성물은 망막밑으로 투여되는 것을 특징으로 하는 조성물.
제 48 항 또는 제 49 항에 있어서, 상기 조성물은 유리체강내로, 정맥내로 또는 맥락막에 투여되는 것을 특징으로 하는 조성물.
제 48 항 내지 제 51 항 중 어느 한 항에 있어서, 상기 대상체는 포유류인 것을 특징으로 하는 조성물.
제 52 항에 있어서, 상기 대상체는 인간인 것을 특징으로 하는 조성물.
제 48 항 내지 제 53 항 중 어느 한 항에 있어서, 상기 조성물은 다른 치료법과 조합되어 투여되는 것을 특징으로 하는 조성물.
제 48 항 내지 제 54 항 중 어느 한 항에 있어서, 상기 조성물은 약 10⁹ 내지 약 10¹³ 벡터 게놈 (VG)의 투여량으로 투여되는 것을 특징으로 하는 조성물.
제 48 항 내지 제 55 항 중 어느 한 항에 있어서, 상기 조성물은 약 100 μL 내지 약 500 μL의 부피로 투여되는 것을 특징으로 하는 조성물.
제 48 항 내지 제 56 항 중 어느 한 항에 있어서, 상기 조성물은 1회를 초과하여 투여되는 것을 특징으로 하는 조성물.
범맥락막 위축의 치료를 위한 의약의 제조에서, 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터의 사용.
색맹의 치료를 위한 의약의 제조에서, 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터의 사용.