KR20210104661A - 인테인 단백질 및 이의 용도 - Google Patents

인테인 단백질 및 이의 용도 Download PDF

Info

Publication number
KR20210104661A
KR20210104661A KR1020217014221A KR20217014221A KR20210104661A KR 20210104661 A KR20210104661 A KR 20210104661A KR 1020217014221 A KR1020217014221 A KR 1020217014221A KR 20217014221 A KR20217014221 A KR 20217014221A KR 20210104661 A KR20210104661 A KR 20210104661A
Authority
KR
South Korea
Prior art keywords
leu
intein
glu
lys
ser
Prior art date
Application number
KR1020217014221A
Other languages
English (en)
Inventor
알베르토 아우리치오
이바나 트라파니
파트리치아 토나베네
Original Assignee
폰다지오네 텔레톤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 폰다지오네 텔레톤 filed Critical 폰다지오네 텔레톤
Publication of KR20210104661A publication Critical patent/KR20210104661A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Ophthalmology & Optometry (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Epidemiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 발명은 특히 5Kb보다 큰 유전자의 효과적인 유전자 요법을 허용하는 작제물, 벡터, 상대적 숙주 세포 및 약학적 조성물에 관한 것이다.

Description

인테인 단백질 및 이의 용도
본 발명은 특히 5 kb보다 큰 코딩 서열(CDS)을 갖는 유전자의 돌연변이로 인한 질병에 대해 효과적인 유전자 요법을 허용하는 작제물, 벡터, 상대적 숙주 세포 및 약학적 조성물에 관한 것이다.
아데노 관련 바이러스(AAV) 벡터를 사용한 유전자 요법은 인간에게 안전하고 효과적이다. AAV 기반 유전자 요법 제품은 최근 몇 년간 미국 및 유럽 둘 모두에서 유전적 대사 및 실명 질병에 대해 승인된 한편, 안과학에서 혈액학, 근골격 및 대사 장애에 이르는 다양한 치료 분야의 질병에 대한 AAV 기반 유전자 요법 접근법에 대한 임상 시험이 계속 증가하고 있다.
그러나, AAV 벡터 화물 용량의 한계는 5 kb보다 큰 코딩 서열(CDS)을 가진 유전자(본원에서 큰 유전자로도 언급됨)의 돌연변이로 인한 질병에 대한 AAV 기반 요법의 개발을 방해한다.
큰 유전자의 돌연변이로 인한 유전 질병(하기 표 1에 나열됨)은 특히 DMD 유전자의 돌연변이로 인한 뒤시엔느 근육 디스트로피, CFTR 유전자의 돌연변이로 인한 낭성섬유증, F8 유전자의 돌연변이로 인한 혈우병 A, DYSF 유전자의 돌연변이로 인한 디스펄린병증(dysferlinopathy), PKD 유전자의 돌연변이로 인한 다낭신장병, ATP7B 유전자의 돌연변이로 인한 윌슨병, HTT 유전자의 돌연변이로 인한 헌팅턴병, NPC1 유전자의 돌연변이로 인한 니먼-픽 C형을 포함한다.
표 1: 큰 유전자의 돌연변이로 인한 유전 질병
Figure pct00001
또한, 몇 가지 유전 망막 변성(IRD)은 하기 표 2에 나열된 것처럼 큰 유전자의 돌연변이로 인한 것이다. IRD는 유럽 및 미국에서 3000명 중 약 1명에 영향을 미친다(58).
가장 빈번하고 심각한 IRD 중에는 1/2,000의 전체 세계 유병률로 가장 흔하게는 단일 유전성 질환으로 유전되고(1), 전세계적으로 실명의 주요 원인인 망막색소변성(RP), 레버 선천성 흑암시(LCA) 및 스타가르트병(STGD)이다. IRD를 유발하는 돌연변이의 대부분은 망막의 신경세포 광수용체(PR), 간상체 및/또는 추상체에서 발현되는 유전자에서 발생한다(2).
유전자 요법은 IRD 치료에 큰 가능성을 갖는다. 유전적 형태의 실명에 대한 최초의 아데노-관련 바이러스(AAV) 벡터 기반 유전자 요법 제품이 2017년 12월에 승인되었다(3). 또한, 희귀한 형태의 실명 및 일반적 형태의 실명의 유전자 요법을 위한 다수의 다른 AAV 기반 제품이 현재 임상 개발 중에 있다(4). 현재까지 AAV가 망막에 가장 효율적인 유전자 요법 비히클을 대표한다는 것은 이제 널리 확립되어 있지만(4,5), 이의 제한된 화물 용량은 트랜스진(transgene)뿐만 아니라 이의 발현에 필요한 시스 조절 요소를 포함하는 5 kb 크기를 초과하는 DNA 서열의 전달에 필요한 조건에서의 이의 사용을 방해했다(6).
5kb 크기를 초과하는 질병 유전자의 예는 하기 표 2에 요약되어 있다.
표 2: 5kb 크기를 초과하는 질병 유전자
Figure pct00002
스타가르트병(STGD; MIM#248200)은 PR 외부 분절에 위치된 모든 트랜스 망막 수송체를 인코딩하는 ABCA4 유전자(CDS: 6822 bp)의 돌연변이에 의해 유발되는 유전성 황반 변성의 가장 흔한 형태이며(7); 어셔 증후군 IB형(USH1B; MIM#276900)은 망막 내의 PR 및 RPE 둘 모두에서 발현되는 액틴 기반 모터인 색다른 MY07A를 인코딩하는 MY07A 유전자(CDS: 6648 bp)(8)의 돌연변이에 의해 유발되는 가장 심각한 형태의 RP 및 난청이다(9-11).
추상체-간상체 디스트로피 3형, 노란점안저, 연령-관련 황반 변성 2형, 조기 발병 중증 망막 디스트로피 및 색소성 망막염 19형이 또한 ABCA4 돌연변이와 관련(본원에서 ABCA4-관련 질병으로 언급됨)된다.
본 발명자 및 다른 사람들은 각각이 큰 트랜스진 발현 카세트의 코딩 서열(CDS)의 단편을 함유하는 이중(최대 9 kb)(6, 12, 13) 또는 삼중(최대 14 kb)(14) AAV 벡터를 사용하여 상기 제한이 극복될 수 있음을 제시하였다. 이중 및 삼중 AAV 벡터는 AAV 유전체의 콘카테머화(concatemerization) 및 재조합을 활용하여 다수의 AAV 벡터에 의해 공동 감염된 세포에서 전장 유전체를 재구성한다. 그러나, 대부분의 유전 망막 질병에 대한 주요 치료 표적인 광수용체에서 이중 또는 삼중 AAV 벡터로 달성된 트랜스진 발현의 효율은 단일 AAV 벡터로 달성된 것보다 낮다(6, 14, 15). 이는 적절한 DNA 콘카테머 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 통한 스플라이싱 효율을 포함하여 효율적인 형질도입에 필요한 다양한 제한 단계로 인한 것일 수 있다.
본 발명자는 W02014/170480호 및 문헌[Colella et al (15)]에서 스플라이싱(트랜스-스플라이싱), 상동성 재조합(중복) 또는 둘의 조합(하이브리드)에 의해 큰 유전자를 재구성하는 이중 AAV 벡터, 이중 트랜스 스플라이싱 및 하이브리브 벡터가 유전 망막 변성의 치료에 특히 효율적이라는 발견을 제시하였다. 또한, 문헌[Maddalena et al. (14)]은 최대 14 kb의 유전자에 대한 삼중 AAV 벡터 접근법을 입증하였다. 그러나, 이중 또는 삼중 AAV 벡터로 달성된 트랜스진 발현의 효율은 단일 AAV 벡터로 달성된 것보다 낮다(6, 13, 14). 이는 적절한 DNA 콘카테머 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 통한 스플라이싱 효율을 포함하여 효율적인 형질도입에 필요한 다양한 제한 단계로 인한 것일 수 있다. 또한, 삼중 AAV 벡터 전략은 치료적 접근법에 필요한 임계 값 미만의 유전자 발현 수준을 생성한다.
따라서, 효과적인 유전자 요법을 위해 큰 유전자 발현을 재구성하는 데 활용될 수 있는 작제물 및 벡터가 여전히 필요하다.
본 발명자는 이제 짧은 분할-인테인(split-intein)이 측면에 있는 리포터 또는 큰 치료 단백질의 단편 중 하나를 각각 인코딩하는 다중 AAV 벡터의 전달이 시험관 내 또는 생체 내 둘 모두에서 단백질 트랜스-스플라이싱(trans-splicing) 및 전장 단백질 재구성을 발생시키는 것을 발견하였다.
인테인은 숙주 단백질 내에서 전사되고 번역된 유전 요소이며, 이는 에너지 공급, 외인성 숙주 특이적 프로테아제 또는 보조 인자의 부재하에서 최종 단백질 생성물에서 아미노산 변형을 남기지 않고 단백질 인트론과 유사하게 자가 절제된다(16, 17, 27, 28). 인테인 활성은 효율적인 트랜스-스플라이싱이 발생하기 위해 필요한 라이게이션 접합을 둘러싸는 특정 펩티드 서열(N- 및 C-엑스테인으로 언급됨)과 함께 상황 의존적이며, 이 중 가장 중요한 것은 C-엑스테인의 첫 번째 잔기로서 티올 또는 하이드록실기(즉, Cys, Ser 또는 Thr)를 함유하는 아미노산이다(18). 분할-인테인은 2개의 숙주 단백질의 말단에서 2개의 개별 폴리펩티드로 발현되는 인테인의 서브셋이며, 이들의 트랜스-스플라이싱을 촉매하여 하나의 더 큰 폴리펩티드의 생성을 발생시킨다(19). 분할-인테인을 포함하는 인테인은 단백질 정제 및 라벨링 단계(19, 20)뿐만 아니라 널리 사용되는 CRISPR/Cas9 유전체 편집 뉴클레아제(21, 22)의 재구성을 포함하는 생명공학 적용에서 널리 사용된다.
인자 VIII 유전자를 포함하는 치료 유전자의 발현을 재구성하기 위해 인테인 기반 단백질 스플라이싱을 활용하려는 여러 시도가 이루어졌으며, 여기서 인자 VIII의 시네코시스티스 종(Synechocystis sp)(Ssp) DnaB 인테인-융합 중쇄 및 경쇄 유전자가 세포 배양 및 동물 모델에서 인자 VIII의 재구성으로 이어지는 것으로 입증되었다(23, 24). 유사하게, 고도로 기능적인 형태의 디스트로핀 유전자가 시험관 내 및 생체 내에서 발현되며, 여기서 6.3-kb 베커 디스트로핀(Becker dystrophin) 유전자는 2개의 AAV 벡터로 분할되고, 각각의 절반이 융합되어 시네코시스티스 종 PCC 6803(Ssp) DnaB 인테인 또는 로도써무스 마리누스(Rhodothermus marinus)(Rma) DnaB 인테인으로부터 획득된 분할 인테인에 융합되었다(25). 또한, 분할-인테인(즉, N. 푼크티포르메(N. punctiforme) DnaE 분할 인테인) 매개 단백질 트랜스-스플라이싱 전략은 심장 세포에 있는 2개의 개별 단편으로부터의 L-형 칼슘 채널의 큰 포어 형성 서브유닛을 재구성하는 것으로 보고되었다(26). US 6,544,786호에는 디스트로핀 미니유전자를 전달하기 위한 분할 인테인의 사용을 추가로 보고한다.
본 발명자는 큰 전장 단백질을 이들의 단편화 후 2개 또는 3개의 분할-인테인이 측면에 있는 폴리펩티드(이의 코딩 서열은 단일 AAV 벡터에 적합화됨)로 재구성하기 위해 단백질 트랜스-스플라이싱을 매개하기 위해 분할-인테인의 고유한 능력을 이용하였다.
따라서, 본 발명은 인테인 매개 트랜스-스플라이싱을 촉진하고, 기능성 단백질을 재구성하기 위해 분할 인테인에 융합된 상기 큰 단백질의 2개 이상의 단편을 표적 세포에 제공함으로써 큰 세포 단백질 재구성을 구현한다.
본 발명은 유전자, 특히 5 kb를 초과하는 코딩 영역을 갖는 유전자의 돌연변이로 인한 질병에 대한 AAV 벡터를 사용한 유전자 요법을 제공한다.
분할-인테인에 의해 매개되는 단백질 트랜스-스플라이싱이 단백질을 재구성하기 위해 단일 세포 유기체에 의해 사용된다는 발견에 기초하여, 본 발명자는 각각 짧은 분할-인테인이 측면에 있는 리포터 또는 큰 치료 단백질의 단편 중 하나를 인코딩하여 시험관 내 및 생체 내에서 단백질 트랜스-스플라이싱 및 전장 단백질 재구성을 발생시키는 다중 AAV 벡터를 작제하였다.
유리하게는, 본 발명에 의해 달성된 질병 단백질의 AAV 기반 단백질 트랜스-스플라이싱 매개 재구성은 당 분야에 공지된 큰 단백질에 대한 AAV 기반 방법보다 더 많은 양의 표적 단백질의 발현을 제공하였다. 이는 적절한 DNA 콘카테머(concatemer) 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 가로지른 스플라이싱 효율을 포함하여 이중 벡터 기반 시스템의 효율적인 형질도입에 필요한 다양한 제한 단계를 극복했기 때문일 것이다.
본 발명은 세포에서 코딩 서열을 발현시키기 위한 벡터 시스템을 제공하며, 상기 코딩 서열은 제1 부분(CDS1), 제2 부분(CDS2) 및 선택적으로 제3 부분(CDS3)으로 구성되고, 상기 벡터 시스템은,
a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터를 포함하고;
여기서, 제1 벡터 및 제2 벡터는 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 스플라이싱에 의해 생성되고;
또는
상기 벡터 시스템은,
a') - 상기 코딩 서열의 상기 제1 부분(CDS1),
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b') - 상기 코딩 서열의 상기 제2 부분(CDS2),
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열;
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 3' 말단에 위치하는, 제3 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터; 및
c') - 상기 코딩 서열의 상기 제3 부분(CDS3)
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS3의 5' 말단에 위치하는, 제4 인테인 뉴클레오티드 서열을 포함하는, 제3 벡터를 포함하고;
여기서, 제1 인테인 뉴클레오티드 서열은 제3 인테인 뉴클레오티드 서열과 상이하고, 제2 인테인 서열은 제4 인테인 뉴클레오티드 서열과 상이하며, 여기서 제1 벡터, 제2 벡터, 제3 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물은 단백질 트랜스-스플라이싱에 의해 생성된다.
바람직하게는, 벡터 시스템에서, 제1 인테인, 제2 인테인, 제3 인테인 및 제4 인테인은 분할 인테인을 인코딩하고, 바람직하게는 상기 분할 인테인은 150개 아미노산의 최대 길이를 갖고, 더욱 바람직하게는 상기 분할 인테인은 DnaE 또는 DnaB 인테인이다.
본 발명에 따르면, 인테인은 단백질 스플라이싱으로 공지된 과정에서 자신을 절제하고 나머지 부분(엑스테인(extein))과 펩티드 결합으로 연결할 수 있는 단백질의 세그먼트이다. 세그먼트는 내부 단백질 서열의 경우 "인테인", 외부 단백질 서열의 경우 "엑스테인"으로 언급되며, 업스트림 엑스테인은 "N-엑스테인"으로 언급되고, 다운스트림 엑스테인은 "C-엑스테인"으로 언급되고, 업스트림 인테인은 "N-인테인"으로 언급되고, 다운스트림 인테인은 "C-인테인"으로 언급된다.
따라서, 본 발명의 맥락에서, N-인테인은 제1 폴리펩티드의 N-말단에 위치(및 이와 융합)한 인테인 단편이고, C-인테인은 제2 폴리펩티드의 C-말단에 위치(및 이와 융합)한 인테인 단편이며, 여기서 2개의 폴리펩티드의 발현시, 2개의 인테인 단편은 단백질 트랜스 스플라이싱을 겪고 결합되어 완전한 인테인을 형성하고, 2개의 폴리펩티드가 결합되고, 여기서 2개의 폴리펩티드가 전장 단백질을 형성하는 경우, 상기 전장 단백질은 재구성된다.
본 발명에 따르면, 제1 인테인 서열은 N-인테인 서열이고, 제2 인테인 서열은 C-인테인 서열이며, 여기서 상기 N-인테인 및 상기 C-인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 예를 들어, 널리 사용되는 분할 인테인은 상이한 유기체로부터의 DnaE 유전자로부터 유래된다. 본 발명에 따르면, 관심 단백질의 코딩 서열이 2개의 부분으로 분할되는 경우, N-인테인 코딩 서열은 관심 단백질의 N-말단 부분을 코딩하는 서열과 인 프레임(in frame)으로 융합되고; C-인테인 코딩 서열은 관심 서열의 C-말단 부분을 코딩하는 서열과 인 프레임으로 융합된다. 2개의 전구체 융합 단백질의 발현시, 인테인은 자가촉매 절제를 겪고, 라이게이션된 엑스테인, 예를 들어, 관심 있는 재구성된 단백질을 형성한다.
본 발명에 따르면, 관심 단백질의 코딩 서열은 3개의 부분으로 분할될 수 있다. 따라서, 제1 인테인 서열은 N-인테인 서열이고, 제2 인테인 서열은 C-인테인 서열이며, 여기서 제1 인테인 코딩 서열은 C-말단에서 인 프레임으로 관심 단백질의 N-부분을 코딩하는 서열에 융합되고, 제2 인테인 코딩 서열은 인 프레임으로 관심 단백질의 중간 부분을 코딩하는 서열의 N-말단에 융합된다. 따라서, 상기 N-인테인 및 상기 C-인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 현재 구성 내에서, 제3 인테인은 관심 단백질의 중간 부분의 C-말단을 코딩하는 서열에 인 프레임으로 융합된 N-인테인 코딩 서열이고, 제4 인테인은 관심 단백질의 C-부분의 N-말단을 코딩하는 서열에 인 프레임으로 융합된 C-인테인 코딩 서열이다. 따라서, 상기 제3 및 제4 인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 본 발명의 범위 내에서, 상기 제1 및 제2 인테인 및 상기 제3 및 제4 인테인은 상이한 인테인 유전자로부터 유래되고, 제1 인테인은 제2 인테인에 선택적으로 결합하는 반면, 제3 인테인은 제4 인테인에 선택적으로 결합한다.
본 발명에서, 제1 벡터, 제2 벡터 및 선택적으로 제3 벡터가 세포에 삽입되는 경우, 적어도 2개의 융합 단백질 또는 3개의 융합 단백질이 형성되고, 상기 2개의 융합 단백질 또는 3개의 융합 단백질이 접촉하는 경우, 코딩 서열의 단백질 생성물이 생성된다. 접촉 단계는 C-인테인에 대한 N-인테인의 결합을 허용하는 조건하에서 수행된다.
본 발명에서, 제1 벡터, 제2 벡터 및 제3 벡터가 세포에 삽입되는 경우, 3개의 독립적인 폴리펩티드가 생성되고, 전장 단백질이 트랜스-스플라이싱을 통해 생성된다. 3개의 AAV 인테인 벡터 개발의 핵심은 상이한 인테인, 즉, DnaE 및 DnaB의 사용이었으며, 따라서 이는 교차 반응하지 않아 제1 및 제3 벡터에 의해 생성된 폴리펩티드 사이의 부적절한 트랜스-스플라이싱을 방지한다.
본 발명의 바람직한 구현예에 따르면, 세포에서 관심 유전자의 코딩 서열을 발현하기 위한 벡터 시스템은 2개의 벡터를 포함하며, 각각의 벡터는 인테인 서열이 측면에 있는 상기 코딩 서열의 일부를 포함하고, 상기 코딩 서열의 5' 말단은 N-인테인의 서열에 의해 3' 말단에 측면에 있고, 관심 유전자의 코딩 서열의 3' 말단은 C-인테인의 서열에 의해 측면에 있어, 둘 모두의 벡터가 세포에서 발현되는 경우, 2개의 융합 단백질이 생성되고, 자발적인 트랜스-스플라이싱 반응의 결과로서 관심 전장 단백질이 생성된다.
본 발명의 추가의 바람직한 구현예에 따르면, 세포에서 관심 유전자의 코딩 서열을 발현하기 위한 벡터 시스템은 3개의 벡터를 포함하며, 각각의 벡터는 인테인 서열이 측면에 있는 상기 코딩 서열의 일부를 포함하고, 상기 코딩 서열은 상기 코딩 서열의 5' 말단이 제1 N-인테인의 서열에 의해 3' 말단에 측면에 있도록 3개의 부분으로 나뉘고; 상기 코딩 서열의 중간 부분은 제1 C-인테인에 의해 5' 말단에 그리고 제2 N-인테인에 의해 3' 말단에 측면에 존재하고; 상기 코딩 서열의 3' 부분은 제2 C-인테인에 의해 5' 말단에 측면에 있어, 3개 모두의 벡터가 세포에서 발현되는 경우, 3개의 융합 단백질이 생성되고, 관심 전장 단백질이 자발적 트랜스-스플라이싱 반응의 결과로서 생성되며, 여기서 제1 N-인테인은 제1 C-인테인과 반응하고, 제2 N-인테인은 제2 C-인테인과 반응한다.
본 발명의 분할 인테인은 하나의 유전자에 의해 인코딩될 수 있으며, 이는 이후 2개의 개별 인테인 단편, 예를 들어, 분할 인테인을 인코딩하도록 조작되고; 대안적으로, 천연 발생 분할 인테인은 2개의 별개의 유전자에 의해 인코딩되고; 예를 들어, 시아노박테리아에서, DNA 중합효소 III의 촉매 서브유닛인 DnaE는 2개의 별개의 유전자인 dnaE-ndnaE-c에 의해 인코딩된다. 본 발명 내에서 바람직한 인테인은 인테인 단백질(예를 들어, 미니 인테인)으로부터 유래된 인테인 또는 트랜스-스플라이싱 반응을 통해 인테인 단백질을 형성하는 분할 인테인이며, 이는 150 aa 이하의 길이이다.
본 발명의 분할 인테인은 천연 발생 인테인 또는 SEQ ID No. 1 내지 14(동족체)와 100%, 98%, 80%, 75%, 70%, 65%, 60%, 55%, 50% 동일할 수 있으며, 상기 인테인은 트랜스-스플라이싱 반응을 겪는 능력을 보유한다. 본 발명의 범위 내에는 트랜스-스플라이싱 활성을 유지하는 천연 발생 또는 변형 인테인의 단편 또는 변이체가 있다.
편리하게는, 본 발명의 분할 인테인은 상이한 유기체로부터 분리된 동일 유전자로부터 유래될 수 있다. 바람직한 인테인 유전자는 Dna BDna E이다.
바람직한 구현예에서, 본 발명의 인테인은 노스톡 푼크티포르메(Nostoc punctiforme)(Npu) 시네코시스티스 종(Synechocystis sp.) PCC6803(Ssp), 피쉐렐라 종(Fischerella sp.) PCC 9605, 사이토네마 톨리포트리코이데스(Scytonema tolypothrichoides), 시아노박테리아 박테리움(Cyanobacteria bacterium) SW_9_47_5, 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 플라겔리포르메(Nostoc flagelliforme), 크로코스파에라 왓소니이(Crocosphaera watsonii) WH 8502, 크로오콕시디오프시스 쿠바나(Chroococcidiopsis cubana) CCALA 043, 트리코데스미움 에리트라에움(Trichodesmium erythraeum)을 포함하는 시아노박테리아로부터의 DnaE 유전자(예를 들어, DNA 중합효소 III 서브유닛 알파)로부터 유래된 분할 인테인이고; 바람직하게는, 본 발명의 인테인은 노스톡 푼크티포르메 또는 시네코시스티스 종 PCC6803으로부터 분리된 Dna E 유전자로부터 유래된다.
추가의 바람직한 구현예에서, 본 발명의 인테인은, 예를 들어, (59)에 기재된 R. 마리누스(R. marinus)(Rma), 시네코시스티스 종 PC6803 (Ssp), 포르피라 푸르푸레아(Porphyra purpurea) 엽록체(Ppu)를 포함하는 시아노박테리아로부터의 DnaB 유전자로부터 유래된 분할 인테인이다.
바람직하게는,
- 제1 인테인 뉴클레오티드 서열은 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제2 인테인 뉴클레오티드 서열은 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제3 인테인 뉴클레오티드 서열은 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제4 인테인 뉴클레오티드 서열은 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩한다.
바람직하게는, 제1 또는 제3 인테인이 SEQ ID 1인 경우, 제2 또는 제4는 SEQ ID 2이거나; 제1 또는 제3 인테인이 SEQ ID 3인 경우, 제2 또는 제4 인테인은 SEQ ID 4이거나; 제1 또는 제3 인테인이 SEQ ID 5인 경우, 제2 또는 제4는 SEQ ID 6이거나; 제1 또는 제3 인테인이 SEQ ID 7인 경우, 제2 또는 제4는 SEQ ID 8이거나; 제1 또는 제3 인테인이 SEQ ID 9인 경우, 제2 또는 제4는 SEQ ID 10이거나; 제1 또는 제3 인테인이 SEQ ID 11인 경우, 제2 또는 제4는 SEQ ID 12이다.
바람직하게는, 제1 인테인이 SEQ ID 1이고, 제2 인테인이 SEQ ID 2인 경우, 제3 인테인은 SEQ ID 1이 아니고, 제4 인테인은 SEQ ID 2가 아니고; 바람직하게는 제1 인테인이 SEQ ID 3이고, 제2 인테인이 SEQ ID 4인 경우, 제3 인테인은 SEQ ID 3가 아니고, 제4 인테인은 SEQ ID 4가 아니고; 바람직하게는 제1 인테인이 SEQ ID 5이고, 제2 인테인이 SEQ ID 6인 경우, 제3 인테인은 SEQ ID 5가 아니고, 제4 인테인은 SEQ ID 6이 아니고; 바람직하게는 제1 인테인이 SEQ ID 7이고, 제2 인테인이 SEQ ID 8인 경우, 제3 인테인은 SEQ ID 7이 아니고, 제4 인테인은 SEQ ID 8이 아니고; 바람직하게는 제1 인테인이 SEQ ID 9이고, 제2 인테인이 SEQ ID 10인 경우, 제3 인테인은 SEQ ID 9가 아니고, 제4 인테인은 SEQ ID 10이 아니고; 바람직하게는 제1 인테인이 SEQ ID 11이고, 제2 인테인이 SEQ ID 12인 경우, 제3 인테인은 SEQ ID 11이 아니고, 제4 인테인은 SEQ ID 12가 아니다.
특정 구현예에서, 제1 인테인은 SEQ ID 1이고, 제2 인테인은 SEQ ID 2이고, 제3 인테인은 SEQ ID 3이고, 제4 인테인은 SEQ ID 4이거나; 제1 인테인은 SEQ ID 5이고, 제2 인테인은 SEQ ID 6이고, 제3 인테인은 SEQ ID 3이고, 제4 인테인은 SEQ ID 4이다.
바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 코딩 서열의 상기 제1 부분(CDS1) 또는 코딩 서열의 상기 제2 부분(CDS2) 또는 코딩 서열의 상기 제3 부분(CDS3)의 5' 말단 부분에 작동 가능하게 연결된 프로모터 서열을 추가로 포함한다.
바람직한 프로모터는 전사 프로모터 활성을 보유하는 단편 및 변이체를 포함하는 편재성, 인공 또는 조직 특이적 프로모터이다. 특히 바람직한 프로모터는 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1), 광수용체간 레티노이드 결합 단백질 프로모터(IRBP), 로돕신 프로모터(RHO), 난황상 황반 디스트로피 2 프로모터(VMD2), 로돕신 키나제 프로모터(RK)를 포함하는 광수용체 특이적 프로모터이고; 추가의 특히 바람직한 프로모터는 MCK, MYODI를 포함하는 근육 특이적 프로모터; 티록신 결합 글로불린(TBG), 하이브리드 간 특이적 프로모터(HLP)를 포함하는 간 특이적 프로모터(67); hSYNl, CaMKIla를 포함하는 뉴런 특이적 프로모터; Ksp-카드헤린16, NKCC2를 포함하는 신장 특이적 프로모터이다. 본 발명에 따른 편재성 프로모터는, 예를 들어, 편재성 사이토메갈로바이러스(CMV)(32) 및 짧은 CMV(33) 프로모터이다. 본 발명의 범위 내의 보다 바람직한 프로모터는 GRK1, TBG, CaMKIla, Ksp-카드헤린16이다.
여전히 바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 5'-말단 반복(5'-TR) 뉴클레오티드 서열 및 3'-말단 반복(3'-TR) 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 5'-TR은 5'-역 말단 반복(5'-ITR) 뉴클레오티드 서열이고, 3'-TR은 3'-역 말단 반복(3'-ITR) 뉴클레오티드 서열이다.
여전히 바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 아데닐중합체형성 신호 뉴클레오티드 서열을 추가로 포함한다.
여전히 바람직한 구현예에서, 코딩 서열은 인코딩된 단백질 생성물의 구조적 도메인 또는 기능적 도메인 내에 속하지 않는 친핵체 아미노산으로 구성된 위치에서 제1 부분, 제2 부분 및 선택적으로 제3 부분으로 분할되며, 여기서 친핵체 아미노산은 세린, 트레오닌 또는 시스테인으로부터 선택된다.
바람직하게는, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나는 코딩 서열에 작동 가능하게 연결된 적어도 하나의 인핸서 또는 조절 뉴클레오티드 서열을 추가로 포함한다.
바람직한 인핸서 또는 조절 뉴클레오티드 서열은
Figure pct00003
-글로빈 IgG 키메라 인트론, 우드척(Woodchuck) 간염 바이러스 전사 후 조절 요소이다.
선택적으로, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나는 재구성된 인테인 단백질의 안정성을 감소시키기 위해 적어도 하나의 분해 신호를 추가로 포함한다.
바람직하게는, 상기 분해 신호는 CL1 데그론(degron) 또는 PB29 데그론이다. 보다 바람직하게는, 상기 분해 신호는 ecDHFR 또는 이의 단편이고, 바람직하게는 ecDHFR 분해 신호는 본원에 기재된 바와 같이 내부 데그론으로 기능하는 변이체 DHFR이다. 가장 바람직하게는, 단편은 ecDHFR의 분해 특성을 보유하고, 바람직하게는 내부 데그론으로 기능하는 변이체 DHFR의 특성을 보유하고, 바람직하게는 단편은 미니 ecDHFR이며, 여기서 미니 ecDHFR은 내부 데그론으로 기능하는 변이체이다.
바람직하게는, 코딩 서열은 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병, 근육 디스트로피이다.
여전히 바람직하게는, 코딩 서열은 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성이고, 바람직하게는 망막 변성은 유전되며, 바람직하게는 병리 또는 질병은 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반 디스트로피, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택된다. 보다 바람직하게는, 코딩 서열은 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그(ortholog) 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 엑손 및 조절 요소를 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
또한 바람직하게는, 코딩 서열은 근육 디스트로피, 예를 들어, 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병을 교정할 수 있는 단백질을 인코딩한다.
보다 바람직하게는, 코딩 서열은 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 제어 영역을 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
여전히 바람직하게는, 코딩 서열은 DMD, CFTR, F8, ATP7B, PAH, DYSF, MECP2, PKD, NPC1, HTT 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 조절 요소를 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
본 발명의 특히 바람직한 구현예에서, 코딩 서열은 ABCA4 유전자를 인코딩한다. 바람직하게는, 상기 코딩 서열은 상기 ABCA4 단백질의 aa Cys1150, Ser1168, Ser1090에 상응하는 뉴클레오티드에서 분할되고, 분할 인테인은 분할 지점에 삽입된다.
추가의 바람직한 구현예에서, 코딩 서열은 CEP290 유전자를 인코딩한다. 바람직하게는, 상기 코딩 서열은 aa Cys1076; Ser1275에 상응하는 뉴클레오티드에서 분할된다. 보다 바람직하게는, 상기 코딩 서열은 상기 CEP290 단백질의 aa Cys929 및 1474; Ser 453 및 Cys1474에 해당하는 뉴클레오티드 서열에서 분할되고, 2개의 분할 인테인은 분할 지점에 삽입된다.
EGFP SEQ ID No. 15
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다. 분할 Cys.71(굵은 글씨)
Figure pct00004
ABCA4 SEQ ID No. 16
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다.
분할 세트1 Cys.1150 (굵은 글씨)
분할 세트2 Ser.1168 (밑줄이 있는 글씨)
분할 세트3 Ser.1090(이탤릭체)
Figure pct00005
CEP290 SEQ ID No. 17
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다.
분할 세트1 Cys.1076 (굵은 글씨)
분할 세트2-3 Ser.1275 (밑줄이 있는 글씨)
분할 세트4 Cys.929 및 Cys.1474 (이탤릭체)
Figure pct00006
Figure pct00007
F8 SEQ ID No. 18
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다. 분할 세트1 Cys.1312 (밑줄이 있는 글씨) 세트 분할 세트2 Ser.984(굵은 글씨)
Figure pct00008
ecDHFR SEQ ID No. 19
Figure pct00009
미니 ecDHFR SEQ ID No. 20
Figure pct00010
바람직한 구현예에서, 본 발명의 벡터 시스템은,
a) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1)의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1)의 5' 말단 부분;
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터: 및
b) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2)의 3' 말단 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터를 포함하거나,
a') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1')의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1')의 5' 말단 부분;
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
b') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2')의 제2 부분; 및
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열;
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터; 및
c') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS3')의 제3 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제3 벡터를 포함한다.
바람직하게는, 상기 제1, 제2 및 제3 벡터는 독립적으로 바이러스 벡터, 바람직하게는 아데노바이러스 벡터 또는 아데노-관련 바이러스(AAV) 벡터이고, 바람직하게는 상기 제1, 제2 및 제3 아데노-관련 바이러스(AAV) 벡터는 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 혈청형은 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9, 혈청형 7m8, 혈청형 sh10; 혈청형 2(quad Y-F)로부터 선택된다.
본 발명은 또한 상기 정의된 바와 같은 벡터 시스템으로 형질전환된 숙주 세포를 제공한다.
바람직하게는, 벡터 시스템 또는 숙주 세포는 의학적 용도를 위한 것이고, 바람직하게는 유전자 요법에 사용하기 위한 것이고, 바람직하게는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 손실, 채널병증, 폐질환, 근육병증, 심장병, 황반 디스트로피를 특징으로 하는 병리 또는 질병의 치료 및/또는 예방에서 사용하기 위한 것이다.
바람직하게는, 망막 변성은 유전되며, 바람직하게는 병리 또는 질병은 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반 디스트로피, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택된다.
바람직하게는, 벡터 시스템 또는 숙주 세포는 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병의 예방 및/또는 치료에서 사용하기 위한 것이다.
본 발명은 또한 본 발명의 벡터 시스템 또는 숙주 세포 및 약학적으로 허용되는 비히클을 포함하는 약학적 조성물을 제공한다.
도 1: AAV 인테인은 이중 AAV보다 높은 수준으로 그리고 단일 AAV로 달성된 수준까지 시험관 내 및 마우스 및 돼지 망막 모두에서 EGFP를 재구성한다.
(a) AAV 인테인 매개 단백질 트랜스-스플라이싱의 도식 표현. ITR: AAV2 역 말단 반복; CDS: 코딩 서열;
Figure pct00011
: 3x플래그 태그; 폴리A: 아데닐중합체형성 신호.
(b) 전장 또는 AAV 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293의 용해질의 웨스턴 블롯(WB) 분석. pEGFP: 전장 EGFP 플라스미드; pAAV I+II : AAV-EGFP I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV-EGFP II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 화살표는 전장 EGFP 단백질(EGFP), EGFP 단백질의 N- 및 C-말단 반쪽(각각 B 및 A), 및 전장 EGFP 단백질로부터 절제된 재구성된 인테인(C)을 나타낸다. WB는 n=3 독립 실험을 나타낸다.
(c) 단일, 인테인 또는 이중 AAV2/2-CMV-EGFP 벡터로 감염된 HEK293의 용해질의 WB 분석. WB는 n=5 독립 실험을 나타낸다.
(d) AAV2/8-CMV-EGFP 인테인 벡터로 망막하 주사된 C57BL/6J 마우스로부터의 망막 냉동절편. 스케일 바: 50 μm. RPE: 망막 색소 상피; OS: 외부 세그먼트; ONL: 외부 핵층.
(e-f) 단일 인테인 또는 이중 AAV2/8-GRK1-EGFP 벡터로 망막하 주사된 C57BL/6J 마우스(e) 또는 대형 백색 돼지(f)로부터의 망막 냉동절편. 스케일 바: 50 μm
(e); 200 μm (f). OS: 외부 세그먼트; ONL: 외부 핵층.
(g) 배양 293일에 AAV2/2-GRK1-EGFP-인테인 벡터로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
도 2: AAV 인테인의 최적화는 큰 ABCA4 및 CEP290 단백질의 적절한 재구성을 허용한다.
(a-b) AAV-shCMV-ABCA4 또는 -CEP290 인테인 플라스미드의 상이한 세트(각각 세트 1 및 세트 5)로 형질감염된 HEK293으로부터의 용해질의 웨스턴 블롯(WB) 분석. 사용된 다양한 세트의 도식 표현은 도 16에 도시되어 있다. WB는 n=3 독립 실험을 나타낸다.
(c-d) AAV-shCMV-ABCA4(c) 또는 AAV-shCMV-CEP290(d) 인테인 플라스미드로 형질감염된 HeLa 세포의 면역형광 분석의 대표 이미지. pABCA4(c) 또는 pCEP290(d): 전장 발현 카세트를 포함하는 플라스미드; pAAV 인테인: AAV-인테인 플라스미드(c에서 세트 1 또는 d에서 세트 5); I+II+III: AAV I+II+III 인테인 플라스미드; I+II: AAV I+II 인테인 플라스미드; I+III: AAV I+III 인테인 플라스미드; II+III: AAV II+III 인테인 플라스미드; I: 단일 AAV I 인테인 플라스미드; II: 단일 AAV II 인테인 플라스미드; III: 단일 AAV III 인테인 플라스미드; Neg: 형질감염되지 않은 세포.
세포는 c에서 3x플래그 및 VAP-B(세포질그물 마커) 및 TGN46(트랜스-골지 네트워크 마커) 또는 d에서 아세틸화 튜불린(미세관의 마커)에 대해 염색되었다. 백색 화살표는 도 18에서 더 높은 배율로 제시된 세포를 가리킨다.
도 3: AAV 인테인은 이중 AAV 벡터보다 더 효율적으로 큰 ABCA4 및 CEP290 단백질을 재구성한다.
이중 또는 인테인 AAV2/2-shCMV-ABCA4(a) 또는 -CEP290(b) 벡터로 감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
AAV 인테인: AAV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b) 인테인 벡터; I+II+III: AAV I+II+III 인테인 벡터; I+II: AAV I+II 인테인 벡터; I+III: AAV I+III 인테인 벡터; II+III: AAV II+III 인테인 벡터; I: 단일 AAV I 인테인 벡터; II: 단일 AAV II 인테인 벡터; III: 단일 AAV III 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
(a) 화살표는 전장 ABCA4 단백질을 나타내고, a: AAV I에서 유래된 단백질 생성물; B: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질을 나타내고, a: AAV II+III로부터 유래된 단백질 생성물; b: AAV I+II로부터 유래된 단백질 생성물; c: AAV II로부터 유래된 단백질 생성물; d: AAV III로부터 유래된 단백질 생성물; e: AAV I으로부터 유래된 단백질 생성물. WB는 n=3 독립 실험을 나타낸다.
도 4: AAV 인테인은 마우스, 돼지 및 인간 광수용체에서 큰 단백질을 치료 수준으로 재구성한다.
(a-c) 이중 또는 인테인 AAV2/8-GRK1-ABCA4(a, c) 또는 -CEP290(b) 벡터(각각 세트 1 및 세트 5)가 주사된 야생형 마우스(a, b) 또는 대형 백색 돼지(c)로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터 또는 PBS.
(d) AAV2/2-GRK1-ABCA4 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 WB 분석. AAV 인테인: AAV-ABCA4 인테인 벡터; Neg: 감염되지 않은 오르가노이드; -/-: STGD1 환자로부터 유래된 오르가노이드.
(a, c, d) 화살표는 전장 ABCA4 단백질(ABCA4)을 나타내고, a: AAV I에서 유래된 단백질 생성물; b: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질(CEP290)을 모두 나타내고; a: AAV II+III로부터 유래된 단백질 생성물 및 d: AAV III로부터 유래된 단백질 생성물.
도 5: AAV 인테인의 망막하 투여는 유전성 망막 변성의 마우스 모델의 망막 표현형을 개선한다.
(a) AAV 인테인으로 처리된 Abca4-/- 마우스의 RPE에서 리포푸신(lipofuscin)이 차지하는 평균 영역의 정량화. 각각의 도트는 각각의 눈에 대해 측정된 평균 값을 나타낸다. 각각의 그룹에 대한 리포푸신 영역의 평균 값이 그래프에 표시된다. +/+ 또는 +/-: 대조 주사된 Abca4+/+ 또는 +/- 눈(PBS); -/-: 음성 대조군 주사된 Abca4-/- 눈(AAV I ABCA4 또는 AAV II ABCA4 또는 PBS); -/- AAV 인테인: AAV 인테인 벡터가 주사된 Abca4-/- 눈(세트 1). * ANOVA p 값 <0.05; *** ANOVA p 값 <0.001.
(b) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 rd16 마우스로부터의 망막 섹션의 대표 이미지. 스케일 바: 25 μm. 각각의 이미지에서 측정된 ONL의 두께는 수직의 흑색 선으로 표시된다. RPE: 망막 색소 상피; ONL: 외부 핵층; INL: 내부 핵층; GCL: 신경절 세포층.
(c) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 마우스 및 rd16 마우스로부터의 눈의 대표 이미지. 백색 원은 동공을 정의한다.
도 6: 큰 단백질의 단백질 트랜스-스플라이싱 매개 재구성의 도식 표현.
큰 유전자의 코딩 서열(CDS)은 2개의 반쪽(5' 및 3')으로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 동일 세포의 공동 형질도입시, 단백질 수준에서 2개의 반쪽을 결합하여 전장 단백질 발현을 재구성하기 위해 상이한 메커니즘이 활용된다. 5'-벡터는 5' CDS, 5' 인테인(n-인테인) 및 데그론을 포함하는 반면, 3'-벡터는 3'CDS 및 3' 인테인(c-인테인)을 포함하며; 둘 모두의 벡터는 프로모터 및 폴리A를 포함한다. 2개의 절반 폴리펩티드의 쌍형성은 인테인 자기-이식을 통해 매개되며; 숙주 단백질로부터의 이후의 인테인 자가-절제는 전장 단백질 재구성을 발생시킨다. 데그론은 이제 절제된 인테인에 포매되며, 프로테아좀에 의해 신속하게 유비퀴틴화되고 분해된다.
도 7: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 8: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 9: 인테인 DnaE-ecDHFR 발현은 TMP-의존적이다.
ecDHFR을 함유하거나(pAAV 인테인+ecDHFR) 함유하지 않는(pAAV 인테인) AAV_ABCA4 인테인 플라스미드로 형질감염되고, 증가된 용량의 트리메트로핀(Trimetrophin)(1 내지 50
Figure pct00012
)으로 처리된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않는(DnaE) 절제된 인테인을 나타낸다.
도 10: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 11. 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 12: 단일 AAV I 또는 AAV II 인테인 플라스미드가 아닌 AAV I+II로 형질감염된 HEK293 세포에서의 EGFP 형광.
전장 또는 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; pAAV I+II : AAV I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 13: 전장 단백질에 대한 인테인은 종에 따라 다르다.
AAV-CMV-EGFP(a) 또는 AAV-GRK1-EGFP 인테인 벡터(b-c)로 감염된 HEK293 세포(a), C57BL/6J 마우스(b) 및 대형 백색 돼지 망막(c)으로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터로 감염된 세포(a) 또는 AAV 인테인 벡터로 주사된 눈(b, c); Neg: 감염되지 않은 세포(a) 또는 PBS로 주사된 눈(b, c). 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 14: 인간 iPSCs-유래 3D 망막 오르가노이드의 특성규명.
(a) 배양 183일에 망막 오르가노이드의 광학 현미경 분석.
(b) 성숙한 광수용체 마커에 대한 항체를 사용한 면역형광 분석. 스케일 바: 100 μm.
(c) AAV2/2-CMV-EGFP 및 AAV2/2-IRBP-DsRed 벡터 둘 모두로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
(d) 배양 230일에 망막 오르가노이드의 표면으로부터 돌출된 외부 세그먼트-유사 구조가 관찰되었다. 삽입된 도면은 방사형 구조를 갖는 외부 세그먼트(OS) 유사 구조의 존재를 나타낸다. NR: 신경 망막; RPE: 망막 색소 상피.
(e) 주사 전자 현미경 분석은 내부 세그먼트(IS), 연결 섬모(CC) 및 외부 세그먼트(OS)-유사 구조의 존재를 나타낸다. 스케일 바: 4 μm.
(f) 전자 현미경 분석은 외부 제한 막(*), 중심소체(C), 기저 소체(BB), 연결 섬모(CC) 및 외부 세그먼트의 스케치(OS)의 존재를 나타낸다. 삽입된 도면은 OS에서 조직화되지 않은 막 디스크의 존재를 나타낸다. 스케일 바: 500 nm.
D: 배양일.
도 15: 인간 3D 망막 오르가노이드에서 전장 단백질에 비해 낮은 인테인.
AAV2/2-GRK1-EGFP 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 16: AAV-ABCA4 및 -CEP290 인테인의 다양한 세트의 도식 표현.
(a) AAV-ABCA4-인테인 작제물. (작제물에 의해 예시된 세트 1-2) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: Npu의 돌연변이된 DnaE(mNpu)로부터의 n-인테인; c-mDnaE: mNpu의 DnaE 로부터의 c-인테인.
(b) AAV-CEP290-인테인 작제물. (세트 1) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; sh폴리A: 짧은 합성 폴리A; (세트 2) n-DnaE: mNpu의 DnaE로부터의 n-인테인; c-DnaE: mNpu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: mNpu의 DnaE로부터의 c-인테인; (세트 4) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: AAV I과 AAV II 사이의 Npu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 N-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척(Woodchuck) 간염 바이러스 전사 후 조절 요소. (세트 5) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: AAV I과 AAV II 사이의 mNpu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 n-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척 간염 바이러스 전사 후 조절 요소. (a-b) ITR: AAV2 역 말단 반복; : 3x플래그 태그; 프로모터: 시험관 내 실험을 위한 짧은 CMV 및 생체 내 실험을 위한 인간 G-단백질 결합 수용체(GRK1) 프로모터; 폴리A: 유인원 바이러스 40 아데닐중합체형성 신호(ABCA4의 경우, a) 및 소 성장 호르몬 아데닐중합체형성 신호(CEP290의 경우, b). 각각의 세트의 분할 지점의 아미노산이 도면에 도시된다. 예측된 단백질 분자량은 각각의 AAV 벡터 아래에 도시된다.
도 17: 이종 N- 및 C-인테인의 조합은 시험관 내에서 검출 가능한 EGFP 단백질 재구성을 발생시키지 않는다.
전장 또는 인테인 AAV-CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. N+C-DnaE: DnaE로부터의 인테인에 융합된 AAV I+II; N+C-DnaB: DnaB으로부터의 인테인에 융합된 AAV I+II; N+C-mDnaE: mDnaE로부터의 분할-인테인에 융합된 AAV I+II; N-DnaE+C-DnaB: DnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-DnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 DnaE로부터의 c-인테인에 융합된 AAV II; N-mDnaE+C-DnaB: mDnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-mDnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 mDnaE로부터의 c-인테인에 융합된 AAV II; pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 18: CEP290은 미세소관을 따라 정렬한다.
도 2d로부터의 단일 세포의 확대. 전장 CEP290 발현 카세트(pCEP290)를 포함하는 플라스미드 또는 CEP290 인테인 플라스미드(세트 5, pAAV I+II+III)로 형질감염된 HeLa 세포의 면역형광 분석. 세포는 3x플래그 및 아세틸화 튜불린(미세소관의 마커)에 대해 염색되었다. 스케일 바: 50 μm.
짧은-CMV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
(a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드.
(b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드.
Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 19: AAV 인테인 플라스미드의 형질감염은 전장 발현 카세트를 갖는 단일 플라스미드의 형질감염보다 더 적은 양으로 ABCA4 및 CEP290 단백질을 재구성한다.
짧은-CMV-ABCA4(a) 또는 -CEP290(b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. (a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드. (b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드. Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 20: AAV 인테인 벡터의 망막하 전달은 마우스 망막에서 ABCA4 발현을 발생시킨다.
이중 또는 인테인 AAV2/8-GRK1-ABCA4 벡터(세트 1)가 주사된 야생형 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
도 21: AAV 인테인은 내인성 Abca4의 약 10%를 재구성한다.
AAV2/8-GRK1-ABCA4 인테인 벡터(세트 1)가 주사된 Abca4 +/- 또는 Abca4 -/- 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. mAbca4: Abca4 +/- 망막; AAV 인테인: AAV 인테인 주사된 망막; Neg: 주사되지 않은 망막. 겔 #2 및 #3에 로딩된 Abca4+/-로부터의 망막 용해질은 동일하다. 내인성에 비한 AAV 인테인 ABCA4 발현의 백분율은 각각의 레인 아래에 도시된다.
도 22: AAV 인테인은 인간 망막 오르가노이드에서 전장 ABCA4 단백질을 재구성한다.
AAV2/2-GRK1-ABCA4 인테인 벡터(세트 1)로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. -/-: STGD1 환자로부터 유래된 오르가노이드; +/+: 건강한 공여자로부터 유래된 오르가노이드.
도 23: AAV 인테인 벡터의 망막하 투여는 Abca4 -/- 마우스에서 리포푸신(lipofuscin) 축적을 감소시킨다.
음성 대조군(Neg) 또는 AAV 인테인 벡터(세트 1)가 주사된 야생형 및 Abca4-/- 마우스의 RPE에서 리포푸신 과립을 제시하는 투과 전자 현미경 분석의 대표적 사진. 백색 화살표는 리포푸신 과립을 나타낸다; M: 미토콘드리아.
도 24: 마우스에서 AAV 인테인 벡터의 망막하 전달은 ONL 두께를 변형시키지 않는다.
AAV 인테인 벡터, 관련되지 않은 AAV 벡터(AAV neg) 또는 PBS로 망막하 주사된 C57BL/6J 마우스 눈의 스펙트럼 도메인 광학 간섭 단층촬영 분석. 흑색 막대는 AAV-ABCA4 인테인 벡터(세트 1), 및 이들의 상응하는 대조군으로 주사 후 6개월의 눈을 나타내고; 백색 막대는 AAV-CEP290 인테인 벡터(세트 5), 및 이들의 상응하는 대조군으로 주사 후 4.5개월의 눈을 나타낸다. 데이터는 평균 ± s.e로 표시된다. 평균 값은 해당 막대 위에 표시된다.
도 25. AAV 인테인 벡터는 전장 야생형 F8을 전달할 수 있다.
a) 단일 AAV B-도메인 결실 변이체 3 인자 VIII(F8-V3) 및 AAV F8 인테인 벡터의 도식표현.
F8 유전자의 코딩 서열은 2개의 반쪽(5' 및 3' F8)로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 5'-벡터는 5' F8 및 5' 인테인(n-DnaE)을 포함하는 반면, 3'-벡터는 3' F8 및 3' 인테인(c-DnaE)을 포함하며; 둘 모두의 벡터는 HLP 프로모터 및 합성 폴리A를 포함한다. V3, 변이체 3; SS, 신호 서열.
b) F8 인테인은 단일 특대 AAV F8-V3와 달리 정의된 벡터 유전체를 사용하여 AAV 캡시드로 적절하게 패키징된다.
HLP 프로모터에 특이적인 프로브를 사용한 벡터 유전체 온전성의 서던 블롯 분석은 AAV F8 인테인 벡터에 존재하지 않는 특대 AAV F8-V3에서 트렁케이션된 생성물을 나타내었다. Neg, 음성 대조군.
c) AAV F8 인테인 벡터는 주사 후 8주에 혈우병 A 넉아웃 마우스의 출혈 표현형의 약간의 보정을 제시한다.
AAV F8 인테인(둘 모두 분할 지점) 주사 후 8주에 혈우병 A 넉아웃 마우스의 혈장 샘플의 aPTT 분석은 PBS 주사 대조군에 비해 약간의 표현형 보정을 제시한다. aPTT, 활성화된 부분 트롬보플라스틴 시간.
유전자 요법
지난 10년 동안, 유전자 요법은 수백 건의 임상 시험에서 질병 치료에 적용되었다. 인간 세포에 유전자를 전달하기 위해 다양한 도구가 개발되었으며; 그 중, 아데노-관련 바이러스를 포함하는 유전자 조작 바이러스가 현재 유전자 전달을 위한 가장 인기 있는 도구 중 하나이다. 대부분의 시스템은 관심 유전자를 수용할 수 있는 벡터 및 감염성 바이러스 입자를 함유하는 벡터의 생성을 허용하는 바이러스 구조 단백질 및 효소를 제공할 수 있는 헬퍼 세포를 함유한다. 아데노-관련 바이러스는 뉴클레오티드 및 아미노산 서열, 유전체 구조, 병원성 및 숙주 범위가 상이한 바이러스 계열이다. 이러한 다양성은 상이한 치료적 적용을 개발하기 위해 상이한 생물학적 특징을 갖는 바이러스를 사용할 기회를 제공한다. 임의의 전달 도구와 마찬가지로, 효율성, 특정 조직 또는 세포 유형을 표적으로 하는 능력, 관심 유전자의 발현 및 아데노-관련 바이러스 기반 시스템의 안정성은 유전자 요법의 성공적인 적용에 중요하다. 최근 몇 년 동안 이들 연구 분야에 많은 노력을 기울였다. 유전자 발현을 변경시키고, 전달을 표적화하고, 바이러스 역가를 개선시키고, 안전성을 증가시키기 위해 아데노-관련 바이러스 기반 벡터 및 헬퍼 세포에 대해 다양한 변형이 이루어졌다. 본 발명은 단일 아데노-관련 바이러스 기반 벡터에 대해 제한 화물을 초과하는 크기로 관심 유전자를 효율적으로 전달하는 작용을 한다는 점에서 상기 설계 과정의 개선을 나타낸다. 바이러스는 유전자 전달을 위한 논리적 도구이다. 이들은 세포 내부에서 복제하며, 따라서 세포에 진입하여 세포 기계를 사용하여 이들의 유전자를 발현하는 메커니즘을 진화시켰다. 바이러스 기반 유전자 전달의 개념은 관심 유전자를 발현할 수 있도록 바이러스를 조작하는 것이다. 특정 적용 및 바이러스의 유형에 따라, 대부분의 바이러스 벡터는 숙주에서 야생형 바이러스로 자유롭게 복제하는 능력을 방해하는 돌연변이를 함유한다. 유전자 전달을 위한 바이러스 벡터를 생성하기 위해 여러 상이한 계열로부터의 바이러스가 변형되었다. 이들 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 바이러스, 단순 헤르페스 바이러스, 피코르나바이러스 및 알파바이러스를 포함한다. 본 발명은 바람직하게는 아데노-관련 바이러스를 사용한다. 따라서, 유전자 전달을 위한 바이러스 기반 벡터는 비제한적으로 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 슈도타이핑된 AAV 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 배큘로바이러스 벡터를 포함한다.
유전자 전달을 위한 이상적인 아데노-관련 바이러스 기반 벡터는 효율적이고, 세포 특이적이고, 조절되고, 안전해야 한다. 전달 효율은 치료의 효능을 결정할 수 있으므로 중요하다. 현재의 노력은 아데노-관련 바이러스 벡터로 세포 유형 특이적 감염 및 유전자 발현을 달성하는 것을 목표로 한다. 또한, 요법은 오래 지속되거나 조절된 발현을 요구할 수 있으므로 관심 유전자의 발현을 조절하기 위해 아데노-관련 바이러스 벡터가 개발되고 있다. 대부분의 바이러스는 병원체이거나 병원성 잠재성을 가지므로 안전성은 바이러스 유전자 전달의 주요 문제이다.
아데노-관련 바이러스(AAV)는 인간 및 일부 다른 영장류 종을 감염시키는 작은 바이러스이다. AAV는 현재 질병을 유발하는 것으로 공지되어 있지 않으므로 결과적으로 바이러스는 매우 가벼운 면역 반응을 유발한다. AAV를 사용한 유전자 요법 벡터는 분열 세포 및 정지 세포 둘 모두를 감염시킬 수 있으며, 숙주 세포의 유전체로의 통합 없이 염색체외 상태로 지속될 수 있다. 이들 특징은 AAV를 유전자 요법을 위한 바이러스 벡터를 생성하고, 동종 인간 질병 모델을 생성하기 위한 매우 매력적인 후보로 만든다.
야생형 AAV는 다수의 특징으로 인해 유전자 요법 연구자로부터 상당한 관심을 끌었다. 이들 중 가장 중요한 것은 바이러스의 병원성의 명백한 결핍이다. 이는 또한 분열하지 않는 세포를 감염시킬 수 있으며, 인간 염색체 19의 특정 부위(AAVS1으로 지정됨)에서 숙주 세포 유전체에 안정적으로 통합하는 능력을 갖는다. 상기 특징은 무작위 삽입 및 돌연변이유발의 위협을 나타내고, 때때로 암의 발달이 후속되는 레트로바이러스보다 다소 더 예측 가능하게 만든다. AAV 유전체는 언급된 부위에 가장 빈번히 통합되는 반면, 유전체로의 무작위 통합은 무시할 수 있는 빈도로 발생한다. 그러나, 유전자 요법 벡터로서의 AAV의 개발은 벡터의 DNA에서 repcap를 제거함으로써 이러한 통합 능력을 제거하였다. 단일 가닥 벡터 DNA가 숙주 세포 DNA 중합효소 복합체에 의해 이중 가닥 DNA로 전환된 후 핵에서 콘카타머 형성을 돕는 역 말단 반복(ITR) 사이에 유전자의 전사를 유도하는 프로모터와 함께 원하는 유전자가 삽입된다. AAV 기반 유전자 요법 벡터는 숙주 세포 핵에서 에피솜 콘카타머를 형성한다. 분열하지 않는 세포에서, 이들 콘카테머는 숙주 세포의 수명 동안 온전하게 유지된다. 분열 세포에서, 에피솜 DNA는 숙주 세포 DNA와 함께 복제되지 않으므로 AAV DNA는 세포 분열을 통해 상실된다. 숙주 유전체로의 AAV DNA의 무작위 통합은 검출 가능하지만 매우 낮은 빈도로 발생한다. AAV는 또한 매우 낮은 면역원성을 나타내며, 겉보기에는 중화 항체의 생성에 제한되는 것으로 보이나, 이들은 명확하게 정의된 세포독성 반응을 유도하지 않는다. 정지 세포를 감염시키는 능력과 함께 상기 특징은 인간 유전자 요법을 위한 벡터로서의 아데노바이러스에 비한 이들의 우위를 나타낸다.
AAV 유전체, 전사체 및 단백체
AAV 유전체는 약 4.7 킬로베이스 길이인 양성-센스 또는 음성-센스의 단일 가닥 데옥시리보핵산(ssDNA)의 구축이다. 유전체는 DNA 가닥의 양 말단에 역 말단 반복(ITR), 및 2개의 오픈 리딩 프레임(ORF)인 repcap을 포함한다. 전자는 AAV 수명 주기에 필요한 Rep 단백질을 인코딩하는 4개의 중복 유전자로 구성되며, 후자는 함께 상호작용하여 정20면체 대칭의 캡시드를 형성하는 VP1, VP2 및 VP3의 캡시드 단백질의 중복 뉴클레오티드 서열을 함유한다.
ITR 서열
역 말단 반복(ITR) 서열은 각각 145개의 염기를 포함한다. 이들은 AAV 유전체의 효율적인 증식에 필요한 것으로 나타났던 이들의 대칭으로 인해 그렇게 명명되었다. 이들 서열의 또 다른 특성은 헤어핀을 형성하는 이들의 능력이며, 이는 제2 DNA 가닥의 프리메이스(primase) 독립적 합성을 허용하는 소위 자가-프라이밍에 기여한다. ITR은 또한 숙주 세포 유전체(인간의 19번째 염색체)로의 AAV DNA의 통합 및 이로부터의 구조 둘 모두뿐만 아니라 완전히 조립된 데옥시리보뉴클레아제 내성 AAV 입자의 생성과 조합된 AAV DNA의 효율적인 캡시드화(encapsidation)에 필요한 것으로 나타났다.
유전자 요법과 관련하여, ITR은 치료 유전자 옆에서 시스(cis)로 필요한 유일한 서열인 것으로 보이며: 구조(cap) 및 패키징(rep) 유전자는 트랜스(trans)로 전달될 수 있다. 이러한 가정하에, 리포터 또는 치료 유전자를 함유하는 재조합 AAV(rAAV) 벡터의 효율적인 생성을 위한 많은 방법이 확립되었다. 그러나, ITR이 효과적인 복제 및 캡시드화를 위해 시스로 필요한 유일한 요소는 아니라는 것이 또한 공개되었다. 몇몇 연구 그룹은 rep 유전자의 코딩 서열 내에서 시스-작용 Rep-의존 요소(cis-acting Rep-dependent element; CARE)로 지정된 서열을 확인하였다. CARE는 시스로 존재하는 경우 복제 및 캡시드화를 강화하는 것으로 나타났다.
AAV 혈청형
현재까지, 수십 개의 상이한 AAV 변이체(혈청형)이 확인되고 분류되었다(60). 공지된 모든 혈청형은 다수의 다양한 조직 유형의 세포를 감염시킬 수 있다. 조직 특이성은 캡시드 혈청형에 의해 결정되며, 향성 범위를 변경시키기 위한 AAV 벡터의 슈도타이핑(pseudotyping)이 아마도 요법에서의 이들의 사용에 중요할 것이다. 슈도타이핑된 AAV 벡터는 제2 AAV 혈청형의 캡시드에 하나의 AAV 혈청형의 유전체를 함유하는 것이며; 예를 들어, AAV2/8 벡터는 AAV8 캡시드 및 AAV2 유전체를 함유한다(61). 상기 벡터는 또한 키메라 벡터로 공지되어 있다.
혈청형 2
혈청형 2(AAV2)는 지금까지 가장 광범위하게 조사되었다. AAV2는 골격근, 뉴런, 혈관 평활근 세포 및 간세포에 대한 천연 향성을 제시한다. AAV2에 대한 3개의 세포 수용체가 설명되었다: 헤파란 설페이트 프로테오글리칸(HSPG), avβ5 인테그린 및 섬유모세포 성장 인자 수용체 1(FGFR-1). 첫 번째는 일차 수용체로 기능하는 반면, 후자의 2개는 공동-수용체 활성을 가지며, AAV가 수용체-매개 세포내이입에 의해 세포로 진입할 수 있게 한다. 이들 연구 결과는 큐, 한다 등(Qju, Handa et al.)에 의해 논란이 되었다. HSPG는 일차 수용체로 기능하지만, 세포 외 기질에서의 이의 풍부는 AAV 입자를 청소하고 감염 효율을 손상시킬 수 있다.
바이러스의 혈청형 2(AAV-2)가 건강한 세포를 해치지 않고 암세포를 명백히 사멸시키는 것으로 연구에서 나타났다. 펜실베니아 주립 의과 대학의 면역학 및 미생물학 교수인 크레이그 마이어스(Craig Meyers)는 "우리의 결과는 대부분의 인구를 감염시키나 공지된 병적인 영향은 없는 아데노-관련 바이러스 2형이 다수의 유형의 암세포를 사멸시키지만 건강한 세포에는 영향을 미치지 않음을 시사한다"라고 말했다. 이는 새로운 항암제로 이어질 수 있다.
기타 혈청형
AAV2는 다양한 AAV 기반 연구에서 가장 인기 있는 혈청형이지만, 다른 혈청형이 유전자 전달 벡터로서 더 효과적일 수 있는 것으로 밝혀졌다. 예를 들어, AAV6는 기도 상피 세포를 감염시키는 데 훨씬 나은 것으로 나타나고, AAV7은 뮤린 골격근 세포의 매우 높은 형질도입 비율을 나타내고(AAV1 및 AAV5와 유사하게), AAV8은 간세포 및 광수용체를 형질도입하는 데 탁월하며, AAV1 및 5는 혈관 내피 세포로의 유전자 전달에서 매우 효율적인 것으로 나타났다. 뇌에서, 대부분의 AAV 혈청형은 신경 향성을 나타내는 반면 AAV5는 또한 별아교세포를 형질도입한다. AAV1 및 AAV2의 하이브리드인 AAV6는 또한 AAV2보다 낮은 면역원성을 나타낸다.
혈청형은 결합된 수용체에 따라 상이할 수 있다. 예를 들어, AAV4 및 AAV5 형질도입은 가용성 시알산(이들 혈청형 각각에 대한 상이한 형태)에 의해 억제될 수 있으며, AAV5는 혈소판 유래 성장 인자 수용체를 통해 세포로 진입하는 것으로 나타났다. 4중 티로신 돌연변이체 또는 AAV 2/7m8과 같은 신규한 AAV 변이체는 작은 동물 모델에서 유리체로부터 외부 망막을 형질도입하는 것으로 나타났다(62, 63). 또 다른 AAV 돌연변이체는 ShH1O로 명명되었으며, 이는 유리체 내 투여 후 개선된 아교세포 향성을 갖는 AAV6 변이체이다. 망막에 대한 특히 유리한 향성을 갖는 추가 AAV 돌연변이체는 AAV2(quad Y-F)이다(65).
본 발명의 유전자 전달 비히클은 환자에게 투여될 수 있다. 상기 투여는 "생체 내" 투여 또는 "생체 외" 투여일 수 있다. 숙련된 작업자는 적절한 투여량 비율을 결정할 수 있다. 용어 "투여된"은 바이러스 또는 비-바이러스 기술에 의한 전달을 포함한다. 바이러스 전달 메커니즘은 상기 설명된 바와 같이 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터 및 배큘로바이러스 벡터 등을 포함하나 이에 제한되지는 않는다.
비-바이러스 전달 시스템은 DNA 형질감염, 예를 들어, 전기천공, 지질 매개 형질감염, 압축 DNA-매개 형질감염; 리포솜, 면역리포솜, 리포펙틴, 양이온성 안면 양친매성 분자(CFA) 및 이들의 조합을 포함한다.
본 발명에 따른 벡터 시스템에 의한 하나 이상의 치료 유전자의 전달은 단독으로 또는 다른 치료 또는 치료의 성분과 조합하여 사용될 수 있다.
약학적 조성물
본 발명은 또한 유전자 요법에 의해 개체를 치료하기 위한 약학적 조성물을 제공하며, 여기서 조성물은 하나 이상의 전달 가능한 치료 및/또는 진단 트랜스진(들) 또는 이에 의해 생성되거나 이로부터 획득된 바이러스 입자를 포함하는 치료적 유효량의 본 발명의 벡터/작제물 또는 숙주 세포를 포함한다. 약학적 조성물은 인간 또는 동물용일 수 있다. 전형적으로, 의사는 개별 대상체에게 가장 적합할 실제 투여량을 결정할 것이며, 이는 특정 개인의 연령, 체중 및 반응에 따라 달라질 것이다. 조성물은 선택적으로 약학적으로 허용되는 담체, 희석제, 부형제 또는 애쥬번트를 포함할 수 있다. 약학적 담체, 부형제 또는 희석제의 선택은 의도된 투여 경로 및 표준 약학적 실시와 관련하여 선택될 수 있다. 약학적 조성물은 담체, 부형제 또는 희석제로서 또는 이에 더하여 임의의 적합한 결합제(들), 윤활제(들), 현탁제(들), 코팅제(들), 가용화제(들), 및 표적 부위로의 바이러스 진입을 돕거나 증가시킬 수 있는 기타 담체 제제(예를 들어, 지질 전달 시스템)를 포함할 수 있다. 적절한 경우, 약학적 조성물은 좌약 또는 페서리 형태의 흡입, 국소적으로 로션, 용액, 크림, 연고 또는 더스팅 파우더(dusting powder)의 형태로, 피부 패치의 사용에 의해, 경구적으로 전분 또는 락토스와 같은 부형제를 함유하는 정제 형태, 또는 단독으로 또는 부형제와 혼합하여 캡슐 또는 오뷸(ovule), 또는 착향제 또는 착색제를 함유하는 엘릭서, 용액 또는 현탁액 형태로 투여될 수 있으며; 바람직하게는 이들은 비경구적으로, 예를 들어, 해면 내, 정맥 내, 근육 내 또는 피하 주사될 수 있다. 비경구 투여를 위해, 조성물은 다른 물질, 예를 들어, 용액을 혈액과 등장성으로 만들기에 충분한 염 또는 단당류를 함유할 수 있는 멸균 수용액 형태로 가장 잘 사용될 수 있다. 협측 또는 설하 투여를 위해, 조성물은 통상적인 방식으로 제형화될 수 있는 정제 또는 로젠지 형태로 투여될 수 있다.
바람직한 제형은 결막낭에 국소적으로 또는 결막하로 투여되고, 바람직하게는 1일 내지 6개월 동안, 바람직하게는 1일 내지 30일 동안, 바람직하게는 하루에 1 내지 10회 투여되는 것이다.
바람직한 투여는 전방으로의 투여, 유리체 내 주사, 망막 하 주사, 안구근처(parabulbar) 및/또는 안구뒤 주사, 기질내 각막 주사이다.
바람직하게는, 본 발명의 약학적 조성물은 국소 안구 사용을 위한 것이며, 따라서 안과용 조성물이다.
본 발명에 따른 벡터 시스템은 임의의 편리한 경로에 의해 투여될 수 있으나, 바람직한 투여 경로는 안구 표면에 국소적으로, 특히 각막에 국소적으로 투여되는 것이다. 더욱 더 바람직한 경로는 결막낭으로의 점적주입이다.
의료용으로 눈으로 국소 투여될 안과용 조성물의 생성을 위한 벡터 시스템의 사용이 본 발명의 특정 목적이다.
보다 일반적으로, 본 발명의 하나의 바람직한 구현예는 선택적으로 하나 이상의 약학적으로 허용되는 첨가제(예를 들어, 희석제 또는 담체)와 함께 벡터 시스템을 포함하는 눈의 국소, 표면 또는 제한된 영역 및/또는 눈의 부속기에 국소 적용을 위해 제형화된 조성물이다.
본원에서 사용되는 용어 "비히클", "희석제", "담체" 및 "첨가제"는 상호 교환 가능하다.
본 발명의 안과용 조성물은 약학적으로 허용되고 눈에 내약성이고 활성 원리와 상용성인 안과용 담체를 함께 포함하는 용액, 에멀젼 또는 현탁액(점안제), 연고, 젤, 에어로졸, 미스트 또는 리니멘트의 형태일 수 있다.
또한, 지연 방출을 위한 안과 투여를 위한 특정 경로, 예를 들어, 결막낭에 위치하거나 컨택트 렌즈에 위치할 안구 침식성 삽입물 또는 중합체 막 "저장소" 시스템이 본 발명의 범위 내이다.
본 발명의 안과용 조성물은 국소 투여될 수 있으며, 예를 들어, 조성물은 전달되고, 눈 및/또는 눈의 부속기와 직접 접촉한다.
본 발명의 적어도 하나의 벡터 시스템을 함유하는 약학적 조성물은, 예를 들어, 문헌[Remington: The Science and Practice of Pharmacy 1995, edited by E. W. Martin, Mack Publishing Company, 19th edition, Easton, Pa]에 기재된 바와 같은 임의의 통상적인 기술에 의해 제조될 수 있다.
일 구현예에서, 조성물은 액체가 되도록 제형화되며, 여기서 벡터 시스템은 용액 또는 현탁액에 있을 수 있다. 조성물은 점안제, 인공 눈물, 눈 세척제 또는 셀룰로스 에테르(예를 들어, 메틸셀룰로스)와 같은 액체 담체를 포함하는 컨택트 렌즈 흡착제와 같은 국소 적용에 적합한 임의의 액체 형태로 제형화될 수 있다.
바람직하게는, 액체는 수성 액체이다. 또한, 액체가 멸균인 것이 바람직하다. 멸균은, 예를 들어, 임의의 통상적인 방법, 예를 들어, 여과, 조사 또는 가열에 의해 또는 무균 조건하에서 제조 공정을 수행함으로써 부여될 수 있다.
액체는 하나 이상의 친유성 비히클을 포함할 수 있다.
본 발명의 일 구현예에서, 조성물은 연고로 제형화된다. 바람직하게는, 연고 내의 하나의 담체는 바셀린 담체일 수 있다.
약학적으로 허용되는 비히클은 일반적으로 특정 제형, 의도된 투여 경로 등에 따라 선택되어야 하는 임의의 통상적으로 사용되는 약학적으로 허용되는 비히클일 수 있다. 또한, 약학적으로 허용되는 비히클은, 예를 들어, 인터넷 주소 http://www.fda.gov/cder/drug/iig/default.htm에서 이용 가능한 FDA "비활성 성분 목록"으로부터의 임의의 허용되는 첨가제일 수 있다.
적어도 하나의 약학적으로 허용되는 희석제 또는 담체는 완충액일 수 있다. 일부 목적을 위해, 조성물이 5 내지 9 범위의 pH, 예를 들어, pH 5 내지 6, pH 6 내지 8 또는 pH 7 내지 7.5로 용액을 완충할 수 있는 완충액을 포함하는 것이 종종 바람직하다.
그러나, 본 발명의 다른 구현예에서, 약학적 조성물은 완충액을 전혀 포함하지 않거나, 마이크로몰 양의 완충액만을 포함할수 있다. 완충액은, 예를 들어, TRIS, 아세테이트, 글루타메이트, 락테이트, 말레에이트, 타르트레이트, 포스페이트, 시트레이트, 보레이트, 카르보네이트, 글리시네이트, 히스티딘, 글리신, 숙시네이트 및 트리에탄올아민 완충액으로 구성된 군으로부터 선택될 수 있다. 그러므로, 완충액은 K2HP04, Na2HP04 또는 소듐 시트레이트일 수 있다.
바람직한 구현예에서, 완충액은 TRIS 완충액이다. TRIS 완충액은, 예를 들어, 트로메타민 USP, THAM, 트리즈마(Trizma), 트리스아민(Trisamine), 트리스 아미노(Tris amino) 및 트로메타몰을 포함하는 트로메타민에 대해 다양한 다른 명칭으로 공지되어 있다. TRIS라는 명칭은 상기 언급된 모든 명칭을 포함한다.
또한, 완충액은, 예를 들어, 비경구 사용, 특히 약학적 제형이 비경구 사용을 위한 것인 경우 USP 상용성 완충액으로부터 선택될 수 있다. 예를 들어, 완충액은 일염기 산, 예를 들어, 아세트산, 벤조산, 글루콘산, 글리세르산 및 락트산, 이염기산, 예를 들어, 아코니트산, 아디프산, 아스코르브산, 탄산, 글루탐산, 말산, 숙신산 및 타르타르산, 다염기산, 예를 들어, 시트르산 및 인산 및 염기, 예를 들어, 암모니아, 디에탄올아민, 글리신, 트리에탄올아민 및 TRIS로 구성된 군으로부터 선택될 수 있다.
조성물은 보존제, 예를 들어, 티메로살, 클로로부탄올, 벤즈알코늄 클로라이드, 또는 클로르헥시딘, 완충제, 예를 들어, 포스페이트, 보레이트, 카르보네이트 및 시트레이트, 및 증점제, 예를 들어, 고분자량 카르복시 비닐 중합체, 예를 들어, B. F. Goodrich Chemical Company의 상표인 카르보폴의 명칭으로 시판되는 것, 하이드록시메틸셀룰로스 및 폴리비닐 알콜을 함유할 수 있으며, 이들은 모두 선행 기술에 따른다.
본 발명의 일부 구현예에서, 약학적으로 허용되는 첨가제는 안정화제를 포함한다. 안정화제는, 예를 들어, 세제, 아미노산, 지방산, 중합체, 다가 알콜, 금속 이온, 환원제, 킬레이트제 또는 항산화제일 수 있으나, 임의의 다른 적합한 안정화제가 또한 본 발명과 함께 사용될 수 있다. 예를 들어, 안정화제는 폴록사머, 트윈-20(Tween-20), 트윈-40, 트윈-60, 트윈-80, Brij, 금속 이온, 아미노산, 폴리에틸렌 글리콜, 트리톤(Triton) 및 아스코르브산으로 구성된 군으로부터 선택될 수 있다.
또한, 안정화제는 아미노산, 예를 들어, 글리신, 알라닌, 아르기닌, 류신, 글루탐산 및 아스파르트산, 계면화성제, 예를 들어, 폴리소르베이트 20, 폴리소르베이트 80 및 폴록사머 407, 지방산, 예를 들어, 포스파티딜 콜린 에탄올아민 및 아세틸트립토파네이트, 중합체, 예를 들어, 폴리에틸렌 글리콜 및 폴리비닐피롤리돈, 다가 알콜, 예를 들어, 소르비톨, 만니톨, 글리세린, 수크로스, 글루코스, 프로필렌 글리콜, 에틸렌 글리콜, 락토스 및 트레할로스, 항산화제, 예를 들어, 아스코르브산, 시스테인 HCL, 티오글리세롤, 티오글리콜산, 티오소르비톨 및 글루타티온, 환원제, 예를 들어, 여러 티올, 킬레이트제, 예를 들어, EDTA 염, 글루탐산 및 아스파르트산으로 구성된 군으로부터 선택될 수 있다.
약학적으로 허용되는 첨가제는 등장성 염, 고장성 염, 저장성 염, 완충액 및 안정화제로 구성된 군으로부터 선택된 하나 이상을 포함할 수 있다.
바람직한 구현예에서, 보존제와 같은 다른 약학적 부형제가 존재한다. 일 구현예에서, 상기 보존제는 파라벤, 비제한적인 예로, 메틸 파라하이드록시벤조에이트 또는 프로필 파라하이드록시벤조에이트이다.
본 발명의 일부 구현예에서, 약학적으로 허용되는 첨가제는 점액용해제(예를 들어, N-아세틸 시스테인), 히알루론산, 사이클로덱스트린, 석유를 포함한다.
안구 또는 부속기 조직으로의 국소 조성물의 경피 전달을 촉진하고 진척시키기 위해 본 발명의 약학적 조성물에 혼입될 수 있는 예시적 화합물은 알콜(에탄올, 프로판올 및 노난올), 지방 알콜(라우릴 알콜), 지방산(발레르산, 카프로산 및 카프르산), 지방산 에스테르(이소프로필 미리스테이트 및 이소프로필 n-헥사노에이트), 알킬 에스테르(에틸 아세테이트 및 부틸 아세테이트), 폴리올(프로필렌 글리콜, 프로판디온 및 헥산트리올), 설폭시드(디메틸설폭시드 및 데실메틸설폭시드), 아미드(우레아, 디메틸아세트아미드 및 피롤리돈 유도체), 계면활성제(소듐 라우릴 설페이트, 세틸트리메틸암모늄 브로마이드, 폴락사머, 스팬, 트윈, 담즙염 및 레시틴), 테르펜(d-리모넨, 알파-테르펜올, 1,8-시네올 및 멘톤), 및 알카논(N-헵탄 및 N-노난)을 포함하나, 이에 제한되지는 않는다. 또한, 국소 투여되는 조성물은 카드헤린 길항제, 셀렉틴 길항제 및 인테그린 길항제를 포함하나, 이에 제한되지는 않는 표면 접착 분자 조절제를 포함할 수 있다.
또한, 안과 용액은 결막낭에서 약제의 체류를 개선시키기 위해 증점제, 예를 들어, 하이드록시메틸셀룰로스, 하이드록시에틸셀룰로스, 하이드록시프로필메틸셀룰로스, 메틸셀룰로스, 폴리비닐피롤리돈 등을 함유할 수 있다.
일 구현예에서, 본 발명에 따라 사용하기 위한 벡터 시스템은 안과적으로 허용되는 보존제, 계면활성제, 점도 향상제, 침투 향상제, 완충제, 소듐 클로라이드 및 수성의 멸균 안과용 현탁액 또는 용액을 형성시키기 위한 물과 조합될 수 있다. 안과용 용액은 벡터 시스템의 용해를 돕기 위해 안과적으로 허용되는 계면활성제를 추가로 포함할 수 있다. 벡터 시스템을 생리학적으로 허용되는 등장성 수성 완충액에 용해시켜 안과용 용액 제형이 제조될 수 있다.
멸균의 안과용 연고 제형을 제조하기 위해, 벡터 시스템은 무기질유, 액체 라놀린 또는 백색 바셀린과 같은 적절한 비히클에서 보존제와 조합될 수 있다. 멸균 안과용 젤 제형은 유사한 안과용 제조물에 대해 공개된 제형에 따라, 예를 들어, 카르보폴-940 등의 조합으로부터 제조된 친수성 염기에 벡터 시스템을 현탁시킴으로써 제조될 수 있으며; 보존제 및 긴장성 제제가 혼입될 수 있다.
바람직하게는, 본 발명의 제형은 국소 치료를 위한 치료적 유효량의 벡터 시스템; 조성물의 국소 적용시 벡터 시스템과 관련된 불편함을 감소시키기에 효과적인 상기 조성물의 물에서 가용성인 유도체의 양과 상기 조성물의 0.05 중량/부피 % 사이의 양으로 존재하는 잔틴 유도체로서, 상기 잔틴 유도체가 테오필린, 카페인, 테오브로민 및 이들의 혼합물로 구성된 군으로부터 선택되는, 잔틴 유도체; 안과용 보존제; 및 등장성, 수성, 비자극성 안과용 조성물을 제공하기 위한 완충제를 포함하는 눈으로의 국소 적용을 위한 수성의 비자극성 안과용 조성물이다.
약물 전달 장치
일 구현예에서, 본 발명은 적어도 벡터 시스템 및 약학적으로 상용성인 중합체로 구성된 약물 전달 장치를 포함한다. 예를 들어, 조성물은 상기 중합체에 혼입되거나 코팅된다. 조성물은 화학적으로 결합되거나 중합체에 의해 물리적으로 포획된다. 중합체는 소수성이거나 친수성이다. 중합체 장치는 다수의 물리적 배열을 포함한다. 중합체 장치의 예시적인 물리적 형태는 필름, 스캐폴드, 챔버, 구체, 미세구, 스텐트 또는 기타 구조를 포함하나, 이에 제한되지는 않는다. 중합체 장치는 내부 및 외부 표면을 갖는다. 장치는 하나 이상의 내부 챔버를 갖는다. 이들 챔버는 하나 이상의 조성물을 함유한다. 장치는 하나 이상의 화학적으로 구별되는 단량체의 중합체를 함유한다. 장치의 서브유닛 또는 단량체는 시험관 내 또는 생체 내에서 중합된다.
바람직한 구현예에서, 본 발명은 중합체 및 상기 중합체 내에 또는 상에 혼입된 생리활성 조성물을 포함하는 장치를 포함하고, 상기 조성물은 벡터 시스템을 포함하고, 상기 장치는 안구 표면 조직, 안구 표면 조직과 접촉한 부속기 조직, 유체 충전된 안구 또는 부속기 강, 또는 안구 또는 부속기 강에 이식되거나 이에 주사된다.
장치가 형성될 수 있는 예시적인 점막접착성 다중음이온성 천연 또는 반합성 중합체는 폴리갈락투론산, 히알루론산, 카르복시메틸아밀로스, 카르복시메틸키틴, 콘드로이틴 설페이트, 헤파린 설페이트 및 메소글리칸을 포함하나 이에 제한되지는 않는다. 일 구현예에서, 장치는 선택적으로 전체 또는 부분적으로 생분해될 수 있는 생체적합성 중합체 매트릭스를 포함한다. 하이드로겔은 적합한 중합체 매트릭스 물질의 일 예이다. 하이드로겔을 형성할 수 있는 물질의 예는 폴리락트산, 폴리글리콜산, PLGA 중합체, 알기네이트 및 알기네이트 유도체, 젤라틴, 콜라겐, 아가로스, 천연 및 합성 다당류, 폴리아미노산, 예를 들어, 폴리펩티드, 특히 폴리(리신), 폴리에스테르, 예를 들어, 폴리하이드록시부티레이트 및 폴리-.엡실론.-카프롤락톤, 폴리무수물; 폴리포스파진, 폴리비닐 알콜), 폴리(알킬렌 옥사이드), 특히 폴리(에틸렌 옥사이드), 폴리(알릴아민)(PAM), 폴리(아크릴레이트), 변형된 스티렌 중합체, 예를 들어, 폴리(4-아미노메틸스티렌), 플루로닉 폴리올, 폴리옥사머, 폴리(우론산), 폴리(비닐피롤리돈) 및 상기의 공중합체, 예를 들어, 그라프트 공중합체를 포함한다. 또 다른 구현예에서, 스캐폴드는 다양한 합성 중합체 및 천연 발생 중합체, 비제한적인 예로, 콜라겐, 피브린, 히알루론산, 아가로스 및 라미닌 풍부 젤로부터 제작될 수 있다.
하이드로겔에 대한 하나의 바람직한 물질은 알기네이트 또는 변형된 알기네이트 물질이다. 알기네이트 분자는 중합체 사슬에 따라 비율 및 순차적 분포가 다양한 (1-4)-결합된 β-D-만누론산(M 단위) 및 L-글루론산(G 단위) 단량체로 구성된다. 알기네이트 다당류는 2가 양이온(예를 들어, Ca+2, Mg+2, Ba+2)에 대해 강한 친화성을 갖고 이들 분자에 노출되는 경우 안정적인 하이드로겔을 형성하는 중합전해질 시스템이다.
장치는 국소, 결막하, 또는 공막위 공간, 피하 또는 관내 투여된다. 특히, 장치는 안구 조직의 표면 위 또는 바로 아래에 배치된다. 대안적으로, 장치는 누관 또는 눈물샘 내부에 배치된다. 중합체 내로 또는 중합체 상에 혼입된 조성물은 장치로부터 방출되거나 확산된다.
일 구현예에서, 조성물은 컨택트 렌즈 또는 약물 전달 장치 내로 또는 컨택트 렌즈 또는 약물 전달 장치 상에 혼입되며, 여기서 하나 이상의 분자가 렌즈 또는 장치로부터 확산되거나 일시적으로 제어되는 방식으로 방출된다. 이러한 구현예에서, 컨택트 렌즈 조성물은, 예를 들어, 렌즈가 시력 교정에 필요한 경우 안구 표면에 남아 있거나, 컨택트 렌즈가 시간의 함수로서 용해되어 조성물을 밀접하게 병치된 조적으로 동시에 방출한다. 유사하게, 약물 전달 장치는 다양한 구현예에서 선택적으로 생분해성이거나 영구적이다.
예를 들어, 조성물은 상기 렌즈에 혼입되거나 코팅된다. 조성물은 화학적으로 결합되거나 컨택트 렌즈 중합체에 의해 물리적으로 포획된다. 대안적으로, 색상 첨가제는 치료 약물 조성물과 동일한 속도로 방출되는 중합체 조성물에 화학적으로 결합되거나 물리적으로 포획되어, 색상 첨가제의 강도의 변화는 중합체 내에 결합되거나 포획되어 남아 있는 치료 약물 조성물의 양 또는 용량의 변화를 나타낸다. 대안적으로 또는 추가로, 자외선(UV) 흡수제는 컨택트 렌즈 중합체 내에 화학적으로 결합되거나 물리적으로 포획된다. 컨택트 렌즈는 소수성이거나 친수성이다.
본 발명의 조성물을 전달하기 위한 수단으로 소수성 렌즈를 제작하는 데 사용되는 예시적 물질은 아메포콘 A(amefocon A), 암실포콘 A(amsilfocon A), 아퀼라포콘 A(aquilafocon A), 아르포콘 A(arfocon A), 카부포콘 A(cabufocon A), 카부포콘 B, 카르보실포콘 A(carbosilfocon A), 크릴포콘 A(crilfocon A), 크릴포콘 B, 디메포콘 A(dimefocon A), 엔플루포콘 A(enflufocon A), 엔플로포콘 B(enflofocon B), 에리포콘 A(erifocon A), 플루로포콘 A(flurofocon A), 플루실포콘 A(flusilfocon A), 플루실포콘 B, 플루실포콘 C, 플루실포콘 D, 플루실포콘 E, 헥사포콘 A(hexafocon A), 호포콘 A(hofocon A), 하이부포콘 A(hybufocon A), 이타비스플루오로포콘 A(itabisfluorofocon A), 이타플루오로포콘 A(itafluorofocon A), 이타포콘 A(itafocon A), 이타포콘 B, 콜포콘 A(kolfocon A), 콜포콘 B, 콜포콘 C, 콜포콘 D, 로티포콘 A(lotifocon A), 로티포콘 B, 로티포콘 C, 멜라포콘 A(melafocon A), 미가포콘 A(migafocon A), 네포콘 A(nefocon A), 네포콘 B, 네포콘 C, 온시포콘 A(onsifocon A), 오프리포콘 A(oprifocon A), 옥시플루플로콘 A(oxyfluflocon A), 파플루포콘 B(paflufocon B), 파플루포콘 C, 파플루포콘 D, 파플루포콘 E, 파플루포콘 F, 파시포콘 A(pasifocon A), 파시포콘 B, 파시포콘 C, 파시포콘 D, 파시포콘 E, 페무포콘 A(pemufocon A), 포로포콘 A(porofocon A), 포로포콘 B, 로플루포콘 A(roflufocon A), 로플루포콘 B, 로플루포콘 C, 로플루포콘 D, 로플루포콘 E, 로실포콘 A(rosilfocon A), 사타포콘 A(satafocon A), 시플루포콘 A(siflufocon A), 실라포콘 A(silafocon A), 스테라포콘 A(sterafocon A), 술포콘 A(sulfocon A), 술포콘 B, 텔라포콘 A(telafocon A), 티실포콘 A(tisilfocon A), 톨로포콘 A(tolofocon A), 트리포콘 A(trifocon A), 유니포콘 A(unifocon A), 비나포콘 A(vinafocon A) 및 윌로포콘 A(wilofocon A)를 포함하나 이에 제한되지는 않는다. 본 발명의 조성물을 전달하기 위한 수단으로 친수성 렌즈를 제작하는 데 사용되는 예시적 물질은 아바필콘 A(abafilcon A), 아코필콘 A(acofilcon A), 아코필콘 B, 아쿠아필콘 A(acquafilcon A), 알로필콘 A(alofilcon A), 알파필콘(alphafilcon A), 암필콘 A(amfilcon A), 아스티필콘 A(astifilcon A), 아틀라필콘 A(atlafilcon A), 발라필콘 A(balafilcon A), 비스필콘 A(bisfilcon A), 부필콘 A(bufilcon A), 콤필콘 A(comfilcon A), 크로필콘 A(crofilcon A), 사이클로필콘 A(cyclofilcon A), 다르필콘 A(darfilcon A), 델타필콘 A(deltafilcon A), 델타필콘 B, 디메필콘 A(dimefilcon A), 드록스필콘 A(droxfilcon A), 엘라스토필콘 A(elastofilcon A), 엡실필콘 A(epsilfilcon A), 에스테리필콘 A(esterifilcon A), 에타필콘 A(etafilcon A), 포코필콘 A(focofilcon A), 갈리필콘 A(galyfilcon A), 겐필콘 A(genfilcon A), 고바필콘 A(govafilcon A), 헤필콘 A(hefilcon A), 헤필콘 B, 헤필콘 C, 힐라필콘 A(hilafilcon A), 힐라필콘 B, 히옥시필콘 A(hioxifilcon A), 히옥시필콘 B, 히옥시필콘 C, 하이드로필콘 A(hydrofilcon A), 레네필콘 A(lenefilcon A), 리크리필콘 A(licryfilcon A), 리크리필콘 B, 리도필콘 A(lidofilcon A), 리도필콘 B, 로트라필콘 A(lotrafilcon A), 로트라필콘 B, 마필콘 A(mafilcon A), 메사필콘 A(mesafilcon A), 메타필콘 B(methafilcon B), 미파필콘 A(mipafilcon A), 넬피콘 A(nelfilcon A), 네트라필콘 A(netrafilcon A), 오쿠필콘 A(ocufilcon A), 오쿠필콘 B, C, 오쿠필콘 D, 오쿠필콘 E, 오필콘 A(ofilcon A), 오마필콘 A(omafilcon A), 옥시필콘 A(oxyfilcon A), 펜타필콘 A(pentafilcon A), 퍼필콘 A(perfilcon A), 페바필콘 A(pevafilcon A), 펨필콘 A(phemfilcon A), 폴리마콘(polymacon), 세노필콘 A(senofilcon A), 실라필콘 A(silafilcon A), 실록시필콘 A(siloxyfilcon A), 서필콘 A(surfilcon A), 테필콘 A(tefilcon A), 테트라필콘 A(tetrafilcon A), 트릴필콘 A(trilfilcon A), 비필콘 A(vifilcon A), 비필콘 B 및 자일로필콘 A(xylofilcon A)를 포함하나 이에 제한되지는 않는다.
본 발명의 범위 내에는 겔 또는 겔-유사 물질, 크림 또는 점성 에멀젼으로 제형화된 조성물이다. 상기 조성물은 조성물의 점도를 향상시키기 위해 적어도 하나의 겔화 성분, 중합체 또는 다른 적합한 제제를 포함하는 것이 바람직하다. 치료되는 영역에 해로운 영향을 미치지 않고 피부, 눈 또는 점액으로의 국소 투여를 위한 조성물 및 약학적 조성물의 제형에서 적용할 수 있는 당업자에게 공지된 임의의 겔화 성분이 사용될 수 있다. 예를 들어, 겔화 성분은 아크릴산, 카르보머, 카르복시폴리메틸렌, 예를 들어, 상표 카르보폴(예를 들어, 카르보폴 940)로 B. F. Goodrich에 의해 시판되는 물질, 폴리에틸렌-폴리프로필렌글리콜, 예를 들어, 상표 폴록사머(예를 들어, 폴록사머 188)로 BASF에 의해 시판되는 물질, 셀룰로스 유도체, 예를 들어, 하이드록시프로필 셀룰로스, 하이드록시에틸 셀룰로스, 하이드록시에틸렌 셀룰로스, 메틸 셀룰로스, 카르복시메틸 셀룰로스, 알긴산-프로필렌 글리콜 에스테르, 폴리비닐피롤리돈, 비검(마그네슘 알루미늄 실리케이트), 페물렌(Pemulen), 시물겔(Simulgel)(예를 들어, 시물겔 600, 시물겔 EG 및 시물겔 NS), 카피겔(Capigel), 콜라팩스(Colafax), 플라스돈(plasdone) 등 및 이들의 혼합물의 군으로부터 선택될 수 있다.
본 발명에 따른 겔 또는 겔-유사물질은, 예를 들어, 10% w/w 미만의 물, 예를 들어, 20% w/w 미만의 물, 예를 들어, 적어도 20%의 w/w 물, 예를 들어, 적어도 30% w/w의 물, 예를 들어, 적어도 40% w/w의 물, 예를 들어, 적어도 50% w/w의 물, 예를 들어, 적어도 75% w/w의 물, 예를 들어, 적어도 90% w/w의 물, 예를 들어, 적어도 95% w/w의 물을 포함한다. 바람직하게는, 상기 물은 탈이온수이다.
본 발명의 겔-유사 물질은 하이드로겔, 물 또는 다른 수성 매질에서 분산액으로서 형성된 콜로이드 겔을 포함한다. 따라서, 하이드로겔은 분산된 상(콜로이드)이 연속상(즉, 물)과 조합하여 점성 젤리 유사 제품, 예를 들어, 응고된 실리식산을 생성하는 콜로이드의 형성시 형성된다. 하이드로겔은 화학적 또는 물리적 결합을 통해 가교된 친수성 중합체 사슬의 3차원 네트워크이다. 중합체 사슬의 친수성 특성으로 인해, 하이드로겔은 물을 흡수하고 팽창한다. 팽창 과정은 가교되지 않은 친수성 중합체의 용해도와 동일하다. 정의에 따라, 물은 하이드로겔의 전체 중량(또는 부피)의 적어도 10%를 구성한다.
하이드로겔의 예는 합성 중합체, 예를 들어, 폴리하이드록시 에틸 메타크릴레이트, 및 화학적으로 또는 물리적으로 가교된 폴리비닐 알콜, 폴리아크릴아미드, 폴리(N-비닐 피롤리돈), 폴리에틸렌 옥사이드, 및 가수분해된 폴리아크릴로니트릴을 포함한다. 유기 중합체인 하이드로겔의 예는 공유 또는 이온 가교된 다당류 기반 하이드로겔, 예를 들어, 알기네이트, 펙틴, 카르복시메틸 셀룰로스, 헤파린, 히알루로네이트 및 키틴으로부터의 하이드로겔, 키토산, 풀루란, 겔란 및 잔탄의 다가 금속염을 포함한다. 본 발명의 실험에서 사용되는 특정 하이드로겔은 셀룰로스 화합물(즉, 하이드록시프로필메틸셀룰로스[HPMC]) 및 고분자량 히알루론산(HA)이었다.
히알루론산은 다양한 신체 조직에 의해 제조된 다당류이다. 미국 특허 5,166,331호에는 안구 내 유체에 대한 대체물 및 국소 안과용 약물 담체로서 사용하기 위한 히알루론산의 다양한 분획의 정제가 논의되어 있다. 히알루론산의 안구 용도를 논의하는 다른 미국 특허 출원은 일련 번호 11/859,627호; 11/952,927호; 10/966,764호; 11/741,366호; 및 11/039,192호를 포함한다. 안구 내 사용을 위한 거대분자의 제형이 공지되어 있다. 예를 들어, 미국 특허 출원 일련 번호 11/370,301호; 11/364,687호; 60/721,600호; 11/116,698호 및 60/567,423호; 11/695,527호를 참조한다. 다양한 활성제의 사용은 고점도 히알루론산이며 이로 공지되어 있다. 예를 들어, 미국 특허 출원 일련 번호 10/966,764호; 11/091,977호; 11/354,415호; 60/519,237호; 60/530,062호; 및 11/695,527호를 참조한다.
WO2010048086호에 기재된 바와 같은 지속 방출 제형은 본 발명의 범위 내이다.
당업자는 숙주 세포로의 폴리뉴클레오티드 또는 벡터의 통합을 위한 표준 방법, 예를 들어, 형질감염, 리포펙션, 전기천공, 미세주입, 바이러스 감염, 열 충격, 막 또는 세포 융합의 화학적 투과화 후 형질전환을 잘 인지한다.
본원에서 사용되는 용어 "숙주 세포 또는 유전적으로 조작된 숙주 세포"는 이전에 설명된 작제물 또는 벡터로 형질도입되거나, 형질전환되거나, 형질감염된 숙주 세포에 관한 것이다.
적절한 숙주 세포의 대표적인 예로서, 박테리아 세포, 예를 들어, E. 콜리, 스트렙토마이세스(Streptomyces), 살모넬라 티피무리움(Salmonella typhimurium), 진균 세포, 예를 들어, 효모, 곤충 세포, 예를 들어, Sf9, 동물 세포, 예를 들어, CHO 또는 COS, 식물 세포 등을 언급할 수 있다. 적절한 숙주의 선택은 본원의 교시로부터 당업자의 범위 내에 있는 것으로 간주된다. 바람직하게는, 상기 숙주 세포는 동물 세포, 가장 바람직하게는 인간 세포이다. 본 발명은 본원에 기재된 임의의 재조합 발현 벡터를 포함하는 숙주 세포를 추가로 제공한다. 숙주 세포는 배양된 세포 또는 일차 세포일 수 있고, 즉, 유기체, 예를 들어, 인간으로부터 직접 분리될 수 있다. 숙주 세포는 부착 세포 또는 현탁 세포일 수 있고, 즉, 현탁액에서 성장하는 세포일 수 있다. 적합한 숙주 세포는 당 분야에 공지되어 있으며, 예를 들어, DH5α, E. 콜리 세포, 차이니즈 햄스터(Chinese hamster) 난소 세포, 원숭이 VERO 세포, COS 세포, HEK293 세포 등을 포함한다.
생체 외 유전자 요법의 경우, 숙주 세포는 환자로부터 분리된 세포, 예를 들어, 조혈 줄기 세포일 수 있으며, 이는 트랜스진의 도입시 이를 필요로 하는 상기 환자에 재도입된다.
AAV 기반 바이러스 전달 시스템
AAV 벡터의 작제는 당업자에게 공지된 절차에 따르고 기술을 사용하여 수행될 수 있다. 아데노-관련 바이러스 벡터 작제 및 요법에서의 사용을 위한 이론 및 실행은 여러 과학 및 특허 간행물에 예시되어 있다(다음 참고문헌은 본원에 참조로서 포함된다: Flotte TR. Adeno-associated virus-based gene therapy for inherited disorders. Pediatr Res. 2005 Dec;58(6):1143-7; Goncalves MA. Adeno-associated virus: from defective virus to effective vector, Virol J. 2005 May 6;2:43; Surace EM, Auricchio A. Adeno-associated viral vectors for retinal gene transfer. Prog Retin Eye Res. 2003 Nov;22(6):705-19; Mandel RJ, Manfredsson FP, Foust KD, Rising A, Reimsnider S, Nash K, Burger C. Recombinant adeno-associated viral vectors as therapeutic agents to treat neurological disorders. Mol Ther. 2006 Mar;13(3):463-83).
AAV 벡터를 함유하는 약학적 조성물의 적합한 투여 형태는 주사 가능한 용액 또는 현탁액, 눈 로션 및 안과용 연고를 포함하나 이에 제한되지는 않는다. 바람직한 구현예에서, AAV 벡터는 척추강 내 주사에 의해 투여된다. 특히 바람직한 구현예에서, AAV 벡터는 망막 하 주사에 의해, 전방 또는 안구뒤 공간 및 유리체 내에서 투여된다. 바람직하게는, 바이러스 벡터는 망막 하 접근법을 통해 전달된다(문헌[Bennicelli J, et al Mol Ther. 2008 Jan 22; Reversal of Blindness in Animal Models of Leber Congenital Amaurosis Using Optimized AAV2-mediated Gene Transfer]에 기재된 바와 같음).
요법에 사용하기 위한 바이러스의 용량은 투여 경로, 질병의 중증도, 환자의 일반적인 상태 및 기타 임상 파라미터에 따라 사례를 기준으로 결정되어야 한다. 일반적으로, 적합한 투여량은 108 내지 1013 vg (벡터 유전체)/눈으로 다양할 것이다.
인테인
인테인은 단백질 스플라이싱으로 공지된 과정에서 자신을 절제하고 나머지 부분(엑스테인)과 펩티드 결합으로 연결할 수 있는 단백질의 세그먼트이다. 세그먼트는 내부 단백질 서열의 경우 "인테인"으로, 외부 단백질 서열의 경우 "엑스테인"으로 언급되며, 업스트림 엑스테인은 "N-엑스테인"으로 언급되고, 다운스트림 엑스테인은 "C-엑스테인"으로 언급된다. 단백질 스플라이싱 과정의 생성물은 성숙 단백질 및 인테인의 2개의 안정적인 단백질이다.
인테인은 또한 본원에서 "분할-인테인"으로 언급되는 2개의 별개로 전사되고 번역되는 유전자에 의해 인코딩된 2개의 단편으로 존재한다.
본 발명의 인테인은 (66)에 개시된 New England Biolabs Intein 데이터베이스에 나열된 분할 인테인을 포함하나 이에 제한되지는 않는다.
분할 인테인은 미니 인테인을 생성하기 위해 먼저 귀소 엔도뉴클레아제 도메인 서열을 제거함으로써 인테인으로부터 시작하여 생성될 수 있다. 상기 미니 인테인은 이후 공지된 결정 구조의 인테인과의 단백질 서열 정렬을 통해 설계된 하나 이상의 부위에서 분할되어 분할 인테인을 생성할 수 있으며, 본 발명의 개시에 포함된 프로토콜에 따라 트랜스-스플라이싱 활성에 대해 검정될 수 있다.
분할 인테인은 합리적 설계에 기초한 인테인 서열의 부위 특이적 돌연변이유발 또는 변형, 및/또는 기능 선택, 파지 디스플레이 및 리보솜 디스플레이와 같은 방법을 사용한 유도 진화를 통해 활성, 효율, 일반성 및 안정성을 포함하는 바람직한 특징에서 추가로 개선될 수 있다.
분할 인테인의 예는 2개의 별개의 유전자인 dnaE-ndnaE-c에 의해 인코딩된 시아노박테리아에서 DNA 중합효소 III의 촉매 서브유닛인 DnaE로부터 유래된 인테인이다. dnaE-n 유전자에 의해 인코딩된 인테인은 본원에서 "N-인테인"으로 언급된다. dnaE-c 유전자에 의해 인코딩된 인테인은 본원에서 "C-인테인"으로 언급된다. 일반적으로, 분할 인테인의 N-부분은 "N-인테인"으로 언급되고, 분할 인테인의 C-부분은 "C-인테인"으로 언급된다. 분할 인테인은 트랜스로 자가 회합하고 단백질-스플라이싱 활성을 촉매한다(본원에서 "트랜스-스플라이싱").
본 발명의 분할 인테인의 추가 예는 Npu-DnaE-n 뉴틀레오티드 서열에 의해 코딩된 SEQ ID 1 및 Npu-DnaE-c 뉴클레오티드 서열에 의해 코딩된 SEQ. ID 2로 하기 표 3에 표시된 노스톡 푼크티포르메(Nostoc punctiforme)(Npu)로부터의 DnaE의 인테인(27, 28); Rma-DnaB-n 뉴클레오티드 서열에 의해 코딩된 SEQ ID 4 및 Rma-DnaB-c 뉴클레오티드 서열에 의해 코딩된 SEQ ID 5로 하기 표에 표시된 로도써무스 마리누스(Rhodothermus marinus)(Rma)로부터의 DnaB의 인테인(29); N-인테인이 NpU(SEQ. IDs 5)의 DnaE로부터 유래되고, C-인테인이 시네코시스티스 종(Synechocystis species) 균주 PCC6803(Ssp(SEQ ID 6)로부터 각각 유래되는 돌연변이된 N- 및 C-인테인(30); 하기 표에서 각각 SEQ ID 13 및 14에 포함된 시네코시스티스 종 균주 PCC6803 N-인테인 및 C-인테인을 포함한다. 다른 인테인 시스템이 또한 사용될 수 있다. 예를 들어, dnaE 인테인, Cfa-N 및 Cfa-C 인테인 쌍에 기초한 합성 고속 인테인이 기재되었다(예를 들어, (31) 및 WO 2017/132580호, 본원에 참조로서 포함됨). Ssp GyrB 인테인, Ssp DnaX 인테인, Ter DnaE3 인테인, Ter ThyX 인테인 및 Cne Prp8 인테인을 포함하는 추가 인테인은 미국 특허 번호 8,394,604호에 기재되었다. 본 발명의 내의 추가 인테인은 WO2018071868호에 개시된 인테인이며, 여기서 인테인의 첫 번째 쌍은 하기 표에 나열되고, SEQ ID 9(N-인테인) 및 SEQ ID 10(C-인테인)으로 명명되고; 인테인의 두 번째 쌍은, 예를 들어, SEQ ID 11 및 SEQ ID 12에 나열된다.
대안적으로, 인테인 시스템은 리간드(예를 들어, 소분자, 예를 들어, 4-하이드록시타목시펜, 펩티드, 단백질, 폴리뉴클레오티드, 아미노산 및 뉴클레오티드)의 부재하에서 단백질 스플라이싱 활성을 나타내지 않거나 최소의 단백질 스플라이싱 활성을 나타내는 리간드-의존성 인테인일 수 있다. 리간드-의존성 인테인은, 예를 들어, 본원에 참조로서 포함되는 U.S. 2014/0065711 A1호에 기재된 것을 포함한다.
표 3. 본 발명의 분할 인테인의 예
Figure pct00013
Figure pct00014
Figure pct00015
본원에 기재된 바와 같이, 트랜스-스플라이싱 활성을 유지하면서 상이한 유기체로부터의 동일한 유전자로부터 유래된 인테인이 본 발명의 범위 내이다. 비제한적인 예로서, DNA-E 분할 인테인은 노스톡 푼크티포르메(Npu) 시네코시스티스 종 PCC6803(Ssp), 피쉐렐라 종 PCC 9605, 사이토네마 톨리포트리코이데스, 시아노박테리아 박테리움 SW_9_47_5, 노둘라리아 스푸미게나, 노스톡 플라겔리포르메, 크로코스파에라 왓소니이 WH 8502, 크로오콕시디오프시스 쿠바나 CCALA 043, 트리코데스미움 에리트라에움을 포함하는 시아노박테리아로부터의 DnaE 유전자(예를 들어, DNA 중합효소 III 서브유닛 알파)의 분할 인테인으로부터 유래될 수 있다. 추가 예로서, DNA-B 분할 인테인은, 예를 들어, (59)에 기재된 R. 마리누스(Rma), 시네코시스티스 종 PC6803(Ssp), 포르피라 푸르푸레아 엽록체(Ppu)를 포함하는 시아노박테리아로부터의 DnaB 유전자로부터 유래될 수 있다.
따라서, 본 발명의 분할 인테인은 천연 발생 인테인과 100%, 98%, 80%, 75%, 70%, 65%, 50% 동일할 수 있으며, 상기 인테인은 트랜스-스플라이싱 반응을 겪는 능력을 보유한다. 본 발명의 범위 내에는 트랜스-스플라이싱 활성을 유지하는 천연 발생 또는 변형 인테인의 단편이 있다.
예를 들어, Npu(노스톡 푼티포르메(Nostoc puntiforme)) DnaE와 시네코시스티스 종 PCC6803 N-인테인 사이의 정렬;
Figure pct00016
Npu(노스톡 푼티포르메) DnaE와 시네코시스티스 종 PCC6803 C-인테인 사이의 정렬을 참조한다:
Figure pct00017
따라서, 트랜스-스플라이싱 활성을 보유하는 본 발명의 인테인의 분할 인테인 변이체 및 단편이 또한 본 발명의 범위 내이다.
흥미롭게도, 인테인은 스플라이싱 활성을 보장하는 기능적 특징을 보존한 것이 보고되었다. 특히, 4개의 인테인 모티프가 확인되었다(이들의 컨센서스 서열에 대해서는 하기 참조): 블록 A-H(Pietrokovski 1994 및 Perler 1997) 및 블록 N2 및 N4(Pietrokovski 1998). 인테인 블록 A, N2, B, N4, F 및 G는 단백질 스플라이싱에 관여한다. 블록 C, D, E, H는 엔도뉴클레아제 도메인에 존재하며, 이는 분할 인테인이 부재한다. 따라서, 분할 인테인은 트랜스-스플라이싱 활성에 필수적인 보존된 모티프를 보유한다. ([Perler, F. B. (2002). InBase, the Intein Database. Nucleic Acids Res. 30, 383-384.]에 개시된 인테인 데이터베이스)
Figure pct00018
단일 잔기는 불변이지만, 블록 A의 Ser 및 Cys, 블록 B의 His, 블록 G의 His, Asn 및 Ser/Cys/Thr은 스플라이싱 모티프에서 가장 보존된 잔기이다.
본 발명의 인테인의 정렬:
나열된 모든 N-인테인의 CLUSTAL W 정렬:
Figure pct00019
Figure pct00020
나열된 모든 C-인테인의 CLUSTAL 2.1 다중 서열 정렬:
Figure pct00021
요약하면, 인테인 활성은 효율적인 트랜스-스플라이싱이 발생하기 위해 필요한 라이게이션 접합을 둘러싸는 특정 펩티드 서열(N- 및 C-엑스테인으로 언급됨)과 함께 상황 의존적이며, 이 중 가장 중요한 것은 C-엑스테인의 첫 번째 잔기로서 친핵성 티올 또는 하이드록실기(즉, Cys, Ser 또는 Thr)를 함유하는 아미노산이다.
본 발명자는 생체 내에서 큰 단백질을 재구성하기 위해 인테인 매개 단백질 트랜스플라이싱을 사용하였다. 인테인 유전자 서열에 의해 인코딩된 분할 인테인은 전구체 폴리펩티드로 생성되며, 이는 이들의 구조적 보완을 통해 단백질 트랜스-스플라이싱 반응을 재조립하고 촉매할 수 있다.
단백질 트랜스-스플라이싱의 맥락에서, N-인테인 유전자는 관심 단백질의 N-말단 부분을 코딩하는 서열과 인 프레임으로 융합되고; C-인테인 유전자는 관심 서열의 C-말단 부분을 코딩하는 서열과 인 프레임으로 융합된다. 2개의 전구체 융합 단백질의 발현시, 인테인은 자가촉매 절제를 겪고, 라이게이션된 엑스테인, 예를 들어, 관심 있는 재구성된 단백질을 형성한다.
따라서, 관심 단백질의 재구성은 상기 단백질을 2개 또는 3개의 단편으로 분할하는 것을 필요로 하며, 이들의 코딩 서열은 N- 또는 C-인테인에 융합되고 프로모터의 제어하에 있는 AAV 벡터로 개별적으로 클로닝된다. 각각의 단백질에 대한 분할 지점은 C-엑스테인에서 제1 잔기로서 접합 지점(예를 들어, 친핵성 티올 또는 하이드록실기를 함유하는 아미노산(즉, Cys, Ser 또는 Thr)의 존재)에서의 아미노산 요구사항뿐만 아니라 각각의 인테인-폴리펩티드 전구체 폴리펩티드 및 생성된 재구성된 단백질의 적절한 단백질 폴딩 및 안정성을 선호하기 위해 중요한 단백질 도메인의 온전성의 보존을 고려하여 선택된다.
특히 주목할 만한 것은, 본 발명자는 2개의 관심 단백질 내에서 접합 지점을 선택하였다: 단백질 ABCA4는 아미노산 Cys1150, Ser1168, Ser1090에서 분할되고, 분할 인테인은 분할 지점에 삽입된다. CEP290 단백질은 aa Cys1076, Ser1275, Cys929 및 1474; Ser 453 및 Cys1474에서 분할된다.
분해 신호
조절된 단백질 분해는 미스폴딩되거나, 응집되거나, 달리 비정상적인 단백질로부터 세포를 보호하고, 또한 생체 내에서 단명하도록 진화하고, 주로 유비퀴틴(Ub)-프로테아좀 시스템(UPS) 및 자가포식-리소좀 경로에 의해 매개되는 단백질의 수준을 제어하며, 분자 샤페론이 둘 모두의 시스템의 일부이다.
분해 신호는 단백질 분해 경로의 표적이 되도록 하여 반감기가 감소하는 단백질의 특징이다. 특히, N-데그론 및 C-데그론은 주요 결정인자가 각각 세포 단백질의 N-말단 및 C-말단 잔기인 분해 신호이다. N-데그론 및 C-데그론은 다양한 범위로 인접 서열 모티프 및 또한 폴리유비퀴틸화 부위로 작용하는 내부 리신 잔기를 포함한다.
본 발명의 의미 내에서, 내부 데그론은 N-말단 또는 C-말단이 아닌 단백질 서열 내부에 위치한 분해 신호로 정의되며, 이의 기능적으로 필수적으로 요소는 N-말단 잔기 또는 C-말단 잔기를 포함하지 않고 단백질 분해를 매개한다.
데그론 경로는 단백질분해 시스템의 세트를 포함하며 이의 통합 특징은 N- 또는 C- 또는 내부-데그론을 함유하는 단백질을 인식하는 이들의 능력이며 이에 의해 26S 프로테아솜 또는 자가포식에 의해 이들 단백질의 분해를 유발한다.
E. 콜리 디하이드로폴레이트 환원효소(ecDHFR)는 디하이드로폴레이트의 원핵생물 1차 대사의 여러 단계에 필수적인 보조인자인 테트라하이드로폴레이트로의 환원을 촉매하는 159-잔기 효소이다. DHFR의 다수의 억제제가 약물로 개발되었으며, 상기 억제제 중 하나인 트리메토프림(TMP)은 포유동물 DHFR보다 훨씬 더 강력하게 ecDHFR을 억제한다. 이러한 큰 치료 윈도우는 포유동물 세포에서 TMP를 "생물학적 침묵"으로 만든다. ecDHFR-TMP 상호작용의 특이성은 TMP의 상업적 이용가능성 및 매력적인 약리학적 특성과 결합되어 이러한 단백질-리간드 쌍을 분해 시스템으로 개발하는 데 이상적으로 만든다(69). 따라서, 단백질 내에서 DHFR 아미노산 서열, 바람직하게는 ecDHFR 아미노산 서열의 존재는 단백질 분해를 발생시키는 프로테아솜 시스템에 대한 표적 신호로서 기능한다. TMP의 존재하에서, 상기 단백질은 안정화된다.
편리하게는, 이와모토 등(Iwamoto et al.)에 의해 개발된 점 돌연변이를 갖는 ecDHFR 유래 데그론 신호는 N-말단 또는 내부 위치 내에 위치하는 경우에만 기능적 활성(예를 들어, 융합 단백질의 분해)을 부여하는 3개의 아미노산 돌연변이 R12Y, Y100I 및 G67S(69)를 포함한다.
가장 짧은 활성 펩티드를 확인한 본 발명자에 의해 ecDHFR-유래 데그론에 대한 추가 개선이 이루어졌다. 편리하게는, 더 짧은 서열은 동일한 AAV 벡터 내에서 더 긴 코딩 서열을 적합화하는 것을 허용한다.
본 발명의 내에서, ecDHFR 유래 데그론은 비활성인 인테인의 N-말단에 융합되었다. 단백질 트랜스플라이싱 시, 데그론은 재구성된 인테인 내에 위치하며, 이의 분해를 매개한다.
본 발명의 ecDHFR은 WT ecDHFR, 돌연변이체 DHFR, 전장 ecDHFR, 더 짧은 scDHFR이다.
DHFR은 105 내지 159 aa 길이일 수 있으며, 여기서 단축은 C-말단에서 발생한다.
ecDHFR E. 콜리 유래, 야생형
뉴클레오티드 서열: (623 nt) SEQ ID No. 27
Figure pct00022
아미노산 서열:
Figure pct00023
ecDHFR E. 콜리 유래, 내부 데그론 돌연변이체(159 aa)
굵은 글씨의 돌연변이 위치 - SEQ ID No. 29
Figure pct00024
ecDHFR E. 콜리 유래, 야생형, 최소 활성 단편
뉴클레오티드 서열: SEQ ID No. 30
Figure pct00025
Figure pct00026
ecDHFR E. 콜리 유래, 내부 데그론 돌연변이체 pe, 최소 활성 단편 (104 aa)
(굵은 글씨의 돌연변이 위치) SEQ IN No. 32
Figure pct00027
서열
본 발명의 코딩 서열은 포유동물 세포, 바람직하게는 포유동물 망막 세포, 특히 광수용체 세포, 또는 간세포, 근육 세포, 심장 세포, 신경 세포, 신장 세포, 내피 세포에서 이의 발현을 조절할 수 있는 선택적으로 인트론 서열이 뒤따르는 프로모터 서열에 작동 가능하게 연결될 수 있다. 예시적인 프로모터는 편재성, 인공 또는 조직 특이적 프로모터, 예를 들어, 전사 프로모터 활성을 보유하는 이의 단편 및 변이체, 예를 들어, 광수용체 특이적 프로모터, 예를 들어, 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1), 광수용체간 레티노이드 결합 단백질 프로모터(IRBP), 로돕신 프로모터(RHO), 난황상 황반 디스트로피 2 프로모터(VMD2), 로돕신 키나제 프로모터(RK); 근육 특이적 프로모터, 예를 들어, MCK, MYODI; 간 특이적 프로모터, 예를 들어, 티록신 결합 글로불린(TBG), 하이브리드 간 특이적 프로모터(HLP)(67); 뉴런 특이적 프로모터, 예를 들어, hSYN1, CaMKIIa; 신장 특이적 프로모터, 예를 들어, Ksp-카드헤린16, NKCC2를 포함하나, 이에 제한되지는 않는다. 본 발명에 따른 편재성 프로모터는, 예를 들어, 편재성 사이토메갈로바이러스(CMV)(32) 및 짧은 CMV(33) 프로모터이다.
선택적으로, 프로모터 서열은
Figure pct00028
-글로빈 IgG 키메라 인트론과 같은 인핸서 서열을 포함한다.
본 발명의 목적을 위해, 바람직하게는 본원에 개시된 서열, 또는 유전 부호의 축퇴성으로 인해 동일한 아미노산 서열을 인코딩하는 서열로부터 각각 선택되는 EGFP(YP_009062989), ABCA4 및 CEP290의 코딩 서열은 포유동물 망막 세포, 특히 광수용체 세포에서의 이의 발현을 조절할수 있는 프로모터 서열에 기능적으로 연결된다.
예시적인 아데닐중합체형성 신호는 소 성장 호르몬 아데닐중합체형성 신호(bGHpA), 인간 베타 글로빈 아데닐중합체형성 신호 또는 짧은 합성 버전(68), SV40 아데닐중합체형성 신호, 또는 다른 천연 발생 또는 인공 아데닐중합체형성 신호를 포함하나, 이에 제한되지는 않는다.
본 발명은 재구성된 인테인 단백질의 안정성을 감소시키기 위해 분해 신호의 뉴클레오티드 서열의 사용을 제공한다. 편리하게는, 최대 효과를 유지하기 위해 하나 이상의 서열이 반복될 수 있다.
본 발명에 따른 적합한 분해 신호는 (i) 미스폴딩된 단백질과 구조적 유사성을 공유하고, 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩티드인 짧은 데그론 CL1, (ii) 공여 단백질의 N-말단에서의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해 둘 모두를 매개하는 유비퀴틴, (iii) CL1 데그론과 유사하게 본원 및 (69)에 기재된 바와 같은 유비퀴틴 경로의 효소, 변이체 ecDHFR 및 이의 단편에 의해 인지되는 구조에서 폴딩되는 것으로 예측되는 9개 아미노산 길이의 펩티드인 N-말단 PB29 데그론, 특히 N-말단 또는 내부 위치 내에 위치하는 경우에만 기능적 활성(예를 들어, 융합 단백질의 분해)을 부여하는 3개의 아미노산 돌연변이인 R12Y, Y100I 및 G67S를 포함하는 점 돌연변이를 갖는 ecDHFR 유래 데그론 신호를 포함한다.
예시적인 분해 신호는 참조로서 본원에 포함되는 WO 201613932호에 기재되어 있다.
당업자는 용이하게 인지될 수 있는 바와 같이 실험실의 숙련된 장인이 인위적으로 생성할 수 있는 변이체에 더하여 자연에서 발견되는 단백질의 다수의 변이체 서열이 있을 수 있다. 본 발명의 폴리뉴클레오티드 및 폴리펩티드는 본원에서 구체적으로 예시된 것뿐만 아니라 변이체가 원하는 기능적 활성을 유지하는 한 이의 임의의 천연 변이체뿐만 아니라 인위적으로 생성될 수 있는 임의의 변이체를 포함한다. 또한, 변이체 폴리펩티드가 본원에 구체적으로 예시된 폴리펩티드와 실질적으로 동일한 관련 기능 활성을 유지하는 한 폴리펩티드의 서열 내에서의 아미노산 치환, 첨가 또는 결실을 제외하고 본원에 예시된 폴리펩티드의 동일한 아미노산 서열을 갖는 폴리펩티드가 본 발명의 범위 내이다. 예를 들어, 폴리펩티드의 기능에 영향을 미치지 않는 폴리펩티드 내의 보존적 아미노산 치환은 본 발명의 범위 내일 것이다. 따라서, 본원에 개시된 폴리펩티드는 구체적으로 예시된 서열의 상기 논의된 바와 같은 변이체 및 단편을 포함하는 것으로 이해되어야 한다. 본 발명은 본원에 개시된 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 이들 뉴클레오티드 서열은 본원에 제시된 단백질 및 아미노산 서열의 지식을 갖는 당업자에 의해 용이하게 작제될 수 있다. 당업자에 의해 인지되는 바와 같이, 유전 부호의 축퇴성은 장인이 특정 폴리펩티드 또는 단백질을 인코딩하는 다양한 뉴클레오티드 서열을 작제하는 것을 가능하게 한다. 특정 뉴클레오티드 서열의 선택은, 예를 들어, 특정 발현 시스템 또는 숙주 세포의 코돈 사용에 좌우될 수 있다. 대상 폴리펩티드에 구체적으로 예시된 것 이외의 아미노산의 치환을 갖는 폴리펩티드가 또한 본 발명의 범위 내에서 고려된다. 예를 들어, 치환된 아미노산을 갖는 폴리펩티드가 아미노산이 치환되지 않은 폴리펩티드와 실질적으로 동일한 활성을 보유하는 한 비-천연 아미노산은 본 발명의 폴리펩티드의 아미노산을 대체할 수 있다. 비-천연 아미노산의 예는 오르니틴, 시트룰린, 하이드록시프롤린, 호모세린, 페닐글리신, 타우린, 요오도티로신, 2,4-디아미노부티르산, a-아미노 이소부티르산, 4-아미노부티르산, 2-아미노 부티르산, γ-아미노 부티르산, ε-아미노 헥산산, 6-아미노 헥산산, 2-아미노 이소부티르산, 3-아미노 프로피온산, 노르류신, 노르발린, 사르코신, 호모시트룰린, 시스테산, τ-부틸글리신, τ-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 디자이너 아미노산(designer amino acid), 예를 들어, β-메틸 아미노산, C-메틸 아미노산, N-메틸 아미노산, 및 일반적으로 아미노산 유사체를 포함하나, 이에 제한되지는 않는다. 비-천연 아미노산은 또한 유도체화된 측면 기를 갖는 아미노산을 포함한다. 더욱이, 단백질의 임의의 아미노산은 D(우회전) 형태 또는 L(좌회전) 형태일 수 있다. 아미노산은 일반적으로 비극성, 하전되지 않은 극성, 염기성 및 산성의 부류로 분류될 수 있다. 한 부류의 아미노산을 갖는 폴리펩티드가 동일한 부류의 또 다른 아미노산으로 대체되는 보존적 치환은 치환을 갖는 폴리펩티드가 치환을 갖지 않는 폴리펩티드와 실질적으로 동일한 생물학적 활성을 여전히 보유하는 한 본 발명의 범위 내에 속한다. 표 4는 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.
표 4. 각각의 부류에 속하는 아미노산의 예의 목록
Figure pct00029
변이체 폴리뉴클레오티드가 본원에 구체적으로 예시된 폴리뉴클레오티드와 실질적으로 동일한 관련 기능적 활성을 보유하는 한(예를 들어, 이들은 예시된 폴리뉴클레오티드에 의해 인코딩되는 것과 동일한 아미노산 서열 또는 동일한 기능적 활성을 갖는 단백질을 인코딩함) 폴리뉴클레오티드의 서열 내에서 뉴클레오티드 치환, 첨가 또는 결실을 제외하고 본원에 예시된 폴리뉴클레오티드의 동일한 뉴클레오티드 서열을 갖는 폴리뉴클레오티드가 또한 본 발명의 범위 내이다. 따라서, 본원에 개시된 폴리뉴클레오티드는 구체적으로 예시된 서열의 상기 논의된 바와 같은 변이체 및 단편을 포함하는 것으로 이해되어야 한다.
본 발명은 표준의 엄격한 조건 및 표준 방법(Maniatis, T. et al, 1982) 하에서 서열과의 하이브리드화를 허용하도록 본 발명의 폴리뉴클레오티드 서열과 충분히 상동성인 서열을 갖는 폴리뉴클레오티드 분자를 또한 고려한다. 본원에 기재된 폴리뉴클레오티드는 또한 본원에 예시된 것과 보다 특정한 동일성 및/또는 유사성 범위의 관점에서 정의될 수 있다. 서열 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 더욱 바람직하게는 80% 초과, 더욱 더 바람직하게는 90% 초과일 것이고, 95% 초과일 수 있다. 서열의 동일성 및/또는 유사성은 본원에 예시된 서열과 비교하여 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 또는 그 초과일 수 있다. 달리 명시되지 않는 한, 본원에서 사용되는 바와 같은 2개의 서열의 서열 동일성 및/또는 유사성 백분율은 칼린 및 알트슐(Karlin and Altschul)(1993)에서와 같이 변형된 칼린 및 알트슐(1990)의 알고리즘을 사용하여 결정될 수 있다. 상기 알고리즘은 알트슐 등(1990)의 NBLAST 및 XBLAST 프로그램에 통합되어 있다. BLAST 검색은 NBLAST 프로그램, 스코어 = 100, 단어길이 = 12로 수행하여 원하는 서열 동일성 백분율을 갖는 서열을 획득할 수 있다. 비교 목적을 위해 갭이 있는 정렬을 획득하기 위해, 문헌[Altschul et al., (1997)]에 기재된 바와 같은 Gapped BLAST가 사용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 각각의 프로그램(NBLAST 및 XBLAST)의 디폴트 파라미터가 사용될 수 있다. NCBI/N1H 웹사이트를 참조한다.
본 발명의 플라스미드
Figure pct00030
Figure pct00031
Figure pct00032
EGFP
p915_pAAV2.1-TBG-5' EGFP 인테인 (SEQ IN No. 33)
Figure pct00033
TBG 프로모터: 굵은 글씨 (seq B)
5' EGFP: 밑줄 (seq C)
Figure pct00034
3x플래그: 이탤릭체 (seq E)
WPRE: 이탤릭체 밑줄 (seq F)
Bgh 폴리A: 굵은 글씨 밑줄 (seq G)
Figure pct00035
Figure pct00036
Figure pct00037
p917_pAAV2.1-TBG-3' EGFP 인테인
5' ITR (seq A)
TBG 프로모터 (seq B)
C-인테인 Npu DnaE (seq I) SEQ ID No. 34
Figure pct00038
3' EGFP (seq L) SEQ IN No. 35
Figure pct00039
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p914_pAAV2.1-CMV-5' EGFP 인테인
5' ITR (seq A)
CMV 프로모터 (seq M) SEQ ID No. 36
Figure pct00040
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p916_pAAV2.1-CMV-3' EGFP 인테인
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 Npu DnaE (seq I)
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p932_pAAV2.1-GRK-5' EGFP 인테인
5' ITR (seq A)
GRK1 프로모터 (seq N) SEQ ID No. 37
Figure pct00041
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p933_pAAV2.1-GRK1-3' EGFP 인테인
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 Npu DnaE (seq I)
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p36 pAAV2.1-CMV-5' EGFP 인테인_ecDHFR
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O) SEQ ID No. 38
Figure pct00042
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p37 pAAV2.1-CMV-5' EGFP 인테인_미니 ecDHFR
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
미니 ecDHFR (seq P) SEQ ID No. 39
Figure pct00043
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p902_pAAV2.1-CMV-5' EGFR 인테인 DnaB
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 RmaDnaB (seq Q) SEQ ID No. 40
Figure pct00044
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p903_pAAV2.1-CMV-3' EGFR 인테인 DnaB
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 Rma DnaB (seq R) SEQ ID No. 41
Figure pct00045
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1256_pAAV2.1-CMV-5' EGFR 인테인 mDnaE
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 mDnaE (seq S) SEQ ID No. 42
Figure pct00046
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1257 pAAV2.1-CMV-3' EGFR 인테인 mDnaE
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 mDnaE (seq T) SEQ ID No. 43
Figure pct00047
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
CEP290
p1005 pAAV2.1-CMV260-5' CEP290 인테인 (세트 1)
5' ITR (seq A)
CMV260 (seq U) SEQ ID No. 44
Figure pct00048
5' CEP290: SEQ ID No. 45
Figure pct00049
Figure pct00050
N-인테인 DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V) SEQ ID No. 46
Figure pct00051
3' ITR (seq H)
p1093 pAAV2.1-CMV260-3' CEP290 인테인 (세트 1)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 47
Figure pct00052
Figure pct00053
Figure pct00054
C-인테인 DnaE (seq I)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1065 pAAV2.1-CMV260-5' CEP290 인테인 (세트 2)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 48
Figure pct00055
Figure pct00056
Figure pct00057
N-인테인 DnaE (seq D)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1067 pAAV2.1-CMV260-3' CEP290 인테인 (세트 2)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 49
Figure pct00058
Figure pct00059
Figure pct00060
C-인테인 DnaE (seq I)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1087 pAAV2.1-CMV260-5' CEP290 인테인 (세트 3)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 50
Figure pct00061
Figure pct00062
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1088 pAAV2.1-CMV260-3' CEP290 인테인 (세트 3)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 51
Figure pct00063
Figure pct00064
C-인테인 mDnaE (seq T)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1182 pAAV2.1-CMV260-5' CEP290 인테인 (세트 4)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 52
Figure pct00065
Figure pct00066
N-인테인 DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1183 pAAV2.1-CMV260-CEP290 바디 인테인 (세트 4)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 DnaE (seq I)
CEP290 바디: SEQ ID No. 53
Figure pct00067
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1181 pAAV2.1-CMV260-3' CEP290 인테인 (세트 4/세트 5)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 Rma DnaB (seq R)
3' SEP290: SEQ ID No. 54
Figure pct00068
Figure pct00069
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1179 pAAV2.1-CMV260-5' CEP290 인테인 (세트 5)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 55
Figure pct00070
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1180 pAAV2.1-CMV260-CEP290 바디 인테인 (세트 5)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 mDnaE (seq T)
CEP290 바디: SEQ ID No. 56
Figure pct00071
Figure pct00072
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1152 pAAV2.1-GRK1-5' CEP290 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
5' CEP290: SEQ ID No. 57
Figure pct00073
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1153 pAAV2.1-GRK-CEP290 바디 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 mDnaE (seq T)
CEP290 바디: SEQ ID No. 58
Figure pct00074
Figure pct00075
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1156 pAAV2.1-GRK1-3' CEP290 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 Rma DnaB (seq R)
3' CEP290: SEQ ID No. 59
Figure pct00076
Figure pct00077
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
pzac-GRK1-5' ABCA4 인테인 (세트 1) SEQ ID No. 60
5' ITR (seq A)
GRK1: 굵은 글씨
5' ABCA4: 밑줄
Figure pct00078
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00079
Figure pct00080
pzac-GRK1-3' ABCA4 인테인 (세트 1) SEQ ID No. 61
5' ITR (seq A)
GRK1: 굵은 글씨
3' ABCA4: 밑줄
Figure pct00081
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00082
Figure pct00083
Figure pct00084
pzac-CMV260-5' ABCA4 인테인 (세트 1) SEQ ID No. 62
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
Figure pct00085
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00086
Figure pct00087
Figure pct00088
pzac-CMV260-3' ABCA4 인테인 (세트 1) SEQ ID No. 63
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
Figure pct00089
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00090
Figure pct00091
Figure pct00092
p38 pAAV2.1-CMV260-5' ABCA4 인테인_ecDHFR (세트 1)
5' ITR (seq A)
CMV260 (seq U)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p39 pAAV2.1-CMV260-5' ABCA4 인테인_미니 ecDHFR (세트 1)
5' ITR (seq A)
CMV260 (seq U)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
미니 ecDHFR (seq P)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p40 pAAV2.1-GRK1-5' ABCA4 인테인_ecDHFR (세트 1)
5' ITR (seq A)
GRK1 (seq N)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p41 pAAV2.1-GRK1-5' ABCA4 인테인_미니 ecDHFR (세트 1) SEQ ID No. 64
5' ITR (seq A)
GRK1: 굵은 글씨
5' ABCA4: 밑줄
Figure pct00093
3x플래그: 이탤릭체
Figure pct00094
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00095
Figure pct00096
pzac-CMV260-5' ABCA4 인테인 (세트 2) SEQ ID No. 65
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
Figure pct00097
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00098
Figure pct00099
Figure pct00100
pzac-CMV260-3' ABCA4 인테인 (세트 2) SEQ ID No. 66
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
Figure pct00101
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00102
Figure pct00103
Figure pct00104
pzac-CMV260-5' ABCA4 인테인 (세트 3) SEQ ID No. 67
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
Figure pct00105
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00106
Figure pct00107
Figure pct00108
pzac-CMV260-3' ABCA4 인테인 (세트 3) SEQ ID No. 68
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
Figure pct00109
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00110
Figure pct00111
Figure pct00112
p836 (IRBP_DsRed) SEQ ID No. 69
5' ITR (seq A)
IRBP 굵은 글씨
WPRE: 이탤릭체 밑줄
DsRed 밑줄
BghpA: 굵은 글씨 밑줄
3' ITR (seq H)
Figure pct00113
p1232 pAAV2.1_HLP_5' F8 인테인 (세트 1)
5' ITR (seq A)
HLP 프로모터 (seq J) SEQ ID No. 70
Figure pct00114
F8 신호 서열 (seq K) SEQ ID No. 71
Figure pct00115
5' F8: SEQ ID No. 72
Figure pct00116
Figure pct00117
Figure pct00118
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1389 pAAV2.1_HLP_3' F8 인테인 (세트 1)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
C-인테인 Npu DnaE (seq I)
3' F8:SEQ ID No. 73
Figure pct00119
Figure pct00120
Figure pct00121
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1207 pAAV2.1_HLP_5' F8 인테인 (세트 2)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
5' F8 (세트 2): SEQ ID No. 74
Figure pct00122
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1388 pAAV2.1_HLP_3' F8 인테인 (세트 2)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
C-인테인 Npu DnaE (seq I)
3' F8: SEQ ID No. 75
Figure pct00123
Figure pct00124
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
본 발명은 이제 비제한적인 예에 의해 예시될 것이다.
재료 및 방법
AAV 벡터 플라스미드의 생성
AAV 벡터 생성에 사용되는 플라스미드는 AAV 혈청형 2의 ITR을 함유하는 pAAV2.1(36) 또는 pZac(37) 플라스미드로부터 유래되었다. AAV 인테인 플라스미드는 도 1a 및 도 S5에 상술된 바와 같이 설계되었다. EGFP 단백질은 아미노산(a.a.) C71에서 분할되었다. ABCA4 단백질은 a.a. C1150(세트 1), a.a. S1168(세트 2) 및 a.a. C1090(세트 3)에서 큰 세포질 도메인 CD1(34, 35)에서 분할되었다. a.a. C1150(세트 1) 및 S1168(세트 2)은 공지된 ABCA4 기능과 관련되지 않은 영역에 속하지만, C1090은 a.a. 929에서 a.a. 1148에 걸쳐 있는 ABCA4 뉴클레오티드 결합 도메인에 포함된다. 모든 CEP290 분할 지점은 코일드-코일(coiled-coil) 도메인에 속하며(36): CEP290이 2개의 폴리펩티드로 분할된 경우, 이는 a.a. C1076(세트 1) 또는 S1275(세트 2-3)에서 발생했으며, 3개의 폴리펩티드로 분할된 경우, 이는 a.a. C929 및 C1474(세트 4) 또는 a.a. S453 및 C1474(세트 5)에 존재하였다.
플라스미드에 포함된 인테인은 노스톡 푼크티포르메(Npu)로부터의 DnaE의 인테인(27, 28), 또는 Npu 및 시네코시스티스 종 균주 PCC6803(Ssp) 각각의 DnaE로부터의 돌연변이된 N- 및 C-인테인으로 구성된 인테인(30), 또는 로도써무스 마리누스(Rma)로부터의 DnaB의 인테인(29)이었다. 연구에 사용된 플라스미드는 편재성 사이토메갈로바이러스(CMV)(38) 및 짧은 CMV(39) 프로모터 또는 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1) 40 프로모터의 제어 하에 있었다. EGFP 및 CEP290을 인코딩하는 플라스미드는 소 성장 호르몬 아데닐중합체형성 신호(bGHpA)를 포함한 반면, ABCA4를 인코딩하는 플라스미드는 유인원 바이러스 40(SV40) 아데닐중합체형성 신호를 포함하였다.
AAV 벡터 생성 및 특성규명
AAV 벡터는 이미 설명된 바와 같이 HEK293 세포의 삼중 형질감염에 의해 TIGEM AAV 벡터 코어에 의해 생성되었다(14, 41). 인테인 서열을 포함하거나 포함하지 않는 AAV 벡터 사이에 벡터 수율의 차이는 관찰되지 않았다.
세포의 형질강‘m 및 AAV 감염
HEK293 세포는 이미 기재된 바와 같이 칼슘 포스페이트 방법(1 μg의 각각의 플라스미드/6웰 플레이트 포맷의 웰)을 사용하여 유지되고 형질감염되었다(14). 도 S9에 기재된 실험을 위해, 1 μg의 AAV 인테인 플라스미드에 함유된 동일한 수의 분자에 해당하는 전장 유전자를 인코딩하는 플라스미드의 양을 사용하였다. 각각의 웰에서 형질감염된 DNA의 전체량은 필요한 경우 스크램블 플라스미드의 첨가에 의해 동일하게 유지하였다.
도 2c 및 2d의 실험에 사용된 HeLa 세포를 Lipofectamine LTX(Invitrogen)를 사용하여 형질감염시켰다(1 또는 0.5 μg의 각각의 플라스미드/24웰 플레이트 포맷의 웰). AAV 감염을 이미 기재된 바와 같이 수행하였다(14).
iPSC 및 망막 분화 배양
인간 유도 다능성 줄기 세포(iPSC)는 (42)에 기재된 방법을 사용하여 피부 생검에서 배양된 섬유모세포에서 유래되었다. STGD1 세포주는 (43)에 또한 기재된 ABCA4 화합물 이형접한 변이체 c.4892T>C 및 c.4539+2001G>A, 또는 화합물 이형접합 변이체 c.[2919-?_3328+?del; 4462T>C] 및 c.5196+1137G>A를 가졌다. c.[2919-?_3328+?del; 4462T>C]는 2개의 변이체로 구성된 대립유전자이다. c.2919-? 3328+?del은 엑손 20, 21 및 22뿐만 아니라 인트론 19 및 22의 공지되지 않은 세그먼트의 결실을 구성한다. 이러한 결실은 c.4462T>C를 갖는 시스 입체형태에서 발견되었다. iPSC는 mTeSR™배지(#85850; Stem cell technologies)를 함유하는 마트리겔(#354277, Corning® Matrigel® hESC-Qualified Matrix; Corning, NY)-코팅된 6웰 플레이트에서 유지시켰다. 2-6분 동안 0.5 mM EDTA(#AM9260G; Ambion)를 사용하여 약 80% 컨플루언스에서 세포를 계대배양하였다. 망막 분화는 이전에 기재된 프로토콜의 조합을 기반으로 하였다(44, 45). 간단히 말해서, iPSC를 RevitaCell Supplement(#A-2644501; Gibco, ThermoFisher) 및 1% 마트리겔을 함유하는 V-바닥 96웰 플레이트(9,000 세포/웰)에 플레이팅하여 응집체 형성을 유도하였다. 이후, 응집체를 배양하여 (46)에 보고된 바와 같이 3D 망막 오르가노이드를 생성시켰다.
웨스턴 블롯 분석 및 ELISA
샘플(HEK293 세포, 망막 및 망막 오르가노이드)을 RIPA 완충액에 용해시켜 EGFP, ABCA4 및 CEP290 단백질을 추출하였다. 용해 완충액에 프로테아제 억제제(완전 프로테아제 억제제 칵테일 정제; Roche, Basel, Switzerland) 및 1 mM 페닐메틸설포닐을 보충하였다. 용해 후, ABCA4 샘플을 2 M 우레아가 보충된 1X Laemmli 샘플 완충액에서 15분 동안 37℃에서 변성시켰다. EGFP 및 CEP290 샘플을 1X Laemmli 샘플 완충액에서 5분 동안 99℃에서 변성시켰다. 용해질을 12%(EGFP 샘플의 경우) 또는 6%(ABCA4 및 CEP290 샘플의 경우) SDS-폴리아크릴아미드 겔 전기영동으로 분리하였다. 면역블로팅에 사용된 항체는 다음과 같았다: EGFP, ABCA4 및 CEP290 단백질을 검출하기 위한 항-3x플래그(1:1000, A8592; Sigma-Aldrich, Saint Louis, MO, USA); ABCA4를 검출하기 위한 항-ABCA4(1:500, LS-C87292; LifeSpan BioSciences, Inc. Seattle, USA); 항-필라민 A(1:1000, #4762; Cell Signaling Technology, Danvers, MA, USA); 시험관 내 실험에서 로딩 대조군으로 사용되는 β-액틴인 필라민 A를 검출하기 위한 항-β-액틴(1:1000, NB600-501; Novus Biological LLC, Littleton, CO, USA); 생체 내 실험에서 로딩 대조군으로 사용되는 디스펄린(Dysferlin)을 검출하기 위한 항-디스펄린(1:500, Dysferlin, clone Ham1/7B6, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). 웨스턴 블롯에 의해 검출된 EGFP, ABCA4 및 CEP290 밴드의 정량화는 ImageJ 소프트웨어(무료 다운로드는 http://rsbweb.nih.gov/ij/에서 이용 가능함)를 사용하여 수행하였다.
도 21에 제시된 실험을 위해, AAV 인테인 벡터가 주사된 Abca4 -/- 마우스 및 대조군 한배새끼 Abca4 +/- 마우스 둘 모두로부터의 망막 용해질을 상기 기재된 바와 같이 30
Figure pct00125
의 용해 완충액에서 용해시키고, 25 또는 5
Figure pct00126
의 용해질을 각각 항-ABCA4 항체(LS-C87292; 에피토프 보존: 인간 ABCA4의 경우 100%; 뮤린 Abca4의 경우 86%)를 사용한 웨스턴 블롯에 사용하였다. ImageJ 소프트웨어를 사용하여 밴드 강도의 정량화에 의해 측정된 망막 용해질에서의 ABCA4의 양을 이후 아크릴아미드 겔에 로딩된 망막 용해질의 부피로 표준화하였다. 도 9의 실험에서, HEK293 세포를 도면에 보고된 바와 같이 증가된 용량의 트리메토프림(T7883, Sigma-Aldrich)으로 매일 처리하였다.
ELISA는 Max Discovery Green Fluorescent Protein Kit ELISA(Bioo Scientific Corporation, Austin, TX, USA)를 사용하여 세포 또는 마우스 및 돼지 망막 용해질에서 수행하였다.
rAAV 벡터 DNA의 서던 블롯 분석.
DNA를 1.5 내지 6 x 1010 바이러스 입자(GC로 측정됨)로부터 추출하였다. 패키징되지 않은 유전체를 분해하기 위해, 벡터 용액을 37℃에서 2시간 동안 50 mM Tris, pH 7.5 및 1 mM MgCl2를 함유하는 300 μl의 전체 부피에서 30 μl의 DNase(Roche)와 함께 인큐베이션하였다. 이후, DNase를 50 mM EDTA로 비활성화시킨 후, 프로테이나제 K 및 2.5% N-라우릴-사르코실 용액과 함께 1시간 동안 50℃에서 인큐베이션하여 캡시드를 용해시켰다. DNA를 페놀-클로로포름으로 2회 추출하고, 2 부피의 에탄올 100% 및 10% 소듐 아세테이트(3 M) 및 1
Figure pct00127
의 글리코겐(20
Figure pct00128
)으로 침전시켰다. 알칼리성 아가로스 겔 전기영동을 이전에 기재된 바와 같이 수행하였다(Sambrook, J., and Russell, D.W. 2001. Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory Press. Cold Spring Harbor, New York, USA. 999 pp). 5102 bp의 밴드를 생성하기 위해 Smal를 이용한 pF8-V3의 이중 분해에 의해 마커를 생성시켰다. HLP 프로모터에 특이적인 프로브를 사용하였다.
활성화된 부분 트롬보플라스틴 시간(aPTT)
9개 부분의 혈액을 안구 뒤 후퇴에 의해 완충된 트리소듐 시트레이트 0.109M(BD, Franklin Lakes, NJ, USA)의 한 부분으로 수집하였다. 15분 동안 13000 rpm에서 샘플을 원심분리하여 혈장을 분리하였다.
제조업체의 매뉴얼에 따라 aPTT 프로그램을 사용하여 Coatron M4(
Figure pct00129
)에서 aPTT를 측정하였다.
면역침전 및 액체 크로마토그래피/질량 분광법 분석
세포를 100 mm 플레이트(1x107 세포/플레이트)에 플레이팅하고, 칼슘 포스페이트 방법(20 μg의 각각의 플라스미드/플레이트)을 사용하여 AAV-EGFP 또는 ABCA4 인테인 플라스미드로 현탁액에서 형질감염시켰다. 세포를 형질감염 72시간 후에 수확하고, EGFP 및 ABCA4 단백질 둘 모두를 제조업체 지침에 따라 항-플래그 M2 자기 비드(M8823; Sigma-Aldrich)를 사용하여 면역침전시켰다. 단백질을 37℃에서 4M 우레아가 보충된 샘플 완충액에서 15분 동안 인큐베이션하여 비드로부터 용리시켰다. 이후, 단백질을 12%(EGFP의 경우) 또는 6%(ABCA4의 경우) SDS-폴리아크릴아미드 겔 전기영동에 로딩하였다. 쿠마시 블루(Coomassie Blue)로 염색한 후 절단된 26 및 30개의 단백질 밴드(각각 AAV-EGFP 및 ABCA4 인테인 플라스미드로 2회 및 3회 독립적으로 형질감염된 HEK293 세포로부터)를 단백질 시퀀싱(Creative proteomics, Shirley, NY)에 사용하였다. 간단히 말해서, 트립신, 키모트립신, Glu-C, Arg-C, Asp-N 및 Lys-N의 효소 각각에 의한 분해를 위해 3개의 겔 슬라이드를 사용하였다. ABCA4를 분해하기 위해 펩신을 추가로 사용하였다. 생성된 펩티드는 탠덤 질량 분광법(tandem Mass Spectrometry)(나노 LC-MS/MS) 분석과 결합된 나노스케일 액체 크로마토그래피를 사용하여 확인하고 정량하였다. 획득된 질량 분광법 데이터를 PEAKS STUDIO 8.5를 사용하여 분석하였다. 본 발명자는 EGFP 및 ABCA4 단백질 둘 모두에 대해 100%의 단백질 서열 적용범위를 달성하였다.
동물 모델
동물을 TIGEM 동물 시설(Naples)에 수용하고, 12시간 명/암 주기로 유지하였다. C57BL/6J 마우스를 Envigo(Italy)에서 구입하였다.
알비노 Abca4 -/- 마우스를 BALB/c 마우스(Rpe65 Leu450에 대해 동형접합)와의 연속 교배 및 역교배를 통해 생성시키고, 근친교배를 유지하였다. BXD24/TyJ-Cep290rd16/J(rd16으로 언급됨) 마우스는 The Jackson Laboratory(JAX stock #000031)에서 수입되었다. rd16 마우스는 엑손 35-39를 포함하는 897 bp의 인-프레임 결실을 갖는다(46). 동형접합 암컷과 동형접합 수컷을 교배시켜 마우스를 유지시켰다. 혈우병 마우스 B6;129S-F8tm1Kaz/J(F8tm1으로 언급됨)를 The Jackson Laboratory(JAX stock #004424)에서 수입하였다. F8tm1 마우스는 엑손 16의 3' 말단의 7 bp 및 인트론 16의 5' 말단의 286 bp를 포함하여 293 bp의 서열을 대체하는 네오마이신 내성 카세트를 갖는다. 마우스 콜로니는 동형접합 암컷과 반접합체 수컷을 교배함으로써 유지시켰다.
이러한 연구에 사용된 대형 백색 암컷 돼지(Azienda Agricola Pasotti, Imola, Italy)는 이탈리아 국립 돼지 사육 협회(Italian National Pig Breeders' Association)의 LWHerd Book에 순종으로 등록되었으며, Centro di Biotecnologie A.O.R.N. Antonio Cardarelli (Naples, Italy)에서 사육되었고, 12시간의 명/암 주기로 유지시켰다.
마우스 및 돼지에서의 AAV 벡터의 망막하 주사
이러한 연구를 안과 및 시력 연구에서의 동물 사용에 대한 시력 및 안과 연구 협회 성명 및 동물 절차에 대한 이탈리아 보건부 규정에 따라 수행하였다. 마우스에 대한 모든 절차는 2015년 3월 6일에 이탈리아 보건부; 보건, 동물 보건, 영양 및 식품 안전과의 승인을 받았다.
마우스 및 돼지에서의 망막하 주사를 이전에 기재된 바와 같이 수행하였다(예를 들어, 14). 마우스 눈에 1 μl 또는 0.5 μl(rd16 새끼의 경우)의 벡터 용액을 주사하였다. AAV2/8 용량은 결과 섹션에 기재된 바와 같이 다양한 마우스 실험에서 다양하였다. 돼지 눈에 100 μl의 AAV2/8 벡터 용액의 2개의 인접한 망막하 수포를 주사하였다. AAV2/8 용량은 2x10^11 GC의 각각의 벡터/눈이었고, 따라서 2개의 AAV 벡터의 공동 주입은 4x10^11 GC/눈의 전체 용량을 발생시켰다.
조직학, 광학 및 형광 현미경검사
조직학적 섹션에서 EGFP 발현을 평가하기 위해, C57BL/6J 마우스 및 대형 백색 돼지 둘 모두로부터의 망막 오르가노이드, 눈을 고정시키고, 이전에 기재된 바와 같이 섹션화하였다. DAPI(Vector Lab Inc., Peterborough, UK)가 있는 Vectashield가 장착된 EGFP 양성 냉동절편을 적절한 여기 및 검출 설정을 사용하여 공초점 LSM-700 현미경(Carl Zeiss, Oberkochen, Germany)에서 분석하고, 40x 배율로 획득하였다. 적녹 색맹의 유병률로 인해, 적색 및 녹색의 존재를 함께 피하기 위해, 원본 이미지의 색이 도 14에서 수정되었다.
AAV CEP290 인테인 벡터가 주사된 rd16 마우스에서 외부 핵층의 두께를 평가하기 위해, 눈을 밤새 4% 파라포름알데하이드(PFA)에서 고정시킨 후, 연속 에탄올에서 탈수시킨 후, 파라핀 블록에 포매시켰다. rd16 마우스(10 μm)의 연속 단면을 수평 경선을 따라 절단하고, 슬라이드에 점진적으로 분포하고, 헤마톡실린 및 에오신(H&E)으로 염색하였다. 이후, 섹션을 현미경(Leica Microsystems GmbH; DM5000)으로 분석하고, 20x 배율로 획득하였다. 각각의 눈에 대해, 눈의 중앙 영역에 있는 슬라이스의 시간적 주입 측면으로부터의 하나의 이미지를 분석에 사용하였다. ImageJ 소프트웨어의 "프리핸드 라인(freehand line)"을 사용하여 유전자형/치료 그룹에 마스킹된 작업자에 의해 각각의 이미지에서 ONL 두께의 3회 측정을 획득하였다.
면역형광 분석
ABCA4 또는 CEP290 AAV 인테인 플라스미드로 형질감염된 HeLa 세포를 형질감염 후 24시간에 10분 동안 4% PFA에 고정시켰다. 세포를 30분 동안 차단 완충액(PBS 중 0.05% 사포닌, 0.5% BSA, 50mM NH4Cl, 0.02%NaN3, pH7.2)에서 차단한 후, 다음과 같이 인큐베이션하였다:
- ABCA4 단백질을 검출하기 위해 항-플래그 M2 항체(F1804, Sigma-Aldrich); 세포질그물을 염색하기 위해 항-VAP-B 항체[Antonella De Matteis lab에서 생산됨((47)] 및 트랜스-골지 네트워크를 염색하기 위해 TGN46(AHP-499, Serotech)로 1시간 동안. PBS에서 세척 후, 세포를 30분 동안 2차 항체와 인큐베이션하였다: 항-플래그, -VAP-B 및 -TGN46 항체 각각에 대해 특이적인 염소 항-마우스 Alexa Fluor 568; 염소 항-토끼 Alexa Fluor 488, 당나귀 항-양 Alexa Fluor 633.
- CEP290 단백질을 검출하기 위해 항-플래그 항체(F7425, Sigma-Aldrich), 및 미세소관을 염색하기 위해 항-아세틸화 튜불린 항체(T6793, Sigma-Aldrich)로 밤새. PBS에서 세척 후, 세포를 1시간 동안 적절한 2차 항체와 함께 인큐베이션하였다: 각각 항-플래그 및 -Ac-튜불린 항체에 특이적인 염소 항-토끼 Alexa Fluor 594 및 당나귀 항-마우스 Alexa Fluor 488.
핵을 DAPI로 염색하였다. 적녹 색맹의 유병률로 인해, 적색 및 녹색의 존재를 함께 피하기 위해, 원본 이미지의 색이 도 2 c-d 및 도 18 모두에서 수정되었다.
인간 망막 오르가노이드의 면역형광에 사용되는 항체는 다음과 같다:
항-인간 추상체-어레스틴(arrestin)(CAR)(50, 51)(1:10000, 'Luminaire founders' hCAR; Dr Cheryl M. Craft, Doheny Eye Institute, Los Angeles, CA, USA로부터의 선물); 항-옵신, 레드/그린(1:200, AB5405; Merck Millipore, Darmstadt, Germania); 항-레코베린(anti-Recoverin)(1:500, AB5585; Merck Millipore); 항-CRX(A-9, 1:250, sc377138; Santa Cruz Biotechnology, Dallas, Texas, USA); 항-로돕신(1D4, 1:200, ab5417, Abcam, Cambridge, MA, USA).
투과 및 주사 전자 현미경 분석
전자 현미경(EM) 분석을 위해, AAV 망막하 주사 후 3개월에 Abca4 -/- 마우스를 밤새 어둡게 적응시킨 후, 눈을 수확하였다. 눈을 18시간 동안 0.1 M PHEM 완충액 pH 6.9 중 0.2% 글루타르알데하이드(GA) - 2% PFA에 고정시킨 후, 0.1 M PHEM 완충액으로 헹구었다. 이후, 눈을 광학 현미경 하에서 절개하여 아이컵(eyecup)의 시간적 주입 영역을 선택하였다. 이후, 아이컵의 상기 부분을 2.3 M 수크로스가 주입된 12% 젤라틴에 포매시켰다. 냉동절편(60 nm)을 액체 질소에서 동결시키고, Leica Ultramicrotome EM FC7(Leica Microsystems)을 사용하여 절단하였다. 다양한 실험 그룹에 대한 데이터 속성의 편향을 피하기 위해, iTEM 소프트웨어(Olympus SYS, Hamburg, Germany)를 사용하여 유전자형/치료 그룹에 마스킹된 작업자에 의해 망막 색소 상피에서 리포푸신 과립이 차지하는 영역의 측정을 수행하였다. 각각의 필드에서 각각의 리포푸신 과립의 영역은 iTEM 소프트웨어의 '프리 핸드 폴리곤' 도구를 사용하여 적어도 20개의 상이한 이미지(25 μm2 영역)에서 측정하였다.
주사 전자 현미경(SEM) 분석을 위해, 망막 오르가노이드를 GA에 고정하고, Os04로 염색하고, 에탄올에서 탈수하고, 임계점 건조 절차를 사용하여 건조시켰다. 이후, 건조된 표본을 SEM 표본 스텁(stub)에 장착하고, 얇은 층의 금으로 코팅하였다. 표본의 표면 3차원 구성을 분석하고, 이미지를 JEOL 6700F 주사 전자 현미경(JEOL Ltd., Tokyo, Japan)을 사용하여 획득하였다.
미세구조 분석을 위해, 망막 오르가노이드를 0.2 M PHEM 완충액 pH 7.3 중 2% PFA 및 1% GA의 혼합물로 밤새 고정시켰다. 고정 후, 표본을 이전에 기재된 바와 같이 사후-고정시켰다. 이후, 이들을 탈수시키고, 에폭시 수지에 포매시키고, 72시간 동안 60℃에서 중합시켰다. 얇은 연속 60 nm 섹션을 Leica EM UC7 박절기에서 절단하였다.
EM 이미지를 VELETTA CCD 디지털 카메라(FEI, Eindhoven, The Netherlands)가 장착된 FEI Tecnai-12 전자 현미경을 사용하여 획득하였다.
전기생리학 기록 및 스펙트럼 도메인 광학 간섭 단층촬영
기능적 및 형태학적 분석을 이미 기재된 바와 같이 수행하였다(14).
동공 광 반응
rd16 마우스로부터의 동공 광 반응을 전하-결합 장치 NikonDlH 디지털 카메라(Topcon Biomedical Systems, Oakland, NJ)에 연결된 TRC-50IX 망막 카메라를 사용하여 어두운 조건에서 기록하였다. 마우스를 대략 10초 동안 10 럭스 광 자극에 노출시키고, IMAGEnet 소프트웨어(Topcon Biomedical Systems)를 사용하여 눈 당 하나의 사진을 획득하였다. 각각의 눈에 대해, 동공 직경을 눈 직경(측두에서 비강까지)으로 표준화하였다.
통계 분석
일원 ANOVA 검사(지표 검사) 또는 크루스칼-왈리스(Kruskal-Wallis) 순위 합계 검사(비-지표 검사)를 수행하여 종속 변수에 대한 2개 이상의 그룹의 독립 변수 사이의 통계적으로 유의한 차이가 있는지 결정하였다. P-값은 다음과 같다: 시험관 내(p 크루스칼-왈리스(Kruskal-Wallis) = 0.006036), 마우스 망막(p ANOVA = 0.00585), 및 돼지 망막(p 크루스칼-왈리스 = 0.009005)에서의 EGFP 단백질 정량을 위한 ELISA 검정;
도 5a(p ANOVA = 0.00585); 도 5b(p 크루스칼-왈리스 = 5.547E-5); 도 5c(p ANOVA=5.81E-10); ERG 분석(a- 및 b-파 진폭 둘 모두에 대해 분석된 모든 휘도에서 p ANOVA 또는 p 크루스칼-왈리스 > 0.05); 도 S14의 OCT 분석(ABCA4의 경우 p ANOVA = 0.52 및 CEP290의 경우 p ANOVA = 0.965). 그룹의 평균 사이의 다중 쌍별-비교로 결정된 그룹 사이의 통계적으로 유의한 차이는 다음과 같다: 시험관 내(단일 AAV 대 이중 AAV = 0.012; AAV 인테인 대 이중 AAV = 0.012; 단일 AAV 대 AAV 인테인 = 0.222), 마우스 망막(단일 AAV 대 이중 AAV = 0.0044; AAV 인테인 대 이중 AAV = 0.3754; 단일 AAV 대 AAV 인테인 = 0.0561) 및 돼지 망막(단일 AAV 대 이중 AAV = 0.012; AAV 인테인 대 이중 AAV = 0.012; 단일 AAV 대 AAV 인테인 = 0.841)에서의 EGFP 단백질 정량화를 위한 ELISA 검정; 도 5a: +/+ 대 -/- AAV 인테인 = 0.4530; +/+ 대 -/- = 0.0002; 도 5b: 야생형 대 rd16 AAV 인테인 = 0.00131; 도 5c: 야생형 대 rd16 AAV 인테인 1E-07; 야생형 대 rdl6 neg < IE-06.
실시예
실시예 1. AAV-EGFP 인테인은 시험관 내에서 전장 단백질을 재구성한다.
본 발명자는 망막에서 인테인 매개 단백질 트랜스-스플라이싱의 효율을 시험하였다; 2개의 AAV 벡터를 생성시켰으며, 각각은 노스톡 푼크티포르메[Npu 도 1a]로부터의 DnaE 분할-인테인의 N- 및 C-말단 절반에 각각 융합된 리포터 EGFP 단백질의 N- 또는 C-말단 절반을 인코딩한다. EGFP 단백질은 아미노산(a.a.) C71에서 분할되었다. 각각의 AAV 벡터는 적절한 조절 요소(즉, 프로모터 및 소 성장 호르몬 아데닐중합체형성 신호(bGHpA) 및 삼중 플래그 태그(3x플래그))를 포함하여 둘 모두의 절반뿐만 아니라 전장의 재구성된 EGFP 단백질의 검출을 허용하였다(도 1a).
AAV-EGFP Dna E 인테인 플라스미드를 사용하여 인간 배아 신장 293(HEK293) 세포를 형질감염시키고, 단일 N- 및 C-말단 절반뿐만 아니라 전장 EGFP 단백질의 생성을 평가하였다. 도 12에 제시된 바와 같이 전장 EGFP를 인코딩하는 단일 AAV 플라스미드로 형질감염된 세포에서 관찰된 것과 동등한 EGFP 형광은 AAV-EGFP 인테인 플라스미드로 공동 형질감염된 세포에서 검출되었지만, 단일 N- 및 C-말단 AAV-EGFP 인테인 플라스미드로 공동 형질감염된 세포에서 검출되지 않았다. 도 1b에 제시된 바와 같이 성숙 단백질에서 스플라이싱된 DnaE 인테인(약 17 kDa)과 함께 예상 크기(약 28 kDa)의 트랜스-스플라이싱된 EGFP 단백질의 존재를 둘 모두의 AAV-EGFP 인테인 플라스미드의 공동 형질감염 후에만 HEK293 세포 용해질의 웨스턴 블롯(WB) 분석에 의해 확인하였다. 또한, 밴드 강도의 정량화는 AAV 인테인 플라스미드로부터의 EGFP 단백질 양이 단일 AAV 플라스미드에서 관찰된 것의 76 ± 37%(n= 3의 독립적인 실험)임을 나타내었다. 단백질 재구성의 정확성을 정의하기 위해, EGFP를 AAV-EGFP 인테인 플라스미드로 형질감염된 HEK293 세포로부터 면역정제하였고, 액체 크로마토그래피-질량 분광법(LC-MS) 분석을 수행하여 이의 단백질 서열을 정의하였다. 이러한 샘플의 단백질분해성 분해로부터 획득된 3539 펩티드(이 중 7개가 분할 지점을 포함함(표 5))는 전체 단백질을 포함하였고, AAV 인테인 플라스미드에 의해 재구성된 EGFP의 아미노산 서열이 야생형 EGFP의 것과 정확히 일치함을 확인하였다.
표 5. EGFP 분할 지점을 포함하는 펩티드.
C = 시스테인 71
Figure pct00130
실시예 2. AAV-EGFP 인테인은 시험관 내에서 이중 AAV 벡터보다 효율적이다.
AAV 인테인 벡터에서 EGFP 단백질 재구성을 확인하기 위해, HEK293 세포를 AAV2/2-CMV-EGFP DnaE 인테인 또는 동일한 발현 카세트를 포함한 단일 및 이중 AAV 벡터로 감염시켰다. 이중 벡터가 완전한 DNA 또는 단백질 재조합을 겪는다고 가정하는 3개의 시스템 사이의 유사한 용량을 의미하는 5x10^4 유전체 카피(GC)/세포의 각각의 벡터의 감염 다중도(m.o.i). EGFP 양을 정확하게 정량하기 위해, 감염 후 72시간에 세포 용해질을 수확하였다. EGFP 발현을 WB 및 효소 결합 면역흡착 검정(ELISA) 둘 모두에 의해 평가하였다: AAV 인테인 벡터로 획득된 EGFP 발현은 단일 AAV로 달성된 것의 대략 절반(단일 AAV = 0.735 ± 0.2 ng EGFP/μg 전체 용해질, n=5의 독립적 실험; AAV 인테인 = 0.403 ± 0.04 ng EGFP/μg 전체 용해질, n=5의 독립적 실험) 및 도 1c에 제시된 바와 같이 이중 AAV 벡터로 획득된 것보다 10배(이중 AAV = 0.046 ± 0.01 ng EGFP/μg 전체 용해질, n=5의 독립적 실험) 더 높았다. 또한, 절제된 인테인의 것에 비한 전장 EGFP의 강도를 WB로 정량화하였고; 이들의 상대적 풍부함은 1:0.2(n=6의 독립적 실험, 도 13a)인 것으로 밝혀졌다.
실시예 3. AAV-EGFP 인테인 벡터의 망막하 투여는 마우스 및 돼지 망막 둘 모두에서 효율적인 전장 단백질 재구성을 발생시킨다.
AAV 인테인-매개 트랜스-스플라이싱이 망막에서 전장 단백질 발현을 재구성하는지의 여부를 조사하기 위해, 4주령 C57BL/6J 마우스에 AAV2/8-CMV-EGFP Dna E 인테인 벡터(각각의 벡터의 용량/눈: 5.8x10^9 GC)를 망막하 주사하였다. 눈을 1개월 후에 수확하고, 현미경 분석으로 분석하였다. EGFP 형광은 망막 색소 상피의 모든 눈에서, 가장 중요하게는 광수용체에서 검출되었다(도 1d). 광수용체에서의 단일 및 이중 AAV의 것에 대해 AAV 인테인으로부터의 트랜스진 발현을 비교하기 위해, 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1) 프로모터의 제어 하에서 EGFP를 인코딩하는 AAV2/8 벡터를 4주령 C57BL/6J 마우스에 망막하 주사하였다(각각의 벡터의 용량/눈: 5x10^9 GC). 눈을 주사 1개월 후에 수확하고, 형광 현미경, ELISA 또는 WB로 분석하였다.
EGFP 형광을 도 1e에서 관찰된 바와 같이 모든 세트의 벡터가 주사된 눈의 광수용체 세포층에서 검출되었다. ELISA에 의한 EGFP 단백질 양의 정확한 정량화는 AAV 인테인이 단일 AAV보다 덜 효율적이고, 이중 AAV보다 약 3배 더 효율적으로 EGFP 단백질을 재구성하였음을 확인하였다(단일 AAV = 8.41 ± 2.48 ng EGFP/망막, n=5 눈; AAV 인테인 = 3.72 ± 0.85 ng EGFP/망막, n=7 눈; 이중 AAV = 1.38 ± 0.43 ng EGFP/망막, n=7 눈). WB 밴드 강도의 정량화 후 절제된 인테인에 대한 전장 EGFP의 상대량은 1:3(n=14 분석된 눈, 도 13b)이었다.
이후, 본 발명자는 돼지 망막에서 광수용체를 형질도입할 때 AAV 인테인 벡터의 효율성을 평가하였고, 이는 이의 크기 및 구조로 인해 바이러스 벡터 형질도입을 평가하는 우수한 전임상 모델이다(48). 따라서, 대형 백색 돼지에 단일 인테인 및 이중 AAV2/8-GRK1-EGFP 벡터(각각의 벡터의 용량/눈: 2x10^11 GC, 2개의 인접한 망막하 수포를 통해 전달됨)를 망막하 주사하였다. 눈을 주사 1개월 후에 수확하고, 형광 현미경, ELISA 또는 WB로 분석하였다. 특히, 광수용체 세포층에서 AAV 인테인 매개 EGFP 단백질 재구성은 EGFP 형광에 의해 평가된 바와 같이 이중 AAV에 의해 매개된 것보다 높았고 단일 AAV 벡터와 구별할 수 없었다(도 1f). 망막 용해질에서 EGFP의 정확한 정량화는 AAV 인테인이 단백질을 단일 AAV로 달성한 것과 유사하고 이중 AAV 벡터로 획득된 것보다 약 3배 더 높은 양으로 재구성하는 것을 확인하였다(단일 AAV = 247.5 ± 45.1 ng EGFP/망막, n= 5 눈; AAV 인테인 = 227.0 ± 15.7 ng EGFP/망막, n=5 눈; 이중 AAV = 82.3 ± 9.6 ng EGFP/망막, n=5 눈). WB 밴드 강도의 정량화 후 절제된 인테인에 대한 전장 EGFP의 상대량은 1:2(n=8 눈, 도 13c)이었다.
실시예 4. 전장 EGFP는 3D 인간 망막 오르가노이드에서 AAV 매개 단백질 트랜스-스플라이싱에 의해 재구성된다.
인간 망막을 대표하는 추가 전임상 모델로서, 본 발명자는 인간 유도 다능성 줄기 세포(iPSC)로부터 3D 망막 오르가노이드를 생성시켰다(49, 50). 6개월된 오르가노이드(도 14a)는 도 14b에 제시된 바와 같이 성숙 광수용체 마커에 의해 염색된 세포를 함유하였고; 오르가노이드는 형광 분석에 의해 도 14c에 제시된 바와 같이 광수용체 특이적 프로모터를 갖는 AAV2 벡터, 즉, AAV2/2 CMV EGFP 및 AAV2/2 IRBP DsRed 벡터에 의해 성공적으로 형질도입되었다. 광학(도 14d) 및 전자(도 14e-f) 현미경은 광수용체 외부 세그먼트의 버드(bud)의 존재를 제시한다. AAV-GRK1-EGFP 인테인 벡터(각각의 벡터의 용량/오르가노이드: 1x10^12 GC)와 함께 30일 동안 인큐베이션된 9개월된 3D 인간 망막 오르가노이드는 EGFP 형광을 제시한다(도 1g). 망막 오르가노이드 용해질의 WB 분석(도 15)은 밴드 강도 정량화(n = 4 오르가노이드) 후 절제된 인테인보다 약 5배 더 풍부한 전장 EGFP 발현을 확인한다.
실시예 5. 큰 단백질의 인테인 매개 트랜스스플라이싱(효율적인 AAV 인테인 매개 단백질 트랜스-스플라이싱을 위해 최적의 ABCA4 및 CEP90 분할 지점의 확인이 필요함)
단백질 트랜스-스플라이싱이 큰 치료 단백질을 재구성하는 메커니즘으로 개발될 수 있는지의 여부를 시험하기 위해, 본 발명자는 AAV-ABCA4 및 -CEP290 인테인 벡터를 개발하였다.
ABCA4 및 CEP290을 2개(AAV I, AAV II) 또는 3개(AAV I, AAV II, AAV III)의 단편으로 분할하였고, 이의 코딩 서열은 단일 AAV 벡터에서 개별적으로 클로닝되었고, 도 16에 제시된 바와 같이 분할-인테인 N- 및 C-말단의 코딩 서열에 융합되었다. AAV 인테인 벡터는 편재성 짧은 CMV[(shCMV), 모든 세트에 대해] 또는 GRK1 프로모터(ABCA4에 대해 세트 1 및 CEP290에 대해 세트 5)를 포함하였다.
각각의 단백질에 대한 분할 지점은 효율적인 단백질 트랜스-스플라이싱을 위한 접합 지점에서의 아미노산 잔기 요구사항(18, 51)뿐만 아니라 각각의 독립적인 폴리펩티드 및 이에 따른 최종 재구성된 단백질의 적절한 폴딩 및 안정성을 선호하는 중요 단백질 도메인의 온전성의 보존 둘 모두를 고려하여 선택하였다. 추가 분할-인테인을 또한 고려하였다. 단백질이 3개의 폴리펩티드(세트 4 및 5, 도 16b)로 분할된 CEP290 세트를 우드척 간염 바이러스 전사 후 조절 요소[WPRE, (52)]의 포함을 허용하도록 생성시켜 트랜스진 발현을 증가시켰다. 생성된 전장 단백질의 양을 감소시킬 수 있는 AAV I과 AAV III 사이의 원치 않는 트랜스-스플라이싱을 방지하기 위해, 세트 4 및 5는 2개의 분할 접합에서 2개의 상이한 분할-인테인, 특히 로도써무스 마리누스로부터의 DnaB 인테인 및 야생형 DnaE 인테인 또는 본 발명자가 교차 반응하지 않는 것을 제시하는 돌연변이된 DnaE 인테인을 포함하였다(도 17).
본 발명자는 HEK293 세포의 형질감염 후 ABCA4 및 CEP290을 재구성하는 AAV 인테인 플라스미드의 각각의 세트의 능력을 비교하였다. 형질감염 72시간 후 세포 용해질의 WB 분석은 예상 크기의 전장 ABCA4 및 CEP290 단백질(각각 약 250 kDa 및 약 290 kDa)이 다양한 효율로 AAV 인테인 플라스미드의 각각의 세트로부터 재구성된 것을 나타내었다(도 2a-b). 세트 1 및 5는 각각 ABCA4 및 CEP290 단백질 재구성에 가장 효율적인 것으로 밝혀졌으며, 따라서 모든 후속 실험에 사용하였다.
단백질 재구성의 정확성을 정의하기 위해, 본 발명자는 세트 1로 형질감염된 HEK293 세포로부터의 ABCA4를 면역정제하고, LC-MS 분석을 수행하여 이의 단백질 서열을 정의하였다. 이러한 샘플의 단백질분해성 분해로부터 획득된 3108 펩티드(이 중 22개가 분할 지점을 포함함(표 6))는 전체 단백질을 포함하였고, AAV 인테인 플라스미드에 의해 재구성된 ABCA4의 아미노산 서열이 야생형 ABCA4의 것과 정확히 일치함을 확인하였다. AAV 인테인에 의해 재구성된 ABCA4의 아미노산 서열은 야생형 ABCA4의 것과 일치한다. AAV 인테인에서 재구성된 ABCA4의 액체 크로마토그래피-질량 분광법 분석에서 확인된 야생형 ABCA4 서열과 펩티드 사이의 정렬을 수행하였다.
표 6. ABCA4 분할 지점을 포함하는 펩티드.
N.B.: C : 시스테인 1150
Figure pct00131
Figure pct00132
Figure pct00133
이후, 본 발명자는 상이한 인테인 함유 플라스미드의 단백질 생성물의 세포 내 국소화를 전장 단백질의 국소화와 비교하여 이들을 평가하였다. 전장 ABCA4는 배양된 세포주에서 발현시 세포질그물(ER)에 위치하는 것으로 공지되어 있다(53, 54). 세트 1로부터의 2개의 ABCA4 폴리펩티드는 ER에서 공동 국소화하는 것으로 밝혀진 반면, 트랜스-골지 네트워크에서는 공동국소화가 밝혀지지 않았다(도 2c). AAV 인테인 플라스미드로 공동 형질감염된 세포뿐만 아니라 전장 ABCA4 단백질을 인코딩하는 플라스미드로 형질감염된 세포에서 유사한 국소화가 관찰되었고, 따라서 이는 세포주에서 외인적으로 발현된 ABCA4의 ER에서의 우세한 국소화를 확인한다.
CEP290의 경우, 전장 단백질이 우세한 점 모양 및 작은 원섬유 패턴을 갖는 혼합 분포 패턴을 나타내는 것으로 보고되었다(55). CEP290의 세포하 표적화를 담당하는 도메인의 해부는 N-말단 도메인(a.a. 1-362)이 막과 상호작용하는 이의 능력으로 인해 단백질을 소포 구조로 표적화하는 반면, 단백질의 미오신-꼬리 상동성 도메인의 많은 부분을 포함하는 CEP290의 C-말단 근처의 영역은 미세소관 결합(a.a. 580-2479)을 매개하고, 트렁케이션된 형태로 발현되는 경우 아세틸화된 튜불린(Ac-Tub)과 일치하는 현저한 원섬유 분포를 갖는 것을 나타내었다. 드리바스 등(Drivas et al.)과 일치하여, AAV I, II 또는 III 인테인 플라스미드로 단독으로 형질감염되거나 AAV I+II, AAV I+III 및 AAV II+III로 공동 형질감염된 HeLa 세포에 대한 면역형광 분석은 AAV I 및 AAV II로부터의 생성물이 우세한 점상 패턴을 갖는 반면 AAV III(단백질의 미오신-꼬리 상동성 도메인을 포함함)로부터의 것은 원섬유 패턴을 나타내고 Ac-tub에 완전히 공존하는 유일한 것임을 나타내었다(도 2d). 따라서, AAV I+II로부터의 생성물은 우세한 점상 패턴을 갖는 반면, AAV I+III 및 AAV II+III로부터의 것은 조합된 미세소관 원섬유 및 점상 패턴을 갖는다. 3개의 AAV CEP290 인테인 플라스미드로 공동 형질감염된 세포는 전장 CEP290 단백질을 인코딩하는 플라스미드로 형질감염된 세포에서 관찰된 신호와 동등한 미세소관을 따라 부분적으로 정렬된 우세한 점상 신호를 나타내었다(도 2d 및 도 18).
이후, 본 발명자는 AAV-ABCA4 및 -CEP290 인테인 플라스미드의 최상의 세트로 획득된 단백질의 양을 상응하는 전장 단백질을 인코딩하는 단일 AAV 플라스미드로부터 획득된 것과 비교하였다. 이를 위해, HEK293 세포를 동일한 등몰량의 단일 또는 AAV 인테인 플라스미드로 형질감염시키고, 형질감염 72시간 후에 세포 용해질을 WB로 분석하였다(도 19). 밴드 강도의 정량화는 AAV 인테인 플라스미드로부터의 ABCA4 및 CEP290 발현이 각각 상응하는 단일 AAV 플라스미드로 관찰된 것의 61 ± 4%(n= 3의 독립적 실험) 및 58 ± 4%(n= 3의 독립적 실험)인 것을 나타내었다.
실시예 6. AAV 인테인 벡터는 시험관 내 및 망막에서 큰 치료 단백질의 발현을 매개한다.
본 발명자는 AAV 인테인 매개 큰 단백질 재구성의 효율을 시험관 내 및 마우스 및 돼지 망막 모두에서 이중 AAV 벡터의 효율과 비교하였다. HEK293 세포를 ABCA4(세트 1) 또는 CEP290(세트 5)(m.o.i: 5x10^4 GC/각각의 벡터의 세포)을 인코딩하는 AAV2/2 이중 또는 인테인 벡터로 감염시키고, 세포 용해질을 WB에 의해 72시간 후에 분석하였다. 도 3a 및 3b에 제시된 바와 같이, AAV-ABCA4 및 -CEP290 인테인 벡터 둘 모두는 이중 AAV 벡터보다 더 효율적으로 큰 단백질 재구성을 매개하였다. 예상된 바와 같이, 전장 단백질에 더하여, 단일 AAV 인테인 벡터(ABCA4 및 CEP290 둘 모두의 경우) 또는 AAV II와 AAV III 사이에서 발생하는 트랜스-스플라이싱(CEP290의 경우)으로부터 유래된 더 짧은 폴리펩티드가 관찰되었다(도 3a 및 3b).
또한, 4주령 야생형 마우스에 이중 벡터(각각의 ABCA4 벡터의 용량/눈: 3.3x10^9 GC, 각각의 CEP290 벡터의 용량/눈: 1.1x10^9 GC)와 비교하여 AAV-GRK1-ABCA4 또는 -CEP290 인테인(각각 세트 1 및 5)을 망막하 주사하였다. 동물을 주사 후 4-7주에 희생시키고, 망막 용해질에서의 단백질 발현을 WB로 평가하였다. 전장 단백질은 AAV-ABCA4 인테인 주사된 눈의 10/11(91%)(도 4a 및 20) 및 AAV-CEP290 인테인 주사된 눈의 5/10(50%)(도 4b)에서 검출되었다. 반대로, 전장 단백질 발현은 ABCA4 및 CEP290 이중 AAV 벡터가 주사된 눈의 5/9(56%) 및 0/5에서 각각 명백하였다. 시험관 내에서 관찰된 것과 유사하게, 단일 AAV 인테인 벡터(ABCA4 및 CEP290 둘 모두의 경우) 및 AAV II와 AAV III 사이에서 발생하는 트랜스-스플라이싱(CEP290의 경우)으로부터 유래된 폴리펩티드가 검출되었다(도 4a 및 4b).
내인성에 비해 AAV 인테인에 의해 매개된 단백질 재구성의 효율을 조사하기 위해, 1-4개월령 Abca4 -/- 마우스에 AAV-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 ABCA4 벡터의 용량/눈: 5.5x10^9 GC)를 망막하 주사하였다. 한달 후, 영향을 받지 않은 Abca4 -/- 마우스 및 AAV 인테인 주사된 Abca4 -/- 마우스로부터의 망막 용해질에서의 ABCA4 발현을 뮤린 및 인간 ABCA4 둘 모두를 인지하는 항체를 사용하여 WB에 의해 분석하였다(도 21). AAV 인테인 ABCA4 발현은 내인성 ABCA4의 8,6 ± 1,3%인 것으로 밝혀졌다.
임상적으로 관련된 돼지 망막에서의 효율적인 큰 단백질 재구성을 확인하기 위해, 대형 백색 돼지에게 AAV2/8-GRK1-ABCA4 인테인(세트 1) 또는 이중 벡터(각각의 벡터의 용량/눈: 2x10^11 GC, 2개의 인접한 망막하 수포를 통해 전달됨)를 망막하 주사하였고, 주사 1개월 후 단백질 발현을 WB로 분석하였다. 특히, AAV 인테인은 이중 AAV 벡터보다 더 효율적으로 전장 ABCA4 단백질을 재구성하는 것으로 밝혀졌다(도 4c).
마지막으로, 121일의 배양에서 건강한 개인 또는 STGD1 환자의 iPSC로부터의 인간 망막 오르가노이드[광수용체 성숙이 시작되는 경우(20)]를 AAV2/2-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 벡터의 용량/오르가노이드: 1x10^12 GC)로 감염시켰다. 오르가노이드는 감염 후 20 내지 40일 사이에 용해되었고, WB로 분석하였다. 예상 크기의 ABCA4는 모든 감염된 오르가노이드에서 검출되었다(도 4d 및 도 22; 정상 대조군 및 STGD1 오르가노이드로부터 각각 n=3 및 n=4).
실시예 7. AAV 인테인 벡터의 망막하 투여는 STGD1 및 LCA10 마우스 모델의 망막 표현형을 개선시킨다.
AAV 인테인 벡터로 획득된 광수용체 형질도입이 치료적으로 관련될 수 있는지의 여부를 결정하기 위해, 이들을 STGD1(Abca4 -/- ) 및 LCA10(rd16)의 마우스 모델의 망막에서 시험하였다.
1개월령 Abca4 -/- 마우스에 AAV2/8-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 벡터의 용량/눈: 4.3-4.8x10^9 GC)를 망막하 주사하였다. 3개월 후 눈을 수확하고, Abca4 -/- 마우스의 망막 색소 상피(RPE)에 축적되는 리포푸신의 양을 측정하기 위해 망막 초박막 섹션의 투과 전자 현미경 분석을 수행하였다(56, 57). 특히, RPE 리포푸신 축적은 AAV 인테인 벡터가 주사된 Abca4 -/- 눈에서 유의하게 감소하였지만, 음성 대조군 주입 눈에서는 그렇지 않았다(p 값 = 0.0163; 도 5a 및 도 23).
병행하여, 4-6일령 rd16 마우스에 AAV2/8-GRK1-CEP290 인테인 벡터(세트 5)(각각의 벡터의 용량/눈: 5.5x10^8 GC)를 망막하 주사하였다. 주사 1개월 후 망막 섹션의 현미경 분석은 광수용체 핵을 포함하는 외핵 층(ONL)의 두께가 점진적 망막 변성의 결과(55)로서 야생형 마우스에 비해 rd16 마우스에서 유의하게 감소한 것을 나타내었다(p 값 = 0.00048; 도 5b). 특히, AAV 인테인 벡터가 주사된 rd16 망막의 ONL 두께는 음성 대조군이 주사된 rd16 망막의 것보다 유의하게 더 높았다(약 60%, p 값 = 0.00281)(도 5b). 따라서, 동공 광 반응(PLR)에 기초한 망막 기능 시험은 음성 대조군이 주사된 rd16 눈에서보다 AAV 인테인 벡터가 주사된 rd16 마우스에서 유의하게 더 높은 동공 수축(약 20%, p 값 = 0.00073)을 나타내었다(도 5c).
또한, 본 발명자는 망막에서 AAV 인테인 벡터의 안전성을 조사하였다. 이를 위해, 야생형 C57BL/6J 마우스에 AAV2/8-GRK1-ABCA4 또는 -CEP290 인테인 벡터(각각 세트 1 및 5)(각각의 ABCA4 벡터의 용량/눈: 4.3x10^9 GC; 각각의 CEP290 벡터의 용량/눈: 1.1x10^9 GC)를 망막하 주사하고, 망막 전기 활성을 주사 후 6 및 4.5개월에 각각 간츠펠드(Ganzfeld) 망막전위도(ERG)에 의해 측정하였다. 둘 모두의 연구에서, a- 및 b-파 진폭은 AAV 인테인 벡터(ABCA4 및 CEP290에 대해 각각 n=14-15 및 n=11)가 주사된 마우스 눈과 음성 대조군 AAV 벡터(ABCA4 및 CEP290에 대해 각각 n=8 및 n=5) 또는 PBS(ABCA4 및 CEP290에 대해 각각n=6-7 및 n=6)가 주사된 눈 사이에서 유사하였다. 유사하게, 광학 간섭 단층촬영에 의해 측정된 ONL의 두께는 AAV 인테인-, 음성 대조군- 및 PBS-주사된 눈 사이에서 유사하였다(도 24).
실시예 8. 안전한 AAV 인테인 매개 큰 유전자 전달
AAV 인테인을 주사한 야생형 마우스에서 명백한 독성의 징후가 관찰되지 않았지만, 본 발명자는 일단 절제된 인테인 내에 포매시 융합된 단백질을 신속한 유비퀴틴화 및 이후의 프로테아좀 파괴로 유도하는 데그론의 트랜스-스플라이싱 시스템 내의 포함을 평가하였다(도 6). 기재된 데그론 대부분은 N- 또는 C-말단 위치(즉, CL1, SMN, CIITA, ODC)에서 기능적이며, 이들 데그론은 단일 숙주 단백질의 분해로 이어지기 때문에 N- 또는 C-인테인에 융합될 수 없으며 따라서 단백질 트랜스-스플라이싱(PTS) 반응에 관여할 필요가 있는 폴리펩티드를 뺀다. 따라서, 본 발명자는 N- 또는 내부 위치에서만 기능적 활성을 부여하는 3개의 아미노산 돌연변이인 R12Y, Y100I 및 G67S(69)를 포함하는 E. 콜리로부터의 디하이드로폴레이트 환원효소의 돌연변이 형태(ecDHFR)를 선택하였다.
절제된 인테인의 양을 감소시키는 데 있어서 ecDHFR의 효율을 시험하기 위해, 본 발명자는 Npu DnaE 및 ecDHFR(pAAV2.1-CMV-5' EGFP 인테인_ecDHFR)의 N-말단 절반에 융합된 EGFP의 N-말단 절반을 인코딩하는 AAV 벡터를 생성시켰다. 따라서, 데그론은 비활성화되어야 하는 C-말단 끝에 존재할 것이다. 벡터 II와 조합된 AAV-EGFP-ecDHFR 인테인 플라스미드(Npu DnaE의 C-말단 절반에 융합된 EGFP의 C-말단 절반(pAAV2.1-CMV-3' EGFP 인테인)을 인코딩함)를 HEK293 세포를 형질감염시키는 데 사용하였고, 전장 EGFP 단백질 및 절제된 인테인의 생성을 평가하였다. AAV 인테인과 비교하여 유사한 단백질 수준을 갖는 트랜스-스플라이싱된 EGFP 단백질이 WB 분석에 의해 검출되었다. 또한, 절제된 인테인의 양은 AAV-EGFP-ecDHFR 인테인 플라스미드의 공동형질감염 후 HEK293 세포 용해질에서 상당히 감소하였다(도 7). 이후, 발명자는 큰 ABCA4 단백질(pAAV2.1-CMV260-5' ABCA4 인테인_ecDHFR)에 동일한 전략을 적용하기로 결정하였다. EGFP에 관해서, 이들은 AAV-ABCA4-인테인과 비교하여 AAV-ABCA4-ecDHFR 인테인 플라스미드로부터의 전장 ABCA4의 유사한 양을 발견하였다(도 8a). 중요하게는, 절제된 인테인의 완전한 소멸이 관찰되었다(도 8b).
본 발명자가 ecDHFR 매개 DnaE 분해를 관찰하고 있음을 증명하기 위해, 세포를 트리메토프림(TMP)으로 처리하였다. TMP는 ecDHFR에 결합하여 단백질이 분해되는 것을 방지하여 융합 단백질이 분해를 피할 수 있도록 하는 항생제이다(69). AAV-ABCA4-ecDHFR 인테인 플라스미드로 공동 형질감염된 HEK293 세포를 증가된 용량의 TMP로 처리하고, DnaE 인테인이 더 이상 분해되지 않고, TMP는 용량 의존적 방식으로 ecDHFR을 안정화시킴을 발견하였고, 이는 DnaE 인테인의 감소가 ecDHFR에 의해 매개됨을 의미한다(도 9).
(인테인에 추가하여) 벡터에 데그론을 포함하는 한 가지 제한은 AAV의 클로닝 능력이 추가로 감소하여 일부 적용에 대해 특대 AAV 벡터를 생성한다는 것이다. 실제로, ecDHFR은 159aa 길이이다. 따라서, 본 발명자는 N- 또는 내부 위치에서의 활성에 중요한 것으로 보고된 아미노산을 보유하는 105 aa의 더 짧은 ecDHFR 변이체를 설계하였다. 본 발명자는 EGFP 및 ABCA4 인테인 플라스미드 둘 모두에서의 이러한 미니 ecDHFR(pAAV2.1-CMV-5' EGFP 인테인_미니 ecDHFR; pAAV2.1-CMV260- 5' ABCA4 인테인_미니 cDHFR)을 시험하였다. AAV-EGFP- 또는 ABCA4-미니 ecDHFR 인테인 플라스미드의 공동 형질감염시, 이들은 AAV 인테인 플라스미드와 비교하여 유사한 전장 단백질 발현(도 10 및 11a) 및 DnaE 인테인의 강한 감소(도 10 및 11b)를 발견하였다.
이들 결과는 PTS 시스템에서의 ecDHFR 또는 미니 ecDHFR의 포함이 단백질 트랜스-스플라이싱 및 치료 단백질 생성의 효능에 유의하게 영향을 주지 않고 선택적인 인테인 분해를 매개하는 것을 시사하였다.
실시예 9. 간에서의 인테인 매개 단백질 트랜스-스플라이싱
간에서의 인테인 매개 단백질 트랜스-스플라이싱의 효율을 시험하기 위해, 노스톡 푼크티포르메로부터의 DnaE 분할-인테인의 N- 및 C-말단 절반에 융합된 리포터 EGFP 단백질의 N- 또는 C-말단 절반을 각각 인코딩하는 2개의 AAV 벡터를 생성시켰다.
5주령의 C57/BL6 마우스에 간 특이적 인간 티록신 결합 글로불린(TBG) 프로모터(각각의 벡터의 용량/kg: 5 x 1011 GC)를 갖는 AAV2/8 벡터를 안구 뒤 주사하였다. 주사 후 4주에 간을 수확하고, 항-3x플래그 항체를 이용한 웨스턴 블롯에 의한 분석을 위해 용해시켜 EGFP-3x플래그 및 인테인-3x플래그를 검출하였다. EGFP 밴드 강도의 정량화는 AAV 인테인이 약 6-7배 더 많은 단백질 양으로 이중 AAV보다 간을 더 효율적으로 형질도입한다는 것을 나타내었다.
실시예 10. AAV 인테인 벡터는 혈우병 A에 영향을 받은 큰 F8 유전자를 전달하는 데 사용될 수 있다.
혈우병 A에서 돌연변이된 F8 유전자는 이의 야생형 형태의 단일 AAV에 의해 전달되기에는 너무 크다(약 7 kb). 이 때문에, 유전자의 B-도메인 결실(BDD) 형태만이 AAV 유전자 요법의 맥락에서 적합화되었다. 최근에, BDD-F8 및 짧은 간-특이적 프로모터 및 폴리A 신호 모두를 포함하는 5 kb 발현 카세트가 AAV5에 패키징되었고, 마우스 및 시노몰구스 원숭이(70)뿐만 아니라 HemA 환자(71)에서 FVIII의 치료 수준을 발생시키는 것으로 나타났다. 그러나, 이러한 벡터의 유전체는 약간 특대이며, 이종성의 트렁케이션된 유전체의 라이브러리로서 AAV 캡시드에 패키징되어 표적 세포에서 재구성시 효과적인 형질도입을 발생시킨다. 특대 AAV 벡터의 효율은 정상 크기에 비해 낮으며, 이종성의 트렁케이션된 유전체를 갖는 상기 생성물의 품질은 상용화를 향한 추가 개발을 배제할 수 있다.
제한된 AAV 화물 용량을 극복하기 위해, 각각 분할 Npu DnaE 인테인이 측면에 있는 큰 FVIII 단백질의 2개의 절반 중 하나를 인코딩하는 일정한 크기의 유전체를 갖는 2개의 별개의 AAV 벡터를 포함하는 단백질 트랜스-스플라이싱 전략을 설계하였다.
야생형 F8 유전자를 B 도메인에서 2개의 상이한 분할 지점, 즉 세트 1 및 세트 2로 분할하였다. 짧은 합성 폴리A와 함께 간 특이적 하이브리드 간 프로모터(HLP) 하에서 F8 인테인 벡터를 생성시켰다(도 25a). 벡터 유전체는 서던 블롯에 의해 제시된 바와 같이 이들의 특대 AAV BDD-F8 대조군과 달리 AAV 캡시드로 적절히 패키징되었다(도 25b).
전략의 치료적 관련성을 결정하기 위해, AAV2/8 F8 인테인 벡터를 안구 뒤 주입(각각의 벡터의 용량/동물: 4-5 x 1011 GC)을 통해 7-8주령 혈우병 A 넉아웃 마우스에 전신 주사하였다. 주사 8주 후 혈장의 aPTT(활성화된 부분 트롬보플라스틴 시간) 분석은 특대 단일 AAV BDD-F8 대조군과 동일한 수준이 아니지만 출혈 표현형의 약간의 수정을 나타내었다(도 25c).
참고문헌
Figure pct00134
Figure pct00135
Figure pct00136
Figure pct00137
Figure pct00138
SEQUENCE LISTING <110> Fondazione Telethon <120> Intein proteins and uses thereof <130> PCT 141280 <150> EP18200490.3 <151> 2018-10-15 <150> EP19169116.1 <151> 2019-04-12 <160> 95 <170> PatentIn version 3.5 <210> 1 <211> 102 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 1 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val Asp Asn Leu Pro Asn 100 <210> 2 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 2 Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile 20 25 30 Ala Ser Asn 35 <210> 3 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 3 Cys Leu Ala Gly Asp Thr Leu Ile Thr Leu Ala Asp Gly Arg Arg Val 1 5 10 15 Pro Ile Arg Glu Leu Val Ser Gln Gln Asn Phe Ser Val Trp Ala Leu 20 25 30 Asn Pro Gln Thr Tyr Arg Leu Glu Arg Ala Arg Val Ser Arg Ala Phe 35 40 45 Cys Thr Gly Ile Lys Pro Val Tyr Arg Leu Thr Thr Arg Leu Gly Arg 50 55 60 Ser Ile Arg Ala Thr Ala Asn His Arg Phe Leu Thr Pro Gln Gly Trp 65 70 75 80 Lys Arg Val Asp Glu Leu Gln Pro Gly Asp Tyr Leu Ala Leu Pro Arg 85 90 95 Arg Ile Pro Thr Ala Ser Thr Pro Thr Leu 100 105 <210> 4 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 4 Ala Ala Ala Cys Pro Glu Leu Arg Gln Leu Ala Gln Ser Asp Val Tyr 1 5 10 15 Trp Asp Pro Ile Val Ser Ile Glu Pro Asp Gly Val Glu Glu Val Phe 20 25 30 Asp Leu Thr Val Pro Gly Pro His Asn Phe Val Ala Asn Asp Ile Ile 35 40 45 Ala His Asn 50 <210> 5 <211> 102 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 5 Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Ile Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Met Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val Asp Asn Leu Pro Asn 100 <210> 6 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 6 Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp 1 5 10 15 Ile Gly Leu Pro Gln Tyr His Asn Phe Leu Leu Ala Asn Gly Ala Ile 20 25 30 Ala Ala Asn 35 <210> 7 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 7 Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr 20 25 30 Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His 35 40 45 Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln 85 90 95 Val Asp Gly Leu Pro 100 <210> 8 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 8 Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly Leu Val 20 25 30 Ala Ser Asn 35 <210> 9 <211> 102 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 9 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val Asp Asn Leu Pro Asn 100 <210> 10 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 10 Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile 20 25 30 Ala Ser Asn 35 <210> 11 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 11 Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr 20 25 30 Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His 35 40 45 Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln 85 90 95 Val Asp Gly Leu Pro 100 <210> 12 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 12 Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr 20 25 30 Asp Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly Leu 35 40 45 Val Ala Ser Asn 50 <210> 13 <211> 123 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 13 Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser 20 25 30 Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser 50 55 60 Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln 65 70 75 80 Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr 85 90 95 Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu 100 105 110 Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys 115 120 <210> 14 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 14 Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp 1 5 10 15 Ile Gly Leu Pro Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile 20 25 30 Ala Ala Asn Cys 35 <210> 15 <211> 261 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 15 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Asp 225 230 235 240 Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys 245 250 255 Asp Asp Asp Asp Lys 260 <210> 16 <211> 2293 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 16 Met Gly Phe Val Arg Gln Ile Gln Leu Leu Leu Trp Lys Asn Trp Thr 1 5 10 15 Leu Arg Lys Arg Gln Lys Ile Arg Phe Val Val Glu Leu Val Trp Pro 20 25 30 Leu Ser Leu Phe Leu Val Leu Ile Trp Leu Arg Asn Ala Asn Pro Leu 35 40 45 Tyr Ser His His Glu Cys His Phe Pro Asn Lys Ala Met Pro Ser Ala 50 55 60 Gly Met Leu Pro Trp Leu Gln Gly Ile Phe Cys Asn Val Asn Asn Pro 65 70 75 80 Cys Phe Gln Ser Pro Thr Pro Gly Glu Ser Pro Gly Ile Val Ser Asn 85 90 95 Tyr Asn Asn Ser Ile Leu Ala Arg Val Tyr Arg Asp Phe Gln Glu Leu 100 105 110 Leu Met Asn Ala Pro Glu Ser Gln His Leu Gly Arg Ile Trp Thr Glu 115 120 125 Leu His Ile Leu Ser Gln Phe Met Asp Thr Leu Arg Thr His Pro Glu 130 135 140 Arg Ile Ala Gly Arg Gly Ile Arg Ile Arg Asp Ile Leu Lys Asp Glu 145 150 155 160 Glu Thr Leu Thr Leu Phe Leu Ile Lys Asn Ile Gly Leu Ser Asp Ser 165 170 175 Val Val Tyr Leu Leu Ile Asn Ser Gln Val Arg Pro Glu Gln Phe Ala 180 185 190 His Gly Val Pro Asp Leu Ala Leu Lys Asp Ile Ala Cys Ser Glu Ala 195 200 205 Leu Leu Glu Arg Phe Ile Ile Phe Ser Gln Arg Arg Gly Ala Lys Thr 210 215 220 Val Arg Tyr Ala Leu Cys Ser Leu Ser Gln Gly Thr Leu Gln Trp Ile 225 230 235 240 Glu Asp Thr Leu Tyr Ala Asn Val Asp Phe Phe Lys Leu Phe Arg Val 245 250 255 Leu Pro Thr Leu Leu Asp Ser Arg Ser Gln Gly Ile Asn Leu Arg Ser 260 265 270 Trp Gly Gly Ile Leu Ser Asp Met Ser Pro Arg Ile Gln Glu Phe Ile 275 280 285 His Arg Pro Ser Met Gln Asp Leu Leu Trp Val Thr Arg Pro Leu Met 290 295 300 Gln Asn Gly Gly Pro Glu Thr Phe Thr Lys Leu Met Gly Ile Leu Ser 305 310 315 320 Asp Leu Leu Cys Gly Tyr Pro Glu Gly Gly Gly Ser Arg Val Leu Ser 325 330 335 Phe Asn Trp Tyr Glu Asp Asn Asn Tyr Lys Ala Phe Leu Gly Ile Asp 340 345 350 Ser Thr Arg Lys Asp Pro Ile Tyr Ser Tyr Asp Arg Arg Thr Thr Ser 355 360 365 Phe Cys Asn Ala Leu Ile Gln Ser Leu Glu Ser Asn Pro Leu Thr Lys 370 375 380 Ile Ala Trp Arg Ala Ala Lys Pro Leu Leu Met Gly Lys Ile Leu Tyr 385 390 395 400 Thr Pro Asp Ser Pro Ala Ala Arg Arg Ile Leu Lys Asn Ala Asn Ser 405 410 415 Thr Phe Glu Glu Leu Glu His Val Arg Lys Leu Val Lys Ala Trp Glu 420 425 430 Glu Val Gly Pro Gln Ile Trp Tyr Phe Phe Asp Asn Ser Thr Gln Met 435 440 445 Asn Met Ile Arg Asp Thr Leu Gly Asn Pro Thr Val Lys Asp Phe Leu 450 455 460 Asn Arg Gln Leu Gly Glu Glu Gly Ile Thr Ala Glu Ala Ile Leu Asn 465 470 475 480 Phe Leu Tyr Lys Gly Pro Arg Glu Ser Gln Ala Asp Asp Met Ala Asn 485 490 495 Phe Asp Trp Arg Asp Ile Phe Asn Ile Thr Asp Arg Thr Leu Arg Leu 500 505 510 Val Asn Gln Tyr Leu Glu Cys Leu Val Leu Asp Lys Phe Glu Ser Tyr 515 520 525 Asn Asp Glu Thr Gln Leu Thr Gln Arg Ala Leu Ser Leu Leu Glu Glu 530 535 540 Asn Met Phe Trp Ala Gly Val Val Phe Pro Asp Met Tyr Pro Trp Thr 545 550 555 560 Ser Ser Leu Pro Pro His Val Lys Tyr Lys Ile Arg Met Asp Ile Asp 565 570 575 Val Val Glu Lys Thr Asn Lys Ile Lys Asp Arg Tyr Trp Asp Ser Gly 580 585 590 Pro Arg Ala Asp Pro Val Glu Asp Phe Arg Tyr Ile Trp Gly Gly Phe 595 600 605 Ala Tyr Leu Gln Asp Met Val Glu Gln Gly Ile Thr Arg Ser Gln Val 610 615 620 Gln Ala Glu Ala Pro Val Gly Ile Tyr Leu Gln Gln Met Pro Tyr Pro 625 630 635 640 Cys Phe Val Asp Asp Ser Phe Met Ile Ile Leu Asn Arg Cys Phe Pro 645 650 655 Ile Phe Met Val Leu Ala Trp Ile Tyr Ser Val Ser Met Thr Val Lys 660 665 670 Ser Ile Val Leu Glu Lys Glu Leu Arg Leu Lys Glu Thr Leu Lys Asn 675 680 685 Gln Gly Val Ser Asn Ala Val Ile Trp Cys Thr Trp Phe Leu Asp Ser 690 695 700 Phe Ser Ile Met Ser Met Ser Ile Phe Leu Leu Thr Ile Phe Ile Met 705 710 715 720 His Gly Arg Ile Leu His Tyr Ser Asp Pro Phe Ile Leu Phe Leu Phe 725 730 735 Leu Leu Ala Phe Ser Thr Ala Thr Ile Met Leu Cys Phe Leu Leu Ser 740 745 750 Thr Phe Phe Ser Lys Ala Ser Leu Ala Ala Ala Cys Ser Gly Val Ile 755 760 765 Tyr Phe Thr Leu Tyr Leu Pro His Ile Leu Cys Phe Ala Trp Gln Asp 770 775 780 Arg Met Thr Ala Glu Leu Lys Lys Ala Val Ser Leu Leu Ser Pro Val 785 790 795 800 Ala Phe Gly Phe Gly Thr Glu Tyr Leu Val Arg Phe Glu Glu Gln Gly 805 810 815 Leu Gly Leu Gln Trp Ser Asn Ile Gly Asn Ser Pro Thr Glu Gly Asp 820 825 830 Glu Phe Ser Phe Leu Leu Ser Met Gln Met Met Leu Leu Asp Ala Ala 835 840 845 Val Tyr Gly Leu Leu Ala Trp Tyr Leu Asp Gln Val Phe Pro Gly Asp 850 855 860 Tyr Gly Thr Pro Leu Pro Trp Tyr Phe Leu Leu Gln Glu Ser Tyr Trp 865 870 875 880 Leu Gly Gly Glu Gly Cys Ser Thr Arg Glu Glu Arg Ala Leu Glu Lys 885 890 895 Thr Glu Pro Leu Thr Glu Glu Thr Glu Asp Pro Glu His Pro Glu Gly 900 905 910 Ile His Asp Ser Phe Phe Glu Arg Glu His Pro Gly Trp Val Pro Gly 915 920 925 Val Cys Val Lys Asn Leu Val Lys Ile Phe Glu Pro Cys Gly Arg Pro 930 935 940 Ala Val Asp Arg Leu Asn Ile Thr Phe Tyr Glu Asn Gln Ile Thr Ala 945 950 955 960 Phe Leu Gly His Asn Gly Ala Gly Lys Thr Thr Thr Leu Ser Ile Leu 965 970 975 Thr Gly Leu Leu Pro Pro Thr Ser Gly Thr Val Leu Val Gly Gly Arg 980 985 990 Asp Ile Glu Thr Ser Leu Asp Ala Val Arg Gln Ser Leu Gly Met Cys 995 1000 1005 Pro Gln His Asn Ile Leu Phe His His Leu Thr Val Ala Glu His 1010 1015 1020 Met Leu Phe Tyr Ala Gln Leu Lys Gly Lys Ser Gln Glu Glu Ala 1025 1030 1035 Gln Leu Glu Met Glu Ala Met Leu Glu Asp Thr Gly Leu His His 1040 1045 1050 Lys Arg Asn Glu Glu Ala Gln Asp Leu Ser Gly Gly Met Gln Arg 1055 1060 1065 Lys Leu Ser Val Ala Ile Ala Phe Val Gly Asp Ala Lys Val Val 1070 1075 1080 Ile Leu Asp Glu Pro Thr Ser Gly Val Asp Pro Tyr Ser Arg Arg 1085 1090 1095 Ser Ile Trp Asp Leu Leu Leu Lys Tyr Arg Ser Gly Arg Thr Ile 1100 1105 1110 Ile Met Ser Thr His His Met Asp Glu Ala Asp Leu Leu Gly Asp 1115 1120 1125 Arg Ile Ala Ile Ile Ala Gln Gly Arg Leu Tyr Cys Ser Gly Thr 1130 1135 1140 Pro Leu Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr 1145 1150 1155 Leu Val Arg Lys Met Lys Asn Ile Gln Ser Gln Arg Lys Gly Ser 1160 1165 1170 Glu Gly Thr Cys Ser Cys Ser Ser Lys Gly Phe Ser Thr Thr Cys 1175 1180 1185 Pro Ala His Val Asp Asp Leu Thr Pro Glu Gln Val Leu Asp Gly 1190 1195 1200 Asp Val Asn Glu Leu Met Asp Val Val Leu His His Val Pro Glu 1205 1210 1215 Ala Lys Leu Val Glu Cys Ile Gly Gln Glu Leu Ile Phe Leu Leu 1220 1225 1230 Pro Asn Lys Asn Phe Lys His Arg Ala Tyr Ala Ser Leu Phe Arg 1235 1240 1245 Glu Leu Glu Glu Thr Leu Ala Asp Leu Gly Leu Ser Ser Phe Gly 1250 1255 1260 Ile Ser Asp Thr Pro Leu Glu Glu Ile Phe Leu Lys Val Thr Glu 1265 1270 1275 Asp Ser Asp Ser Gly Pro Leu Phe Ala Gly Gly Ala Gln Gln Lys 1280 1285 1290 Arg Glu Asn Val Asn Pro Arg His Pro Cys Leu Gly Pro Arg Glu 1295 1300 1305 Lys Ala Gly Gln Thr Pro Gln Asp Ser Asn Val Cys Ser Pro Gly 1310 1315 1320 Ala Pro Ala Ala His Pro Glu Gly Gln Pro Pro Pro Glu Pro Glu 1325 1330 1335 Cys Pro Gly Pro Gln Leu Asn Thr Gly Thr Gln Leu Val Leu Gln 1340 1345 1350 His Val Gln Ala Leu Leu Val Lys Arg Phe Gln His Thr Ile Arg 1355 1360 1365 Ser His Lys Asp Phe Leu Ala Gln Ile Val Leu Pro Ala Thr Phe 1370 1375 1380 Val Phe Leu Ala Leu Met Leu Ser Ile Val Ile Pro Pro Phe Gly 1385 1390 1395 Glu Tyr Pro Ala Leu Thr Leu His Pro Trp Ile Tyr Gly Gln Gln 1400 1405 1410 Tyr Thr Phe Phe Ser Met Asp Glu Pro Gly Ser Glu Gln Phe Thr 1415 1420 1425 Val Leu Ala Asp Val Leu Leu Asn Lys Pro Gly Phe Gly Asn Arg 1430 1435 1440 Cys Leu Lys Glu Gly Trp Leu Pro Glu Tyr Pro Cys Gly Asn Ser 1445 1450 1455 Thr Pro Trp Lys Thr Pro Ser Val Ser Pro Asn Ile Thr Gln Leu 1460 1465 1470 Phe Gln Lys Gln Lys Trp Thr Gln Val Asn Pro Ser Pro Ser Cys 1475 1480 1485 Arg Cys Ser Thr Arg Glu Lys Leu Thr Met Leu Pro Glu Cys Pro 1490 1495 1500 Glu Gly Ala Gly Gly Leu Pro Pro Pro Gln Arg Thr Gln Arg Ser 1505 1510 1515 Thr Glu Ile Leu Gln Asp Leu Thr Asp Arg Asn Ile Ser Asp Phe 1520 1525 1530 Leu Val Lys Thr Tyr Pro Ala Leu Ile Arg Ser Ser Leu Lys Ser 1535 1540 1545 Lys Phe Trp Val Asn Glu Gln Arg Tyr Gly Gly Ile Ser Ile Gly 1550 1555 1560 Gly Lys Leu Pro Val Val Pro Ile Thr Gly Glu Ala Leu Val Gly 1565 1570 1575 Phe Leu Ser Asp Leu Gly Arg Ile Met Asn Val Ser Gly Gly Pro 1580 1585 1590 Ile Thr Arg Glu Ala Ser Lys Glu Ile Pro Asp Phe Leu Lys His 1595 1600 1605 Leu Glu Thr Glu Asp Asn Ile Lys Val Trp Phe Asn Asn Lys Gly 1610 1615 1620 Trp His Ala Leu Val Ser Phe Leu Asn Val Ala His Asn Ala Ile 1625 1630 1635 Leu Arg Ala Ser Leu Pro Lys Asp Arg Ser Pro Glu Glu Tyr Gly 1640 1645 1650 Ile Thr Val Ile Ser Gln Pro Leu Asn Leu Thr Lys Glu Gln Leu 1655 1660 1665 Ser Glu Ile Thr Val Leu Thr Thr Ser Val Asp Ala Val Val Ala 1670 1675 1680 Ile Cys Val Ile Phe Ser Met Ser Phe Val Pro Ala Ser Phe Val 1685 1690 1695 Leu Tyr Leu Ile Gln Glu Arg Val Asn Lys Ser Lys His Leu Gln 1700 1705 1710 Phe Ile Ser Gly Val Ser Pro Thr Thr Tyr Trp Val Thr Asn Phe 1715 1720 1725 Leu Trp Asp Ile Met Asn Tyr Ser Val Ser Ala Gly Leu Val Val 1730 1735 1740 Gly Ile Phe Ile Gly Phe Gln Lys Lys Ala Tyr Thr Ser Pro Glu 1745 1750 1755 Asn Leu Pro Ala Leu Val Ala Leu Leu Leu Leu Tyr Gly Trp Ala 1760 1765 1770 Val Ile Pro Met Met Tyr Pro Ala Ser Phe Leu Phe Asp Val Pro 1775 1780 1785 Ser Thr Ala Tyr Val Ala Leu Ser Cys Ala Asn Leu Phe Ile Gly 1790 1795 1800 Ile Asn Ser Ser Ala Ile Thr Phe Ile Leu Glu Leu Phe Glu Asn 1805 1810 1815 Asn Arg Thr Leu Leu Arg Phe Asn Ala Val Leu Arg Lys Leu Leu 1820 1825 1830 Ile Val Phe Pro His Phe Cys Leu Gly Arg Gly Leu Ile Asp Leu 1835 1840 1845 Ala Leu Ser Gln Ala Val Thr Asp Val Tyr Ala Arg Phe Gly Glu 1850 1855 1860 Glu His Ser Ala Asn Pro Phe His Trp Asp Leu Ile Gly Lys Asn 1865 1870 1875 Leu Phe Ala Met Val Val Glu Gly Val Val Tyr Phe Leu Leu Thr 1880 1885 1890 Leu Leu Val Gln Arg His Phe Phe Leu Ser Gln Trp Ile Ala Glu 1895 1900 1905 Pro Thr Lys Glu Pro Ile Val Asp Glu Asp Asp Asp Val Ala Glu 1910 1915 1920 Glu Arg Gln Arg Ile Ile Thr Gly Gly Asn Lys Thr Asp Ile Leu 1925 1930 1935 Arg Leu His Glu Leu Thr Lys Ile Tyr Pro Gly Thr Ser Ser Pro 1940 1945 1950 Ala Val Asp Arg Leu Cys Val Gly Val Arg Pro Gly Glu Cys Phe 1955 1960 1965 Gly Leu Leu Gly Val Asn Gly Ala Gly Lys Thr Thr Thr Phe Lys 1970 1975 1980 Met Leu Thr Gly Asp Thr Thr Val Thr Ser Gly Asp Ala Thr Val 1985 1990 1995 Ala Gly Lys Ser Ile Leu Thr Asn Ile Ser Glu Val His Gln Asn 2000 2005 2010 Met Gly Tyr Cys Pro Gln Phe Asp Ala Ile Asp Glu Leu Leu Thr 2015 2020 2025 Gly Arg Glu His Leu Tyr Leu Tyr Ala Arg Leu Arg Gly Val Pro 2030 2035 2040 Ala Glu Glu Ile Glu Lys Val Ala Asn Trp Ser Ile Lys Ser Leu 2045 2050 2055 Gly Leu Thr Val Tyr Ala Asp Cys Leu Ala Gly Thr Tyr Ser Gly 2060 2065 2070 Gly Asn Lys Arg Lys Leu Ser Thr Ala Ile Ala Leu Ile Gly Cys 2075 2080 2085 Pro Pro Leu Val Leu Leu Asp Glu Pro Thr Thr Gly Met Asp Pro 2090 2095 2100 Gln Ala Arg Arg Met Leu Trp Asn Val Ile Val Ser Ile Ile Arg 2105 2110 2115 Glu Gly Arg Ala Val Val Leu Thr Ser His Ser Met Glu Glu Cys 2120 2125 2130 Glu Ala Leu Cys Thr Arg Leu Ala Ile Met Val Lys Gly Ala Phe 2135 2140 2145 Arg Cys Met Gly Thr Ile Gln His Leu Lys Ser Lys Phe Gly Asp 2150 2155 2160 Gly Tyr Ile Val Thr Met Lys Ile Lys Ser Pro Lys Asp Asp Leu 2165 2170 2175 Leu Pro Asp Leu Asn Pro Val Glu Gln Phe Phe Gln Gly Asn Phe 2180 2185 2190 Pro Gly Ser Val Gln Arg Glu Arg His Tyr Asn Met Leu Gln Phe 2195 2200 2205 Gln Val Ser Ser Ser Ser Leu Ala Arg Ile Phe Gln Leu Leu Leu 2210 2215 2220 Ser His Lys Asp Ser Leu Leu Ile Glu Glu Tyr Ser Val Thr Gln 2225 2230 2235 Thr Thr Leu Asp Gln Val Phe Val Asn Phe Ala Lys Gln Gln Thr 2240 2245 2250 Glu Ser His Asp Leu Pro Leu His Pro Arg Ala Ala Gly Ala Ser 2255 2260 2265 Arg Gln Ala Gln Asp Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys 2270 2275 2280 Asp His Asp Ile Asp Tyr Lys Asp Asp Asp 2285 2290 <210> 17 <211> 2501 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 17 Met Pro Pro Asn Ile Asn Trp Lys Glu Ile Met Lys Val Asp Pro Asp 1 5 10 15 Asp Leu Pro Arg Gln Glu Glu Leu Ala Asp Asn Leu Leu Ile Ser Leu 20 25 30 Ser Lys Val Glu Val Asn Glu Leu Lys Ser Glu Lys Gln Glu Asn Val 35 40 45 Ile His Leu Phe Arg Ile Thr Gln Ser Leu Met Lys Met Lys Ala Gln 50 55 60 Glu Val Glu Leu Ala Leu Glu Glu Val Glu Lys Ala Gly Glu Glu Gln 65 70 75 80 Ala Lys Phe Glu Asn Gln Leu Lys Thr Lys Val Met Lys Leu Glu Asn 85 90 95 Glu Leu Glu Met Ala Gln Gln Ser Ala Gly Gly Arg Asp Thr Arg Phe 100 105 110 Leu Arg Asn Glu Ile Cys Gln Leu Glu Lys Gln Leu Glu Gln Lys Asp 115 120 125 Arg Glu Leu Glu Asp Met Glu Lys Glu Leu Glu Lys Glu Lys Lys Val 130 135 140 Asn Glu Gln Leu Ala Leu Arg Asn Glu Glu Ala Glu Asn Glu Asn Ser 145 150 155 160 Lys Leu Arg Arg Glu Asn Lys Arg Leu Lys Lys Lys Asn Glu Gln Leu 165 170 175 Cys Gln Asp Ile Ile Asp Tyr Gln Lys Gln Ile Asp Ser Gln Lys Glu 180 185 190 Thr Leu Leu Ser Arg Arg Gly Glu Asp Ser Asp Tyr Arg Ser Gln Leu 195 200 205 Ser Lys Lys Asn Tyr Glu Leu Ile Gln Tyr Leu Asp Glu Ile Gln Thr 210 215 220 Leu Thr Glu Ala Asn Glu Lys Ile Glu Val Gln Asn Gln Glu Met Arg 225 230 235 240 Lys Asn Leu Glu Glu Ser Val Gln Glu Met Glu Lys Met Thr Asp Glu 245 250 255 Tyr Asn Arg Met Lys Ala Ile Val His Gln Thr Asp Asn Val Ile Asp 260 265 270 Gln Leu Lys Lys Glu Asn Asp His Tyr Gln Leu Gln Val Gln Glu Leu 275 280 285 Thr Asp Leu Leu Lys Ser Lys Asn Glu Glu Asp Asp Pro Ile Met Val 290 295 300 Ala Val Asn Ala Lys Val Glu Glu Trp Lys Leu Ile Leu Ser Ser Lys 305 310 315 320 Asp Asp Glu Ile Ile Glu Tyr Gln Gln Met Leu His Asn Leu Arg Glu 325 330 335 Lys Leu Lys Asn Ala Gln Leu Asp Ala Asp Lys Ser Asn Val Met Ala 340 345 350 Leu Gln Gln Gly Ile Gln Glu Arg Asp Ser Gln Ile Lys Met Leu Thr 355 360 365 Glu Gln Val Glu Gln Tyr Thr Lys Glu Met Glu Lys Asn Thr Cys Ile 370 375 380 Ile Glu Asp Leu Lys Asn Glu Leu Gln Arg Asn Lys Gly Ala Ser Thr 385 390 395 400 Leu Ser Gln Gln Thr His Met Lys Ile Gln Ser Thr Leu Asp Ile Leu 405 410 415 Lys Glu Lys Thr Lys Glu Ala Glu Arg Thr Ala Glu Leu Ala Glu Ala 420 425 430 Asp Ala Arg Glu Lys Asp Lys Glu Leu Val Glu Ala Leu Lys Arg Leu 435 440 445 Lys Asp Tyr Glu Ser Gly Val Tyr Gly Leu Glu Asp Ala Val Val Glu 450 455 460 Ile Lys Asn Cys Lys Asn Gln Ile Lys Ile Arg Asp Arg Glu Ile Glu 465 470 475 480 Ile Leu Thr Lys Glu Ile Asn Lys Leu Glu Leu Lys Ile Ser Asp Phe 485 490 495 Leu Asp Glu Asn Glu Ala Leu Arg Glu Arg Val Gly Leu Glu Pro Lys 500 505 510 Thr Met Ile Asp Leu Thr Glu Phe Arg Asn Ser Lys His Leu Lys Gln 515 520 525 Gln Gln Tyr Arg Ala Glu Asn Gln Ile Leu Leu Lys Glu Ile Glu Ser 530 535 540 Leu Glu Glu Glu Arg Leu Asp Leu Lys Lys Lys Ile Arg Gln Met Ala 545 550 555 560 Gln Glu Arg Gly Lys Arg Ser Ala Thr Ser Gly Leu Thr Thr Glu Asp 565 570 575 Leu Asn Leu Thr Glu Asn Ile Ser Gln Gly Asp Arg Ile Ser Glu Arg 580 585 590 Lys Leu Asp Leu Leu Ser Leu Lys Asn Met Ser Glu Ala Gln Ser Lys 595 600 605 Asn Glu Phe Leu Ser Arg Glu Leu Ile Glu Lys Glu Arg Asp Leu Glu 610 615 620 Arg Ser Arg Thr Val Ile Ala Lys Phe Gln Asn Lys Leu Lys Glu Leu 625 630 635 640 Val Glu Glu Asn Lys Gln Leu Glu Glu Gly Met Lys Glu Ile Leu Gln 645 650 655 Ala Ile Lys Glu Met Gln Lys Asp Pro Asp Val Lys Gly Gly Glu Thr 660 665 670 Ser Leu Ile Ile Pro Ser Leu Glu Arg Leu Val Asn Ala Ile Glu Ser 675 680 685 Lys Asn Ala Glu Gly Ile Phe Asp Ala Ser Leu His Leu Lys Ala Gln 690 695 700 Val Asp Gln Leu Thr Gly Arg Asn Glu Glu Leu Arg Gln Glu Leu Arg 705 710 715 720 Glu Ser Arg Lys Glu Ala Ile Asn Tyr Ser Gln Gln Leu Ala Lys Ala 725 730 735 Asn Leu Lys Ile Asp His Leu Glu Lys Glu Thr Ser Leu Leu Arg Gln 740 745 750 Ser Glu Gly Ser Asn Val Val Phe Lys Gly Ile Asp Leu Pro Asp Gly 755 760 765 Ile Ala Pro Ser Ser Ala Ser Ile Ile Asn Ser Gln Asn Glu Tyr Leu 770 775 780 Ile His Leu Leu Gln Glu Leu Glu Asn Lys Glu Lys Lys Leu Lys Asn 785 790 795 800 Leu Glu Asp Ser Leu Glu Asp Tyr Asn Arg Lys Phe Ala Val Ile Arg 805 810 815 His Gln Gln Ser Leu Leu Tyr Lys Glu Tyr Leu Ser Glu Lys Glu Thr 820 825 830 Trp Lys Thr Glu Ser Lys Thr Ile Lys Glu Glu Lys Arg Lys Leu Glu 835 840 845 Asp Gln Val Gln Gln Asp Ala Ile Lys Val Lys Glu Tyr Asn Asn Leu 850 855 860 Leu Asn Ala Leu Gln Met Asp Ser Asp Glu Met Lys Lys Ile Leu Ala 865 870 875 880 Glu Asn Ser Arg Lys Ile Thr Val Leu Gln Val Asn Glu Lys Ser Leu 885 890 895 Ile Arg Gln Tyr Thr Thr Leu Val Glu Leu Glu Arg Gln Leu Arg Lys 900 905 910 Glu Asn Glu Lys Gln Lys Asn Glu Leu Leu Ser Met Glu Ala Glu Val 915 920 925 Cys Glu Lys Ile Gly Cys Leu Gln Arg Phe Lys Glu Met Ala Ile Phe 930 935 940 Lys Ile Ala Ala Leu Gln Lys Val Val Asp Asn Ser Val Ser Leu Ser 945 950 955 960 Glu Leu Glu Leu Ala Asn Lys Gln Tyr Asn Glu Leu Thr Ala Lys Tyr 965 970 975 Arg Asp Ile Leu Gln Lys Asp Asn Met Leu Val Gln Arg Thr Ser Asn 980 985 990 Leu Glu His Leu Glu Cys Glu Asn Ile Ser Leu Lys Glu Gln Val Glu 995 1000 1005 Ser Ile Asn Lys Glu Leu Glu Ile Thr Lys Glu Lys Leu His Thr 1010 1015 1020 Ile Glu Gln Ala Trp Glu Gln Glu Thr Lys Leu Gly Asn Glu Ser 1025 1030 1035 Ser Met Asp Lys Ala Lys Lys Ser Ile Thr Asn Ser Asp Ile Val 1040 1045 1050 Ser Ile Ser Lys Lys Ile Thr Met Leu Glu Met Lys Glu Leu Asn 1055 1060 1065 Glu Arg Gln Arg Ala Glu His Cys Gln Lys Met Tyr Glu His Leu 1070 1075 1080 Arg Thr Ser Leu Lys Gln Met Glu Glu Arg Asn Phe Glu Leu Glu 1085 1090 1095 Thr Lys Phe Ala Glu Leu Thr Lys Ile Asn Leu Asp Ala Gln Lys 1100 1105 1110 Val Glu Gln Met Leu Arg Asp Glu Leu Ala Asp Ser Val Ser Lys 1115 1120 1125 Ala Val Ser Asp Ala Asp Arg Gln Arg Ile Leu Glu Leu Glu Lys 1130 1135 1140 Asn Glu Met Glu Leu Lys Val Glu Val Ser Lys Leu Arg Glu Ile 1145 1150 1155 Ser Asp Ile Ala Arg Arg Gln Val Glu Ile Leu Asn Ala Gln Gln 1160 1165 1170 Gln Ser Arg Asp Lys Glu Val Glu Ser Leu Arg Met Gln Leu Leu 1175 1180 1185 Asp Tyr Gln Ala Gln Ser Asp Glu Lys Ser Leu Ile Ala Lys Leu 1190 1195 1200 His Gln His Asn Val Ser Leu Gln Leu Ser Glu Ala Thr Ala Leu 1205 1210 1215 Gly Lys Leu Glu Ser Ile Thr Ser Lys Leu Gln Lys Met Glu Ala 1220 1225 1230 Tyr Asn Leu Arg Leu Glu Gln Lys Leu Asp Glu Lys Glu Gln Ala 1235 1240 1245 Leu Tyr Tyr Ala Arg Leu Glu Gly Arg Asn Arg Ala Lys His Leu 1250 1255 1260 Arg Gln Thr Ile Gln Ser Leu Arg Arg Gln Phe Ser Gly Ala Leu 1265 1270 1275 Pro Leu Ala Gln Gln Glu Lys Phe Ser Lys Thr Met Ile Gln Leu 1280 1285 1290 Gln Asn Asp Lys Leu Lys Ile Met Gln Glu Met Lys Asn Ser Gln 1295 1300 1305 Gln Glu His Arg Asn Met Glu Asn Lys Thr Leu Glu Met Glu Leu 1310 1315 1320 Lys Leu Lys Gly Leu Glu Glu Leu Ile Ser Thr Leu Lys Asp Thr 1325 1330 1335 Lys Gly Ala Gln Lys Val Ile Asn Trp His Met Lys Ile Glu Glu 1340 1345 1350 Leu Arg Leu Gln Glu Leu Lys Leu Asn Arg Glu Leu Val Lys Asp 1355 1360 1365 Lys Glu Glu Ile Lys Tyr Leu Asn Asn Ile Ile Ser Glu Tyr Glu 1370 1375 1380 Arg Thr Ile Ser Ser Leu Glu Glu Glu Ile Val Gln Gln Asn Lys 1385 1390 1395 Phe His Glu Glu Arg Gln Met Ala Trp Asp Gln Arg Glu Val Asp 1400 1405 1410 Leu Glu Arg Gln Leu Asp Ile Phe Asp Arg Gln Gln Asn Glu Ile 1415 1420 1425 Leu Asn Ala Ala Gln Lys Phe Glu Glu Ala Thr Gly Ser Ile Pro 1430 1435 1440 Asp Pro Ser Leu Pro Leu Pro Asn Gln Leu Glu Ile Ala Leu Arg 1445 1450 1455 Lys Ile Lys Glu Asn Ile Arg Ile Ile Leu Glu Thr Arg Ala Thr 1460 1465 1470 Cys Lys Ser Leu Glu Glu Lys Leu Lys Glu Lys Glu Ser Ala Leu 1475 1480 1485 Arg Leu Ala Glu Gln Asn Ile Leu Ser Arg Asp Lys Val Ile Asn 1490 1495 1500 Glu Leu Arg Leu Arg Leu Pro Ala Thr Ala Glu Arg Glu Lys Leu 1505 1510 1515 Ile Ala Glu Leu Gly Arg Lys Glu Met Glu Pro Lys Ser His His 1520 1525 1530 Thr Leu Lys Ile Ala His Gln Thr Ile Ala Asn Met Gln Ala Arg 1535 1540 1545 Leu Asn Gln Lys Glu Glu Val Leu Lys Lys Tyr Gln Arg Leu Leu 1550 1555 1560 Glu Lys Ala Arg Glu Glu Gln Arg Glu Ile Val Lys Lys His Glu 1565 1570 1575 Glu Asp Leu His Ile Leu His His Arg Leu Glu Leu Gln Ala Asp 1580 1585 1590 Ser Ser Leu Asn Lys Phe Lys Gln Thr Ala Trp Asp Leu Met Lys 1595 1600 1605 Gln Ser Pro Thr Pro Val Pro Thr Asn Lys His Phe Ile Arg Leu 1610 1615 1620 Ala Glu Met Glu Gln Thr Val Ala Glu Gln Asp Asp Ser Leu Ser 1625 1630 1635 Ser Leu Leu Val Lys Leu Lys Lys Val Ser Gln Asp Leu Glu Arg 1640 1645 1650 Gln Arg Glu Ile Thr Glu Leu Lys Val Lys Glu Phe Glu Asn Ile 1655 1660 1665 Lys Leu Gln Leu Gln Glu Asn His Glu Asp Glu Val Lys Lys Val 1670 1675 1680 Lys Ala Glu Val Glu Asp Leu Lys Tyr Leu Leu Asp Gln Ser Gln 1685 1690 1695 Lys Glu Ser Gln Cys Leu Lys Ser Glu Leu Gln Ala Gln Lys Glu 1700 1705 1710 Ala Asn Ser Arg Ala Pro Thr Thr Thr Met Arg Asn Leu Val Glu 1715 1720 1725 Arg Leu Lys Ser Gln Leu Ala Leu Lys Glu Lys Gln Gln Lys Ala 1730 1735 1740 Leu Ser Arg Ala Leu Leu Glu Leu Arg Ala Glu Met Thr Ala Ala 1745 1750 1755 Ala Glu Glu Arg Ile Ile Ser Ala Thr Ser Gln Lys Glu Ala His 1760 1765 1770 Leu Asn Val Gln Gln Ile Val Asp Arg His Thr Arg Glu Leu Lys 1775 1780 1785 Thr Gln Val Glu Asp Leu Asn Glu Asn Leu Leu Lys Leu Lys Glu 1790 1795 1800 Ala Leu Lys Thr Ser Lys Asn Arg Glu Asn Ser Leu Thr Asp Asn 1805 1810 1815 Leu Asn Asp Leu Asn Asn Glu Leu Gln Lys Lys Gln Lys Ala Tyr 1820 1825 1830 Asn Lys Ile Leu Arg Glu Lys Glu Glu Ile Asp Gln Glu Asn Asp 1835 1840 1845 Glu Leu Lys Arg Gln Ile Lys Arg Leu Thr Ser Gly Leu Gln Gly 1850 1855 1860 Lys Pro Leu Thr Asp Asn Lys Gln Ser Leu Ile Glu Glu Leu Gln 1865 1870 1875 Arg Lys Val Lys Lys Leu Glu Asn Gln Leu Glu Gly Lys Val Glu 1880 1885 1890 Glu Val Asp Leu Lys Pro Met Lys Glu Lys Asn Ala Lys Glu Glu 1895 1900 1905 Leu Ile Arg Trp Glu Glu Gly Lys Lys Trp Gln Ala Lys Ile Glu 1910 1915 1920 Gly Ile Arg Asn Lys Leu Lys Glu Lys Glu Gly Glu Val Phe Thr 1925 1930 1935 Leu Thr Lys Gln Leu Asn Thr Leu Lys Asp Leu Phe Ala Lys Ala 1940 1945 1950 Asp Lys Glu Lys Leu Thr Leu Gln Arg Lys Leu Lys Thr Thr Gly 1955 1960 1965 Met Thr Val Asp Gln Val Leu Gly Ile Arg Ala Leu Glu Ser Glu 1970 1975 1980 Lys Glu Leu Glu Glu Leu Lys Lys Arg Asn Leu Asp Leu Glu Asn 1985 1990 1995 Asp Ile Leu Tyr Met Arg Ala His Gln Ala Leu Pro Arg Asp Ser 2000 2005 2010 Val Val Glu Asp Leu His Leu Gln Asn Arg Tyr Leu Gln Glu Lys 2015 2020 2025 Leu His Ala Leu Glu Lys Gln Phe Ser Lys Asp Thr Tyr Ser Lys 2030 2035 2040 Pro Ser Ile Ser Gly Ile Glu Ser Asp Asp His Cys Gln Arg Glu 2045 2050 2055 Gln Glu Leu Gln Lys Glu Asn Leu Lys Leu Ser Ser Glu Asn Ile 2060 2065 2070 Glu Leu Lys Phe Gln Leu Glu Gln Ala Asn Lys Asp Leu Pro Arg 2075 2080 2085 Leu Lys Asn Gln Val Arg Asp Leu Lys Glu Met Cys Glu Phe Leu 2090 2095 2100 Lys Lys Glu Lys Ala Glu Val Gln Arg Lys Leu Gly His Val Arg 2105 2110 2115 Gly Ser Gly Arg Ser Gly Lys Thr Ile Pro Glu Leu Glu Lys Thr 2120 2125 2130 Ile Gly Leu Met Lys Lys Val Val Glu Lys Val Gln Arg Glu Asn 2135 2140 2145 Glu Gln Leu Lys Lys Ala Ser Gly Ile Leu Thr Ser Glu Lys Met 2150 2155 2160 Ala Asn Ile Glu Gln Glu Asn Glu Lys Leu Lys Ala Glu Leu Glu 2165 2170 2175 Lys Leu Lys Ala His Leu Gly His Gln Leu Ser Met His Tyr Glu 2180 2185 2190 Ser Lys Thr Lys Gly Thr Glu Lys Ile Ile Ala Glu Asn Glu Arg 2195 2200 2205 Leu Arg Lys Glu Leu Lys Lys Glu Thr Asp Ala Ala Glu Lys Leu 2210 2215 2220 Arg Ile Ala Lys Asn Asn Leu Glu Ile Leu Asn Glu Lys Met Thr 2225 2230 2235 Val Gln Leu Glu Glu Thr Gly Lys Arg Leu Gln Phe Ala Glu Ser 2240 2245 2250 Arg Gly Pro Gln Leu Glu Gly Ala Asp Ser Lys Ser Trp Lys Ser 2255 2260 2265 Ile Val Val Thr Arg Met Tyr Glu Thr Lys Leu Lys Glu Leu Glu 2270 2275 2280 Thr Asp Ile Ala Lys Lys Asn Gln Ser Ile Thr Asp Leu Lys Gln 2285 2290 2295 Leu Val Lys Glu Ala Thr Glu Arg Glu Gln Lys Val Asn Lys Tyr 2300 2305 2310 Asn Glu Asp Leu Glu Gln Gln Ile Lys Ile Leu Lys His Val Pro 2315 2320 2325 Glu Gly Ala Glu Thr Glu Gln Gly Leu Lys Arg Glu Leu Gln Val 2330 2335 2340 Leu Arg Leu Ala Asn His Gln Leu Asp Lys Glu Lys Ala Glu Leu 2345 2350 2355 Ile His Gln Ile Glu Ala Asn Lys Asp Gln Ser Gly Ala Glu Ser 2360 2365 2370 Thr Ile Pro Asp Ala Asp Gln Leu Lys Glu Lys Ile Lys Asp Leu 2375 2380 2385 Glu Thr Gln Leu Lys Met Ser Asp Leu Glu Lys Gln His Leu Lys 2390 2395 2400 Glu Glu Ile Lys Lys Leu Lys Lys Glu Leu Glu Asn Phe Asp Pro 2405 2410 2415 Ser Phe Phe Glu Glu Ile Glu Asp Leu Lys Tyr Asn Tyr Lys Glu 2420 2425 2430 Glu Val Lys Lys Asn Ile Leu Leu Glu Glu Lys Val Lys Lys Leu 2435 2440 2445 Ser Glu Gln Leu Gly Val Glu Leu Thr Ser Pro Val Ala Ala Ser 2450 2455 2460 Glu Glu Phe Glu Asp Glu Glu Glu Ser Pro Val Asn Phe Pro Ile 2465 2470 2475 Tyr Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile 2480 2485 2490 Asp Tyr Lys Asp Asp Asp Asp Lys 2495 2500 <210> 18 <211> 2351 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 18 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 755 760 765 Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp 770 775 780 Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys 785 790 795 800 Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser 805 810 815 Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr 820 825 830 Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn 835 840 845 Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly 850 855 860 Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu 865 870 875 880 Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys 885 890 895 Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn 900 905 910 Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met 915 920 925 Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys 930 935 940 Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu 945 950 955 960 Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu 965 970 975 Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe 980 985 990 Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala 995 1000 1005 Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser 1010 1015 1020 Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser 1025 1030 1035 Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu 1040 1045 1050 Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg 1055 1060 1065 Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met 1070 1075 1080 Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln 1085 1090 1095 Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met 1100 1105 1110 Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile 1115 1120 1125 Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro 1130 1135 1140 Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu 1145 1150 1155 Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys 1160 1165 1170 Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro 1175 1180 1185 Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu 1190 1195 1200 Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu 1205 1210 1215 Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile 1220 1225 1230 His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu 1235 1240 1245 Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr 1250 1255 1260 Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn 1265 1270 1275 Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu 1280 1285 1290 Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu 1295 1300 1305 Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln 1310 1315 1320 Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg 1325 1330 1335 Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp 1340 1345 1350 Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro 1355 1360 1365 Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala 1370 1375 1380 Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser 1385 1390 1395 Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser 1400 1405 1410 Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe 1415 1420 1425 Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys 1430 1435 1440 Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys 1445 1450 1455 Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly 1460 1465 1470 Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser 1475 1480 1485 Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp 1490 1495 1500 Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His 1505 1510 1515 Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser 1520 1525 1530 Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr 1535 1540 1545 Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val 1550 1555 1560 Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser 1565 1570 1575 Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln 1580 1585 1590 Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys 1595 1600 1605 Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys 1610 1615 1620 Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys 1625 1630 1635 Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg 1640 1645 1650 Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu 1655 1660 1665 Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 1670 1675 1680 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile 1685 1690 1695 Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 1700 1705 1710 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr 1715 1720 1725 Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser 1730 1735 1740 Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 1745 1750 1755 Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu 1760 1765 1770 His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp 1775 1780 1785 Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser 1790 1795 1800 Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly 1805 1810 1815 Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr 1820 1825 1830 Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu 1835 1840 1845 Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu 1850 1855 1860 Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His 1865 1870 1875 Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln 1880 1885 1890 Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp 1895 1900 1905 Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1910 1915 1920 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His 1925 1930 1935 Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met 1940 1945 1950 Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser 1955 1960 1965 Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr 1970 1975 1980 Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr 1985 1990 1995 Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly 2000 2005 2010 Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly 2015 2020 2025 Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro 2030 2035 2040 Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala 2045 2050 2055 Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His 2060 2065 2070 Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser 2075 2080 2085 Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile 2090 2095 2100 Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser 2105 2110 2115 Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr 2120 2125 2130 Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn 2135 2140 2145 Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 2150 2155 2160 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg 2165 2170 2175 Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys 2180 2185 2190 Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln 2195 2200 2205 Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser 2210 2215 2220 Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp 2225 2230 2235 Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe 2240 2245 2250 Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys 2255 2260 2265 Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser 2270 2275 2280 Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys 2285 2290 2295 Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val 2300 2305 2310 Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His 2315 2320 2325 Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu 2330 2335 2340 Gly Cys Glu Ala Gln Asp Leu Tyr 2345 2350 <210> 19 <211> 159 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 19 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu 100 105 110 Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr 115 120 125 Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp 130 135 140 Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg 145 150 155 <210> 20 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 20 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Ile Glu Gln Phe Leu Pro 100 105 <210> 21 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 21 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val Asp Asn Leu 100 <210> 22 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 22 Cys Leu Ser Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Pro Ile Gly 1 5 10 15 Lys Ile Val Ile Cys Val Tyr Ser Val Asp Gly Tyr Thr Gln Ala Gln 20 25 30 Trp His Asp Arg Gly Glu Gln Glu Val Glu Tyr Glu Asp Gly Ser Ile 35 40 45 Arg Ala Thr Asp His Phe Thr Asp Gln Leu Ile Glu Ile Phe Arg Leu 50 55 60 Asp Leu Asn 65 <210> 23 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 23 Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser 20 25 30 Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser 50 55 60 Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln 65 70 75 80 Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr 85 90 95 Leu Glu Asn Ile 100 <210> 24 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 24 Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr 1 5 10 15 Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe 20 25 30 Ile Ala Ser Asn 35 <210> 25 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 25 Met Lys Arg Leu Gly Gln Asp Ile Gly Asp His Asn Phe Leu Asn Gly 1 5 10 15 Ile Ala Asn <210> 26 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 26 Met Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe 1 5 10 15 Asp Ile Gly Leu Pro Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala 20 25 30 Ile Ala Ala Asn 35 <210> 27 <211> 477 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 27 atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60 tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120 atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180 ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240 atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300 cagttcctgc ccaaggccca gaagctgtac ctgacccaca tcgacgccga ggtggagggc 360 gacacccact tccccgacta cgagcccgac gactgggaga gcgtgttcag cgagttccac 420 gacgccgacg cccagaacag ccacagctac tgcttcgaga tcctggagag gaggtga 477 <210> 28 <211> 159 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 28 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asp Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu 100 105 110 Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr 115 120 125 Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp 130 135 140 Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg 145 150 155 <210> 29 <211> 159 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 29 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu 100 105 110 Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr 115 120 125 Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp 130 135 140 Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg 145 150 155 <210> 30 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 30 atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60 tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120 atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180 ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240 atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300 cagttcctgc cctga 315 <210> 31 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 31 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asp Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Tyr Glu Gln Phe Leu Pro 100 105 <210> 32 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 32 Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met 1 5 10 15 Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys 20 25 30 Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu 35 40 45 Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser 50 55 60 Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu 65 70 75 80 Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly 85 90 95 Gly Arg Val Ile Glu Gln Phe Leu Pro 100 105 <210> 33 <211> 2665 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 33 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240 caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300 caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360 cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420 ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480 tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540 aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600 tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660 taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720 ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780 gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840 taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900 tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960 aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020 gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080 cggccgccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 1140 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1200 ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 1260 ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cctgagctac gagaccgaga 1320 tcctgaccgt ggagtacggc ctgctgccca tcggcaagat cgtggagaag cggatcgagt 1380 gcaccgtgta cagcgtggac aacaacggca acatctacac ccagcccgtg gcccagtggc 1440 acgaccgggg cgagcaggag gtgttcgagt actgcctgga ggacggcagc ctgatccggg 1500 ccaccaagga ccacaagttc atgaccgtgg acggccagat gctgcccatc gacgagatct 1560 tcgagcggga gctggacctg atgcgggtgg acaacctgcc caacgactac aaagaccatg 1620 acggtgatta taaagatcat gacatcgact acaaggatga cgatgacaag tgaaagcttg 1680 gatccaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1740 ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1800 cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1860 agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1920 ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1980 tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 2040 ggctgttggg cactgacaat tccgtggtgt tgtcggggaa gctgacgtcc tttccatggc 2100 tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 2160 ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2220 gtcttcgaga tctgcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 2280 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 2340 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 2400 ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggact cgagttaagg 2460 gcgaattccc gattaggatc ttcctagagc atggctacgt agataagtag catggcgggt 2520 taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 2580 gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 2640 cctcagtgag cgagcgagcg cgcag 2665 <210> 34 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 34 atgatcaaga tcgccacccg gaagtacctg ggcaagcaga acgtgtacga catcggcgtg 60 gagcgggacc acaacttcgc cctgaagaac ggcttcatcg ccagcaat 108 <210> 35 <211> 507 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 35 tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc 60 gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc 120 gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac 180 ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa cagccacaac 240 gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatccgccac 300 aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc 360 gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa 420 gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc 480 actctcggca tggacgagct gtacaag 507 <210> 36 <211> 583 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 36 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctgg tttagtgaac cgt 583 <210> 37 <211> 301 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 37 ctagtgggcc ccagaagcct ggtggttgtt tgtccttctc aggggaaaag tgaggcggcc 60 ccttggagga aggggccggg cagaatgatc taatcggatt ccaagcagct caggggattg 120 tctttttcta gcaccttctt gccactccta agcgtcctcc gtgaccccgg ctgggattta 180 gcctggtgct gtgtcagccc cgggctccca ggggcttccc agtggtcccc aggaaccctc 240 gacagggcca gggcgtctct ctcgtccagc aagggcaggg acgggccaca ggcaagggcg 300 c 301 <210> 38 <211> 477 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 38 atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60 tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120 atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180 ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240 atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300 cagttcctgc ccaaggccca gaagctgtac ctgacccaca tcgacgccga ggtggagggc 360 gacacccact tccccgacta cgagcccgac gactgggaga gcgtgttcag cgagttccac 420 gacgccgacg cccagaacag ccacagctac tgcttcgaga tcctggagag gaggtga 477 <210> 39 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 39 atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60 tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120 atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180 ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240 atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300 cagttcctgc cctga 315 <210> 40 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 40 tgcctggccg gcgacaccct gatcaccctg gccgacggca ggagggtgcc catcagggag 60 ctggtgagcc agcagaactt cagcgtgtgg gccctgaacc cccagaccta caggctggag 120 agggccaggg tgagcagggc cttctgcacc ggcatcaagc ccgtgtacag gctgaccacc 180 aggctgggca ggagcatcag ggccaccgcc aaccacaggt tcctgacccc ccagggctgg 240 aagagggtgg acgagctgca gcccggcgac tacctggccc tgcccaggag gatccccacc 300 gccagcaccc ccaccctg 318 <210> 41 <211> 156 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 41 atggccgccg cctgccccga gctgaggcag ctggcccaga gcgacgtgta ctgggacccc 60 atcgtgagca tcgagcccga cggcgtggag gaggtgttcg acctgaccgt gcccggcccc 120 cacaacttcg tggccaacga catcatcgcc cacaac 156 <210> 42 <211> 306 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 42 tgcctgagct acgacaccga gatcctgacc gtggagtacg gcatcctgcc catcggcaag 60 atcgtggaga agaggatcga gtgcaccgtg tacagcgtgg acaacaacgg caacatctac 120 acccagcccg tggcccagtg gcacgacagg ggcgagcagg aggtgttcga gtactgcctg 180 gaggacggca gcctgatcag ggccaccaag gaccacaagt tcatgaccgt ggacggccag 240 atgatgccca tcgacgagat cttcgagagg gagctggacc tgatgagggt ggacaacctg 300 cccaac 306 <210> 43 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 43 atggtgaagg tgatcggcag gaggagcctg ggcgtgcaga ggatcttcga catcggcctg 60 ccccagtacc acaacttcct gctggccaac ggcgccatcg ccgccaac 108 <210> 44 <211> 270 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 44 ctagcgttga cattgattat tgactagtac ggtaaatggc ccgcctggct gatgactcac 60 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 120 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 180 gtgtacggtg ggaggtctat ataagcagag ctggtttagt gaactagaga acccactgct 240 tactggcttc tcgagattcc accatggcgc 270 <210> 45 <211> 3225 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 45 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380 gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440 atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500 gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560 agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620 gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680 caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740 gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800 aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860 agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920 gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980 atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040 agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100 ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160 gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220 gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280 aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340 aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400 ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460 ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520 aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580 tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640 gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700 acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760 ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820 atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880 gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940 caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000 atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060 cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120 gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180 atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacat 3225 <210> 46 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 46 aattcaataa aagatcttta ttttcattag atctgtgtgt tggttttttg tgtgcggcc 59 <210> 47 <211> 4212 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 47 tgtcaaaaaa tgtatgaaca cttacggact tcgttaaagc aaatggagga acgtaatttt 60 gaattggaaa ccaaatttgc tgagcttacc aaaatcaatt tggatgcaca gaaggtggaa 120 cagatgttaa gagatgaatt agctgatagt gtgagcaagg cagtaagtga tgctgatagg 180 caacggattc tagaattaga gaagaatgaa atggaactaa aagttgaagt gtcaaaactg 240 agagagattt ctgatattgc cagaagacaa gttgaaattt tgaatgcaca acaacaatct 300 agggacaagg aagtagagtc cctcagaatg caactgctag actatcaggc acagtctgat 360 gaaaagtcgc tcattgccaa gttgcaccaa cataatgtct ctcttcaact gagtgaggct 420 actgctcttg gtaagttgga gtcaattaca tctaaactgc agaagatgga ggcctacaac 480 ttgcgcttag agcagaaact tgatgaaaaa gaacaggctc tctattatgc tcgtttggag 540 ggaagaaaca gagcaaaaca tctgcgccaa acaattcagt ctctacgacg acagtttagt 600 ggagctttac ccttggcaca acaggaaaag ttctccaaaa caatgattca actacaaaat 660 gacaaactta agataatgca agaaatgaaa aattctcaac aagaacatag aaatatggag 720 aacaaaacat tggagatgga attaaaatta aagggcctgg aagagttaat aagcacttta 780 aaggatacca aaggagccca aaaggtaatc aactggcata tgaaaataga agaacttcgt 840 cttcaagaac ttaaactaaa tcgggaatta gtcaaggata aagaagaaat aaaatatttg 900 aataacataa tttctgaata tgaacgtaca atcagcagtc ttgaagaaga aattgtgcaa 960 cagaacaagt ttcatgaaga aagacaaatg gcctgggatc aaagagaagt tgacctggaa 1020 cgccaactag acatttttga ccgtcagcaa aatgaaatac taaatgcggc acaaaagttt 1080 gaagaagcta caggatcaat ccctgaccct agtttgcccc ttccaaatca acttgagatc 1140 gctctaagga aaattaagga gaacattcga ataattctag aaacacgggc aacttgcaaa 1200 tcactagaag agaaactaaa agagaaagaa tctgctttaa ggttagcaga acaaaatata 1260 ctgtcaagag acaaagtaat caatgaactg aggcttcgat tgcctgccac tgcagaaaga 1320 gaaaagctca tagctgagct aggcagaaaa gagatggaac caaaatctca ccacacattg 1380 aaaattgctc atcaaaccat tgcaaacatg caagcaaggt taaatcaaaa agaagaagta 1440 ttaaagaagt atcaacgtct tctagaaaaa gccagagagg agcaaagaga aattgtgaag 1500 aaacatgagg aagaccttca tattcttcat cacagattag aactacaggc tgatagttca 1560 ctaaataaat tcaaacaaac ggcttgggat ttaatgaaac agtctcccac tccagttcct 1620 accaacaagc attttattcg tctggctgag atggaacaga cagtagcaga acaagatgac 1680 tctctttcct cactcttggt caaactaaag aaagtatcac aagatttgga gagacaaaga 1740 gaaatcactg aattaaaagt aaaagaattt gaaaatatca aattacagct tcaagaaaac 1800 catgaagatg aagtgaaaaa agtaaaagcg gaagtagagg atttaaagta tcttctggac 1860 cagtcacaaa aggagtcaca gtgtttaaaa tctgaacttc aggctcaaaa agaagcaaat 1920 tcaagagctc caacaactac aatgagaaat ctagtagaac ggctaaagag ccaattagcc 1980 ttgaaggaga aacaacagaa agcacttagt cgggcacttt tagaactccg ggcagaaatg 2040 acagcagctg ctgaagaacg tattatttct gcaacttctc aaaaagaggc ccatctcaat 2100 gttcaacaaa tcgttgatcg acatactaga gagctaaaga cacaagttga agatttaaat 2160 gaaaatcttt taaaattgaa agaagcactt aaaactagta aaaacagaga aaactcacta 2220 actgataatt tgaatgactt aaataatgaa ctgcaaaaga aacaaaaagc ctataataaa 2280 atacttagag agaaagagga aattgatcaa gagaatgatg aactgaaaag gcaaattaaa 2340 agactaacca gtggattaca gggcaaaccc ctgacagata ataaacaaag tctaattgaa 2400 gaactccaaa ggaaagttaa aaaactagag aaccaattag agggaaaggt ggaggaagta 2460 gacctaaaac ctatgaaaga aaagaatgct aaagaagaat taattaggtg ggaagaaggt 2520 aaaaagtggc aagccaaaat agaaggaatt cgaaacaagt taaaagagaa agagggggaa 2580 gtctttactt taacaaagca gttgaatact ttgaaggatc tttttgccaa agccgataaa 2640 gagaaactta ctttgcagag gaaactaaaa acaactggca tgactgttga tcaggttttg 2700 ggaatacgag ctttggagtc agaaaaagaa ttggaagaat taaaaaagag aaatcttgac 2760 ttagaaaatg atatattgta tatgagggcc caccaagctc ttcctcgaga ttctgttgta 2820 gaagatttac atttacaaaa tagatacctc caagaaaaac ttcatgcttt agaaaaacag 2880 ttttcaaagg atacatattc taagccttca atttcaggaa tagagtcaga tgatcattgt 2940 cagagagaac aggagcttca gaaggaaaac ttgaagttgt catctgaaaa tattgaactg 3000 aaatttcagc ttgaacaagc aaataaagat ttgccaagat taaagaatca agtcagagat 3060 ttgaaggaaa tgtgtgaatt tcttaagaaa gaaaaagcag aagttcagcg gaaacttggc 3120 catgttagag ggtctggtag aagtggaaag acaatcccag aactggaaaa aaccattggt 3180 ttaatgaaaa aagtagttga aaaagtccag agagaaaatg aacagttgaa aaaagcatca 3240 ggaatattga ctagtgaaaa aatggctaat attgagcagg aaaatgaaaa attgaaggct 3300 gaattagaaa aacttaaagc tcatcttggg catcagttga gcatgcacta tgaatccaag 3360 accaaaggca cagaaaaaat tattgctgaa aatgaaaggc ttcgtaaaga acttaaaaaa 3420 gaaactgatg ctgcagagaa attacggata gcaaagaata atttagagat attaaatgag 3480 aagatgacag ttcaactaga agagactggt aagagattgc agtttgcaga aagcagaggt 3540 ccacagcttg aaggtgctga cagtaagagc tggaaatcca ttgtggttac aagaatgtat 3600 gaaaccaagt taaaagaatt ggaaactgat attgccaaaa aaaatcaaag cattactgac 3660 cttaaacagc ttgtaaaaga agcaacagag agagaacaaa aagttaacaa atacaatgaa 3720 gaccttgaac aacagattaa gattcttaaa catgttcctg aaggtgctga gacagagcaa 3780 ggccttaaac gggagcttca agttcttaga ttagctaatc atcagctgga taaagagaaa 3840 gcagaattaa tccatcagat agaagctaac aaggaccaaa gtggagctga aagcaccata 3900 cctgatgctg atcaactaaa ggaaaaaata aaagatctag agacacagct caaaatgtca 3960 gatctagaaa agcagcattt gaaggaggaa ataaagaagc tgaaaaaaga actggaaaat 4020 tttgatcctt cattttttga agaaattgaa gatcttaagt ataattacaa ggaagaagtg 4080 aagaagaata ttctcttaga agagaaggta aaaaaacttt cagaacaatt gggagttgaa 4140 ttaactagcc ctgttgctgc ttctgaagag tttgaagatg aagaagaaag tcctgttaat 4200 ttccccattt ac 4212 <210> 48 <211> 3822 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 48 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380 gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440 atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500 gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560 agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620 gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680 caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740 gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800 aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860 agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920 gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980 atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040 agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100 ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160 gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220 gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280 aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340 aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400 ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460 ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520 aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580 tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640 gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700 acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760 ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820 atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880 gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940 caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000 atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060 cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120 gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180 atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacattgtca aaaaatgtat 3240 gaacacttac ggacttcgtt aaagcaaatg gaggaacgta attttgaatt ggaaaccaaa 3300 tttgctgagc ttaccaaaat caatttggat gcacagaagg tggaacagat gttaagagat 3360 gaattagctg atagtgtgag caaggcagta agtgatgctg ataggcaacg gattctagaa 3420 ttagagaaga atgaaatgga actaaaagtt gaagtgtcaa aactgagaga gatttctgat 3480 attgccagaa gacaagttga aattttgaat gcacaacaac aatctaggga caaggaagta 3540 gagtccctca gaatgcaact gctagactat caggcacagt ctgatgaaaa gtcgctcatt 3600 gccaagttgc accaacataa tgtctctctt caactgagtg aggctactgc tcttggtaag 3660 ttggagtcaa ttacatctaa actgcagaag atggaggcct acaacttgcg cttagagcag 3720 aaacttgatg aaaaagaaca ggctctctat tatgctcgtt tggagggaag aaacagagca 3780 aaacatctgc gccaaacaat tcagtctcta cgacgacagt tt 3822 <210> 49 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 49 agtggagctt tacccttggc acaacaggaa aagttctcca aaacaatgat tcaactacaa 60 aatgacaaac ttaagataat gcaagaaatg aaaaattctc aacaagaaca tagaaatatg 120 gagaacaaaa cattggagat ggaattaaaa ttaaagggcc tggaagagtt aataagcact 180 ttaaaggata ccaaaggagc ccaaaaggta atcaactggc atatgaaaat agaagaactt 240 cgtcttcaag aacttaaact aaatcgggaa ttagtcaagg ataaagaaga aataaaatat 300 ttgaataaca taatttctga atatgaacgt acaatcagca gtcttgaaga agaaattgtg 360 caacagaaca agtttcatga agaaagacaa atggcctggg atcaaagaga agttgacctg 420 gaacgccaac tagacatttt tgaccgtcag caaaatgaaa tactaaatgc ggcacaaaag 480 tttgaagaag ctacaggatc aatccctgac cctagtttgc cccttccaaa tcaacttgag 540 atcgctctaa ggaaaattaa ggagaacatt cgaataattc tagaaacacg ggcaacttgc 600 aaatcactag aagagaaact aaaagagaaa gaatctgctt taaggttagc agaacaaaat 660 atactgtcaa gagacaaagt aatcaatgaa ctgaggcttc gattgcctgc cactgcagaa 720 agagaaaagc tcatagctga gctaggcaga aaagagatgg aaccaaaatc tcaccacaca 780 ttgaaaattg ctcatcaaac cattgcaaac atgcaagcaa ggttaaatca aaaagaagaa 840 gtattaaaga agtatcaacg tcttctagaa aaagccagag aggagcaaag agaaattgtg 900 aagaaacatg aggaagacct tcatattctt catcacagat tagaactaca ggctgatagt 960 tcactaaata aattcaaaca aacggcttgg gatttaatga aacagtctcc cactccagtt 1020 cctaccaaca agcattttat tcgtctggct gagatggaac agacagtagc agaacaagat 1080 gactctcttt cctcactctt ggtcaaacta aagaaagtat cacaagattt ggagagacaa 1140 agagaaatca ctgaattaaa agtaaaagaa tttgaaaata tcaaattaca gcttcaagaa 1200 aaccatgaag atgaagtgaa aaaagtaaaa gcggaagtag aggatttaaa gtatcttctg 1260 gaccagtcac aaaaggagtc acagtgttta aaatctgaac ttcaggctca aaaagaagca 1320 aattcaagag ctccaacaac tacaatgaga aatctagtag aacggctaaa gagccaatta 1380 gccttgaagg agaaacaaca gaaagcactt agtcgggcac ttttagaact ccgggcagaa 1440 atgacagcag ctgctgaaga acgtattatt tctgcaactt ctcaaaaaga ggcccatctc 1500 aatgttcaac aaatcgttga tcgacatact agagagctaa agacacaagt tgaagattta 1560 aatgaaaatc ttttaaaatt gaaagaagca cttaaaacta gtaaaaacag agaaaactca 1620 ctaactgata atttgaatga cttaaataat gaactgcaaa agaaacaaaa agcctataat 1680 aaaatactta gagagaaaga ggaaattgat caagagaatg atgaactgaa aaggcaaatt 1740 aaaagactaa ccagtggatt acagggcaaa cccctgacag ataataaaca aagtctaatt 1800 gaagaactcc aaaggaaagt taaaaaacta gagaaccaat tagagggaaa ggtggaggaa 1860 gtagacctaa aacctatgaa agaaaagaat gctaaagaag aattaattag gtgggaagaa 1920 ggtaaaaagt ggcaagccaa aatagaagga attcgaaaca agttaaaaga gaaagagggg 1980 gaagtcttta ctttaacaaa gcagttgaat actttgaagg atctttttgc caaagccgat 2040 aaagagaaac ttactttgca gaggaaacta aaaacaactg gcatgactgt tgatcaggtt 2100 ttgggaatac gagctttgga gtcagaaaaa gaattggaag aattaaaaaa gagaaatctt 2160 gacttagaaa atgatatatt gtatatgagg gcccaccaag ctcttcctcg agattctgtt 2220 gtagaagatt tacatttaca aaatagatac ctccaagaaa aacttcatgc tttagaaaaa 2280 cagttttcaa aggatacata ttctaagcct tcaatttcag gaatagagtc agatgatcat 2340 tgtcagagag aacaggagct tcagaaggaa aacttgaagt tgtcatctga aaatattgaa 2400 ctgaaatttc agcttgaaca agcaaataaa gatttgccaa gattaaagaa tcaagtcaga 2460 gatttgaagg aaatgtgtga atttcttaag aaagaaaaag cagaagttca gcggaaactt 2520 ggccatgtta gagggtctgg tagaagtgga aagacaatcc cagaactgga aaaaaccatt 2580 ggtttaatga aaaaagtagt tgaaaaagtc cagagagaaa atgaacagtt gaaaaaagca 2640 tcaggaatat tgactagtga aaaaatggct aatattgagc aggaaaatga aaaattgaag 2700 gctgaattag aaaaacttaa agctcatctt gggcatcagt tgagcatgca ctatgaatcc 2760 aagaccaaag gcacagaaaa aattattgct gaaaatgaaa ggcttcgtaa agaacttaaa 2820 aaagaaactg atgctgcaga gaaattacgg atagcaaaga ataatttaga gatattaaat 2880 gagaagatga cagttcaact agaagagact ggtaagagat tgcagtttgc agaaagcaga 2940 ggtccacagc ttgaaggtgc tgacagtaag agctggaaat ccattgtggt tacaagaatg 3000 tatgaaacca agttaaaaga attggaaact gatattgcca aaaaaaatca aagcattact 3060 gaccttaaac agcttgtaaa agaagcaaca gagagagaac aaaaagttaa caaatacaat 3120 gaagaccttg aacaacagat taagattctt aaacatgttc ctgaaggtgc tgagacagag 3180 caaggcctta aacgggagct tcaagttctt agattagcta atcatcagct ggataaagag 3240 aaagcagaat taatccatca gatagaagct aacaaggacc aaagtggagc tgaaagcacc 3300 atacctgatg ctgatcaact aaaggaaaaa ataaaagatc tagagacaca gctcaaaatg 3360 tcagatctag aaaagcagca tttgaaggag gaaataaaga agctgaaaaa agaactggaa 3420 aattttgatc cttcattttt tgaagaaatt gaagatctta agtataatta caaggaagaa 3480 gtgaagaaga atattctctt agaagagaag gtaaaaaaac tttcagaaca attgggagtt 3540 gaattaacta gccctgttgc tgcttctgaa gagtttgaag atgaagaaga aagtcctgtt 3600 aatttcccca tttac 3615 <210> 50 <211> 3822 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 50 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380 gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440 atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500 gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560 agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620 gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680 caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740 gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800 aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860 agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920 gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980 atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040 agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100 ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160 gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220 gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280 aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340 aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400 ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460 ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520 aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580 tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640 gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700 acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760 ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820 atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880 gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940 caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000 atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060 cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120 gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180 atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacattgtca aaaaatgtat 3240 gaacacttac ggacttcgtt aaagcaaatg gaggaacgta attttgaatt ggaaaccaaa 3300 tttgctgagc ttaccaaaat caatttggat gcacagaagg tggaacagat gttaagagat 3360 gaattagctg atagtgtgag caaggcagta agtgatgctg ataggcaacg gattctagaa 3420 ttagagaaga atgaaatgga actaaaagtt gaagtgtcaa aactgagaga gatttctgat 3480 attgccagaa gacaagttga aattttgaat gcacaacaac aatctaggga caaggaagta 3540 gagtccctca gaatgcaact gctagactat caggcacagt ctgatgaaaa gtcgctcatt 3600 gccaagttgc accaacataa tgtctctctt caactgagtg aggctactgc tcttggtaag 3660 ttggagtcaa ttacatctaa actgcagaag atggaggcct acaacttgcg cttagagcag 3720 aaacttgatg aaaaagaaca ggctctctat tatgctcgtt tggagggaag aaacagagca 3780 aaacatctgc gccaaacaat tcagtctcta cgacgacagt tt 3822 <210> 51 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 51 agtggagctt tacccttggc acaacaggaa aagttctcca aaacaatgat tcaactacaa 60 aatgacaaac ttaagataat gcaagaaatg aaaaattctc aacaagaaca tagaaatatg 120 gagaacaaaa cattggagat ggaattaaaa ttaaagggcc tggaagagtt aataagcact 180 ttaaaggata ccaaaggagc ccaaaaggta atcaactggc atatgaaaat agaagaactt 240 cgtcttcaag aacttaaact aaatcgggaa ttagtcaagg ataaagaaga aataaaatat 300 ttgaataaca taatttctga atatgaacgt acaatcagca gtcttgaaga agaaattgtg 360 caacagaaca agtttcatga agaaagacaa atggcctggg atcaaagaga agttgacctg 420 gaacgccaac tagacatttt tgaccgtcag caaaatgaaa tactaaatgc ggcacaaaag 480 tttgaagaag ctacaggatc aatccctgac cctagtttgc cccttccaaa tcaacttgag 540 atcgctctaa ggaaaattaa ggagaacatt cgaataattc tagaaacacg ggcaacttgc 600 aaatcactag aagagaaact aaaagagaaa gaatctgctt taaggttagc agaacaaaat 660 atactgtcaa gagacaaagt aatcaatgaa ctgaggcttc gattgcctgc cactgcagaa 720 agagaaaagc tcatagctga gctaggcaga aaagagatgg aaccaaaatc tcaccacaca 780 ttgaaaattg ctcatcaaac cattgcaaac atgcaagcaa ggttaaatca aaaagaagaa 840 gtattaaaga agtatcaacg tcttctagaa aaagccagag aggagcaaag agaaattgtg 900 aagaaacatg aggaagacct tcatattctt catcacagat tagaactaca ggctgatagt 960 tcactaaata aattcaaaca aacggcttgg gatttaatga aacagtctcc cactccagtt 1020 cctaccaaca agcattttat tcgtctggct gagatggaac agacagtagc agaacaagat 1080 gactctcttt cctcactctt ggtcaaacta aagaaagtat cacaagattt ggagagacaa 1140 agagaaatca ctgaattaaa agtaaaagaa tttgaaaata tcaaattaca gcttcaagaa 1200 aaccatgaag atgaagtgaa aaaagtaaaa gcggaagtag aggatttaaa gtatcttctg 1260 gaccagtcac aaaaggagtc acagtgttta aaatctgaac ttcaggctca aaaagaagca 1320 aattcaagag ctccaacaac tacaatgaga aatctagtag aacggctaaa gagccaatta 1380 gccttgaagg agaaacaaca gaaagcactt agtcgggcac ttttagaact ccgggcagaa 1440 atgacagcag ctgctgaaga acgtattatt tctgcaactt ctcaaaaaga ggcccatctc 1500 aatgttcaac aaatcgttga tcgacatact agagagctaa agacacaagt tgaagattta 1560 aatgaaaatc ttttaaaatt gaaagaagca cttaaaacta gtaaaaacag agaaaactca 1620 ctaactgata atttgaatga cttaaataat gaactgcaaa agaaacaaaa agcctataat 1680 aaaatactta gagagaaaga ggaaattgat caagagaatg atgaactgaa aaggcaaatt 1740 aaaagactaa ccagtggatt acagggcaaa cccctgacag ataataaaca aagtctaatt 1800 gaagaactcc aaaggaaagt taaaaaacta gagaaccaat tagagggaaa ggtggaggaa 1860 gtagacctaa aacctatgaa agaaaagaat gctaaagaag aattaattag gtgggaagaa 1920 ggtaaaaagt ggcaagccaa aatagaagga attcgaaaca agttaaaaga gaaagagggg 1980 gaagtcttta ctttaacaaa gcagttgaat actttgaagg atctttttgc caaagccgat 2040 aaagagaaac ttactttgca gaggaaacta aaaacaactg gcatgactgt tgatcaggtt 2100 ttgggaatac gagctttgga gtcagaaaaa gaattggaag aattaaaaaa gagaaatctt 2160 gacttagaaa atgatatatt gtatatgagg gcccaccaag ctcttcctcg agattctgtt 2220 gtagaagatt tacatttaca aaatagatac ctccaagaaa aacttcatgc tttagaaaaa 2280 cagttttcaa aggatacata ttctaagcct tcaatttcag gaatagagtc agatgatcat 2340 tgtcagagag aacaggagct tcagaaggaa aacttgaagt tgtcatctga aaatattgaa 2400 ctgaaatttc agcttgaaca agcaaataaa gatttgccaa gattaaagaa tcaagtcaga 2460 gatttgaagg aaatgtgtga atttcttaag aaagaaaaag cagaagttca gcggaaactt 2520 ggccatgtta gagggtctgg tagaagtgga aagacaatcc cagaactgga aaaaaccatt 2580 ggtttaatga aaaaagtagt tgaaaaagtc cagagagaaa atgaacagtt gaaaaaagca 2640 tcaggaatat tgactagtga aaaaatggct aatattgagc aggaaaatga aaaattgaag 2700 gctgaattag aaaaacttaa agctcatctt gggcatcagt tgagcatgca ctatgaatcc 2760 aagaccaaag gcacagaaaa aattattgct gaaaatgaaa ggcttcgtaa agaacttaaa 2820 aaagaaactg atgctgcaga gaaattacgg atagcaaaga ataatttaga gatattaaat 2880 gagaagatga cagttcaact agaagagact ggtaagagat tgcagtttgc agaaagcaga 2940 ggtccacagc ttgaaggtgc tgacagtaag agctggaaat ccattgtggt tacaagaatg 3000 tatgaaacca agttaaaaga attggaaact gatattgcca aaaaaaatca aagcattact 3060 gaccttaaac agcttgtaaa agaagcaaca gagagagaac aaaaagttaa caaatacaat 3120 gaagaccttg aacaacagat taagattctt aaacatgttc ctgaaggtgc tgagacagag 3180 caaggcctta aacgggagct tcaagttctt agattagcta atcatcagct ggataaagag 3240 aaagcagaat taatccatca gatagaagct aacaaggacc aaagtggagc tgaaagcacc 3300 atacctgatg ctgatcaact aaaggaaaaa ataaaagatc tagagacaca gctcaaaatg 3360 tcagatctag aaaagcagca tttgaaggag gaaataaaga agctgaaaaa agaactggaa 3420 aattttgatc cttcattttt tgaagaaatt gaagatctta agtataatta caaggaagaa 3480 gtgaagaaga atattctctt agaagagaag gtaaaaaaac tttcagaaca attgggagtt 3540 gaattaacta gccctgttgc tgcttctgaa gagtttgaag atgaagaaga aagtcctgtt 3600 aatttcccca tttac 3615 <210> 52 <211> 2784 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 52 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380 gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440 atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500 gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560 agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620 gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680 caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740 gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800 aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860 agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920 gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980 atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040 agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100 ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160 gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220 gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280 aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340 aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400 ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460 ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520 aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580 tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640 gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700 acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760 ttgttgtcaa tggaggctga agtt 2784 <210> 53 <211> 1635 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 53 tgtgaaaaaa ttgggtgttt gcaaagattt aaggaaatgg ccattttcaa gattgcagct 60 ctccaaaaag ttgtagataa tagtgtttct ttgtctgaac tagaactggc taataaacag 120 tacaatgaac tgactgctaa gtacagggac atcttgcaaa aagataatat gcttgttcaa 180 agaacaagta acttggaaca cctggagtgt gaaaacatct ccttaaaaga acaagtggag 240 tctataaata aagaactgga gattaccaag gaaaaacttc acactattga acaagcctgg 300 gaacaggaaa ctaaattagg taatgaatct agcatggata aggcaaagaa atcaataacc 360 aacagtgaca ttgtttccat ttcaaaaaaa ataactatgc tggaaatgaa ggaattaaat 420 gaaaggcagc gggctgaaca ttgtcaaaaa atgtatgaac acttacggac ttcgttaaag 480 caaatggagg aacgtaattt tgaattggaa accaaatttg ctgagcttac caaaatcaat 540 ttggatgcac agaaggtgga acagatgtta agagatgaat tagctgatag tgtgagcaag 600 gcagtaagtg atgctgatag gcaacggatt ctagaattag agaagaatga aatggaacta 660 aaagttgaag tgtcaaaact gagagagatt tctgatattg ccagaagaca agttgaaatt 720 ttgaatgcac aacaacaatc tagggacaag gaagtagagt ccctcagaat gcaactgcta 780 gactatcagg cacagtctga tgaaaagtcg ctcattgcca agttgcacca acataatgtc 840 tctcttcaac tgagtgaggc tactgctctt ggtaagttgg agtcaattac atctaaactg 900 cagaagatgg aggcctacaa cttgcgctta gagcagaaac ttgatgaaaa agaacaggct 960 ctctattatg ctcgtttgga gggaagaaac agagcaaaac atctgcgcca aacaattcag 1020 tctctacgac gacagtttag tggagcttta cccttggcac aacaggaaaa gttctccaaa 1080 acaatgattc aactacaaaa tgacaaactt aagataatgc aagaaatgaa aaattctcaa 1140 caagaacata gaaatatgga gaacaaaaca ttggagatgg aattaaaatt aaagggcctg 1200 gaagagttaa taagcacttt aaaggatacc aaaggagccc aaaaggtaat caactggcat 1260 atgaaaatag aagaacttcg tcttcaagaa cttaaactaa atcgggaatt agtcaaggat 1320 aaagaagaaa taaaatattt gaataacata atttctgaat atgaacgtac aatcagcagt 1380 cttgaagaag aaattgtgca acagaacaag tttcatgaag aaagacaaat ggcctgggat 1440 caaagagaag ttgacctgga acgccaacta gacatttttg accgtcagca aaatgaaata 1500 ctaaatgcgg cacaaaagtt tgaagaagct acaggatcaa tccctgaccc tagtttgccc 1560 cttccaaatc aacttgagat cgctctaagg aaaattaagg agaacattcg aataattcta 1620 gaaacacggg caact 1635 <210> 54 <211> 3018 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 54 tgcaaatcac tagaagagaa actaaaagag aaagaatctg ctttaaggtt agcagaacaa 60 aatatactgt caagagacaa agtaatcaat gaactgaggc ttcgattgcc tgccactgca 120 gaaagagaaa agctcatagc tgagctaggc agaaaagaga tggaaccaaa atctcaccac 180 acattgaaaa ttgctcatca aaccattgca aacatgcaag caaggttaaa tcaaaaagaa 240 gaagtattaa agaagtatca acgtcttcta gaaaaagcca gagaggagca aagagaaatt 300 gtgaagaaac atgaggaaga ccttcatatt cttcatcaca gattagaact acaggctgat 360 agttcactaa ataaattcaa acaaacggct tgggatttaa tgaaacagtc tcccactcca 420 gttcctacca acaagcattt tattcgtctg gctgagatgg aacagacagt agcagaacaa 480 gatgactctc tttcctcact cttggtcaaa ctaaagaaag tatcacaaga tttggagaga 540 caaagagaaa tcactgaatt aaaagtaaaa gaatttgaaa atatcaaatt acagcttcaa 600 gaaaaccatg aagatgaagt gaaaaaagta aaagcggaag tagaggattt aaagtatctt 660 ctggaccagt cacaaaagga gtcacagtgt ttaaaatctg aacttcaggc tcaaaaagaa 720 gcaaattcaa gagctccaac aactacaatg agaaatctag tagaacggct aaagagccaa 780 ttagccttga aggagaaaca acagaaagca cttagtcggg cacttttaga actccgggca 840 gaaatgacag cagctgctga agaacgtatt atttctgcaa cttctcaaaa agaggcccat 900 ctcaatgttc aacaaatcgt tgatcgacat actagagagc taaagacaca agttgaagat 960 ttaaatgaaa atcttttaaa attgaaagaa gcacttaaaa ctagtaaaaa cagagaaaac 1020 tcactaactg ataatttgaa tgacttaaat aatgaactgc aaaagaaaca aaaagcctat 1080 aataaaatac ttagagagaa agaggaaatt gatcaagaga atgatgaact gaaaaggcaa 1140 attaaaagac taaccagtgg attacagggc aaacccctga cagataataa acaaagtcta 1200 attgaagaac tccaaaggaa agttaaaaaa ctagagaacc aattagaggg aaaggtggag 1260 gaagtagacc taaaacctat gaaagaaaag aatgctaaag aagaattaat taggtgggaa 1320 gaaggtaaaa agtggcaagc caaaatagaa ggaattcgaa acaagttaaa agagaaagag 1380 ggggaagtct ttactttaac aaagcagttg aatactttga aggatctttt tgccaaagcc 1440 gataaagaga aacttacttt gcagaggaaa ctaaaaacaa ctggcatgac tgttgatcag 1500 gttttgggaa tacgagcttt ggagtcagaa aaagaattgg aagaattaaa aaagagaaat 1560 cttgacttag aaaatgatat attgtatatg agggcccacc aagctcttcc tcgagattct 1620 gttgtagaag atttacattt acaaaataga tacctccaag aaaaacttca tgctttagaa 1680 aaacagtttt caaaggatac atattctaag ccttcaattt caggaataga gtcagatgat 1740 cattgtcaga gagaacagga gcttcagaag gaaaacttga agttgtcatc tgaaaatatt 1800 gaactgaaat ttcagcttga acaagcaaat aaagatttgc caagattaaa gaatcaagtc 1860 agagatttga aggaaatgtg tgaatttctt aagaaagaaa aagcagaagt tcagcggaaa 1920 cttggccatg ttagagggtc tggtagaagt ggaaagacaa tcccagaact ggaaaaaacc 1980 attggtttaa tgaaaaaagt agttgaaaaa gtccagagag aaaatgaaca gttgaaaaaa 2040 gcatcaggaa tattgactag tgaaaaaatg gctaatattg agcaggaaaa tgaaaaattg 2100 aaggctgaat tagaaaaact taaagctcat cttgggcatc agttgagcat gcactatgaa 2160 tccaagacca aaggcacaga aaaaattatt gctgaaaatg aaaggcttcg taaagaactt 2220 aaaaaagaaa ctgatgctgc agagaaatta cggatagcaa agaataattt agagatatta 2280 aatgagaaga tgacagttca actagaagag actggtaaga gattgcagtt tgcagaaagc 2340 agaggtccac agcttgaagg tgctgacagt aagagctgga aatccattgt ggttacaaga 2400 atgtatgaaa ccaagttaaa agaattggaa actgatattg ccaaaaaaaa tcaaagcatt 2460 actgacctta aacagcttgt aaaagaagca acagagagag aacaaaaagt taacaaatac 2520 aatgaagacc ttgaacaaca gattaagatt cttaaacatg ttcctgaagg tgctgagaca 2580 gagcaaggcc ttaaacggga gcttcaagtt cttagattag ctaatcatca gctggataaa 2640 gagaaagcag aattaatcca tcagatagaa gctaacaagg accaaagtgg agctgaaagc 2700 accatacctg atgctgatca actaaaggaa aaaataaaag atctagagac acagctcaaa 2760 atgtcagatc tagaaaagca gcatttgaag gaggaaataa agaagctgaa aaaagaactg 2820 gaaaattttg atccttcatt ttttgaagaa attgaagatc ttaagtataa ttacaaggaa 2880 gaagtgaaga agaatattct cttagaagag aaggtaaaaa aactttcaga acaattggga 2940 gttgaattaa ctagccctgt tgctgcttct gaagagtttg aagatgaaga agaaagtcct 3000 gttaatttcc ccatttac 3018 <210> 55 <211> 1356 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 55 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaa 1356 <210> 56 <211> 3063 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 56 tcgggagtat atggtttaga agatgctgtc gttgaaataa agaattgtaa aaaccaaatt 60 aaaataagag atcgagagat tgaaatatta acaaaggaaa tcaataaact tgaattgaag 120 atcagtgatt tccttgatga aaatgaggca cttagagagc gtgtgggcct tgaaccaaag 180 acaatgattg atttaactga atttagaaat agcaaacact taaaacagca gcagtacaga 240 gctgaaaacc agattctttt gaaagagatt gaaagtctag aggaagaacg acttgatctg 300 aaaaaaaaaa ttcgtcaaat ggctcaagaa agaggaaaaa gaagtgcaac ttcaggatta 360 accactgagg acctgaacct aactgaaaac atttctcaag gagatagaat aagtgaaaga 420 aaattggatt tattgagcct caaaaatatg agtgaagcac aatcaaagaa tgaatttctt 480 tcaagagaac taattgaaaa agaaagagat ttagaaagga gtaggacagt gatagccaaa 540 tttcagaata aattaaaaga attagttgaa gaaaataagc aacttgaaga aggtatgaaa 600 gaaatattgc aagcaattaa ggaaatgcag aaagatcctg atgttaaagg aggagaaaca 660 tctctaatta tccctagcct tgaaagacta gttaatgcta tagaatcaaa gaatgcagaa 720 ggaatctttg atgcgagtct gcatttgaaa gcccaagttg atcagcttac cggaagaaat 780 gaagaattaa gacaggagct cagggaatct cggaaagagg ctataaatta ttcacagcag 840 ttggcaaaag ctaatttaaa gatagaccat cttgaaaaag aaactagtct tttacgacaa 900 tcagaaggat cgaatgttgt ttttaaagga attgacttac ctgatgggat agcaccatct 960 agtgccagta tcattaattc tcagaatgaa tatttaatac atttgttaca ggaactagaa 1020 aataaagaaa aaaagttaaa gaatttagaa gattctcttg aagattacaa cagaaaattt 1080 gctgtaattc gtcatcaaca aagtttgttg tataaagaat acctaagtga aaaggagacc 1140 tggaaaacag aatctaaaac aataaaagag gaaaagagaa aacttgagga tcaagtccaa 1200 caagatgcta taaaagtaaa agaatataat aatttgctca atgctcttca gatggattcg 1260 gatgaaatga aaaaaatact tgcagaaaat agtaggaaaa ttactgtttt gcaagtgaat 1320 gaaaaatcac ttataaggca atatacaacc ttagtagaat tggagcgaca acttagaaaa 1380 gaaaatgaga agcaaaagaa tgaattgttg tcaatggagg ctgaagtttg tgaaaaaatt 1440 gggtgtttgc aaagatttaa ggaaatggcc attttcaaga ttgcagctct ccaaaaagtt 1500 gtagataata gtgtttcttt gtctgaacta gaactggcta ataaacagta caatgaactg 1560 actgctaagt acagggacat cttgcaaaaa gataatatgc ttgttcaaag aacaagtaac 1620 ttggaacacc tggagtgtga aaacatctcc ttaaaagaac aagtggagtc tataaataaa 1680 gaactggaga ttaccaagga aaaacttcac actattgaac aagcctggga acaggaaact 1740 aaattaggta atgaatctag catggataag gcaaagaaat caataaccaa cagtgacatt 1800 gtttccattt caaaaaaaat aactatgctg gaaatgaagg aattaaatga aaggcagcgg 1860 gctgaacatt gtcaaaaaat gtatgaacac ttacggactt cgttaaagca aatggaggaa 1920 cgtaattttg aattggaaac caaatttgct gagcttacca aaatcaattt ggatgcacag 1980 aaggtggaac agatgttaag agatgaatta gctgatagtg tgagcaaggc agtaagtgat 2040 gctgataggc aacggattct agaattagag aagaatgaaa tggaactaaa agttgaagtg 2100 tcaaaactga gagagatttc tgatattgcc agaagacaag ttgaaatttt gaatgcacaa 2160 caacaatcta gggacaagga agtagagtcc ctcagaatgc aactgctaga ctatcaggca 2220 cagtctgatg aaaagtcgct cattgccaag ttgcaccaac ataatgtctc tcttcaactg 2280 agtgaggcta ctgctcttgg taagttggag tcaattacat ctaaactgca gaagatggag 2340 gcctacaact tgcgcttaga gcagaaactt gatgaaaaag aacaggctct ctattatgct 2400 cgtttggagg gaagaaacag agcaaaacat ctgcgccaaa caattcagtc tctacgacga 2460 cagtttagtg gagctttacc cttggcacaa caggaaaagt tctccaaaac aatgattcaa 2520 ctacaaaatg acaaacttaa gataatgcaa gaaatgaaaa attctcaaca agaacataga 2580 aatatggaga acaaaacatt ggagatggaa ttaaaattaa agggcctgga agagttaata 2640 agcactttaa aggataccaa aggagcccaa aaggtaatca actggcatat gaaaatagaa 2700 gaacttcgtc ttcaagaact taaactaaat cgggaattag tcaaggataa agaagaaata 2760 aaatatttga ataacataat ttctgaatat gaacgtacaa tcagcagtct tgaagaagaa 2820 attgtgcaac agaacaagtt tcatgaagaa agacaaatgg cctgggatca aagagaagtt 2880 gacctggaac gccaactaga catttttgac cgtcagcaaa atgaaatact aaatgcggca 2940 caaaagtttg aagaagctac aggatcaatc cctgacccta gtttgcccct tccaaatcaa 3000 cttgagatcg ctctaaggaa aattaaggag aacattcgaa taattctaga aacacgggca 3060 act 3063 <210> 57 <211> 1356 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 57 atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60 caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120 aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180 atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240 gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300 gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360 gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420 gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480 aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540 attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600 gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660 gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720 aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780 aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840 tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900 ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960 gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020 gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080 gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140 aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200 ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260 aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320 ttagttgagg ctctgaagag gttaaaagat tatgaa 1356 <210> 58 <211> 3063 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 58 tcgggagtat atggtttaga agatgctgtc gttgaaataa agaattgtaa aaaccaaatt 60 aaaataagag atcgagagat tgaaatatta acaaaggaaa tcaataaact tgaattgaag 120 atcagtgatt tccttgatga aaatgaggca cttagagagc gtgtgggcct tgaaccaaag 180 acaatgattg atttaactga atttagaaat agcaaacact taaaacagca gcagtacaga 240 gctgaaaacc agattctttt gaaagagatt gaaagtctag aggaagaacg acttgatctg 300 aaaaaaaaaa ttcgtcaaat ggctcaagaa agaggaaaaa gaagtgcaac ttcaggatta 360 accactgagg acctgaacct aactgaaaac atttctcaag gagatagaat aagtgaaaga 420 aaattggatt tattgagcct caaaaatatg agtgaagcac aatcaaagaa tgaatttctt 480 tcaagagaac taattgaaaa agaaagagat ttagaaagga gtaggacagt gatagccaaa 540 tttcagaata aattaaaaga attagttgaa gaaaataagc aacttgaaga aggtatgaaa 600 gaaatattgc aagcaattaa ggaaatgcag aaagatcctg atgttaaagg aggagaaaca 660 tctctaatta tccctagcct tgaaagacta gttaatgcta tagaatcaaa gaatgcagaa 720 ggaatctttg atgcgagtct gcatttgaaa gcccaagttg atcagcttac cggaagaaat 780 gaagaattaa gacaggagct cagggaatct cggaaagagg ctataaatta ttcacagcag 840 ttggcaaaag ctaatttaaa gatagaccat cttgaaaaag aaactagtct tttacgacaa 900 tcagaaggat cgaatgttgt ttttaaagga attgacttac ctgatgggat agcaccatct 960 agtgccagta tcattaattc tcagaatgaa tatttaatac atttgttaca ggaactagaa 1020 aataaagaaa aaaagttaaa gaatttagaa gattctcttg aagattacaa cagaaaattt 1080 gctgtaattc gtcatcaaca aagtttgttg tataaagaat acctaagtga aaaggagacc 1140 tggaaaacag aatctaaaac aataaaagag gaaaagagaa aacttgagga tcaagtccaa 1200 caagatgcta taaaagtaaa agaatataat aatttgctca atgctcttca gatggattcg 1260 gatgaaatga aaaaaatact tgcagaaaat agtaggaaaa ttactgtttt gcaagtgaat 1320 gaaaaatcac ttataaggca atatacaacc ttagtagaat tggagcgaca acttagaaaa 1380 gaaaatgaga agcaaaagaa tgaattgttg tcaatggagg ctgaagtttg tgaaaaaatt 1440 gggtgtttgc aaagatttaa ggaaatggcc attttcaaga ttgcagctct ccaaaaagtt 1500 gtagataata gtgtttcttt gtctgaacta gaactggcta ataaacagta caatgaactg 1560 actgctaagt acagggacat cttgcaaaaa gataatatgc ttgttcaaag aacaagtaac 1620 ttggaacacc tggagtgtga aaacatctcc ttaaaagaac aagtggagtc tataaataaa 1680 gaactggaga ttaccaagga aaaacttcac actattgaac aagcctggga acaggaaact 1740 aaattaggta atgaatctag catggataag gcaaagaaat caataaccaa cagtgacatt 1800 gtttccattt caaaaaaaat aactatgctg gaaatgaagg aattaaatga aaggcagcgg 1860 gctgaacatt gtcaaaaaat gtatgaacac ttacggactt cgttaaagca aatggaggaa 1920 cgtaattttg aattggaaac caaatttgct gagcttacca aaatcaattt ggatgcacag 1980 aaggtggaac agatgttaag agatgaatta gctgatagtg tgagcaaggc agtaagtgat 2040 gctgataggc aacggattct agaattagag aagaatgaaa tggaactaaa agttgaagtg 2100 tcaaaactga gagagatttc tgatattgcc agaagacaag ttgaaatttt gaatgcacaa 2160 caacaatcta gggacaagga agtagagtcc ctcagaatgc aactgctaga ctatcaggca 2220 cagtctgatg aaaagtcgct cattgccaag ttgcaccaac ataatgtctc tcttcaactg 2280 agtgaggcta ctgctcttgg taagttggag tcaattacat ctaaactgca gaagatggag 2340 gcctacaact tgcgcttaga gcagaaactt gatgaaaaag aacaggctct ctattatgct 2400 cgtttggagg gaagaaacag agcaaaacat ctgcgccaaa caattcagtc tctacgacga 2460 cagtttagtg gagctttacc cttggcacaa caggaaaagt tctccaaaac aatgattcaa 2520 ctacaaaatg acaaacttaa gataatgcaa gaaatgaaaa attctcaaca agaacataga 2580 aatatggaga acaaaacatt ggagatggaa ttaaaattaa agggcctgga agagttaata 2640 agcactttaa aggataccaa aggagcccaa aaggtaatca actggcatat gaaaatagaa 2700 gaacttcgtc ttcaagaact taaactaaat cgggaattag tcaaggataa agaagaaata 2760 aaatatttga ataacataat ttctgaatat gaacgtacaa tcagcagtct tgaagaagaa 2820 attgtgcaac agaacaagtt tcatgaagaa agacaaatgg cctgggatca aagagaagtt 2880 gacctggaac gccaactaga catttttgac cgtcagcaaa atgaaatact aaatgcggca 2940 caaaagtttg aagaagctac aggatcaatc cctgacccta gtttgcccct tccaaatcaa 3000 cttgagatcg ctctaaggaa aattaaggag aacattcgaa taattctaga aacacgggca 3060 act 3063 <210> 59 <211> 3018 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 59 tgcaaatcac tagaagagaa actaaaagag aaagaatctg ctttaaggtt agcagaacaa 60 aatatactgt caagagacaa agtaatcaat gaactgaggc ttcgattgcc tgccactgca 120 gaaagagaaa agctcatagc tgagctaggc agaaaagaga tggaaccaaa atctcaccac 180 acattgaaaa ttgctcatca aaccattgca aacatgcaag caaggttaaa tcaaaaagaa 240 gaagtattaa agaagtatca acgtcttcta gaaaaagcca gagaggagca aagagaaatt 300 gtgaagaaac atgaggaaga ccttcatatt cttcatcaca gattagaact acaggctgat 360 agttcactaa ataaattcaa acaaacggct tgggatttaa tgaaacagtc tcccactcca 420 gttcctacca acaagcattt tattcgtctg gctgagatgg aacagacagt agcagaacaa 480 gatgactctc tttcctcact cttggtcaaa ctaaagaaag tatcacaaga tttggagaga 540 caaagagaaa tcactgaatt aaaagtaaaa gaatttgaaa atatcaaatt acagcttcaa 600 gaaaaccatg aagatgaagt gaaaaaagta aaagcggaag tagaggattt aaagtatctt 660 ctggaccagt cacaaaagga gtcacagtgt ttaaaatctg aacttcaggc tcaaaaagaa 720 gcaaattcaa gagctccaac aactacaatg agaaatctag tagaacggct aaagagccaa 780 ttagccttga aggagaaaca acagaaagca cttagtcggg cacttttaga actccgggca 840 gaaatgacag cagctgctga agaacgtatt atttctgcaa cttctcaaaa agaggcccat 900 ctcaatgttc aacaaatcgt tgatcgacat actagagagc taaagacaca agttgaagat 960 ttaaatgaaa atcttttaaa attgaaagaa gcacttaaaa ctagtaaaaa cagagaaaac 1020 tcactaactg ataatttgaa tgacttaaat aatgaactgc aaaagaaaca aaaagcctat 1080 aataaaatac ttagagagaa agaggaaatt gatcaagaga atgatgaact gaaaaggcaa 1140 attaaaagac taaccagtgg attacagggc aaacccctga cagataataa acaaagtcta 1200 attgaagaac tccaaaggaa agttaaaaaa ctagagaacc aattagaggg aaaggtggag 1260 gaagtagacc taaaacctat gaaagaaaag aatgctaaag aagaattaat taggtgggaa 1320 gaaggtaaaa agtggcaagc caaaatagaa ggaattcgaa acaagttaaa agagaaagag 1380 ggggaagtct ttactttaac aaagcagttg aatactttga aggatctttt tgccaaagcc 1440 gataaagaga aacttacttt gcagaggaaa ctaaaaacaa ctggcatgac tgttgatcag 1500 gttttgggaa tacgagcttt ggagtcagaa aaagaattgg aagaattaaa aaagagaaat 1560 cttgacttag aaaatgatat attgtatatg agggcccacc aagctcttcc tcgagattct 1620 gttgtagaag atttacattt acaaaataga tacctccaag aaaaacttca tgctttagaa 1680 aaacagtttt caaaggatac atattctaag ccttcaattt caggaataga gtcagatgat 1740 cattgtcaga gagaacagga gcttcagaag gaaaacttga agttgtcatc tgaaaatatt 1800 gaactgaaat ttcagcttga acaagcaaat aaagatttgc caagattaaa gaatcaagtc 1860 agagatttga aggaaatgtg tgaatttctt aagaaagaaa aagcagaagt tcagcggaaa 1920 cttggccatg ttagagggtc tggtagaagt ggaaagacaa tcccagaact ggaaaaaacc 1980 attggtttaa tgaaaaaagt agttgaaaaa gtccagagag aaaatgaaca gttgaaaaaa 2040 gcatcaggaa tattgactag tgaaaaaatg gctaatattg agcaggaaaa tgaaaaattg 2100 aaggctgaat tagaaaaact taaagctcat cttgggcatc agttgagcat gcactatgaa 2160 tccaagacca aaggcacaga aaaaattatt gctgaaaatg aaaggcttcg taaagaactt 2220 aaaaaagaaa ctgatgctgc agagaaatta cggatagcaa agaataattt agagatatta 2280 aatgagaaga tgacagttca actagaagag actggtaaga gattgcagtt tgcagaaagc 2340 agaggtccac agcttgaagg tgctgacagt aagagctgga aatccattgt ggttacaaga 2400 atgtatgaaa ccaagttaaa agaattggaa actgatattg ccaaaaaaaa tcaaagcatt 2460 actgacctta aacagcttgt aaaagaagca acagagagag aacaaaaagt taacaaatac 2520 aatgaagacc ttgaacaaca gattaagatt cttaaacatg ttcctgaagg tgctgagaca 2580 gagcaaggcc ttaaacggga gcttcaagtt cttagattag ctaatcatca gctggataaa 2640 gagaaagcag aattaatcca tcagatagaa gctaacaagg accaaagtgg agctgaaagc 2700 accatacctg atgctgatca actaaaggaa aaaataaaag atctagagac acagctcaaa 2760 atgtcagatc tagaaaagca gcatttgaag gaggaaataa agaagctgaa aaaagaactg 2820 gaaaattttg atccttcatt ttttgaagaa attgaagatc ttaagtataa ttacaaggaa 2880 gaagtgaaga agaatattct cttagaagag aaggtaaaaa aactttcaga acaattggga 2940 gttgaattaa ctagccctgt tgctgcttct gaagagtttg aagatgaaga agaaagtcct 3000 gttaatttcc ccatttac 3018 <210> 60 <211> 4908 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 60 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360 ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420 ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480 ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540 cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600 ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780 atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080 agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140 cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200 ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260 cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320 cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380 tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440 gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500 ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560 tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620 gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680 actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740 gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800 aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860 cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920 ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980 acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040 tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100 agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160 acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220 agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280 aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340 caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400 ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460 tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520 tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580 acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640 tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700 agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760 gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820 tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880 ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940 gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000 accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060 ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120 tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180 tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240 actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300 aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360 cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420 ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480 cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540 acaatggagc tgggaaaacc accaccttgt ccatcctgac gggtctgttg ccaccaacct 3600 ctgggactgt gctcgttggg ggaagggaca ttgaaaccag cctggatgca gtccggcaga 3660 gccttggcat gtgtccacag cacaacatcc tgttccacca cctcacggtg gctgagcaca 3720 tgctgttcta tgcccagctg aaaggaaagt cccaggagga ggcccagctg gagatggaag 3780 ccatgttgga ggacacaggc ctccaccaca agcggaatga agaggctcag gacctatcag 3840 gtggcatgca gagaaagctg tcggttgcca ttgcctttgt gggagatgcc aaggtggtga 3900 ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc tgggatctgc 3960 tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg gacgaggccg 4020 acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc tcaggcaccc 4080 cactcttcct gaagaactgc ctgagctacg agaccgagat cctgaccgtg gagtacggcc 4140 tgctgcccat cggcaagatc gtggagaagc ggatcgagtg caccgtgtac agcgtggaca 4200 acaacggcaa catctacacc cagcccgtgg cccagtggca cgaccggggc gagcaggagg 4260 tgttcgagta ctgcctggag gacggcagcc tgatccgggc caccaaggac cacaagttca 4320 tgaccgtgga cggccagatg ctgcccatcg acgagatctt cgagcgggag ctggacctga 4380 tgcgggtgga caacctgccc aacgactaca aagaccatga cggtgattat aaagatcatg 4440 acatcgacta caaggatgac gatgacaagt gagcggccgc ttcgagcaga catgataaga 4500 tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 4560 gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 4620 aacaacaatt gcattcattt tatgtttcag gttcaggggg agatgtggga ggttttttaa 4680 agcaagtaaa acctctacaa atgtggtaaa atcgataagg atcttcctag agcatggcta 4740 cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4800 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4860 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4908 <210> 61 <211> 4634 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 61 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360 ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420 ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480 ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540 cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600 ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgca tgatcaagat 660 cgccacccgg aagtacctgg gcaagcagaa cgtgtacgac atcggcgtgg agcgggacca 720 caacttcgcc ctgaagaacg gcttcatcgc cagcaattgc tttggcacag gcttgtactt 780 aaccttggtg cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggggacctg 840 cagctgctcg tctaagggtt tctccaccac gtgtccagcc cacgtcgatg acctaactcc 900 agaacaagtc ctggatgggg atgtaaatga gctgatggat gtagttctcc accatgttcc 960 agaggcaaag ctggtggagt gcattggtca agaacttatc ttccttcttc caaataagaa 1020 cttcaagcac agagcatatg ccagcctttt cagagagctg gaggagacgc tggctgacct 1080 tggtctcagc agttttggaa tttctgacac tcccctggaa gagatttttc tgaaggtcac 1140 ggaggattct gattcaggac ctctgtttgc gggtggcgct cagcagaaaa gagaaaacgt 1200 caacccccga cacccctgct tgggtcccag agagaaggct ggacagacac cccaggactc 1260 caatgtctgc tccccagggg cgccggctgc tcacccagag ggccagcctc ccccagagcc 1320 agagtgccca ggcccgcagc tcaacacggg gacacagctg gtcctccagc atgtgcaggc 1380 gctgctggtc aagagattcc aacacaccat ccgcagccac aaggacttcc tggcgcagat 1440 cgtgctcccg gctacctttg tgtttttggc tctgatgctt tctattgtta tccctccttt 1500 tggcgaatac cccgctttga cccttcaccc ctggatatat gggcagcagt acaccttctt 1560 cagcatggat gaaccaggca gtgagcagtt cacggtactt gcagacgtcc tcctgaataa 1620 gccaggcttt ggcaaccgct gcctgaagga agggtggctt ccggagtacc cctgtggcaa 1680 ctcaacaccc tggaagactc cttctgtgtc cccaaacatc acccagctgt tccagaagca 1740 gaaatggaca caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg agaagctcac 1800 catgctgcca gagtgccccg agggtgccgg gggcctcccg cccccccaga gaacacagcg 1860 cagcacggaa attctacaag acctgacgga caggaacatc tccgacttct tggtaaaaac 1920 gtatcctgct cttataagaa gcagcttaaa gagcaaattc tgggtcaatg aacagaggta 1980 tggaggaatt tccattggag gaaagctccc agtcgtcccc atcacggggg aagcacttgt 2040 tgggttttta agcgaccttg gccggatcat gaatgtgagc gggggcccta tcactagaga 2100 ggcctctaaa gaaatacctg atttccttaa acatctagaa actgaagaca acattaaggt 2160 gtggtttaat aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg cccacaacgc 2220 catcttacgg gccagcctgc ctaaggacag gagccccgag gagtatggaa tcaccgtcat 2280 tagccaaccc ctgaacctga ccaaggagca gctctcagag attacagtgc tgaccacttc 2340 agtggatgct gtggttgcca tctgcgtgat tttctccatg tccttcgtcc cagccagctt 2400 tgtcctttat ttgatccagg agcgggtgaa caaatccaag cacctccagt ttatcagtgg 2460 agtgagcccc accacctact gggtaaccaa cttcctctgg gacatcatga attattccgt 2520 gagtgctggg ctggtggtgg gcatcttcat cgggtttcag aagaaagcct acacttctcc 2580 agaaaacctt cctgcccttg tggcactgct cctgctgtat ggatgggcgg tcattcccat 2640 gatgtaccca gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg ctttatcttg 2700 tgctaatctg ttcatcggca tcaacagcag tgctattacc ttcatcttgg aattatttga 2760 gaataaccgg acgctgctca ggttcaacgc cgtgctgagg aagctgctca ttgtcttccc 2820 ccacttctgc ctgggccggg gcctcattga ccttgcactg agccaggctg tgacagatgt 2880 ctatgcccgg tttggtgagg agcactctgc aaatccgttc cactgggacc tgattgggaa 2940 gaacctgttt gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc tgctggtcca 3000 gcgccacttc ttcctctccc aatggattgc cgagcccact aaggagccca ttgttgatga 3060 agatgatgat gtggctgaag aaagacaaag aattattact ggtggaaata aaactgacat 3120 cttaaggcta catgaactaa ccaagattta tccaggcacc tccagcccag cagtggacag 3180 gctgtgtgtc ggagttcgcc ctggagagtg ctttggcctc ctgggagtga atggtgccgg 3240 caaaacaacc acattcaaga tgctcactgg ggacaccaca gtgacctcag gggatgccac 3300 cgtagcaggc aagagtattt taaccaatat ttctgaagtc catcaaaata tgggctactg 3360 tcctcagttt gatgcaatcg atgagctgct cacaggacga gaacatcttt acctttatgc 3420 ccggcttcga ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga gtattaagag 3480 cctgggcctg actgtctacg ccgactgcct ggctggcacg tacagtgggg gcaacaagcg 3540 gaaactctcc acagccatcg cactcattgg ctgcccaccg ctggtgctgc tggatgagcc 3600 caccacaggg atggaccccc aggcacgccg catgctgtgg aacgtcatcg tgagcatcat 3660 cagagaaggg agggctgtgg tcctcacatc ccacagcatg gaagaatgtg aggcactgtg 3720 tacccggctg gccatcatgg taaagggcgc ctttcgatgt atgggcacca ttcagcatct 3780 caagtccaaa tttggagatg gctatatcgt cacaatgaag atcaaatccc cgaaggacga 3840 cctgcttcct gacctgaacc ctgtggagca gttcttccag gggaacttcc caggcagtgt 3900 gcagagggag aggcactaca acatgctcca gttccaggtc tcctcctcct ccctggcgag 3960 gatcttccag ctcctcctct cccacaagga cagcctgctc atcgaggagt actcagtcac 4020 acagaccaca ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg aaagtcatga 4080 cctccctctg caccctcgag ctgctggagc cagtcgacaa gcccaggacg actacaaaga 4140 ccatgacggt gattataaag atcatgacat cgactacaag gatgacgatg acaagtgagc 4200 ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa 4260 tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 4320 ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 4380 agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtaaaatcg 4440 ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4500 tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4560 gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4620 gagcgagcgc gcag 4634 <210> 62 <211> 4875 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 62 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660 ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720 tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780 atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840 gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900 caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960 atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020 tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080 atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140 actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200 tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260 tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320 gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380 gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440 gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500 acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560 tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620 tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680 ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740 agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800 tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860 actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920 ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980 tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040 ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100 ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160 aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220 cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280 acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340 tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400 ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460 ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520 agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580 tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640 tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700 tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760 tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820 tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880 tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940 cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000 gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060 aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120 gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180 ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240 tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300 aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360 actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420 taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480 agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540 tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600 aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660 tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720 aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780 ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840 cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 3900 actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 3960 tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 4020 agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcctg agctacgaga 4080 ccgagatcct gaccgtggag tacggcctgc tgcccatcgg caagatcgtg gagaagcgga 4140 tcgagtgcac cgtgtacagc gtggacaaca acggcaacat ctacacccag cccgtggccc 4200 agtggcacga ccggggcgag caggaggtgt tcgagtactg cctggaggac ggcagcctga 4260 tccgggccac caaggaccac aagttcatga ccgtggacgg ccagatgctg cccatcgacg 4320 agatcttcga gcgggagctg gacctgatgc gggtggacaa cctgcccaac gactacaaag 4380 accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat gacaagtgag 4440 cggccgcttc gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga 4500 atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4560 attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4620 cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 4680 gataaggatc ttcctagagc atggctacgt agataagtag catggcgggt taatcattaa 4740 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4800 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4860 cgagcgagcg cgcag 4875 <210> 63 <211> 4602 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 63 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg atcaagatcg ccacccggaa gtacctgggc aagcagaacg 660 tgtacgacat cggcgtggag cgggaccaca acttcgccct gaagaacggc ttcatcgcca 720 gcaattgctt tggcacaggc ttgtacttaa ccttggtgcg caagatgaaa aacatccaga 780 gccaaaggaa aggcagtgag gggacctgca gctgctcgtc taagggtttc tccaccacgt 840 gtccagccca cgtcgatgac ctaactccag aacaagtcct ggatggggat gtaaatgagc 900 tgatggatgt agttctccac catgttccag aggcaaagct ggtggagtgc attggtcaag 960 aacttatctt ccttcttcca aataagaact tcaagcacag agcatatgcc agccttttca 1020 gagagctgga ggagacgctg gctgaccttg gtctcagcag ttttggaatt tctgacactc 1080 ccctggaaga gatttttctg aaggtcacgg aggattctga ttcaggacct ctgtttgcgg 1140 gtggcgctca gcagaaaaga gaaaacgtca acccccgaca cccctgcttg ggtcccagag 1200 agaaggctgg acagacaccc caggactcca atgtctgctc cccaggggcg ccggctgctc 1260 acccagaggg ccagcctccc ccagagccag agtgcccagg cccgcagctc aacacgggga 1320 cacagctggt cctccagcat gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc 1380 gcagccacaa ggacttcctg gcgcagatcg tgctcccggc tacctttgtg tttttggctc 1440 tgatgctttc tattgttatc cctccttttg gcgaataccc cgctttgacc cttcacccct 1500 ggatatatgg gcagcagtac accttcttca gcatggatga accaggcagt gagcagttca 1560 cggtacttgc agacgtcctc ctgaataagc caggctttgg caaccgctgc ctgaaggaag 1620 ggtggcttcc ggagtacccc tgtggcaact caacaccctg gaagactcct tctgtgtccc 1680 caaacatcac ccagctgttc cagaagcaga aatggacaca ggtcaaccct tcaccatcct 1740 gcaggtgcag caccagggag aagctcacca tgctgccaga gtgccccgag ggtgccgggg 1800 gcctcccgcc cccccagaga acacagcgca gcacggaaat tctacaagac ctgacggaca 1860 ggaacatctc cgacttcttg gtaaaaacgt atcctgctct tataagaagc agcttaaaga 1920 gcaaattctg ggtcaatgaa cagaggtatg gaggaatttc cattggagga aagctcccag 1980 tcgtccccat cacgggggaa gcacttgttg ggtttttaag cgaccttggc cggatcatga 2040 atgtgagcgg gggccctatc actagagagg cctctaaaga aatacctgat ttccttaaac 2100 atctagaaac tgaagacaac attaaggtgt ggtttaataa caaaggctgg catgccctgg 2160 tcagctttct caatgtggcc cacaacgcca tcttacgggc cagcctgcct aaggacagga 2220 gccccgagga gtatggaatc accgtcatta gccaacccct gaacctgacc aaggagcagc 2280 tctcagagat tacagtgctg accacttcag tggatgctgt ggttgccatc tgcgtgattt 2340 tctccatgtc cttcgtccca gccagctttg tcctttattt gatccaggag cgggtgaaca 2400 aatccaagca cctccagttt atcagtggag tgagccccac cacctactgg gtaaccaact 2460 tcctctggga catcatgaat tattccgtga gtgctgggct ggtggtgggc atcttcatcg 2520 ggtttcagaa gaaagcctac acttctccag aaaaccttcc tgcccttgtg gcactgctcc 2580 tgctgtatgg atgggcggtc attcccatga tgtacccagc atccttcctg tttgatgtcc 2640 ccagcacagc ctatgtggct ttatcttgtg ctaatctgtt catcggcatc aacagcagtg 2700 ctattacctt catcttggaa ttatttgaga ataaccggac gctgctcagg ttcaacgccg 2760 tgctgaggaa gctgctcatt gtcttccccc acttctgcct gggccggggc ctcattgacc 2820 ttgcactgag ccaggctgtg acagatgtct atgcccggtt tggtgaggag cactctgcaa 2880 atccgttcca ctgggacctg attgggaaga acctgtttgc catggtggtg gaaggggtgg 2940 tgtacttcct cctgaccctg ctggtccagc gccacttctt cctctcccaa tggattgccg 3000 agcccactaa ggagcccatt gttgatgaag atgatgatgt ggctgaagaa agacaaagaa 3060 ttattactgg tggaaataaa actgacatct taaggctaca tgaactaacc aagatttatc 3120 caggcacctc cagcccagca gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct 3180 ttggcctcct gggagtgaat ggtgccggca aaacaaccac attcaagatg ctcactgggg 3240 acaccacagt gacctcaggg gatgccaccg tagcaggcaa gagtatttta accaatattt 3300 ctgaagtcca tcaaaatatg ggctactgtc ctcagtttga tgcaatcgat gagctgctca 3360 caggacgaga acatctttac ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg 3420 aaaaggttgc aaactggagt attaagagcc tgggcctgac tgtctacgcc gactgcctgg 3480 ctggcacgta cagtgggggc aacaagcgga aactctccac agccatcgca ctcattggct 3540 gcccaccgct ggtgctgctg gatgagccca ccacagggat ggacccccag gcacgccgca 3600 tgctgtggaa cgtcatcgtg agcatcatca gagaagggag ggctgtggtc ctcacatccc 3660 acagcatgga agaatgtgag gcactgtgta cccggctggc catcatggta aagggcgcct 3720 ttcgatgtat gggcaccatt cagcatctca agtccaaatt tggagatggc tatatcgtca 3780 caatgaagat caaatccccg aaggacgacc tgcttcctga cctgaaccct gtggagcagt 3840 tcttccaggg gaacttccca ggcagtgtgc agagggagag gcactacaac atgctccagt 3900 tccaggtctc ctcctcctcc ctggcgagga tcttccagct cctcctctcc cacaaggaca 3960 gcctgctcat cgaggagtac tcagtcacac agaccacact ggaccaggtg tttgtaaatt 4020 ttgctaaaca gcagactgaa agtcatgacc tccctctgca ccctcgagct gctggagcca 4080 gtcgacaagc ccaggacgac tacaaagacc atgacggtga ttataaagat catgacatcg 4140 actacaagga tgacgatgac aagtgagcgg ccgcttcgag cagacatgat aagatacatt 4200 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4260 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4320 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 4380 taaaacctct acaaatgtgg taaaatcgat aaggatcttc ctagagcatg gctacgtaga 4440 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 4500 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 4560 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 4602 <210> 64 <211> 4955 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 64 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gctagcctag tgggccccag aagcctggtg gttgtttgtc cttctcaggg 180 gaaaagtgag gcggcccctt ggaggaaggg gccgggcaga atgatctaat cggattccaa 240 gcagctcagg ggattgtctt tttctagcac cttcttgcca ctcctaagcg tcctccgtga 300 ccccggctgg gatttagcct ggtgctgtgt cagccccggg ctcccagggg cttcccagtg 360 gtccccagga accctcgaca gggccagggc gtctctctcg tccagcaagg gcagggacgg 420 gccacaggca agggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 480 gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 540 atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 600 atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 660 cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 720 tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 780 catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 840 ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 900 aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 960 gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1020 tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1080 catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1140 ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1200 cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1260 gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1320 gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1380 aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1440 ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1500 cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 1560 gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 1620 gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 1680 tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 1740 agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 1800 taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 1860 tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 1920 catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 1980 caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2040 gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2100 ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2160 ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2220 cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2280 catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2340 cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2400 ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2460 catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 2520 tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 2580 cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 2640 cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 2700 cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 2760 cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 2820 tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 2880 agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 2940 attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3000 cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3060 tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3120 cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3180 acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3240 tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3300 ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3360 gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 3420 cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 3480 cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 3540 gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 3600 caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 3660 cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 3720 cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 3780 catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 3840 tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gcctgagcta 3900 cgagaccgag atcctgaccg tggagtacgg cctgctgccc atcggcaaga tcgtggagaa 3960 gcggatcgag tgcaccgtgt acagcgtgga caacaacggc aacatctaca cccagcccgt 4020 ggcccagtgg cacgaccggg gcgagcagga ggtgttcgag tactgcctgg aggacggcag 4080 cctgatccgg gccaccaagg accacaagtt catgaccgtg gacggccaga tgctgcccat 4140 cgacgagatc ttcgagcggg agctggacct gatgcgggtg gacaacctgc ccaacgacta 4200 caaagaccat gacggtgatt ataaagatca tgacatcgac tacaaggatg acgatgacaa 4260 gatcagcctg atcgccgccc tggccgtgga ctacgtgatc ggcatggaga acgccatgcc 4320 ctggaacctg cccgccgacc tggcctggtt caagaggaac accctgaaca agcccgtgat 4380 catgggcagg cacacctggg agagcatcgg caggcccctg cccggcagga agaacatcat 4440 cctgagcagc cagcccagca ccgacgacag ggtgacctgg gtgaagagcg tggacgaggc 4500 catcgccgcc tgcggcgacg tgcccgagat catggtgatc ggcggcggca gggtgatcga 4560 gcagttcctg ccctgattcg agcagacatg ataagataca ttgatgagtt tggacaaacc 4620 acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 4680 tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 4740 tttcaggttc agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt 4800 ggtaaaatcg ataaggatcc aattgaggaa cccctagtga tggagttggc cactccctct 4860 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4920 gcccgggcgg cctcagtgag cgagcgagcg cgcag 4955 <210> 65 <211> 4929 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 65 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660 ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720 tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780 atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840 gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900 caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960 atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020 tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080 atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140 actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200 tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260 tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320 gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380 gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440 gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500 acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560 tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620 tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680 ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740 agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800 tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860 actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920 ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980 tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040 ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100 ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160 aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220 cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280 acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340 tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400 ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460 ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520 agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580 tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640 tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700 tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760 tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820 tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880 tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940 cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000 gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060 aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120 gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180 ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240 tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300 aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360 actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420 taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480 agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540 tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600 aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660 tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720 aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780 ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840 cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 3900 actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 3960 tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 4020 agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct 4080 tgtacttaac cttggtgcgc aagatgaaaa acatccagtg cctgagctac gagaccgaga 4140 tcctgaccgt ggagtacggc ctgctgccca tcggcaagat cgtggagaag cggatcgagt 4200 gcaccgtgta cagcgtggac aacaacggca acatctacac ccagcccgtg gcccagtggc 4260 acgaccgggg cgagcaggag gtgttcgagt actgcctgga ggacggcagc ctgatccggg 4320 ccaccaagga ccacaagttc atgaccgtgg acggccagat gctgcccatc gacgagatct 4380 tcgagcggga gctggacctg atgcgggtgg acaacctgcc caacgactac aaagaccatg 4440 acggtgatta taaagatcat gacatcgact acaaggatga cgatgacaag tgagcggccg 4500 cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4560 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4620 agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4680 gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4740 gatcttccta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacaa 4800 ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4860 cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4920 agcgcgcag 4929 <210> 66 <211> 4548 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 66 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg atcaagatcg ccacccggaa gtacctgggc aagcagaacg 660 tgtacgacat cggcgtggag cgggaccaca acttcgccct gaagaacggc ttcatcgcca 720 gcaatagcca aaggaaaggc agtgagggga cctgcagctg ctcgtctaag ggtttctcca 780 ccacgtgtcc agcccacgtc gatgacctaa ctccagaaca agtcctggat ggggatgtaa 840 atgagctgat ggatgtagtt ctccaccatg ttccagaggc aaagctggtg gagtgcattg 900 gtcaagaact tatcttcctt cttccaaata agaacttcaa gcacagagca tatgccagcc 960 ttttcagaga gctggaggag acgctggctg accttggtct cagcagtttt ggaatttctg 1020 acactcccct ggaagagatt tttctgaagg tcacggagga ttctgattca ggacctctgt 1080 ttgcgggtgg cgctcagcag aaaagagaaa acgtcaaccc ccgacacccc tgcttgggtc 1140 ccagagagaa ggctggacag acaccccagg actccaatgt ctgctcccca ggggcgccgg 1200 ctgctcaccc agagggccag cctcccccag agccagagtg cccaggcccg cagctcaaca 1260 cggggacaca gctggtcctc cagcatgtgc aggcgctgct ggtcaagaga ttccaacaca 1320 ccatccgcag ccacaaggac ttcctggcgc agatcgtgct cccggctacc tttgtgtttt 1380 tggctctgat gctttctatt gttatccctc cttttggcga ataccccgct ttgacccttc 1440 acccctggat atatgggcag cagtacacct tcttcagcat ggatgaacca ggcagtgagc 1500 agttcacggt acttgcagac gtcctcctga ataagccagg ctttggcaac cgctgcctga 1560 aggaagggtg gcttccggag tacccctgtg gcaactcaac accctggaag actccttctg 1620 tgtccccaaa catcacccag ctgttccaga agcagaaatg gacacaggtc aacccttcac 1680 catcctgcag gtgcagcacc agggagaagc tcaccatgct gccagagtgc cccgagggtg 1740 ccgggggcct cccgcccccc cagagaacac agcgcagcac ggaaattcta caagacctga 1800 cggacaggaa catctccgac ttcttggtaa aaacgtatcc tgctcttata agaagcagct 1860 taaagagcaa attctgggtc aatgaacaga ggtatggagg aatttccatt ggaggaaagc 1920 tcccagtcgt ccccatcacg ggggaagcac ttgttgggtt tttaagcgac cttggccgga 1980 tcatgaatgt gagcgggggc cctatcacta gagaggcctc taaagaaata cctgatttcc 2040 ttaaacatct agaaactgaa gacaacatta aggtgtggtt taataacaaa ggctggcatg 2100 ccctggtcag ctttctcaat gtggcccaca acgccatctt acgggccagc ctgcctaagg 2160 acaggagccc cgaggagtat ggaatcaccg tcattagcca acccctgaac ctgaccaagg 2220 agcagctctc agagattaca gtgctgacca cttcagtgga tgctgtggtt gccatctgcg 2280 tgattttctc catgtccttc gtcccagcca gctttgtcct ttatttgatc caggagcggg 2340 tgaacaaatc caagcacctc cagtttatca gtggagtgag ccccaccacc tactgggtaa 2400 ccaacttcct ctgggacatc atgaattatt ccgtgagtgc tgggctggtg gtgggcatct 2460 tcatcgggtt tcagaagaaa gcctacactt ctccagaaaa ccttcctgcc cttgtggcac 2520 tgctcctgct gtatggatgg gcggtcattc ccatgatgta cccagcatcc ttcctgtttg 2580 atgtccccag cacagcctat gtggctttat cttgtgctaa tctgttcatc ggcatcaaca 2640 gcagtgctat taccttcatc ttggaattat ttgagaataa ccggacgctg ctcaggttca 2700 acgccgtgct gaggaagctg ctcattgtct tcccccactt ctgcctgggc cggggcctca 2760 ttgaccttgc actgagccag gctgtgacag atgtctatgc ccggtttggt gaggagcact 2820 ctgcaaatcc gttccactgg gacctgattg ggaagaacct gtttgccatg gtggtggaag 2880 gggtggtgta cttcctcctg accctgctgg tccagcgcca cttcttcctc tcccaatgga 2940 ttgccgagcc cactaaggag cccattgttg atgaagatga tgatgtggct gaagaaagac 3000 aaagaattat tactggtgga aataaaactg acatcttaag gctacatgaa ctaaccaaga 3060 tttatccagg cacctccagc ccagcagtgg acaggctgtg tgtcggagtt cgccctggag 3120 agtgctttgg cctcctggga gtgaatggtg ccggcaaaac aaccacattc aagatgctca 3180 ctggggacac cacagtgacc tcaggggatg ccaccgtagc aggcaagagt attttaacca 3240 atatttctga agtccatcaa aatatgggct actgtcctca gtttgatgca atcgatgagc 3300 tgctcacagg acgagaacat ctttaccttt atgcccggct tcgaggtgta ccagcagaag 3360 aaatcgaaaa ggttgcaaac tggagtatta agagcctggg cctgactgtc tacgccgact 3420 gcctggctgg cacgtacagt gggggcaaca agcggaaact ctccacagcc atcgcactca 3480 ttggctgccc accgctggtg ctgctggatg agcccaccac agggatggac ccccaggcac 3540 gccgcatgct gtggaacgtc atcgtgagca tcatcagaga agggagggct gtggtcctca 3600 catcccacag catggaagaa tgtgaggcac tgtgtacccg gctggccatc atggtaaagg 3660 gcgcctttcg atgtatgggc accattcagc atctcaagtc caaatttgga gatggctata 3720 tcgtcacaat gaagatcaaa tccccgaagg acgacctgct tcctgacctg aaccctgtgg 3780 agcagttctt ccaggggaac ttcccaggca gtgtgcagag ggagaggcac tacaacatgc 3840 tccagttcca ggtctcctcc tcctccctgg cgaggatctt ccagctcctc ctctcccaca 3900 aggacagcct gctcatcgag gagtactcag tcacacagac cacactggac caggtgtttg 3960 taaattttgc taaacagcag actgaaagtc atgacctccc tctgcaccct cgagctgctg 4020 gagccagtcg acaagcccag gacgactaca aagaccatga cggtgattat aaagatcatg 4080 acatcgacta caaggatgac gatgacaagt gagcggccgc ttcgagcaga catgataaga 4140 tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 4200 gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 4260 aacaacaatt gcattcattt tatgtttcag gttcaggggg agatgtggga ggttttttaa 4320 agcaagtaaa acctctacaa atgtggtaaa atcgataagg atcttcctag agcatggcta 4380 cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4440 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4500 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4548 <210> 67 <211> 4695 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 67 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660 ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720 tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780 atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840 gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900 caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960 atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020 tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080 atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140 actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200 tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260 tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320 gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380 gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440 gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500 acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560 tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620 tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680 ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740 agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800 tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860 actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920 ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980 tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040 ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100 ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160 aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220 cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280 acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340 tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400 ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460 ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520 agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580 tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640 tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700 tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760 tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820 tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880 tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940 cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000 gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060 aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120 gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180 ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240 tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300 aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360 actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420 taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480 agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540 tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600 aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660 tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720 aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780 ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840 cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctgcctg agctacgaca 3900 ccgagatcct gaccgtggag tacggcatcc tgcccatcgg caagatcgtg gagaagagga 3960 tcgagtgcac cgtgtacagc gtggacaaca acggcaacat ctacacccag cccgtggccc 4020 agtggcacga caggggcgag caggaggtgt tcgagtactg cctggaggac ggcagcctga 4080 tcagggccac caaggaccac aagttcatga ccgtggacgg ccagatgatg cccatcgacg 4140 agatcttcga gagggagctg gacctgatga gggtggacaa cctgcccaac gactacaaag 4200 accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat gacaagtgag 4260 cggccgcttc gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga 4320 atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4380 attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4440 cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 4500 gataaggatc ttcctagagc atggctacgt agataagtag catggcgggt taatcattaa 4560 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4620 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4680 cgagcgagcg cgcag 4695 <210> 68 <211> 4782 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 68 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240 atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300 gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360 attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540 atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600 ccaccatggc ggccgccatg gtgaaggtga tcggcaggag gagcctgggc gtgcagagga 660 tcttcgacat cggcctgccc cagtaccaca acttcctgct ggccaacggc gccatcgccg 720 ccaactctgg ggtggaccct tactcgagac gctcaatctg ggatctgctc ctgaagtatc 780 gctcaggcag aaccatcatc atgtccactc accacatgga cgaggccgac ctccttgggg 840 accgcattgc catcattgcc cagggaaggc tctactgctc aggcacccca ctcttcctga 900 agaactgctt tggcacaggc ttgtacttaa ccttggtgcg caagatgaaa aacatccaga 960 gccaaaggaa aggcagtgag gggacctgca gctgctcgtc taagggtttc tccaccacgt 1020 gtccagccca cgtcgatgac ctaactccag aacaagtcct ggatggggat gtaaatgagc 1080 tgatggatgt agttctccac catgttccag aggcaaagct ggtggagtgc attggtcaag 1140 aacttatctt ccttcttcca aataagaact tcaagcacag agcatatgcc agccttttca 1200 gagagctgga ggagacgctg gctgaccttg gtctcagcag ttttggaatt tctgacactc 1260 ccctggaaga gatttttctg aaggtcacgg aggattctga ttcaggacct ctgtttgcgg 1320 gtggcgctca gcagaaaaga gaaaacgtca acccccgaca cccctgcttg ggtcccagag 1380 agaaggctgg acagacaccc caggactcca atgtctgctc cccaggggcg ccggctgctc 1440 acccagaggg ccagcctccc ccagagccag agtgcccagg cccgcagctc aacacgggga 1500 cacagctggt cctccagcat gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc 1560 gcagccacaa ggacttcctg gcgcagatcg tgctcccggc tacctttgtg tttttggctc 1620 tgatgctttc tattgttatc cctccttttg gcgaataccc cgctttgacc cttcacccct 1680 ggatatatgg gcagcagtac accttcttca gcatggatga accaggcagt gagcagttca 1740 cggtacttgc agacgtcctc ctgaataagc caggctttgg caaccgctgc ctgaaggaag 1800 ggtggcttcc ggagtacccc tgtggcaact caacaccctg gaagactcct tctgtgtccc 1860 caaacatcac ccagctgttc cagaagcaga aatggacaca ggtcaaccct tcaccatcct 1920 gcaggtgcag caccagggag aagctcacca tgctgccaga gtgccccgag ggtgccgggg 1980 gcctcccgcc cccccagaga acacagcgca gcacggaaat tctacaagac ctgacggaca 2040 ggaacatctc cgacttcttg gtaaaaacgt atcctgctct tataagaagc agcttaaaga 2100 gcaaattctg ggtcaatgaa cagaggtatg gaggaatttc cattggagga aagctcccag 2160 tcgtccccat cacgggggaa gcacttgttg ggtttttaag cgaccttggc cggatcatga 2220 atgtgagcgg gggccctatc actagagagg cctctaaaga aatacctgat ttccttaaac 2280 atctagaaac tgaagacaac attaaggtgt ggtttaataa caaaggctgg catgccctgg 2340 tcagctttct caatgtggcc cacaacgcca tcttacgggc cagcctgcct aaggacagga 2400 gccccgagga gtatggaatc accgtcatta gccaacccct gaacctgacc aaggagcagc 2460 tctcagagat tacagtgctg accacttcag tggatgctgt ggttgccatc tgcgtgattt 2520 tctccatgtc cttcgtccca gccagctttg tcctttattt gatccaggag cgggtgaaca 2580 aatccaagca cctccagttt atcagtggag tgagccccac cacctactgg gtaaccaact 2640 tcctctggga catcatgaat tattccgtga gtgctgggct ggtggtgggc atcttcatcg 2700 ggtttcagaa gaaagcctac acttctccag aaaaccttcc tgcccttgtg gcactgctcc 2760 tgctgtatgg atgggcggtc attcccatga tgtacccagc atccttcctg tttgatgtcc 2820 ccagcacagc ctatgtggct ttatcttgtg ctaatctgtt catcggcatc aacagcagtg 2880 ctattacctt catcttggaa ttatttgaga ataaccggac gctgctcagg ttcaacgccg 2940 tgctgaggaa gctgctcatt gtcttccccc acttctgcct gggccggggc ctcattgacc 3000 ttgcactgag ccaggctgtg acagatgtct atgcccggtt tggtgaggag cactctgcaa 3060 atccgttcca ctgggacctg attgggaaga acctgtttgc catggtggtg gaaggggtgg 3120 tgtacttcct cctgaccctg ctggtccagc gccacttctt cctctcccaa tggattgccg 3180 agcccactaa ggagcccatt gttgatgaag atgatgatgt ggctgaagaa agacaaagaa 3240 ttattactgg tggaaataaa actgacatct taaggctaca tgaactaacc aagatttatc 3300 caggcacctc cagcccagca gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct 3360 ttggcctcct gggagtgaat ggtgccggca aaacaaccac attcaagatg ctcactgggg 3420 acaccacagt gacctcaggg gatgccaccg tagcaggcaa gagtatttta accaatattt 3480 ctgaagtcca tcaaaatatg ggctactgtc ctcagtttga tgcaatcgat gagctgctca 3540 caggacgaga acatctttac ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg 3600 aaaaggttgc aaactggagt attaagagcc tgggcctgac tgtctacgcc gactgcctgg 3660 ctggcacgta cagtgggggc aacaagcgga aactctccac agccatcgca ctcattggct 3720 gcccaccgct ggtgctgctg gatgagccca ccacagggat ggacccccag gcacgccgca 3780 tgctgtggaa cgtcatcgtg agcatcatca gagaagggag ggctgtggtc ctcacatccc 3840 acagcatgga agaatgtgag gcactgtgta cccggctggc catcatggta aagggcgcct 3900 ttcgatgtat gggcaccatt cagcatctca agtccaaatt tggagatggc tatatcgtca 3960 caatgaagat caaatccccg aaggacgacc tgcttcctga cctgaaccct gtggagcagt 4020 tcttccaggg gaacttccca ggcagtgtgc agagggagag gcactacaac atgctccagt 4080 tccaggtctc ctcctcctcc ctggcgagga tcttccagct cctcctctcc cacaaggaca 4140 gcctgctcat cgaggagtac tcagtcacac agaccacact ggaccaggtg tttgtaaatt 4200 ttgctaaaca gcagactgaa agtcatgacc tccctctgca ccctcgagct gctggagcca 4260 gtcgacaagc ccaggacgac tacaaagacc atgacggtga ttataaagat catgacatcg 4320 actacaagga tgacgatgac aagtgagcgg ccgcttcgag cagacatgat aagatacatt 4380 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4440 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4500 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 4560 taaaacctct acaaatgtgg taaaatcgat aaggatcttc ctagagcatg gctacgtaga 4620 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 4680 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 4740 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 4782 <210> 69 <211> 1983 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 69 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct ctagtagcac agtgtctggc atgtagcagg aactaaaata atggcagtga 180 ttaatgttat gatatgcaga cacaacacag caagataaga tgcaatgtac cttctgggtc 240 aaaccaccct ggccactcct ccccgatacc cagggttgat gtgcttgaat tagacaggat 300 taaaggctta ctggagctgg aagccttgcc ccaactcagg agtttagccc cagaccttct 360 gtccaccagc gcggccgacc ggccaagggc gaattctgca gatatccatc acactggcat 420 ggatagcact gagaacgtca tcaagccctt catgcgcttc aaggtgcaca tggagggctc 480 cgtgaacggc cacgagttcg agatcgaggg cgagggcgag ggcaagccct acgagggcac 540 ccagaccgcc aagctgcagg tgaccaaggg cggccccctg cccttcgcct gggacatcct 600 gtccccccag ttccagtacg gctccaaggt gtacgtgaag caccccgccg acatccccga 660 ctacaagaag ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga 720 cggcggcgtg gtgaccgtga cccaggactc ctccctgcag gacggcacct tcatctacca 780 cgtgaagttc atcggcgtga acttcccctc cgacggcccc gtaatgcaga agaagactct 840 gggctgggag ccctccaccg agcgcctgta cccccgcgac ggcgtgctga agggcgagat 900 ccacaaggcg ctgaagctga agggcggcgg ccactacctg gtggagttca agtcaatcta 960 catggccaag aagcccgtga agctgcccgg ctactactac gtggactcca agctggacat 1020 cacctcccac aacgaggact acaccgtggt ggagcagtac gagcgcgccg aggcccgcca 1080 ccacctgttc cagtagaatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1140 tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1200 tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc 1260 tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc 1320 tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt 1380 cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg 1440 gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga agctgacgtc 1500 ctttccatgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta 1560 cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg 1620 gcctcttccg cgtcttcggc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 1680 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 1740 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 1800 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggaaggaacc 1860 cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 1920 accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 1980 cag 1983 <210> 70 <211> 251 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 70 tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60 gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120 tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180 cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240 ggacagtgaa t 251 <210> 71 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 71 atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt 57 <210> 72 <211> 3876 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 72 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760 ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820 gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880 ggaaaaaatg tatcgtcaac agagagtggt aggttattta aagggaaaag agctcatgga 2940 cctgctttgt tgactaaaga taatgcctta ttcaaagtta gcatctcttt gttaaagaca 3000 aacaaaactt ccaataattc agcaactaat agaaagactc acattgatgg cccatcatta 3060 ttaattgaga atagtccatc agtctggcaa aatatattag aaagtgacac tgagtttaaa 3120 aaagtgacac ctttgattca tgacagaatg cttatggaca aaaatgctac agctttgagg 3180 ctaaatcata tgtcaaataa aactacttca tcaaaaaaca tggaaatggt ccaacagaaa 3240 aaagagggcc ccattccacc agatgcacaa aatccagata tgtcgttctt taagatgcta 3300 ttcttgccag aatcagcaag gtggatacaa aggactcatg gaaagaactc tctgaactct 3360 gggcaaggcc ccagtccaaa gcaattagta tccttaggac cagaaaaatc tgtggaaggt 3420 cagaatttct tgtctgagaa aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac 3480 gtaggactca aagagatggt ttttccaagc agcagaaacc tatttcttac taacttggat 3540 aatttacatg aaaataatac acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag 3600 aaggaaacat taatccaaga gaatgtagtt ttgcctcaga tacatacagt gactggcact 3660 aagaatttca tgaagaacct tttcttactg agcactaggc aaaatgtaga aggttcatat 3720 gacggggcat atgctccagt acttcaagat tttaggtcat taaatgattc aacaaataga 3780 acaaagaaac acacagctca tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg 3840 ggaaatcaaa ccaagcaaat tgtagagaaa tatgca 3876 <210> 73 <211> 3120 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 73 tgcaccacaa ggatatctcc taatacaagc cagcagaatt ttgtcacgca acgtagtaag 60 agagctttga aacaattcag actcccacta gaagaaacag aacttgaaaa aaggataatt 120 gtggatgaca cctcaaccca gtggtccaaa aacatgaaac atttgacccc gagcaccctc 180 acacagatag actacaatga gaaggagaaa ggggccatta ctcagtctcc cttatcagat 240 tgccttacga ggagtcatag catccctcaa gcaaatagat ctccattacc cattgcaaag 300 gtatcatcat ttccatctat tagacctata tatctgacca gggtcctatt ccaagacaac 360 tcttctcatc ttccagcagc atcttataga aagaaagatt ctggggtcca agaaagcagt 420 catttcttac aaggagccaa aaaaaataac ctttctttag ccattctaac cttggagatg 480 actggtgatc aaagagaggt tggctccctg gggacaagtg ccacaaattc agtcacatac 540 aagaaagttg agaacactgt tctcccgaaa ccagacttgc ccaaaacatc tggcaaagtt 600 gaattgcttc caaaagttca catttatcag aaggacctat tccctacgga aactagcaat 660 gggtctcctg gccatctgga tctcgtggaa gggagccttc ttcagggaac agagggagcg 720 attaagtgga atgaagcaaa cagacctgga aaagttccct ttctgagagt agcaacagaa 780 agctctgcaa agactccctc caagctattg gatcctcttg cttgggataa ccactatggt 840 actcagatac caaaagaaga gtggaaatcc caagagaagt caccagaaaa aacagctttt 900 aagaaaaagg ataccatttt gtccctgaac gcttgtgaaa gcaatcatgc aatagcagca 960 ataaatgagg gacaaaataa gcccgaaata gaagtcacct gggcaaagca aggtaggact 1020 gaaaggctgt gctctcaaaa cccaccagtc ttgaaacgcc atcaacggga aataactcgt 1080 actactcttc agtcagatca agaggaaatt gactatgatg ataccatatc agttgaaatg 1140 aagaaggaag attttgacat ttatgatgag gatgaaaatc agagcccccg cagctttcaa 1200 aagaaaacac gacactattt tattgctgca gtggagaggc tctgggatta tgggatgagt 1260 agctccccac atgttctaag aaacagggct cagagtggca gtgtccctca gttcaagaaa 1320 gttgttttcc aggaatttac tgatggctcc tttactcagc ccttataccg tggagaacta 1380 aatgaacatt tgggactcct ggggccatat ataagagcag aagttgaaga taatatcatg 1440 gtaactttca gaaatcaggc ctctcgtccc tattccttct attctagcct tatttcttat 1500 gaggaagatc agaggcaagg agcagaacct agaaaaaact ttgtcaagcc taatgaaacc 1560 aaaacttact tttggaaagt gcaacatcat atggcaccca ctaaagatga gtttgactgc 1620 aaagcctggg cttatttctc tgatgttgac ctggaaaaag atgtgcactc aggcctgatt 1680 ggaccccttc tggtctgcca cactaacaca ctgaaccctg ctcatgggag acaagtgaca 1740 gtacaggaat ttgctctgtt tttcaccatc tttgatgaga ccaaaagctg gtacttcact 1800 gaaaatatgg aaagaaactg cagggctccc tgcaatatcc agatggaaga tcccactttt 1860 aaagagaatt atcgcttcca tgcaatcaat ggctacataa tggatacact acctggctta 1920 gtaatggctc aggatcaaag gattcgatgg tatctgctca gcatgggcag caatgaaaac 1980 atccattcta ttcatttcag tggacatgtg ttcactgtac gaaaaaaaga ggagtataaa 2040 atggcactgt acaatctcta tccaggtgtt tttgagacag tggaaatgtt accatccaaa 2100 gctggaattt ggcgggtgga atgccttatt ggcgagcatc tacatgctgg gatgagcaca 2160 ctttttctgg tgtacagcaa taagtgtcag actcccctgg gaatggcttc tggacacatt 2220 agagattttc agattacagc ttcaggacaa tatggacagt gggccccaaa gctggccaga 2280 cttcattatt ccggatcaat caatgcctgg agcaccaagg agcccttttc ttggatcaag 2340 gtggatctgt tggcaccaat gattattcac ggcatcaaga cccagggtgc ccgtcagaag 2400 ttctccagcc tctacatctc tcagtttatc atcatgtata gtcttgatgg gaagaagtgg 2460 cagacttatc gaggaaattc cactggaacc ttaatggtct tctttggcaa tgtggattca 2520 tctgggataa aacacaatat ttttaaccct ccaattattg ctcgatacat ccgtttgcac 2580 ccaactcatt atagcattcg cagcactctt cgcatggagt tgatgggctg tgatttaaat 2640 agttgcagca tgccattggg aatggagagt aaagcaatat cagatgcaca gattactgct 2700 tcatcctact ttaccaatat gtttgccacc tggtctcctt caaaagctcg acttcacctc 2760 caagggagga gtaatgcctg gagacctcag gtgaataatc caaaagagtg gctgcaagtg 2820 gacttccaga agacaatgaa agtcacagga gtaactactc agggagtaaa atctctgctt 2880 accagcatgt atgtgaagga gttcctcatc tccagcagtc aagatggcca tcagtggact 2940 ctcttttttc agaatggcaa agtaaaggtt tttcagggaa atcaagactc cttcacacct 3000 gtggtgaact ctctagaccc accgttactg actcgctacc ttcgaattca cccccagagt 3060 tgggtgcacc agattgccct gaggatggag gttctgggct gcgaggcaca ggacctctac 3120 <210> 74 <211> 2892 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 74 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760 ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820 gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880 ggaaaaaatg ta 2892 <210> 75 <211> 4104 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 75 tcgtcaacag agagtggtag gttatttaaa gggaaaagag ctcatggacc tgctttgttg 60 actaaagata atgccttatt caaagttagc atctctttgt taaagacaaa caaaacttcc 120 aataattcag caactaatag aaagactcac attgatggcc catcattatt aattgagaat 180 agtccatcag tctggcaaaa tatattagaa agtgacactg agtttaaaaa agtgacacct 240 ttgattcatg acagaatgct tatggacaaa aatgctacag ctttgaggct aaatcatatg 300 tcaaataaaa ctacttcatc aaaaaacatg gaaatggtcc aacagaaaaa agagggcccc 360 attccaccag atgcacaaaa tccagatatg tcgttcttta agatgctatt cttgccagaa 420 tcagcaaggt ggatacaaag gactcatgga aagaactctc tgaactctgg gcaaggcccc 480 agtccaaagc aattagtatc cttaggacca gaaaaatctg tggaaggtca gaatttcttg 540 tctgagaaaa acaaagtggt agtaggaaag ggtgaattta caaaggacgt aggactcaaa 600 gagatggttt ttccaagcag cagaaaccta tttcttacta acttggataa tttacatgaa 660 aataatacac acaatcaaga aaaaaaaatt caggaagaaa tagaaaagaa ggaaacatta 720 atccaagaga atgtagtttt gcctcagata catacagtga ctggcactaa gaatttcatg 780 aagaaccttt tcttactgag cactaggcaa aatgtagaag gttcatatga cggggcatat 840 gctccagtac ttcaagattt taggtcatta aatgattcaa caaatagaac aaagaaacac 900 acagctcatt tctcaaaaaa aggggaggaa gaaaacttgg aaggcttggg aaatcaaacc 960 aagcaaattg tagagaaata tgcatgcacc acaaggatat ctcctaatac aagccagcag 1020 aattttgtca cgcaacgtag taagagagct ttgaaacaat tcagactccc actagaagaa 1080 acagaacttg aaaaaaggat aattgtggat gacacctcaa cccagtggtc caaaaacatg 1140 aaacatttga ccccgagcac cctcacacag atagactaca atgagaagga gaaaggggcc 1200 attactcagt ctcccttatc agattgcctt acgaggagtc atagcatccc tcaagcaaat 1260 agatctccat tacccattgc aaaggtatca tcatttccat ctattagacc tatatatctg 1320 accagggtcc tattccaaga caactcttct catcttccag cagcatctta tagaaagaaa 1380 gattctgggg tccaagaaag cagtcatttc ttacaaggag ccaaaaaaaa taacctttct 1440 ttagccattc taaccttgga gatgactggt gatcaaagag aggttggctc cctggggaca 1500 agtgccacaa attcagtcac atacaagaaa gttgagaaca ctgttctccc gaaaccagac 1560 ttgcccaaaa catctggcaa agttgaattg cttccaaaag ttcacattta tcagaaggac 1620 ctattcccta cggaaactag caatgggtct cctggccatc tggatctcgt ggaagggagc 1680 cttcttcagg gaacagaggg agcgattaag tggaatgaag caaacagacc tggaaaagtt 1740 ccctttctga gagtagcaac agaaagctct gcaaagactc cctccaagct attggatcct 1800 cttgcttggg ataaccacta tggtactcag ataccaaaag aagagtggaa atcccaagag 1860 aagtcaccag aaaaaacagc ttttaagaaa aaggatacca ttttgtccct gaacgcttgt 1920 gaaagcaatc atgcaatagc agcaataaat gagggacaaa ataagcccga aatagaagtc 1980 acctgggcaa agcaaggtag gactgaaagg ctgtgctctc aaaacccacc agtcttgaaa 2040 cgccatcaac gggaaataac tcgtactact cttcagtcag atcaagagga aattgactat 2100 gatgatacca tatcagttga aatgaagaag gaagattttg acatttatga tgaggatgaa 2160 aatcagagcc cccgcagctt tcaaaagaaa acacgacact attttattgc tgcagtggag 2220 aggctctggg attatgggat gagtagctcc ccacatgttc taagaaacag ggctcagagt 2280 ggcagtgtcc ctcagttcaa gaaagttgtt ttccaggaat ttactgatgg ctcctttact 2340 cagcccttat accgtggaga actaaatgaa catttgggac tcctggggcc atatataaga 2400 gcagaagttg aagataatat catggtaact ttcagaaatc aggcctctcg tccctattcc 2460 ttctattcta gccttatttc ttatgaggaa gatcagaggc aaggagcaga acctagaaaa 2520 aactttgtca agcctaatga aaccaaaact tacttttgga aagtgcaaca tcatatggca 2580 cccactaaag atgagtttga ctgcaaagcc tgggcttatt tctctgatgt tgacctggaa 2640 aaagatgtgc actcaggcct gattggaccc cttctggtct gccacactaa cacactgaac 2700 cctgctcatg ggagacaagt gacagtacag gaatttgctc tgtttttcac catctttgat 2760 gagaccaaaa gctggtactt cactgaaaat atggaaagaa actgcagggc tccctgcaat 2820 atccagatgg aagatcccac ttttaaagag aattatcgct tccatgcaat caatggctac 2880 ataatggata cactacctgg cttagtaatg gctcaggatc aaaggattcg atggtatctg 2940 ctcagcatgg gcagcaatga aaacatccat tctattcatt tcagtggaca tgtgttcact 3000 gtacgaaaaa aagaggagta taaaatggca ctgtacaatc tctatccagg tgtttttgag 3060 acagtggaaa tgttaccatc caaagctgga atttggcggg tggaatgcct tattggcgag 3120 catctacatg ctgggatgag cacacttttt ctggtgtaca gcaataagtg tcagactccc 3180 ctgggaatgg cttctggaca cattagagat tttcagatta cagcttcagg acaatatgga 3240 cagtgggccc caaagctggc cagacttcat tattccggat caatcaatgc ctggagcacc 3300 aaggagccct tttcttggat caaggtggat ctgttggcac caatgattat tcacggcatc 3360 aagacccagg gtgcccgtca gaagttctcc agcctctaca tctctcagtt tatcatcatg 3420 tatagtcttg atgggaagaa gtggcagact tatcgaggaa attccactgg aaccttaatg 3480 gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 3540 attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 3600 gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 3660 atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 3720 ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 3780 aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 3840 actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 3900 agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 3960 ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 4020 taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 4080 ggctgcgagg cacaggacct ctac 4104 <210> 76 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 76 Gly Val Gln Cys Phe Ser Arg 1 5 <210> 77 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 77 Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val 1 5 10 15 Gln Cys Phe Ser Arg Tyr 20 <210> 78 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 78 Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg 1 5 10 15 <210> 79 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 79 Thr Tyr Gly Val Gln Cys Phe Ser Arg 1 5 <210> 80 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 80 Tyr Gly Val Gln Cys Phe Ser Arg 1 5 <210> 81 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 81 Val Gln Cys Phe Ser Arg 1 5 <210> 82 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 82 Gln Cys Phe Ser Arg 1 5 <210> 83 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 83 Lys Asn Cys Phe Gly Thr 1 5 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 84 Lys Asn Cys Phe Gly Thr Gly Leu 1 5 <210> 85 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 85 Lys Asn Cys Phe Gly Thr Gly Leu Tyr 1 5 <210> 86 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 86 Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu 1 5 10 <210> 87 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 87 Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr 1 5 10 <210> 88 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 88 Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu 1 5 10 <210> 89 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 89 Leu Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys 1 5 10 <210> 90 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 90 Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys Phe 1 5 10 <210> 91 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 91 Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg 1 5 10 <210> 92 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 92 Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg Lys Met 1 5 10 15 <210> 93 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 93 Ile Ala Ile Ile Ala Gln Gly Arg Leu Tyr Cys Ser Gly Thr Pro Leu 1 5 10 15 Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr 20 25 <210> 94 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 94 Gln Gly Arg Leu Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys 1 5 10 15 Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg Lys Met Lys Asn Ile 20 25 30 Gln Ser Gln Arg 35 <210> 95 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> synthetic <400> 95 Gly Thr Pro Leu Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu 1 5 10 15 Thr Leu Val Arg Lys Met Lys Asn Ile Gln Ser Gln Arg Lys Gly Ser 20 25 30 Glu Gly Thr Cys Ser Cys Ser Ser 35 40

Claims (23)

  1. 세포에서 코딩 서열을 발현시키기 위한 벡터 시스템으로서, 상기 코딩 서열이 제1 부분(CDS1), 제2 부분(CDS2) 및 선택적으로 제3 부분(CDS3)으로 구성되고, 상기 벡터 시스템이,
    a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
    - N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
    b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
    - C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터를 포함하고:
    여기서, 제1 벡터 및 제2 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 스플라이싱에 의해 생성되고;
    또는
    상기 벡터 시스템이,
    a') - 상기 코딩 서열의 상기 제1 부분(CDS1),
    - 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
    b') - 상기 코딩 서열의 상기 제2 부분(CDS2),
    - 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열;
    - 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 3' 말단에 위치하는, 제3 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터; 및
    c') - 상기 코딩 서열의 상기 제3 부분(CDS3)
    - 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS3의 5' 말단에 위치하는, 제4 인테인 뉴클레오티드 서열을 포함하는, 제3 벡터를 포함하고;
    여기서, 제1 인테인 뉴클레오티드 서열이 제3 인테인 뉴클레오티드 서열과 상이하고, 제2 인테인 서열이 제4 인테인 뉴클레오티드 서열과 상이하며, 여기서 제1 벡터, 제2 벡터, 제3 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 트랜스-스플라이싱에 의해 생성되는,
    벡터 시스템.
  2. 제1항에 있어서, 제1 인테인, 제2 인테인, 제3 인테인 및 제4 인테인이 분할 인테인을 인코딩하고, 바람직하게는 상기 분할 인테인이 150개 아미노산의 최대 길이를 갖고, 더욱 바람직하게는 상기 분할 인테인이 DnaE 또는 DnaB 인테인인 벡터 시스템.
  3. 제1항 또는 제2항에 있어서,
    - 제1 인테인 뉴클레오티드 서열이 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
    - 제2 인테인 뉴클레오티드 서열이 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
    - 제3 인테인 뉴클레오티드 서열이 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
    - 제4 인테인 뉴클레오티드 서열이 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하는,
    벡터 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 코딩 서열의 상기 제1 부분(CDS1) 또는 코딩 서열의 상기 제2 부분(CDS2) 또는 코딩 서열의 상기 제3 부분(CDS3)의 5' 말단 부분에 작동 가능하게 연결된 프로모터 서열을 추가로 포함하는 벡터 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 5'-말단 반복(5'-TR) 뉴클레오티드 서열 및 3'-말단 반복(3'-TR) 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 5'-TR이 5'-역 말단 반복(5'-ITR) 뉴클레오티드 서열이고, 3'-TR이 3'-역 말단 반복(3'-ITR) 뉴클레오티드 서열인 벡터 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 아데닐중합체형성 신호 뉴클레오티드 서열을 추가로 포함하고/하거나, 제1 벡터 또는 제2 벡터 또는 제3 벡터 중 적어도 하나가 분해 신호를 코딩하는 뉴클레오티드 서열을 추가로 포함하는 벡터 시스템.
  7. 제6항에 있어서, 분해 신호가 CL1, PB29, SMN, CIITA, ODc, ecDHFR 또는 이들의 단편으로 구성된 군으로부터 선택되는 벡터 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 코딩 서열이 인코딩된 단백질 생성물의 구조적 도메인 또는 기능적 도메인 내에 속하지 않는 친핵체 아미노산으로 구성된 위치에서 제1 부분, 제2 부분 및 선택적으로 제3 부분으로 분할되며, 상기 친핵체 아미노산이 세린, 트레오닌 또는 시스테인으로부터 선택되는 벡터 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나가 코딩 서열에 작동 가능하게 연결된 적어도 하나의 인핸서 또는 조절 뉴클레오티드 서열을 추가로 포함하는 벡터 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 코딩 서열이 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병인 벡터 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 코딩 서열이 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애가 망막 변성이고, 바람직하게는 망막 변성이 유전되며, 바람직하게는 병리 또는 질병이 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반이상증, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택되는, 벡터 시스템.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 코딩 서열이 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병을 교정할 수 있는 단백질을 인코딩하는 벡터 시스템.
  13. 제1항 내지 제11항 중 어느 한 항에 있어서, 코딩 서열이 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1으로 구성된 군으로부터 선택되는 유전자의 코딩 서열인 벡터 시스템.
  14. 제1항 내지 제12항 중 어느 한 항에 있어서, 코딩 서열이 DMD, CFTR, F8, ATP7B, PAH, DYSF, MECP2, PKD, NPC1 HTT로 구성된 군으로부터 선택되는 유전자의 코딩 서열인 벡터 시스템.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서,
    a) 5'-3' 방향으로,
    - 5'-역 말단 반복(5'-ITR) 서열;
    - 프로모터 서열;
    - 코딩 서열(CDS1)의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1)의 5' 말단 부분;
    - N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
    - 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
    b) 5'-3' 방향으로,
    - 5'-역 말단 반복(5'-ITR) 서열;
    - 프로모터 서열;
    - C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
    - 코딩 서열(CDS2)의 3' 말단 부분; 및
    - 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터를 포함하거나;
    a') 5'-3' 방향으로,
    - 5'-역 말단 반복(5'-ITR) 서열;
    - 프로모터 서열;
    - 코딩 서열(CDS1')의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1')의 5' 말단 부분;
    - 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
    - 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
    b') 5'-3' 방향으로,
    - 5'-역 말단 반복(5'-ITR) 서열;
    - 프로모터 서열;
    - 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
    - 코딩 서열(CDS2')의 제2 부분; 및
    - 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열;
    - 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터; 및
    c') 5'-3' 방향으로,
    - 5'-역 말단 반복(5'-ITR) 서열;
    - 프로모터 서열;
    - 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열;
    - 코딩 서열(CDS3')의 제3 부분; 및
    - 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제3 벡터를 포함하는,
    벡터 시스템.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 코딩 서열이 ABCA4 유전자를 인코딩하고, 바람직하게는, 상기 코딩 서열이 ABCA4 단백질의 aa Cys1150, Ser1168, Ser1090에 상응하는 뉴클레오티드에서 분할되고, 분할 인테인이 분할 지점에 삽입되거나, 코딩 서열이 CEP290 유전자를 인코딩하고, 바람직하게는, 상기 코딩 서열이 CEP290 단백질의 aa Cys1076; Ser1275에 상응하는 뉴클레오티드에서 분할되고, 바람직하게는, CEP290 유전자를 인코딩하는 코딩 서열이 상기 CEP290 단백질의 aa Cys929 및 1474; Ser 453 및 Cys1474에 상응하는 뉴클레오티드 서열에서 분할되고, 2개의 분할 인테인이 분할 지점에 삽입되는, 벡터 시스템.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 벡터가 독립적으로 바이러스 벡터, 바람직하게는 아데노바이러스 벡터 또는 아데노-관련 바이러스(AAV) 벡터이고, 바람직하게는 상기 제1, 제2 및 제3 아데노-관련 바이러스(AAV) 벡터가 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 혈청형이 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9, 혈청형 7m8, 혈청형 sh10; 혈청형 2(quad Y-F)로부터 선택되는, 벡터 시스템.
  18. 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템으로 형질전환된 숙주 세포.
  19. 의료 용도를 위한 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템 또는 제18항에 따른 숙주 세포.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 유전자 요법에 사용하고, 바람직하게는 망막 변성, 대사 장애, 혈액 장애, 신경변성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병을 특징으로 하는 병리 또는 질병의 치료 및/또는 예방에 사용하기 위한 벡터 시스템 또는 숙주 세포.
  21. 제20항에 있어서, 망막 변성이 유전되며, 바람직하게는 병리 또는 질병이 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반이상증, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택되는 벡터 시스템 또는 숙주 세포.
  22. 제20항에 있어서, 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병의 예방 및/또는 치료에서 사용하기 위한 벡터 시스템 또는 숙주 세포.
  23. 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템 또는 제18항에 따른 숙주 세포 및 약학적으로 허용되는 비히클을 포함하는 약학적 조성물.
KR1020217014221A 2018-10-15 2019-10-15 인테인 단백질 및 이의 용도 KR20210104661A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18200490.3 2018-10-15
EP18200490 2018-10-15
EP19169116.1 2019-04-12
EP19169116 2019-04-12
PCT/EP2019/078020 WO2020079034A2 (en) 2018-10-15 2019-10-15 Intein proteins and uses thereof

Publications (1)

Publication Number Publication Date
KR20210104661A true KR20210104661A (ko) 2021-08-25

Family

ID=68234008

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217014221A KR20210104661A (ko) 2018-10-15 2019-10-15 인테인 단백질 및 이의 용도

Country Status (12)

Country Link
US (1) US20210371878A1 (ko)
EP (1) EP3867387A2 (ko)
JP (1) JP2022512718A (ko)
KR (1) KR20210104661A (ko)
CN (1) CN113348249A (ko)
AU (1) AU2019360372A1 (ko)
BR (1) BR112021007221A2 (ko)
CA (1) CA3116606A1 (ko)
IL (1) IL282362A (ko)
MX (1) MX2021004391A (ko)
SG (1) SG11202103886XA (ko)
WO (1) WO2020079034A2 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021209574A1 (en) 2020-04-15 2021-10-21 Fondazione Telethon Constructs comprising inteins
WO2022056440A1 (en) * 2020-09-14 2022-03-17 President And Fellows Of Harvard College Dual-aav vector delivery of pcdh15 and uses thereof
WO2023004125A2 (en) * 2021-07-23 2023-01-26 University Of Washington Generation of large proteins by co-delivery of multiple vectors
WO2023070527A1 (zh) * 2021-10-29 2023-05-04 上海鑫湾生物科技有限公司 一种条件控制的可剪接嵌合抗原受体分子及其应用
CN114854694A (zh) * 2022-04-29 2022-08-05 四川轻化工大学 一种高通量筛选新冠药物的荧光素酶互补体系及其构建方法与应用

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919208A (en) 1973-10-09 1975-11-11 Yeda Res & Dev 7-(Cyanomethylaryl)acetamide-cephalosporin derivatives
US5166331A (en) 1983-10-10 1992-11-24 Fidia, S.P.A. Hyaluronics acid fractions, methods for the preparation thereof, and pharmaceutical compositions containing same
AU7895700A (en) * 1999-10-15 2001-04-30 Dalhousie University Method and vector for producing and transferring trans-spliced peptides
US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
US20100098772A1 (en) 2008-10-21 2010-04-22 Allergan, Inc. Drug delivery systems and methods for treating neovascularization
US9200045B2 (en) 2011-03-11 2015-12-01 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
AU2012314355B2 (en) * 2011-09-28 2018-01-18 Zera Intein Protein Solutions, S.L. Split inteins and uses thereof
US9197705B2 (en) 2013-04-12 2015-11-24 Samsung Electronics Co., Ltd. Method and apparatus for supporting driving using wireless communication network and system thereof
ES2704677T3 (es) 2013-04-18 2019-03-19 Fond Telethon Suministro eficaz de genes grandes por vectores de AAV duales
NL2013235B1 (en) 2014-07-22 2016-08-16 Douwe Egberts Bv Pad for use in a machine for preparing at least one part of a single beverage serving, system including a machine and method for preparing at least one part of a single beverage serving with such a system.
DK3212778T3 (da) * 2014-10-28 2019-11-04 Agrivida Inc Fremgangsmåder og sammensætninger til stabilisering af trans-splejsning af intein-modificerede proteaser
EP3265571B1 (en) * 2015-03-03 2022-04-13 Fondazione Telethon Multiple vector system and uses thereof
FI3408292T3 (fi) * 2016-01-29 2023-06-30 Univ Princeton Jaettuja inteiinejä, joilla on poikkeuksellinen silmukoitumisaktiivisuus
CA2968112A1 (en) 2016-05-26 2017-11-26 Op-Hygiene Ip Gmbh Dispenser servicing in a multiple washroom facility
KR20190020745A (ko) * 2016-06-15 2019-03-04 옥스포드 유니버시티 이노베이션 리미티드 Abc4a를 발현시키기 위한 이중 중첩 아데노-관련 바이러스 벡터 시스템
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors

Also Published As

Publication number Publication date
WO2020079034A2 (en) 2020-04-23
AU2019360372A1 (en) 2021-06-03
IL282362A (en) 2021-06-30
CN113348249A (zh) 2021-09-03
WO2020079034A3 (en) 2020-06-18
MX2021004391A (es) 2021-08-16
CA3116606A1 (en) 2020-04-23
EP3867387A2 (en) 2021-08-25
BR112021007221A2 (pt) 2021-08-10
US20210371878A1 (en) 2021-12-02
JP2022512718A (ja) 2022-02-07
SG11202103886XA (en) 2021-05-28

Similar Documents

Publication Publication Date Title
KR20210104661A (ko) 인테인 단백질 및 이의 용도
JP7011467B2 (ja) ミスフォールドタンパク質の分解のための組成物及び方法
CN107530399B (zh) 治疗分子在体外和体内的有效递送
Welch et al. Actin polymerization is induced by Arp 2/3 protein complex at the surface of Listeria monocytogenes
KR102240180B1 (ko) 다중 벡터 시스템 및 이의 용도
JP2016028604A (ja) IL−4Rαに結合する涙液リポカリンムテイン
JP2024023183A (ja) 設計されたメガヌクレアーゼを使用した網膜色素変性症の治療
Mercier et al. The amphipathic alpha helices of the Toxoplasma protein GRA2 mediate postsecretory membrane association
US20230151385A1 (en) Selectable marker proteins, expression vectors, engineered cells and extracellular vesicles for the production of virus-like particles for therapeutic and prophylactic applications
CN115461082A (zh) 用于治疗遗传性黄斑变性的组合物和方法
JP2023504773A (ja) 眼遺伝子送達のためのaavベクター変異体
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
CN112601454B (zh) 用于治疗杜兴肌营养不良的组合物和方法
KR20210057720A (ko) Clrn1 관련된 청력 손실 및/또는 시력 손실의 치료 방법
JP2001258578A (ja) 新規FabD
US20230064326A1 (en) OPTOGENETIC COMPOSITIONS COMPRISING A CBh PROMOTER SEQUENCE AND METHODS FOR USE
KR20240023126A (ko) 망막 장애
WO2023143366A1 (zh) 变异型腺相关病毒及其在疾病治疗中的应用
CN112522276B (zh) 一种emc1核苷酸序列及其应用
KR20240023127A (ko) 망막 장애
CN117813321A (zh) 视网膜病症
US20210290727A1 (en) MODULATION OF mTORCI ACTIVITY AND AUTOPHAGY VIA CIB2-RHEB INTERACTION
CN117043324A (zh) 用于治疗先天性肌营养不良的治疗性lama2载荷
KR20240005950A (ko) 벡터 시스템
KR20230125806A (ko) 선천성 근이영양증의 치료를 위한 치료용 lama2 페이로드