KR20240045198A - 캡시드 변이체 및 이의 사용 방법 - Google Patents

캡시드 변이체 및 이의 사용 방법 Download PDF

Info

Publication number
KR20240045198A
KR20240045198A KR1020247000005A KR20247000005A KR20240045198A KR 20240045198 A KR20240045198 A KR 20240045198A KR 1020247000005 A KR1020247000005 A KR 1020247000005A KR 20247000005 A KR20247000005 A KR 20247000005A KR 20240045198 A KR20240045198 A KR 20240045198A
Authority
KR
South Korea
Prior art keywords
seq
compared
capsid polypeptide
polypeptide
mutations
Prior art date
Application number
KR1020247000005A
Other languages
English (en)
Inventor
실바인 라판
한나 레비틴
로렌 휠록
Original Assignee
디노 테라퓨틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디노 테라퓨틱스, 인코포레이티드 filed Critical 디노 테라퓨틱스, 인코포레이티드
Publication of KR20240045198A publication Critical patent/KR20240045198A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14145Special targeting system for viral vectors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 개시내용은 부분적으로 페이로드를 전달하는 데 사용될 수 있는 변이체 캡시드 폴리펩티드에 관한 것이다. 본 개시내용은 부분적으로 VP1과 같은 개선된 변이체 데펜도파보바이러스 캡시드 단백질(예를 들어, AAV2), 데펜도파보 바이러스의 생성 방법, 이에 사용하기 위한 조성물, 및 이에 의해 생성된 바이러스 입자를 제공한다. 일부 실시양태에서, 생성된 바이러스 입자는 캡시드 단백질에 돌연변이가 없는 바이러스 입자에 비해 안구 형질도입이 증가한다.

Description

캡시드 변이체 및 이의 사용 방법
관련 출원에 대한 상호 참조
본 출원은 2021년 6월 3일에 출원된 미국 가출원 번호 63/196,554, 2022년 4월 15일에 출원된 미국 가출원 번호 63/331,627 및 2022년 5월 16일에 출원된 미국 가출원 번호 63/342,455에 대한 우선권을 주장하며, 이들 각각은 전체가 본원에 참조로 포함된다.
데펜도파보바이러스(dependoparvovirus), 예를 들어, 아데노 관련 데펜도파보바이러스, 예를 들어, 아데노 관련 바이러스(AAV)는 인간 대상체를 포함하여 세포에 다양한 페이로드(payload)를 전달하기 위한 벡터로서 관심을 끌고 있다.
요약
본 개시내용은 부분적으로 VP1과 같은 개선된 변이체 데펜도파보바이러스 캡시드 단백질(dependoparvovirus capsid protein)(예를 들어, AAV2), 데펜도파보바이러스의 생성 방법, 이에 사용하기 위한 조성물, 및 이에 의해 생성된 바이러스 입자를 제공한다. 일부 실시양태에서, 생성된 바이러스 입자는 캡시드 단백질에 돌연변이가 없는 바이러스 입자와 비교하여 안구 형질도입(ocular transduction)이 증가한다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 제공된 바와 같은 변이체 캡시드 단백질을 암호화하는 서열을 포함하는 핵산에 관한 것이다. 일부 실시양태에서, 데펜도파보바이러스는 아데노 관련 데펜도파보바이러스(AAV)이다. 일부 실시양태에서, AAV는 AAV2이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 캡시드 폴리펩티드에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 핵산을 포함하는 데펜도파보바이러스 입자에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 핵산을 포함하는 벡터, 예를 들어, 플라스미드에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 핵산(예를 들어, VP1과 같은 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산)을 포함하는 데펜도파보바이러스 입자에 관한 것으로, 상기 암호화 서열은 본원에 제공된 바와 같은 변화 또는 돌연변이를 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 폴리펩티드를 포함하는 변이체 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자에 관한 것이다.
일부 실시양태에서, 변이체 캡시드 폴리펩티드는 VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이; VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이; 또는 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90 또는 91을 포함하는 핵산 분자, 이의 단편, 또는 이에 대한 서열 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%인 이의 변이체에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 핵산, 예를 들어, 캡시드 폴리펩티드, 예를 들어, VP1 폴리펩티드를 암호화하는 서열을 포함하는 핵산을 포함하는 벡터에 관한 것으로, 상기 암호화 서열은 본원에 제공된 바와 같은 변화 또는 돌연변이를 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로, 예를 들어, VP1과 같은 캡시드 폴리펩티드를 암호화하는 서열을 포함하는, 본원에 기술된 핵산 또는 벡터를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템에 관한 것으로, 상기 캡시드 폴리펩티드 암호화 서열은 암호화 서열에 본원에 제공된 바와 같은 변화 또는 돌연변이를 포함한다. 일부 실시양태에서, 세포, 무세포 시스템 또는 다른 번역 시스템은 본원에 기술된 데펜도파보바이러스 입자를 포함하며, 예를 들어, 상기 입자는 VP1 폴리펩티드와 같은 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산을 포함하고, 상기 암호화 서열은 본원에 제공된 바와 같은 변화 또는 돌연변이를 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 폴리펩티드를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템에 관한 것으로, 상기 폴리펩티드 암호화 서열은 본원에 제공된 바와 같은 변화 또는 돌연변이를 포함한다. 일부 실시양태에서, 세포, 무세포 시스템 또는 다른 번역 시스템은 본원에 기술된 데펜도파보바이러스 입자를 포함하며, 예를 들어, 상기 입자는 VP1 폴리펩티드를 암호화하는 서열을 포함하는 핵산을 포함하고, 상기 VP1 암호화 서열은 본원에 제공된 바와 같은 상응하는 변화 또는 돌연변이를 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로 세포를 본원에 기술된 핵산을 포함하는 데펜도파보바이러스 입자와 접촉시키는 단계를 포함하는, 세포로의 페이로드의 전달 방법에 관한 것이다. 일부 실시양태에서, 본 개시내용은 부분적으로 세포를 본원에 기술된 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자와 접촉시키는 단계를 포함하는, 세포로의 페이로드의 전달 방법에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 핵산(예를 들어, 본원에 제공된 바와 같은 AAV2 캡시드 변이체를 암호화하는 서열을 포함하는 핵산)을 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템을 제공하는 단계; 및 데펜도파보바이러스 입자의 생성에 적합한 조건하에서 상기 세포, 무세포 시스템 또는 다른 번역 시스템을 배양하여 데펜도파보바이러스 입자를 생성함으로써 데펜도파보바이러스 입자를 제조하는 단계를 포함하는, 데펜도파보바이러스 입자의 제조 방법에 관한 것이다. 일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 데펜도파보바이러스 입자의 제조 방법에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 폴리펩티드를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템을 제공하는 단계; 및 데펜도파보바이러스 입자의 생성에 적합한 조건하에서 상기 세포, 무세포 시스템 또는 다른 번역 시스템을 배양하여 데펜도파보바이러스 입자를 생성함으로써 데펜도파보바이러스 입자를 제조하는 단계를 포함하는, 데펜도파보바이러스 입자의 제조 방법에 관한 것이다. 일부 실시양태에서, 본 개시내용은 부분적으로 본원에 기술된 데펜도파보바이러스 입자의 제조 방법에 관한 것이다.
일부 실시양태에서, 본 개시내용은 부분적으로 세포, 무세포 시스템 또는 다른 번역 시스템에서 제조된 데펜도파보바이러스 입자에 관한 것으로, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 본원에 제공된 바와 같은 캡시드 변이체를 포함하는 데펜도파보바이러스를 암호화하는 핵산을 포함한다.
일부 실시양태에서, 본 개시내용은 부분적으로 대상체에게 본원에 기술된 데펜도파보바이러스 입자를 질환 또는 병태를 치료하는데 유효한 양으로 투여하는 단계를 포함하는, 대상체의 질환 또는 병태의 치료 방법에 관한 것이다.
본 발명은 다음의 번호가 매겨진 실시양태를 참조하여 추가로 설명된다.
도 1. 눈의 각 영역(region)에서 수집된 조직의 다이어그램. 망막(retina)(왼쪽 및 중앙 도면)에서는 망막의 상부(superior), 비강(nasal), 하부(inferior) 및 측두부(temporal) 영역 각각으로부터 말초 및 중심 망막 샘플을 별도로 수집했으며, 황반(macula)도 별도로 수집하였다. 각 영역에서 신경 망막(neural retina)과 맥락막(choroid)/RPE 층(중앙 도면)을 별도로 수집하였다. TM/SC 영역(오른쪽 도면)에서는 상부, 측두부, 비강 및 하부 샘플을 별도로 수집하였다.
도 2a-c. 대표적인 기준 캡시드 VP1 폴리펩티드의 다중서열 정렬. 이러한 정렬은 서로 다른 기준 캡시드 폴리펩티드 내의 위치에 상응하는 아미노산 위치를 결정하는 데 사용될 수 있다.
도 3. 중간 처리량 연구(medium throughput study)에 포함되고 유리체 내(intravitreal, IVT) 투여 경로를 통해 주사된 변이체의 데이터. 모든 값은 AAV2 야생형에 대한 log2이다. "-10" 값은 변이체가 측정되지 않았음을 나타낸다.
도 4. 중간 처리량 연구에 포함되고 전방 내(intracameral, IC) 투여 경로를 통해 주사된 변이체의 데이터. 모든 값은 AAV2 야생형에 대한 log2이다. "-10" 값은 변이체가 측정되지 않았음을 나타낸다.
도 5a-5c. IVT 투여 경로를 통해 주사된 변이체에 대한 중간 처리량 연구에서 처리된 벌크 조직으로부터의 데이터. 모든 값은 AAV2 야생형에 대한 log2이다. "-10" 값은 변이체가 측정되지 않았음을 나타낸다.
도 6a-6c. IC 투여 경로를 통해 주사된 변이체에 대한 중간 처리량 연구에서 처리된 벌크 조직으로부터의 데이터. 모든 값은 AAV2 야생형에 대한 log2이다. "-10" 값은 변이체가 측정되지 않았음을 나타낸다.
도 7. 라이브러리 실험 1의 벌크 섬유주대 형질도입(trabecular meshwork transduction)(IC 투여) 대 망막 형질도입(IVT 투여)의 플롯. 각 점은 고유한 변이체이다. 중간 처리량 실험에 포함하기 위해 진한 검정색의 변이체를 선택하였다. 모든 값은 AAV2 야생형에 대한 log2이다.
도 8. 라이브러리 실험 1(x축)과 중간 처리량 실험(y축)의 변이체에 대한 신경 망막 형질도입(IVT 투여)의 상관관계. 모든 값은 AAV2 야생형에 대한 log2이다.
도 9. 각 변이체에 대한 고유한 형질도입 이벤트 수를 보고한, 중간 처리량 연구에서 얻은 후안부 조직 샘플의 변이체에 대한 단일 핵 RNA 시퀀싱 결과. 모든 결과는 입력 테스트 물품에서의 각 변이체의 양으로 정규화된다. "VAR-05-n"으로 표시된 변이체는 표 1, 표 2 및 표 3의 "VAR-n"에 상응한다.
도 10a-53. 표시된 변이체에 대한 상대적 생체분포(biodistribution) 및 형질도입 측정값. IVT-MT-BD 및 IC-MT-BD는 중간 처리량 실험에서 수집된 각 안구 조직 샘플의 유리체 내 주사("IVT") 및 전방 내 주사("IC")로부터 도 10a(VAR-1), 11a(VAR-2), 12a(VAR-3), 13a(VAR-4), 14a(VAR-5), 17a(VAR-8), 18a(VAR-9), 20a(VAR-11), 21a(VAR-12), 22a(VAR-13), 23a(VAR-14), 25a(VAR-17), 27a(VAR-19), 28a(VAR-20), 29a(VAR-21), 30a(VAR-22), 31a(VAR-23), 32a(VAR-24), 34a(VAR-26), 37a(VAR-29), 38a(VAR-30), 39a(VAR-31), 41a(VAR-33), 42a(VAR-34), 43a(VAR-35), 44a(VAR-36), 45a(VAR-37), 46a(VAR-38), 47a(VAR-39), 48a(VAR-40), 49a(VAR-41), 50a(VAR-42) 및 51a(VAR-43)에서 각각 확인된 변이체 캡시드를 포함하는 바이러스 벡터에 대한 벌크 생체분포율(biodistribution rate) 측정값을 플롯한 것이다. IVT-MT-TD 및 IC-MT-TD는 중간 처리량 실험에서 수집된 각 안구 조직 샘플의 유리체 내 주사("IVT") 및 전방 내 주사("IC")로부터 도 10a(VAR-1), 11a(VAR-2), 12a(VAR-3), 13a(VAR-4), 14a(VAR-5), 17a(VAR-8), 18a(VAR-9), 20a(VAR-11), 21a(VAR-12), 22a(VAR-13), 23a(VAR-14), 25a(VAR-17), 27a(VAR-19), 28a(VAR-20), 29a(VAR-21), 30a(VAR-22), 31a(VAR-23), 32a(VAR-24), 34a(VAR-26), 37a(VAR-29), 38a(VAR-30), 39a(VAR-31), 41a(VAR-33), 42a(VAR-34), 43a(VAR-35), 44a(VAR-36), 45a(VAR-37), 46a(VAR-38), 47a(VAR-39), 48a(VAR-40), 49a(VAR-41), 50a(VAR-42) 및 51a(VAR-43)에서 각각 확인된 변이체 캡시드를 포함하는 바이러스 벡터에 대한 벌크 형질도입률 측정값을 플롯한 것이다. 모든 값은 야생형 AAV2 비율을 기준으로 log(2) 변이체 비율로 플롯된다. 점은 바코드 복제율의 평균을 나타낸다(n=8). 오차 막대는 95% 신뢰구간이다(+/-1.96 * 평균의 표준 오차("SEM")). 집계된 벌크 형질도입률은 조직의 모든 구성 눈 영역(맥락막/RPE, 신경 망막, 신경 망막 비황반)에 걸쳐 관찰된 수를 합하여 계산하였다. 맥락막/RPE 비율은 수집된 모든 맥락막/RPE 샘플을 합하여 계산하였다; 신경 망막 비율은 황반을 포함하여 수집된 모든 신경 망막층 샘플을 합하여 계산하였다. 신경 망막 비황반은 모든 신경 망막층 비황반 망막 샘플을 합하여 계산하였다. "비교" 패널은 패널에 표시된 대로 IVT 또는 IC 투여를 통한 중간 처리량(MT) 실험 라이브러리 실험 1 및 라이브러리 실험 2에서 수집된 도 10b(VAR-1), 11b(VAR-2), 12b(VAR-3), 13b(VAR-4), 14b(VAR-5), 15(VAR-6), 16(VAR-7), 17b(VAR-8), 18b(VAR-9), 19(VAR-10), 20b(VAR-11), 21b(VAR-12), 22b(VAR-13), 23b(VAR-14), 24(VAR-15), 25b(VAR-17), 26(VAR-18), 27b(VAR-19), 28b(VAR-20), 29b(VAR-21), 30b(VAR-22), 31b(VAR-23), 32b(VAR-24), 33(VAR-25), 34b(VAR-26), 35(VAR-27), 36(VAR-28), 37b(VAR-29), 38b(VAR-30), 39b(VAR-31), 40(VAR-32), 41b(VAR-33), 42b(VAR-34), 43b(VAR-35), 44b(VAR-36), 45b(VAR-37), 46b(VAR-38), 47b(VAR-39), 48b(VAR-40), 49b(VAR-41), 50b(VAR-42), 51b(VAR-43), 52(VAR-44) 및 53(VAR-45)에서 확인된 변이체 캡시드를 포함하는 바이러스 벡터에 대한 벌크 형질도입률 및 생체분포율 측정값(패널에 표시된 바와 같음)을 요약한 것이다. 모든 값은 야생형 AAV2 비율을 기준으로 log(2) 변이체 비율로 표시된다. 라이브러리 실험 1의 경우, 점은 야생형 AAV2를 기준으로 계산된 베이지안 사후 분포(Bayesian posterior distribution)의 log2 형질도입 평균을 나타낸다(실시예 섹션 참고). 오차 막대는 상기 사후 분포를 사용한 95% 신뢰구간을 나타낸다(+/-1.96 * 표준 편차("SD")). 라이브러리 실험 2의 경우, 점은 생물학적 복제율의 평균을 나타낸다(n=4개의 눈). 오차 막대는 95% 신뢰구간이다(+/-1.96 * SEM). MT 실험의 경우, 점은 바코드 복제율의 평균을 나타낸다(n=8). 오차 막대는 95% 신뢰구간이다(+/-1.96 * SEM). 조직(예를 들어, 맥락막/RPE, 신경 망막, TM/SC)에 대해 집계된 벌크 형질도입률은 조직 영역에 대해 수집된 모든 샘플에서 관찰된 수를 합하여 계산하였다. 점이 없으면 데이터가 수집되지 않았음을 의미한다.
열거된 실시양태
1. 서열번호 37, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 폴리펩티드를 포함하는 변이체 캡시드 폴리펩티드.
2. 실시양태 1에 있어서, 폴리펩티드가 다음을 포함하는 변이체 캡시드 폴리펩티드:
VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이;
VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이; 또는
VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이.
3. 실시양태 2에 있어서,
VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 1-36에 상응하는 돌연변이를 포함하고;
VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 431-466에 상응하는 돌연변이를 포함하고;
VAR-17 내지 VAR45 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 552-617에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
4. 실시양태 1 내지 3 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이 및 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
5. 실시양태 1 내지 4 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
6. 실시양태 1 내지 5 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
7. 실시양태 1 내지 6 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33, 446, 449, 450, 451, 452, 454, 455, 456, 457, 458, 459, 460, 461, 464, 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597 또는 600에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이 또는 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 선택적으로 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는 변이체 캡시드 폴리펩티드.
8. 실시양태 1 내지 7 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33 또는 이들의 임의의 조합에서의 돌연변이에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 결실 또는 치환을 포함하는 변이체 캡시드 폴리펩티드.
9. 실시양태 1 내지 8 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 446, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 464 또는 이들의 임의의 조합에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는 변이체 캡시드 폴리펩티드.
10. 실시양태 1 내지 9 중 어느 하나에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597, 600 또는 이들의 임의의 조합에서의 돌연변이, 위치 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이, 592와 593 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는 변이체 캡시드 폴리펩티드.
11. VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가
삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 454 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산, 예를 들어, 4-7개 아미노산, 예를 들어, 7개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하는 삽입;
치환, 예를 들어, 서열번호 1과 비교하여 위치 445와 465 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 6-10개 잔기, 예를 들어, 적어도 7-10개 잔기, 예를 들어, 적어도 8-10개 잔기, 예를 들어, 적어도 9-10개 잔기, 예를 들어, 적어도 10개 잔기의 치환; 및
이들의 임의의 조합이고;
변이체가 T455G/L/Q, T456G, Q457T, S458Q, R459G/T로부터 선택된 적어도 3개의 돌연변이를 포함하고; 서열번호 1과 비교하여 위치 445-465 사이에 적어도 3개의 다른 돌연변이를 추가로 포함하고, 상기 돌연변이는 치환, 삽입 또는 결실인 변이체 캡시드 폴리펩티드.
12. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 552와 588 사이에 있고, 상기 돌연변이가 다음을 포함하는 변이체 캡시드 폴리펩티드:
삽입, 예를 들어, 서열번호 1과 비교하여 위치 583과 588 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하거나 서열번호 93-122의 4개 이상의 아미노산의 단편을 포함하는 삽입;
치환, 예를 들어, 서열번호 1과 비교하여 위치 552와 588 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 3-9개 잔기, 예를 들어, 적어도 4-9개 잔기, 예를 들어, 적어도 5-9개 잔기, 예를 들어, 적어도 6-9개 잔기, 예를 들어, 적어도 7-9개 잔기, 예를 들어, 적어도 8-9개, 예를 들어, 적어도 9개 잔기의 치환; 및
이들의 임의의 조합.
13. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 552와 566 사이에 있고, 상기 돌연변이가 다음을 포함하는 변이체 캡시드 폴리펩티드:
(a) 다음 공통식(consensus formula)을 포함하는 치환:
A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A(서열번호 132)
여기서, n은 서열번호 1에 제시된 야생형 잔기이다;
(b) 상기 공통의 비천연 발생 아미노산 중 1, 2, 3, 4, 5, 6 또는 7개를 포함하는 치환; 또는
(c) 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환으로서, 위치 557, 558, 559 중 임의의 것 또는 이들의 임의의 조합에 류신을 도입하는 치환.
14. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 추가로 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 575와 588 사이에 있고, 상기 돌연변이가 다음을 포함하는 변이체 캡시드 폴리펩티드:
(a) 다음 공통식을 포함하는 치환:
E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)
여기서 n은 서열번호 1에 제시된 야생형 잔기이고 del은 결실이다;
(b) 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)의 1-5개의 비천연 발생 아미노산을 포함하는 치환; 또는
(c) 서열번호 1과 비교하여 위치 578, 580 또는 581 중 임의의 것에서의 치환으로서, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산인 치환.
15. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 추가로 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 552와 588 사이에 있고,
상기 돌연변이가 다음을 포함하는, 서열번호 1과 비교하여 위치 552와 566 사이의 치환이고:
(a) 다음 공통식을 포함하는 치환:
A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A(서열번호 132)
여기서 n은 서열번호 1에 제시된 야생형 잔기이다;
(b) 상기 공통의 비천연 발생 아미노산 중 1, 2, 3, 4, 5, 6 또는 7개를 포함하는 치환; 또는
(c) 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환으로서, 위치 557, 558, 559 중 임의의 것 또는 이들의 임의의 조합에 류신을 도입하는 치환;
상기 돌연변이가 다음을 포함하는, 서열번호 1과 비교하여 위치 575와 588 사이의 치환인 변이체 캡시드 폴리펩티드:
(a) 다음 공통식을 포함하는 치환:
E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)
여기서 n은 서열번호 1에 제시된 야생형 잔기이고 del은 결실이다;
(b) 상기 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)의 1-5개의 비천연 발생 아미노산을 포함하는 치환; 또는
(c) 서열번호 1과 비교하여 위치 578, 580 또는 581 중 임의의 것에서의 치환으로서, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산인 치환.
16. 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 584와 617 사이에 있고, 상기 돌연변이가 다음을 포함하는 변이체 캡시드 폴리펩티드:
삽입, 예를 들어, 서열번호 1과 비교하여 위치 584와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-5개 아미노산, 예를 들어, 5-8개 아미노산, 예를 들어, 7-10개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드, 또는 F, I, P, G, 또는 서열번호 93-122 중 임의의 것의 적어도 4개 아미노산의 단편으로부터 선택된 단일 잔기를 포함하는 삽입;
치환, 예를 들어, 서열번호 1과 비교하여 위치 584와 617 사이에서의 치환에 상응하는 적어도 1개 이상의 잔기, 예를 들어, 적어도 1-2개 잔기, 예를 들어, 적어도 2-7개 잔기, 예를 들어, 적어도 2-8개 잔기의 치환; 및
이들의 임의의 조합.
17. 실시양태 17에 있어서, 삽입이 7-10개 아미노산을 포함하고 LALGETTRPA(서열번호 93)와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%이거나 LALGETTRPA(서열번호 93)의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편을 포함하는, 예를 들어, LGETTRP(서열번호 94)를 포함하는 변이체 캡시드 폴리펩티드.
18. 실시양태 1 내지 17 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 14, 15, 19 및 24에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
19. 실시양태 1 내지 18 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 3, 6, 11, 12, 21, 23, 25, 29, 31 및 33에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
20. 실시양태 1 내지 19 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 451, 455, 456, 457, 458 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
21. 실시양태 1 내지 20 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 452, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
22. 실시양태 1 내지 21 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 457 및 458에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
23. 실시양태 1 내지 22 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 446에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
24. 실시양태 1 내지 23 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
25. 실시양태 1 내지 24 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 451, 455, 456, 457, 458, 459 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
26. 실시양태 1 내지 25 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 448에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
27. 실시양태 1 내지 26 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 453에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
28. 실시양태 1 내지 27 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 456, 457, 458, 459, 460 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
29. 실시양태 1 내지 28 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 451, 454, 455, 456, 458, 459, 461 및 464 위치에서 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
30. 실시양태 1 내지 29 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 446, 448, 449, 451, 453, 455, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
31. 실시양태 1 내지 30 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 447에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
32. 실시양태 1 내지 31 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 581에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
33. 실시양태 1 내지 32 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 584에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
34. 실시양태 1 내지 33 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 555, 561, 566, 578, 580, 581 및 585에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
35. 실시양태 1 내지 34 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 557 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
36. 실시양태 1 내지 35 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 556, 558, 578 및 580에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
37. 실시양태 1 내지 36 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 554, 556, 559, 561, 566, 581, 585, 586 및 587에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
38. 실시양태 1 내지 37 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 552, 555, 556, 559, 561, 566, 578, 581 및 586에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
39. 실시양태 1 내지 38 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 575 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
40. 실시양태 1 내지 39 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 583에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
41. 실시양태 1 내지 40 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585, 588, 589, 590, 591, 593, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
42. 실시양태 1 내지 41 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 592에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
43. 실시양태 1 내지 42 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
44. 실시양태 1 내지 43 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 586에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
45. 실시양태 1 내지 44 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 589에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
46. 실시양태 1 내지 45 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 587에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
47. 실시양태 1 내지 46 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 590에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
48. 실시양태 1 내지 47 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585, 586, 587, 591, 594, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
49. 실시양태 1 내지 48 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 591에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
50. 실시양태 1 내지 49 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 588에서의 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
51. 실시양태 1 내지 50 중 어느 하나에 있어서, 삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이 또는 592와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-10개 아미노산, 예를 들어, 2-8개 아미노산, 예를 들어, 3-7개 아미노산, 예를 들어, 7개 아미노산의 삽입을 포함하는 변이체 캡시드 폴리펩티드.
52. 실시양태 1 내지 51 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 T14L, L15V, I19A 및 K24H 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
53. 실시양태 1 내지 52 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 A3V, Y6F, L11F, E12Q, Q21L, W23I, L25C, P29A, P31N 및 K33R 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
54. 실시양태 1 내지 53 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, T450M, P451T, T455L, T456G, Q457T, S458Q 및 R459M 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
55. 실시양태 1 내지 54 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, 잔기 P451 결실, S452T, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
56. 실시양태 1 내지 55 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 Q457F 및 S458C 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
57. 실시양태 1 내지 56 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 446과 447 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 KCQEGMA(서열번호 95)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
58. 실시양태 1 내지 57 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 449와 450 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LMVDRLG(서열번호 96)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
59. 실시양태 1 내지 58 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
60. 실시양태 1 내지 59 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 448과 449 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 HCQECPI(서열번호 97)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
61. 실시양태 1 내지 60 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 453과 454 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 FSGLEN(서열번호 98)의 폴리펩티드, 또는 이의 적어도 5개 아미노산 단편을 포함하는 변이체 캡시드 폴리펩티드.
62. 실시양태 1 내지 61 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 T456, Q457, S458, R459, L460 및 Q461의 잔기 결실에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
63. 실시양태 1 내지 62 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N449I, T450N, P451G, 잔기 T454 결실, T455Q, T456N, S458Q, R459T, Q461K 및 Q464V 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
64. 실시양태 1 내지 63 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 S446A, 잔기 T448 및 N449 결실, P451Q, G453T, T455G, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
65. 실시양태 1 내지 64 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, T450S, S452G, T455A, Q457F, S458M, R459D에 상응하는 돌연변이, 및 잔기 451과 452 사이의 삽입을 포함하고, 상기 삽입은 아미노산 Y를 포함하는 변이체 캡시드 폴리펩티드.
66. 실시양태 1 내지 65 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 447과 448 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 HETEFNF(서열번호 99)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
67. 실시양태 1 내지 66 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
68. 실시양태 1 내지 67 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 581과 582 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 FALMEP(서열번호 100)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
69. 실시양태 1 내지 68 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 RAYNPD(서열번호 101)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
70. 실시양태 1 내지 69 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 R585 결실 및 E555A, D461S, R566K, S578V, S580A 및 T581A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
71. 실시양태 1 내지 70 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 V557L 및 S578D 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
72. 실시양태 1 내지 71 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 K556N, M558L, S578I 및 S580A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
73. 실시양태 1 내지 72 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 I554L, K556R, I559L, D561S, R566A, T581D, R585S, G586R 및 N587S 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
74. 실시양태 1 내지 73 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 V552A, E555S, K556D, I559L, D561S, R566K, S578I, T581D 및 G586Q 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
75. 실시양태 1 내지 74 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 Q575E 및 S578A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
76. 실시양태 1 내지 75 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 583과 584 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LNWTAE(서열번호 102)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
77. 실시양태 1 내지 76 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 R585S, R588T, Q589N, A590P, A591I, A593G, T597S 및 V600A 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
78. 실시양태 1 내지 77 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 R585N 및 G586A 돌연변이에 상응하는 돌연변이 및 잔기 584와 585 사이의 삽입을 포함하고, 상기 삽입은 LAKEFTTR(서열번호 103)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, KEFTTR(서열번호 104)을 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
79. 실시양태 1 내지 78 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LHPLE(서열번호 105)의 폴리펩티드 또는 이의 적어도 4개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
80. 실시양태 1 내지 79 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 F를 포함하는 변이체 캡시드 폴리펩티드.
81. 실시양태 1 내지 80 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 DQDFKNR(서열번호 106)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
82. 실시양태 1 내지 81 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 I를 포함하는 변이체 캡시드 폴리펩티드.
83. 실시양태 1 내지 82 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LAIEQTRPA(서열번호 107)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, IEQTRPA(서열번호 108)를 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
84. 실시양태 1 내지 83 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 G586P 및 N587A 돌연변이 및 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 RARLDETT(서열번호 109)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, RLDETT(서열번호 110)를 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
85. 실시양태 1 내지 84 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N587A 돌연변이에 상응하는 돌연변이 및 잔기 586과 587 사이의 삽입을 포함하고, 상기 삽입은 LALAEITRP(서열번호 111)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, LAEITRP(서열번호 112)를 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
86. 실시양태 1 내지 85 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 N587A 돌연변이 및 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LANGEQTRP(서열번호 113)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, NGEQTRP(서열번호 114)를 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
87. 실시양태 1 내지 86 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 ATDTKT(서열번호 115)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
88. 실시양태 1 내지 87 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 590과 591 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 P를 포함하는 변이체 캡시드 폴리펩티드.
89. 실시양태 1 내지 88 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 APGETTRPA(서열번호 116)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
90. 실시양태 1 내지 89 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 P를 포함하는 변이체 캡시드 폴리펩티드.
91. 실시양태 1 내지 90 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 R585S, G586S, N587A, A591E, D594R, T597A 및 V600I 돌연변이에 상응하는 돌연변이를 포함하는 변이체 캡시드 폴리펩티드.
92. 실시양태 1 내지 91 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 대응하는 돌연변이를 포함하고, 상기 삽입은 FHNEGKY(서열번호 118)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편를 포함하는 변이체 캡시드 폴리펩티드.
93. 실시양태 1 내지 92 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 591과 592 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 G를 포함하는 변이체 캡시드 폴리펩티드.
94. 실시양태 1 내지 93 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 588과 589 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 QPWEPDK(서열번호 119)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
95. 실시양태 1 내지 94 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 ALALSTTN(서열번호 120)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, ALSTTN(서열번호 121)을 포함하거나 이로 이루어진 단편))을 포함하는 변이체 캡시드 폴리펩티드.
96. 실시양태 1 내지 95 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 PWGTAG(서열번호 122)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는 변이체 캡시드 폴리펩티드.
97. (a) 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46 중 어느 하나의 폴리펩티드, (b) 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46 중 어느 하나의 VP2 또는 VP3 서열; (c) 이에 대한 동일성이 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%인 서열을 포함하는 폴리펩티드로서, 상기 서열은 서열번호 1에 비해 서열번호 2 내지 서열번호 46 중 임의의 것과 연관된 돌연변이 차이 중 적어도 1개(예를 들어, 1개, 2개, 3개 또는 그 이상, 예를 들어, 모두)를 포함하는 폴리펩티드; 또는 (d) (a) 또는 (b)의 폴리펩티드에 대해 1개 이상 20개 이하, 19개 이하, 18개 이하, 17개 이하, 16개 이하, 15개 이하, 14개 이하, 13개 이하, 12개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 3개 이하 또는 2개 이하의 아미노산 돌연변이를 갖는 폴리펩티드로서, 상기 폴리펩티드는 서열번호 1에 비해 서열번호 2 내지 46 중 임의의 것과 연관된 돌연변이 차이 중 적어도 1개(예를 들어, 1개, 2개, 3개 또는 그 이상, 예를 들어, 모두)를 포함하는 폴리펩티드를 포함하는 변이체 캡시드 폴리펩티드.
98. 실시양태 1 내지 97 중 어느 하나에 있어서, 변이체 캡시드 폴리펩티드가 VP1 폴리펩티드, VP2 폴리펩티드 또는 VP3 폴리펩티드인 변이체 캡시드 폴리펩티드.
99. 서열번호 1의 554에 상응하는 위치에서 류신에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 I554L을 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
100. 실시양태 1 내지 99 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 8 내지 12개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
101. 실시양태 1 내지 100 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 최대 16개의 추가 돌연변이, 예를 들어, 11 내지 16개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
102. 실시양태 1 내지 101 중 어느 하나에 있어서, 서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S를 포함함)를 추가로 포함하는 변이체 캡시드 폴리펩티드.
103. 실시양태 1 내지 102 중 어느 하나에 있어서, 서열번호 1의 581에 상응하는 위치에서 아스파르트산에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)를 추가로 포함하는 변이체 캡시드 폴리펩티드.
104. 서열번호 1의 559에 상응하는 위치에서 류신에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 I559L을 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
105. 실시양태 1 내지 104 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 13개의 추가 돌연변이, 예를 들어, 4 내지 13개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
106. 실시양태 1 내지 105 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 8 내지 19개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
107. 실시양태 1 내지 106 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-23(서열번호 24)과 비교하여 최대 20개의 추가 돌연변이, 예를 들어, 5 내지 20개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
108. 실시양태 1 내지 107 중 어느 하나에 있어서, 서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S를 포함함)를 추가로 포함하고, 선택적으로 캡시드 폴리펩티드가 서열번호 1의 581에 상응하는 위치에서 아스파르트산(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)을 추가로 포함하는 변이체 캡시드 폴리펩티드.
109. 서열번호 1의 556에 상응하는 위치에서 아스파라긴에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 K556N을 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
110. 실시양태 1 내지 109 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 4 내지 12개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
111. 실시양태 1 내지 110 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-21(서열번호 22)과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 9 내지 12개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
112. 서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S를 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
113. 실시양태 1 내지 112 중 어느 하나에 있어서, 캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 7 내지 12개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
114. 실시양태 1 내지 113 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-19(서열번호 20)와 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 11 내지 14개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
115. 실시양태 1 내지 114 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 10 내지 14개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
116. 실시양태 1 내지 115 중 어느 하나에 있어서, 캡시드 폴리펩티드가 VAR-23(서열번호 24)과 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 9 내지 14개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
117. 실시양태 1 내지 116 중 어느 하나에 있어서, 서열번호 1의 581에 상응하는 위치에서 아스파르트산에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)를 추가로 포함하는 변이체 캡시드 폴리펩티드.
118. 서열번호 1의 587에 상응하는 위치에서 돌연변이를 포함하는 캡시드 폴리펩티드로서, 선택적으로 돌연변이가 알라닌에 대한 것이고(예를 들어, 돌연변이는 서열번호 1에 따른 N587A이다), 선택적으로 캡시드 폴리펩티드가 서열번호 1에 따른 580과 587 사이(선택적으로 586과 587 사이)의 인접한 2개 아미노산 사이의 삽입(예를 들어, 4개 이상의 아미노산 삽입, 선택적으로 7개 이상의 아미노산 삽입, 선택적으로 7-10개 아미노산 삽입, 선택적으로 7, 8 또는 9개 아미노산 삽입)을 추가로 포함하는 변이체 캡시드 폴리펩티드
119. 실시양태 1 내지 118 중 어느 하나의 변이체 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자.
120. 실시양태 119에 있어서, 변이체 캡시드 폴리펩티드를 암호화하는 서열에 작동 가능하게 연결된 하나 이상의 조절 요소를 포함하는 핵산 분자.
121. 실시양태 119 또는 120에 있어서, 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91 또는 이의 단편, 또는 이에 대한 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%인 이의 변이체를 포함하는 핵산 분자.
122. 실시양태 1 내지 118 중 어느 하나의 변이체 캡시드 폴리펩티드를 포함하거나 실시양태 119 내지 121 중 어느 하나의 핵산 분자에 의해 암호화된 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자(예를 들어, 아데노 관련 바이러스("AAV") 입자).
123. 실시양태 122에 있어서, 이종 전이유전자 및 하나 이상의 조절 요소를 포함하는 핵산을 포함하는 바이러스 입자.
124. 실시양태 1 내지 118 중 어느 하나의 변이체 캡시드 폴리펩티드를 포함하는 실시양태 122 또는 123의 바이러스 입자로서, 상기 바이러스 입자, 상기 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자, 또는 실시양태 119 내지 121 중 어느 하나의 핵산 분자에 의해 암호화된 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자가 야생형 AAV2(예를 들어, 서열번호 1의 캡시드 폴리펩티드를 포함하거나 서열번호 92에 의해 암호화된 바이러스 입자)에 비해, 예를 들어, 본원에 기술된 바와 같이, 예를 들어, 마우스 또는 NHP에서 측정했을 때 증가된 안구 형질도입(ocular transduction)을 나타내는 바이러스 입자.
125. 실시양태 119 내지 121 중 어느 하나에 있어서, 핵산 분자가 이중 가닥 또는 단일 가닥이고, 선택적으로 핵산 분자가 선형 또는 원형이고, 예를 들어, 핵산 분자가 플라스미드인 핵산 분자.
126. 변이체 AAV2 캡시드 폴리펩티드를 포함하는 바이러스 입자의 생성 방법으로서, 실시양태 119 내지 121 또는 125 중 어느 하나의 핵산 분자를 세포(예를 들어, HEK293 세포)에 도입하는 단계 및 이로부터 상기 바이러스 입자를 수확하는 단계를 포함하는 방법.
127. 세포를 실시양태 1 내지 118 중 어느 하나의 변이체 캡시드 폴리펩티드 또는 실시양태 123 또는 124의 바이러스 입자 및 페이로드를 포함하는 데펜도파보바이러스 입자와 접촉시키는 단계를 포함하는, 세포로의 페이로드(예를 들어, 핵산)의 전달 방법.
128. 실시양태 127에 있어서, 세포가 안구 세포인 방법.
129. 실시양태 128에 있어서, 안구 세포가 망막, 황반 또는 섬유주대에 존재하는 방법.
130. 대상체에게 실시양태 1 내지 118 중 어느 하나의 변이체 캡시드 폴리펩티드 및 페이로드를 포함하는 데펜도파보바이러스 입자를 투여하거나, 대상체에게 실시양태 122 내지 124 중 어느 하나의 바이러스 입자를 투여하는 단계를 포함하는, 대상체에 페이로드(예를 들어, 핵산)를 전달하는 방법.
131. 실시양태 130에 있어서, 입자가 페이로드를 눈에 전달하는 방법.
132. 실시양태 131에 있어서, 입자가 페이로드를 망막, 황반 또는 섬유주대에 전달하는 방법.
133. 실시양태 130 내지 132 중 어느 하나에 있어서, 입자가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입으로 페이로드를 눈에 전달하는 방법.
134. 실시양태 133에 있어서, 눈의 하나 이상의 영역이 망막, 황반, 섬유주대 또는 이들의 임의의 조합으로부터 선택되는 방법.
135. 실시양태 133에 있어서, 망막이 비황반 망막을 포함하는 방법.
136. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 135 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배 또는 150배인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
137. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 136 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직에 비해 비황반 망막 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
138. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 137 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 비황반 망막 조직에 비해 황반 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
139. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 138 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 황반 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
140. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 139 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 비황반 망막 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
141. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 140 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 황반 조직 및 비황반 망막 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
142. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 141 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직 및 비황반 망막 조직에 비해 섬유주대 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
143. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 142 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직에 비해 섬유주대 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
144. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 143 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 비황반 망막 조직에 비해 섬유주대 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
145. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 144 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직, 황반 조직 및 비황반 망막 조직에 특이적인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
146. 실시양태 1 내지 118 중 어느 하나, 실시양태 122 내지 124 중 어느 하나 또는 실시양태 130 내지 145 중 어느 하나에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 생체분포 없이 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하는 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
147. 실시양태 130 내지 146 중 어느 하나에 있어서, 대상체에 대한 투여가 유리체 내 주사 또는 전방 내 주사를 통해 이루어지는 방법.
148. 데펜도파보바이러스 입자를 질환 또는 병태를 치료하는데 효과적인 양으로 대상체에게 투여하는 단계를 포함하는, 대상체의 질환 또는 병태의 치료 방법으로서, 데펜도파보바이러스 입자는 실시양태 1 내지 118 및 136 내지 146 중 어느 하나의 캡시드 폴리펩티드를 포함하는 입자이거나, 실시양태 119 내지 121 또는 125 중 어느 하나의 핵산에 의해 암호화되거나, 실시양태 122-124 중 어느 하나의 바이러스 입자인 방법.
149. 실시양태 1 내지 125 또는 136 내지 146 중 어느 하나의 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템.
150. 데펜도파보바이러스(예를 들어, 아데노 관련 데펜도파보바이러스(AAV) 입자의 제조 방법으로서,
실시양태 119 내지 121 또는 125 중 어느 하나의 핵산을 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템을 제공하는 단계; 및
데펜도파보바이러스 입자의 생성에 적합한 조건하에서 상기 세포, 무세포 시스템 또는 다른 번역 시스템을 배양하여 데펜도파보바이러스 입자를 생성하는 단계를 포함하는 방법.
151. 실시양태 150에 있어서, 세포, 무세포 시스템 또는 다른 번역 시스템이 제2 핵산 분자를 포함하고, 상기 제2 핵산 분자가 데펜도파보바이러스 입자에 패키징되어 있는 방법.
152. 실시양태 150에 있어서, 제2 핵산이 페이로드, 예를 들어, 치료 제품을 암호화하는 이종 핵산 서열을 포함하는 방법.
153. 실시양태 150 내지 152 중 어느 하나에 있어서, 실시양태 119 내지 121 또는 125 중 어느 하나의 핵산이 실시양태 119 내지 121 또는 125 중 어느 하나의 핵산을 포함하지 않는 데펜도파보바이러스 입자의 생성을 매개하는 방법.
154. 실시양태 150 내지 153 중 어느 하나에 있어서, 실시양태 119 내지 121 또는 125 중 어느 하나의 핵산이 데펜도파보바이러스 입자의 생성을 서열번호 92의 핵산에 의해 매개되는 생성 수준보다 적어도 10%, 적어도 20%, 적어도 50%, 적어도 100%, 적어도 200% 또는 그 이상의 수준으로 매개하는 방법.
155. 실시양태 122 내지 124 중 어느 하나의 바이러스 입자 또는 실시양태 126 또는 150 내지 154 중 어느 하나의 방법에 의해 생성된 바이러스 입자 및 약제학적으로 허용되는 담체를 포함하는 조성물, 예를 들어, 약제학적 조성물.
156. 실시양태 1 내지 118 및 136 내지 146 중 어느 하나, 실시양태 119 내지 121 또는 125 중 어느 하나, 또는 실시양태 122 내지 124 및 136 내지 146 중 어느 하나에 있어서, 대상체의 질환 또는 병태를 치료하기 위한 변이체 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자.
157. 실시양태 1 내지 118 및 136 내지 146 중 어느 하나, 청구항 119 내지 121 또는 125 중 어느 하나, 또는 청구항 122 내지 124 및 136 내지 146 중 어느 하나에 있어서, 대상체의 질환 또는 병태를 치료하는 데 사용하기 위한 약제의 제조에 사용하기 위한 변이체 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자.
본 개시내용은 부분적으로 데펜도파보바이러스 입자를 생성하는 데 사용될 수 있는 변이체 캡시드 변이체에 관한 것이다. 일부 실시양태에서, 상기 입자는 변이체 캡시드 폴리펩티드가 없는 데펜도파보바이러스 입자와 비교하여 안구 내 형질도입 효율성이 높아져 전이유전자 또는 관심 분자를 눈에 전달하는 데 사용할 수 있다. 따라서, 변이체 캡시드 폴리펩티드, 이를 암호화하는 핵산 분자, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자 및 이의 사용 방법이 본원에서 제공된다.
정의
A, An, The: 본원에서 사용되는 단수형 "a", "an" 및 "the"는 문맥에서 달리 명시하지 않는 한 복수형을 포함한다.
약, 대략: 본원에서 사용되는 용어 "약" 및 "대략"은 일반적으로 측정의 성격 또는 정밀도를 고려할 때 측정된 양에 대해 허용 가능한 정도의 오차를 의미한다. 예시적인 오차 정도는 주어진 값 또는 값의 범위의 15% 이내, 전형적으로 10% 이내, 더 전형적으로는 5% 이내이다.
데펜도파보바이러스 캡시드: 본원에서 사용되는 용어 "데펜도파보바이러스 캡시드"는 데펜도파보바이러스 폴리펩티드를 포함하는 조립된 바이러스 캡시드를 지칭한다. 일부 실시양태에서, 데펜도파보바이러스 캡시드는 기능적 데펜도파보바이러스 캡시드이며, 예를 들어, 완전히 접혀 있고/거나 조립되어 있거나, 표적 세포를 감염시키는 데 적합하거나, 적어도 임계 시간 동안 안정하게 유지된다(예를 들어, 접혀 있고/거나 조립되어 있고/거나 표적 세포를 감염시키는 데 적합함).
데펜도파보바이러스 입자: 본원에서 사용되는 용어 "데펜도파보바이러스 입자"는 데펜도파보바이러스 폴리펩티드 및 패키징된 핵산을 포함하는 조립된 바이러스 캡시드를 지칭하며, 예를 들어, 페이로드, 데펜도파보바이러스 게놈(예를 들어, 전체 데펜도파보바이러스 게놈)의 하나 이상의 성분 또는 둘 다를 포함한다. 일부 실시양태에서, 데펜도파보바이러스 입자는 기능적 데펜도파보바이러스 입자이며, 예를 들어, 원하는 페이로드를 포함하거나, 완전히 접혀 있고/거나 조립되어 있거나, 표적 세포를 감염시키는 데 적합하거나, 적어도 임계 시간 동안 안정하게 유지된다(예를 들어, 접혀 있고/거나 조립되어 있고/거나 표적 세포를 감염시키는 데 적합함).
데펜도파보바이러스 X 입자/캡시드: 본원에서 사용되는 용어 "데펜도파보바이러스 X 입자/캡시드"는 자연 발생 데펜도파보바이러스 X 종으로부터 유래된 적어도 하나의 폴리펩티드 또는 폴리펩티드 암호화 핵산 서열을 포함하는 데펜도파보바이러스 입자/캡시드를 지칭한다. 예를 들어, 데펜도파보바이러스 B 입자는 자연 발생 데펜도파보바이러스 B 서열로부터 유래된 적어도 하나의 폴리펩티드 또는 폴리펩티드 암호화 핵산 서열을 포함하는 데펜도파보바이러스 입자를 지칭한다. 본 문맥에서 사용된 '~로부터 유래된'은 해당 서열과의 동일성이 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%인 것을 의미한다. 상응하게, 본원에서 사용되는 AAVX 입자/캡시드는 자연 발생 AAV X 혈청형으로부터 유래된 적어도 하나의 폴리펩티드 또는 폴리펩티드 암호화 핵산 서열을 포함하는 AAV 입자/캐스피드를 지칭한다. 예를 들어, AAV2 입자는 자연 발생 AAV2 서열로부터 유래된 적어도 하나의 폴리펩티드 또는 폴리펩티드 암호화 핵산 서열을 포함하는 AAV 입자를 지칭한다.
외인성: 본원에서 사용되는 용어 "외인성"은 해당 상황에서 자연 발생하지 않는 상황에(예를 들어, 핵산, 폴리펩티드 또는 세포에) 존재하는 특징, 서열 또는 성분을 의미한다. 예를 들어, 돌연변이체 캡시드 폴리펩티드를 포함하는 핵산 서열 또는 이를 암호화하는 핵산 분자는 캡시드 폴리펩티드를 포함할 수 있다. 이러한 방식으로 외인성이라는 용어를 사용하는 것은 해당 위치에서 해당 돌연변이를 포함하는 폴리펩티드 또는 폴리펩티드를 암호화하는 핵산 분자가 자연 발생하지 않는 것, 예를 들어, AAV2에 존재하지 않는 것, 예를 들어, 서열번호 1에 존재하지 않는 것을 의미한다.
기능적: 데펜도파보바이러스 캡시드(예를 들어, Cap(예를 들어, VP1, VP2 및/또는 VP3) 또는 Rep)의 폴리펩티드 성분과 관련하여 본원에서 사용되는 용어 "기능적"은 해당 폴리펩티드 성분의 자연 발생 버전 활성의 적어도 50, 60, 70, 80, 90 또는 100%를 제공하는 폴리펩티드를 지칭한다(예를 들어, 숙주 세포에 존재하는 경우). 예를 들어, 기능적 VP1 폴리펩티드는 안정적으로 접혀 데펜도파보바이러스 캡시드에 조립될 수 있다(예를 들어, 패키징 및/또는 분비에 적합함). 데펜도파보바이러스 캡시드 또는 입자와 관련하여 본원에서 사용되는 "기능적"은 다음 생성 특징 중 하나 이상을 포함하는 캡시드 또는 입자를 지칭한다: 원하는 페이로드를 포함하거나, 완전히 접혀 있고/거나 조립되거나, 표적을 감염시킬 수 있거나 적어도 임계 시간 동안 안정적으로 유지된다(예를 들어, 접혀 있고/거나 조립되고/거나 표적 세포를 감염시킬 수 있음).
핵산: 본원에서 사용되는 가장 넓은 의미로 용어 "핵산"은 올리고뉴클레오티드 사슬에 포함되어 있거나 포함될 수 있는 임의의 화합물 및/또는 물질을 의미한다. 일부 실시양태에서, 핵산은 포스포디에스테르 연결을 통해 올리고뉴클레오티드 사슬에 포함되어 있거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥에서 알 수 있듯이, 일부 실시양태에서 "핵산"은 개별 핵산 단량체(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭하며; 일부 실시양태에서, "핵산"은 개별 핵산 단량체를 포함하는 올리고뉴클레오티드 사슬 또는 많은 개별 핵산 단량체를 포함하는 더 긴 폴리뉴클레오티드 사슬을 지칭한다. 일부 실시양태에서, "핵산"은 RNA이거나 RNA를 포함한다; 일부 실시양태에서 "핵산"은 DNA이거나 DNA를 포함한다. 일부 실시양태에서, 핵산은 하나 이상의 천연 핵산 잔기이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산은 하나 이상의 핵산 유사체이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산은 하나 이상의 변형된 또는 합성 또는 비천연 발생 뉴클레오티드이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산 유사체는 포스포디에스테르 백본을 활용하지 않는다는 점에서 핵산과 다르다. 예를 들어, 일부 실시양태에서, 핵산은 당업계에 얼려져 있고 백본에 포스포디에스테르 결합 대신 펩티드 결합을 하는 하나 이상의 "펩티드 핵산"이거나 이를 포함하거나 이로 이루어지며, 이는 본 발명의 범위 내에 있는 것으로 간주한다. 대안적으로 또는 추가적으로, 일부 실시양태에서, 핵산은 포스포디에스테르 결합보다는 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 한다. 일부 실시양태에서, 핵산은 RNA 또는 단백질과 같은 기능적 유전자 산물을 암호화하는 뉴클레오티드 서열을 갖는다. 일부 실시양태에서, 핵산은 부분적으로 또는 전체적으로 단일 가닥이고; 일부 실시양태에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다.
변이체: 본원에서 사용되는 "변이체 캡시드 폴리펩티드"는 기준 서열(예를 들어, 서열번호 1)과 상이한 폴리펩티드를 지칭한다. 변이체는, 예를 들어, 돌연변이(예를 들어, 치환, 결실 또는 삽입)를 포함할 수 있다. 일부 실시양태에서, 변이체는 기준 서열과 약 또는 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하다. 일부 실시양태에서, 기준 서열은 서열번호 1을 포함하는 폴리펩티드이다.
캡시드 폴리펩티드 및 이를 암호화하는 핵산
본 개시내용은 부분적으로 야생형 서열과 비교하여 돌연변이(삽입, 결실 또는 치환)를 포함하는 변이체 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산에 관한 것이다. 일부 실시양태에서, 야생형 서열은 서열번호 1이다. 본 개시내용은 부분적으로 서열번호 1과 비교하여 하나 이상의 돌연변이를 갖는 서열번호 1을 포함하는 변이체 캡시드 폴리펩티드에 관한 것이다. 돌연변이는, 예를 들어, 야생형 서열과 비교하여 삽입, 결실 또는 치환일 수 있다. 일부 실시양태에서, 야생형 서열은 서열번호 1이다.
일부 실시양태에서, 핵산 분자는 표 2, 표 3 또는 표 4로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 2 및 표 3; 표 2 및 표 4, 또는 표 3 및 표 4로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 2 및 표 3으로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 2 및 표 4로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 3 및 표 4로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 표 2는 서열번호 1과 비교하여 잔기 1-36에 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 표 3은 서열번호 1과 비교하여 잔기 431-466에 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 표 4는 서열번호 1과 비교하여 잔기 552-617에 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 핵산 분자는 서열번호 1의 1-36 아미노산 영역 내의 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 서열번호 1의 431-466 아미노산 영역 내의 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1의 552-617 아미노산 영역 내에 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1의 1-36, 431-466 및 552-617 아미노산 영역 내의 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 3으로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 표 3으로부터 선택된 돌연변이는 삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 454 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산, 예를 들어, 4-7개 아미노산, 예를 들어, 7개 아미노산의 삽입으로서, 상기 삽입은 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하고; 표 3으로부터 선택된 돌연변이는 치환, 예를 들어, 서열번호 1과 비교하여 위치 445와 465 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 6-10개 잔기, 예를 들어, 적어도 7-10개 잔기, 예를 들어, 적어도 8-10개 잔기, 예를 들어, 적어도 9-10개 잔기, 예를 들어, 적어도 10개 잔기의 치환이고; 변이체는 T455G/L/Q, T456G, Q457T, S458Q, R459G/T로부터 선택된 적어도 3개의 돌연변이를 포함하고; 서열번호 1과 비교하여 위치 445-465 사이에 적어도 3개의 다른 돌연변이를 추가로 포함하고, 상기 돌연변이는 치환, 삽입 또는 결실이다. 일부 실시양태에서, 핵산 분자는 표 4로부터 선택된 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 표 4로부터 선택된 돌연변이는 삽입, 예를 들어, 서열번호 1과 비교하여 위치 583과 588 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산의 삽입으로서, 상기 삽입은 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하고; 표 4로부터 선택된 돌연변이는 치환, 예를 들어, 서열번호 1과 비교하여 위치 552와 588 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 3-9개 잔기, 예를 들어, 적어도 4-9개 잔기, 예를 들어, 적어도 5-9개 잔기, 예를 들어, 적어도 6-9개 잔기, 예를 들어, 적어도 7-9개 잔기, 예를 들어, 적어도 8-9개 잔기, 예를 들어, 적어도 9개 잔기의 치환이다. 일부 실시양태에서, 표 4로부터 선택된 돌연변이는 서열번호 1과 비교하여 위치 552와 566 사이의 돌연변이이고, 상기 돌연변이는 공통식 A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A(서열번호 132)(여기서 n은 서열번호 1에 제시된 야생형 잔기이다)를 포함하는 치환이거나; 상기 돌연변이는 공통식 A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A(서열번호 132)의 비야생형 아미노산 중 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개를 포함하는 치환을 포함하거나; 변이체는 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환을 포함하고, 상기 치환은 위치 557, 558, 559 중 임의의 것또는 이들의 임의의 조합에 류신을 도입한다.
일부 실시양태에서, 표 4로부터 선택된 돌연변이는 서열번호 1과 비교하여 위치 575와 588 사이의 돌연변이이고, 상기 돌연변이는 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)(여기서 n은 서열번호 1에 제시된 야생형 잔기이고, "del"은 결실이다)를 포함하는 치환이거나; 상기 돌연변이는 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)의 비야생형 아미노산 중 적어도 1-7개를 포함하는 치환을 포함하거나; 변이체는 서열번호 1과 비교하여 위치 578, 580 또는 581에서의 치환을 포함하고, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산이다.
일부 실시양태에서, 표 4로부터 선택된 돌연변이는 서열번호 1과 비교하여 위치 552와 588 사이의 돌연변이이고, 상기 돌연변이는 공통식 A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A(서열번호 132)(여기서 n은 서열번호 1에 제시된 야생형 잔기이다); 상기 공통의 1, 2, 3, 4, 5, 6 또는 7개 아미노산을 포함하는 위치 552와 566 사이의 치환이고; 변이체는 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환을 추가로 포함하고, 상기 치환은 위치 557, 558, 559 중 임의의 것 또는 이들의 임의의 조합에 류신을 도입하고; 상기 돌연변이는 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S(서열번호 133)(여기서 n은 서열번호 1에 기재된 야생형 잔기이고; del은 결실이다); 상기 공통의 1-6개 아미노산을 포함하는 위치 575와 588 사이의 치환이고; 변이체는 서열번호 1과 비교하여 위치 578, 580 또는 581에서의 치환을 추가로 포함하고, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산이다.
일부 실시양태에서, 표 4로부터 선택된 돌연변이는 서열번호 1과 비교하여 위치 584와 617 사이의 돌연변이이고, 상기 돌연변이는 다음을 포함한다:
삽입, 예를 들어, 서열번호 1과 비교하여 위치 584와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-5개 아미노산, 예를 들어, 5-8개 아미노산, 예를 들어, 7-10개 아미노산의 삽입으로서, 상기 삽입은 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드, 또는 F, I, P, G로부터 선택된 단일 잔기를 포함한다;
치환, 예를 들어, 서열번호 1과 비교하여 위치 584와 617 사이의 치환에 상응하는 적어도 1개 이상의 잔기, 예를 들어, 적어도 1-2개 잔기, 예를 들어, 적어도 2-7개 잔기, 예를 들어, 적어도 2-8개 잔기의 치환; 및 이들의 임의의 조합.
일부 실시양태에서, 삽입은 7-10개 아미노산을 포함하고 LALGETTRPA(서열번호 93)와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%이다.
일부 실시양태에서, 핵산 분자는 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33, 446, 449, 450, 451, 452, 454, 455, 456, 457, 458, 459, 460, 461, 464, 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597, 600 또는 이들의 임의의 조합에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이, 592와 593 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하고, 선택적으로 상기 돌연변이는 삽입, 결실 또는 치환을 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 3에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 6에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 11에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 12에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 14에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 15에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 19에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 21에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 23에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 24에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 25에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 29에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 31에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 33에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 446에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 450에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 451에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 452에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 454에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 455에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 456에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 457에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 458에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 460에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 461에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 464에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 552에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 554에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 555에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 556에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 557에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 558에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 559에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 561에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 566에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 575에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 578에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 580에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 581에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 586에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 587에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 588에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 589에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 590에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 591에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 593에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 594에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 597에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 600에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 446과 447 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 447과 448 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 448과 449 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449와 450 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 451과 452 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 453과 454 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 581과 582 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 583과 584 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 584와 585 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585와 586 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 586과 587 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 587과 588 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 588과 589 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 589와 590 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 590과 591 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 591과 592 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 592와 593 사이의 위치에서 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33 또는 이들의 임의의 조합에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하고, 상기 돌연변이는 결실 또는 치환을 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1에 따른 위치 446, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 464 또는 이들의 임의의 조합에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1에 따른 위치 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597, 600 또는 이들의 임의의 조합에서의 돌연변이, 위치 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이, 592와 593 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 14, 15, 19 및 24에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 3, 6, 11, 12, 21, 23, 25, 29, 31 및 33에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449, 450, 451, 455, 456, 457, 458 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449, 450, 452, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 457 및 458에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 446에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 451, 455, 456, 457, 458, 459 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 448에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 453에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 456, 457, 458, 459, 460 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 서열번호 1과 비교하여 위치 449, 450, 451, 454, 455, 456, 458, 459, 461 및 464에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 446, 448, 449, 451, 453, 455, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 447에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 581에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 584에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 555, 561, 566, 578, 580, 581 및 585에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 557 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 556, 558, 578 및 580에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 554, 556, 559, 561, 566, 581, 585, 586 및 587에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 552, 555, 556, 559, 561, 566, 578, 581 및 586에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 575 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 583에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585, 588, 589, 590, 591, 593, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 592에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 586에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 589에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 587에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 590에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585, 586, 587, 591, 594, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 591에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 588에서의 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589과 590 사이, 590과 591 사이, 591과 592 사이 또는 592와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-10개 아미노산, 예를 들어, 2-8개 아미노산, 예를 들어, 3-7개 아미노산, 예를 들어, 7개 아미노산의 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 446과 447 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 447과 448 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 448과 449 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449와 450 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 451과 452 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 453과 454 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 581과 582 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 583과 584 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 584와 585 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585와 586 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 586과 587 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 587과 588 사이의 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 588과 589 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 589와 590 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 590과 591 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 591과 592 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 592와 593 사이에 삽입을 포함하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 449, 450, 452, 455, 457, 458, 459에서의 돌연변이 및 위치 451과 452 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 585와 586에서의 돌연변이 및 위치 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 586과 587에서의 돌연변이 및 위치 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 587에서의 돌연변이 및 위치 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 T14L, L15V, I19A 및 K24H 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 A3V, Y6F, L11F, E12Q, Q21L, W23I, L25C, P29A, P31N 및 K33R 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N449Q, T450M, P451T, T455L, T456G, Q457T, S458Q 및 R459M 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N449Q, 잔기 451 결실, S452T, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 Q457F 및 S458C 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 446과 447 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은, 예를 들어, KCQEGMA(서열번호 95)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 KCQEGMA(서열번호 95)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 KCQEGMA(서열번호 95)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 KCQEGMA(서열번호 95)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 KCQEGMA(서열번호 95)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 KCQEGMA(서열번호 95)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 449와 450 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 LMVDRLG(서열번호 96)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LMVDRLG(서열번호 96)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LMVDRLG(서열번호 96)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LMVDRLG(서열번호 96)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LMVDRLG(서열번호 96)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LMVDRLG(서열번호 96)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 448과 449 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 HCQECPI(서열번호 97)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 HCQECPI(서열번호 97)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HCQECPI(서열번호 97)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HCQECPI(서열번호 97)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HCQECPI(서열번호 97)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HCQECPI(서열번호 97)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 453과 454 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 FSGLEN(서열번호 98)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 FSGLEN(서열번호 98)과의 동일성이 적어도 50%, 66.67%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FSGLEN(서열번호 98)과 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FSGLEN(서열번호 98)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FSGLEN(서열번호 98)의 적어도 3개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 위치 456, 457, 458, 459, 460 및 461의 잔기 결실에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N449I, T450N, P451G, 잔기 454 결실, T455Q, T456N, S458Q, R459T, Q461K 및 Q464V 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 S446A, 잔기 448 및 449 결실, P451Q, G453T, T455G, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N449Q, T450S, S452G, T455A, Q457F, S458M, R459D 및 잔기 451과 452 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 Y를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 447과 448 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 HETEFNF(서열번호 99)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 HETEFNF(서열번호 99)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HETEFNF(서열번호 99)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HETEFNF(서열번호 99)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HETEFNF(서열번호 99)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 HETEFNF(서열번호 99)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 581과 582 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 FALMEP(서열번호 100)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 FALMEP(서열번호 100)와의 동일성이 적어도 50%, 66.67%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FALMEP(서열번호 100)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FALMEP(서열번호 100)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FALMEP(서열번호 100)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 RAYNPD(서열번호 101)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 RAYNPD(서열번호 101)와의 동일성이 적어도 50%, 66.67%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RAYNPD(서열번호 101)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RAYNPD(서열번호 101)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RAYNPD(서열번호 101)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 585 결실 및 E555A, D461S, R566K, S578V, S580A 및 T581A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 V557L 및 S578D 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 K556N, M558L, S578I 및 S580A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 I554L, K556R, I559L, D561S, R566A, T581D, R585S, G586R 및 N587S 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 V552A, E555S, K556D, I559L, D561S, R566K, S578I, T581D 및 G586Q 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 Q575E 및 S578A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 583과 584 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 LNWTAE(서열번호 102)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LNWTAE(서열번호 102)와의 동일성이 적어도 50%, 66.67%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LNWTAE(서열번호 102)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LNWTAE(서열번호 102)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LNWTAE(서열번호 102)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 R585S, R588T, Q589N, A590P, A591I, A593G, T597S 및 V600A 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 R585N 및 G586A 돌연변이, 및 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은, 예를 들어, LAKEFTTR(서열번호 103)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)과의 동일성이 적어도 50%, 62.5%, 75%, 87.5% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)과 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAKEFTTR(서열번호 103)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은, 예를 들어, KEFTTR(서열번호 104)을 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 LHPLE(서열번호 105)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LHPLE(서열번호 105)와의 동일성이 적어도 60%, 80% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LHPLE(서열번호 105)와 비교하여 적어도 1개 또는 2개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LHPLE(서열번호 105)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 F를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 DQDFKNR(서열번호 106)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 DQDFKNR(서열번호 106)과의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 DQDFKNR(서열번호 106)과 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 DQDFKNR(서열번호 106)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 DQDFKNR(서열번호 106)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 DQDFKNR(서열번호 106)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 I를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 LAIEQTRPA(서열번호 107)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)와의 동일성이 적어도 55.5%, 66.6%, 77.7%, 88.8% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)와 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LAIEQTRPA(서열번호 107)의 적어도 8개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 예를 들어, IEQTRPA(서열번호 108)를 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 G586P 및 N587A 돌연변이, 및 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은, 예를 들어, RARLDETT(서열번호 109)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)와의 동일성이 적어도 50%, 62.5%, 75%, 87.5% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)와 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 RARLDETT(서열번호 109)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은, 예를 들어, RLDETT(서열번호 110)를 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N587A 돌연변이, 및 잔기 586과 587 사이의 삽입에 대응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은, 예를 들어, LALAEITRP(서열번호 111)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)와의 동일성이 적어도 55.5%, 66.6%, 77.7%, 88.8% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)와 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LALAEITRP(서열번호 111)의 적어도 8개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은, 예를 들어, LAEITRP(서열번호 112)를 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 N587A 돌연변이, 및 잔기 586과 587 사이의 삽입에 대응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은, 예를 들어, LANGEQTRP(서열번호 113)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)와의 동일성이 적어도 55.5%, 66.6%, 77.7%, 88.8% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)와 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 LANGEQTRP(서열번호 113)의 적어도 8개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은, 예를 들어, NGEQTRP(서열번호 114)를 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 ATDTKT(서열번호 115)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 ATDTKT(서열번호 115)와의 동일성이 적어도 50%, 66.67%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ATDTKT(서열번호 115)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ATDTKT(서열번호 115)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ATDTKT(서열번호 115)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 590과 591 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 P를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 APGETTRPA(서열번호 116)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)와의 동일성이 적어도 55.5%, 66.6%, 77.7%, 88.8% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)와 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 APGETTRPA(서열번호 116)의 적어도 8개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은, 예를 들어, GETTRP(서열번호 117)를 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 P를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 R585S, G586S, N587A, A591E, D594R, T597A 및 V600I 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 FHNEGKY(서열번호 118)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 FHNEGKY(서열번호 118)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FHNEGKY(서열번호 118)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FHNEGKY(서열번호 118)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FHNEGKY(서열번호 118)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 FHNEGKY(서열번호 118)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 591과 592 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 아미노산 G를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 588과 589 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 QPWEPDK(서열번호 119)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 QPWEPDK(서열번호 119)와의 동일성이 적어도 57.1%, 71.4%, 85.7% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 QPWEPDK(서열번호 119)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 QPWEPDK(서열번호 119)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 QPWEPDK(서열번호 119)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 QPWEPDK(서열번호 119)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 ALALSTTN(서열번호 120)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)과의 동일성이 적어도 50%, 62.5%, 75%, 87.5% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)과 비교하여 적어도 1, 2, 3 또는 4개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)의 적어도 6개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 ALALSTTN(서열번호 120)의 적어도 7개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 예를 들어, ALSTTN(서열번호 121)을 포함하고, 예를 들어, 이로 이루어진다.
일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하며, 상기 삽입은 PWGTAG(서열번호 122)의 폴리펩티드를 포함하고, 예를 들어, 상기 폴리펩티드로 이루어진다. 일부 실시양태에서, 삽입은 PWGTAG(서열번호 122)와의 동일성이 적어도 50%, 66.7%, 83.3% 또는 100%인 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 PWGTAG(서열번호 122)와 비교하여 적어도 1, 2 또는 3개의 돌연변이를 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 PWGTAG(서열번호 122)의 적어도 4개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 삽입은 PWGTAG(서열번호 122)의 적어도 5개 아미노산의 단편을 포함하는 폴리펩티드를 포함한다.
일부 실시양태에서, 핵산 분자는 본원에 제공된 바와 같은 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 본원에 제공된 캡시드 폴리펩티드와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 본원에 제공된 캡시드 폴리펩티드와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 캡시드 폴리펩티드를 포함하는 캡시드 폴리펩티드가 제공된다.
일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 46의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 2의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 3의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 4의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 5의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 6의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 7의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 8의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 9의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 10의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 11의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 12의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 13의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 14의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 15의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 16의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 17의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 18의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 19의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 20의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 21의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 22의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 23의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 24의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 25의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 26의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 27의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 28의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 29의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 30의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 31의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 32의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 33의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 34의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 35의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 36의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 37의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 38의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 39의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 40의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 41의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 42의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 43의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 44의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 45의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 46의 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90 또는 91의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 47의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 48의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 49의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 50의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 51의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 52의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 53의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 54의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 55의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 56의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 57의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 58의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 59의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 60의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 61의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 62의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 63의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 64의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 65의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 66의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 67의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 68의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 69의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 70의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 71의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 72의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 73의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 74의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 75의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 76의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 77의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 78의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 79의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 80의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 81의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 82의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 83의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 84의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 85의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 86의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 87의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 88의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 89의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 90의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 46의 서열을 암호화하는 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90 또는 91의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 2의 서열을 암호화하는 서열번호 47의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 3의 서열을 암호화하는 서열번호 48의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 4의 서열을 암호화하는 서열번호 49의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 5의 서열을 암호화하는 서열번호 50의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 6의 서열을 암호화하는 서열번호 51의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 7의 서열을 암호화하는 서열번호 52의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 8의 서열을 암호화하는 서열번호 53의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 9의 서열을 암호화하는 서열번호 54의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 10의 서열을 암호화하는 서열번호 55의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 11의 서열을 암호화하는 서열번호 56의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 12의 서열을 암호화하는 서열번호 57의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 13의 서열을 암호화하는 서열번호 58의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 14의 서열을 암호화하는 서열번호 59의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 15의 서열을 암호화하는 서열번호 60의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 16의 서열을 암호화하는 서열번호 61의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 17의 서열을 암호화하는 서열번호 62의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 18의 서열을 암호화하는 서열번호 63의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 19의 서열을 암호화하는 서열번호 64의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 20의 서열을 암호화하는 서열번호 65의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 21의 서열을 암호화하는 서열번호 66의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 22의 서열을 암호화하는 서열번호 67의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 23의 서열을 암호화하는 서열번호 68의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 24의 서열을 암호화하는 서열번호 69의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 25의 서열을 암호화하는 서열번호 70의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 26의 서열을 암호화하는 서열번호 71의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 27의 서열을 암호화하는 서열번호 72의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 28의 서열을 암호화하는 서열번호 73의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 29의 서열을 암호화하는 서열번호 74의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 30의 서열을 암호화하는 서열번호 75의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 31의 서열을 암호화하는 서열번호 76의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 32의 서열을 암호화하는 서열번호 77의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 33의 서열을 암호화하는 서열번호 78의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 34의 서열을 암호화하는 서열번호 79의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 35의 서열을 암호화하는 서열번호 80의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 36의 서열을 암호화하는 서열번호 81의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 37의 서열을 암호화하는 서열번호 82의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 38의 서열을 암호화하는 서열번호 83의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 39의 서열을 암호화하는 서열번호 84의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 40의 서열을 암호화하는 서열번호 85의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 41의 서열을 암호화하는 서열번호 86의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 42의 서열을 암호화하는 서열번호 87의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 43의 서열을 암호화하는 서열번호 88의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 44의 서열을 암호화하는 서열번호 89의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 45의 서열을 암호화하는 서열번호 90의 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 46의 서열을 암호화하는 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90 또는 91의 뉴클레오티드 서열에 의해 암호화되는 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 46의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 47의 뉴클레오티드 서열에 의해 암호화되는 서열번호 2의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 48의 뉴클레오티드 서열에 의해 암호화되는 서열번호 3의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 49의 뉴클레오티드 서열에 의해 암호화되는 서열번호 4의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 50의 뉴클레오티드 서열에 의해 암호화되는 서열번호 5의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 51의 뉴클레오티드 서열에 의해 암호화되는 서열번호 6의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 52의 뉴클레오티드 서열에 의해 암호화되는 서열번호 7의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 53의 뉴클레오티드 서열에 의해 암호화되는 서열번호 8의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 54의 뉴클레오티드 서열에 의해 암호화되는 서열번호 9의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 55의 뉴클레오티드 서열에 의해 암호화되는 서열번호 10의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 56의 뉴클레오티드 서열에 의해 암호화되는 서열번호 11의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 57의 뉴클레오티드 서열에 의해 암호화되는 서열번호 12의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 58의 뉴클레오티드 서열에 의해 암호화되는 서열번호 13의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 59의 뉴클레오티드 서열에 의해 암호화되는 서열번호 14의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 60의 뉴클레오티드 서열에 의해 암호화되는 서열번호 15의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 61의 뉴클레오티드 서열에 의해 암호화되는 서열번호 16의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 62의 뉴클레오티드 서열에 의해 암호화되는 서열번호 17의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 63의 뉴클레오티드 서열에 의해 암호화되는 서열번호 18의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 64의 뉴클레오티드 서열에 의해 암호화되는 서열번호 19의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 65의 뉴클레오티드 서열에 의해 암호화되는 서열번호 20의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 66의 뉴클레오티드 서열에 의해 암호화되는 서열번호 21의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 67의 뉴클레오티드 서열에 의해 암호화되는 서열번호 22의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 68의 뉴클레오티드 서열에 의해 암호화되는 서열번호 23의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 69의 뉴클레오티드 서열에 의해 암호화되는 서열번호 24의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 70의 뉴클레오티드 서열에 의해 암호화되는 서열번호 25의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 71의 뉴클레오티드 서열에 의해 암호화되는 서열번호 26의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 72의 뉴클레오티드 서열에 의해 암호화되는 서열번호 27의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 73의 뉴클레오티드 서열에 의해 암호화되는 서열번호 28의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 74의 뉴클레오티드 서열에 의해 암호화되는 서열번호 29의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 75의 뉴클레오티드 서열에 의해 암호화되는 서열번호 30의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 76의 뉴클레오티드 서열에 의해 암호화되는 서열번호 31의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 77의 뉴클레오티드 서열에 의해 암호화되는 서열번호 32의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 78의 뉴클레오티드 서열에 의해 암호화되는 서열번호 33의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 79의 뉴클레오티드 서열에 의해 암호화되는 서열번호 34의 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 78의 뉴클레오티드 서열에 의해 암호화되는 서열번호 33의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 79의 뉴클레오티드 서열에 의해 암호화되는 서열번호 34의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 80의 뉴클레오티드 서열에 의해 암호화되는 서열번호 35의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 81의 뉴클레오티드 서열에 의해 암호화되는 서열번호 36의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 82의 뉴클레오티드 서열에 의해 암호화되는 서열번호 37의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 83의 뉴클레오티드 서열에 의해 암호화되는 서열번호 38의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 84의 뉴클레오티드 서열에 의해 암호화되는 서열번호 39의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 85의 뉴클레오티드 서열에 의해 암호화되는 서열번호 40의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 86의 뉴클레오티드 서열에 의해 암호화되는 서열번호 41의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 87의 뉴클레오티드 서열에 의해 암호화되는 서열번호 42의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 88의 뉴클레오티드 서열에 의해 암호화되는 서열번호 43의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 89의 뉴클레오티드 서열에 의해 암호화되는 서열번호 44의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 90의 뉴클레오티드 서열에 의해 암호화되는 서열번호 45의 서열을 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드 또는 동일성(%)을 위한 기준 폴리펩티드는 서열번호 91의 뉴클레오티드 서열에 의해 암호화되는 서열번호 46의 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 VAR-1 내지 VAR-45 중 어느 하나와 관련된 모든 돌연변이 차이(예를 들어, 표 1의 7열에 표시된 바와 같음)를 포함하고 서열번호 1과 관련하여 30개 이하, 20개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 2개 이하 또는 1개 이하의 추가 돌연변이를 추가로 포함하는 서열을 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 VP1 캡시드 폴리펩티드이다. 실시양태에서, 캡시드 폴리펩티드는 VP2 캡시드 폴리펩티드이다. 실시양태에서, 캡시드 폴리펩티드는 VP3 캡시드 폴리펩티드이다. 기준 서열인 서열번호 1과 관련하여, VP1 캡시드 폴리펩티드는 서열번호 1의 아미노산 1-724를 포함한다. 기준 서열인 서열번호 1과 관련하여, VP2 캡시드 폴리펩티드는 서열번호 1의 아미노산 138-724를 포함한다. 기준 서열인 서열번호 1과 관련하여, VP3 캡시드 폴리펩티드는 서열번호 1의 아미노산 203-724를 포함한다.
표 1은 상기 비제한적인 예시적 변이체의 안구 형질도입 특성 및 생성 특성에 관한 변이체 캡시드를 포함하는 핵산을 포함하는 예시적 변이체 데펜도파보바이러스 입자에 관한 정보를 나열한다. 캡시드 폴리펩티드 및 이를 암호화하는 핵산 분자의 예시적인 서열이 표 2, 표 3 및 표 4에 제공되어 있다.
[표 1] 변이체 캡시드 폴리펩티드를 포함하는 예시적인 변이체 데펜도파보바이러스(예를 들어, AVV) 입자의 형질도입 및 바이러스 생성. 황반 및 망막 형질도입은 IVT 주사 후 측정된다; 섬유주 형질도입은 IC 주사 후 측정된다. 치환은 n###N으로 표시되며, 여기서 "N"은 최종 아미노산이고, "n"은 기준 아미노산이고 "###"은 서열번호 1의 기준 아미노산 위치이다; 결실은 n###-로 표시되며, 여기서 "-"는 기준 서열인 서열번호 1의 "###" 위치에서 "n"의 결실을 나타낸다; 삽입은 ###_Naa_###_(n)y로 표시되며, 여기서 "###"은 삽입이 발생하는 기준 서열인 서열번호 1의 아미노산 위치이고, "Naa"는 삽입("N" 아미노산 포함) 길이를 지칭하고 "(n)y"는 삽입 순서를 제공한다. 각각의 개별 돌연변이 차이(예를 들어, 행 내에서 7열의 따옴표('') 안의 각 돌연변이) 및 이러한 개별 돌연변이 차이의 조합은 때때로 본원에서 "VAR-X와 연관된 돌연변이"로 지칭되며, 여기서 VAR-X는 "명칭 열"에 나열된 변이체 식별자이다.
[표 1]
[표 2]
[표 3]
[표 4]
일부 실시양태에서, 핵산 분자는 표 2에 제공된 바와 같은 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 표 3에 제공된 바와 같은 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 핵산 분자는 표 4에 제공된 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 2의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 3의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 4의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 5의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 6의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 2의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 7의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 8의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 9의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 10의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 11의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 12의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 13의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 14의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 15의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 16의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 17의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 18의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 19의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 20의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 21의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 22의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 23의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 24의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 25의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 26의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 27의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 28의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 29의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 30의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 31의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 핵산 분자는 서열번호 32의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 33의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 34의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 35의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 36의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 핵산 분자는 서열번호 37의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 38의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 39의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 40의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 41의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 42의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 43의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 44의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 45의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 핵산 분자는 서열번호 46의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 캡시드 폴리펩티드를 암호화한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 VAR-1, VAR-2, VAR-3, VAR-4, VAR-5, VAR-6, VAR-7, VAR-8, VAR-9, VAR-10, VAR-11, VAR-12, VAR-13, VAR-14, VAR-15, VAR-16, VAR-17, VAR-18, VAR-19, VAR-20, VAR-21, VAR-22, VAR-23, VAR-24, VAR-25, VAR-26, VAR-27, VAR-28, VAR-29, VAR-30, VAR-31, VAR-32, VAR-33, VAR-34, VAR-35, VAR-36, VAR-37, VAR-38, VAR-39, VAR-40, VAR-41, VAR-42, VAR-43, VAR-44 또는 VAR-45의 표 1의 돌연변이 차이 열에 나타낸 바와 같은 돌연변이(삽입, 결실 또는 치환)를 적어도 또는 약 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 기준 캡시드 서열은 돌연변이(삽입, 결실 또는 치환)를 적어도, 약 또는 정확히 80% 포함한다. 일부 실시양태에서, 기준 캡시드 서열은 돌연변이(삽입, 결실 또는 치환)를 적어도, 약 또는 정확히 85% 포함한다. 일부 실시양태에서, 기준 캡시드 서열은 돌연변이(삽입, 결실 또는 치환)를 적어도, 약 또는 정확히 90% 포함한다. 일부 실시양태에서, 기준 캡시드 서열은 돌연변이(삽입, 결실 또는 치환)를 적어도, 약 또는 정확히 95% 포함한다. 일부 실시양태에서, 기준 캡시드 서열은 돌연변이(삽입, 결실 또는 치환)를 100% 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 다음과 같은 돌연변이 그룹(이러한 돌연변이 그룹에 대한 용어는 위 표 1의 범례에 제공됨) 중 하나를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다:
['T14L', 'L15V', 'I19A', 'K24H'];
['A3V', 'Y6F', 'L11F', 'E12Q', 'Q21L', 'W23I', 'L25C', 'P29A', 'P31N', 'K33R'];
['N449Q', 'T450M', 'P451T', 'T455L', 'T456G', 'Q457T', 'S458Q', 'R459M'];
['N449Q', 'P451-', 'S452T', 'T456G', 'Q457T', 'R459G'];
['Q457F', 'S458C'];
['446_7aa_447_KCQEGMA'];
['449_7aa_450_LMVDRLG'];
['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A'];
['448_7aa_449_HCQECPI'];
['453_6aa_454_FSGLEN'];
['T456-', 'Q457-', 'S458-', 'R459-', 'L460-', 'Q461-'];
['N449I', 'T450N', 'P451G', 'T454-', 'T455Q', 'T456N', 'S458Q', 'R459T', 'Q461K', 'Q464V'];
['S446A', 'T448-', 'N449-', 'P451Q', 'G453T', 'T455G', 'T456G', 'Q457T', 'R459G'];
['N449Q', 'T450S', '451_1aa_452_Y', 'S452G', 'T455A', 'Q457F', 'S458M', 'R459D'];
['447_7aa_448_HETEFNF'];
['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A'];
['581_6aa_582_FALMEP'];
['584_6aa_585_RAYNPD'];
['E555A', 'D561S', 'R566K', 'S578V', 'S580A', 'T581A', 'R585-'];
['V557L', 'S578D'];
['K556N', 'M558L', 'S578I', 'S580A'];
['I554L', 'K556R', 'I559L', 'D561S', 'R566A', 'T581D', 'R585S', 'G586R', 'N587S'];
['V552A', 'E555S', 'K556D', 'I559L', 'D561S', 'R566K', 'S578I', 'T581D', 'G586Q'];
['Q575E', 'S578A'];
['583_6aa_584_LNWTAE'];
['R585S', 'R588T', 'Q589N', 'A590P', 'A591I', 'A593G', 'T597S', 'V600A'];
['584_8aa_585_LAKEFTTR', 'R585N', 'G586A'];
['592_5aa_593_LHPLE'];
['585_1aa_586_F'];
['586_7aa_587_DQDFKNR'];
['589_1aa_590_I'];
['587_9aa_588_LAIEQTRPA'];
['584_8aa_585_RARLDETT', 'G586P', 'N587A'];
['586_9aa_587_LALAEITRP', 'N587A'];
['586_9aa_587_LANGEQTRP', 'N587A'];
['586_6aa_587_ATDTKT'];
['590_1aa_591_P'];
['587_9aa_588_APGETTRPA'];
['589_1aa_590_P'];
['R585S', 'G586S', 'N587A', 'A591E', 'D594R', 'T597A', 'V600I'];
['586_7aa_587_FHNEGKY'];
['591_1aa_592_G'];
['588_7aa_589_QPWEPDK'];
['592_8aa_593_ALALSTTN']; 또는
['585_6aa_586_PWGTAG'].
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['A3V', 'Y6F', 'L11F', 'E12Q', 'Q21L', 'W23I', 'L25C', 'P29A', 'P31N', 'K33R']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['A3V', 'Y6F', 'L11F', 'E12Q', 'Q21L', 'W23I', 'L25C', 'P29A', 'P31N', 'K33R']의 돌연변이 중 적어도 8개, 9개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['N449Q', 'P451-', 'S452T', 'T456G', 'Q457T', 'R459G']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['N449Q', 'P451-', 'S452T', 'T456G', 'Q457T', 'R459G']의 돌연변이 중 적어도 5개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['446_7aa_447_KCQEGMA']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['449_7aa_450_LMVDRLG']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A']의 돌연변이 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['448_7aa_449_HCQECPI']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['453_6aa_454_FSGLEN']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['T456-', 'Q457-', 'S458-', 'R459-', 'L460-', 'Q461-']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['T456-', 'Q457-', 'S458-', 'R459-', 'L460-', 'Q461-']의 돌연변이 중 적어도 5개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['N449I', 'T450N', 'P451G', 'T454-', 'T455Q', 'T456N', 'S458Q', 'R459T', 'Q461K', 'Q464V']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['N449I', 'T450N', 'P451G', 'T454-', 'T455Q', 'T456N', 'S458Q', 'R459T', 'Q461K', 'Q464V']의 돌연변이 중 적어도 8개, 9개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['S446A', 'T448-', 'N449-', 'P451Q', 'G453T', 'T455G', 'T456G', 'Q457T', 'R459G']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['S446A', 'T448-', 'N449-', 'P451Q', 'G453T', 'T455G', 'T456G', 'Q457T', 'R459G']의 돌연변이 중 적어도 8개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['N449Q', 'T450S', '451_1aa_452_Y', 'S452G', 'T455A', 'Q457F', 'S458M', 'R459D']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['N449Q', 'T450S', '451_1aa_452_Y', 'S452G', 'T455A', 'Q457F', 'S458M', 'R459D']의 돌연변이 중 적어도 7개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['R585S', 'G586S', 'N587A', 'A591E', 'D594R', 'T597A', 'V600I']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['R585S', 'G586S', 'N587A', 'A591E', 'D594R', 'T597A', 'V600I']의 돌연변이 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['P451T', 'T455G', 'T456G', 'Q457T', 'S458Q', 'R459T', 'Q461A']의 돌연변이 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['E555A', 'D561S', 'R566K', 'S578V', 'S580A', 'T581A', 'R585-']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['E555A', 'D561S', 'R566K', 'S578V', 'S580A', 'T581A', 'R585-']의 돌연변이 중 적어도 6개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['I554L', 'K556R', 'I559L', 'D561S', 'R566A', 'T581D', 'R585S', 'G586R', 'N587S']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['I554L', 'K556R', 'I559L', 'D561S', 'R566A', 'T581D', 'R585S', 'G586R', 'N587S']의 돌연변이 중 적어도 8개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['V552A', 'E555S', 'K556D', 'I559L', 'D561S', 'R566K', 'S578I', 'T581D', 'G586Q']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['V552A', 'E555S', 'K556D', 'I559L', 'D561S', 'R566K', 'S578I', 'T581D', 'G586Q']의 돌연변이 중 적어도 8개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['R585S', 'R588T', 'Q589N', 'A590P', 'A591I', 'A593G', 'T597S', 'V600A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['R585S', 'R588T', 'Q589N', 'A590P', 'A591I', 'A593G', 'T597S', 'V600A']의 돌연변이 중 적어도 7개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['447_7aa_448_HETEFNF']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['581_6aa_582_FALMEP']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['584_6aa_585_RAYNPD']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['583_6aa_584_LNWTAE']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['592_5aa_593_LHPLE']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 5개 아미노산 삽입의 아미노산 잔기 중 적어도 4개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['586_7aa_587_DQDFKNR']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['587_9aa_588_LAIEQTRPA']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 9개 아미노산 삽입의 아미노산 잔기 중 적어도 8개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['586_6aa_587_ATDTKT']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['587_9aa_588_APGETTRPA']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 9개 아미노산 삽입의 아미노산 잔기 중 적어도 8개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['586_7aa_587_FHNEGKY']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['588_7aa_589_QPWEPDK']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 7개 아미노산 삽입의 아미노산 잔기 중 적어도 6개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['592_8aa_593_ALALSTTN']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 8개 아미노산 삽입의 아미노산 잔기 중 적어도 7개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['585_6aa_586_PWGTAG']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 6개 아미노산 삽입의 아미노산 잔기 중 적어도 5개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['584_8aa_585_LAKEFTTR', 'R585N', 'G586A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['584_8aa_585_LAKEFTTR', 'R585N', 'G586A']에 언급된 삽입 및 점 돌연변이의 아미노산 잔기 중 적어도 8개, 9개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['584_8aa_585_RARLDETT', 'G586P', 'N587A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['584_8aa_585_RARLDETT', 'G586P', 'N587A']에 언급된 삽입 및 점 돌연변이의 아미노산 잔기 중 적어도 8개, 9개 또는 모두를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['586_9aa_587_LALAEITRP', 'N587A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['586_9aa_587_LALAEITRP', 'N587A']에 언급된 삽입 및 점 돌연변이의 아미노산 잔기 중 적어도 8개, 9개 또는 전부를 포함한다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 같은 기준 캡시드 서열 및 ['586_9aa_587_LANGEQTRP', 'N587A']를 적어도 또는 약 또는 정확히 80%, 85%, 90% 또는 95% 또는 100% 포함한다. 일부 실시양태에서, 캡시드 폴리펩티드는 ['586_9aa_587_LANGEQTRP', 'N587A']에 언급된 삽입 및 점 돌연변이의 아미노산 잔기 중 적어도 8개, 9개 또는 전부를 포함한다.
변이체 캡시드(상응하는 위치)
본원에 기술된 캡시드 폴리펩티드 서열에 대한 돌연변이는 기준 서열, 예를 들어, 서열번호 1 내의 위치 및/또는 위치에서의 아미노산과 관련하여 기술된다. 따라서, 일부 실시양태에서, 본원에 기술된 캡시드 폴리펩티드는 기준 서열, 예를 들어, 서열번호 1의 변이체 캡시드 폴리펩티드로서, 예를 들어, 기준 캡시드 폴리펩티드 서열(예를 들어, 기준 캡시드 폴리펩티드 VP1, VP2 및/또는 VP3 서열), 예를 들어, 서열번호 1(또는 그 안에 포함된 VP2 또는 VP3 서열)과의 동일성이 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%이고 본원에 기술된 하나 이상의 돌연변이를 추가로 포함하는 캡시드 폴리펩티드를 포함한다.
당업자는 기준 서열 내의 각각의 아미노산 위치가 혈청형이 상이한 데펜도파보바이러스로부터 유래된 캡시드 폴리펩티드와 같은 다른 캡시드 폴리펩티드의 서열 내의 위치에 상응한다는 것을 이론에 구애됨이 없이 이해할 것이다. 이러한 상응하는 위치는 당업계에 공지된 서열 정렬 도구를 사용하여 확인한다. 특히 바람직한 서열 정렬 도구는 Clustal Omega이다(Sievers F., 등, Mol. Syst. Biol. 7:359, 2011, DOI: 10.1038/msb.2011.75, 전체 내용이 본원에 참조로 포함됨). 예시적인 기준 캡시드 폴리펩티드의 정렬이 도 1a-1c에 나와 있다. 따라서, 일부 실시양태에서, 본 발명의 변이체 캡시드 폴리펩티드는 상이한 기준 캡시드 폴리펩티드와 관련하여 본원에 기술된 돌연변이의 위치에 상응하는 위치에서 이러한 기준 캡시드 폴리펩티드에 본원에 기술된 하나 이상의 돌연변이를 포함하는 기준 캡시드 폴리펩티드의 변이체를 포함한다. 따라서, 예를 들어, 서열번호 1에 대해 XnnnY로 기술된 돌연변이(여기서 X는 서열번호 1의 위치 nnn에 존재하는 아미노산이고 Y는, 예를 들어, 본원에 기술된 해당 위치의 아미노산 돌연변이이다), 본 개시내용은 서열번호 1(또는 본원에 포함된 VP2 또는 VP3 서열) 이외의 기준 캡시드 폴리펩티드 서열(예를 들어, 기준 캡시드 폴리펩티드 VP1, VP2 및/또는 VP3 서열)과의 동일성이 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%이고 서열번호 1의 위치 nnn에 상응하는 위치에 개시된 돌연변이를 추가로 포함하는(예를 들어, 서열번호 1의 위치 nnn에 상응하는 새로운 변이체 캡시드 폴리펩티드 서열의 위치에 Y를 포함하는) 변이체 캡시드 폴리펩티드를 제공한다. 상술한 바와 같이, 이러한 상응하는 위치는, 예를 들어, 상술한 클러스탈 오메가 도구(clustal omega tool)와 같은 서열 정렬 도구를 사용하여 결정한다. 예시적인 공지된 AAV 혈청형의 상응하는 아미노산 위치의 예가 도 2a-c에 제공되어 있다. 일부 실시양태에서, 변이체는 "변이체 AAV2 캡시드 폴리펩티드"로 지칭될 수 있는 AAV2 캡시드 폴리펩티드의 변이체이다.
따라서, 실시양태에서, 본 개시내용은 서열번호 1 이외의 기준 서열, 예를 들어, 본원에 기술된 바와 같은 서열번호 1 이외의 기준 서열의 변이체인 캡시드 폴리펩티드 서열을 제공하며, 이는 본원에 기술된 돌연변이에 상응하는 하나 이상의 돌연변이를 포함한다. 실시양태에서, 이러한 변이체는 본원에 제공된 바와 같은 VAR-1 내지 VAR-53 중 어느 하나와 연관된 모든 돌연변이에 상응하는 돌연변이를 포함한다.
본원에 사용된 바와 같이, 아미노산 또는 핵산 서열과 같은 서열 내 위치와 관련하여 사용된 용어 "~에 상응하다"는 VP1, VP2 및 VP3 폴리펩티드를 포함하는 캡시드 폴리펩티드의 전장 서열, 또는 이를 암호화하는 핵산 분자와 같은 전체 캡시드 폴리펩티드 또는 폴리뉴클레오티드 서열과 관련하여 사용될 수 있다. 일부 실시양태에서, 용어 "~에 상응하다"는 캡시드 폴리펩티드의 영역 또는 도메인과 관련하여 사용될 수 있다. 예를 들어, 기준 캡시드 폴리펩티드의 VP1 섹션의 위치에 상응하는 위치는 변이체 캡시드 폴리펩티드의 VP1 부분에 상응할 수 있다. 따라서, 위치가 다른 위치에 상응하는지를 결정하기 위해 2개의 서열을 정렬할 때, 전장 폴리펩티드가 사용될 수 있거나, 위치가 특정 위치에 상응하는지를 결정하기 위해 도메인(영역)이 사용될 수 있다. 일부 실시양태에서, 해당 영역은 VP1 폴리펩티드이다. 일부 실시양태에서, 해당 영역은 VP2 폴리펩티드이다. 일부 실시양태에서, 해당 영역은 VP3 폴리펩티드이다. 일부 실시양태에서, 기준 폴리펩티드가 AAV의 특정 혈청형의 야생형 서열(예를 들어, 전장 또는 영역)인 경우, 변이체 폴리펩티드는 기준 서열(예를 들어, 전장 또는 영역)과 비교하여 이러한 상응하는 위치에서 돌연변이가 이루어진 동일한 혈청형일 수 있다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드는 기준 서열과 비교하여 상이한 혈청형이다.
본원에 기술된 변이체 캡시드 폴리펩티드는 선택적으로 당업계에 공지된 기준 캡시드 혈청형의 변이체이다. 이러한 기준 AAV 혈청형의 비제한적인 예는 AAV1, AAVrh10, AAV-DJ, AAV-DJ8, AAV5, AAVPHP.B (PHP.B), AAVPHP.A (PHP.A), AAVG2B-26, AAVG2B-13, AAVTH1.1-32, AAVTH1.1-35, AAVPHP.B2 (PHP.B2), AAVPHP.B3 (PHP.B3), AAVPHP.N/PHP.B-DGT, AAVPHP.B-EST, AAVPHP.B-GGT, AAVPHP.B-ATP, AAVPHP.B-ATT-T, AAVPHP.B-DGT-T, AAVPHP.B-GGT-T, AAVPHP.B-SGS, AAVPHP.B-AQP, AAVPHP.B-QQP, AAVPHP.B-SNP(3), AAVPHP.B-SNP, AAVPHP.B-QGT, AAVPHP.B-NQT, AAVPHP.B-EGS, AAVPHP.B-SGN, AAVPHP.B-EGT, AAVPHP.B-DST, AAVPHP.B-DST, AAVPHP.B-STP, AAVPHP.B-PQP, AAVPHP.B-SQP, AAVPHP.B-QLP, AAVPHP.B-TMP, AAVPHP.B-TTP, AAVPHP.S/G2A12, AAVG2A15/G2A3 (G2A3), AAVG2B4 (G2B4), AAVG2B5 (G2B5), PHP.S, AAV2, AAV2G9, AAV3, AAV3a, AAV3b, AAV3-3, AAV4, AAV4-4, AAV6, AAV6.1, AAV6.2, AAV6.1.2, AAV7, AAV7.2, AAV8, AAV9.11, AAV9.13, AAV9, AAV9 K449R (또는 K449R AAV9), AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84, AAV9.9, AAV10, AAV11, AAV12, AAV16.3, AAV24.1, AAV27.3, AAV42.12, AAV42-1b, AAV42-2, AAV42-3a, AAV42-3b, AAV42-4, AAV42-5a, AAV42-5b, AAV42-6b, AAV42-8, AAV42-10, AAV42-11, AAV42-12, AAV42-13, AAV42-15, AAV42-aa, AAV43-1, AAV43-12, AAV43-20, AAV43-21, AAV43-23, AAV43-25, AAV43-5, AAV44.1, AAV44.2, AAV44.5, AAV223.1, AAV223.2, AAV223.4, AAV223.5, AAV223.6, AAV223.7, AAV1-7/rh.48, AAV1-8/rh.49, AAV2-15/rh.62, AAV2-3/rh.61, AAV2-4/rh.50, AAV2-5/rh.51, AAV3.1/hu.6, AAV3.1/hu.9, AAV3-9/rh.52, AAV3-11/rh.53, AAV4-8/r11.64, AAV4-9/rh.54, AAV4-19/rh.55, AAV5-3/rh.57, AAV5-22/rh.58, AAV7.3/hu.7, AAV16.8/hu.10, AAV16.12/hu.11, AAV29.3/bb.1, AAV29.5/bb.2, AAV106.1/hu.37, AAV114.3/hu.40, AAV127.2/hu.41, AAV127.5/hu.42, AAV128.3/hu.44, AAV130.4/hu.48, AAV145.1/hu.53, AAV145.5/hu.54, AAV145.6/hu.55, AAV161.10/hu.60, AAV161.6/hu.61, AAV33.12/hu.17, AAV33.4/hu.15, AAV33.8/hu.16, AAV52/hu.19, AAV52.1/hu.20, AAV58.2/hu.25, AAVA3.3, AAVA3.4, AAVA3.5, AAVA3.7, AAVC1, AAVC2, AAVC5, AAVF3, AAVF5, AAVH2, AAVrh.72, AAVhu.8, AAVrh.68, AAVrh.70, AAVpi.1, AAVpi.3, AAVpi.2, AAVrh.60, AAVrh.44, AAVrh.65, AAVrh.55, AAVrh.47, AAVrh.69, AAVrh.45, AAVrh.59, AAVhu.12, AAVH6, AAVH-1/hu.1, AAVH-5/hu.3, AAVLG-10/rh.40, AAVLG-4/rh.38, AAVLG-9/hu.39, AAVN721-8/rh.43, AAVCh.5, AAVCh.5R1, AAVcy.2, AAVcy.3, AAVcy.4, AAVcy.5, AAVCy.5R1, AAVCy.5R2, AAVCy.5R3, AAVCy.5R4, AAVcy.6, AAVhu.1, AAVhu.2, AAVhu.3, AAVhu.4, AAVhu.5, AAVhu.6, AAVhu.7, AAVhu.9, AAVhu.10, AAVhu.11, AAVhu.13, AAVhu.15, AAVhu.16, AAVhu.17, AAVhu.18, AAVhu.20, AAVhu.21, AAVhu.22, AAVhu.23.2, AAVhu.24, AAVhu.25, AAVhu.27, AAVhu.28, AAVhu.29, AAVhu.29R, AAVhu.31, AAVhu.32, AAVhu.34, AAVhu.35, AAVhu.37, AAVhu.39, AAVhu.40, AAVhu.41, AAVhu.42, AAVhu.43, AAVhu.44, AAVhu.44R1, AAVhu.44R2, AAVhu.44R3, AAVhu.45, AAVhu.46, AAVhu.47, AAVhu.48, AAVhu.48R1, AAVhu.48R2, AAVhu.48R3, AAVhu.49, AAVhu.51, AAVhu.52, AAVhu.54, AAVhu.55, AAVhu.56, AAVhu.57, AAVhu.58, AAVhu.60, AAVhu.61, AAVhu.63, AAVhu.64, AAVhu.66, AAVhu.67, AAVhu.14/9, AAVhu.t 19, AAVrh.2, AAVrh.2R, AAVrh.8, AAVrh.8R, AAVrh.10, AAVrh.12, AAVrh.13, AAVrh.13R, AAVrh.14, AAVrh.17, AAVrh.18, AAVrh.19, AAVrh.20, AAVrh.21, AAVrh.22, AAVrh.23, AAVrh.24, AAVrh.25, AAVrh.31, AAVrh.32, AAVrh.33, AAVrh.34, AAVrh.35, AAVrh.36, AAVrh.37, AAVrh.37R2, AAVrh.38, AAVrh.39, AAVrh.40, AAVrh.46, AAVrh.48, AAVrh.48.1, AAVrh.48.1.2, AAVrh.48.2, AAVrh.49, AAVrh.51, AAVrh.52, AAVrh.53, AAVrh.54, AAVrh.56, AAVrh.57, AAVrh.58, AAVrh.61, AAVrh.64, AAVrh.64R1, AAVrh.64R2, AAVrh.67, AAVrh.73, AAVrh.74(AAVrh74로도 지칭됨), AAVrh8R, AAVrh8R A586R 돌연변이체, AAVrh8R R533A 돌연변이체, AAAV, BAAV, 염소(caprine) AAV, 소(bovine) AAV, AAVhE1.1, AAVhEr1.5, AAVhER1.14, AAVhEr1.8, AAVhEr1.16, AAVhEr1.18, AAVhEr1.35, AAVhEr1.7, AAVhEr1.36, AAVhEr2.29, AAVhEr2.4, AAVhEr2.16, AAVhEr2.30, AAVhEr2.31, AAVhEr2.36, AAVhER1.23, AAVhEr3.1, AAV2.5T, AAV-PAEC, AAV-LK01, AAV-LK02, AAV-LK03, AAV-LK04, AAV-LK05, AAV-LK06, AAV-LK07, AAV-LK08, AAV-LK09, AAV-LK10, AAV-LK11, AAV-LK12, AAV-LK13, AAV-LK14, AAV-LK15, AAV-LK16, AAV-LK17, AAV-LK18, AAV-LK19, AAV-PAEC2, AAV-PAEC4, AAV-PAEC6, AAV-PAEC7, AAV-PAEC8, AAV-PAEC11, AAV-PAEC12, AAV-2-pre-miRNA-101, AAV-8h, AAV-8b, AAV-h, AAV-b, AAV SM 10-2, AAV Shuffle 100-1, AAV Shuffle 100-3, AAV Shuffle 100-7, AAV Shuffle 10-2, AAV Shuffle 10-6, AAV Shuffle 10-8, AAV Shuffle 100-2, AAV SM 10-1, AAV SM 10-8, AAV SM 100-3, AAV SM 100-10, BNP61 AAV, BNP62 AAV, BNP63 AAV, AAVrh.50, AAVrh.43, AAVrh.62, AAVrh.48, AAVhu.19, AAVhu.11, AAVhu.53, AAV4-8/rh.64, AAVLG-9/hu.39, AAV54.5/hu.23, AAV54.2/hu.22, AAV54.7/hu.24, AAV54.1/hu.21, AAV54.4R/hu.27, AAV46.2/hu.28, AAV46.6/hu.29, AAV128.1/hu.43, 트루타입(true type) AAV(ttAAV), UPENN AAV 10, 일본(Japanese) AAV 10 혈청형, AAV CBr-7.1, AAV CBr-7.10, AAV CBr-7.2, AAV CBr-7.3, AAV CBr-7.4, AAV CBr-7.5, AAV CBr-7.7, AAV CBr-7.8, AAV CBr-B7.3, AAV CBr-B7.4, AAV CBr-E1, AAV CBr-E2, AAV CBr-E3, AAV CBr-E4, AAV CBr-E5, AAV CBr-e5, AAV CBr-E6, AAV CBr-E7, AAV CBr-E8, AAV CHt-1, AAV CHt-2, AAV CHt-3, AAV CHt-6.1, AAV CHt-6.10, AAV CHt-6.5, AAV CHt-6.6, AAV CHt-6.7, AAV CHt-6.8, AAV CHt-P1, AAV CHt-P2, AAV CHt-P5, AAV CHt-P6, AAV CHt-P8, AAV CHt-P9, AAV CKd-1, AAV CKd-10, AAV CKd-2, AAV CKd-3, AAV CKd-4, AAV CKd-6, AAV CKd-7, AAV CKd-8, AAV CKd-B1, AAV CKd-B2, AAV CKd-B3, AAV CKd-B4, AAV CKd-B5, AAV CKd-B6, AAV CKd-B7, AAV CKd-B8, AAV CKd-H1, AAV CKd-H2, AAV CKd-H3, AAV CKd-H4, AAV CKd-H5, AAV CKd-H6, AAV CKd-N3, AAV CKd-N4, AAV CKd-N9, AAV CLg-F1, AAV CLg-F2, AAV CLg-F3, AAV CLg-F4, AAV CLg-F5, AAV CLg-F6, AAV CLg-F7, AAV CLg-F8, AAV CLv-1, AAV CLv1-1, AAV Clv1-10, AAV CLv1-2, AAV CLv-12, AAV CLv1-3, AAV CLv-13, AAV CLv1-4, AAV Clv1-7, AAV Clv1-8, AAV Clv1-9, AAV CLv-2, AAV CLv-3, AAV CLv-4, AAV CLv-6, AAV CLv-8, AAV CLv-D1, AAV CLv-D2, AAV CLv-D3, AAV CLv-D4, AAV CLv-D5, AAV CLv-D6, AAV CLv-D7, AAV CLv-D8, AAV CLv-E1, AAV CLv-K1, AAV CLv-K3, AAV CLv-K6, AAV CLv-L4, AAV CLv-L5, AAV CLv-L6, AAV CLv-M1, AAV CLv-M11, AAV CLv-M2, AAV CLv-M5, AAV CLv-M6, AAV CLv-M7, AAV CLv-M8, AAV CLv-M9, AAV CLv-R1, AAV CLv-R2, AAV CLv-R3, AAV CLv-R4, AAV CLv-R5, AAV CLv-R6, AAV CLv-R7, AAV CLv-R8, AAV CLv-R9, AAV CSp-1, AAV CSp-10, AAV CSp-11, AAV CSp-2, AAV CSp-3, AAV CSp-4, AAV CSp-6, AAV CSp-7, AAV CSp-8, AAV CSp-8.10, AAV CSp-8.2, AAV CSp-8.4, AAV CSp-8.5, AAV CSp-8.6, AAV CSp-8.7, AAV CSp-8.8, AAV CSp-8.9, AAV CSp-9, AAV.hu.48R3, AAV.VR-355, AAV3B, AAV4, AAV5, AAVF1/HSC1, AAVF11/HSC11, AAVF12/HSC12, AAVF13/HSC13, AAVF14/HSC14, AAVF15/HSC15, AAVF16/HSC16, AAVF17/HSC17, AAVF2/HSC2, AAVF3/HSC3, AAVF4/HSC4, AAVF5/HSC5, AAVF6/HSC6, AAVF7/HSC7, AAVF8/HSC8, 및/또는 AAVF9/HSC9, 7m8, Spark100, AAVMYO 및 이의 변이체를 포함한다.
일부 실시양태에서, 기준 AAV 캡시드 서열은 AAV2 서열을 포함한다. 일부 실시양태에서, 기준 AAV 캡시드 서열은 AAV5 서열을 포함한다. 일부 실시양태에서, 기준 AAV 캡시드 서열은 AAV8 서열을 포함한다. 일부 실시양태에서, 기준 AAV 캡시드 서열은 AAV9 서열을 포함한다. 일부 실시양태에서, 기준 AAV 캡시드 서열은 AAVrh74 서열을 포함한다. 이론에 구애됨이 없이, 기준 AAV 캡시드 서열은 VP1 영역을 포함하는 것으로 이해된다. 특정 실시양태에서, 기준 AAV 캡시드 서열은 VP1, VP2 및/또는 VP3 영역, 또는 이들의 임의의 조합을 포함한다. 기준 VP1 서열은 기준 AAV 캡시드 서열과 동의어로 간주될 수 있다.
서열번호 1(야생형 AAV2)의 예시적인 기준 서열은 다음과 같다:
달리 명시하지 않는 한, 서열번호 1은 기준 서열이다. 위의 서열에서, VP1, VP2 및 VP3에서 발견된 서열은 밑줄이 쳐져 있고(예를 들어, VP3 캡시드 폴리펩티드는 서열번호 1의 아미노산 203-735에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐), VP1 및 VP2 둘 다에서 발견된 서열은 볼드체로 표시되어 있으며(예를 들어, VP2 캡시드 폴리펩티드는 서열번호 1의 아미노산 138-735에 상응하는 서열을 포함하고, 예를 들어, 이로 이루어짐) 밑줄이 쳐져 있지 않거나 볼드체로 표시되지 않은 서열은 VP1에서만 발견된다(예를 들어, VP1 캡시드 폴리펩티드는 서열번호 1의 아미노산 1-735에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐).
서열번호 1을 암호화하는 핵산 서열의 예는 서열번호 92이다:
야생형 AAV5의 예시적인 기준 서열인 서열번호 123(야생형 AAV5)은 다음과 같다:
위의 서열에서, VP1, VP2 및 VP3에서 발견된 서열은 밑줄이 쳐져 있고(예를 들어, VP3 캡시드 폴리펩티드는 서열번호 123의 아미노산 193-725에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐), VP1 및 VP2 둘 다에서 발견된 서열은 볼드체로 표시되어 있으며(예를 들어, VP2 캡시드 폴리펩티드는 서열번호 123의 아미노산 137-725에 상응하는 서열을 포함하고, 예를 들어, 이로 이루어짐) 밑줄이 쳐져 있지 않거나 볼드체로 표시되지 않은 서열은 VP1에서만 발견된다(예를 들어, VP1 캡시드 폴리펩티드는 서열번호 123의 아미노산 1-725에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐).
서열번호 123을 암호화하는 핵산 서열의 예는 서열번호 124이다:
야생형 AAV8의 예시적인 기준 서열인 서열번호 125(야생형 AAV8)는 다음과 같다:
위의 서열에서, VP1, VP2 및 VP3에서 발견된 서열은 밑줄이 쳐져 있고(예를 들어, VP3 캡시드 폴리펩티드는 서열번호 125의 아미노산 204-739에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐), VP1 및 VP2 둘 다에서 발견된 서열은 볼드체로 표시되어 있으며(예를 들어, VP2 캡시드 폴리펩티드는 서열번호 125의 아미노산 138-735에 상응하는 서열을 포함하고, 예를 들어, 이로 이루어짐) 밑줄이 쳐져 있지 않거나 볼드체로 표시되지 않은 서열은 VP1에서만 발견된다(예를 들어, VP1 캡시드 폴리펩티드는 서열번호 125의 아미노산 1-739에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐).
서열번호 125를 암호화하는 핵산 서열의 예는 서열번호 126이다:
야생형 AAV9의 예시적인 기준 서열인 서열번호 127(야생형 AAV9)은 다음과 같다:
위의 서열에서, VP1, VP2 및 VP3에서 발견된 서열은 밑줄이 쳐져 있고(예를 들어, VP3 캡시드 폴리펩티드는 서열번호 127의 아미노산 203-737에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐), VP1 및 VP2 둘 다에서 발견된 서열은 볼드체로 표시되어 있으며(예를 들어, VP2 캡시드 폴리펩티드는 서열번호 127의 아미노산 138-737에 상응하는 서열을 포함하고, 예를 들어, 이로 이루어짐) 밑줄이 쳐져 있지 않거나 볼드체로 표시되지 않은 서열은 VP1에서만 발견된다(예를 들어, VP1 캡시드 폴리펩티드는 서열번호 127의 아미노산 1-737에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐).
서열번호 127을 암호화하는 핵산 서열의 예는 서열번호 128이다:
야생형 AAVrh74의 예시적인 기준 서열인 서열번호 129(야생형 AAVrh74)는 다음과 같다:
서열번호 130의 예시적인 대체 기준 서열(대체 야생형 AAVrh74)은 다음과 같다:
위의 서열(서열번호 129 또는 서열번호 130)에서, VP1, VP2 및 VP3에서 발견된 서열은 밑줄이 쳐져 있고(예를 들어, VP3 캡시드 폴리펩티드는 서열번호 129의 아미노산 204-739에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐), VP1 및 VP2 둘 다에서 발견된 서열은 볼드체로 표시되어 있으며(예를 들어, VP2 캡시드 폴리펩티드는 서열번호 129의 아미노산 137-739에 상응하는 서열을 포함하고, 예를 들어, 이로 이루어짐) 밑줄이 쳐져 있지 않거나 볼드체로 표시되지 않은 서열은 VP1에서만 발견된다(예를 들어, VP1 캡시드 폴리펩티드는 서열번호 129의 아미노산 1-739에 상응하는 아미노산을 포함하고, 예를 들어, 이로 이루어짐).
서열번호 129를 암호화하는 핵산 서열의 예는 서열번호 131이다.
본 개시내용은 캡시드(Cap) 유전자에 의해 암호화되는 구조적 캡시드 단백질(VP1, VP2 및 VP3 포함)을 지칭한다. 이러한 캡시드 단백질은 AAV와 같은 바이러스 벡터의 외부 단백질 구조 쉘(shell)(즉, 캡시드)을 형성한다. Cap 폴리뉴클레오티드로부터 합성된 VP 캡시드 단백질은 일반적으로 상응하는 Cap 뉴클레오티드 서열의 시작 코돈(AUG 또는 ATG)과 연관된 폴리펩티드 서열(Met1)의 첫 번째 아미노산으로서 메티오닌을 포함한다. 그러나 첫 번째 메티오닌(Met1) 잔기 또는 일반적으로 임의의 첫 번째 아미노산(AA1)이 Met-아미노펩티다제(Met-aminopeptidase)와 같은 단백질 처리 효소에 의해 폴리펩티드 합성 후 또는 도중에 절단되는 것이 통상적이다. 이러한 "Met/AA-클리핑(Met/AA-clipping)" 과정은 종종 폴리펩티드 서열의 두 번째 아미노산(예를 들어, 알라닌, 발린, 세린, 트레오닌 등)의 상응하는 아세틸화와 연관성이 있다. Met-클리핑은 통상 VP1 및 VP3 캡시드 단백질에서 발생하지만 VP2 캡시드 단백질에서도 발생할 수 있다. Met/AA-클리핑이 불완전한 경우, 바이러스 캡시드를 포함하는 하나 이상(1개, 2개 또는 3개)의 VP 캡시드 단백질의 혼합물이 생성될 수 있으며, 그 중 일부는 Met1/AA1 아미노산을 포함하고(Met+/AA+) 그 중 일부는 Met/AA-클리핑의 결과로 Met1/AA1 아미노산이 부족하다(Met-/AA-). 캡시드 단백질의 Met/AA-클리핑에 관한 추가 논의는 Jin, 등. Direct Liquid Chromatography/Mass Spectrometry Analysis for Complete Characterization of Recombinant Adeno-Associated Virus Capsid Proteins. Hum Gene Ther Methods.2017 Oct.28(5):255-267; Hwang, 등. N-Terminal Acetylation of Cellular Proteins Creates Specific Degradation Signals. Science. 2010 February 19.327(5968): 973-977을 참고하며; 이의 내용은 각각 전체가 본원에 참조로 포함된다. 본 개시내용에 따르면, 캡시드 폴리펩티드에 대한 언급은 클리핑된 것(Met-/AA-) 또는 클리핑되지 않은(Met+/AA+) 것에 제한되지 않고, 문맥상 독립적인 캡시드 폴리펩티드, 캡시드 단백질의 혼합물로 구성된 바이러스 캡시드 및/또는 본 개시내용의 캡시드 폴리펩티드를 암호화하거나 기술하거나 생성하거나 제공하는 폴리뉴클레오티드 서열(또는 이의 단편)도 지칭한다. "캡시드 폴리펩티드"(예컨대 VP1, VP2 또는 VP3)에 대한 직접적인 언급은 Met1/AA1 아미노산을 포함하는(Met+/AA+) VP 캡시드 단백질뿐만 아니라, 예를 들어, Met/AA-클리핑(Met-/AA-)의 결과로 Met1/AA1 아미노산이 결여된 상응하는 VP 캡시드 폴리펩티드도 포함한다. 추가로 본 개시내용에 따르면, Met1/AA1 아미노산을 포함하는(Met+/AA+) 하나 이상의 캡시드 폴리펩티드를 각각 포함하거나 암호화하는 특정 서열번호(단백질이든 핵산이든)에 대한 언급은 서열을 검토하면 첫 번째 나열된 아미노산(Met1/AA1 여부에 관계없이)이 결여될 수 있다는 것이 쉽게 명백하므로 Met1/AA1 아미노산이 결여된 VP 캡시드 폴리펩티드를 교시하는 것으로 이해해야 한다. 비제한적인 예로서, 길이가 736개 아미노산이고 AUG/ATG 시작 코돈에 의해 암호화된 "Met1" 아미노산을 포함하는(Met+) VP1 폴리펩티드 서열에 대한 언급은 또한 길이가 735개 아미노산이고 736개 아미노산 Met+ 서열의 "Met1" 아미노산을 포함하지 않는(Met-) VP1 폴리펩티드 서열을 교시하는 것으로 이해한다. 두 번째 비제한적 예로서, 길이가 736개 아미노산이고 임의의 NNN 개시자 코돈에 의해 암호화된 "AA1" 아미노산을 포함하는(AA1+) VP1 폴리펩티드 서열에 대한 언급은 또한 길이가 735개 아미노산이고 736개 아미노산 AA1+ 서열의 "AA1" 아미노산을 포함하지 않는(AA1-) VP1 폴리펩티드 서열을 교시하는 것으로 이해할 수 있다. VP 캡시드 단백질로부터 형성된 바이러스 캡시드에 대한 언급(예컨대 특정 AAV 캡시드 혈청형에 대한 언급)은 Met1/AA1 아미노산을 포함하는(Met+/AA1+) VP 캡시드 단백질과, 예를 들어, Met/AA1-클리핑(Met-/AA1-)의 결과로 Met1/AA1 아미노산이 결여된 상응하는 VP 캡시드 단백질 또는 이들의 임의의 조합(Met+/AA1+ 및 Met-/AA1-)을 포함할 수 있다. 비제한적인 예로서, AAV 캡시드 혈청형은 VP1(Met+/AA1+), VP1(Met-/AA1-) 또는 VP1(Met+/AA1+)과 VP1(Met-/AA1-)의 조합을 포함할 수 있다. AAV 캡시드 혈청형은 VP3(Met+/AA1+), VP3(Met-/AA1-) 또는 VP3(Met+/AA1+)과 VP3(Met-/AA1-)의 조합도 포함할 수 있으며; VP2(Met+/AA1) 및 VP2(Met-/AA1-)의 유사한 선택적 조합도 포함할 수 있다.
일부 실시양태에서, 기준 AAV 캡시드 서열은 상술한 임의의 것과의 동일성이 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%인 아미노산 서열을 포함한다.
일부 실시양태에서, 기준 AAV 캡시드 서열은 상술한 임의의 것과의 동일성이 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%인 뉴클레오티드 서열에 의해 암호화된다. 특정 실시양태에서, 기준 서열은 AAV 캡시드 서열이 아니고 대신 상이한 벡터(예를 들어, 렌티바이러스, 플라스미드 등)이다.
일부 실시양태에서, (예를 들어, AAV2 변이체 캡시드 단백질을 암호화하는) 본 개시내용의 핵산은 핵산(예를 들어, 상기 핵산을 포함하는 플라스미드 벡터)으로 형질감염되거나 상기 핵산을 포함하는 바이러스로 감염된 세포에서 전사, 번역 및/또는 발현을 허용하는 방식으로 핵산 분자에 작동 가능하게 연결되는 통상적인 제어 요소 또는 서열을 포함한다. 본원에서 사용되는 "작동 가능하게 연결된" 서열에는 관심 유전자와 인접한 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 거리를 두고 작용하는 발현 제어 서열이 모두 포함된다.
발현 제어 서열에는 스플라이싱 및 폴리아데닐화(폴리A) 신호와 같은 효율적인 RNA 처리 신호; 적절한 전사 개시, 종결, 프로모터 및 인핸서(enhancer) 서열; 세포질 mRNA를 안정화시키는 서열; 단백질 안정성을 향상시키는 서열; 번역 효율성을 향상시키는 서열(예를 들어, Kozak 공통 서열); 및 일부 실시양태에서는 암호화된 전이유전자 생성물의 분비를 향상시키는 서열이 포함된다. 천연(native), 상시발현(constitutive), 유도성(inducible) 및/또는 조직 특이적(tissue-specific) 프로모터를 포함하는 발현 제어 서열은 당업계에 알려져 있으며, 본원에 개시된 조성물 및 방법과 함께 활용될 수 있다.
일부 실시양태에서, 전이유전자에 대한 천연 프로모터가 사용될 수 있다. 이론에 구애됨이 없이 천연 프로모터는 전이유전자의 천연 발현을 모방할 수 있거나, 시간적, 발달적 또는 조직 특이적 발현 또는 특정 전사 자극에 반응하는 발현을 제공할 수 있다. 일부 실시양태에서, 전이유전자는, 예를 들어, 천연 발현을 모방하기 위해 인핸서 요소, 폴리아데닐화 영역 또는 Kozak 공통 서열과 같은 다른 천연 발현 제어 요소에 작동 가능하게 연결될 수 있다.
일부 실시양태에서, 전이유전자는 조직 특이적 프로모터에 작동 가능하게 연결된다.
일부 실시양태에서, 전이유전자를 운반하는 벡터, 예를 들어, 플라스미드는 또한 선택 마커(selectable marker) 또는 리포터 유전자를 포함할 수 있다. 이러한 선택 리포터 또는 마커 유전자는 박테리아 세포에서 벡터, 예를 들어, 플라스미드의 존재를 알리는 데 사용될 수 있다. 벡터의 다른 성분, 예를 들어, 플라스미드에는 복제 기점(origin of replication)이 포함될 수 있다. 이들 및 기타 프로모터와 벡터 요소의 선택은 통상적이며 많은 이러한 서열이 이용 가능하다(예를 들어, Sambrook 등 및 본원에 인용된 참고문헌 참고).
일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 눈에서의 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 망막에서의 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 비황반 망막에서의 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반에서의 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 망막에 비해 섬유주대에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 비황반 망막에 비해 섬유주대에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반에 비해 섬유주대에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 망막에 비해 황반에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 비황반 망막에 비해 황반에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에 비해 황반에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 비황반 망막 및 섬유주대에 비해 황반에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 망막 및 섬유주대에 비해 황반에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반 및 섬유주대에 비해 망막에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반 및 섬유주대에 비해 비황반 망막에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반 및 망막에 비해 섬유주대에서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 황반 및 비황반 망막에 비해 섬유주대에서 형질도입을 증가시킨다.
일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 1배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 2배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 4배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 6배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 8배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 10배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 15배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 16배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 32배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 64배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 100배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 150배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 200배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 500배 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는, 예를 들어, 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 안구 형질도입을 적어도 1000배 증가시킨다. 실시양태에서, 증가된 안구 형질도입은 변이체 바이러스 입자에 패키징된 핵산으로부터 생성된 표적 조직(예를 들어, 표적 조직의 세포 또는 세포 집단)의 mRNA 수준을 기준 바이러스 입자에 패키징된(예를 들어, 서열번호 1의 캡시드 폴리펩티드를 포함하는 캡시드에 패키징된) 핵산으로부터 생성된 표적 조직(예를 들어, 표적 조직의 세포 또는 세포 집단)의 mRNA 수준과 비교하여 측정된다.
일부 실시양태에서, 캡시드 폴리펩티드는 단리되거나 정제된 폴리펩티드(예를 들어, 세포, 다른 생물학적 성분 또는 오염물질로부터 단리되거나 정제됨)이다. 일부 실시양태에서, 변이체 폴리펩티드는, 예를 들어, 본원에 기술된 데펜도파보바이러스 입자에 존재한다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드는, 예를 들어, 본원에 기술된 세포, 무세포 시스템 또는 번역 시스템에 존재한다.
일부 실시양태에서, 캡시드 폴리펩티드는 데펜도파보바이러스 B(예를 들어, AAV2) 입자에 존재한다. 일부 실시양태에서, 캡시드 입자는 안구 형질도입이 증가한다.
일부 실시양태에서, 데펜도파보바이러스 입자는 본원에 제공된 아미노산 서열(예를 들어, 서열번호 2-46)과의 동일성이 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%인 아미노산 서열을 포함한다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드는 본원에 제공된 변이체 캡시드 폴리펩티드의 아미노산 서열과 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 아미노산만큼 상이한 아미노산 서열을 포함한다.
일부 실시양태에서, 추가적인 변경은 데펜도파보바이러스 입자의 생성 특성 또는 이의 제조 방법을 개선한다. 일부 실시양태에서, 추가적인 변경은 데펜도파보바이러스 입자의 또 다른 특징, 예를 들어, 친화성(tropism)을 개선하거나 변경시킨다.
VP1 핵산 및 폴리펩티드
본 개시내용은 추가로 부분적으로 본원에 제공된 바와 같은 데펜도파보바이러스(예를 들어, 데펜도파보바이러스 B, 예를 들어, AAV2) 폴리펩티드를 암호화하는 서열을 포함하는 핵산뿐만 아니라 이에 의해 암호화되는 VP1 폴리펩티드에 관한 것이다. 일부 실시양태에서, 폴리펩티드는 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 25, 27, 28, 29, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 또는 46의 서열을 포함한다.
데펜도파보바이러스 입자
본 개시내용은 또한 부분적으로 본원에 기술된 핵산 또는 폴리펩티드를 포함하거나 본원에 기술된 방법에 의해 생성된 데펜도파보바이러스 입자(예를 들어, 기능적 데펜도파보바이러스 입자)에 관한 것이다.
데펜도파보바이러스는 공동 감염 헬퍼 바이러스(co-infecting helper virus)와 같이 특정 기능이 제공되는 세포에서만 자라는 단일 가닥 DNA 파보바이러스이다. 아데노 관련 바이러스(AAV)로 당업계에 알려진 혈청형을 포함하는 데펜도파보바이러스 A 및 데펜도파보바이러스 B를 포함하는 여러 종의 데펜도파보바이러스가 알려져 있다. 최소 13가지 혈청형의 특성이 규명되었다. AAV에 대한 일반 정보 및 리뷰는, 예를 들어, Carter, Handbook of Parvoviruses, Vol. 1, pp. 169-228 (1989), 및 Berns, Virology, pp. 1743-1764, Raven Press, (New York, 1990)에서 확인할 수 있다. AAV 혈청형과 어느 정도는 데펜도파보바이러스 종은 구조적 및 기능적으로 상당히 상호연관되어 있다. (예를 들어, Blacklowe, pp. 165-174 of Parvoviruses and Human Disease, J. R. Pattison, ed. (1988); 및 Rose, Comprehensive Virology 3:1-61 (1974) 참고). 예를 들어, 모든 AAV 혈청형은 분명히 상동성 rep 유전자에 의해 매개되는 매우 유사한 복제 특성을 나타내고; 모두 세 가지 관련 캡시드 단백질을 가지고 있다. 또한, 이질듀플렉스(heteroduplex) 분석은 게놈 길이에 따른 혈청형 사이의 광범위한 교차 혼성화(cross-hybridization)를 밝혀 상호연관성(interrelatedness)을 추가로 시사한다. 데펜도파보바이러스 게놈은 또한 "역 말단 반복 서열"(ITR)에 상응하는 말단에 자가 어닐링 세그먼트를 포함한다.
자연 발생 데펜도파보바이러스, 예를 들어, AAV 혈청형의 게놈 구성은 매우 유사하다. 예를 들어, AAV의 게놈은 길이가 대략 5,000개 뉴클레오티드(nt) 이하인 선형 단일 가닥 DNA 분자이다. 역 말단 반복(ITR)은 비구조적 복제(Rep) 단백질과 구조적 캡시드(Cap) 단백질에 대한 고유한 코딩 뉴클레오티드 서열의 측면에 위치한다. 세 가지 상이한 바이러스 입자(VP) 단백질이 캡시드를 형성한다. 말단 145nt는 자기상보적이며 T자형 헤어핀을 형성하는 에너지적으로 안정한 분자 내 듀플렉스를 형성할 수 있도록 조직화된다. 이러한 헤어핀 구조는 바이러스 DNA 복제의 근원지 역할을 하며 세포 DNA 중합효소 복합체의 프라이머 역할을 한다. Rep 유전자는 Rep 단백질인 Rep78, Rep68, Rep52 및 Rep40을 암호화한다. Rep78 및 Rep68은 p5 프로모터로부터 전사되고 Rep 52 및 Rep40은 p19 프로모터로부터 전사된다. cap 유전자는 VP 단백질인 VP1, VP2 및 VP3을 암호화한다. cap 유전자는 p40 프로모터로부터 전사된다.
일부 실시양태에서, 본 개시내용의 데펜도파보바이러스 입자는 본원에 제공된 캡시드 폴리펩티드를 포함하는 핵산을 포함한다. 일부 실시양태에서, 상기 입자는 본원에 제공된 바와 같은 폴리펩티드를 포함한다.
일부 실시양태에서, 본 개시내용의 데펜도파보바이러스 입자는 AAV2 입자일 수 있다. 일부 실시양태에서, AAV2 입자는 본원에 제공된 바와 같은 캡시드 폴리펩티드 또는 이를 암호화하는 핵산 분자를 포함한다.
일부 실시양태에서 데펜도파보바이러스 입자는 본원에 기술된 변이체 캡시드 폴리펩티드를 포함하는 캡시드를 포함한다. 실시양태에서, 데펜도파보바이러스 입자는 본원에 기술된 변이체 캡시드 폴리펩티드 및 핵산 분자를 포함한다. 실시양태에서, 데펜도파보바이러스 입자는 본원에 기술된 변이체 캡시드 폴리펩티드 및 하나 이상의 역 말단 반복(ITR) 서열, 예를 들어, AAV2 데펜도파보바이러스로부터 유래된 ITR, 하나 이상의 조절 요소(예를 들어, 프로모터) 및 (예를 들어, 본원에 기술된 바와 같은) 페이로드를 포함하는 핵산 분자를 포함한다. 실시양태에서, ITR 중 적어도 하나가 변형된다. 실시양태에서, 핵산 분자는 단일 가닥이다. 실시양태에서, 핵산 분자는 자기상보적이다.
증가된 안구 형질도입 특성
본 개시내용은 부분적으로 핵산, 폴리펩티드, 세포, 무세포 시스템, 번역 시스템, 바이러스 입자 및, 예를 들어, 서열번호 1의 야생형 서열을 갖는 기준 서열의 캡시드 폴리펩티드를 갖는 바이러스 입자와 비교하여 안구 형질도입이 증가된 바이러스 입자를 생성하기 위해 핵산, 폴리펩티드, 세포, 무세포 시스템, 번역 시스템, 바이러스 입자를 제조하는 방법에 관한 것이다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 눈에서 전이유전자의 안구 형질도입을 증가시키고, 이에 따라 눈에서 전이유전자의 발현을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 망막에서 전이유전자의 안구 형질도입을 증가시키고, 이에 따라 망막에서 전이유전자의 발현을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 비황반 망막에서 전이유전자의 안구 형질도입을 증가시키고, 이에 따라 비황반 망막에서 전이유전자의 발현을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 황반에서 전이유전자의 안구 형질도입을 증가시키고, 이에 따라 황반에서 전이유전자의 발현을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 섬유주대에서 전이유전자의 안구 형질도입을 증가시키고, 이에 따라 섬유주대에서 전이유전자의 발현을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 유리액(vitreous humor) 앞에 있는 구조를 포함하는 눈의 앞쪽 1/3 지점에서 전이유전자의 안구 형질도입을 증가시킨다. 유리액 앞에 있는 구조의 예에는 각막(cornea), 홍채(iris), 모양체(ciliary body), 수정체, 섬유주대 및 쉴렘관(Schlemm's canal)이 포함된다. 따라서, 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 각막, 홍채, 모양체, 수정체, 섬유주대 또는 쉴렘관, 또는 이들의 임의의 조합에서 전이유전자의 안구 형질도입을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 수정체 후방, 예컨대 앞유리체막(anterior hyaloid membrane) 및 그 뒤의 모든 광학 구조, 예컨대 유리액, 망막, 맥락막, 시신경 또는 이들의 임의의 조합에서 전이유전자의 안구 형질도입을 증가시킨다. 따라서, 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 앞유리체막 및 그 뒤의 모든 광학 구조, 예컨대 유리액, 망막, 맥락막 또는 시신경, 또는 이들의 임의의 조합에서 전이유전자의 안구 형질도입을 증가시킨다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자를 사용하면 눈의 앞쪽 1/3 지점 및 수정체 후방에서 전이유전자의 안구 형질도입을 증가시킨다.
일부 실시양태에서, 안구 형질도입의 증가는 기준 서열 캡시드 폴리펩티드를 갖는, 예를 들어, 야생형 캡시드 폴리펩티드 서열번호 1을 갖는 바이러스 입자보다 log2 규모로 약 1-5배 더 좋다(예를 들어, 약 2-5배 더 좋고, 예를 들어, 약 3-5배 더 좋음).
일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 서열번호 1에 비해 눈에서 변이체 캡시드 폴리펩티드의 생체분포를 증가시키지 않으면서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 서열번호 1에 비해 망막 내 변이체 캡시드 폴리펩티드의 생체분포를 증가시키지 않으면서 형질도입을 증가시킨다. 일부 실시양태에서, 바이러스 입자에 존재하는 캡시드 폴리펩티드는 서열번호 1에 비해 섬유주대에서 변이체 캡시드 폴리펩티드의 생체분포를 증가시키지 않으면서 형질도입을 증가시킨다.
표 5는 눈의 다양한 층, 구조 및/또는 부분에서 표시된 변이체 캡시드의 캡시드 폴리펩티드를 포함하는 변이체 데펜도파보바이러스 입자의 생체분포에 관한 정보를 나열한다. 망막의 생체분포는 IVT 주사 후 측정된다. 섬유주대 내 생체분포는 IC 주사 후 측정된다.
[표 5]
일부 실시양태에 따르면, 서열번호 1의 544에 상응하는 위치의 류신에 상응하는 점 돌연변이(예를 들어, 서열번호 1과 비교하여 I554L)를 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 예를 들어, VAR-22는 서열번호 1과 비교하여 I554L 돌연변이를 포함한다(표 1에 나타냄). I554L 돌연변이가 있는 추가 변이체 캡시드 폴리펩티드(VAR-46, VAR-47, VAR-48, VAR-49)를 평가했는데, 이러한 추가 변이체 캡시드 폴리펩티드는 각각 VAR-22에서와 같이 서열번호 1과 비교하여 555 아미노산 위치에 돌연변이가 없다. VAR-46, VAR-47, VAR-48 및 VAR-49에 대한 데이터는 표 6에 나와 있으며, VAR-22와 마찬가지로 I554L 돌연변이를 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해 섬유주대 조직의 형질도입을 증가시켰다. 따라서, 이론에 구애됨이 없이 놀랍게도 I554L 돌연변이의 존재가 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열과 관련하여 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다. 서열번호 1에 비해, I554L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리(edit distance)가 8-12 범위이다(표 6에 제시됨). VAR-22에 비해, I554L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 11-16이다(표 6에 제시됨). 따라서, 서열번호 1과 비교하여 I554L 돌연변이를 포함하는, 캡시드 폴리펩티드, 캡시드 폴리펩티드를 암호화하는 핵산 분자, 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술되어 있다. 일부 실시양태에서, I554L 돌연변이를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I554L 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I554L 돌연변이를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 또한, 일부 실시양태에서 서열번호 1과 비교하여 I554L 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 분자가 개시된다. 또한, 일부 실시양태에서는 서열번호 1과 비교하여 I554L 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자, 예를 들어, 데펜도파보바이러스 입자가 개시된다.
표 6에 나타낸 바와 같이, I554L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드 각각은 서열번호 1과 비교하여 섬유주대 형질도입이 증가한다. 따라서, 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 I554L에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 가진 바이러스 입자에 비해 섬유주대에서 형질도입을 증가시킨다.
[표 6]
일부 실시양태에서, 위치 554에 L(예를 들어, I554L) 돌연변이를 포함하는 캡시드 폴리펩티드에는 하나 이상의 추가 돌연변이가 있다. 일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 544에 상응하는 위치의 류신 및 서열번호 1의 561에 상응하는 위치의 세린에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I554L 및 D561S를 포함함). 예를 들어, VAR-22, VAR-46 및 VAR-47은 서열번호 1과 비교하여 I554L 및 D561S에 상응하는 돌연변이를 포함한다. VAR-46 및 VAR-47은 VAR-22에서와 같이 서열번호 1과 비교하여 560, 562, 563, 564 및 565 아미노산 잔기에 돌연변이가 없다. 따라서, 이론에 구애됨이 없이 놀랍게도 I554L 및 D561S 돌연변이 둘 다의 존재가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1과 비교하여 I554L 및 T581D에 상응하는 점 돌연변이를 포함한다. 예를 들어, VAR-22, VAR-46 및 VAR-47은 서열번호 1의 544에 상응하는 위치의 류신 및 서열번호 1의 581에 상응하는 위치의 아스파르트산에 상응하는 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I554L 및 T581D를 포함함). VAR-46 및 VAR-47에는 I554L 돌연변이 및 T581D 돌연변이가 있지만, VAR-22에서와 같이 서열번호 1과 비교하여 579, 580, 582, 583 및 584 아미노산 잔기에 돌연변이가 없다. 따라서, 이론에 구애됨이 없이 놀랍게도 I554L 및 T581D 돌연변이의 존재는 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 544에 상응하는 위치의 류신, 서열번호 1의 561에 상응하는 위치의 세린 및 서열번호 1의 581에 상응하는 위치의 아스파르트산에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I554L, D561S 및 T581D를 포함함). 예를 들어, VAR-22, VAR-46 및 VAR-47은 서열번호 1과 비교하여 I554L, D561S 및 T581D에 상응하는 돌연변이를 포함한다.
따라서, 서열번호 1의 554에 상응하는 위치의 류신을 포함하고(예를 들어, 서열번호 1과 비교하여 I554L 돌연변이를 포함하고) 서열번호 1의 561에 상응하는 위치의 세린 및 서열번호 1의 581에 상응하는 위치의 트레오닌 중 하나 또는 둘 다를 포함하는(예를 들어, 서열번호 1과 비교하여 D561S 및 T581D 돌연변이) 캡시드 폴리펩티드, 상기 캡시드 폴리펩티드를 암호화하는 핵산 분자, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서, I554L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I554L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I554L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 I554L 돌연변이에 상응하는 돌연변이와 서열번호 1과 비교하여 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 I554L에 상응하는 돌연변이와 서열번호 1과 비교하여 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다.
일부 실시양태에 따르면, 서열번호 1의 위치 559에 류신에 상응하는 점 돌연변이(예를 들어, 서열번호 1과 비교하여 I559L)를 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 예를 들어, VAR-22 및 VAR-23은 서열번호 1과 비교하여 I559L 돌연변이를 포함한다(표 1에 나타냄). I559L 돌연변이가 있는 추가 변이체 캡시드 폴리펩티드(VAR-50, VAR-51, VAR-52)를 평가하였으며, 이러한 추가 변이체 캡시드 폴리펩티드 각각은 VAR-22 및 VAR-23에서와 같이 서열번호 1과 비교하여 557, 558 및 560 아미노산 잔기에 돌연변이가 없다. VAR-50, VAR-51 및 VAR-52에 대한 데이터는 표 7에 나와 있으며, VAR-22 및 VAR-23과 마찬가지로 I559L 돌연변이를 포함하는 이러한 캡시드 폴리펩티드를 포함하는 바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해 섬유주대 조직의 형질도입을 증가시켰다. 따라서, 이론에 구애됨이 없이 놀랍게도 서열번호 1의 559에 상응하는 위치의 류신의 존재(예를 들어, I559L 돌연변이를 포함함)는 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다. 서열번호 1에 비해, I559L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 4-13 범위이다(표 7에 나타냄). VAR-22에 비해, I559L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 8-19이다(표 7에 나타냄). VAR-23에 비해, I559L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 5-20이다(표 7에 나타냄). 따라서, 서열번호 1의 559에 상응하는 위치에서 류신을 포함하는(예를 들어, 서열번호 1과 비교하여 I559L 돌연변이) 캡시드 폴리펩티드, 상기 캡시드 폴리펩티드를 암호화하는 핵산 분자, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서, I559L 돌연변이를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-23의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 일부 실시양태에서, 서열번호 1의 559에 상응하는 위치에서 류신을 포함하는 캡시드 폴리펩티드(예를 들어, 서열번호 1과 비교하여 I559L 돌연변이에 상응하는 돌연변이)를 암호화하는 핵산 분자가 본원에 개시된다. 또한, 서열번호 1의 559에 상응하는 위치에서 류신을 포함하는 캡시드 폴리펩티드(예를 들어, 서열번호 1과 비교하여 I559L 돌연변이에 상응하는 돌연변이)를 포함하는 바이러스 입자, 예를 들어, 데펜도파보바이러스 입자가 본원에 개시된다.
표 7에 나타낸 바와 같이, I559L 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드 각각은 서열번호 1과 비교하여 섬유주 형질도입이 증가하였다. 따라서, 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 I559L에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 가진 바이러스 입자에 비해 섬유주대에서 형질도입을 증가시킨다
[표 7]
일부 실시양태에서, 서열번호 1의 559에 상응하는 위치에서 류신을 포함하는 캡시드 폴리펩티드(예를 들어, I559L 돌연변이)에는 하나 이상의 추가 돌연변이가 있다. 일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 559에 상응하는 위치의 류신 및 서열번호 1의 561에 상응하는 위치의 세린에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I559L 및 D561S를 포함함). 예를 들어, VAR-22, VAR-23 및 VAR-50은 서열번호 1과 비교하여 I559L 및 D561S에 상응하는 돌연변이를 포함한다. VAR-50에는 VAR-22 및 VAR-23에서와 같이 서열번호 1과 비교하여 562, 563, 564 및 565 아미노산 잔기에 돌연변이가 없다. 따라서, 이론에 구애됨이 없이 놀랍게도 I559L 및 D561S 돌연변이의 존재는 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 559에 상응하는 위치의 류신 및 서열번호 1의 581에 상응하는 위치의 아스파르트산에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I559L 및 T581D를 포함함). 예를 들어, VAR-22, VAR-23, VAR-50 및 VAR-51은 서열번호 1과 비교하여 I559L 및 T581D에 상응하는 돌연변이를 포함한다. VAR-50 및 VAR-51은 VAR-22 및 VAR-23에서와 같이 서열번호 1과 비교하여 579, 582, 583 및 584 아미노산 잔기에 돌연변이가 없다. 따라서, 이론에 구애됨이 없이 놀랍게도 I559L 및 T581D 돌연변이 둘 다의 존재가 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 559에 상응하는 위치의 류신, 서열번호 1의 561에 상응하는 위치의 세린 및 서열번호 1의 581에 상응하는 위치의 아스파르트산에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 I5549L, D561S 및 T581D를 포함함). 예를 들어, 위에서 논의한 바와 같이, VAR-22, VAR-23 및 VAR-50은 서열번호 1과 비교하여 I554L, D561S 및 T581D에 상응하는 돌연변이를 포함한다. 따라서, 서열번호 1과 비교하여 I559L 돌연변이와 서열번호 1과 비교하여 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드, 캡시드 폴리펩티드를 암호화하는 핵산 분자, 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서 I559L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 VAR-23의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, I559L 돌연변이와 D561S 및 T581D 돌연변이 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 일부 실시양태에서, 핵산 분자는 서열번호 1과 비교하여 I559L 돌연변이와 서열번호 1과 비교하여 D561S 및 T581D 돌연변이 중 하나 또는 둘 다에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화한다. 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 I559L에 상응하는 돌연변이와 서열번호 1과 비교하여 D561S 및 D561S 및 T581D 중 하나 또는 둘 다를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다.
일부 실시양태에서, 하나 이상의 추가 돌연변이를 추가로 포함하는 I5549L, D561S 및/또는 T581D 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 일부 실시양태에서, 캡시드 폴리펩티드는 I5549L, D561S, T581D에 상응하는 점 돌연변이, 및 서열번호 1의 556에 상응하는 위치에서 R, D 또는 N으로의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 비교하여 VAR-22는 K556R에 상응하는 돌연변이를 포함하고, VAR-23은 K556D에 상응하는 돌연변이를 포함하고, VAR-50은 K556N에 상응하는 돌연변이를 포함한다. 따라서, 이론에 구애됨이 없이 놀랍게도 I5549L, D561S 및/또는 T581D 돌연변이, 서열번호 1의 위치 556에 상응하는 위치에서 R, D, 또는 N으로의 돌연변이의 존재가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, I5549L, D561S 및/또는 T581D에 상응하는 점 돌연변이, 및 서열번호 1의 586에 상응하는 위치에서 R 또는 Q로의 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 예를 들어, 서열번호 1과 비교하여 VAR-22는 G586R에 상응하는 돌연변이를 포함하고, VAR-23은 G586Q에 상응하는 돌연변이를 포함하고, VAR-50은 G586Q에 상응하는 돌연변이를 포함한다. 따라서, 이론에 구애됨이 없이 놀랍게도 I5549L, D561S 및/또는 T581D 돌연변이, 서열번호 1의 586에 상응하는 위치에서 R 또는 Q로의 돌연변이의 존재가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다.
일부 실시양태에서, 캡시드 폴리펩티드는 I5549L, D561S 및/또는 T581D에 상응하는 점 돌연변이, 및 서열번호 1의 566에 상응하는 위치에서 A 또는 K로의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 비교하여 VAR-22는 R566A에 상응하는 돌연변이를 포함하고, VAR-23은 R566K에 상응하는 돌연변이를 포함하고, VAR-51은 R566K에 상응하는 돌연변이를 포함한다. 따라서, 이론에 구애됨이 없이 놀랍게도 I5549L, D561S 및/또는 T581D 돌연변이, 서열번호 1의 566에 상응하는 위치에서 A 또는 K로의 돌연변이의 존재가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다.
일부 실시양태에 따르면, 캡시드 폴리펩티드는 서열번호 1의 556에 상응하는 위치에서 아스파라긴에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 K556N을 포함함). 예를 들어, VAR-21은 서열번호 1과 비교하여 K556N 돌연변이를 포함한다(표 1에 나타냄). K556N 돌연변이가 있는 추가 변이체 캡시드 폴리펩티드(VAR-47, VAR-49, VAR-50)를 평가했는데, 이러한 추가 변이체 캡시드 폴리펩티드 각각은 VAR-21에서와 같이 서열번호 1과 비교하여 555 및 557 아미노산 잔기에 돌연변이가 없다. VAR-47, VAR-49 및 VAR-50에 대한 데이터는 표 8에 나와 있으며, VAR-21과 마찬가지로 서열번호 1의 556에 상응하는 위치에서 아스파라긴을 포함하는(예를 들어, K556N 돌연변이) 캡시드 폴리펩티드를 포함하는 바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해 섬유주대 조직의 형질도입을 증가시켰다. 따라서, 이론에 구애됨이 없이 놀랍게도 서열번호 1의 556에 상응하는 위치의 아스파라긴의 존재(예를 들어, K556N 돌연변이의 존재)는 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다. 서열번호 1에 비해, K556N 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 4-12 범위이다(표 8에 나타냄). VAR-21에 비해, K556N 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 9-12이다(표 8에 나타냄). 따라서, 서열번호 1의 556에 상응하는 위치에서 아스파라긴을 포함하는 캡시드 폴리펩티드, 상기 캡시드 폴리펩티드를 암호화하는 핵산 분자, 상기 캡시드 폴리펩티드를 포함하는(예를 들어, 서열번호 1과 비교하여 K556N 돌연변이를 포함하는) 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서, K556N 돌연변이를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, K556N 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-21의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, K556N 돌연변이를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다.
일부 실시양태에서, 서열번호 1의 556에 상응하는 위치에서 아스파라긴에 상응하는 돌연변이를 포함하는(예를 들어, 서열번호 1과 비교하여 K556N 돌연변이를 포함하는) 캡시드 폴리펩티드를 암호화하는 핵산 분자가 본원에 개시된다. 표 8에 나타낸 바와 같이, K556N 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드 각각은 서열번호 1과 비교하여 섬유주 형질도입이 증가하였다. 바이러스 입자에 존재하는, 서열번호 1과 비교하여 K556N에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다.
[표 8]
일부 실시양태에서, 서열번호 1의 556에 상응하는 위치에서 아스파라긴을 포함하는(예를 들어, K556N 돌연변이를 포함하는) 캡시드 폴리펩티드에는 하나 이상의 추가 돌연변이가 있다. 일부 실시양태에서, 캡시드 폴리펩티드는 K556N에 상응하는 돌연변이, 및 서열번호 1의 578에 상응하는 위치에서 I, V 또는 T로의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 비교하여 VAR-21은 S578I에 상응하는 돌연변이를 포함하고, VAR-46은 S578V에 상응하는 돌연변이를 포함하고, VAR-47은 S578T에 상응하는 돌연변이를 포함한다. 따라서, 이론에 구애됨이 없이 놀랍게도 K556N 돌연변이 및 서열번호 1의 578에 상응하는 위치에서 I, V 또는 T로의 돌연변이의 존재가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다.
일부 실시양태에 따르면, 캡시드 폴리펩티드는 서열번호 1의 561에 상응하는 위치의 세린에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 D561S를 포함한다). 예를 들어, VAR-19, VAR-22 및 VAR-23은 서열번호 1과 비교하여 D561S 돌연변이를 포함한다(표 1에 나타냄). D561S 돌연변이를 갖는 추가 변이체 캡시드 폴리펩티드(VAR-46, VAR-47, VAR-50, VAR-53)를 평가했는데, 이러한 추가 변이체 캡시드 폴리펩티드 각각은 VAR-19, VAR-22 및 VAR-23에서와 같이 서열번호 1과 비교하여 560, 562, 563, 564 및 565 위치에 돌연변이가 없다. VAR-46, VAR-47, VAR-50 및 VAR-53에 대한 데이터는 표 9에 나와 있으며, VAR-19, VAR-22 및 VAR-23과 마찬가지로 D561S 돌연변이를 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해 섬유주대 조직의 형질도입을 증가시켰다. 따라서, 이론에 구애됨이 없이 놀랍게도 서열번호 1의 561에 상응하는 위치의 세린의 존재(예를 들어, D561S 돌연변이)가 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 형질도입 증가에 기여하는 것으로 밝혀졌다. 서열번호 1에 비해, D561S 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 7-12 범위이다(표 9에 나타냄). VAR-19에 비해, D561S 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 11-14이다(표 9에 나타냄). VAR-22에 비해, D561S 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 10-14이다(표 9에 나타냄). VAR-23에 비해, D561S 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드는 편집 거리가 9-14이다(표 9에 나타냄). 따라서, 서열번호 1의 561에 상응하는 위치에서 세린을 포함하는 캡시드 폴리펩티드, 상기 캡시드 폴리펩티드를 암호화하는 핵산 분자, 상기 캡시드 폴리펩티드를 포함하는(예를 들어, 서열번호 1과 비교하여 D561S 돌연변이를 포함하는) 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서, D561S 돌연변이를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-19의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-23의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 돌연변이를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 일부 실시양태에서, 서열번호 1의 561에 상응하는 위치의 세린에 상응하는 돌연변이를 포함하는(예를 들어, 서열번호 1과 비교하여 D561S 돌연변이를 포함하는) 캡시드 폴리펩티드를 암호화하는 핵산 분자가 본원에 개시된다. 표 9에 나타낸 바와 같이, D561S 돌연변이를 포함하는 추가 변이체 캡시드 폴리펩티드 각각은 서열번호 1과 비교하여 섬유주 형질도입을 증가시켰다. 따라서, 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 D561S에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다.
[표 9]
일부 실시양태에서, 서열번호 1의 561에 상응하는 위치에서 세린을 포함하는(예를 들어, D561S 돌연변이를 포함하는) 캡시드 폴리펩티드는 하나 이상의 추가 돌연변이를 갖는다. 일부 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 561에 상응하는 위치의 세린 및 서열번호 1의 581에 상응하는 위치의 아스파르트산에 상응하는 점 돌연변이를 포함한다(예를 들어, 서열번호 1과 비교하여 D561S 및 T581D 돌연변이를 포함함). 예를 들어, VAR-22, VAR-23, VAR-46, VAR-47, VAR-50 및 VAR-53은 서열번호 1과 비교하여 D561S 및 T581D에 상응하는 돌연변이를 포함한다. 따라서, 이론에 구애됨이 없이 놀랍게도 D561S 및 T581D 돌연변이 둘 다의 존재는 이러한 돌연변이를 포함하지 않는 캡시드 폴리펩티드에 비해 다양한 캡시드 폴리펩티드 서열의 맥락에서 섬유주대 조직의 증가된 형질도입에 기여하는 것으로 밝혀졌다. 따라서, 서열번호 1의 561에 상응하는 위치에서 세린을 포함하고, 서열번호 1의 581에 상응하는 위치에서 아스파르트산을 포함하는(예를 들어, 서열번호 1과 비교하여 D561S 및 T581D 돌연변이를 포함하는) 캡시드 폴리펩티드, 상기 캡시드 폴리펩티드를 암호화하는 핵산 분자, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자, 및 이의 제조 및 사용 방법이 본원에 기술된다. 일부 실시양태에서, D561S 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드는 서열번호 1과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-22의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 임의로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드는 VAR-23의 캡시드 폴리펩티드 서열과의 서열 동일성이 95% 초과, 96% 초과, 97% 초과 또는 선택적으로 98% 초과 또는 99% 초과이다. 일부 실시양태에서, D561S 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드에는 서열번호 1에 비해 1-20개, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 돌연변이가 있다. 일부 실시양태에서, 서열번호 1과 비교하여 D561S 및 T581D 돌연변이에 상응하는 돌연변이를 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 분자가 본원에 개시된다. 일부 실시양태에서, 바이러스 입자에 존재하는, 서열번호 1과 비교하여 D561S 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드는 기준 캡시드 폴리펩티드, 예를 들어, 야생형 캡시드 폴리펩티드(서열번호 1)를 갖는 바이러스 입자와 비교하여 섬유주대에서의 형질도입을 증가시킨다.
서열번호 1의 587에 상응하는 위치에서 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 실시양태에서, 돌연변이는 알라닌에 대한 것이다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1에 따른 N587A 돌연변이를 포함한다. 또한, 서열번호 1의 587에 상응하는 위치의 돌연변이의 N-말단에 인접한 2개의 아미노산 사이에 하나 이상의 아미노산, 예를 들어, 4개 이상의 아미노산, 예를 들어, 7, 8, 9개 이상의 아미노산, 예를 들어, 7개와 10개 사이의 아미노산의 삽입을 추가로 포함하는, 서열번호 1의 587에 상응하는 위치에서 돌연변이, 예를 들어, 알라닌으로의 돌연변이를 포함하는(예를 들어, 서열번호 1에 따른 N587A를 포함하는) 캡시드 폴리펩티드가 본원에 개시된다. 실시양태에서, 삽입은 7개 아미노산이다. 실시양태에서, 삽입은 8개 아미노산이다. 실시양태에서, 삽입은 9개 아미노산이다. 실시양태에서, 삽입은 10개 아미노산이다. 실시양태에서, 삽입은 서열번호 1의 587에 상응하는 위치에서 돌연변이의 N-말단에 3개 이하의 아미노산 뒤에 발생한다. 실시양태에서, 삽입은 서열번호 1의 580 내지 587에 상응하는 아미노산으로부터 선택된 2개의 인접한 아미노산 사이에서 일어난다. 실시양태에서, 삽입은 서열번호 1의 584와 585에 상응하는 아미노산 사이에서 일어난다. 실시양태에서, 삽입은 서열번호 1의 586과 587에 상응하는 아미노산 사이에서 일어난다. 실시양태에서, 서열번호 1과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하고 서열번호 1의 N587에 상응하는 위치에서 알라닌을 포함하고 서열번호 1의 위치 586과 587에 상응하는 아미노산 사이에 삽입을 포함하는 캡시드 폴리펩티드가 본원에 개시된다. 상기 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자가 본원에 개시된다. 또한, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자, 예를 들어, 데펜도파보바이러스 입자가 개시되어 있다. 실시양태에서, 이러한 바이러스 입자, 예를 들어, 데펜도파보바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해, 예를 들어, 표적 조직으로부터의 바이러스 RNA의 정량화로 측정했을 때 눈의 황반 및/또는 비황반 망막 조직의 형질도입을 증가시킨다. 실시양태에서, 이러한 바이러스 입자, 예를 들어, 데펜도파보바이러스 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자에 비해, 예를 들어, 표적 조직으로부터의 바이러스 RNA의 정량화로 측정했을 때 전안부 조직(예를 들어, 섬유주대 및/또는 쉴렘관 조직)의 형질도입을 증가시킨다.
본원의 실시예 3에 기술된 바와 같이, 본원에 기술된 각각의 변이체에 존재하는 돌연변이의 하위조합은 가능한 모든 1-돌연변이, 2-돌연변이, 3-돌연변이, 4-돌연변이 등을 각 변이체의 돌연변이 총 개수까지 계산적으로 정의함으로써 결정되었다(삽입된 아미노산의 연속 문자열은 이 분석만을 위해 1개의 돌연변이로 계산됨). 적어도 돌연변이의 이러한 하위조합과 하위조합에 지정되지 않은 최대 3개의 추가 돌연변이를 포함하는 라이브러리 실험 1 및 라이브러리 실험 2에서 테스트된 고유 변이체를 풀링하고, 각 풀의 모든 변이체에 대해 전체 망막 형질도입 중앙값을 계산하였다. 분석을 통해 변이체 캡시드 폴리펩티드에 존재할 때 라이브러리 실험 1 및 라이브러리 실험 2에서 테스트된 wtAAV2 전체 망막 형질도입 변이체 중앙값보다 더 나은 결과를 가져오는 몇 가지 최소 구조적 요소(돌연변이 세트)를 확인한다. 이러한 돌연변이 세트와 각 풀과 연관된 추가 데이터는 아래 표 12 및 표 13에 나와 있다.
[표 12]
[표 13]
따라서, 본원에서는 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 표 12 또는 표 13에 나열된 공통 돌연변이 세트를 포함하는 서열을 포함하는 캡시드 폴리펩티드가 제공된다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 본원에 기술된 바와 같은 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 바와 같은 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱으로 결정했을 때 야생형 AAV2에 비해 망막 형질도입이 적어도 2배 증가한다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-11과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) R459- 및 T456-, (2) R459- 및 Q457-, (3) S458-, T456- 및 L460-, (4) R459-, Q457- 및 T456-, (5) Q457- 및 L460-, (6) R459-, Q457- 및 L460-, (7) R459-, S458- 및 Q457-, (8) S458-, Q457- 및 T456-, (9) L460-, S458-, R459-, Q457- 및 T456-, (10) R459-, S458-, Q457- 및 L460-, (11) R459-, S458-, Q457- 및 T456-, (12) S458- 및 L460-, (13) R459-, S458-, L460-, (14) R459- 및 S458-, (15) S458- 및 Q457-, 또는 (16) S458- 및 T456-를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배 또는 적어도 4배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-12와 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) S458Q, T455Q 및 P451G, (2) T456N 및 R459T, (3) N449I, T456N, R459T 및 T455Q, (4) R459T 및 P451G, (5) S458Q, T454- 및 T450N, (6) R459T 및 T454-, 또는 (7) S458Q, Q461K, R459T 및 Q464V를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 4배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-13과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) S446A, P451Q, T455G, N449-, T448-, G453T 및 Q457T, (2) S446A, P451Q, T456G, T455G, N449-, T448-, G453T 및 Q457T, (3) S446A 및 Q457T, 또는 (4) S446A 및 T456G를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 VP1에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-14와 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) T455A, T450S 및 R459D, (2) N449Q, T455A, T450S 및 R459D, (3) N449Q, T450S 및 R459D, (4) S452G, T455A, T450S, N449Q 및 R459D, (5) N449Q, S452G, T455A 및 R459D, (6) N449Q, T455A 및 R459D, (7) N449Q, S452G 및 R459D, 또는 (8) N449Q 및 R459D를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, P2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90% 동일한 서열을 포함하고 S578D 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-21과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) S578I 및 M558L, (2) S578I 및 S580A, (3) M558L 및 S580A, (4) K556N 및 S578I를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90% 동일한 서열을 포함하고 S578I 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90% 동일한 서열을 포함하고 I559L 및 T581D 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-26과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) R588T, R585S, T597S, A591I 및 V600A, (2) R588T, R585S, Q589N, A590P, T597S 및 A591I, (3) A593G, R585S, T597S, A591I 및 V600A, (4) R588T, R585S, A590P, T597S, A591I 및 V600A, (5) R588T, A593G, R585S, Q589N, A590P 및 V600A, (6) R588T, A593G, Q589N, A590P 및 A591I, (7) R588T, R585S, Q589N, A590P 및 T597S, 또는 (8) R588T, R585S, Q589N, A590P, T597S 및 V600A를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90% 동일한 서열을 포함하고 서열번호 1의 아미노산 580과 600 사이에, 바람직하게는 서열번호 1의 위치 592 뒤의 임의의 위치에서 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되며, 상기 삽입은 LX1X2를 포함하고, X1 및 X2는 임의의 아미노산이거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-3과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) P451T, T456G, T455L, N449Q, S458Q 및 Q457T, (2) P451T, T456G, T450M, N449Q, S458Q 및 Q457T, (3) N449Q, T455L, T456G 및 S458Q, (4) P451T, T455L, N449Q, S458Q 및 Q457T, (5) P451T, T456G, T455L, N449Q 및 Q457T, (6) P451T, T456G, R459M, N449Q 및 Q457T를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-3, VAR-4 VAR-8, VAR-13 및/또는 VAR-14와 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) N449Q, (2) N449Q 및 T456G, (3) N449Q, T456G 및 Q457T, (4) T456G, (5) T456G 및 Q457T, (6) Q457T 또는 (7) N449Q 및 Q457T를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 위치 580-600 중 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 587 다음에 적어도 6개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 X1X2EQTRPA(서열번호 134)를 포함하거나 이로 이루어지고, X1 및 X2는 임의의 아미노산으로부터 독립적으로 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-4와 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) N449Q, T456G 및 S452T, (2) S452T, T456G 및 Q457T, (3) T456G, P451-, Q457T, N449Q 및 R459G, (4) S452T, P451- 및 Q457T, (5) N449Q, P451-, T456G 및 S452T, (6) S452T 및 P451-, (7) N449Q, Q457T 및 S452T, (8) N449Q, Q457T 및 R459G, (9) N449Q, P451-, T456G 및 Q457T, 또는 (10) P451- 및 R459G를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-4 및 VAR-13과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) T456G, R459G 및 Q457T, (2) R459G를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-40과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) T597A, R585S, G586S, A591E, D594R 및 V600I, (2) R585S, G586S, A591E, D594R 및 V600I, (3) A591E, T597A, R585S 및 D594R, (4) T597A, R585S, N587A, G586S, D594R 및 V600I, (5) T597A, R585S, N587A, A591E 및 D594R, (6) T597A, R585S, N587A, G586S 및 D594R, (7) A591E, T597A, R585S 및 G586S, 또는 (8) R585S, N587A, G586S, A591E 및 V600I를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-8과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) P451T, T456G, T455G, R459T, S458Q 및 Q457T, (2) T456G, T455G, R459T, S458Q 및 Q457T, (3) P451T, T456G, T455G, R459T 및 Q457T, (4) P451T, S458Q, Q457T 및 T455G, (5) Q461A, R459T, T456G 및 T455G, (6) S458Q, R459T, T456G 및 T455G, (7) P451T, T456G, R459T, S458Q 및 Q457T, (8) P451T, S458Q, Q457T 및 R459T, (9) P451T, S458Q, T456G 및 R459T, (10) T456G, T455G, Q461A, S458Q 및 Q457T, (11) P451T, T456G, T455G, Q461A, R459T 및 Q457T, (12) P451T, Q461A, R459T, S458Q 및 Q457T, (13) S458Q, T456G, T455G 및 Q457T, (14) P451T, T456G, Q461A, R459T 및 S458Q, (15) Q461A, R459T 및 T455G, (16) T456G, T455G, Q461A, R459T 및 S458Q, (17) Q461A, P451T 및 T455G, (18) P451T, R459T, T456G 및 Q457T, (19) S458Q, R459T, T456G 및 Q457T, (20) R459T, T456G 및 T455G, (21) S458Q, T456G 및 R459T, (22) Q461A, R459T, S458Q 및 T455G, (23) T456G, T455G, Q461A, R459T, S458Q 및 Q457T, (24) T456G, Q461A, R459T, S458Q 및 Q457T, (25) R459T 및 T456G, (26) P451T, S458Q, R459T 및 Q461A, (27) T455G, Q461A, R459T, S458Q 및 Q457T, (28) T456G, T455G, Q461A, R459T 및 Q457T, (29) Q461A, T456G, T455G 및 Q457T, (30) Q461A, R459T, T456G 및 Q457T, (31) Q461A, S458Q 및 R459T (32) S458Q, R459T 및 Q457T, (33) R459T 및 Q457T, (34) R459T 및 T455G, (35) Q461A 및 R459T, (36) Q461A, P451T, T456G 및 Q457T, (37) P451T, T456G 및 R459T, (38) P451T, S458Q 및 R459T, 또는 (39) Q461A 및 T455G를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 32배, 적어도 16배, 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 VAR-8 및 VAR-12 또는 VAR-13과 연관된 공통 돌연변이 세트를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 공통 돌연변이 세트는 (1) S458Q 및 R459T, (2) R459T, (3) T456G 및 T455G, 또는 (4) Q457T 및 T455G를 포함하거나 이로 이루어진다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 32배, 적어도 16배, 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600 중 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 584 다음에 적어도 4개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 RAYNX1X2(서열번호 135)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, P2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 바와 같이 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90% 동일한 서열을 포함하고 R566K 돌연변이를 포함하는 캡시드 폴리펩티드가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 4개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 DQDFKX1X2(서열번호 136)를 포함하거나 이로 이루어지고, X1 및 X2는 임의의 아미노산으로부터 독립적으로 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 587 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 IEQTRX1X2(서열번호 137) 또는 LAIEQTRX1X2(서열번호 138)를 포함하거나 이로 이루어지고, X1 및 X2는 임의의 아미노산으로부터 독립적으로 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 587 다음에 적어도 6개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 X1X2EQTRPA(서열번호 132)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 587 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 X1X2QTRPA(서열번호 139)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 584 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 RARLDX1X2(서열번호 140), RARLDEX1X2(서열번호 141) 또는 RARLDETX1X2(서열번호 142)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서 캡시드 폴리펩티드는 G586P 돌연변이를 추가로 포함한다. 실시양태에서, 캡시드 폴리펩티드는 N587A 돌연변이를 추가로 포함한다. 실시양태에서, 캡시드 폴리펩티드는 G586P 및 N587A 돌연변이를 추가로 포함한다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 584 다음에 적어도 7개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 RARLDETX1X2(서열번호 142)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 X1X2GEQTRP(서열번호 143) 또는 X1X2EQTRP(서열번호 144)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 4개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 ATDTX1X2(서열번호 145)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 ATDTKX1X2(서열번호 146)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 6개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 ATDTKT(서열번호 115)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
캡시드 폴리펩티드, 예를 들어, 서열번호 1의 VP1, VP2 또는 VP3과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 서열을 포함하고 서열번호 1의 아미노산 위치 580-600의 임의의 것 다음에, 예를 들어, 서열번호 1에 따른 아미노산 586 다음에 적어도 5개 아미노산의 삽입을 포함하는 캡시드 폴리펩티드가 본원에서 제공되고, 상기 삽입은 X1X2TDTKT(서열번호 147)를 포함하거나 이로 이루어지고, X1 및 X2는 독립적으로 임의의 아미노산으로부터 선택되거나 존재하지 않는다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 1의 VP1, VP2 또는 VP3 서열에 비해 추가 돌연변이를 10개 미만, 9개 미만, 8개 미만, 7개 미만, 6개 미만, 5개 미만, 4개 미만, 3개 미만, 2개 미만 포함하거나 포함하지 않는다. 실시양태에서, 상기 캡시드 폴리펩티드를 포함하는 바이러스 입자는, 예를 들어, 벌크 망막 조직으로부터의 바이러스 cDNA의 NGS 시퀀싱에 의해 결정되는 바와 같이, 야생형 AAV2를 포함하는 바이러스 입자에 비해 증가된 망막 형질도입을 나타낸다. 실시양태에서, 바이러스 입자는, 예를 들어, 본원에 기술된 대로 결정되는 바와 같이 야생형 AAV2에 비해 적어도 8배, 적어도 4배 또는 적어도 2배 증가된 망막 형질도입을 나타낸다.
실시양태에서, 상술한 캡시드 폴리펩티드, 예를 들어, VP1, VP2 또는 VP3 캡시드 폴리펩티드를 암호화하는 핵산 분자가 본원에서 제공된다. 실시양태에서, 상술한 캡시드 폴리펩티드, 예를 들어, VP1, VP2 또는 VP3 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다.
본원에 기술된 조성물의 제조 방법
본 개시내용은 부분적으로 본원에 기술된 캡시드 폴리펩티드 또는 데펜도파보바이러스 입자, 예를 들어, 본원에 기술된 데펜도파보바이러스 입자의 제조 방법에 관한 것이다. 일부 실시양태에서, 데펜도파보바이러스 입자의 제조 방법은 본원에 제공된 변이체 캡시드 폴리펩티드를 암호화하는 본원에 기술된 핵산, 또는 본원에 제공된 폴리펩티드(예를 들어, 변이체 캡시드 폴리펩티드)를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템을 제공하는 단계; 및 데펜도파보바이러스 입자의 생성에 적합한 조건하에서 상기 세포, 무세포 시스템 또는 다른 번역 시스템을 배양하여 데펜도파보바이러스 입자를 제조하는 단계를 포함한다.
일부 실시양태에서, 본원에 기술된 핵산을 포함하는 세포를 제공하는 것은 핵산을 세포에 도입하는 것, 예를 들어, 세포를 핵산으로 형질감염시키거나 형질전환시키는 것을 포함한다. 본 개시내용의 핵산은 숙주 세포로 전달될 수 있는 임의의 유전 요소(벡터), 예를 들어, 네이키드 DNA, 플라스미드, 파지, 트랜스포존(transposon), 코스미드(cosmid), 에피솜(episome), 비바이러스 전달 비히클(예를 들어, 지질 기반 운반체)의 단백질, 바이러스 등의 일부로서 위치할 수 있으며 운반된 서열을 전달할 수 있다. 이러한 벡터는 형질감염, 리포좀 전달, 전기천공, 막 융합 기술, 바이러스 감염, 고속 DNA 코팅된 펠릿 및 원형질체 융합을 비롯한 임의의 적합한 방법에 의해 전달될 수 있다. 당업자는 본 발명의 임의의 실시양태를 구성하기 위한 핵산 조작에 대한 지식과 기술을 보유하고 있으며, 상기 기술에는 유전 공학, 재조합 공학 및 합성 기술이 포함된다. 예를 들어, Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참고.
일부 실시양태에서, 본 개시내용의 벡터는 본원에 제공된 데펜도파보바이러스 변이체 캡시드 폴리펩티드 또는 이의 단편을 암호화하는 서열을 포함한다. 일부 실시양태에서, 본 개시내용의 벡터는 데펜도파보바이러스 rep 단백질 또는 이의 단편을 암호화하는 서열을 포함한다. 일부 실시양태에서, 이러한 벡터는 데펜도파보바이러스 cap(예를 들어, 본원에 기술된 변이체 캡시드 폴리펩티드)과 rep 단백질을 모두 암호화하는 서열을 함유할 수 있다. AAV rep와 cap이 모두 제공되는 벡터에서 데펜도파보바이러스 rep와 데펜도파보바이러스 cap 서열은 모두 AAV2와 같은 동일한 데펜도파보바이러스 종 또는 혈청형 기원일 수 있다. 대안적으로, 본 개시내용은 또한 cap 서열이 유래된 것과 상이한 데펜도파보바이러스 종 또는 혈청형으로부터 rep 서열이 유래된 벡터를 제공한다. 일부 실시양태에서, rep 및 cap 서열은 별도의 공급원(예를 들어, 별도의 벡터, 또는 숙주 세포 게놈 및 벡터)으로부터 발현된다. 일부 실시양태에서, rep 서열은 상이한 데펜도파보바이러스 종 또는 혈청형의 cap 서열에 프레임 내 융합되어 키메라 데펜도파보바이러스 벡터를 형성한다. 일부 실시양태에서, 본 발명의 벡터는 페이로드, 예를 들어, 데펜도파보바이러스 5' ITR 및 데펜도파보바이러스 3' ITR이 측면에 있는 페이로드, 예를 들어, 선택된 전이유전자를 포함하는 미니유전자(예를 들어, 본원에 기술된 바와 같은 페이로드)를 추가로 함유한다.
본원에 기술된 벡터, 예를 들어, 플라스미드는 다양한 목적에 유용하지만, 데펜도파보바이러스 서열 또는 이의 단편, 및 일부 실시양태에서는 페이로드를 포함하는 재조합 데펜도파보바이러스 입자의 생성에 사용하기에 특히 매우 적합하다.
일부 실시양태에서, 본 개시내용은 데펜도파보바이러스 입자(예를 들어, 데펜도파보바이러스 B 입자, 예를 들어, AAV2 입자 또는 본원에 기술된 바와 같은 변이체 캡시드 폴리펩티드를 포함하는 입자) 또는 이의 일부의 제조 방법을 제공한다. 일부 실시양태에서, 상기 방법은 본원에 제공된 바와 같은 데펜도파보바이러스 변이체 캡시드 폴리펩티드 또는 이의 단편을 암호화하는 핵산 서열, 기능적 rep 유전자; (예를 들어, 본원에 기술된 바와 같은) 페이로드, 예를 들어, 데펜도파보바이러스 역 말단 반복(ITR) 및 전이유전자를 포함하는 미니유전자를 함유하고 페이로드, 예를 들어, 미니유전자를 데펜도파보바이러스 캡시드로 패키징하는 것을 촉진하는 데 충분한 헬퍼 기능이 있는 숙주 세포를, 선택적으로 프로모터와 같은 조절 요소의 제어하에 배양하는 단계를 포함한다. 데펜도파보바이러스 캡시드에 페이로드, 예를 들어 미니유전자를 패키징하기 위해 숙주 세포에서 배양하는 데 필요한 성분은 트랜스로 숙주 세포에 제공될 수 있다. 일부 실시양태에서, 필요한 성분(예를 들어, 페이로드(예를 들어, 미니유전자), rep 서열, cap 서열 및/또는 헬퍼 기능) 중 임의의 하나 이상은 당업자에게 알려진 방법을 사용하여 하나 이상의 필요한 성분을 안정적으로 포함하도록 조작된 숙주 세포에 의해 제공될 수 있다. 일부 실시양태에서, 필요한 성분(들)을 안정하게 포함하도록 조작된 숙주 세포는 이를 유도성 프로모터의 제어하에 포함한다. 일부 실시양태에서, 필요한 성분은 상시발현 프로모터의 제어하에 있을 수 있다. 적합한 유도성 및 상시발현 프로모터의 예가 본원에 제공되며 추가 예는 당업자에게 공지되어 있다. 일부 실시양태에서, 하나 이상의 성분을 안정하게 포함하도록 조작된 선택된 숙주 세포는 상시발현 프로모터의 제어하에 있는 성분 및 하나 이상의 유도성 프로모터의 제어하에 있는 또 다른 성분을 포함할 수 있다. 예를 들어, 필요한 성분을 안정적으로 포함하도록 조작된 숙주 세포는 하나 이상의 유도성 프로모터의 제어하에 rep 및/또는 cap 단백질을 포함하는 293개의 세포(예를 들어, 상시발현 프로모터의 제어하에 헬퍼 기능을 포함함)로부터 생성될 수 있다.
본 개시내용의 데펜도파보바이러스 입자를 생성하는 데 필요한 페이로드(예를 들어, 미니유전자), rep 서열, cap 서열 및 헬퍼 기능은 그에 전달되는 서열을 전달하는 임의의 유전 요소(예를 들어, 벡터 또는 벡터의 조합) 형태로 숙주 세포를 패키징하는 데 전달될 수 있다. 유전 요소는 본원에 기술된 방법을 포함하여 임의의 적합한 방법에 의해 전달될 수 있다. 본 개시내용의 유전 요소, 벡터 및 기타 핵산을 구성하는 데 사용되는 방법은 당업자에게 알려져 있으며 유전 공학, 재조합 공학 및 합성 기술을 포함한다. 예를 들어, Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참고. 유사하게, rAAV 비리온을 생성하는 방법은 잘 알려져 있으며 적합한 방법의 선택은 본 발명을 제한하지 않는다. 예를 들어, K. Fisher 등, J. Virol, 70:520-532 (1993) 및 미국 특허 제5,478,745호 참고. 달리 명시하지 않는 한, 본원에 기술된 데펜도파보바이러스 ITR 및 기타 선택된 데펜도파보바이러스 성분은 임의의 데펜도파보바이러스 종 및 혈청형, 예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV9로부터 용이하게 선택될 수 있다. ITR 또는 기타 데펜도파보바이러스 성분은 데펜도파보바이러스 종 또는 혈청형으로부터 당업자가 이용할 수 있는 기술을 사용하여 쉽게 단리할 수 있다. 데펜도파보바이러스 종 및 혈청형은 학술, 상업 또는 공공 공급원(예를 들어, American Type Culture Collection, Manassas, VA)에서 분리하거나 얻을 수 있다. 일부 실시양태에서, 데펜도파보바이러스 서열은 문헌 또는, 예를 들어, GenBank 또는 PubMed와 같은 데이터베이스에서 이용 가능한 공개된 서열을 참조하여 합성 또는 기타 적합한 수단을 통해 얻을 수 있다.
본 개시내용의 데펜도파보바이러스 입자(예를 들어, 변이체 캡시드 폴리펩티드 및, 예를 들어, 페이로드를 포함함)는 데펜도파보바이러스 또는 생물학적 생성물의 생성을 허용하고 배양물에서 유지될 수 있는 임의의 무척추 세포 유형을 사용하여 생성할 수 있다. 일부 실시양태에서, 곤충 세포는 본원에 기술된 조성물의 생성에 또는 본원에 기술된 데펜도파보바이러스 입자의 제조 방법에 사용될 수 있다. 예를 들어, 사용되는 곤충 세포주는 스포도프테라 프루기페르다(Spodoptera frugiperda), 예컨대 Sf9, SF21, SF900+, 초파리(drosophila) 세포주, 모기 세포주, 예를 들어, 아에데스 알보픽투스(Aedes albopictus) 유래 세포주, 국내 누에(domestic silkworm) 세포주, 예를 들어, 누에나방(Bombyxmori) 세포주, 트리코플루시아 니(Trichoplusia ni) 세포주, 예컨대 High Five 세포 또는 레피도프테라(Lepidoptera) 세포주, 예컨대 아스칼라파 오도라타(Ascalapha odorata) 세포주에서 유래할 수 있다. 일부 실시양태에서, 곤충 세포는 High Five, Sf9, Se301, SeIZD2109, SeUCR1, SP900+, Sf21, BTI-TN-5B1-4, MG-1, Tn368, HzAml, BM-N, Ha2302, Hz2E5 및 Ao38을 포함하는 바큘로바이러스(baculovirus) 감염에 취약하다.
일부 실시양태에서, 본 개시내용의 방법은 데펜도파보바이러스의 복제 또는 생물학적 생성물의 생성을 허용하고 배양물에서 유지될 수 있는 임의의 포유동물 세포 유형을 사용하여 수행할 수 있다. 일부 실시양태에서, 사용된 포유동물 세포는 HEK293, HEK293T, HeLa, CHO, NS0, SP2/0, PER.C6, Vero, RD, BHK, HT 1080, A549, Cos-7, ARPE-19 또는 MRC-5 세포일 수 있다. 일부 실시양태에서 배양물은 부착성 세포 배양물이다. 일부 실시양태에서, 배양물은 현탁 세포 배양물이다.
곤충 세포에서 단백질(예를 들어, 재조합 또는 이종 단백질, 예를 들어, 데펜도파보바이러스 폴리펩티드)을 발현시키는 방법은 잘 문서화되어 있으며, 핵산, 예컨대 벡터, 예를 들어, 곤충 세포 상용성 벡터(insect-cell compatible vector)를 이러한 세포에 도입하는 방법 및 이러한 세포를 배양물에 유지하는 방법도 잘 문서화되어 있다. 예를 들어, METHODS IN MOLECULAR BIOLOGY, ed. Richard, Humana Press, N J (1995); O'Reilly 등, BACULOVIRUS EXPRESSION VECTORS, A LABORATORY MANUAL, Oxford Univ. Press (1994); Samulski 등, J. Vir. 63:3822-8 (1989); Kajigaya 등, Proc. Nat'l. Acad. Sci. USA 88:4646-50 (1991); Ruffing 등, J. Vir. 66:6922-30 (1992); Kirnbauer 등, Vir. 219:37-44 (1996); Zhao 등, Vir. 272:382-93 (2000); 및 Samulski 등, 미국 특허 제6,204,059호 참고. 일부 실시양태에서, 곤충 세포에서 데펜도파보바이러스 폴리펩티드(예를 들어, 데펜도파보바이러스 게놈)를 암호화하는 핵산 작제물은 곤충 세포 상용성 벡터이다. 본원에서 사용되는 "곤충 세포 상용성 벡터"는 곤충 또는 곤충 세포의 생산적 형질전환 또는 형질감염이 가능한 핵산 분자를 의미한다. 예시적인 생물학적 벡터에는 플라스미드, 선형 핵산 분자 및 재조합 바이러스가 포함된다. 곤충 세포 상용성인 한 임의의 벡터를 사용할 수 있다. 벡터는 곤충 세포의 게놈에 통합되거나 염색체 외부에 남아 있을 수 있다. 벡터는, 예를 들어, 에피솜 벡터로서 영구적으로 또는 일시적으로 존재할 수 있다. 벡터는 당업계에 공지된 임의의 수단에 의해 도입될 수 있다. 이러한 수단에는 세포의 화학적 처리, 전기천공 또는 감염이 포함되지만 이에 제한되지 않는다. 일부 실시양태에서, 벡터는 바큘로바이러스, 바이러스 벡터 또는 플라스미드이다.
일부 실시양태에서, 데펜도파보바이러스 폴리펩티드를 암호화하는 핵산 서열은 Sf9 또는 HEK 세포와 같은 특정 세포 유형에서의 발현을 위한 조절 발현 제어 서열에 작동 가능하게 연결된다. 곤충 숙주 세포 또는 포유동물 숙주 세포에서 외래 유전자를 발현시키기 위한 당업자에게 공지된 기술이 본 개시내용의 조성물 및 방법과 함께 사용될 수 있다. 곤충 세포에서 분자 공학 및 폴리펩티드 발현 방법은 예를 들어, Summers 및 Smith. A Manual of Methods for Baculovirus Vectors and Insect Culture Procedures, Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex. (1986); Luckow. 1991; Prokop 등, Cloning and Expression of Heterologous Genes in Insect Cells with Baculovirus Vectors' Recombinant DNA Technology and Applications, 97-152 (1986); King, L. A. 및 R. D. Possee, The baculovirus expression system, Chapman and Hall, United Kingdom (1992); O'Reilly, D. R., L. K. Miller, V. A. Luckow, Baculovirus Expression Vectors: A Laboratory Manual, New York (1992); W. H. Freeman 및 Richardson, C. D., Baculovirus Expression Protocols, Methods in Molecular Biology, volume 39 (1995); 미국 특허 제4,745,051호; US2003148506; 및 WO 03/074714에 기술되어 있다. 데펜도파보바이러스 폴리펩티드를 암호화하는 뉴클레오티드 서열의 전사에 적합한 프로모터에는 다면체, p10, p35 또는 IE-1 프로모터가 포함되며, 상기 참고문헌에 기술된 추가 프로모터도 고려된다.
일부 실시양태에서, 본원에 기술된 핵산을 포함하는 세포를 제공하는 것은 핵산을 포함하는 세포를 획득하는 것을 포함한다.
세포, 무세포 시스템 및 다른 번역 시스템의 배양 방법은 당업자에게 알려져 있다. 일부 실시양태에서, 세포를 배양하는 것은 세포에 적합한 배지를 제공하고, 바이러스 입자 생성을 달성하기에 적합한 시간 동안 세포와 배지를 인큐베이션하는 것을 포함한다.
일부 실시양태에서, 데펜도파보바이러스 입자의 제조 방법은 데펜도파보바이러스 입자를 하나 이상의 기타 성분(예를 들어, 세포 또는 배지 성분)으로부터 단리하는 것을 포함하는 정제 단계를 추가로 포함한다.
일부 실시양태에서, 데펜도파보바이러스 입자의 생성은 다음 중 하나 이상(예를 들어, 모두)을 포함한다: 데펜도파보바이러스 폴리펩티드의 발현, 데펜도파보바이러스 캡시드(예를 들어, 본원에 제공된 변이체 캡시드 폴리펩티드를 포함하는 캡시드)의 조립, 데펜도파보바이러스 게놈의 발현(예를 들어, 복제) 및 데펜도파보바이러스 게놈을 데펜도파보바이러스 캡시드로 패키징하여 데펜도파보바이러스 입자를 생성함. 일부 실시양태에서, 데펜도파보바이러스 입자의 생성은 데펜도파보바이러스 입자의 분비를 추가로 포함한다.
일부 실시양태에서, 그리고 본원의 다른 곳에 기술된 바와 같이, 변이체 캡시드 폴리펩티드를 암호화하는 핵산 분자는 데펜도파보바이러스 게놈에 배치된다. 일부 실시양태에서, 그리고 본원의 다른 곳에 기술된 바와 같이, 변이체 캡시드 폴리펩티드를 암호화하는 핵산 분자는 본원에 기술된 데펜도파보바이러스 입자의 제조 방법의 일부로서 데펜도파보바이러스 게놈과 함께 데펜도파보바이러스 입자로 패키징된다. 다른 실시양태에서, 변이체 캡시드 폴리펩티드를 암호화하는 핵산 분자는 본원에 기술된 방법에 의해 제조된 데펜도파보바이러스 입자로 패키징되지 않는다.
일부 실시양태에서, 본원에 기술된 데펜도파보바이러스 입자의 제조 방법은 페이로드(예를 들어, 본원에 기술된 페이로드) 및 변이체 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자를 생성한다. 일부 실시양태에서, 페이로드는 (예를 들어, 데펜도파보바이러스 게놈에 더하여) 제2 핵산을 포함하고, 데펜도파보바이러스 입자의 생성은 제2 핵산을 데펜도파보바이러스 입자에 패키징하는 것을 포함한다. 일부 실시양태에서, 데펜도파보바이러스 입자의 제조 방법에 사용하기 위한 세포, 무세포 시스템 또는 다른 번역 시스템은 제2 핵산을 포함한다. 일부 실시양태에서, 제2 핵산은 외인성 서열(예를 들어, 데펜도파보바이러스, 세포, 또는 데펜도파보바이러스 입자가 투여될 표적 세포 또는 대상체에 외인성임)을 포함한다. 일부 실시양태에서, 외인성 서열은 외인성 폴리펩티드를 암호화한다. 일부 실시양태에서, 외인성 서열은 치료 생성물을 암호화한다.
일부 실시양태에서, 본원에 기술된 핵산 또는 폴리펩티드는 당업자에게 알려진 방법에 의해 생성된다. 본 개시내용의 핵산, 폴리펩티드 및 이의 단편은 재조합 생성, 화학적 합성 또는 기타 합성 수단을 포함하는 임의의 적합한 수단에 의해 생성될 수 있다. 이러한 생성 방법은 당업자의 지식 내에 있으며 본 발명을 제한하지 않는다.
응용
본 개시내용은 부분적으로 본원에 기술된 핵산, 폴리펩티드 또는 입자를 포함하는 조성물에 관한 것이다. 추가로 본 개시내용은 부분적으로 본원에 기술된 조성물, 핵산, 폴리펩티드 또는 입자를 활용하는 방법에 관한 것이다. 본 개시내용에 기초하여 명백해지는 바와 같이, 본원에 개시된 핵산, 폴리펩티드, 입자 및 방법은 유용성이 다양하다.
본 개시내용은 부분적으로 본원에 기술된 핵산, 예를 들어, 변이체 캡시드 폴리펩티드를 암호화하는 핵산을 포함하는 벡터에 관한 것이다. 많은 유형의 벡터가 당업자에게 알려져 있다. 일부 실시양태에서, 벡터는 플라스미드를 포함한다. 일부 실시양태에서, 벡터는 단리된 벡터, 예를 들어, 세포 또는 기타 생물학적 성분으로부터 제거된 벡터이다.
본 개시내용은 부분적으로 본원에 기술된 핵산 또는 벡터, 예를 들어, 변이체 캡시드 폴리펩티드를 암호화하는 핵산 분자를 포함하는 핵산 또는 벡터를 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템에 관한 것이다. 일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 변이체 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자를 생성할 수 있다. 일부 실시양태에서, 세포, 무세포 시스템 또는 다른 번역 시스템은 변이체 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자의 생성을 촉진하기에 충분한 데펜도파보바이러스 게놈 또는 데펜도파보바이러스 게놈의 성분을 포함하는 핵산을 포함한다.
일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 데펜도파보바이러스 입자 생성 및/또는 분비를 촉진하는 하나 이상의 비-데펜도파보바이러스 핵산 서열을 추가로 포함한다. 상기 서열은 본원에서 헬퍼 서열로 지칭된다. 일부 실시양태에서, 헬퍼 서열은 또 다른 바이러스, 예를 들어, 아데노바이러스 또는 헤르페스 바이러스로부터의 하나 이상의 유전자를 포함한다. 일부 실시양태에서, 데펜도파보바이러스 입자의 생성 및/또는 분비를 위해서는 헬퍼 서열의 존재가 필요하다. 일부 실시양태에서, 세포, 무세포 시스템 또는 다른 번역 시스템은 하나 이상의 헬퍼 서열을 포함하는 벡터, 예를 들어, 플라스미드를 포함한다.
일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 제1 핵산 및 제2 핵산을 포함하고, 상기 제1 핵산은 하나 이상의 데펜도파보바이러스 유전자(예를 들어, Cap 유전자, Rep 유전자 또는 완전한 데펜도파보바이러스 게놈)를 암호화하는 서열 및 헬퍼 서열을 포함하며, 상기 제2 핵산은 페이로드를 포함한다. 일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 제1 핵산 및 제2 핵산을 포함하고, 상기 제1 핵산은 하나 이상의 데펜도파보바이러스 유전자(예를 들어, Cap 유전자, Rep 유전자 또는 완전한 데펜도파보바이러스 게놈)를 암호화하는 서열 및 페이로드를 포함하며, 상기 제2 핵산은 헬퍼 서열을 포함한다. 일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 제1 핵산 및 제2 핵산을 포함하고, 상기 제1 핵산은 헬퍼 서열 및 페이로드를 포함하고, 상기 제2 핵산은 하나 이상의 데펜도파보바이러스 유전자(예를 들어, Cap 유전자, Rep 유전자 또는 완전한 데펜도파보바이러스 게놈)를 암호화하는 서열을 포함한다. 일부 실시양태에서, 상기 세포, 무세포 시스템 또는 다른 번역 시스템은 제1 핵산, 제2 핵산 및 제3 핵산을 포함하고, 상기 제1 핵산은 하나 이상의 데펜도파보바이러스 유전자(예를 들어, Cap 유전자, Rep 유전자 또는 완전한 데펜도파보바이러스 게놈)를 암호화하는 서열을 포함하고, 상기 제2 핵산은 헬퍼 서열을 포함하고, 상기 제3 핵산은 페이로드를 포함한다.
일부 실시양태에서, 제1 핵산, 제2 핵산 및 선택적으로 제3 핵산은 별도의 분자, 예를 들어, 별도의 벡터들 또는 벡터 및 게놈 DNA에 위치한다. 일부 실시양태에서, 제1 핵산, 제2 핵산 및 선택적으로 제3 핵산 중 1개, 2개 또는 전부가 세포의 게놈에 통합된다(예를 들어, 안정적으로 통합된다).
본 개시내용의 세포는 적합한 세포를 본원에 기술된 핵산으로 형질감염시킴으로써 생성될 수 있다. 일부 실시양태에서, 본원에 제공된 바와 같이 변이체 캡시드 폴리펩티드를 포함하는 데펜도파보바이러스 입자를 제조하는 방법 또는 데펜도파보바이러스 입자를 제조하는 방법을 개선하는 것은 본원에 기술된 세포를 제공하는 것을 포함한다. 일부 실시양태에서, 세포를 제공하는 것은 적합한 세포를 본원에 기술된 하나 이상의 핵산으로 형질감염시키는 것을 포함한다.
일부 실시양태에서, 변이체 캡시드를 포함하는 바이러스 입자는 동일한 생성자 세포 유형, 예를 들어, HEK293 세포, 예를 들어 HEK293 세포의 부착 배양물로부터 wt AAV2의 생성 수준보다 적어도 10%, 적어도 20%, 적어도 50%, 적어도 100%, 적어도 200% 또는 더 높은 수준으로 생성된다.
본원에 기술된 핵산 및 벡터와 함께 사용하기에 적합한 많은 유형 및 종류의 세포가 관련 기술분야에 알려져 있다. 일부 실시양태에서, 세포는 인간 세포이다. 일부 실시양태에서, 세포는 무한증식 세포(immortalized cell)이거나 당업계에 알려진 세포주로부터의 세포이다. 일부 실시양태에서, 세포는 HEK293 세포이다.
바이러스 입자 및 페이로드 전달 방법
본 개시내용은 부분적으로 페이로드를 세포, 예를 들어, 대상체 내 또는 샘플 내 세포에 전달하는 방법에 관한 것이다. 일부 실시양태에서, 페이로드를 세포에 전달하는 방법은 페이로드를 포함하는 변이체 캡시드 폴리펩티드(예를 들어, 본원에 기술됨)를 포함하는 데펜도파보바이러스 입자와 세포를 접촉시키는 것을 포함한다. 일부 실시양태에서, 데펜도파보바이러스 입자는 본원에 기술된 데펜도파보바이러스 입자이고 본원에 기술된 페이로드를 포함한다. 일부 실시양태에서, 세포는 안구 세포이다. 일부 실시양태에서, 안구 세포는 망막, 황반 또는 섬유주대에 있다. 일부 실시양태에서, 안구 세포는 망막에 있다. 일부 실시양태에서, 안구 세포는 황반에 있다. 일부 실시양태에서, 안구 세포는 섬유주대에 있다.
일부 실시양태에서, 안구 세포는 유리액 앞쪽의 구조를 포함하는 눈의 앞쪽 1/3 지점에 있다. 유리액 앞쪽의 구조의 예에는 각막, 홍채, 모양체, 수정체, 섬유주대 및, 쉴렘관이 포함된다. 따라서, 일부 실시양태에서, 세포는 각막, 홍채, 모양체, 수정체, 섬유주대 또는 쉴렘관, 또는 이들의 임의의 조합에 존재한다.
일부 실시양태에서, 안구 세포는 전유리체막 및 그 뒤에 있는 모든 광학 구조, 예컨대 유리액, 망막, 맥락막 또는 시신경, 또는 이들의 임의의 조합과 같이 수정체 후방에 있다. 따라서, 일부 실시양태에서, 세포는 전유리체막 및 그 뒤에 있는 모든 광학 구조, 예컨대 유리액, 망막, 맥락막 또는 시신경, 또는 이들의 임의의 조합에 있다.
본 개시내용은 또한 부분적으로 본원에 기술된 캡시드 폴리펩티드를 포함하는 바이러스 입자에 관한 것이다. 실시양태에서, 바이러스 입자는 본원에 기술된 캡시드 폴리펩티드 및 핵산 발현 작제물을 포함한다. 실시양태에서, 바이러스 입자의 핵산 발현 작제물은 페이로드를 포함한다.
일부 실시양태에서, 페이로드는 전이유전자를 포함한다. 일부 실시양태에서, 전이유전자는 폴리펩티드, RNA(예를 들어, miRNA 또는 siRNA) 또는 기타 관심 생성물을 암호화하는 전이유전자 측면에 있는 벡터 서열에 이종성인 핵산 서열이다. 전이유전자의 핵산은 숙주 세포에서 전이유전자 전사, 번역 및/또는 발현을 촉진하기에 충분한 방식으로 조절 성분에 작동 가능하게 연결될 수 있다.
전이유전자는 임의의 폴리펩티드 또는 RNA 암호화 서열일 수 있으며, 선택된 전이유전자는 계획된 용도에 따라 달라질 것이다. 일부 실시양태에서, 전이유전자는 발현 시 검출 가능한 신호를 생성하는 리포터 서열을 포함한다. 이러한 리포터 서열에는 비제한적으로 비색 리포터(colorimetric reporter)(예를 들어, β-락타마제, β-갈락토시다제(LacZ), 알칼리성 포스파타제), 세포 분열 리포터(예를 들어, 티미딘 키나제(thymidine kinase)), 형광 또는 발광 리포터(예를 들어, 녹색 형광 단백질(green fluorescent protein, GFP) 또는 루시퍼라제(luciferase)), 저항 전달 서열(예를 들어, 클로람페니콜 아세틸트랜스퍼라제(chloramphenicol acetyltransferase, CAT)), 또는 고친화성 항체가 존재하거나, 예를 들어, 항원 태그, 예를 들어, 헤마글루티닌 또는 Myc를 포함하는 것과 같은 통상적인 수단에 의해 생성될 수 있는 막 결합 단백질을 암호화하는 DNA 서열이 포함된다.
일부 실시양태에서, 발현을 유도하는 조절 요소와 작동 가능하게 연결된 리포터 서열은 효소 검정, 방사선투과 검정, 비색 검정, 형광 검정 또는 기타 분광 사진 검정, 형광 활성화 세포 분류 검정(fluorescent activating cell sorting assay), 및 효소 결합 면역흡착 검정(enzyme linked immunosorbent assay, ELISA), 방사면역검정(radioimmunoassay, RIA) 및 면역조직화학(immunohistochemistry)을 포함한 면역학적 검정을 비롯한 기존 수단으로 검출 가능한 신호를 제공한다.
일부 실시양태에서, 전이유전자는 RNA, 단백질, 펩티드, 효소, 우성 음성 돌연변이체와 같은 생물학 및 의학에 유용한 생성물을 암호화한다. 일부 실시양태에서, RNA는 tRNA, 리보솜 RNA, dsRNA, 촉매적 RNA, 소형 헤어핀 RNA, siRNA, 트랜스-스플라이싱 RNA 및 안티센스 RNA를 포함한다. 일부 실시양태에서, RNA는 치료 대상체(예를 들어, 인간 또는 동물 대상체)에서 표적화된 핵산 서열의 발현을 억제하거나 폐기한다.
일부 실시양태에서, 전이유전자는 유전자 결핍을 교정하거나 개선하기 위해 사용될 수 있다. 일부 실시양태에서, 유전자 결핍에는 정상 유전자가 정상 수준 미만으로 발현되는 결핍 또는 기능적 유전자 산물이 발현되지 않는 결핍이 포함된다. 일부 실시양태에서, 전이유전자는 숙주 세포에서 발현되는 치료 단백질 또는 폴리펩티드를 암호화한다. 일부 실시양태에서, 데펜도파보바이러스 입자는, 예를 들어, 다중-하위단위 단백질에 의해 유발된 유전자 결함을 교정하거나 개선하기 위해 다중 전이유전자를 포함하거나 전달할 수 있다. 일부 실시양태에서, 예를 들어, 단백질 하위단위를 암호화하는 DNA의 크기가 큰 경우, 예를 들어, 면역글로불린, 혈소판 유래 성장 인자 또는 디스트로핀 단백질의 경우, 단백질의 각 하위단위를 암호화하거나 서로 다른 펩티드 또는 단백질을 암호화하기 위해 서로 다른 전이유전자(예를 들어, 각각 서로 다른 데펜도파보바이러스 입자 또는 단일 데펜도파보바이러스 입자에 위치/전달됨)를 사용할 수 있다. 일부 실시양태에서, 단백질의 서로 다른 하위단위는 동일한 전이유전자, 예를 들어, 내부 리보자임 진입 부위(internal ribozyme entry site, IRES) 또는 효소적으로 절단 가능한 서열(예를 들어, 푸린 절단 부위)에 의해 분리된 각각의 하위단위에 대한 DNA로 각각의 하위단위를 암호화하는 단일 전이유전자에 의해 암호화될 수 있다. 일부 실시양태에서, 상기 DNA는 번역 후 이벤트에서 자가 절단되는 2A 펩티드를 암호화하는 서열에 의해 분리될 수 있다. 예를 들어, Donnelly 등, J. Gen. Virol., 78(Pt 1):13-21 (January 1997); Furler, 등, Gene Ther., 8(11):864-873 (June 2001); Klump 등, Gene Ther 8(10):811-817 (May 2001) 참고.
일부 실시양태에서, 게놈을 포함하는 바이러스 입자가 제공되며, 상기 게놈은 핵산 발현 작제물을 포함한다. 핵산 발현 작제물은 페이로드, 예를 들어, 이종 전이유전자 및 하나 이상의 조절 요소를 포함하는 페이로드를 포함할 수 있다.
일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배 또는 150배이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직에 비해 비황반 망막 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 비황반 망막 조직에 비해 황반 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 섬유주대 조직에 비해 황반 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 섬유주대 조직에 비해 비황반 망막 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 섬유주대 조직에 비해 황반 조직 및 비황반 망막 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 황반 조직 및 비황반 망막 조직에 비해 섬유주대 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 황반 조직에 비해 섬유주대 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 비황반 망막 조직에 비해 섬유주대 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하며, 상기 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 상기 형질도입의 증가는 섬유주대 조직, 황반 조직 및 비황반 망막 조직에 특이적이다. 일부 실시양태에서, 상기 입자는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 생체분포 없이 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달한다. 전술한 임의의 실시양태에서, 증가된 형질도입 또는 생체분포는 본원 실시예 1에 기술된 바와 같이 측정된다(예를 들어, 형질도입에 대해서는 테스트 물품에서 해당 바이러스 입자의 유병률로 표준화된 관심 대상의 벌크 조직, 예를 들어, NHP 조직으로부터 단리된 바이러스 cDNA의 정량화로 측정되고, 생체분포에 대해서는 테스트 물품에서 해당 바이러스 입자의 유병률로 표준화된 관심 대상의 벌크 조직, 예를 들어, NHP 조직으로부터 단리된 바이러스 DNA의 정량화로 측정됨).
일부 실시양태에서, 조절 요소는 프로모터를 포함한다. 일부 실시양태에서, 프로모터는 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, 관심 인간 세포 유형에서 활성인 유비쿼터스(ubiquitous) 또는 상시발현 프로모터이다. 일부 실시양태에서, 상기 세포 유형은 안구 세포, 예를 들어, 신경 망막 세포(neural retinal cell), 광수용 망막 신경절 세포(photoreceptive retinal ganglion cell), 양극성 세포(bipolar cell), 수평 세포(horizontal cell), 무축색 세포(amacrine cell), 광수용체(photoreceptor)(예를 들어, 간상(rod) 또는 원추(cone) 세포), 내피 세포(endothelial cell)(예를 들어, 망막 색소 상피 세포(retinal pigmented epithelial cell)) 및 내피 유사 세포(endothelial-like cell) 등이다. 유비쿼터스 프로모터의 예에는 CAG 프로모터(사이토메갈로바이러스 조기 인핸서 요소(cytomegalovirus early enhancer element)로부터의 하이브리드, 닭 베타 액틴 프로모터(chicken-beta actin promoter), 예를 들어, 닭 베타 액틴 유전자의 첫 번째 엑손(exon) 및 첫 번째 인트론(intron), 및 선택적으로 토끼 베타 글로빈 유전자(rabbit beta globin gene)의 스플라이스 수용체(splice acceptor)), 닭 베타 액틴 프로모터, CBA 프로모터, CMV 프로모터, 인간 PGK 프로모터, 유비퀴틴 프로모터(ubiquitin promoter), 인간 EF1-알파 프로모터 및 이들의 단편이 포함되지만 이에 제한되지 않는다. 일부 실시양태에서, 프로모터는 조직 특이적 프로모터, 예를 들어, 안구 조직 또는 눈 세포에 특이적인 프로모터이다. 안구 조직 특이적 프로모터의 예에는 TBG 프로모터, hAAT 프로모터, CK8 프로모터 및 SPc5-12 프로모터, 간상체에서 활성인 rho 프로모터, 또는 원추체에서 활성인 옵신 프로모터(opsin promoter)가 포함되지만 이에 제한되지 않는다. 일부 실시양태에서, 조절 요소는 광수용체 세포 특이적 조절 요소(예를 들어, 프로모터), 예를 들어, 로돕신 프로모터(rhodopsin promoter); 로돕신 키나제 프로모터(rhodopsin kinase promoter); 베타 포스포디에스테라제 유전자 프로모터(beta phosphodiesterase gene promoter); 망막색소변성증 유전자 프로모터(retinitis pigmentosa gene promoter); 광수용체간 레티노이드 결합 단백질(interphotoreceptor retinoid-binding protein, IRBP) 유전자 인핸서; IRBP 유전자 프로모터, 옵신 유전자 프로모터(opsin gene promoter), 레티노시신 유전자 프로모터(retinoschisin gene promoter), CRX 호메오도메인 단백질 유전자 프로모터(homeodomain protein gene promoter), 구아닌 뉴클레오티드 결합 단백질 알파 형질도입 활성 폴리펩티드 1(guanine nucleotide binding protein alpha transducing activity polypeptide 1, GNAT1) 유전자 프로모터, 신경 망막 특이적 류신 지퍼 단백질(neural retina-specific leucine zipper protein, NRL) 유전자 프로모터, 인간 콘 어레스틴(human cone arrestin, hCAR) 프로모터, 및 PR2.1, PR1.7, PR1.5 및 PR1.1 프로모터를 포함한다. 일부 실시양태에서, 조절 요소는 망막 색소 상피(retinal pigment epithelia, RPE) 세포 특이적 조절 요소(예를 들어, RPE 특이적 프로모터), 예를 들어, RPE 세포에서 작동 가능하게 연결된 유전자의 선택적 발현을 부여하는 조절 요소, 예를 들어, RPE65 유전자 프로모터, 세포 레틴알데히드 결합 단백질(cellular retinaldehyde-binding protein, CRALBP) 유전자 프로모터, 색소 상피 유래 인자(PEDF, 일명 세르핀(serpin) F1) 유전자 프로모터, 및 난황 황반 이영양증(vitelliform macular dystrophy, VMD2) 프로모터를 포함한다. 일부 실시양태에서, 조절 요소는 신경교세포(glial cell)에 특이적인 프로모터, 예를 들어, 망막 신경교세포에서 작동 가능하게 연결된 페이로드의 선택적 발현을 부여하는 조절 요소, 예를 들어, 신경교섬유질산성단백질(glial fibrillary acidic protein, GFAP) 프로모터를 포함한다. 일부 경우에서, 조절 요소는 양극성 세포에 특이적인 프로모터(예를 들어, 양극성 특이적 프로모터), 예를 들어, 양극성 세포에서 작동 가능하게 연결된 페이로드의 선택적 발현을 부여하는 조절 요소, 예를 들어, GRM6 프로모터를 포함한다. 실시양태에서, 프로모터 서열의 길이는 100 내지 1000개의 뉴클레오티드이다. 실시양태에서, 프로모터 서열의 길이는 약 100개, 약 200개, 약 300개, 약 400개, 약 500개, 약 600개, 약 700개, 약 800개, 약 900개 또는 약 1000개의 뉴클레오티드이다. 앞의 문장에서 사용된 "약"은 인용된 길이의 50개의 뉴클레오티드 이내의 값을 나타낸다. 적합한 조절 요소, 예를 들어, 프로모터는 당업자에 의해 용이하게 선택될 수 있으며, 예를 들어, 본원에 기술된 것들과 같지만 이에 제한되지 않는다.
일부 실시양태에서, 핵산 발현 작제물은 인트론을 포함한다. 인트론은 프로모터와 이종 전이유전자 사이에 배치될 수 있다. 일부 측면에서, 인트론은 발현 작제물 상의 이종 전이유전자에 대해 5'에 배치되며, 예를 들어, 이종 전이유전자에 대해 바로 5'에 또는 이종 전이유전자에 대해 100개 이하의 뉴클레오티드가 5'에 배치된다. 일부 측면에서, 인트론은 인간 b-글로빈 및 Ig 중쇄로부터 유래된 키메라 인트론이다(b-글로빈 스플라이스 공여체/면역글로불린 중쇄 스플라이스 수용체 인트론, 또는 b-글로빈/IgG 키메라 인트론으로도 알려짐; Reed, R., 등 Genes and Development, 1989(본원에 전체 내용이 참조로 포함됨)). 다른 측면에서, 인트론은 VH4 인트론 또는 SV40 인트론이다.
본원에서 제공되는 바와 같이, 일부 실시양태에서는 페이로드를 포함하는 바이러스 입자가 제공되며, 상기 페이로드는 이종 전이유전자를 포함하는 핵산을 포함한다. 일부 실시양태에서, 이종 전이유전자는 RNA 간섭 물질, 예를 들어, siRNA, shRNA 또는 기타 간섭 핵산을 암호화한다.
일부 실시양태에서, 페이로드는 치료 폴리펩티드를 암호화하는 이종 전이유전자를 포함한다. 일부 측면에서, 이종 전이유전자는 인간 유전자 또는 이의 단편이다. 일부 측면에서, 치료 폴리펩티드는 인간 단백질이다. 일부 실시양태에서, 바이러스 입자의 이종 전이유전자는 질환 치료에 유용한 분자를 암호화하고, 바이러스 입자는 상기 질환을 치료하기 위해 치료가 필요한 환자에게 투여된다. 본 개시내용에 따른 질환(및 이종 전이유전자 또는 상기 이종 전이유전자에 의해 암호화된 분자)의 예에는 다음이 포함된다: MPSⅠ(알파-L-이두로니다제(alpha-L-iduronidase, IDUA)); MPS Ⅱ - 헌터 증후군(Hunter syndrome)(이두로네이트-2-설파타제(iduronate-2-sulfatase, IDS)); 세로이드 리포푸스신증-바텐병(Ceroid lipofuscinosis-Batten disease)(CLN1, CLN2, CLN10, CLN13, CLN5, CLN11, CLN4, CNL14, CLN3, CLN6, CLN7, CLN8, CLN12); MPS Ⅲa - 산필리포 A형 증후군(Sanfilippo Type A syndrome)(헤파린 설페이트 설파타제(heparin sulfate sulfatase)(N-설포글루코사민 설포하이드롤라제(N-sulfoglucosamine sulfohydrolase, SGSH)라고도 함)); MPS ⅢB - 산필리포 b형 증후군(N-아세틸-알파-D-글루코사미니다제(N-acetyl-alpha-D-glucosaminidase, NAGLU)); MPS Ⅳ - 마로테오-라미 증후군(Maroteaux-Lamy syndrome)(아릴설파타제(arylsulfatase) B); MPS Ⅳ A - 모르쿠오 증후군(Morquio syndrome) A형(GALNS); MPS Ⅳ B - 모르쿠오 증후군 B형(GLB1); 골형성 부전증(Osteogenesis Imperfecgta) Ⅰ, Ⅱ, Ⅲ 또는 Ⅳ형(COL1Al 및/또는 COL1A2); 유전성 혈관부종(hereditary angioedema)(SERPING1, C1NH); 골형성 부전증 Ⅴ형(IFITM5); 골형성 부전증 Ⅵ형(SERPINF1); 골형성 부전증 Ⅶ형(CRTAP); 골형성 부전증 Ⅷ형(LEPRE1 및/또는 P3H1); 골형성 부전증 Ⅸ형(PPIB); 고셔병(Gaucher disease) Ⅰ, Ⅱ 및 Ⅲ형(글루코세레브로시다제(Glucocerebrosidase); GBAl); 파킨슨병(Parkinson's Disease)(글루코세레브로시다제; GBAl 및/또는 도파민 탈탄산효소(dopamine decarboxylase)); 폼페(Pompe)(산성 말타제(acid maltase); GAA; hGAA); 이염성백질이영양증(Metachromatic leukodystrophy)(아릴 설파타제(Aryl sulfatase) A); MPS Ⅶ - 슬라이 증후군(- Sly syndrome)(베타-글루쿠로니다제(beta-glucuronidase)); MPS Ⅷ(글루코사민-6-설페이트 설파타제(glucosamine-6-sulfate sulfatase)); MPS Ⅸ(히알루로니다제(Hyaluronidase)); 단풍당뇨증(maple syrup urine disease)(BCKDHA, BCKDHB 및/또는 DBT); 니만-피크병(Niemann-Pick disease)(스핑고미엘리나제(Sphingomyelinase)); 파킨슨병(항-알파 시누클레인(anti-alpha synuclein) RNAi); 알츠하이머병(Alzheimer's disease)(항돌연변이체 APP RNAi); 스핑고미엘리나제 결핍이 없는 니만-피크병(콜레스테롤 대사 효소를 암호화하는 NPC1 또는 NPC 유전자); 테이-삭스병(Tay-Sachs disease)(베타-헥소사미니다제(beta-hexosaminidase)의 알파 하위단위); 샌드호프병(Sandhoff disease)(베타-헥소사미니다제의 알파 및 베타 하위단위 모두); 파브리병(Fabry Disease)(알파-갈락토시다제(alpha-galactosidase)); 푸코시드축적증(Fucosidosis)(푸코시다제(fucosidase)(FUCA1)); 알파-만노사이드 축적증(Alpha-mannosidosis)(알파-만노시다제(alpha-mannosidase)); 베타-만노사이드 축적증(Beta-mannosidosis)(베타-만노시다제(beta-mannosidase)); 월만병(Wolman disease)(콜레스테롤 에스테르 가수분해효소(cholesterol ester hydrolase)); 드라베 증후군(Dravet syndrome)(SCN1A, SCN1B, SCN2A, GABRG2); 파킨슨병(Neurturin); 파킨슨병(교세포 유래 성장인자(glial derived growth factor, GDGF)); 파킨슨병(티로신 하이드록실라제(tyrosine hydroxylase)); 파킨슨병(글루탐산 탈탄산효소(glutamic acid decarboxylase); FGF-2; BDGF); 척수근위축증(Spinal Muscular Atrophy, SMN)(SMN1 또는 SMN2 포함); 프리드리히 실조(Friedreich's ataxia)(Frataxin); 근위축성 측삭 경화증(Amyotrophic lateral sclerosis, ALS)(SOD1 억제제, 예를 들어, 항-SOD1 RNAi); 글리코겐축적병(Glycogen Storage Disease) la(글루코스-6-포스파타제(Glucose-6-phosphatase)); XLMTM(MTML); 크리글러 나자르(Crigler Najjar)(UGT1Al); CPVT(CASQ2); 척추소뇌실조증(spinocerebellar ataxia)(ATXN2; ATXN3 또는 기타 ATXN 유전자; 항돌연변이체 마차도-조셉병(Machado-Joseph disease)/SCA3 대립유전자 RNAi); 레트 증후군(Rett syndrome)(MECP2 또는 이의 단편); 색맹(Achromatopsia)(CNGB3, CNGA3, GNAT2, PDE6C); 맥락막결손증(Choroidermia, CDM); 다논병(Danon Disease)(LAMP2); 낭포성 섬유증(Cystic Fibrosis)(CFTR 또는 이의 단편); 뒤센 근이영양증(Duchenne Muscular Dystrophy)(미니-/마이크로-디스트로핀 유전자(Mini-/Micro-Dystrophin Gene)); SARS-Cov-2 감염(항-SARS-Cov-2 RNAi, SARS-Cov-2 게놈 단편 또는 S 단백질(변이체 포함)); 팔다리이음근이영양증(Limb Girdle Muscular Dystrophy) 2C형 - 감마-사르코글리칸병증(Gamma-sarcoglycanopathy)(인간-알파-사르코글리칸(human-alpha-sarcoglycan)); 진행성 심부전(Advanced Heart Failure)(SERCA2a); 류마티스 관절염(Rheumatoid Arthritis)(TNFR:Fc Fusion; 항-TNF 항체 또는 이의 단편); 레버 선천성 흑내장증(Leber Congenital Amaurosis)(GAA); X-연관 부신백질이영양증(X-linked adrenoleukodystrophy)(ABCD1); 팔다리이음근이영양증 2C형 - 감마-사르코글리칸병증(감마-사르코글리칸); 엔젤만 증후군(Angelman syndrome)(UBE3A); 망막색소변성증(Retinitis Pigmentosa)(hMERTK); 노인 황반변성(Age-Related Macular Degeneration)(sFLT01); 팔렌 맥더미드 증후군(Phelan-McDermid syndrome)(SHANK3; 22q13.3 대체); 베커 근이영양증(Becker Muscular Dystrophy) 및 산발성 봉입체 근염(Sporadic Inclusion Body Myositis)(huFollistatin344); 파킨슨병(GDNF); 이염성백질이영양증 - MLD(cuARSA); C형 간염(항-HCV RNAi); 팔다리이음근이영양증 2D형(hSGCA); 인간 면역결핍 바이러스 감염; (PG9DP); 급성 간헐성 포르피린증(Acute Intermittant Porphyria)(PBGD); 레버 유전성 시신경병증(Leber's Hereditary Optical Neuropathy)(PIND4v2); 알파-1 항트립신 결핍증(Alpha-1 Antitrypsin Deficiency)(alphaIAT); X-연관 망막분리(X-linked Retinoschisis)(RS1); 맥락막결손증(Choroideremia)(hCHM); 거대 축색 신경병증(Giant Axonal Neuropathy, GAN); 혈우병(Hemophilia) B(인자 Ⅸ); 동형접합성(Homozygous) FH(hLDLR); 디스펄린병증(Dysferlinopathy, DYSF); 색맹(CNGA3 또는 CNGB3); 진행성 핵상 마비(Progressive supranuclear palsy)(MAPT; 항-Tau; 항-MAPT RNAi); 오미틴 트랜스카바밀라제 결핍증(Omithine Transcarbamylase deficiency, OTC); 혈우병 A(인자 Ⅷ); wetAMD(항-VEGF 항체 또는 RNAi)를 포함하는 노인 황반변성(AMD); X-연관 망막색소변성증(RPGR); 근긴장성 이영양증(Myotonic dystrophy) 1형(DMPK; 항-CTG 트리뉴클레오티드 반복 RNAi를 포함하는 항-DMPK RNAi); 근긴장성 이영양증 2형(CNBP); 안면견갑상완 근이영양증(Facioscapulohumeral muscular dystrophy)(D4Z4 DNA); 눈인두 근이영양증(oculopharynggeal muscular dystrophy)(PABPN1; 돌연변이된 PABPN1 억제제(예를 들어, RNAi)); 점액다당류증(Mucopolysaccharidosis) Ⅵ형(hARSB); 레버 유전성 시신경병증(ND4); X-연관 근세관성근증(X-Linked myotubular Myopathy)(MTM1); 크리글러-나자르 증후군(UGT1A1); 망막색소변성증(hPDE6B); 점액다당류증 3B형(hNAGLU); 뒤센 근이영양증(GALGT2); 알츠하이머병(NGF; ApoE4; ApoE2; ApoE3; 항-ApoE RNAi); 가족성 지질단백질 리파제 결핍증(Familial Lipoprotein Lipase Deficiency)(LPL); 알파-1 항트립신 결핍증(hAAT); 레버 선천성 흑내장증 2(hRPE65v2); 배튼병; 후기 영아 신경원성 지방푸신증(Late Infantile Neuronal Lipofuscinosis)(CLN2); 헌팅턴병(Huntington's disease)(HTT; 항-HTT RNAi); 약체 X 증후군(Fragile X syndrome)(FMR1); 레버 유전성 시신경병증(PlND4v2); 방향족 아미노산 탈탄산효소 결핍증(Aromatic Amino Acid Decarboxylase Deficiency)(hAADC); 망막색소변성증(hMERKTK); 및 망막색소변성증(RLBP1).
일부 측면에서, 이종 전이유전자는 항체 또는 이의 단편(예를 들어, 항체 경쇄, 항체 중쇄, Fab 또는 scFv)을 암호화한다. 이종 전이유전자에 의해 암호화되는 항체 또는 이의 단편의 예에는 항-Ab 항체(예를 들어, 솔라네주맙(solanezumab), GSK933776 및 레카네맙(lecanemab)), 항-소르틸린(anti-sortilin)(예를 들어, AL-001), 항-Tau(예를 들어, ABBV-8E12, UCB-0107 및 NI-105), 항-SEMA4D(예를 들어, VX15/2503), 항-알파 시누클레인(anti-alpha synuclein)(예를 들어, 프라시네주맙(prasinezumab), NI-202 및 MED-1341), 항-SOD1(예를 들어, NI-204), 항-CGRP 수용체(예를 들어, 엡티네주맙(eptinezumab), 프레마네주맙(fremanezumab) 또는 갈카네주맙(galcanezumab)), 항-VEGF(예를 들어, 세바시주맙(sevacizumab), 라니비주맙(ranibizumab), 베바시주맙(bevacizumab) 및 브로루시주맙(brolucizumab)), 항-EpoR(예를 들어, LKA-651), 항-ALK1(예를 들어, 아스크린바쿠밉(ascrinvacumab)), 항-C5(예를 들어, 테시돌루밉(tesidolumab), 라불리주맙(ravulizumab) 및 에쿨리주맙(eculizumab)), 항-CD105(예를 들어, 카로툭시맙(carotuximab)), 항-CClQ(예를 들어, ANX-007), 항-TNFa(예를 들어, 아달리무맙(adalimumab), 인플릭시맙(infliximab) 및 골리무맙(golimumab)), 항-RGMa(예를 들어, 엘레자누맙(elezanumab)), 항-TTR(예를 들어, NI-301 및 PRX-004), 항-CTGF(예를 들어, 팜레블루맙(pamrevlumab)), 항-IL6R(예를 들어, 사트랄리주맙(satralizumab), 토실리주맙(tocilizumab) 및 사릴루맙(sarilumab)), 항-IL6(예를 들어, 실툭시맙(siltuximab), 클라자키주맙(clazakizumab), 시루쿠맙(sirukumab), 올로키주맙(olokizumab) 및 게릴림주맙(gerilimzumab)), 항-IL4R(예를 들어, 두필루맙(dupilumab)), 항-IL17A(예를 들어, 익세키주맙(ixekizumab) 및 세쿠키누맙(secukinumab)), 항-IL5R(예를 들어, 레슬리주맙(reslizumab)), 항-IL-5(예를 들어, 벤랄리주맙(benralizumab) 및 메폴리주맙(mepolizumab)), 항-IL13(예를 들어, 트랄로키누맙(tralokinumab)), 항-IL12/IL23(예를 들어, 우스테키누맙(ustekinumab)), 항-CD19(예를 들어, 이네빌리주맙(inebilizumab)), 항-IL31RA(예를 들어, 네몰리주맙(nemolizumab)), 항-ITGF7 mAb(예를 들어, 에트롤리주맙(etrolizumab)), 항-SOST mAb(예를 들어, 로모소주맙(romosozumab)), 항-IgE(예를 들어, 오말리주맙(omalizumab)), 항-TSLP(예를 들어, 네몰리주맙), 항-pKal mAb(예를 들어, 라나델루맙(lanadelumab)), 항-ITGA4(예를 들어, 나탈리주맙 (natalizumab)), 항-ITGA4B7(예를 들어, 베돌리주맙(vedolizumab)), 항-BLyS(예를 들어, 벨리무맙(belimumab)), 항-PD-1(예를 들어, 니볼루맙(nivolumab) 및 펨브롤리주맙(pembrolizumab)), 항-RANKL(예를 들어, 데노수맙(denosumab)), 항-PCSK9(예를 들어, 알리로쿠맙(alirocumab) 및 에볼로쿠맙(evolocumab)), 항-ANGPTL3(예를 들어, 에비나쿠맙(evinacumab)*), 항-OxPL(예를 들어, E06), 항-fD(예를 들어, 람팔리주맙(lampalizumab)) 또는 항-MMP9(예를 들어, 안데칼릭시맙(andecaliximab))가 포함되지만 이에 제한되지 않고, 선택적으로 중쇄(Fab 및 Fc 영역)와 경쇄는 자가 절단 푸린(F)/F2A 또는 푸린(F)/T2A, IRES 부위 또는 가요성 링커에 의해 분리되어, 예를 들어, 동일한 양의 중쇄 및 경쇄 폴리펩티드의 발현을 보장한다.
실시양태에서, 페이로드는 눈 장애와 관련된 유전자 산물을 암호화하는 핵산 또는 이의 단편을 포함한다. 눈 장애와 관련된 예시적인 유전자 산물에는, 예를 들어, ADP-리보실화 인자 유사 6(ADP-ribosylation factor-like 6, ARL6); BBSome 상호작용 단백질 1(BBIP1); BBSome 단백질 1(BBS1); BBSome 단백질 2(BBS2); BBSome 단백질 4(BBS4); BBSome 단백질 5(BBS5); BBSome 단백질 7(BBS7); BBSome 단백질 9(BBS9); BBSome 단백질 10(BBS10); BBSome 단백질 12(BBS12); 중심체 단백질(centrosomal protein) 290kDa(CEP290); 편모내 수송 단백질 172(intraflagellar transport protein 172, IFT172); 편모내 수송 단백질 27(IFT27); 이노시톨 폴리포스페이트-5-포스파타제 E(inositol polyphosphate-5-phosphatase E, INPP5E); 내부 정류 칼륨 채널 서브패밀리 J 구성원 13(inwardly-rectifying potassium channel subfamily J member 13, KCNJ13); 류신 지퍼 전사 인자 유사 1(leucine zipper transcription factor like-1, LZTFL1); 맥쿠식-카우프만 증후군 단백질(McKusick-Kaufman syndrome protein, MKKS); 메켈 증후군 1형 단백질(Meckel syndrome type 1 protein, MKS1); 신장황폐증 3 단백질(nephronophthisis 3 protein, NPHP1); 혈청학적 규정 결장암 항원 8(serologically-defined colon cancer antigen 8, SDCCAG8); 삼자 모티프 함유 단백질 32(tripartite motif-containing protein 32, TRIM32); 테트라트리코펩티드 반복 도메인 8(tetratricopeptide repeat domain 8, TTC8); 바텐병 단백질(CLN3); 시토크롬 P450 4V2(cytochrome P450 4V2, CYP4V2); Rab 에스코트 단백질(escort protein) 1(CHM); PR(양성 조절) 도메인 함유 13 단백질(positive regulatory domain-containing 13 protein, PRDM13); RPE-레티날 G 단백질 결합 수용체(retinal G protein-coupled receptor, RGR); TEA 도메인 패밀리 구성원 1(TEA domain family member 1, TEAD1); 아릴하이드로카본 상호작용 수용체 단백질 유사 1(arylhydrocarbon-interacting receptor protein-like 1, AIPL1); 원추-간상 otx 유사 광수용체 호메오박스 전사 인자(cone-rod otx-like photoreceptor homeobox transcription factor, CRX); 구아닐레이트 사이클라제 활성화 단백질 1A(guanylate cyclase activating protein 1A, GUCA1A); 레티날 특이적 구아닐레이트 사이클라제(retinal-specific guanylate cyclase, GUCY2D); 포스파티딜이노시톨 전달막 관련 패밀리 구성원 3(phosphatidylinositol transfer membrane-associated family member 3, PITPNM3); 프로미닌 1(prominin 1, PROM1); 페리페린(peripherin, PRPH); 페리페린 2(PRPH2); 조절 시냅스막 세포외유출 단백질 1(regulating synaptic membrane exocytosis protein 1, RIMS1); 세마포린 4A(semaphorin 4A, SEMA4A); C. elegans unc119 단백질(UNC119)의 인간 동족체; ATP 결합 카세트 수송체 - 레티날(ABCA4); ADAM 메탈로펩티다제 도메인 9(ADAM metallopeptidase domain 9, ADAM9); 활성화 전사 인자 6(activating transcription factor 6, ATF6); 염색체 21번 오픈 리딩 프레임 2(chromosome 21 open reading frame 2, C21orf2); 염색체 8번 오픈 리딩 프레임 37(C8orf37); 칼슘 채널; 전압 의존적; 알파 2/델타 서브유닛 4(calcium channel; voltage-dependent; alpha 2/delta subunit 4, CACNA2D4); 카드헤린 관련 패밀리 구성원 1(프로토카드헤린(protocadherin) 21)(cadherin-related family member 1, CDHR1); 세라마이드 키나제 유사 단백질(CERKL); 원추 광수용체 cGMP-개폐 양이온 채널 알파 서브유닛(CNGA3); 원추 고리형 뉴클레오티드 개폐 양이온 채널 베타 3 서브유닛(CNGB3); 사이클린 M4(CNNM4); 구아닌 뉴클레오티드 결합 단백질(G 단백질); 알파 형질도입 활성 폴리펩티드 2(alpha transducing activity polypeptide 2, GNAT2); 칼륨 채널 서브패밀리 V 구성원 2(KCNV2); 포스포디에스테라제 6C(PDE6C); 포스포디에스테라제 6H(PDE6H); 중심체 1 중심체 단백질 B(POC1B)의 프로테옴; RAS 종양유전자 패밀리의 RAB28 구성원(RAB28); 망막 및 전방 신경 주름 호메오박스 2 전사 인자(RAX2); 11-시스 레티놀 탈수소효소 5(RDH5); RP GTPase 조절인자 상호작용 단백질 1(RPGRIP1); 튜불린 티로신 리가제 유사 패밀리 구성원 5(tubulin tyrosine ligase-like family member 5, TTLL5); L형 전압 개폐 칼슘 채널 알파-1 서브유닛(CACNA1F); 망막색소변성증 GTPase 조절인자(RPGR); 간상 트랜스듀신 알파 서브유닛(GNAT1); 간상 cGMP 포스포디에스테라제 베타 서브유닛(PDE6B); 로돕신(rhodopsin, RHO); 칼슘 결합 단백질 4(CABP4); G 단백질 결합 수용체 179(GPR179); 로돕신 키나제(GRK1); 대사성 글루타메이트 수용체 6(metabotropic glutamate receptor 6, GRM6); 류신이 풍부한 반복 면역글로불린 유사 막횡단 도메인 단백질 3(leucine-rich repeat immunoglobulin-like transmembrane domains protein 3, LRIT3); 어레스틴(arrestin)(s-항원)(SAG); 용질 운반체 패밀리 24(SLC24A1); 일시적 수용체 잠재적 양이온 채널, 서브패밀리 M, 구성원 1(transient receptor potential cation channel, subfamily M, member 1, TRPM1); 닉탈로핀(nyctalopin, NYX); 녹색 원추세포 옵신(green cone opsin)(OPN1LW); 레드 원추세포 옵신(OPN1MW); 블루 원추세포 옵신(OPN1SW); 프라탁신(frataxin, FXN); 이노신 모노포스페이트 탈수소효소 1(inosine monophosphate dehydrogenase 1, IMPDH1); 교정돌기 호메오박스 2 단백질(orthodenticle homeobox 2 protein, OTX2); 크럼스 동족체 1(crumbs homolog 1, CRB1); 사멸 도메인 함유 단백질 1(death domain containing protein 1, DTHD1); 성장 분화 인자 6(growth differentiation factor 6, GDF6); 편모내 수송 140 클라미도모나스 동족체 단백질(intraflagellar transport 140 Chlamydomonas homolog protein, IFT140); IQ 모티프 함유 B 단백질(IQ motif containing B protein, IQCB1); 레베르실린(lebercilin, LCA5); 레시틴 레티놀 아실트랜스퍼라제(lecithin retinol acyltransferase, LRAT); 니코틴아미드 뉴클레오티드 아데닐릴트랜스퍼라제 1(nicotinamide nucleotide adenylyltransferase 1, NMNAT1); RD3 단백질(RD3); 레티놀 탈수소효소 12(RDH12); 망막 색소 상피 특이적 65kD 단백질(retinal pigment epithelium-specific 65 kD protein, RPE65); 정자형성 관련 단백질 7(spermatogenesis associated protein 7, SPATA7); 터비 유사 단백질 1(tubby-like protein 1, TULP1); 미토콘드리아 유전자(mitochondrial gene)(KSS, LHON, MT-ATP6, MT-TH, MT-TL1, MT-TP, MT-TS2, 미토콘드리아로 암호화된 NADH 탈수소효소[MT-ND]); 베스트로핀 1(bestrophin 1, BEST1); C1q 및 종양 괴사 관련 단백질 5 콜라겐(C1q and tumor necrosis-related protein 5 collagen, C1QTNF5); EGF 함유 피브릴린 유사 세포외 기질 단백질 1(EGF-containing fibrillin-like extracellular matrix protein 1, EFEMP1); 매우 긴 지방산 단백질 연장(elongation of very long fatty acids protein, ELOVL4); 레티날 파신 동족체 2(retinal fascin homolog 2), 액틴 번들링 단백질(actin bundling protein)(FSCN2); 구아닐레이트 사이클라제 활성화 단백질 1B(GUCAB); 헤미센틴 1(hemicentin 1, HMCN1); 광수용체간 기질 프로테오글리칸 1(interphotoreceptor matrix proteoglycan 1, IMPG1); 망막색소변성증 1 유사 단백질 1(RP1L1); 메탈로프로테이나제-3의 조직 억제제(TIMP3); 보체 인자 H(CFH); 보체 인자 D(CFD); 보체 성분 2(C2); 보체 성분 3(C3); 보체 인자 B(CFB); DNA 손상 조절된 자가포식 조절자 2(DNA-damage regulated autophagy modulator 2, DRAM2); 콘드로이틴 설페이트 프로테오글리칸 2(chondroitin sulfate proteoglycan 2)(VCAN); 미토푸신 2(mitofusin 2, MFN2); 핵 수용체 서브패밀리 2 그룹 F 구성원 1(NR2F1); 시신경 위축 1(optic atrophy 1, OPA1); 막횡단 단백질 126A(TMEM126A); 내부 미토콘드리아 막 전위효소 8 동족체 A(TIMM8A); 탄산 탈수효소 IV(carbonic anhydrase IV, CA4); 헥소키나제 1(hexokinase 1, HK1); 켈치 유사 7 단백질(kelch-like 7 protein, KLHL7); 핵 수용체 서브패밀리 2 그룹 E3(NR2E3); 신경 망막 루신 지퍼(neural retina lucine zipper, NRL); 후각 수용체 계열 2 하위 계열 W 구성원 3(olfactory receptor family 2 subfamily W member 3, OR2W3); 사전 mRNA 처리 인자 3(pre-mRNA processing factor 3, PRPF3); 사전 mRNA 처리 인자 4(PRPF4); 사전 mRNA 처리 인자 6(PRPF6); 사전 mRNA 처리 인자 8(PRPF8); 사전 mRNA 처리 인자 31(PRPF31); 망막 외부 분절 막 단백질 1(retinal outer segment membrane protein 1, ROM1); 망막색소변성증 단백질 1(RP1); PIM-키나제 관련 단백질 1(RP9); 소형 핵 리보핵단백질 200kDa(small nuclear ribonucleoprotein 200 kDa, SNRNP200); 분비된 인단백질 2(SPP2); 토포이소머라제 I 결합 아르기닌/세린 풍부 단백질(TOPORS); ADP-리보실화 인자 유사 2 결합 단백질(ARL2BP); 염색체 2번 오픈 리드 프레임 71(C2orf71); 클라린-1(CLRN1); 간상 cGMP-개폐 채널 알파 서브유닛(CNGA1); 간상 cGMP-개폐 채널 베타 서브유닛(CNGB1); 사이토크롬 P450 4V2(CYP4V2); 데하이드로돌리칠 디포스페이트 합성효소(dehydrodolichyl diphosphate synthetase, DHDDS); DEAH 박스 폴리펩티드 38(DEAH box polypeptide 38, DHX38); ER 막 단백질 복합체 서브유닛 1(EMC1); 아이즈 셧/스페이스메이커 동족체(eyes shut/spacemaker homolog)(EYS); 서열 유사성 161 구성원 A를 갖는 패밀리(FAM161A); G 단백질 결합 수용체 125(G protein-coupled receptor 125, GPR125); 헤파란-알파-글루코사미나이드 N-아세틸트랜스퍼라제(heparan-alpha-glucosaminide N-acetyltransferase, HGSNAT); NAD(+)-특이적 이소시트레이트 탈수소효소 3 베타(isocitrate dehydrogenase 3 beta, IDH3B); 광수용체간 기질 프로테오글리칸 2(interphotoreceptor matrix proteoglycan 2, IMPG2); KIAA1549 단백질(KIAA1549); 키즈나 중심체 단백질(kizuna centrosomal protein, KIZ); 남성 생식세포 관련 키나제(male germ-cell associated kinase, MAK); c-mer 원암유전자 수용체 티로신 키나제(c-mer protooncogene receptor tyrosine kinase, MERTK); 메발로네이트 키나제(mevalonate kinase, MVK); NIMA(never in mitosis gene A) 관련 키나제 2(NEK2); 신경 분화 단백질 1(neuronal differentiation protein 1, NEUROD1); cGMP 포스포디에스테라제 알파 서브유닛(phosphodiesterase alpha subunit)(PDE6A); 포스포디에스테라제 6G cGMP 특이적 간상 감마(phosphodiesterase 6G cGMP-specific rod gamma, PDE6G); 진행성 간상체-원추체 변성 단백질(progressive rod-cone degeneration protein, PRCD); 레티놀 결합 단백질 3(retinol binding protein 3, RBP3); 레틴알데히드 결합 단백질 1(retinaldehyde-binding protein 1, RLBP1); 용질 운반체 패밀리 7 구성원 14(solute carrier family 7 member 14, SLC7A14); 어쉐린(usherin)(USH2A); 징크 핑거 단백질 408(zinc finger protein 408, ZNF408); 징크 핑거 단백질 513(ZNF513); 구강-안면-디지털 증후군 1 단백질(oral-facial-digital syndrome 1 protein, OFD1); 망막색소변성증 2(RP2); 레티노스키신(retinoschisin, RS1); 압하이드롤라제 도메인 함유 단백질 12(abhydrolase domain containing protein 12, ABHD12); 카드헤린 유사 유전자 23(CDH23); 중심체 단백질 250kDa(CEP250); 칼슘 및 인테그린 결합 계열 구성원 2(calcium and integrin binding family member 2, CIB2); 휠린(whirlin)(DFNB31); 단일유전자 청력유발 발작 감수성 1 동족체(monogenic audiogenic seizure susceptibility 1 homolog)(GPR98); 히스티딜-tRNA 합성효소(histidyl-tRNA synthetase, HARS); 미오신 ⅦA(myosin ⅦA, MYO7A); 프로토카드헤린 15(PCDH15); 하모닌(harmonin)(USH1C); 안키린 반복 및 SAM 도메인을 함유하는 마우스 스캐폴드 단백질의 인간 동족체(human homolog of mouse scaffold protein containing ankyrin repeats and SAM domain, USH1G); 디스트로핀(dystrophin, DMD); 노린(norrin, NDP); 포스포글리세레이트 키나제(); phosphoglycerate kinase, PGK1); 칼페인 5(calpain 5, CAPN5); 프리즐드-4 Wnt 수용체 동족체(frizzled-4 Wnt receptor homolog, FZD4); 내재막 단백질 2B(integral membrane protein 2B, ITM2B); 저밀도 지질단백질 수용체 관련 단백질 5(LRP5); 마이크로 RNA 204(MIR204); 망막모세포종 단백질 1(retinoblastoma protein 1, RB1); 테트라스파닌 12(tetraspanin 12, TSPAN12); 염색체 12번 오픈 리드 프레임 65(C12orf65); 카드헤린 3(CDH3); 막형 프리즐 관련 단백질(membrane-type frizzled-related protein, MFRP); 오르니틴 아미노트랜스퍼라제(ornithine aminotransferase, OAT); 포스포리파제 A2 그룹 V(phospholipase A2 group V, PLA2G5); 레티놀 결합 단백질 4(retinol-binding protein 4, RBP4); G-단백질 신호전달 9의 조절인자(regulator of G-protein signaling 9, RGS9); G-단백질 신호전달 9-결합 단백질의 조절인자(regulator of G-protein signaling 9-binding protein, RGS9BP); ARMS2; 절단 복구 교차 보완 설치류 복구 결핍 보완 그룹 6 단백질(excision repair cross-complementing rodent repair deficiency complementation group 6 protein, ERCC6); 피불린 5(fibulin 5, FBLN5); HtrA 세린 펩티다제 1(HtrA serine peptidase 1, HTRA1); 톨 유사 수용체 3(TLR3); 및 톨 유사 수용체 4(toll-like receptor 4, TLR4), 옵신; 로돕신; 채널 로돕신(channel rhodopsin); 할로 로돕신(halo rhodopsin) 등이 포함된다.
일부 실시양태에서, 바이러스 입자는 게놈 편집 시스템을 암호화하는 이종 전이유전자를 포함한다. 예에는 CRISPR 게놈 편집 시스템(예를 들어, CRISPR 게놈 편집 시스템의 하나 이상의 성분, 예를 들어, 가이드 RNA 분자 및/또는 Cas9, Cpf1 등과 같은 Cas 효소와 같은 RNA-가이드 뉴클레아제), 아연 핑거 뉴클레아제 게놈 편집 시스템, TALEN 게놈 편집 시스템 또는 메가뉴클레아제 게놈 편집 시스템이 포함된다. 실시양태에서, 게놈 편집 시스템은 포유동물, 예를 들어, 인간 게놈 표적 서열을 표적으로 한다. 실시양태에서, 바이러스 입자는 표적화 가능한 전사 조절인자를 암호화하는 이종 전이유전자를 포함한다. 예에는 CRISPR 기반 전사 조절인자(예를 들어, CRISPR 기반 전사 조절인자의 하나 이상의 성분, 예를 들어, 가이드 RNA 분자 및/또는 효소 불활성 RNA 가이드 뉴클레아제/전사 인자("TF") 융합 단백질, 예컨대 dCas9-TF 융합, dCpf1-TF 융합 등), 아연 핑거 전사 인자 융합 단백질, TALEN 전사 조절인자 또는 메가뉴클레아제 전사 조절인자가 포함된다.
일부 실시양태에서, 치료 분자 또는 시스템의 성분은 하나 이상의 독특한 바이러스 입자(예를 들어, 하나 이상의 독특한 바이러스 입자를 포함하는 집단)에 의해 전달된다. 다른 실시양태에서, 치료 분자, 또는 치료 분자나 시스템의 성분은 단일의 독특한 바이러스 입자(예를 들어, 단일의 독특한 바이러스 입자를 포함하는 집단)에 의해 전달된다.
또한, 전이유전자는 임의의 생물학적 활성 생성물 또는 기타 생성물, 예를 들어, 연구에 바람직한 생성물을 암호화할 수 있다. 적합한 전이유전자는 당업자에 의해 용이하게 선택될 수 있으며, 예를 들어, 본원에 기술된 것과 같지만 이에 제한되지 않는다.
전이유전자에 의해 암호화되는 단백질의 다른 예에는 콜로니 자극 인자(CSF); β-글로빈, 헤모글로빈, 조직 플라스미노겐 활성화제 및 응고 인자와 같은 혈액 인자; 인터루킨; 가용성 수용체, 예컨대 가용성 TNF-α 수용체, 가용성 VEGF 수용체, 가용성 인터루킨 수용체(예를 들어, 가용성 IL-1 수용체 및 가용성 Ⅱ형 IL-1 수용체) 또는 가용성 수용체의 리간드 결합 단편; 각질세포 성장 인자(KGF), 줄기세포 인자(SCF) 또는 섬유아세포 성장 인자(FGF, 예컨대 염기성 FGF 및 산성 FGF)와 같은 성장 인자; 효소; 케모카인; 조직 플라스미노겐 활성화제와 같은 효소 활성화제; 혈관 내피 성장 인자, 신경교종 유래 성장 인자, 안지오제닌 또는 안지오제닌-2와 같은 혈관신생제(angiogenic agent); 가용성 VEGF 수용체와 같은 항혈관신생제; 단백질 백신; 신경 성장 인자(NGF) 또는 옥시토신(oxytocin)과 같은 신경활성 펩티드; 혈전용해제; 조직 인자; 대식세포 활성화 인자; 메탈로프로테이나제의 조직 억제제; 또는 IL-1 수용체 길항제가 포함되지만 이에 제한되지 않는다.
따라서, (a) 서열번호 2의 VP1, VP2 또는 VP3 서열, (b) VAR-1의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-1의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 2의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서(repressor) 서열, (d) 스터퍼(stuffer) 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 3의 VP1, VP2 또는 VP3 서열, (b) VAR-2의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-2의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 3의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 4의 VP1, VP2 또는 VP3 서열, (b) VAR-3의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-3의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 4의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 5의 VP1, VP2 또는 VP3 서열, (b) VAR-4의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-4의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 5의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 6의 VP1, VP2 또는 VP3 서열, (b) VAR-5의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-5의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 6의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 7의 VP1, VP2 또는 VP3 서열, (b) VAR-6의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-6의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 7의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 8의 VP1, VP2 또는 VP3 서열, (b) VAR-7의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-7의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 8의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 9의 VP1, VP2 또는 VP3 서열, (b) VAR-8의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-8의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 9의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 10의 VP1, VP2 또는 VP3 서열, (b) VAR-9의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-9의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 10의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 11의 VP1, VP2 또는 VP3 서열, (b) VAR-10의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-10의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 11의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 12의 VP1, VP2 또는 VP3 서열, (b) VAR-11의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-11의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 12의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 13의 VP1, VP2 또는 VP3 서열, (b) VAR-12의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-12의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 13의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 14의 VP1, VP2 또는 VP3 서열, (b) VAR-13의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-13의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 14의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 15의 VP1, VP2 또는 VP3 서열, (b) VAR-14의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-14의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 15의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 16의 VP1, VP2 또는 VP3 서열, (b) VAR-15의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-15의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 14의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 17의 VP1, VP2 또는 VP3 서열, (b) VAR-16의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-16의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 17의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 18의 VP1, VP2 또는 VP3 서열, (b) VAR-17의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-17의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 18의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 19의 VP1, VP2 또는 VP3 서열, (b) VAR-18의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-18의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 19의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 20의 VP1, VP2 또는 VP3 서열, (b) VAR-19의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-19의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 20의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 21의 VP1, VP2 또는 VP3 서열, (b) VAR-20의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-20의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 21의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 22의 VP1, VP2 또는 VP3 서열, (b) VAR-21의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-21의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 22의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 23의 VP1, VP2 또는 VP3 서열, (b) VAR-22의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-22의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 23의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 24의 VP1, VP2 또는 VP3 서열, (b) VAR-23의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-23의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 24의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 25의 VP1, VP2 또는 VP3 서열, (b) VAR-24의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-24의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 25의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 26의 VP1, VP2 또는 VP3 서열, (b) VAR-25의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-25의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 26의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 27의 VP1, VP2 또는 VP3 서열, (b) VAR-26의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-26의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 27의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 28의 VP1, VP2 또는 VP3 서열, (b) VAR-27의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-27의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 28의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 29의 VP1, VP2 또는 VP3 서열, (b) VAR-28의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-28의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 29의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 30의 VP1, VP2 또는 VP3 서열, (b) VAR-29의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-29의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 31의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 31의 VP1, VP2 또는 VP3 서열, (b) VAR-30의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-30의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 31의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 32의 VP1, VP2 또는 VP3 서열, (b) VAR-31의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-31의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 32의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 33의 VP1, VP2 또는 VP3 서열, (b) VAR-32의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-32의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 33의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 34의 VP1, VP2 또는 VP3 서열, (b) VAR-33의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-33의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 34의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 35의 VP1, VP2 또는 VP3 서열, (b) VAR-34의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-34의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 35의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 36의 VP1, VP2 또는 VP3 서열, (b) VAR-35의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-35의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 36의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 37의 VP1, VP2 또는 VP3 서열, (b) VAR-36의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-36의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 37의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 38의 VP1, VP2 또는 VP3 서열, (b) VAR-37의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-37의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 38의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 39의 VP1, VP2 또는 VP3 서열, (b) VAR-38의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-38의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 39의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 40의 VP1, VP2 또는 VP3 서열, (b) VAR-39의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-39의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 40의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 41의 VP1, VP2 또는 VP3 서열, (b) VAR-40의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-40의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 41의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 42의 VP1, VP2 또는 VP3 서열, (b) VAR-41의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-41의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 42의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 43의 VP1, VP2 또는 VP3 서열, (b) VAR-42의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-42의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 43의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 44의 VP1, VP2 또는 VP3 서열, (b) VAR-43의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-43의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 44의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 45의 VP1, VP2 또는 VP3 서열, (b) VAR-44의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-44의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 45의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
따라서, (a) 서열번호 46의 VP1, VP2 또는 VP3 서열, (b) VAR-45의 돌연변이 세트를 포함하고 서열번호 1과의 동일성이 80% 초과(예를 들어, 90% 초과, 91% 초과, 92% 초과, 93% 초과, 94% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 99% 초과)인 VP1, VP2 또는 VP3 서열, 또는 (c) VAR-45의 돌연변이 세트를 포함하고 서열번호 1에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 추가 돌연변이를 갖지만 40, 39, 38, 37, 36, 35, 34, 33, 32 또는 31개 미만의 추가 돌연변이를 갖는 VP1, VP2 또는 VP3 서열을 포함하는 캡시드 폴리펩티드를 포함하는 바이러스 입자가 본원에서 제공된다. 실시양태에서, 캡시드 폴리펩티드는 서열번호 46의 VP1, VP2 및 VP3 서열을 포함한다. 실시양태에서, 바이러스 입자는 이종 전이유전자, 예를 들어, 안구 장애 관련 생성물을 암호화하는 이종 전이유전자를 포함하는 핵산 분자를 포함한다. 실시양태에서, 이종 전이유전자는 항-VEGF 항체 또는 항체 단편, 항-VEGF RNA 억제 분자, RPE65(예를 들어, 인간 RPE65) 단백질, ABCA4(예를 들어, 인간 ABCA4) 단백질 또는 이의 단편, RLBP1(예를 들어, 인간 RLBP1) 단백질 또는 이의 단편, PDE6B(예를 들어, 인간 PDE6B) 단백질 또는 이의 단편, RPGR(예를 들어, 인간 RPGR) 단백질 또는 이의 단편, 또는 ACHM3A 또는 ACHM3B(예를 들어, 인간 ACHM3A 또는 인간 ACHM3B) 단백질 또는 이의 단편을 암호화한다. 실시양태에서, 바이러스 입자의 핵산 분자는 하나 이상의 조절 요소를 추가로 포함하며, 예를 들어, 프로모터, 예를 들어, 이종 전이유전자에 작동 가능하게 연결되고 관심 조직에서 이종 전이유전자로부터의 발현을 조절하는 프로모터를 포함한다. 실시양태에서, 바이러스 입자의 핵산 분자는 (a) 데펜도파보바이러스 ITR, (b) 인트론, (c) 인핸서 또는 리프레서 서열, (d) 스터퍼 서열 및 (e) 폴리A 서열 중 하나 이상을 추가로 포함한다.
본 개시내용은 부분적으로 페이로드를 대상체, 예를 들어, 동물 또는 인간 대상체에게 전달하는 방법에 관한 것이다. 일부 실시양태에서, 페이로드를 대상체에게 전달하는 방법은 (예를 들어, 본원에 기술된) 페이로드를 포함하는 변이체 폴리펩티드를 포함하는 데펜도파보바이러스 입자를, 예를 들어, 페이로드를 전달하기에 충분한 양 및 시간 동안 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 데펜도파보바이러스 입자는 본원에 기술된 데펜도파보바이러스 입자이고, 본원에 기술된 페이로드를 포함한다. 일부 실시양태에서, 입자는 페이로드를 눈에 전달한다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드가 없는 입자와 비교하여 또는 야생형 캡시드 폴리펩티드와 비교하여 눈으로의 전달이 증가한다.
치료 방법
본 개시내용은 부분적으로 대상체, 예를 들어, 동물 또는 인간 대상체의 질환 또는 병태를 치료하는 방법에 관한 것이다. 본원에 사용된 용어 "질환 또는 병태를 치료하는"은, 예를 들어, 대상체가 이미 질환 또는 병태의 하나 이상의 증상을 앓고 있는 경우 명백한 질환 또는 병태를 치료하는 것을 의미하거나, 예를 들어, 대상체가 질환 또는 병태를 갖고 있는 것으로 확인되었지만 아직 해당 질환 또는 상태의 하나 이상의 증상이 발현되지 않는 경우 증상이 나타나기 전의 질환 또는 병태를 치료하는 것을 의미한다. 예를 들어, 유전자 검사를 통해 증상 발현 전 상태를 확인할 수 있다. 일부 실시양태에서, 대상체에서 질환 또는 병태를 치료하는 방법은 대상체에게 본원에 기술된 변이체 폴리펩티드, 예를 들어, 본원에 기술된 페이로드를 포함하는 데펜도파보바이러스 입자를 투여하는 것을 포함한다. 일부 실시양태에서, 본원에 기술된 페이로드를 포함하는 변이체 폴리펩티드를 포함하는 데펜도파보바이러스 입자는 질환 또는 병태를 치료하는데 효과적인 양 및/또는 시간으로 투여된다. 일부 실시양태에서, 페이로드는 치료 제품이다. 일부 실시양태에서, 페이로드는, 예를 들어, 외인성 폴리펩티드를 암호화하는 핵산이다.
본원에 기술된 변이체 폴리펩티드를 포함하거나 본원에 기술된 방법에 의해 생성된 데펜도파보바이러스 입자는 다양한 질환 또는 장애를 치료하기 위해 하나 이상의 치료 단백질을 발현하는 데 사용될 수 있다. 일부 실시양태에서, 질환 또는 장애는 암, 예를 들어, 암종(carcinoma), 육종(sarcoma), 백혈병(leukemia), 림프종(lymphoma)과 같은 암; 또는 자가면역 질환, 예를 들어, 다발성 경화증(multiple sclerosis)이다. 암종의 비제한적인 예에는 식도암종(esophageal carcinoma); 기관지암종(bronchogenic carcinoma); 결장암종(colon carcinoma); 대장암종(colorectal carcinoma); 위암종(gastric carcinoma); 간세포암종(hepatocellular carcinoma); 기저 세포 암종(basal cell carcinoma), 편평 세포 암종(squamous cell carcinoma)(다양한 조직); 이행세포암종(transitional cell carcinoma)을 포함한 방광암종(bladder carcinoma); 폐의 소세포암종(small cell carcinoma) 및 비소세포암종(non-small cell carcinoma)을 포함하는 폐암종(lung carcinoma); 부신피질암종(adrenocortical carcinoma); 땀샘암종(sweat gland carcinoma); 피지선암종(sebaceous gland carcinoma); 갑상선암종(thyroid carcinoma); 췌장암종(pancreatic carcinoma); 유방암종(breast carcinoma); 난소암종(ovarian carcinoma); 전립선암종(prostate carcinoma); 선암종(adenocarcinoma); 유두암종(papillary carcinoma); 유두상 선암종(papillary adenocarcinoma); 낭선암종(cystadenocarcinoma); 수질암종(medullary carcinoma); 신장 세포 암종(renal cell carcinoma); 자궁암종(uterine carcinoma); 고환암종(testicular carcinoma); 골형성 암종(osteogenic carcinoma); 관내 상피내 암종(ductal carcinoma in situ) 또는 담관 암종(bile duct carcinoma); 융모막암종(choriocarcinoma); 정상피종(seminoma); 배아암종(embryonal carcinoma); 윌름 종양(Wilm's tumor); 자궁경부암종(cervical carcinoma); 상피 암종(epithelieal carcinoma); 및 비인두암종(nasopharyngeal carcinoma)이 포함된다. 육종의 비제한적 예에는 섬유육종(fibrosarcoma), 점액육종(myxosarcoma), 지방육종(liposarcoma), 혈관육종(angiosarcoma), 내피육종(endotheliosarcoma), 림프관육종(lymphangiosarcoma), 연골육종(chondrosarcoma), 척색종(chordoma), 골성육종(osteogenic sarcoma), 골육종(osteosarcoma), 림프관내피육종(lymphangioendotheliosarcoma), 윤활막종(synovioma), 중피종(mesothelioma), 유잉육종(Ewing's sarcoma), 평활근육종(leiomyosarcoma), 횡문근육종(rhabdomyosarcoma) 및 기타 연조직 육종이 포함된다. 고형 종양의 비제한적 예에는 뇌실막종(ependymoma), 송과체종(pinealoma), 혈관모세포종(hemangioblastoma), 청신경종(acoustic neuroma), 희돌기교종(oligodendroglioma), 신경교종, 성상세포종(astrocytoma), 수모세포종(medulloblastoma), 두개인두종(craniopharyngioma), 수막종(menangioma), 흑색종(melanoma), 신경모세포종(neuroblastoma) 및 망막모세포종이 포함된다. 백혈병의 비제한적인 예에는 만성 골수증식 증후군(chronic myeloproliferative syndrome); T 세포 CLL 전림프구성 백혈병(prolymphocytic leukemia), 급성 골수성 백혈병(acute myelogenous leukemia); B 세포 CLL, 털세포 백혈병(hairy cell leukemia)을 포함한 만성 림프구성 백혈병; 및 급성 림프구성 백혈병(acute lymphoblastic leukemia)이 포함된다. 림프종의 예에는 버킷 림프종(Burkitt's lymphoma)과 같은 B 세포 림프종(B-cell lymphoma); 및 호지킨 림프종(Hodgkin's lymphoma)이 포함되지만 이에 제한되지 않는다.
일부 실시양태에서, 질환 또는 장애는 유전 장애이다. 일부 실시양태에서, 유전 장애는 겸상 적혈구 빈혈(sickle cell anemia), 글리코겐 축적 질환(GSD, 예를 들어, GSD Ⅰ형, Ⅱ형, Ⅲ형, Ⅳ형, Ⅴ형, Ⅵ형, Ⅶ형, Ⅷ형, Ⅸ형, Ⅹ형, ⅩⅠ형, ⅩⅡ형, ⅩⅢ형 및 ⅩⅣ형), 낭포성 섬유증, 리소좀 산 리파제(lysosomal acid lipase, LAL) 결핍 1, 테이-삭스병, 페닐케톤뇨증(Phenylketonuria), 점액다당증, 갈락토스혈증(Galactosemia), 근이영양증(예를 들어, 뒤센 근이영양증), 혈우병 A(고전적 혈우병) 또는 혈우병 B(크리스마스병(Christmas Disease))와 같은 혈우병, 윌슨병(Wilson's disease), 파브리병(Fabry Disease), 고셔병(Gaucher Disease), 유전성 혈관부종(HAE) 및 알파 1 항트립신 결핍증이다. 다른 질환 또는 장애의 예는 위의 "페이로드 전달 방법" 섹션에 제공되어 있다.
본원에 기술된 변이체 폴리펩티드를 포함하거나 본원에 기술된 방법에 의해 생성된 데펜도파보바이러스 입자는 다양한 질환 또는 장애를 치료하기 위해 하나 이상의 치료 단백질을 발현하는 데 사용될 수 있다. 일부 실시양태에서, 질환 또는 장애는 눈의 질환 또는 장애, 예를 들어, 망막색소변성증; 황반변성(예를 들어, 습성 노인 황반변성(wet age-related macular degeneration)), 시신경염(optic neuritis); 레버 선천성 흑암시(Leber's congenital amaurosis); 레버 유전성 시신경병증; 색맹(achromatopsia); X-연관 망막분리증(X-linked retinoschisis); 시신경염; 맥락막결손증; 시신경 위축; 망막 원추 이영양증(retinal cone dystrophy); 망막병증(retinopathy); 망막모세포종; 녹내장(glaucoma); 바르데-비들 증후군(Bardet-Biedl syndrome); 어셔 증후군(Usher syndrome); 무홍채증(aniridia); 프리드리히 실조; 난황 황반 이영양증; 망막모세포종; 스타르가르트병(Stargardt disease); 샤르코-마리-투스병(Charcot-Marie-Tooth disease); 푸크 이영양증(Fuch's dystrophy); 프로피온산혈증(propionic acidemia); 또는 색맹(color blindness); 각막 이상증(corneal dystrophy); 원추각막(keratoconus); 야맹증(night blindness); 안구건조증(dry eye); 바르데-비들 증후군; 배튼병; 비에티의 결정성 이영양증(Bietti's Crystalline Dystrophy); 맥락망막 위축(chorioretinal atrophy); 맥락망막 변성(chorioretinal degeneration); 원추세포 또는 원추세포-간상세포 이영양증(상염색체 우성(autosomal dominant), 상염색체 열성(autosomal recessive) 및 X-연관), 선천성 정지 야맹증(congenital stationary night blindness)(상염색체 우성, 상염색체 열성 및 X-연관); 색맹(ACHM2, ACHM3, ACHM4 및 ACHM5 포함), 적색맹(protanopia), 녹색맹(deuteranopia) 및 청색맹(tritanopia)을 포함한 색각(color vision) 장애; 프리드리히 실조; LCA1, LCA2, LCA3, LCA4, LCA6, LCA7, LCA8, LCA12 및 LCA15를 포함하지만 이에 제한되지 않는 레버 선천성 흑암시(Leber's Hereditary Optic Neuropathy)(상염색체 우성 및 상염색체 열성); 레버 유전성 시신경병증; 급성 황반 변성, 최고의 난황 황반 이영양증(Best vitelliform macular dystrophy), 패턴 이영양증(pattern dystrophy), 노스 캐롤라이나 황반 이영양증(North Carolina Macular Dystrophy), 유전성 드루젠(inherited drusen), 소르스비 안저 이영양증(Sorsby's fundus dystrophy), 말라티아 레반타네제(malattia levantanese) 및 조숙의 유전적으로 결정된 망막병증(genetically-determined retinopathy of prematurity)을 포함하지만 이에 제한되지 않는 황반 이영양증(상염색체 우성 및 상염색체 열성); 안구-망막 발달 질환(ocular-retinal developmental disease); 안구백색증(ocular albinism); 시신경 위축(상염색체 우성, 상염색체 열성 및 X-연관); 망막색소변성증(상염색체 우성, 상염색체 열성, X-연관 및 미토콘드리아 유전 형질)(예를 들어, RP1, RP2, RP3, RP10, RP20, RP38, RP40 및 RP43); X-연관 망막분리증; 스타르가르트병; 및 USH1B, USH1C, USH1D, USH1F, USH1G, USH2A, USH2C, USH2D 및 USH3을 포함하지만 이에 제한되지 않는 어셔 증후군이다. 복합 유전 질환의 예에는 녹내장(개방각(open angle), 폐쇄각(angle-closure), 저안압(low-tension), 정상안압(normal-tension), 선천성(congenital), 신생혈관(neovascular), 색소성(pigmentary), 가성박리(pseudoexfoliation)); 삼출성 및 비삼출성 형태(상염색체 우성 및 상염색체 열성) 모두의 노인성 및 기타 형태의 황반변성, 예컨대 급성 황반변성, 난황 황반변성; 미숙아 망막병증(retinopathy of prematurity); 및 보그트 코야나기-하라다(Vogt Koyanagi-Harada, VKH) 증후군이 포함되지만 이에 제한되지 않는다. 후천성 질환의 예에는 급성 황반 신경망막병증(acute macular neuroretinopathy); 전방 허혈성 시신경병증(anterior ischemic optic neuropathy) 및 후방 허혈성 시신경병증(posterior ischemic optic neuropathy); 베체트병(Behcet's disease); 분지 망막 정맥 폐색(branch retinal vein occlusion); 맥락막 혈관신생(choroidal neovascularization); 증식성 당뇨병성 망막병증(proliferative diabetic retinopathy) 및 관련 합병증을 포함하는 당뇨병성 망막병증(diabetic retinopathy); 당뇨병성 포도막염(diabetic uveitis); 황반부종(macular edema), 낭포황반부종(cystoid macular edema) 및 당뇨병성 황반부종(diabetic macular edema)과 같은 부종; 망막전막 장애(epiretinal membrane disorder); 황반 모세혈관확장증(macular telangiectasia); 다초점 맥락막염(multifocal choroiditis); 비망막병증 당뇨병성 망막 기능장애(non-retinopathy diabetic retinal dysfunction); 안구 종양(ocular tumor); 시신경 위축; 망막박리(retinal detachment); 중심 망막 정맥 폐쇄(central retinal vein occlusion), 증식성 유리체망막병증(proliferative vitreoretinopathy, PVR), 망막 동맥 및 정맥 폐쇄 질환(retinal arterial and venous occlusive disease), 혈관 폐쇄(vascular occlusion), 포도막 망막 질환(uveitic retinal disease)과 같은 망막 장애; 포도막 삼출(uveal effusion); 망막 감염성 및 침윤성 질환(retinal infective and infiltrative disease); 후천성 시신경 위축과 같은 시신경 질환이 포함되지만 이에 제한되지 않는다. 외상성 손상(traumatic injury)의 예에는 히스토플라스마증(histoplasmosis); 시신경 외상(optic nerve trauma); 후안부 또는 위치에 영향을 미치는 안구 외상; 망막 외상(retinal trauma); 눈의 바이러스 감염; 시신경의 바이러스 감염; 안구 레이저 치료에 의해 유발되거나 영향을 받는 후안구 병태; 광역학 요법에 의해 유발되거나 영향을 받는 후안구 병태; 광응고(photocoagulation), 방사선 망막병증(radiation retinopathy); 및 교감성 안염(sympathetic ophthalmia)가 포함되지만 이에 제한되지 않는다.
일부 실시양태에서, 변이체 폴리펩티드를 포함하고 페이로드(예를 들어, 전이유전자)를 포함하는 데펜도파보바이러스 입자를 대상체에게 투여하면 대상체에서 페이로드(예를 들어, 전이유전자)의 발현이 유도된다. 일부 실시양태에서, 발현은 눈에서 유도된다. 일부 실시양태에서, 야생형 캡시드 단백질을 갖는 유사한 입자와 비교하여 눈에서의 생성이 증가한다. 대상체(예를 들어, 대상체의 혈청)에서 발현되는 페이로드, 예를 들어, 전이유전자, 예를 들어, 이종 단백질, 예를 들어, 치료 폴리펩티드의 양은 다양할 수 있다. 예를 들어, 일부 실시양태에서, 페이로드, 예를 들어, 전이유전자의 단백질 또는 RNA 생성물은 대상체의 혈청에서 약 5μg/ml 미만의 양으로 발현될 수 있다. 예를 들어, 일부 실시양태에서, 페이로드, 예를 들어, 전이유전자의 단백질 또는 RNA 생성물은 대상체의 혈청에서 적어도 약 9μg/ml, 적어도 약 10μg/ml, 적어도 약 50μg/ml, 적어도 약 100μg/ml, 적어도 약 200μg/ml, 적어도 약 300μg/ml, 적어도 약 400μg/ml, 적어도 약 500μg/ml, 적어도 약 600μg/ml, 적어도 약 700μg/ml, 적어도 약 800μg/ml, 적어도 약 900μg/ml 또는 적어도 약 1000μg/ml의 양으로 발현될 수 있다. 일부 실시양태에서, 페이로드, 예를 들어, 전이유전자의 단백질 또는 RNA 생성물은 대상체의 혈청에서 약 9μg/ml, 약 10μg/ml, 약 50μg/ml, 약 100μg/ml, 약 200μg/ml, 약 300μg/ml, 약 400μg/ml, 약 500μg/ml, 약 600μg/ml, 약 700μg/ml, 약 800μg/ml, 약 900μg/ml, 약 1000μg/ml, 약 1500μg/ml, 약 2000μg/ml, 약 2500μg/ml 또는 이들 값 중 임의의 2개 사이의 범위의 양으로 발현된다.
일부 실시양태에서, 변이체 폴리펩티드를 포함하고 페이로드(예를 들어, 전이유전자)를 포함하는 데펜도파보바이러스 입자는 주사를 통해 대상체에게 투여된다. 일부 실시양태에서, 주사는 전신 주사, 예를 들어, 정맥 내, 동맥 내, 근육 내 또는 피하 주사이다. 일부 실시양태에서, 주사는 눈 주사이다. 일부 실시양태에서, 주사는 유리체강 내 주사, 안와 내 주사, 안와후(retro-orbital) 주사, 맥락막상(suprachoroidal) 주사, 망막하 주사, 결막하 주사 또는 전방 내 주사이다. 일부 실시양태에서, 주사는 유리체강 내 주사이다. 일부 실시양태에서, 주사는 안와 내 주사이다. 일부 실시양태에서, 주사는 안와후 주사이다. 일부 실시양태에서, 주사는 맥락막상 주사이다. 일부 실시양태에서, 주사는 망막하 주사이다. 일부 실시양태에서, 주사는 결막하 주사이다. 일부 실시양태에서, 주사는 전방 내 주사이다.
본원에 개시된 서열은 동일성 백분율로 기술될 수 있다. 당업자는 그러한 특징이 2개 이상의 서열의 정렬을 포함한다는 것을 이해할 것이다. 인터넷을 통해 접근할 수 있는 "Clustal W"와 같은 공개적으로 또는 상업적으로 이용 가능한 다양한 다중 서열 정렬 프로그램을 사용하여 정렬을 수행할 수 있다. 또 다른 예로서, 핵산 서열은 GCG 버전 6.1의 프로그램인 FASTA를 사용하여 비교할 수 있다. FASTA는 쿼리(query) 서열과 검색 서열 간에 가장 잘 겹치는 영역의 정렬 및 서열 동일성 %를 제공한다. 예를 들어, 핵산 서열 간의 동일성 %는 본원에 참조로 포함된 GCG 버전 6.1에 제공된 기본 매개변수와 함께 FASTA를 사용하여 결정할 수 있다. 아미노산 서열에 대해서는 유사한 프로그램, 예를 들어, "Clustal X" 프로그램을 사용할 수 있다. 사용될 수 있는 추가적인 서열 정렬 도구는 (단백질 서열 정렬; (http://www.ebi.ac.uk/Tools/psa/emboss_needle/)) 및 (핵산 정렬; http://www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html)에 의해 제공된다. 일반적으로, 이들 프로그램 중 임의의 것이 기본 설정에서 사용될 수 있지만, 당업자는 필요에 따라 이러한 설정을 변경할 수 있다. 대안적으로, 당업자는 참조된 알고리즘 및 프로그램에 의해 제공되는 것과 같은 적어도 동일성 또는 정렬 수준을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 활용할 수 있다. 본원에 개시된 서열은 편집 거리의 관점에서 추가로 기술될 수 있다. 한 서열을 다른 서열로 변경하는 서열 편집(즉, 단일 염기 또는 뉴클레오티드의 추가, 치환 또는 결실)의 최소 수가 두 서열 사이의 편집 거리이다. 일부 실시양태에서, 두 서열 사이의 거리는 레벤슈타인(Levenshtein) 거리로서 계산된다.
본원에 인용된 모든 간행물, 특허 출원, 특허 및 기타 간행물 및 참고문헌(예를 들어, 서열 데이터베이스 참조 번호)은 그 전체가 참조로 포함된다. 예를 들어, 본원에, 예를 들어, 본원의 표에 언급된 모든 GenBank, Unigene 및 Entrez 서열은 참조로 포함된다. 달리 명시하지 않는 한, 본원의 표를 포함하여 본원에 명시된 서열 접근 번호는 2020년 8월 21일 현재의 데이터베이스 항목을 의미한다. 하나의 유전자 또는 단백질이 복수의 서열 접근 번호를 언급하는 경우 모든 서열 변이체가 포함된다.
본 발명은 다음 실시예에 의해 추가로 예시된다. 실시예는 단지 설명의 목적으로만 제공되며 어떤 방식으로든 본 발명의 범위 또는 내용을 제한하는 것으로 해석되어서는 안 된다.
실시예
실시예 1
라이브러리 생성
야생형 AAV2의 2.5E5 캡시드 변이체의 라이브러리를 설계하고 플라스미드로 클로닝하여 캡시드 변이체를 암호화하는 플라스미드 라이브러리(라이브러리 실험 1용 라이브러리)를 생성하였다. 라이브러리 실험 1의 실험 결과를 평가하고 이 데이터와 다른 데이터로 기계 학습 모델(machine learning model)을 학습시켰으며, 각각 야생형 AAV2의 1E8 캡시드 변이체를 갖는 두 개의 별도 라이브러리를 설계하는 데 사용하였다(라이브러리 실험 2용 라이브러리). 이러한 라이브러리는 라이브러리 실험 1에서 테스트한 라이브러리보다 훨씬 더 다양하다. 한 라이브러리의 변이체는 후안부 형질도입(예를 들어, 망막, 황반, 비황반 망막, 신경 망막 및 맥락막/RPE 포함)(후안부 라이브러리)을, 다른 라이브러리의 변이체는 전안부 형질도입(예를 들어, 섬유주대 조직 및 쉴렘관 조직 포함)(전안구 라이브러리)을 최대화하도록 설계하였다. 두 라이브러리 모두 바이러스 입자를 생성하는 변이체를 포함하도록 설계하였다. 각 변이체의 캡시드와 고유한 캡시드 변이체 바코드 식별자를 암호화하는 AAV 변이체 게놈 라이브러리는 앞에 상술한 바와 같이 3개의 ITR 플라스미드 백본에 클로닝되었다(Ogden 등 2019). 각 플라스미드 백본에는 다양한 투여 경로를 통해 생체분포 및 형질도입 효율을 분석할 수 있는 고유한 게놈 식별자가 포함되어 있다. 라이브러리는 부착된 HEK293T의 일시적인 삼중 형질감염에 이어 이오딕사놀 구배 정제(iodixanol gradient purification)를 통해 생성되었다.
라이브러리의 시험관 내 평가
데이터를 아래와 같이 준비하였다. 각 변이체의 패키징 효율성(또는 "생성")을 측정하기 위해 플라스미드 및 생성된 AAV 라이브러리에 있는 벡터 게놈의 바코드를 두 번의 PCR을 사용하여 Illumina 시퀀싱용으로 준비하였다. 입력 플라스미드 라이브러리의 존재에 대해 정규화된, 각 변이체에 대한 생성 효율성은 생성된 벡터 풀의 각 변이체에 대한 바코드 시퀀싱 수준을 벡터 풀 생성에 사용된 입력 플라스미드 라이브러리의 각 변이체에 대한 바코드 서열 수준과 비교함으로써 표현된다. 벡터 라이브러리의 변이 빈도 측정을 통해 입력 벡터 라이브러리의 변이 빈도에 의한 생체분포 및 형질도입 측정의 다운스트림 정규화도 가능하다. 라이브러리 실험 1의 변이체에 대한 생성 효율성은 표 1에 보고되어 있으며, 보고된 각 값은 야생형 AAV2 생성에 대한 log2 생성으로 보고된 것이다. 라이브러리 실험 2에 대한 후안부 라이브러리 및 전안부 라이브러리의 변이체에 대한 생성 효율성은 표 6-9, 도 3 및 도 4에 보고되어 있으며, 보고된 각 값은 야생형 AAV2 생성에 대한 log2 생성으로 보고된 것이다.
비인간 영장류의 라이브러리의 생체 내 평가
라이브러리 실험 1
모든 NHP 실험은 기관 정책 및 NIH 지침에 따라 수행하였다. 항-AAV2 중화 항체(시험관 내 NAb 검정에 기초한 혈청 NAb 역가 <1:20)에 대해 혈청 음성인 체중 2.4-2.9kg의 젊은 성체 수컷 및 젊은 성체 암컷 사이노몰구스 원숭이(마카카 파시쿨라리스(Macaca fascicularis))를 연구용으로 선택하였다. 테스트 물품 투여 전에 혈액 샘플, 안방수(aqueous humor)(50μL) 및 유리체액(최대 50μL)을 수집하였다. 동물을 케타민(ketamine) 및 덱스메데토미딘(dexmedetomidine)으로 마취시키고 벡터 라이브러리를 유리체강 내(IVT; 4.8E11 vg/눈, 50μL), 전방 내(IC; 8.5E11 vg/눈, 50μL) 및 정맥 내(IV; 1.8-2.5E13 vg/kg) 주사로 투여하였다. 생애 기간 동안 간접 검안경검사(indirect ophthalmoscopy) 및 세극등 생체현미경검사(slit-lamp biomicroscopy)을 통해 동물의 안구 염증 징후를 모니터링하고 동물 시설의 SOP 및 수의사의 권장 사항에 따라 매주 스테로이드(메틸프레드니솔론(methylprednisolone), 40-80mg)와 국소 스테로이드(Durezol) 및 필요에 따라 아트로핀을 IM 주사하여 치료하였다. 혈청 샘플은 주사 후 1시간, 4시간 및 24시간에 매주 수집하였다. 주사 후 4주 후에 동물을 희생시키고 생체분포 및 형질도입 분석을 위해 조직을 수집하였다.
라이브러리 실험 2
라이브러리 실험 2의 전안부 라이브러리 변이체 및 후안부 라이브러리 변이체의 평가를 사이노몰구스 마카크(Cynomolgus macaque)로 수행하였다. 혈청 항-AAV2 NAb 역가(<1:10)가 낮은 두 마리의 비-나이브 동물의 눈 모두에 7.3E11 vg/눈(IC의 경우 3.9E11 vg, IVT의 경우 3.4E11 vg)의 총 용량으로 후안부 라이브러리의 유리체강 내 주사 및 전안부 라이브러리의 전방 내 주사를 투여하였는데, 두 라이브러리 모두 각각의 눈에 두 가지 투여 경로를 통해 주사하였다. 안구 염증 수준을 모니터링하기 위해 생애 4주 동안 매주 안과 검사를 수행하였다.
라이브러리 실험 1 및 라이브러리 실험 2에 대한 조직 처리 및 데이터 분석
망막과 섬유주대를 도 1에 나타낸 바와 같이 절개하였다. 수집된 다른 조직 샘플의 목록은 표 10에 나와 있다. 모든 샘플을 RNAlater ®(Sigma-Aldrich)에 수집하여 실온에서 밤새 배양한 후, RNAlater ®를 배수하고 샘플을 -80℃에서 냉동시켰다. 또한, 부검 시 안방수, 유리체액, 혈청 및 뇌척수액 샘플을 수집하여 -80℃에서 보관하였다.
[표 10]
생체분포 및 형질도입 분석을 위해 Trizol/클로로포름 및 이소프로판올 침전을 사용하여 조직 샘플에서 전체 DNA 및 RNA를 추출하였다. RNA 샘플을 TURBO DNase(Invitrogen)로 처리하였다. 벡터 전이유전자에 특이적이고 고유한 분자 식별자(unique molecular identifier, UMI)를 포함하는 프라이머를 사용하여 프로토스크립트 Ⅱ 역전사효소(Protoscript Ⅱ Reverse Transcriptase)(NEB)를 사용하여 역전사를 수행하였다. 상기 역전사효소가 결여된 대조용 반응(-RT 대조용)도 준비하였다. 전이유전자 작제물에 특이적인 프라이머 및 프로브를 사용하여 Luna Universal Probe qPCR Master Mix(NEB)를 사용하여 생체분포 및 형질도입의 정량화를 수행하였다. 마지막으로, Illumina NGS 플랫폼과 호환되는 프라이머로 전이유전자 바코드 영역을 증폭시키고 NextSeq 550(Illumina)으로 시퀀싱하여 차세대 시퀀싱을 위한 샘플을 준비하였다.
시퀀싱 후, 예상되는 앰플리콘 구조의 판독으로부터 바코드 태그를 추출하고 각 바코드의 풍부도(판독 횟수 또는 UMI 수)를 기록하였다. 분석은 입력 플라스미드 샘플의 변이체 영역을 표적으로 하는 별도의 시퀀싱 검정으로 측정되는 바와 같이 입력 플라스미드 샘플에 존재하고 변이체 서열에 오류를 함유하지 않은 바코드 세트로 제한되었다.
패키징 복제물을 집계하기 위해 복제 바이러스 생성 샘플의 판독 횟수를 합산하였다. 형질도입 샘플을 집계하기 위해 동일한 조직의 샘플에서 나온 UMI 수를 합산하였다.
조직의 바이러스 패키징, 생체분포 및 형질도입은 집계된 생성, 생체분포 및/또는 형질도입 샘플을 입력으로 사용하여 베이지안(Bayesian) 모델을 사용하여 계산하였다. 간략하게, 확률론적 프로그래밍(probabilistic programming)과 확률론적 변이 추론(stochastic variational inference)을 사용하여 실제 테스트 바이러스 입자와 설계된 서열 간의 측정 과정과 디커플링 소스(예를 들어, 교차 패키징, 템플릿 전환 및 DNA 합성 오류)를 모델링하고 바이러스 생성, 생체분포 및 형질도입(다양한 조직 샘플에서) 및 오류율을 계산하였다. 출력은 야생형(WT) AAV2에 대해 계산된 분포의 log2 변환 평균이었다. 따라서, 측정된 특성에 대해 양의 값은 WT보다 우수한 성능을 나타내고, 음의 값은 WT보다 나쁜 성능을 나타낸다. 라이브러리 실험 1에 대한 형질도입 및 생체분포는 표 1(형질도입) 및 표 5(생체분포)에 보고되어 있다. 라이브러리 실험 2에 대한 형질도입 및 생체분포는 표 6-9에 보고되어 있다. 표시된 경우, 황반 형질도입 및 생체분포는 황반의 신경망막층으로 이루어진 조직에서 측정한 값을 지칭한다. 망막 또는 비황반 망막 형질도입 및 생체분포는 눈의 비황반 망막 영역의 신경 망막층으로 이루어진 조직에서 측정한 값을 지칭한다. 맥락막 및/또는 RPE를 포함한 측정은 전체 망막의 맥락막층으로 이루어진 조직에서 수행된다. 이론에 구애됨이 없이 이 실험에 대한 라이브러리의 복잡성은 전체 총 용량(총 용량이 대략 7E11 vg/눈인 1E8 변이체)에 비해 높기 때문에 라이브러리 실험 2의 상대적 형질도입 및 생체분포 값이 압축되고, 따라서 상대적 형질도입 및 생체분포 비율이 과소 표현된다. 그러나 결과는 라이브러리 실험 1과 라이브러리 실험 2 모두에 포함된 변이체의 상대적 순위 순서가 일관적(Spearman 상관관계 = 0.72)임을 보여 주었으며, 이로써 상위 변이체의 형질도입 개선이 유의미한 것임이 확인된다(예를 들어, 야생형 유형 AAV2보다 더 우수함). 이 실험의 변이체는 라이브러리 실험 1과 유사한 복잡성(예를 들어, 라이브러리당 1-2E5개의 변이체)의 후속 라이브러리 실험에 포함되며 실시예 2에 기술되는 바와 같이 라이브러리 실험 1 및 실시예 2에 대해 본원에 기술된 대로 특성이 확인된다.
라이브러리 실험 1 결과
망막 형질도입의 효율성을 평가하기 위해 두 마리 동물의 양쪽 눈에서 망막 영역에 걸쳐 측정값을 얻었다. 데이터 품질은 음성 대조군의 분리(segregation)와 조직 복제물과 동물 간의 측정 상관관계를 통해 확인되었다. 본원에 기술된 캡시드 폴리펩티드를 포함하는 바이러스 입자에 대한 관심 눈 영역에서의 집계된(눈 및 동물에 걸친) 생체분포 및 형질도입 측정값은 표 1 및 표 5에 제공되어 있다. 주목할 만한 점은 WT 대조군에 비해 표적 망막 및/또는 섬유주대 조직에서 20-60배 향상된 형질도입 속도를 보이는 변이체가 발견되었다는 것이다. 흥미롭게도 일부 개선된 망막 형질도입인자는 전방 내 투여 후 섬유주대의 향상된 형질도입을 나타냈지만 IV 투여 후 간의 향상된 형질도입을 나타내지 않았는데, 이는 눈 조직에 대한 특이성을 가리킨다. 말초 망막 또는 황반 형질도입이 특히 개선된 변이체의 하위집합도 확인되었다. 또한, 개별 변이체의 생산성, 비안구 조직의 형질도입 효율성, 및 안구 및 비안구 조직의 생체분포와 같은 기타 관련 매개변수에 대해 라이브러리를 평가하였다. 결론적으로, 이러한 결과는 임상적 관련 특성이 개선된 AAV 변이체의 설계에서 기계 학습 모델의 힘을 보여준다.
라이브러리 실험 2 결과
라이브러리 실험 2에 포함된 라이브러리 실험 1로부터의 변이체에 대한 생성, 형질도입 및 생체분포 측정값은 도 3(IVT 투여) 및 도 4(IC 투여)에 나와 있다. 모든 값은 wt_AAV2에 대한 log(2)이다. "_std"라고 표시된 열은 "_std" 열 바로 왼쪽에 보고된 연관된 생체분포 또는 형질도입 측정값에 대한 95% 신뢰구간을 제공한다. "망막_황반"은 수집된 모든 황반 샘플의 신경 망막층 집계로부터의 측정값을 제공한다. "망막_비황반"은 수집된 모든 비황반 후안부 영역의 신경 망막층 집계로부터의 측정값을 제공한다. 도 4에서 "맥락막"과 "망막"은 모든 후안부 샘플에 걸쳐 맥락막층 또는 신경 망막층의 집계로부터의 측정값을 제공한다.
실시예 2: 중간 처리량 실험
비인간 영장류의 중간 처리량 라이브러리에 대한 생체 내 평가
표 2(서열)에 제공된 선택된 변이체 캡시드를 포함하는 바이러스 입자는 부착성 HEK293T의 일시적인 삼중 형질감염에 이어 이오딕사놀 구배 정제를 통해 개별적으로 생성된다. 최종 풀링된 테스트 물품 내의 개별 변이체의 표현은 가능한 경우 10배 범위 내에서 균형을 이루었다. 각각의 변이체 캡시드는 유비쿼터스 프로모터(cbh)의 제어하에 독특한 바코드와 형광 리포터 유전자를 암호화하는 게놈으로 생성되었다. 전체적으로 각 변이체는 8개의 고유한 바코드를 포함하는 별도의 게놈으로 생성되어 연구 내에서 생물학적 복제의 척도를 제공한다. 다양성과 측정 확실성의 균형을 맞추면서 캡시드 성능을 최적화하는 알고리즘을 기반으로 라이브러리 실험 1의 안구 NHP 데이터 세트로부터 변이체를 선택하였다. 실험의 한 부문(arm)에서 유리체강 내(IVT) 전달을 통한 후안부(예를 들어, 망막, 황반, 비황반 망막, 신경 망막 및 맥락막/RPE 포함) 및 전안부(예를 들어, 섬유주대 및 쉴렘관의 조직 포함)에서의 형질도입 성능을 기반으로 변이체를 선택하였다. 실험의 다른 부문에서는 전방 내(IC) 전달을 통한 후안부의 형질도입 성능을 기반으로 변이체를 선택하였다. 도 7은 IC 투여에 의한 상대적 섬유주대 형질도입(y축)과 IVT 투여를 통한 상대적 망막(비황반) 형질도입(x축)의 함수로서 라이브러리 실험 1로부터 측정된 모든 변이체를 플롯으로 보여준다. 점은 라이브러리 실험 1로부터의 개별 캡시드 변이체를 나타낸다. 어두운 검정색 점은 이 중간 처리량 연구를 위해 선택된 변이체이다. 도 7에 나와 있고 본원에 기술된 바와 같이, 섬유주대 및 망막 모두에 걸쳐 형질도입이 높은 변이체뿐만 아니라 망막에 대한 특이성 또는 섬유주대 조직에 대한 특이성을 갖는 변이체도 확인되었다. 이론에 구애됨이 없이 눈의 한 영역에 특이성을 갖는 캡시드는 관심 조직에 대한 표적화를 증가시킴으로써 유전자 치료에 이로울 수 있다. 이 연구에는 또한 형질도입 음성 대조군(바이러스를 생성하지만 세포를 형질도입하지는 않을 것으로 예상됨)으로서 VP1 및 VP2에 정지 코돈을 함유하고 생성 음성 대조군(바이러스를 생성할 것으로 예상되지 않음)으로서 vp3 정지 코돈을 함유하는 변이체도 포함되었다.
생성 효율성은 상술한 대로 평가한다. 각 바이러스 입자의 등가량(vg)을 등몰량으로 풀링하여(총 약 50-100개의 변이체) AGM 또는 다른 비인간 영장류, 예를 들어, 사이노몰구스 마카크에 실시예 1에 사용된 용량으로 주사한다. 생체분포 및 조직 형질도입을 포함한 바이러스 특성은, 예를 들어, 실시예 1에 기술된 대로 평가한다.
망막 및 섬유주대의 형질도입이 개선된 라이브러리 실험 1 데이터세트에서 확인된 변이체(예를 들어, 본원에 기술된 변이체)에 대한 연구에 중점을 두었다. 먼저, 다양성과 측정 확실성의 균형을 맞추면서 캡시드 성능을 최적화하는 알고리즘을 기반으로 라이브러리 실험 1로부터의 안구 NHP 데이터세트에서 변이체를 선택하였다. 다음으로, 86개의 변이체와 벤치마크를 합성하고 이를 공동 정제를 통해 별도로 생성하여 최종 벡터 제제의 정의된 풍부도 범위 내에 있도록 개별 변이체의 표현의 균형을 맞추었다. 벌크 데이터에서 형질도입 이벤트를 정량화하기 위해 변이체를 확인 바코드 세트뿐만 아니라 다양한 무작위 서열 ID를 포함하는 게놈과 쌍으로 만들었다.
모든 NHP 실험은 기관 정책 및 NIH 지침에 따라 수행하였다. 체중이 2.8-3kg인 젊은 성체 수컷 사이노몰구스 마카크(필리핀 원숭이(Macaca Fascicularis)) 두 마리로서, 한 마리는 혈청 음성(시험관 내 NAb 검정에 기초한 혈청 NAb 역가 <1:20)이고 한 마리는 항-AAV2 중화 항체에 대한 혈청 양성 반응(1:128)을 나타내는 것을 연구용으로 선택하였다. 테스트 물품 투여 전에 혈액 샘플, 안방수(50μL) 및 유리체액(최대 50μL)을 수집하였다. 동물을 케타민 및 덱스메데토미딘으로 마취시키고 벡터 라이브러리를 유리체 내(IVT; 2.63E11 vg/눈, 50μL) 및 전방 내(IC; 1.11E11 vg/눈, 50μL) 주사하였다. 수명 기간 동안 간접 검안경검사 및 세극등 생체현미경검사를 통해 동물의 안구 염증 징후를 모니터링하고 매주 IM 주사로 스테로이드(메틸프레드니솔론, 80mg)와 국소 스테로이드(Durezol) 및 필요에 따라 동물 시설의 SOP 및 수의사의 권장 사항에 따라 아트로핀을 주사하여 치료하였다. Heidelberg Spectralis HRA/OCT 시스템을 사용하여 녹색 형광 단백질(GFP) 이미징을 갖춘 공초점 주사 레이저 검안경검사(confocal scanning laser ophthalmoscopy, cSLO)를 사용하여 부검 전에 각 눈의 형광 이미지를 촬영하였다. 주사 후 4주 후에 동물을 희생시키고 생체분포 및 형질도입 분석을 위해 조직을 수집하였다.
망막과 섬유주대를 도 1에 나타낸 바와 같이 절개하였다. 모든 안구 조직의 무게를 측정하고 해부 후 드라이아이스에서 급속 냉동시켰다. 수집된 모든 안구 조직의 목록은 표 11에 나와 있다.
[표 11]
연구 기간 동안 유의미한 편차는 보고되지 않았으며 주요 안구 염증도 관찰되지 않았다. 주사 4주 후, 벌크 바코드-seq와 snRNA-seq로 형질도입을 측정하였다. 이 데이터를 통해 라이브러리 실험 1 측정값과 이 실험의 특성 측정값 사이의 상관관계를 관찰하고, 벌크 세포 측정값과 단일 세포 측정값 사이의 전달 효율성을 비교하고, 눈 내 주요 세포 유형에 걸쳐 고성능 변이체에 대한 형질도입 속도를 결정할 수 있었다. 개선된 안구 유전자 치료 전달을 위한 매우 유망한 캡시드를 확인하는 것 외에도 이 고해상도 데이터세트는 라이브러리 실험 1 측정값 품질의 검증과 세포 형질도입, 특이성 및 조직 분포 개선을 목표로 하는 향후 기계 유도 설계(machine-guided design)에 대한 귀중한 입력 데이터를 제공한다. 본 실시예 2에 기술된 이 중간 처리량 연구에 포함된 변이체에 대한 벌크 조직의 결과는 도 5a-5c(IVT 투여) 및 도 6a-6c(IC 투여)에 나와 있다. 모든 값은 야생형 AAV2에 대한 log(2)이다. 도 8은 이 실험의 동일한 변이체에 대해 측정된 망막 형질도입의 중간 처리량(y축)에 대한 측정된 라이브러리 실험 1 신경 망막 형질도입(x축)을 플로팅한 것이다. 나타낸 바와 같이, 망막 형질도입 측정과 테스트된 모든 변이체 간의 순위 순서는 두 연구에서 높은 상관관계가 있었다(피어슨 = 0.789; 스피어만 = 0.757).
단일 세포 RNA 서열 분석은 바코드가 표시된 rAAV의 세포 유형 특이적 친화성을 특성화할 수 있는 것으로 이전에 입증되었다(Brown 등, Front. Immunol., 2021). 그러나 외부에서 공급된 공급 비인간 영장류(NHP) 연구에서 특정 조직 유형 및/또는 급속 냉동 샘플로부터 단일 세포 현탁액을 얻는 것은 매우 어려울 수 있다. 우리는 단일 핵 RNA 시퀀싱(snRNA-Seq)과 표적화된 앰플리콘 시퀀싱을 결합하여 눈 조직에 초기 초점을 맞춰 최소한의 시퀀싱 깊이로 최대 50-100개의 바코드가 표시된 rAAV에서 세포 유형별 형질도입을 안정적으로 감지하는 접근 방식을 개발하고 본 실시예에 기술된 실험에서 수집된 조직에 이러한 방법을 적용하였다. 이 접근 방식을 구현하기 위해 우리는 1) 급속 냉동 NHP 망막에서 고품질 단일 핵 현탁액을 분리하기 위한 최적화된 프로토콜을 개발하였고, 2) 10x Genomics Chromium 플랫폼을 사용하여 이러한 핵을 캡슐화하고 세포 유형을 안정적으로 확인하기 위해 유전자 발현 라이브러리를 생성하고, 3) 10x 기능 바코드 키트를 활용하여 바이러스 게놈에 설계된 10x CS1 기능을 사용하여 캡처한 바코드가 표시된 바이러스 전사체를 선택적으로 증폭(시퀀싱용)하였다. 이 접근법을 사용하여 우리는 NHP(사이노몰구스 마카크) 망막에서 여러 rAAV의 세포 유형별 친화성을 조사하였다. 우리의 snRNA-seq 유전자 발현 분석은 간상세포(Rod), 원추세포(Cone) 및 망막 신경절 세포와 같은 치료 관련 세포를 포함한 모든 주요 망막 세포 유형을 확인하였다. 표적화된 라이브러리 시퀀싱을 통해 평가한 바이러스 형질도입 이벤트는 거의 모든 클러스터에서 감지되었으며 rAAV와 벤치마크 간의 형질도입 속도 차이를 성공적으로 정량화할 수 있었다. 전반적으로, 우리는 snRNA 시퀀싱을 사용하여 바코드가 표시된 rAAV의 세포 유형별 친화성을 효과적으로 결정하고 단일 실험에서 여러 rAAV 간의 상대적 형질도입을 정량화할 수 있음을 입증하였다. 이러한 개발은 유전자 치료를 위한 세포 유형별 표적화가 가능한 rAAV를 추가로 설계하고 검증할 수 있는 기회를 열어준다. 또한, 이 접근 방식을 사용하면 추가 연구를 위해 원하는 속성을 가진 rAAV의 중간 처리량 확인이 가능하다.
본 실시예에 기술된 중간 처리량 연구에 적용된 단일 핵 실험 작업 흐름의 세부 사항은 다음과 같다:
재료
EZ 용해 버퍼 + 0.2U/μl의 뮤린 RNAse 억제제
1X PBS + 9% BSA + 0.2U/μl의 뮤린 RNAse 억제제
1X PBS + 5% BSA + 0.2U/μl의 뮤린 RNAse 억제제/세척
1X PBS + 2% BSA + 0.2U/μl의 뮤린 RNAse 억제제
2% BSA + 1x PBS + 0.2U/μl의 RNAse 억제제로 사전 코팅된 15ml 튜브 2개
2% BSA + 1x PBS + 0.2U/μl의 RNAse 억제제로 사전 코팅된 1.5ml 단백질 로빈드 튜브(protein lobind tube) 6개
2ml의 다운스 균질화기(dounce homogenizer) 1개 + 막자(Pestle) A 및 막자 B
0.4μm 필터 2개
0.7μm 필터 2개
1ml의 넓은 보어 피펫 팁
혈구계산기
15μl의 1xPBS + 5% BSA + 가 포함된 0.5ml 단백질 로빈드 튜브 4-6개
망막과 섬유주대로부터의 단일 핵 해리
민싱(mincing): 망막의 경우, 조직 샘플을 얼음 위의 튜브에 넣고 100μl의 EZ 용해 버퍼 + RNAse 억제제를 첨가하였다. 얼음 위에 튜브를 고정한 상태에서 한 쌍의 미세가위(microscissor)로 조직을 약 1분 동안 잘게 다졌다. 다진 샘플 50μl를 2ml의 다운스 균질화기로 옮겼다. 쌍을 이루는 벌크 RNA 추출 및 시퀀싱을 위해 나머지 샘플에 1-2ml의 Trizol을 첨가하였다.
섬유주대의 경우, 조직을 새로운 1.5ml 튜브로 옮기고 50μl의 EZ 용해 버퍼 + RNAse 억제제를 첨가하였다. 얼음 위에 튜브를 고정한 상태에서 한 쌍의 미세가위로 조직을 약 1분 동안 잘게 다졌다. 다진 조직을 2ml의 다운스 균질화기로 옮겼다.
다운스 균질화: 샘플이 포함된 다운스 균질화기에 더 많은 EZ 용해 버퍼 + RNAse 억제제를 첨가하여 용량을 2ml로 만들었다. 느슨하게 맞는 막자(막자 A)를 사용하여 10회의 일정한 스트로크(초당 약 1회의 스트로크)로 샘플을 다운싱하였다. 샘플을 얼음 위에 20초 동안 방치한 다음 꼭 맞는 막자(막자 B)를 사용하여 5회의 일정한 스트로크로 다운싱하였다. 샘플을 다시 얼음 위에 20초 동안 정치한 후 막자 B를 사용하여 추가로 5회 스트로크하였다.
여과 및 정리: 샘플(2ml)을 다운싱한 후 즉시 2ml의 9.5% + 1x PBS + RNAse 억제제를 함유하는 15ml의 팔콘 튜브(falcon tube)로 옮겼다. 샘플을 혼합하고 먼저 70마이크론 필터를 통해 여과한 다음 40마이크론 필터를 통해 여과하였다. 계수를 위해 필터링된 샘플의 작은(5μl) 분취량을 1xPBS + 2% BSA + 요오드화프로피듐(PI)에 1:4로 희석하였다.
샘플(현재 약 4ml)을 2% BSA + 1xPBS + RNAse 억제제로 사전 코팅된 1.5ml의 단백질 로빈드 원심분리 튜브 4개에 동일하게 분할하였다. 샘플을 4℃에서 5분 동안 200 RCF에서 원심분리하였다. 상청액을 버리고 펠릿을 5% BSA + 1xPBS + RNAse-억제제 + PI에 재현탁하였다.
이어서, 핵을 WOLF 분류기에서 분류하였다. PI에 대해 양성으로 염색된 온전한 핵에 대해 게이팅하였다. 또한, 이중선의 프록시로서 PPI에 대해 곡선하 영역을 사용하여 게이팅하여 임의의 이중선을 폐기하였다. FACS 세척된 핵을 4℃에서 5분 동안 200 RFC에서 원심분리하였다. 펠릿을 2% BSA + 1xPBS + RNAse-억제제에 재현탁하고 계수하였다. 최종 핵 농도는 10x 캡슐화를 위해 필요에 따라 조정하였다.
10x 캡슐화 및 라이브러리 제조: 이어서, 제조업체의 표준 지침에 따라 단일 세포 캡슐화를 위해 10X 크롬 플랫폼을 사용하였다. 역전사는 10x 프로토콜에 따라 수행하였다. cDNA 증폭은 Dyno 바이러스 전사체 특이적 정방향 프라이머가 스파이크된 10X 기능 바코드 cDNA 증폭 키트를 사용하여 수행하였다.
cDNA 증폭 후 cDNA 라이브러리의 일부를 사용하여 10x 표준 프로토콜에 따라 유전자 발현 라이브러리를 생성하였다. 동일한 cDNA 라이브러리의 작은 부분을 사용하여 Dyno 바코드 영역을 PCR 증폭시켜 표적 라이브러리를 생성하였다. 바이러스 전사체 특이적 프라이머와 함께 Nextera Handle 또는 TruSeq Handle에 결합하는 프라이머를 표적 증폭에 사용하였다. TruSeq-Handle 프라이머를 사용하여 증폭시키는 경우, 더 큰 선형 증폭된 배경에서 관심 생성물을 선택하기 위해 표적화된 증폭 직후 겔 추출 단계를 수행하였다. 표적화된 증폭 생성물이 정제되면 사전 인덱싱 및 인덱싱 PCR을 수행하고 illumina Next Seq 시퀀서를 사용하여 라이브러리의 시퀀싱을 수행하였다.
결과
변이체 라이브러리로 형질도입된 5% HEK293 세포와 형질도입되지 않은 95% NHP 간 세포의 혼합물을 포함하는 대조군 실험을 수행하여 검정 감도(sensitivity)를 결정하였다. 처리 및 데이터 분석 후 처리된 모든 핵의 6%가 HEK-293 핵이라는 것을 확인할 수 있었고 HEK-293 핵의 대략 20%에서 라이브러리로부터 바이러스 전사체를 검출하였다. 이러한 감도는 본원에 기술된 중간 처리량 연구로부터 변이체 캡시드 폴리펩티드를 포함하는 바이러스 벡터를 확인하고 특성화하는 데 충분하다. 다음으로, NHP 후안부와 전안부 조직에서 분리된 핵의 데이터를 시퀀싱하였다. PCA를 사용하여 주석이 달린 눈 기준 데이터세트에 투영했을 때 주요 세포 유형을 보여주기 위해 UMAP 플롯(Leiden 클러스터링)에 RNA 전사체 데이터를 플로팅하였다(Swamy, VS 등, Gigascience 2021, 본원에 참조로 포함됨). 이를 통해 무축색 세포(Amacrine cell), 양극성 세포(bipolar cell), 원추세포, 수평 세포(horizontal cell), 미세아교세포(microglia), 뮐러 신경교세포(Muller glia), 망막 신경절 세포(retinal ganglion cell) 및 간상세포를 포함한 눈의 주요 세포 유형에 주석을 달 수 있었다. 문헌(Menon M 등, Nature Comm. 2019; Peng Y 등, Cell, 2019, 둘 다 본원에 참조로 포함됨)의 세포 유형 특이적 마커를 사용하여 이러한 세포 클러스터에서 예상되는 발현 패턴을 확인하였다. 도 9는 후안부에서 수집한 샘플의 중간 처리량 연구에서 얻은 변이체에 대한 세포 유형 형질도입을 보여준다. 오차 막대는 세포를 무작위로 2000회 리샘플링하여 추정한 90% 신뢰구간을 보여준다. 도 9에 나타낸 바와 같이, 본원에 기술된 변이체는 AAV2 야생형에 비해 다른 세포 중에서도 간상세포 및 원추세포의 형질도입이 향상되었다. 또한, 본원에 기술된 변이체는 검출 가능한 야생형 AAV2 형질도입을 보이지 않는 뮐러 신경교세포 및 무축색 세포를 형질도입할 수 있다.
실시예 3
본원에 기술된 변이체 캡시드 폴리펩티드와 연관된 돌연변이 세트(즉, 2개 이상의 돌연변이의 그룹)와 증가된 망막 형질도입 사이의 구조-기능 관계를 확인하기 위해, 표 2에서 각 변이체에 존재하는 야생형 AAV2에 대한 모든 돌연변이는 각각의 치환 또는 결실이 개별 돌연변이로 계산되고, 각각의 삽입 서열이 단일 돌연변이로 계산되며, 삽입의 모든 가능한 접두사 및 접미사가 개별 돌연변이로 계산되도록 구성요소 돌연변이로 분해되었다. 예를 들어, 위치 n의 삽입 ABC는 전체 삽입을 나타내는 ABC_n과 또한 [AB+_n, A+_n, +BC_n, +C_n]으로 분해되며, 여기서 '+'는 해당 삽입 위치에서의 임의의 아미노산 중 하나 이상을 나타낸다.
다음으로, 상술한 바와 같이 생성된 모든 가능한 돌연변이 하위조합("공통 돌연변이 세트(Common Mutation Set)"로 지칭됨)에 대해, 공통 돌연변이 세트에 존재하는 동일한 돌연변이를 함유하고 특정 하위조합에 존재하는 공통 돌연변이 세트만 함유하는 서열로부터 편집 거리가 최대 3인 라이브러리 실험 1 또는 라이브러리 실험 2에서 테스트된 모든 변이체를 확인하고 그룹화하였다. 이를 계산하기 위해, 먼저 중복 삽입 접두사 또는 접미사를 함유하는 돌연변이 세트를 최소 설명 돌연변이 세트로 줄였다(예를 들어, {AB+_n, ABC_n} 세트는 {ABC_n}으로 줄이고 {+BC_n, +C_n}세트는 {+BC_n})으로 줄임). '+'를 포함한 삽입 돌연변이를 함유하는 줄여진 돌연변이 세트의 경우 단일 와일드카드를 허용하기 위해 편집 거리를 계산할 때 하나를 뺐다. 이어서, 각각의 공통 돌연변이 세트와 연관된 모든 변이체에 대한 신경 망막 형질도입 측정 중앙값(야생형 AAV2에 대한 log2)을 계산하였다. 중앙값은 평균보다 이상값에 대해 더 탄력적인 강력한 통계이기 때문에 중앙값을 선택하였다.
최소 구조적 요소의 생성된 공통 돌연변이 세트(즉, 본원에 기술된 변이체에서 발견된 돌연변이의 하위조합)를 다음 두 가지 기준 중 하나에 따라 필터링하였다: (1) 라이브러리 실험에서 존재하는 서브모티프를 포함하는 적어도 5개의 독특한 캡시드 폴리펩티드 변이체 및 0보다 큰 야생형 AAV2 전체 망막 형질도입에 대한 log2 중앙값 또는 (2) 서브모티프를 포함하는 5개 미만의 독특한 캡시드 폴리펩티드 변이체 및 0보다 큰 야생형 AAV2 전체 망막 형질도입에 대한 log2 중앙값. 생성된 공통 돌연변이 세트는 데이터가 증가된 전체 망막 형질도입과 연관되고, 따라서 본원에서 확인되고 기술된 독특한 구조-기능 관계를 포함함을 나타내는 세트이다. 결과는 표 12(라이브러리 실험 1 변이체 분석에서 확인된 하위모티프) 및 표 13(라이브러리 실험 2 변이체 분석에서 확인된 하위모티프)에 나와 있다.
참고문헌:
Ogden PJ, Kelsic ED, Sinai S, Church GM. Comprehensive AAV capsid fitness landscape reveals a viral gene and enables machine-guided design. Science. 2019 Nov 29;366(6469):1139-1143. doi: 10.1126/science.aaw2900. PMID: 31780559; PMCID: PMC7197022.
결과는 본원에 제공된 변이체 캡시드 폴리펩티드가 유리체 내 또는 전방 내 주사 시 야생형 AAV2에 비해 눈의 다양한 영역에서 패키징, 생체분포, 형질도입 및/또는 전이유전자(페이로드)의 발현이 증가된 바이러스 입자를 생성한다는 것을 보여준다. 또한, 본원에 기술된 변이체 캡시드 폴리펩티드는 유전자 치료를 위한 표적 세포 집단을 포함하는 눈의 영역에서 선택적 생체분포 및/또는 발현을 제공한다(예를 들어, 황반 선택성, 비황반 망막 선택성, 황반/망막 선택성 및/또는 섬유주대 선택성). 제한 없이, 본원에 기술된 캡시드 폴리펩티드, 핵산 및 바이러스 입자는 본원에 기술된 바와 같이 더 높은 효율성으로 치료제를 눈, 예를 들어, 눈의 특정 세포 유형에 전달하는 데 사용되고 눈의 장애를 치료하는 데 사용된다.
SEQUENCE LISTING <110> DYNO THERAPEUTICS, INC. <120> CAPSID VARIANTS AND METHODS OF USING THE SAME <130> 257394.000502 <140> PCT/US2022/032004 <141> 2022-06-02 <150> 63/342,455 <151> 2022-05-16 <150> 63/331,627 <151> 2022-04-15 <150> 63/196,554 <151> 2021-06-03 <160> 163 <170> PatentIn version 3.5 <210> 1 <211> 735 <212> PRT <213> Adeno-associated virus 2 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Leu Val Ser 1 5 10 15 Glu Gly Ala Arg Gln Trp Trp His Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Met Ala Val Asp Gly Phe Leu Pro Asp Trp Phe Gln Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Leu Trp Ile Lys Cys Lys Pro Gly Ala Pro Asn Pro 20 25 30 Arg Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Gln Met Thr Ser Gly Thr Leu Gly Thr Gln Met Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 5 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Gln Thr Thr Gly Thr Thr Gly Thr Ser Gly Leu Gln Phe Ser Gln Ala 450 455 460 Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro 465 470 475 480 Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn 485 490 495 Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg 500 505 510 Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp 515 520 525 Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln 530 535 540 Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp 545 550 555 560 Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly 565 570 575 Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala 580 585 590 Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg 595 600 605 Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu 675 680 685 Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn 690 695 700 Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser 705 710 715 720 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 6 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Phe Cys Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Lys Cys 435 440 445 Gln Glu Gly Met Ala Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln 450 455 460 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 465 470 475 480 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 485 490 495 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 500 505 510 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 515 520 525 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 530 535 540 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 545 550 555 560 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 565 570 575 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 580 585 590 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 8 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Leu Met Val Asp Arg Leu Gly Thr Pro Ser Gly Thr Thr Thr Gln 450 455 460 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 465 470 475 480 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 485 490 495 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 500 505 510 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 515 520 525 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 530 535 540 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 545 550 555 560 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 565 570 575 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 580 585 590 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 9 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Thr Ser Gly Thr Gly Gly Thr Gln Thr Leu Ala Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 His Cys Gln Glu Cys Pro Ile Asn Thr Pro Ser Gly Thr Thr Thr Gln 450 455 460 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 465 470 475 480 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 485 490 495 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 500 505 510 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 515 520 525 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 530 535 540 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 545 550 555 560 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 565 570 575 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 580 585 590 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 11 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Phe Ser Gly Leu Glu Asn Thr Thr Thr Gln Ser 450 455 460 Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser 465 470 475 480 Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys 485 490 495 Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr 500 505 510 Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala 515 520 525 Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly 530 535 540 Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile 545 550 555 560 Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro 565 570 575 Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 12 <211> 729 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Phe Ser Gln Ala Gly Ala Ser Asp Ile 450 455 460 Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln 465 470 475 480 Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp 485 490 495 Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn 500 505 510 Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe 515 520 525 Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr 530 535 540 Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg 545 550 555 560 Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn 565 570 575 Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 580 585 590 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 595 600 605 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 610 615 620 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 625 630 635 640 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 645 650 655 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 660 665 670 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 675 680 685 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 690 695 700 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 705 710 715 720 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 <210> 13 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser Val Ala 450 455 460 Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro 465 470 475 480 Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn 485 490 495 Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg 500 505 510 Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp 515 520 525 Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln 530 535 540 Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp 545 550 555 560 Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly 565 570 575 Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala 580 585 590 Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg 595 600 605 Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu 675 680 685 Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn 690 695 700 Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser 705 710 715 720 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 14 <211> 733 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala Arg Thr 435 440 445 Gln Ser Thr Thr Gly Gly Thr Ser Gly Leu Gln Phe Ser Gln Ala Gly 450 455 460 Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro Cys 465 470 475 480 Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn Ser 485 490 495 Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp 500 505 510 Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Glu 515 520 525 Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln Gly 530 535 540 Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp Glu 545 550 555 560 Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Ser 565 570 575 Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala Asp 580 585 590 Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp 595 600 605 Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly 610 615 620 His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro 625 630 635 640 Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser 645 650 655 Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser 660 665 670 Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn 675 680 685 Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys 690 695 700 Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu 705 710 715 720 Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 15 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Gln Ser Pro Tyr Gly Gly Thr Ala Thr Phe Met Asp Leu Gln Phe Ser 450 455 460 Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn 485 490 495 Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly 530 535 540 Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg His 435 440 445 Glu Thr Glu Phe Asn Phe Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln 450 455 460 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 465 470 475 480 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 485 490 495 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 500 505 510 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 515 520 525 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 530 535 540 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 545 550 555 560 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 565 570 575 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 580 585 590 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 17 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Thr Ser Gly Thr Gly Gly Thr Gln Thr Leu Ala Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 18 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Phe Ala Leu Met Glu Pro Asn Leu Gln Arg Gly 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 19 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 19 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Ala Tyr Asn Pro Asp Arg Gly 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 20 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 20 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Ala Lys Val Met Ile Thr 545 550 555 560 Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Val Val Ala Ala Asn Leu Gln Gly Asn Arg Gln Ala Ala Thr Ala 580 585 590 Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg 595 600 605 Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu 675 680 685 Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn 690 695 700 Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser 705 710 715 720 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 21 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 21 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Leu Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Asp Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 22 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 22 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Asn Val Leu Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ile Val Ala Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 23 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 23 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Leu Glu Arg Val Met Leu Thr 545 550 555 560 Ser Glu Glu Glu Ile Ala Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Asp Asn Leu Gln Ser Arg Ser Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 24 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Ala Asp Ile Ser Asp Val Met Leu Thr 545 550 555 560 Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ile Val Ser Asp Asn Leu Gln Arg Gln Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 25 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Glu Tyr 565 570 575 Gly Ala Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 26 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Leu Asn Trp Thr Ala Glu Gln Arg Gly 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 27 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 27 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Ser Gly Asn Thr Asn Pro Ile Thr 580 585 590 Gly Asp Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 28 <211> 743 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Leu Ala Lys Glu Phe Thr Thr Arg 580 585 590 Asn Ala Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala 660 665 670 Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe 705 710 715 720 Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 29 <211> 740 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 29 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Leu His Pro Leu Glu Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly 595 600 605 Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala 610 615 620 Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly 625 630 635 640 Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr 645 650 655 Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala 660 665 670 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu 675 680 685 Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 690 695 700 Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp 705 710 715 720 Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 725 730 735 Thr Arg Asn Leu 740 <210> 30 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Phe Gly Asn Arg Gln Ala Ala 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 31 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 31 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asp Gln Asp Phe Lys Asn 580 585 590 Arg Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 32 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ile Ala Ala 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 33 <211> 744 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ile Glu Gln 580 585 590 Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly 595 600 605 Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly 610 615 620 Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser 625 630 635 640 Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu 645 650 655 Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala 660 665 670 Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser 675 680 685 Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn 690 695 700 Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp 705 710 715 720 Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly 725 730 735 Thr Arg Tyr Leu Thr Arg Asn Leu 740 <210> 34 <211> 743 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Ala Arg Leu Asp Glu Thr Thr 580 585 590 Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala 660 665 670 Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe 705 710 715 720 Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 35 <211> 744 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Leu Ala Leu Ala Glu Ile 580 585 590 Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly 595 600 605 Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly 610 615 620 Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser 625 630 635 640 Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu 645 650 655 Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala 660 665 670 Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser 675 680 685 Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn 690 695 700 Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp 705 710 715 720 Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly 725 730 735 Thr Arg Tyr Leu Thr Arg Asn Leu 740 <210> 36 <211> 744 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Leu Ala Asn Gly Glu Gln 580 585 590 Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly 595 600 605 Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly 610 615 620 Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser 625 630 635 640 Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu 645 650 655 Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala 660 665 670 Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser 675 680 685 Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn 690 695 700 Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp 705 710 715 720 Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly 725 730 735 Thr Arg Tyr Leu Thr Arg Asn Leu 740 <210> 37 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Ala Thr Asp Thr Lys Thr 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 38 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Pro Ala 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 39 <211> 744 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 39 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Pro Gly Glu Thr 580 585 590 Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly 595 600 605 Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly 610 615 620 Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser 625 630 635 640 Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu 645 650 655 Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala 660 665 670 Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser 675 680 685 Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn 690 695 700 Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp 705 710 715 720 Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly 725 730 735 Thr Arg Tyr Leu Thr Arg Asn Leu 740 <210> 40 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Pro Ala Ala 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 41 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Ser Ser Ala Arg Gln Ala Glu Thr 580 585 590 Ala Arg Val Asn Ala Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 42 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Phe His Asn Glu Gly Lys 580 585 590 Tyr Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 43 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Gly 580 585 590 Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 44 <211> 742 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Pro Trp Glu 580 585 590 Pro Asp Lys Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 595 600 605 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 610 615 620 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 660 665 670 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 675 680 685 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 690 695 700 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 705 710 715 720 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 725 730 735 Tyr Leu Thr Arg Asn Leu 740 <210> 45 <211> 743 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Leu Ala Leu Ser Thr Thr Asn Ala Asp Val Asn Thr Gln Gly Val 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala 660 665 670 Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe 705 710 715 720 Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 46 <211> 741 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Pro Trp Gly Thr Ala Gly Gly 580 585 590 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 595 600 605 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 610 615 620 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 625 630 635 640 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 645 650 655 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 660 665 670 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 675 680 685 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 690 695 700 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 705 710 715 720 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 725 730 735 Leu Thr Arg Asn Leu 740 <210> 47 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 atggctgccg atggttatct tccagattgg ctcgaggacc tggtatctga aggagcgaga 60 cagtggtggc atctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 48 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 atggctgttg atggttttct tccagattgg tttcaagaca ctctctctga aggaataaga 60 ttatggatca agtgcaaacc tggcgcgcca aacccacgcc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 49 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccggctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacacagatg accagtggaa ccttgggtac acagatgctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 50 <211> 2205 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 50 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gacagactca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacacaaact actggaacca ccggtacctc aggacttcag 1380 ttttctcagg ccggagcgag tgacattcgg gaccagtcta ggaactggct tcctggaccc 1440 tgttaccgcc agcagcgagt atcaaagaca tctgcggata acaacaacag tgaatactcg 1500 tggactggag ctaccaagta ccacctcaat ggcagagact ctctggtgaa tccgggcccg 1560 gccatggcaa gccacaagga cgatgaagaa aagttttttc ctcagagcgg ggttctcatc 1620 tttgggaagc aaggctcaga gaaaacaaat gtggacattg aaaaggtcat gattacagac 1680 gaagaggaaa tcaggacaac caatcccgtg gctacggagc agtatggttc tgtatctacc 1740 aacctccaga gaggcaacag acaagcagct accgcagatg tcaacacaca aggcgttctt 1800 ccaggcatgg tctggcagga cagagatgtg taccttcagg ggcccatctg ggcaaagatt 1860 ccacacacgg acggacattt tcacccctct cccctcatgg gtggattcgg acttaaacac 1920 cctcctccac agattctcat caagaacacc ccggtacctg cgaatccttc gaccaccttc 1980 agtgcggcaa agtttgcttc cttcatcaca cagtactcca cgggacaggt cagcgtggag 2040 atcgagtggg agctgcagaa ggaaaacagc aaacgctgga atcccgaaat tcagtacact 2100 tccaactaca acaagtctgt taatgtggac tttactgtgg acactaatgg cgtgtattca 2160 gagcctcgcc ccattggcac cagatacctg actcgtaatc tgtaa 2205 <210> 51 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctta tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgtt ttgtaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 52 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctga tgaatcctct catcgaccag 1320 tacctgtatt acttgagcaa gtgccaggaa ggaatggcta gaacaaacac tccaagtgga 1380 accaccacgc agtcaaggct tcagttttct caggccggag cgagtgacat tcgggaccag 1440 tctaggaact ggcttcctgg accctgttac cgccagcagc gagtatcaaa gacatctgcg 1500 gataacaaca acagtgaata ctcgtggact ggagctacca agtaccacct caatggcaga 1560 gactctctgg tgaatccggg cccggccatg gcaagccaca aggacgatga agaaaagttt 1620 tttcctcaga gcggggttct catctttggg aagcaaggct cagagaaaac aaatgtggac 1680 attgaaaagg tcatgattac agacgaagag gaaatcagga caaccaatcc cgtggctacg 1740 gagcagtatg gttctgtatc taccaacctc cagagaggca acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 53 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctaa tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacctc atggttgacc gacttgggac tccaagtgga 1380 accaccacgc agtcaaggct tcagttttct caggccggag cgagtgacat tcgggaccag 1440 tctaggaact ggcttcctgg accctgttac cgccagcagc gagtatcaaa gacatctgcg 1500 gataacaaca acagtgaata ctcgtggact ggagctacca agtaccacct caatggcaga 1560 gactctctgg tgaatccggg cccggccatg gcaagccaca aggacgatga agaaaagttt 1620 tttcctcaga gcggggttct catctttggg aagcaaggct cagagaaaac aaatgtggac 1680 attgaaaagg tcatgattac agacgaagag gaaatcagga caaccaatcc cgtggctacg 1740 gagcagtatg gttctgtatc taccaacctc cagagaggca acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 54 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 54 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgactca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact acaagtggaa ccggaggaac acagacgctt 1380 gctttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 55 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 55 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctga tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacacattgt caggagtgtc caattaacac tccaagtgga 1380 accaccacgc agtcaaggct tcagttttct caggccggag cgagtgacat tcgggaccag 1440 tctaggaact ggcttcctgg accctgttac cgccagcagc gagtatcaaa gacatctgcg 1500 gataacaaca acagtgaata ctcgtggact ggagctacca agtaccacct caatggcaga 1560 gactctctgg tgaatccggg cccggccatg gcaagccaca aggacgatga agaaaagttt 1620 tttcctcaga gcggggttct catctttggg aagcaaggct cagagaaaac aaatgtggac 1680 attgaaaagg tcatgattac agacgaagag gaaatcagga caaccaatcc cgtggctacg 1740 gagcagtatg gttctgtatc taccaacctc cagagaggca acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 56 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 56 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctaa tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggat tctctggctt ggagaacacc 1380 accacgcagt caaggcttca gttttctcag gccggagcga gtgacattcg ggaccagtct 1440 aggaactggc ttcctggacc ctgttaccgc cagcagcgag tatcaaagac atctgcggat 1500 aacaacaaca gtgaatactc gtggactgga gctaccaagt accacctcaa tggcagagac 1560 tctctggtga atccgggccc ggccatggca agccacaagg acgatgaaga aaagtttttt 1620 cctcagagcg gggttctcat ctttgggaag caaggctcag agaaaacaaa tgtggacatt 1680 gaaaaggtca tgattacaga cgaagaggaa atcaggacaa ccaatcccgt ggctacggag 1740 cagtatggtt ctgtatctac caacctccag agaggcaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 57 <211> 2190 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gacagactca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccttttc tcaggccgga 1380 gcgagtgaca ttcgggacca gtctaggaac tggcttcctg gaccctgtta ccgccagcag 1440 cgagtatcaa agacatctgc ggataacaac aacagtgaat actcgtggac tggagctacc 1500 aagtaccacc tcaatggcag agactctctg gtgaatccgg gcccggccat ggcaagccac 1560 aaggacgatg aagaaaagtt ttttcctcag agcggggttc tcatctttgg gaagcaaggc 1620 tcagagaaaa caaatgtgga cattgaaaag gtcatgatta cagacgaaga ggaaatcagg 1680 acaaccaatc ccgtggctac ggagcagtat ggttctgtat ctaccaacct ccagagaggc 1740 aacagacaag cagctaccgc agatgtcaac acacaaggcg ttcttccagg catggtctgg 1800 caggacagag atgtgtacct tcaggggccc atctgggcaa agattccaca cacggacgga 1860 cattttcacc cctctcccct catgggtgga ttcggactta aacaccctcc tccacagatt 1920 ctcatcaaga acaccccggt acctgcgaat ccttcgacca ccttcagtgc ggcaaagttt 1980 gcttccttca tcacacagta ctccacggga caggtcagcg tggagatcga gtgggagctg 2040 cagaaggaaa acagcaaacg ctggaatccc gaaattcagt acacttccaa ctacaacaag 2100 tctgttaatg tggactttac tgtggacact aatggcgtgt attcagagcc tcgccccatt 2160 ggcaccagat acctgactcg taatctgtaa 2190 <210> 58 <211> 2205 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 58 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctga tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaatcaac gggagtggac agaaccagca aactcttaag 1380 ttttctgtgg ccggagcgag tgacattcgg gaccagtcta ggaactggct tcctggaccc 1440 tgttaccgcc agcagcgagt atcaaagaca tctgcggata acaacaacag tgaatactcg 1500 tggactggag ctaccaagta ccacctcaat ggcagagact ctctggtgaa tccgggcccg 1560 gccatggcaa gccacaagga cgatgaagaa aagttttttc ctcagagcgg ggttctcatc 1620 tttgggaagc aaggctcaga gaaaacaaat gtggacattg aaaaggtcat gattacagac 1680 gaagaggaaa tcaggacaac caatcccgtg gctacggagc agtatggttc tgtatctacc 1740 aacctccaga gaggcaacag acaagcagct accgcagatg tcaacacaca aggcgttctt 1800 ccaggcatgg tctggcagga cagagatgtg taccttcagg ggcccatctg ggcaaagatt 1860 ccacacacgg acggacattt tcacccctct cccctcatgg gtggattcgg acttaaacac 1920 cctcctccac agattctcat caagaacacc ccggtacctg cgaatccttc gaccaccttc 1980 agtgcggcaa agtttgcttc cttcatcaca cagtactcca cgggacaggt cagcgtggag 2040 atcgagtggg agctgcagaa ggaaaacagc aaacgctgga atcccgaaat tcagtacact 2100 tccaactaca acaagtctgt taatgtggac tttactgtgg acactaatgg cgtgtattca 2160 gagcctcgcc ccattggcac cagatacctg actcgtaatc tgtaa 2205 <210> 59 <211> 2202 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctta tgaatcctct catcgaccag 1320 tacctgtatt acttggctag aactcaaagt acaaccgggg gtacctcagg gcttcagttt 1380 tctcaggccg gagcgagtga cattcgggac cagtctagga actggcttcc tggaccctgt 1440 taccgccagc agcgagtatc aaagacatct gcggataaca acaacagtga atactcgtgg 1500 actggagcta ccaagtacca cctcaatggc agagactctc tggtgaatcc gggcccggcc 1560 atggcaagcc acaaggacga tgaagaaaag ttttttcctc agagcggggt tctcatcttt 1620 gggaagcaag gctcagagaa aacaaatgtg gacattgaaa aggtcatgat tacagacgaa 1680 gaggaaatca ggacaaccaa tcccgtggct acggagcagt atggttctgt atctaccaac 1740 ctccagagag gcaacagaca agcagctacc gcagatgtca acacacaagg cgttcttcca 1800 ggcatggtct ggcaggacag agatgtgtac cttcaggggc ccatctgggc aaagattcca 1860 cacacggacg gacattttca cccctctccc ctcatgggtg gattcggact taaacaccct 1920 cctccacaga ttctcatcaa gaacaccccg gtacctgcga atccttcgac caccttcagt 1980 gcggcaaagt ttgcttcctt catcacacag tactccacgg gacaggtcag cgtggagatc 2040 gagtgggagc tgcagaagga aaacagcaaa cgctggaatc ccgaaattca gtacacttcc 2100 aactacaaca agtctgttaa tgtggacttt actgtggaca ctaatggcgt gtattcagag 2160 cctcgcccca ttggcaccag atacctgact cgtaatctgt aa 2202 <210> 60 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 60 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgcctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacacaatcg ccatacgggg gaaccgccac gttcatggac 1380 cttcagtttt ctcaggccgg agcgagtgac attcgggacc agtctaggaa ctggcttcct 1440 ggaccctgtt accgccagca gcgagtatca aagacatctg cggataacaa caacagtgaa 1500 tactcgtgga ctggagctac caagtaccac ctcaatggca gagactctct ggtgaatccg 1560 ggcccggcca tggcaagcca caaggacgat gaagaaaagt tttttcctca gagcggggtt 1620 ctcatctttg ggaagcaagg ctcagagaaa acaaatgtgg acattgaaaa ggtcatgatt 1680 acagacgaag aggaaatcag gacaaccaat cccgtggcta cggagcagta tggttctgta 1740 tctaccaacc tccagagagg caacagacaa gcagctaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 61 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 61 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtttga tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag acacgaaacc gaattcaatt ttacaaacac tccaagtgga 1380 accaccacgc agtcaaggct tcagttttct caggccggag cgagtgacat tcgggaccag 1440 tctaggaact ggcttcctgg accctgttac cgccagcagc gagtatcaaa gacatctgcg 1500 gataacaaca acagtgaata ctcgtggact ggagctacca agtaccacct caatggcaga 1560 gactctctgg tgaatccggg cccggccatg gcaagccaca aggacgatga agaaaagttt 1620 tttcctcaga gcggggttct catctttggg aagcaaggct cagagaaaac aaatgtggac 1680 attgaaaagg tcatgattac agacgaagag gaaatcagga caaccaatcc cgtggctacg 1740 gagcagtatg gttctgtatc taccaacctc cagagaggca acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 62 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 62 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgactca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact acaagtggaa ccggaggaac acagacgctt 1380 gctttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 63 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 63 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 acctttgccc tcatggagcc gaacctccag agaggcaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 64 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 64 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agcgtgcgta caatcctgat agaggcaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 65 <211> 2205 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 65 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgcaaaggt catgattaca 1680 tccgaagagg aaatcaagac aaccaatccc gtggctacgg agcagtatgg tgtggtagct 1740 gctaacctcc agggcaacag acaagcagct accgcagatg tcaacacaca aggcgttctt 1800 ccaggcatgg tctggcagga cagagatgtg taccttcagg ggcccatctg ggcaaagatt 1860 ccacacacgg acggacattt tcacccctct cccctcatgg gtggattcgg acttaaacac 1920 cctcctccac agattctcat caagaacacc ccggtacctg cgaatccttc gaccaccttc 1980 agtgcggcaa agtttgcttc cttcatcaca cagtactcca cgggacaggt cagcgtggag 2040 atcgagtggg agctgcagaa ggaaaacagc aaacgctgga atcccgaaat tcagtacact 2100 tccaactaca acaagtctgt taatgtggac tttactgtgg acactaatgg cgtgtattca 2160 gagcctcgcc ccattggcac cagatacctg actcgtaatc tgtaa 2205 <210> 66 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 66 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaagct catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg tgatgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 67 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 67 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaacgt cctcattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg tattgtagct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 68 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggacc tcgaacgtgt catgcttaca 1680 tcggaagagg aaatcgccac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 gacaacctcc agtcgagatc aagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 69 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 69 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgctgaca tttctgacgt catgcttaca 1680 agcgaagagg aaatcaaaac aaccaatccc gtggctacgg agcagtatgg tattgtatct 1740 gacaacctcc agagacagaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 70 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 70 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg aggagtatgg tgctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 71 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 71 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc tcaattggac tgccgaacag agaggcaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 72 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 72 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agtctggcaa cacaaatcct attaccggag atgtcaactc gcaaggcgcg 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 73 <211> 2232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 73 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agttggcgaa agaattcact acgcggaatg cgaacagaca agcagctacc 1800 gcagatgtca acacacaagg cgttcttcca ggcatggtct ggcaggacag agatgtgtac 1860 cttcaggggc ccatctgggc aaagattcca cacacggacg gacattttca cccctctccc 1920 ctcatgggtg gattcggact taaacaccct cctccacaga ttctcatcaa gaacaccccg 1980 gtacctgcga atccttcgac caccttcagt gcggcaaagt ttgcttcctt catcacacag 2040 tactccacgg gacaggtcag cgtggagatc gagtgggagc tgcagaagga aaacagcaaa 2100 cgctggaatc ccgaaattca gtacacttcc aactacaaca agtctgttaa tgtggacttt 2160 actgtggaca ctaatggcgt gtattcagag cctcgcccca ttggcaccag atacctgact 2220 cgtaatctgt aa 2232 <210> 74 <211> 2223 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 74 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccttac atccgctgga ggcagatgtc 1800 aacacacaag gcgttcttcc aggcatggtc tggcaggaca gagatgtgta ccttcagggg 1860 cccatctggg caaagattcc acacacggac ggacattttc acccctctcc cctcatgggt 1920 ggattcggac ttaaacaccc tcctccacag attctcatca agaacacccc ggtacctgcg 1980 aatccttcga ccaccttcag tgcggcaaag tttgcttcct tcatcacaca gtactccacg 2040 ggacaggtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa acgctggaat 2100 cccgaaattc agtacacttc caactacaac aagtctgtta atgtggactt tactgtggac 2160 actaatggcg tgtattcaga gcctcgcccc attggcacca gatacctgac tcgtaatctg 2220 taa 2223 <210> 75 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 75 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagatttgg caacagacaa gcagctaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 76 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 76 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcga ccaagatttc aaaaaccgaa acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 77 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 77 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaaatc gcagctaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 78 <211> 2235 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 78 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa ccttgctatc gaacaaacaa gaccagcgag acaagcagct 1800 accgcagatg tcaacacaca aggcgttctt ccaggcatgg tctggcagga cagagatgtg 1860 taccttcagg ggcccatctg ggcaaagatt ccacacacgg acggacattt tcacccctct 1920 cccctcatgg gtggattcgg acttaaacac cctcctccac agattctcat caagaacacc 1980 ccggtacctg cgaatccttc gaccaccttc agtgcggcaa agtttgcttc cttcatcaca 2040 cagtactcca cgggacaggt cagcgtggag atcgagtggg agctgcagaa ggaaaacagc 2100 aaacgctgga atcccgaaat tcagtacact tccaactaca acaagtctgt taatgtggac 2160 tttactgtgg acactaatgg cgtgtattca gagcctcgcc ccattggcac cagatacctg 2220 actcgtaatc tgtaa 2235 <210> 79 <211> 2232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 79 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagagctcg attggatgag acaacacgcc ctgctagaca agcagctacc 1800 gcagatgtca acacacaagg cgttcttcca ggcatggtct ggcaggacag agatgtgtac 1860 cttcaggggc ccatctgggc aaagattcca cacacggacg gacattttca cccctctccc 1920 ctcatgggtg gattcggact taaacaccct cctccacaga ttctcatcaa gaacaccccg 1980 gtacctgcga atccttcgac caccttcagt gcggcaaagt ttgcttcctt catcacacag 2040 tactccacgg gacaggtcag cgtggagatc gagtgggagc tgcagaagga aaacagcaaa 2100 cgctggaatc ccgaaattca gtacacttcc aactacaaca agtctgttaa tgtggacttt 2160 actgtggaca ctaatggcgt gtattcagag cctcgcccca ttggcaccag atacctgact 2220 cgtaatctgt aa 2232 <210> 80 <211> 2235 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 80 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggctt ggctctcgct gagatcacca gaccggcgag acaagcagct 1800 accgcagatg tcaacacaca aggcgttctt ccaggcatgg tctggcagga cagagatgtg 1860 taccttcagg ggcccatctg ggcaaagatt ccacacacgg acggacattt tcacccctct 1920 cccctcatgg gtggattcgg acttaaacac cctcctccac agattctcat caagaacacc 1980 ccggtacctg cgaatccttc gaccaccttc agtgcggcaa agtttgcttc cttcatcaca 2040 cagtactcca cgggacaggt cagcgtggag atcgagtggg agctgcagaa ggaaaacagc 2100 aaacgctgga atcccgaaat tcagtacact tccaactaca acaagtctgt taatgtggac 2160 tttactgtgg acactaatgg cgtgtattca gagcctcgcc ccattggcac cagatacctg 2220 actcgtaatc tgtaa 2235 <210> 81 <211> 2235 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 81 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcct ggcgaacggc gaacaaacca ggcctgcgag acaagcagct 1800 accgcagatg tcaacacaca aggcgttctt ccaggcatgg tctggcagga cagagatgtg 1860 taccttcagg ggcccatctg ggcaaagatt ccacacacgg acggacattt tcacccctct 1920 cccctcatgg gtggattcgg acttaaacac cctcctccac agattctcat caagaacacc 1980 ccggtacctg cgaatccttc gaccaccttc agtgcggcaa agtttgcttc cttcatcaca 2040 cagtactcca cgggacaggt cagcgtggag atcgagtggg agctgcagaa ggaaaacagc 2100 aaacgctgga atcccgaaat tcagtacact tccaactaca acaagtctgt taatgtggac 2160 tttactgtgg acactaatgg cgtgtattca gagcctcgcc ccattggcac cagatacctg 2220 actcgtaatc tgtaa 2235 <210> 82 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 82 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcgc tacggatact aagacgaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 83 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 83 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca ccagctaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 84 <211> 2235 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cgcacccgga gagactacta ggccagcaag acaagcagct 1800 accgcagatg tcaacacaca aggcgttctt ccaggcatgg tctggcagga cagagatgtg 1860 taccttcagg ggcccatctg ggcaaagatt ccacacacgg acggacattt tcacccctct 1920 cccctcatgg gtggattcgg acttaaacac cctcctccac agattctcat caagaacacc 1980 ccggtacctg cgaatccttc gaccaccttc agtgcggcaa agtttgcttc cttcatcaca 2040 cagtactcca cgggacaggt cagcgtggag atcgagtggg agctgcagaa ggaaaacagc 2100 aaacgctgga atcccgaaat tcagtacact tccaactaca acaagtctgt taatgtggac 2160 tttactgtgg acactaatgg cgtgtattca gagcctcgcc ccattggcac cagatacctg 2220 actcgtaatc tgtaa 2235 <210> 85 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 85 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaaccg gcagctaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 86 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agtcttctgc tagacaagca gagacagcac gggtcaacgc tcaaggcatt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 87 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 87 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggctt ccataatgaa ggaaaataca acagacaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 88 <211> 2211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 88 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctgggaccg cagatgtcaa cacacaaggc 1800 gttcttccag gcatggtctg gcaggacaga gatgtgtacc ttcaggggcc catctgggca 1860 aagattccac acacggacgg acattttcac ccctctcccc tcatgggtgg attcggactt 1920 aaacaccctc ctccacagat tctcatcaag aacaccccgg tacctgcgaa tccttcgacc 1980 accttcagtg cggcaaagtt tgcttccttc atcacacagt actccacggg acaggtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaaac gctggaatcc cgaaattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtggacac taatggcgtg 2160 tattcagagc ctcgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 89 <211> 2229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 89 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaaccg tgggaaccgg ataagcaagc agctaccgca 1800 gatgtcaaca cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt 1860 caggggccca tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc 1920 atgggtggat tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta 1980 cctgcgaatc cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac 2040 tccacgggac aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc 2100 tggaatcccg aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact 2160 gtggacacta atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt 2220 aatctgtaa 2229 <210> 90 <211> 2232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 90 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcac tggcgcttag tacaactaat 1800 gcagatgtca acacacaagg cgttcttcca ggcatggtct ggcaggacag agatgtgtac 1860 cttcaggggc ccatctgggc aaagattcca cacacggacg gacattttca cccctctccc 1920 ctcatgggtg gattcggact taaacaccct cctccacaga ttctcatcaa gaacaccccg 1980 gtacctgcga atccttcgac caccttcagt gcggcaaagt ttgcttcctt catcacacag 2040 tactccacgg gacaggtcag cgtggagatc gagtgggagc tgcagaagga aaacagcaaa 2100 cgctggaatc ccgaaattca gtacacttcc aactacaaca agtctgttaa tgtggacttt 2160 actgtggaca ctaatggcgt gtattcagag cctcgcccca ttggcaccag atacctgact 2220 cgtaatctgt aa 2232 <210> 91 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 91 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agcggccttg gggcacagct ggaggcaaca gacaagcagc taccgcagat 1800 gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 1860 gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 1920 ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 1980 gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2040 acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2100 aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2160 gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2220 ctgtaa 2226 <210> 92 <211> 2208 <212> DNA <213> Adeno-associated virus 2 <400> 92 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 93 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 93 Leu Ala Leu Gly Glu Thr Thr Arg Pro Ala 1 5 10 <210> 94 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 94 Leu Gly Glu Thr Thr Arg Pro 1 5 <210> 95 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 95 Lys Cys Gln Glu Gly Met Ala 1 5 <210> 96 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 96 Leu Met Val Asp Arg Leu Gly 1 5 <210> 97 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 97 His Cys Gln Glu Cys Pro Ile 1 5 <210> 98 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 98 Phe Ser Gly Leu Glu Asn 1 5 <210> 99 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 99 His Glu Thr Glu Phe Asn Phe 1 5 <210> 100 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 100 Phe Ala Leu Met Glu Pro 1 5 <210> 101 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 101 Arg Ala Tyr Asn Pro Asp 1 5 <210> 102 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 102 Leu Asn Trp Thr Ala Glu 1 5 <210> 103 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 103 Leu Ala Lys Glu Phe Thr Thr Arg 1 5 <210> 104 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 104 Lys Glu Phe Thr Thr Arg 1 5 <210> 105 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 105 Leu His Pro Leu Glu 1 5 <210> 106 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 106 Asp Gln Asp Phe Lys Asn Arg 1 5 <210> 107 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 107 Leu Ala Ile Glu Gln Thr Arg Pro Ala 1 5 <210> 108 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 108 Ile Glu Gln Thr Arg Pro Ala 1 5 <210> 109 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 109 Arg Ala Arg Leu Asp Glu Thr Thr 1 5 <210> 110 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 110 Arg Leu Asp Glu Thr Thr 1 5 <210> 111 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 111 Leu Ala Leu Ala Glu Ile Thr Arg Pro 1 5 <210> 112 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 112 Leu Ala Glu Ile Thr Arg Pro 1 5 <210> 113 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 113 Leu Ala Asn Gly Glu Gln Thr Arg Pro 1 5 <210> 114 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 114 Asn Gly Glu Gln Thr Arg Pro 1 5 <210> 115 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 115 Ala Thr Asp Thr Lys Thr 1 5 <210> 116 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 116 Ala Pro Gly Glu Thr Thr Arg Pro Ala 1 5 <210> 117 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Gly Glu Thr Thr Arg Pro 1 5 <210> 118 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 118 Phe His Asn Glu Gly Lys Tyr 1 5 <210> 119 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 119 Gln Pro Trp Glu Pro Asp Lys 1 5 <210> 120 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 120 Ala Leu Ala Leu Ser Thr Thr Asn 1 5 <210> 121 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 121 Ala Leu Ser Thr Thr Asn 1 5 <210> 122 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 122 Pro Trp Gly Thr Ala Gly 1 5 <210> 123 <211> 724 <212> PRT <213> Adeno-associated virus 5 <400> 123 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 195 200 205 Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 210 215 220 Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 225 230 235 240 Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 245 250 255 Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 305 310 315 320 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 325 330 335 Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 340 345 350 Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 355 360 365 Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 370 375 380 Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 405 410 415 Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 420 425 430 Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 435 440 445 Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 450 455 460 Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 465 470 475 480 Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 485 490 495 Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 500 505 510 Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 515 520 525 Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 530 535 540 Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 545 550 555 560 Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 565 570 575 Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 580 585 590 Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 595 600 605 Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 610 615 620 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 625 630 635 640 Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 645 650 655 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 660 665 670 Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 675 680 685 Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 690 695 700 Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 705 710 715 720 Thr Arg Pro Leu <210> 124 <211> 2175 <212> DNA <213> Adeno-associated virus 5 <400> 124 atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60 tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120 gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg gctcgatcga 180 ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240 cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300 gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360 aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420 ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480 aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540 ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600 ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660 gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720 agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780 aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840 cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900 tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960 accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020 ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080 tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140 gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200 aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260 cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320 acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380 tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440 gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500 agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560 tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620 acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680 gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740 gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800 gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860 tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920 acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980 cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040 aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100 tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160 acccgacccc tttaa 2175 <210> 125 <211> 738 <212> PRT <213> Adeno-associated virus 8 <400> 125 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 126 <211> 2217 <212> DNA <213> Adeno-associated virus 8 <400> 126 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480 ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540 gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600 cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960 atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020 agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080 caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140 ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200 tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260 gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320 attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380 cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440 ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500 agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560 aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620 gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680 atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740 atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800 cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920 ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980 ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040 gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100 atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160 ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 127 <211> 736 <212> PRT <213> Adeno-associated virus 9 <400> 127 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 128 <211> 2211 <212> DNA <213> Adeno-associated virus 9 <400> 128 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggtattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 129 <211> 738 <212> PRT <213> Unknown <220> <223> Description of Unknown: AAVrh74 sequence <400> 129 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 130 <211> 738 <212> PRT <213> Unknown <220> <223> Description of Unknown: AAVrh74 sequence <400> 130 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Thr Lys Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 131 <211> 2217 <212> DNA <213> Unknown <220> <223> Description of Unknown: AAVrh74 sequence <400> 131 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360 gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420 ggaaagaaga ggccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480 ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540 gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600 tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960 atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020 agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080 caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140 ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200 tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260 gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320 atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380 cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440 ctacccggtc cctgctaccg gcagcaacgt gtctccacga cactgtcgca gaacaacaac 1500 agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560 aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620 ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680 atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740 gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800 caaggagcct tacctggcat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920 ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980 ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040 gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100 attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160 ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 132 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid, preferably D <220> <221> MOD_RES <222> (4)..(4) <223> S or A <220> <221> MOD_RES <222> (5)..(5) <223> D, R or N <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid, preferably T <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid, preferably E <220> <221> MOD_RES <222> (12)..(12) <223> Any amino acid, preferably E <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid, preferably E <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid, preferably I <220> <221> MOD_RES <222> (15)..(15) <223> K or A <400> 132 Ala Xaa Leu Xaa Xaa Leu Leu Leu Xaa Ser Xaa Xaa Xaa Xaa Xaa 1 5 10 15 <210> 133 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid, preferably Y <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid, preferably G <220> <221> MOD_RES <222> (4)..(4) <223> A, I, D, or V <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid, preferably V <220> <221> MOD_RES <222> (7)..(7) <223> A or D <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid, preferably N <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid, preferably L <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid, preferably Q <220> <221> MOD_RES <222> (11)..(11) <223> S or absent <220> <221> MOD_RES <222> (12)..(12) <223> R or Q <400> 133 Glu Xaa Xaa Xaa Xaa Ala Xaa Xaa Xaa Xaa Xaa Xaa Ser 1 5 10 <210> 134 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 134 Xaa Xaa Glu Gln Thr Arg Pro Ala 1 5 <210> 135 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(6) <223> Any amino acid or absent <400> 135 Arg Ala Tyr Asn Xaa Xaa 1 5 <210> 136 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid or absent <400> 136 Asp Gln Asp Phe Lys Xaa Xaa 1 5 <210> 137 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid or absent <400> 137 Ile Glu Gln Thr Arg Xaa Xaa 1 5 <210> 138 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(9) <223> Any amino acid or absent <400> 138 Leu Ala Ile Glu Gln Thr Arg Xaa Xaa 1 5 <210> 139 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 139 Xaa Xaa Gln Thr Arg Pro Ala 1 5 <210> 140 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid or absent <400> 140 Arg Ala Arg Leu Asp Xaa Xaa 1 5 <210> 141 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (7)..(8) <223> Any amino acid or absent <400> 141 Arg Ala Arg Leu Asp Glu Xaa Xaa 1 5 <210> 142 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(9) <223> Any amino acid or absent <400> 142 Arg Ala Arg Leu Asp Glu Thr Xaa Xaa 1 5 <210> 143 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 143 Xaa Xaa Gly Glu Gln Thr Arg Pro 1 5 <210> 144 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 144 Xaa Xaa Glu Gln Thr Arg Pro 1 5 <210> 145 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(6) <223> Any amino acid or absent <400> 145 Ala Thr Asp Thr Xaa Xaa 1 5 <210> 146 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid or absent <400> 146 Ala Thr Asp Thr Lys Xaa Xaa 1 5 <210> 147 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 147 Xaa Xaa Thr Asp Thr Lys Thr 1 5 <210> 148 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(2) <223> Any amino acid or absent <400> 148 Xaa Xaa Glu Gln Thr Arg Pro Ala 1 5 <210> 149 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 149 Arg Ala Tyr Asn Xaa 1 5 <210> 150 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 150 Asp Gln Asp Phe Lys Xaa 1 5 <210> 151 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 151 Leu Ala Ile Glu Gln Thr Arg Xaa 1 5 <210> 152 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 152 Xaa Glu Gln Thr Arg Pro Ala 1 5 <210> 153 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 153 Xaa Gln Thr Arg Pro Ala 1 5 <210> 154 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 154 Arg Ala Arg Leu Asp Glu Thr Xaa 1 5 <210> 155 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 155 Arg Ala Arg Leu Asp Glu Xaa 1 5 <210> 156 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 156 Arg Ala Arg Leu Asp Xaa 1 5 <210> 157 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 157 Xaa Gly Glu Gln Thr Arg Pro 1 5 <210> 158 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 158 Xaa Glu Gln Thr Arg Pro 1 5 <210> 159 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 159 Ala Thr Asp Thr Xaa 1 5 <210> 160 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 160 Ala Thr Asp Thr Lys Xaa 1 5 <210> 161 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 161 Xaa Thr Asp Thr Lys Thr 1 5 <210> 162 <211> 735 <212> PRT <213> Adenoassociated virus 2 <400> 162 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Arg Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 163 <211> 4 <212> PRT <213> Unknown <220> <223> Description of Unknown: Box polypeptide 38 sequence <400> 163 Asp Glu Ala His 1

Claims (60)

  1. 서열번호 37, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46의 VP1, VP2 또는 VP3 서열과의 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% 또는 100%인 폴리펩티드를 포함하는 변이체 캡시드 폴리펩티드.
  2. 제1항에 있어서, 폴리펩티드가 다음을 포함하는 변이체 캡시드 폴리펩티드:
    VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이;
    VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이; 또는
    VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이.
  3. 제2항에 있어서,
    VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 1-36에 상응하는 돌연변이를 포함하고;
    VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 431-466에 상응하는 돌연변이를 포함하고;
    VAR-17 내지 VAR45 중 임의의 것과 연관된 돌연변이가 서열번호 1과 비교하여 잔기 552-617에 상응하는 돌연변이를 포함하는, 변이체 캡시드 폴리펩티드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이 및 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는, 변이체 캡시드 폴리펩티드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-1 내지 VAR-2 중 임의의 것과 연관된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는, 변이체 캡시드 폴리펩티드.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이 및 VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는, 변이체 캡시드 폴리펩티드.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33, 446, 449, 450, 451, 452, 454, 455, 456, 457, 458, 459, 460, 461, 464, 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597 또는 600에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이 또는 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 선택적으로 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는, 변이체 캡시드 폴리펩티드.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 3, 6, 11, 12, 14, 15, 19, 21, 23, 24, 25, 29, 31, 33 또는 이들의 임의의 조합에서의 돌연변이에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 결실 또는 치환을 포함하는, 변이체 캡시드 폴리펩티드.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 446, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 464 또는 이들의 임의의 조합에서의 돌연변이, 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는, 변이체 캡시드 폴리펩티드.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 폴리펩티드가 서열번호 1의 변이체를 포함하고, 변이체 캡시드 폴리펩티드가 서열번호 1에 따른 위치 552, 554, 555, 556, 557, 558, 559, 561, 566, 575, 578, 580, 581, 585, 586, 587, 588, 589, 590, 591, 593, 594, 597, 600 또는 이들의 임의의 조합에서의 돌연변이, 위치 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이, 592와 593 사이 또는 이들의 임의의 조합의 삽입에 상응하는 돌연변이를 포함하고, 상기 돌연변이는 삽입, 결실 또는 치환을 포함하는, 변이체 캡시드 폴리펩티드.
  11. VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가
    삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 454 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산, 예를 들어, 4-7개 아미노산, 예를 들어, 7개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하는 삽입;
    치환, 예를 들어, 서열번호 1과 비교하여 위치 445와 465 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 6-10개 잔기, 예를 들어, 적어도 7-10개 잔기, 예를 들어, 적어도 8-10개 잔기, 예를 들어, 적어도 9-10개 잔기, 예를 들어, 적어도 10개 잔기의 치환; 및
    이들의 임의의 조합이고;
    변이체가 T455G/L/Q, T456G, Q457T, S458Q, R459G/T로부터 선택된 적어도 3개의 돌연변이를 포함하고; 서열번호 1과 비교하여 위치 445-465 사이에 적어도 3개의 다른 돌연변이를 추가로 포함하고, 상기 돌연변이는 치환, 삽입 또는 결실인, 변이체 캡시드 폴리펩티드.
  12. VAR-3 내지 VAR-16 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 552와 588 사이에 있고, 상기 돌연변이가 다음을 포함하는, 변이체 캡시드 폴리펩티드:
    삽입, 예를 들어, 서열번호 1과 비교하여 위치 583과 588 사이의 삽입에 상응하는 4개 이상의 아미노산, 예를 들어, 4-5개 아미노산, 예를 들어, 4-6개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드를 포함하거나 서열번호 93-122의 4개 이상의 아미노산의 단편을 포함하는 삽입;
    치환, 예를 들어, 서열번호 1과 비교하여 위치 552와 588 사이의 치환에 상응하는 적어도 2개 이상의 잔기, 예를 들어, 적어도 3-9개 잔기, 예를 들어, 적어도 4-9개 잔기, 예를 들어, 적어도 5-9개 잔기, 예를 들어, 적어도 6-9개 잔기, 예를 들어, 적어도 7-9개 잔기, 예를 들어, 적어도 8-9개, 예를 들어, 적어도 9개 잔기의 치환; 및
    이들의 임의의 조합.
  13. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서,
    상기 돌연변이가 서열번호 1과 비교하여 위치 552와 566 사이에 있고, 상기 돌연변이가 다음을 포함하는, 변이체 캡시드 폴리펩티드:
    (a) 다음 공통식(consensus formula)을 포함하는 치환:
    A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A
    여기서, n은 서열번호 1에 제시된 야생형 잔기임;
    (b) 상기 공통의 비천연 발생 아미노산 중 1, 2, 3, 4, 5, 6 또는 7개를 포함하는 치환; 또는
    (c) 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환으로서, 위치 557, 558, 559 중 임의의 것 또는 이들의 임의의 조합에 류신을 도입하는 치환.
  14. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 추가로 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 575와 588 사이에 있고, 상기 돌연변이가 다음을 포함하는, 변이체 캡시드 폴리펩티드:
    (a) 다음 공통식을 포함하는 치환:
    E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S
    여기서 n은 서열번호 1에 제시된 야생형 잔기이고 del은 결실임;
    (b) 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S의 1-5개의 비천연 발생 아미노산을 포함하는 치환; 또는
    (c) 서열번호 1과 비교하여 위치 578, 580 또는 581 중 임의의 것에서의 치환으로서, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산인 치환.
  15. VAR-17 내지 VAR-45 중 임의의 것과 연관된 돌연변이로부터 선택된 돌연변이를 추가로 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 552와 588 사이에 있고,
    상기 돌연변이가 다음을 포함하는, 서열번호 1과 비교하여 위치 552와 566 사이의 치환이고:
    (a) 다음 공통식을 포함하는 치환:
    A-n-L-S/A-D/R/N-L-L-L-n-S-n-n-n-n-K/A
    여기서 n은 서열번호 1에 제시된 야생형 잔기임;
    (b) 상기 공통의 비천연 발생 아미노산 중 1, 2, 3, 4, 5, 6 또는 7개를 포함하는 치환; 또는
    (c) 서열번호 1과 비교하여 위치 557, 558 또는 559 중 임의의 것에서의 치환으로서, 위치 557, 558, 559 중 임의의 것 또는 이들의 임의의 조합에 류신을 도입하는 치환;
    상기 돌연변이가 다음을 포함하는, 서열번호 1과 비교하여 위치 575와 588 사이의 치환인, 변이체 캡시드 폴리펩티드:
    (a) 다음 공통식을 포함하는 치환:
    E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S
    여기서 n은 서열번호 1에 제시된 야생형 잔기이고 del은 결실임;
    (b) 상기 공통식 E-n-n-A/I/D/V-n-A-A/D-n-n-n-S/del-R/Q-S의 1-5개의 비천연 발생 아미노산을 포함하는 치환; 또는
    (c) 서열번호 1과 비교하여 위치 578, 580 또는 581 중 임의의 것에서의 치환으로서, 위치 578에서의 치환은 이소류신이고, 위치 580에서의 치환은 알라닌이고, 위치 581에서의 치환은 아스파르트산인 치환.
  16. 돌연변이를 포함하는 서열번호 1의 변이체를 포함하는 변이체 캡시드 폴리펩티드로서, 상기 돌연변이가 서열번호 1과 비교하여 위치 584와 617 사이에 있고, 상기 돌연변이가 다음을 포함하는, 변이체 캡시드 폴리펩티드:
    삽입, 예를 들어, 서열번호 1과 비교하여 위치 584와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-5개 아미노산, 예를 들어, 5-8개 아미노산, 예를 들어, 7-10개 아미노산의 삽입으로서, 서열번호 93-122와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%인 폴리펩티드, 또는 F, I, P, G, 또는 서열번호 93-122 중 임의의 것의 적어도 4개 아미노산의 단편으로부터 선택된 단일 잔기를 포함하는 삽입;
    치환, 예를 들어, 서열번호 1과 비교하여 위치 584와 617 사이에서의 치환에 상응하는 적어도 1개 이상의 잔기, 예를 들어, 적어도 1-2개 잔기, 예를 들어, 적어도 2-7개 잔기, 예를 들어, 적어도 2-8개 잔기의 치환; 및
    이들의 임의의 조합.
  17. 제17항에 있어서, 삽입이 7-10개 아미노산을 포함하고 LALGETTRPA(서열번호 93)와의 동일성이 적어도 60%, 70%, 80%, 90% 또는 100%이거나 LALGETTRPA(서열번호 93)의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편을 포함하는, 예를 들어, LGETTRP(서열번호 94)를 포함하는, 변이체 캡시드 폴리펩티드.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 14, 15, 19 및 24에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 3, 6, 11, 12, 21, 23, 25, 29, 31 및 33에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 451, 455, 456, 457, 458 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 452, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 457 및 458에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 446에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 451, 455, 456, 457, 458, 459 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 448에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 453에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 456, 457, 458, 459, 460 및 461에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 449, 450, 451, 454, 455, 456, 458, 459, 461 및 464에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 446, 448, 449, 451, 453, 455, 456, 457 및 459에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 447에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 581에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 584에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 555, 561, 566, 578, 580, 581 및 585에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 557 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 556, 558, 578 및 580에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 554, 556, 559, 561, 566, 581, 585, 586 및 587에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 552, 555, 556, 559, 561, 566, 578, 581 및 586에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 575 및 578에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 583에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585, 588, 589, 590, 591, 593, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 592에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 586에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 589에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 587에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 590에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 585, 586, 587, 591, 594, 597 및 600에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 591에서의 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 588에서의 돌연변이에 상응하는 돌연변이를 포함하는, 변이체 캡시드 폴리펩티드.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 캡시드 폴리펩티드가 삽입, 예를 들어, 서열번호 1과 비교하여 위치 446과 447 사이, 447과 448 사이, 448과 449 사이, 449와 450 사이, 451과 452 사이, 453과 454 사이, 581과 582 사이, 583과 584 사이, 584와 585 사이, 585와 586 사이, 586과 587 사이, 587과 588 사이, 588과 589 사이, 589와 590 사이, 590과 591 사이, 591과 592 사이 또는 592와 593 사이의 삽입에 상응하는 1개 이상의 아미노산, 예를 들어, 1-10개 아미노산, 예를 들어, 2-8개 아미노산, 예를 들어, 3-7개 아미노산, 예를 들어, 7개 아미노산의 삽입을 포함하는, 변이체 캡시드 폴리펩티드.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 T14L, L15V, I19A 및 K24H 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 A3V, Y6F, L11F, E12Q, Q21L, W23I, L25C, P29A, P31N 및 K33R 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, T450M, P451T, T455L, T456G, Q457T, S458Q 및 R459M 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, 잔기 P451 결실, S452T, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 Q457F 및 S458C 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 446과 447 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 KCQEGMA(서열번호 95)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 449와 450 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LMVDRLG(서열번호 96)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 448과 449 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 HCQECPI(서열번호 97)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 453과 454 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 FSGLEN(서열번호 98)의 폴리펩티드, 또는 이의 적어도 5개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 위치 T456, Q457, S458, R459, L460 및 Q461에서 잔기 결실에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N449I, T450N, P451G, 잔기 T454 결실, T455Q, T456N, S458Q, R459T, Q461K 및 Q464V 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 S446A, 잔기 T448 및 N449 결실, P451Q, G453T, T455G, T456G, Q457T 및 R459G 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N449Q, T450S, S452G, T455A, Q457F, S458M, R459D, 및 잔기 451과 452 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 Y를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 447과 448 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 HETEFNF(서열번호 99)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 P451T, T455G, T456G, Q457T, S458Q, R459T 및 Q461A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 581과 582 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 FALMEP(서열번호 100)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 RAYNPD(서열번호 101)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 R585 결실 및 E555A, D461S, R566K, S578V, S580A 및 T581A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 V557L 및 S578D 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 K556N, M558L, S578I 및 S580A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 I554L, K556R, I559L, D561S, R566A, T581D, R585S, G586R 및 N587S 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 V552A, E555S, K556D, I559L, D561S, R566K, S578I, T581D 및 G586Q 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 Q575E 및 S578A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 583과 584 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LNWTAE(서열번호 102)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 R585S, R588T, Q589N, A590P, A591I, A593G, T597S 및 V600A 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 R585N 및 G586A 돌연변이, 및 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LAKEFTTR(서열번호 103)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, KEFTTR(서열번호 104)을 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LHPLE(서열번호 105)의 폴리펩티드, 또는 이의 적어도 4개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 F를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 DQDFKNR(서열번호 106)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 I를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LAIEQTRPA(서열번호 107)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, IEQTRPA(서열번호 108)를 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 G586P 및 N587A 돌연변이, 및 잔기 584와 585 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 RARLDETT(서열번호 109)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, RLDETT(서열번호 110)를 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N587A 돌연변이, 및 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LALAEITRP(서열번호 111)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, LAEITRP(서열번호 112)를 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 N587A 돌연변이, 및 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 LANGEQTRP(서열번호 113)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 적어도 8개 아미노산의 단편(예를 들어, NGEQTRP(서열번호 114)를 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 ATDTKT(서열번호 115)의 폴리펩티드, 또는 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 590과 591 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 P를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 587과 588 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 APGETTRPA(서열번호 116)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7 또는 적어도 8개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 589와 590 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 P를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 R585S, G586S, N587A, A591E, D594R, T597A 및 V600I 돌연변이에 상응하는 돌연변이를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 586과 587 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 FHNEGKY(서열번호 118)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 591과 592 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 아미노산 G를 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 588과 589 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 QPWEPDK(서열번호 119)의 폴리펩티드, 또는 이이 적어도 4개, 적어도 5개 또는 적어도 6개 아미노산의 단편을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 592와 593 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 ALALSTTN(서열번호 120)의 폴리펩티드, 또는 이의 적어도 4개, 적어도 이의 5개, 적어도 6개 또는 적어도 7개 아미노산의 단편(예를 들어, ALSTTN(서열번호 121)을 포함하거나 이로 이루어진 단편)을 포함하거나;
    캡시드 폴리펩티드가 서열번호 1과 비교하여 잔기 585와 586 사이의 삽입에 상응하는 돌연변이를 포함하고, 상기 삽입은 PWGTAG(서열번호 122)의 폴리펩티드, 또는 이의 적어도 4개 또는 적어도 5개 아미노산의 단편을 포함하는, 변이체 캡시드 폴리펩티드.
  21. (a) 서열번호 37, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46 중 어느 하나의 폴리펩티드, (b) 서열번호 37, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 서열번호 34, 서열번호 35, 서열번호 36, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 또는 서열번호 46 중 어느 하나의 VP2 또는 VP3 서열; (c) 이에 대한 동일성이 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%인 서열을 포함하는 폴리펩티드로서, 상기 서열은 서열번호 1에 비해 서열번호 2 내지 서열번호 46 중 임의의 것과 연관된 돌연변이 차이 중 적어도 1개(예를 들어, 1개, 2개, 3개 또는 그 이상, 예를 들어, 모두)를 포함하는 폴리펩티드; 또는 (d) (a) 또는 (b)의 폴리펩티드에 대해 적어도 1개이지만 20개 이하, 19개 이하, 18개 이하, 17개 이하, 16개 이하, 15개 이하, 14개 이하, 13개 이하, 12개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 3개 이하 또는 2개 이하의 아미노산 돌연변이를 갖는 폴리펩티드로서, 상기 폴리펩티드는 서열번호 1에 비해 서열번호 2 내지 서열번호 46 중 임의의 것과 연관된 돌연변이 차이 중 적어도 1개(예를 들어, 1개, 2개, 3개 또는 그 이상, 예를 들어, 모두)를 포함하는 폴리펩티드를 포함하는, 변이체 캡시드 폴리펩티드.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 변이체 캡시드 폴리펩티드는 VP1 폴리펩티드, VP2 폴리펩티드 또는 VP3 폴리펩티드인, 변이체 캡시드 폴리펩티드.
  23. 서열번호 1의 554에 상응하는 위치에서 류신에 상응하는 돌연변이를 포함하는(예를 들어, 서열번호 1과 비교하여 I554L을 포함하는), 변이체 캡시드 폴리펩티드.
  24. 제22항 또는 제1항 내지 제23항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 8 내지 12개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 최대 16개의 추가 돌연변이, 예를 들어, 11 내지 16개의 돌연변이를 갖는, 변이체 캡시드 폴리펩티드.
  25. 제22항 또는 제1항 내지 제24항 중 어느 한 항에 있어서,
    서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S을 포함함); 또는
    서열번호 1의 581에 상응하는 위치에서 아스파르트산에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)
    를 추가로 포함하는 변이체 캡시드 폴리펩티드.
  26. 서열번호 1의 559에 상응하는 위치에서 류신에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 I559L을 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
  27. 제26항 또는 제1항 내지 제26항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 13개의 추가 돌연변이, 예를 들어, 4 내지 13개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 8 내지 19개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-23(서열번호 24)과 비교하여 최대 20개의 추가 돌연변이, 예를 들어, 5 내지 20개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
  28. 제26항 또는 제1항 내지 제27항 중 어느 한 항에 있어서, 서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S를 포함함)를 추가로 포함하고, 선택적으로 캡시드 폴리펩티드는 서열번호 1의 581에 상응하는 위치에서 아스파르트산(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)을 추가로 포함하는 변이체 캡시드 폴리펩티드.
  29. 서열번호 1의 556에 상응하는 위치에서 아스파라긴에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 K556N을 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
  30. 제29항 또는 제1항 내지 제29항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 4 내지 12개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-21(서열번호 22)과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 9 내지 12개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
  31. 서열번호 1의 561에 상응하는 위치에서 세린에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 D561S를 포함함)를 포함하는 변이체 캡시드 폴리펩티드.
  32. 제31항 또는 제1항 내지 제31항 중 어느 한 항에 있어서,
    캡시드 폴리펩티드가 서열번호 1과 비교하여 최대 12개의 추가 돌연변이, 예를 들어, 7 내지 12개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-19(서열번호 20)와 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 11 내지 14개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-22(서열번호 23)와 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 10 내지 14개의 돌연변이를 갖거나;
    캡시드 폴리펩티드가 VAR-23(서열번호 24)과 비교하여 최대 14개의 추가 돌연변이, 예를 들어, 9 내지 14개의 돌연변이를 갖는 변이체 캡시드 폴리펩티드.
  33. 제31항 또는 제1항 내지 제32항 중 어느 한 항에 있어서, 서열번호 1의 581에 상응하는 위치에서 아스파르트산에 상응하는 돌연변이(예를 들어, 서열번호 1과 비교하여 T581D를 포함함)를 추가로 포함하는 변이체 캡시드 폴리펩티드.
  34. 서열번호 1의 587에 상응하는 위치에서 돌연변이를 포함하는 캡시드 폴리펩티드로서, 선택적으로 돌연변이가 알라닌에 대한 것이고(예를 들어, 돌연변이는 서열번호 1에 따른 N587A임), 선택적으로 캡시드 폴리펩티드가 서열번호 1에 따른 580과 587 사이(선택적으로 586과 587 사이)의 인접한 2개 아미노산 사이의 삽입(예를 들어, 4개 이상의 아미노산 삽입, 선택적으로 7개 이상의 아미노산 삽입, 선택적으로 7-10개 아미노산 삽입, 선택적으로 7, 8 또는 9개 아미노산 삽입)을 추가로 포함하는 변이체 캡시드 폴리펩티드.
  35. 제1항 내지 제34항 중 어느 한 항의 변이체 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자.
  36. 제35항에 있어서, 변이체 캡시드 폴리펩티드를 암호화하는 서열에 작동 가능하게 연결된 하나 이상의 조절 요소를 포함하는 핵산 분자.
  37. 제35항 또는 제36항에 있어서, 서열번호 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 또는 이의 단편, 또는 이에 대한 서열 동일성이 적어도 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%인 이의 변이체를 포함하는 핵산 분자.
  38. 제1항 내지 제34항 중 어느 한 항의 변이체 캡시드 폴리펩티드를 포함하거나 제35항 내지 제37항 중 어느 한 항의 핵산 분자에 의해 암호화된 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자(예를 들어, 아데노 관련 바이러스("AAV") 입자).
  39. 제38항에 있어서, 이종 전이유전자 및 하나 이상의 조절 요소를 포함하는 핵산을 포함하는 바이러스 입자.
  40. 제1항 내지 제34항 중 어느 한 항의 변이체 캡시드 폴리펩티드를 포함하는 제38항 또는 제39항의 바이러스 입자로서, 상기 바이러스 입자, 또는 상기 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자 또는 제35항 내지 제37항 중 어느 한 항의 핵산 분자에 의해 암호화된 변이체 캡시드 폴리펩티드를 포함하는 바이러스 입자가 야생형 AAV2(예를 들어, 서열번호 1의 캡시드 폴리펩티드를 포함하거나 서열번호 92에 의해 암호화된 바이러스 입자)에 비해, 예를 들어, 본원에 기술된 바와 같이, 예를 들어, 마우스 또는 NHP에서 측정했을 때 증가된 안구 형질도입(ocular transduction)을 나타내는 바이러스 입자.
  41. 제35항 내지 제37항 중 어느 한 항에 있어서, 핵산 분자가 이중 가닥 또는 단일 가닥이고, 선택적으로 핵산 분자가 선형 또는 원형이고, 예를 들어, 핵산 분자가 플라스미드인 핵산 분자.
  42. 변이체 AAV2 캡시드 폴리펩티드를 포함하는 바이러스 입자의 생성 방법으로서, 상기 단계는 제35항 내지 제37항 또는 제41항 중 어느 한 항의 핵산 분자를 세포(예를 들어, HEK293 세포)에 도입하는 단계 및 이로부터 상기 바이러스 입자를 수확하는 단계를 포함하는 방법.
  43. 세포를 제1항 내지 제34항 중 어느 한 항의 변이체 캡시드 폴리펩티드 또는 제38항 내지 제40항 중 어느 한 항의 바이러스 입자 및 페이로드를 포함하는 데펜도파보바이러스(dependoparvovirus) 입자와 접촉시키는 단계를 포함하는, 세포로의 페이로드(예를 들어, 핵산)의 전달 방법.
  44. 제43항에 있어서, 세포가 안구 세포이고, 안구 세포가 망막(retina), 황반(macula) 또는 섬유주대(trabecular meshwork)에 존재하는 방법.
  45. 대상체에게 제1항 내지 제34항 중 어느 한 항의 변이체 캡시드 폴리펩티드 및 페이로드를 포함하는 데펜도파보바이러스 입자를 투여하거나, 대상체에게 제38항 내지 제40항 중 어느 한 항의 바이러스 입자를 투여하는 단계를 포함하는, 대상체에게 페이로드(예를 들어, 핵산)를 전달하는 방법.
  46. 제45항에 있어서, 입자가 페이로드를 눈에 전달하고, 입자가 페이로드를 망막, 황반 또는 섬유주대에 전달하는 방법.
  47. 제45항 또는 제46항에 있어서, 입자가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입으로 페이로드를 눈에 전달하고, 눈의 하나 이상의 영역은 망막, 황반, 섬유주대 또는 이들의 임의의 조합으로부터 선택되는 방법.
  48. 제1항 내지 제34항 중 어느 한 항, 제38항 내지 제40항 중 어느 한 항 또는 제42항 내지 제47항 중 어느 한 항에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입으로 페이로드를 눈에 전달하고, 형질도입의 증가는 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배 또는 150배인 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
  49. 제1항 내지 제34항 중 어느 한 항, 제38항 내지 제40항 중 어느 한 항 또는 제42항 내지 제47항 중 어느 한 항에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하고, 형질도입의 증가는 다음과 같은 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법:
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직에 비해 비황반 망막 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 비-황반 망막 조직에 비해 황반 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 황반 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 비황반 망막 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직에 비해 황반 조직 및 비황반 망막 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직 및 비-황반 망막 조직에 비해 섬유주대 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 황반 조직에 비해 섬유주대 조직에 특이적임;
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 비황반 망막 조직에 비해 섬유주대 조직에 특이적임; 또는
    서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 적어도 2배, 4배, 8배, 16배, 32배, 64배, 100배, 200배, 500배 또는 1000배이고, 형질도입의 증가는 섬유주대 조직, 황반 조직 및 비황반 망막 조직에 특이적임.
  50. 제1항 내지 제34항 중 어느 한 항, 제38항 내지 제40항 중 어느 한 항 또는 제42항 내지 제47항 중 어느 한 항에 있어서, 입자(예를 들어, 변이체 캡시드 폴리펩티드를 포함하는 입자)가 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 생체분포 없이 서열번호 1의 캡시드 폴리펩티드를 포함하는 바이러스 입자와 비교하여 눈의 하나 이상의 영역에서 증가된 형질도입 특이성으로 페이로드를 눈에 전달하는 변이체 캡시드 폴리펩티드, 바이러스 입자 또는 방법.
  51. 제43항 내지 제50항 중 어느 한 항에 있어서, 대상체에 대한 투여가 유리체 내 주사(intravitreal injection) 또는 전방 내 주사(intracameral injection)를 통해 이루어지는 방법.
  52. 데펜도파보바이러스 입자를 질환 또는 병태를 치료하는데 효과적인 양으로 대상체에게 투여하는 단계를 포함하는, 대상체의 질환 또는 병태의 치료 방법으로서, 데펜도파보바이러스 입자는 제1항 내지 제34항 및 제48항 내지 제50항 중 어느 한 항의 캡시드 폴리펩티드를 포함하는 입자이거나, 제35항 내지 제37항 중 어느 한 항의 핵산에 의해 암호화되거나, 제38항 내지 제40항 중 어느 한 항의 바이러스 입자인 방법.
  53. 제1항 내지 제41항 또는 제48항 내지 제50항 중 어느 한 항의 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자를 포함하는, 세포, 무세포 시스템 또는 다른 번역 시스템.
  54. 데펜도파보바이러스(예를 들어, 아데노 관련 데펜도파보바이러스(AAV)) 입자의 제조 방법으로서,
    제35항 내지 제37항 또는 제41항 중 어느 한 항의 핵산을 포함하는 세포, 무세포 시스템 또는 다른 번역 시스템을 제공하는 단계; 및
    데펜도파보바이러스 입자의 생성에 적합한 조건하에서 상기 세포, 무세포 시스템 또는 다른 번역 시스템을 배양하여
    데펜도파보바이러스 입자를 제조하는 단계를 포함하는 방법.
  55. 제54항에 있어서, 세포, 무세포 시스템 또는 다른 번역 시스템이 제2 핵산 분자를 포함하고, 상기 제2 핵산 분자가 데펜도파보바이러스 입자에 패키징되어 있고, 제2 핵산이 페이로드, 예를 들어, 치료 제품을 암호화하는 이종 핵산 서열을 포함하는 방법.
  56. 제54항 또는 제55항에 있어서, 제35항 내지 제37항 또는 제41항 중 어느 한 항의 핵산이 제35항 내지 제37항 또는 제41항 중 어느 한 항의 상기 핵산을 포함하지 않는 데펜도파보바이러스 입자의 생성을 매개하는 방법.
  57. 제54항 내지 제56항 중 어느 한 항에 있어서, 제35항 내지 제37항 또는 제41항 중 어느 한 항의 핵산이 데펜도파보바이러스 입자의 생성을 서열번호 92의 핵산에 의해 매개되는 생성 수준보다 적어도 10%, 적어도 20%, 적어도 50%, 적어도 100%, 적어도 200% 또는 그 이상의 수준으로 매개하는 방법.
  58. 제38항 내지 제40항 중 어느 한 항의 바이러스 입자, 또는 제126항 또는 제150항 내지 제154항 중 어느 한 항의 방법에 의해 생성된 바이러스 입자, 및 약제학적으로 허용되는 담체를 포함하는 조성물, 예를 들어, 약제학적 조성물.
  59. 제1항 내지 제34항 및 제48항 내지 제50항 중 어느 한 항, 제35항 내지 제37항 또는 제41항 중 어느 한 항, 또는 제38항 내지 제40항 중 어느 한 항에 있어서, 대상체의 질환 또는 병태를 치료하는 데 사용하기 위한 변이체 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자.
  60. 제1항 내지 제34항 및 제48항 내지 제50항 중 어느 한 항, 제35항 내지 제37항 또는 제41항 중 어느 한 항, 또는 제38항 내지 제40항 중 어느 한 항에 있어서, 대상체의 질환 또는 병태를 치료하는 데 사용하기 위한 약제의 제조에 사용하기 위한 변이체 캡시드 폴리펩티드, 핵산 분자 또는 바이러스 입자.
KR1020247000005A 2021-06-03 2022-06-02 캡시드 변이체 및 이의 사용 방법 KR20240045198A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202163196554P 2021-06-03 2021-06-03
US63/196,554 2021-06-03
US202263331627P 2022-04-15 2022-04-15
US63/331,627 2022-04-15
US202263342455P 2022-05-16 2022-05-16
US63/342,455 2022-05-16
PCT/US2022/032004 WO2022256557A1 (en) 2021-06-03 2022-06-02 Capsid variants and methods of using the same

Publications (1)

Publication Number Publication Date
KR20240045198A true KR20240045198A (ko) 2024-04-05

Family

ID=84324583

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247000005A KR20240045198A (ko) 2021-06-03 2022-06-02 캡시드 변이체 및 이의 사용 방법

Country Status (7)

Country Link
EP (1) EP4347621A1 (ko)
JP (1) JP2024520738A (ko)
KR (1) KR20240045198A (ko)
AU (1) AU2022284870A1 (ko)
BR (1) BR112023025095A2 (ko)
IL (1) IL308987A (ko)
WO (1) WO2022256557A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023201364A2 (en) * 2022-04-15 2023-10-19 Dyno Therapeutics, Inc. Capsid variants and methods of using the same
WO2024059667A2 (en) * 2022-09-13 2024-03-21 Dyno Therapeutics, Inc. Capsid variants and methods of using the same

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101460611B (zh) * 2006-06-08 2013-04-24 巴斯福植物科学有限公司 具有改良生长特性的植物及其制备方法
WO2011119484A1 (en) * 2010-03-23 2011-09-29 Iogenetics, Llc Bioinformatic processes for determination of peptide binding
RU2770922C2 (ru) * 2017-09-20 2022-04-25 4Д Молекьюлар Терапьютикс Инк. Капсиды вариантов аденоассоциированных вирусов и методы их применения

Also Published As

Publication number Publication date
EP4347621A1 (en) 2024-04-10
IL308987A (en) 2024-01-01
JP2024520738A (ja) 2024-05-24
AU2022284870A1 (en) 2024-01-04
WO2022256557A1 (en) 2022-12-08
BR112023025095A2 (pt) 2024-02-20

Similar Documents

Publication Publication Date Title
US11419949B2 (en) Adeno-associated virus variant capsids and methods of use thereof
US11766489B2 (en) Adeno-associated virus variant capsids and use for inhibiting angiogenesis
KR20240045198A (ko) 캡시드 변이체 및 이의 사용 방법
JP2024520740A (ja) カプシドバリアント及びそれを使用する方法
WO2024059667A2 (en) Capsid variants and methods of using the same
WO2023201368A2 (en) Capsid variants and methods of using the same
WO2023201366A2 (en) Capsid variants and methods of using the same
CA3220810A1 (en) Capsid variants and methods of using the same
WO2023201364A2 (en) Capsid variants and methods of using the same
EP4355889A1 (en) Capsid variants and methods of using the same
CN117940446A (zh) 衣壳变体及其使用方法
CN117979953A (zh) 衣壳变体及其使用方法
JP2024522230A (ja) カプシドバリアント及びそれを使用する方法
JP2024525205A (ja) カプシドバリアント及びそれを使用する方法