KR20240019759A - 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 - Google Patents

아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 Download PDF

Info

Publication number
KR20240019759A
KR20240019759A KR1020237039938A KR20237039938A KR20240019759A KR 20240019759 A KR20240019759 A KR 20240019759A KR 1020237039938 A KR1020237039938 A KR 1020237039938A KR 20237039938 A KR20237039938 A KR 20237039938A KR 20240019759 A KR20240019759 A KR 20240019759A
Authority
KR
South Korea
Prior art keywords
nucleic acid
acid sequence
seq
sequence encoding
ser
Prior art date
Application number
KR1020237039938A
Other languages
English (en)
Inventor
마이클 티. 레너드
제레미 제이. 갬
크리스토퍼 에스. 스타키
알렉 에이.케이. 닐슨
Original Assignee
아시모브 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아시모브 인코포레이티드 filed Critical 아시모브 인코포레이티드
Publication of KR20240019759A publication Critical patent/KR20240019759A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01026Pyrrolysine-tRNAPyl ligase (6.1.1.26)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

AAV 생산을 위한 유전자 조작된 세포가 본 명세서에 개시된다. 유전자 조작된 세포는 AAV 생산에 필요한 유전자 발현의 일시적 제어를 위한 분자 시스템을 포함한다. 또한 AAV 생산을 위한 유전자 조작된 세포를 이용하는 방법이 본 명세서에 개시된다.

Description

아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템
기술분야
아데노-연관 바이러스(Adeno-Associated Virus: AAV) 생산 시스템이 본 명세서에 기재된다. 또한 조작된 세포, 및 AAV 생산 시스템을 포함하는 키트 및 AAV 생산을 위해 이를 사용하는 방법이 본 명세서에 기재된다.
관련 출원
본 출원은 미국 특허법(35 U.S.C. § 119) 하에서 2021년 4월 21일자로 출원된 미국 가출원 특허 일련 번호 63/177760의 유익을 주장하며, 이의 전문은 본 명세서에 참조에 의해 원용된다.
EFS-WEB을 통해 텍스트 파일로서 제출된 서열목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출되고 본 명세서에 전문이 참조에 의해 원용되는 서열목록을 포함한다. 2022년 4월 21일자로 생성된 상기 ASCII 사본은 파일명이 A121070007WO00-SEQ-ARM이며, 용량이 347,698 바이트이다.
AAV는 세포 및 유전자 요법을 위한 유망한 유전자 전달 양상이다. AAV는 대상체 내의 세포에 치료적 유전자 페이로드를 운반하도록 변형될 수 있다. AAV의 생산은 일반적으로 바이러스 벡터 생산에 필요한 유전자를 함유하는 플라스미드의 세포 배양물에의 일시적 형질감염을 수반한다. 그러나, 일시적 형질감염은 몇 가지의 부족한 점이 있다. 형질감염 과정을 위해서는 다량의 DNA 및 형질감염 시약이 조달되어야 하는데, 이는 비용이 든다. 또한, 불량한 형질감염 효율은 최소 수의 '형질감염' 세포, 및 형질감염 단계 및 바이러스 생산과 연관된 증가된 변이를 초래할 수 있다.
세포증식억제성 또는 세포독성 유전자 산물을 포함하는 AAV 생산에 필요한 유전자 산물의 유도성 제어를 도입하는 AAV 생산 시스템이 본 명세서에 기재된다. 이러한 유도성 제어는 게놈 수준(즉, 게놈 변형의 유도성 제어)에서 또는 번역 수준(즉, 변경된 번역의 유도성 제어)에서 매개될 수 있다. 기재된 AAV 생산 시스템의 각각은 무작위 통합, 표적화된 통합, 또는 트랜스포존-매개 통합을 이용하여 게놈에 통합될 수 있다.
일부 실시형태에서, 본 출원은, 비표준 tRNA 합성효소(noncanonical tRNA synthetase); 비표준 tRNA 합성효소에 상응하는 비표준 tRNA; NC-Rep 78; 및 NC-Rep52 각각을 암호화하는 핵산 서열을 일괄적으로(collectively) 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포를 개시하며; 이들 각각은 프로모터에 작동 가능하게 연결되되; NC-Rep78을 암호화하는 핵산 서열 및 NC-Rep52를 암호화하는 핵산 서열은 각각 조기 정지 코돈과 비표준 tRNA에 대응하는 아미노산 코돈 둘 다인 코돈을 포함한다. 일부 실시형태에서, 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하고, 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 피롤리실-tRNA 합성효소(Pyrrolysyl-tRNA synthetase: pylRS)인 비표준 tRNA 합성효소를 포함한다. 일부 실시형태에서, 조작된 세포는 서열번호 20 및 21 중 어느 하나의 아미노산 서열을 포함하는 pylRS를 포함한다. 일부 실시형태에서, 조작된 세포는 서열번호 21의 아미노산 서열을 포함하는 PylRS를 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 비표준 tRNA를 암호화하는 핵산 서열을 포함하는 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 H-Lys(Boc)-OH를 담고 있는(charge) 비표준 tRNA를 포함한다. 일부 실시형태에서, 조작된 세포 내에 포함된 비표준 tRNA는 PylT U25C이다. 일부 실시형태에서, 조작된 세포는 서열번호 22의 핵산 서열을 포함하는 PylT U25C를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는, 각각 PylT U25C를 암호화하고 프로모터에 각각 작동 가능하게 연결된 핵산 서열을 포함하는 4개의 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함하는 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, NC-Rep78은 17번 위치에서 조기 정지 코돈을 포함하거나; NC-Rep52는 233번 위치에서 조기 정지 코돈을 포함하거나; 또는 이들의 조합이다. 일부 실시형태에서, 조작된 세포는 pylRS 비표준 tRNA 합성효소 및 PylT U25C 비표준 tRNA를 포함한다. 일부 실시형태에서, 조작된 세포는 단일 전사체로서 암호화된 NC-Rep78을 암호화하는 핵산 서열 및 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 단일 전사체는 서열번호 26 내지 27 중 어느 하나의 아미노산 서열을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 NC-Rep40을 암호화하는 핵산 서열; NC-Rep68을 암호화하는 핵산 서열; 또는 둘 다를 추가로 포함한다.
일부 실시형태에서, 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 또는 SB9 세포이다.
일부 실시형태에서, 본 출원은 위에 기재한 바와 같이 조작된 세포 중 어느 하나를 포함하는 키트를 개시한다. 일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 추가로 포함한다. 일부 실시형태에서, 키트 내에 포함된 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
일부 실시형태에서, 본 출원은 위에 기재한 바와 같은 조작된 세포 중 어느 하나를 비표준 아미노산과 접촉시키는 단계를 포함하는, AAV 생산 방법을 개시한다. 일부 실시형태에서, 비표준 아미노산은 H-Lys(Boc)-OH이다.
일부 양상에서, 본 출원은 Rep52, DA-Rep52, Rep40 또는 DA-Rep40; Rep78, DA-Rep78, Rep68 또는 DA-Rep68; E2A 또는 DA-E2A; E4ORF6 또는 DA-E4ORF6; VARNA 또는 DA-VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; AAP; 및 L4 100K 또는 DA-L4 100K 및 염기 편집기의 각각을 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포를 개시하고, 각각의 핵산 분자는 프로모터에 작동 가능하게 연결되되; 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K 중 적어도 하나의 핵산 서열을 포함하고; DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K의 핵산 서열은 각각 변형된 코돈을 포함한다.
일부 실시형태에서, 변형된 코돈은 미스센스 코돈을 암호화하고, 변형된 코돈에서 사이토신 또는 아데닌의 탈아미노화는 암호화된 아미노산을 다른 아미노산으로 전환시킨다.
일부 실시형태에서, 변형된 코돈은 조기 정지 코돈을 암호화하고, 변형된 코돈에서 아데닌의 탈아미노화는 변형된 코돈을 트립토판 코돈, 글루타민 코돈 또는 아르기닌으로 전환시킨다.
일부 실시형태에서, 변형된 코돈은 조기 정지 코돈을 암호화하고, 변형된 코돈에서 사이토신의 탈아미노화는 암호화된 아미노산을 프롤린으로 전환시킨다.
일부 실시형태에서, 조작된 세포는 하나 이상의 CTCF 절연체를 암호화하는 핵산 서열을 각각 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 DA-E2A를 암호화하는 핵산 서열, DA-E4ORF6을 암호화하는 핵산 서열 및 VARNA를 암호화하는 핵산 서열을 포함하는, 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 L4 100K 또는 DA-L4 100K를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 DA-E2A의 핵산 서열을 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 39 또는 40의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-E2A의 181번 및/또는 324번 위치(서열번호 39 또는 40)는 조기 정지 코돈을 생성하는 아데닌에 대한 돌연변이와 상응한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 아데닌에 대한 하나 이상의 돌연변이를 포함하는 DA-E4ORF6의 핵산 서열을 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 41 또는 42의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6의 77번 및/또는 192번 위치(서열번호 41 또는 42)는 조기 정지 코돈을 생성하는 아데닌을 포함하는 변형된 코돈과 상응한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자는 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열, DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열, VP1 또는 DA-VP1을 암호화하는 핵산 서열, VP2 또는 DA-VP2를 암호화하는 핵산 서열 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 43 또는 47의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 44 또는 48의 아미노산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 45, 49 및 51 중 어느 하나의 아미노산 서열을 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 46, 50 또는 52의 아미노산 서열을 포함하는 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 아미노산 서열을 포함한다. 일부 실시형태에서, Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 핵산 서열은 서열번호 53 내지 55, 113 내지 115 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52, DA-Rep40, DA-Rep68 및 DA-Rep78을 암호화하는 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, 뉴클레오타이드 서열에서 하나의 아데닌 돌연변이는 DA-Rep78의 67, 262 및/또는 319번 아미노산 위치(서열번호 45, 49 및 51)에 상응하는 위치이다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 sgRNA를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 핵산 서열에 상보성인 핵산 서열을 각각 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 각각 서열번호 56 내지 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 하나 이상의 sgRNA에 작동 가능하게 연결된 화학적 유도성 프로모터는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 하나 이상의 sgRNA에 작동 가능하게 연결된 화학적 유도성 프로모터를 암호화하는 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 VP1 또는 DA-VP1, VP2 또는 DA-VP2 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, VP1을 암호화하는 핵산 서열은 서열번호 14의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 99 또는 102의 아미노산 서열을 포함한다. 일부 실시형태에서, VP2를 암호화하는 핵산 서열은 서열번호 15의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP2를 암호화하는 핵산 서열은 서열번호 100 또는 103의 아미노산 서열을 포함한다. 일부 실시형태에서, VP3을 암호화하는 핵산 서열은 서열번호 16의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 서열번호 101 또는 104의 아미노산 서열을 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 AAP를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, AAP를 암호화하는 핵산 서열은 서열번호 17의 아미노산 서열을 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는, 소분자 유도물질(inducer)의 존재 하에 발현될 때, 조작된 세포의 화학적 유도성 프로모터에 결합하는 전사 활성체를 암호화하는 핵산 서열 및 염기 편집기를 암호화하는 핵산 서열을 포함하는, 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 염기 편집기를 포함하는 제3의 안정적으로 통합된 핵산 분자는 아데닌 염기 편집기(Adenine Base Editor: ABE) 또는 사이토신 염기 편집기(Cytosine Base Editor: CBE)를 포함한다. 일부 실시형태에서, CBE는 Cas9 CBE 또는 Cas13 CBE이다. 일부 실시형태에서, ABE는 Cas9 ABE 또는 Cas13 ABE이다. 일부 실시형태에서, Cas9 ABE는 서열번호 82 또는 83을 포함하는 아미노산 서열에 의해 암호화된다. 일부 실시형태에서, Cas13 ABE는 서열번호 84 또는 85를 포함하는 아미노산 서열에 의해 암호화된다. 일부 실시형태에서, ABE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, ABE는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF 또는 CymR 중 적어도 하나, 또는 Gal4 UAS 작동유전자 서열을 포함하는 프로모터로 이루어진 군으로부터 선택되는, 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제3의 화학적 유도성 프로모터를 암호화하는 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함한다. 일부 실시형태에서, 조작된 세포는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트(cumate) cTA 및 rcTA로 이루어진 군으로부터 선택된 전사 활성체를 포함한다. 일부 실시형태에서, 전사 활성체는 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된 소분자 유도물질에 의해 활성화된다. 일부 실시형태에서, 전사 활성체는 TetOn 3G이고, 소분자 유도물질은 독시사이클린이다.
일부 실시형태에서, 조작된 세포는 HEK293 세포 또는 HeLa 세포이다.
일부 양상에서, 본 출원은 본 명세서에 기재된 바와 같은 조작된 세포를 포함하는 키트를 개시한다. 일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 추가로 포함한다. 일부 실시형태에서, 키트 내에 포함된 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
일부 양상에서, 본 출원은 위에 기재한 바와 같은 조작된 세포를 화학적 유도성 프로모터에 결합하는 소분자 유도물질과 접촉시키는 단계를 포함하는, AAV 생산 방법을 개시한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된다.
도 1은 ncAA AAV 플라스미드에 대한 플라스미드 개략도이다. 고세균 메타노사르시나 마제이(Methanosarcina mazei) 직교성 tRNA 합성효소("pylRS")는 hEF1a를 이용하여 구성요소로서 발현된다. 동족 tRNA("PylT")는 ncAA 혼입의 효율이 ncAA tRNA 존재비와 연관되어 있기 때문에 다중-복사 맥락에서 U6 RNA 중합효소 III 프로모터를 이용하여 발현된다. RepAAV2 Rep78 + 52 단독 작제물은 D233X 및 E17X TAG 정지 코돈 돌연변이에 추가로 Rep68/40 스플라이스 부위를 없애는 점 돌연변이를 포함한다. AAV2 Rep52/40-IRES-Rep78/68 작제물은 p19 AAV2 프로모터의 활성을 제거/최소화하는 점 돌연변이를 포함하고, D233X 및 E17X를 포함한다. AAV WT Rep 작제물은 Rep78/68/52/40을 암호화하고, D233X 및 E17X TAG 정지 코돈 돌연변이를 포함한다. Cap 및 헬퍼 유전자 발현 작제물과 관련하여 이러한 ncAA 플라스미드를 이용하는 일시적 시험을 사용하여 ncAA 유도성 AAV 생산을 특성규명할 수 있다.
도 2는 일시적 형질감염 플라스미드에 대한 플라스미드 개략도이다. 조기 정지 코돈은 Rep, Cap, E2A, L4 100K 및/또는 E4 ORF6의 암호화 서열에서 트립토판(W), 글루타민(Q) 또는 아르기닌(R) 코돈을 돌연변이시킴으로써 생성된다. 구성요소로서 발현된 ABE 및 단일 가이드 RNA는 AAV를 생산하는 형질감염 동안 이러한 정지 코돈을 수선한다. ABE 또는 단일 가이드 RNA의 부재 하에서, AAV는 생산되지 않는다.
도 3은 플라스미드의 안정적인 통합을 위한 플라스미드 개략도이다. 트랜스포존 IR/DRs, CTCF 절연체 및 항생제 내성 선택 카세트는 AAV 페이로드, 돌연변이체 Rep/Cap, 및 돌연변이체 헬퍼 유전자에 측접한다. 하나 이상의 조기 정지 코돈이 Rep, E2A 및 E4 ORF6에 도입될 수 있다. ABE는 유도성 TRE 프로모터에 의해 발현되고, rtTA(TetOn) 유전자는 동일한 플라스미드 상에서 항생제 내성 유전자에 융합된다.
도 4는 바이러스 역가를 회복하기 위해 ABE8.17-m 유무와 상관없이 Rep, Cap, E2A, E4 ORF6 및 L4 100K의 개개 조기 정지 돌연변이체를 도시한다. 시험한 모든 Rep 및 Cap 돌연변이체는 ABE의 부재 하에서 AAV 역가를 음성 대조군("편집기 없음")과 비슷한 수준으로 감소시킬 수 있다. 돌연변이체 Rep78 W319* 및 Rep78 Q262*는 ABE8.17-m에 의해 '야생형' AAV("ABE8.17-m[V106W]")와 비슷한 역가로 회복될 수 있었다. 그러나, E2A, E4 ORF6 또는 L4 100K 단독 중 하나의 단일 돌연변이는 ABE의 부재 하에서 AAV 역가를 완전히 감소시키기에 충분하지 않았다.
도 5는 돌연변이 Rep W319* 또는 "야생형" pRepCap 플라스미드와 조합되고, ABE8.17-m 유무와 상관없이 공동 형질감염된 다양한 pHelper 돌연변이의 조합을 나타낸다. pHelper 플라스미드를 삽입 플라스미드로 대체하는 것은 음성 대조군으로서 작용하였다. ABE 유무와 상관없이 모든 삼중 돌연변이("RepW319*,ABE-")는 음성 대조군 수준으로 AAV 역가의 비슷한 감소를 나타낸다. ABE의 부재 하에서 이중 pHelper 돌연변이("wtRep,ABE-")만을 찾을 때, AAV 역가는 감소되지만, 완전히 없어지지는 않는다. ABE의 공동 형질감염("wtRep,ABE+" 및 "RepW319*,ABE+")은, 시험한 돌연변이체 조합물마다 2배 이내에서, 역가를 '야생형' AAV(제1 "wt pHelper" 및 "wtRep,ABE+" 막대) 근처의 수준으로 회복시킨다.
도 6은 독시사이클린 유무와 상관없이 공동 형질감염된 다양한 안정적인 AAV 플라스미드의 조합물을 나타낸다. ABE 플라스미드가 없는 공동 형질감염은 음성 대조군으로서 작용한다. 유도성 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 독시사이클린의 부재 하에서 음성 대조군 수준과 비슷하고, 독시사이클린의 존재 하에서 야생형 AAV 역가 수준과 비슷하며, 둘 다 4배 이내이다. 그러나, 구성적 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 2배 이내에서 독시사이클린의 유무와 상관없이 야생형 대조군 수준과 비슷하고, 이는 일시적으로 시험한 플라스미드 조합물의 유도성 결여를 나타낸다.
AAV는 세포 및 유전자 요법을 위한 유망한 유전자 전달 양상이다. AAV의 생산은 일반적으로 플라스미드의 세포 배양물에의 일시적 형질감염을 수반한다. 그러나, 게놈에 치료 AAV를 생산하는 데 필요한 유전자의 안정적인 통합은 일시적 형질감염을 통한 전통적인 생산과 비교할 때 여러 이점을 제공한다. 세포가 이들 자체의 세포분열 동안에 바이러스 유전자를 증식시키기 때문에, 형질감염 과정을 위해 더 이상 다량의 DNA 및 형질감염 시약을 조달할 필요가 없어서, 비용이 절감된다. 또한, DNA는 이미 핵 내에 있기 때문에, 최소 수의 "비형질감염" 세포 및 형질감염 단계와 연관된 감소된 변이로 인해 바이러스 역가는 더 높고 더 일관될 수 있다. 또한 생산 과정이 간단할수록 연구자의 시간을 절약한다.
그러나, 아데노-연관 바이러스(AAV) 벡터 생산에 필요한 여러 유전자는 다른 연구자들에 의해 세포증식억제성 또는 세포독성, 즉, Rep, E2A 및 E4인 것으로 입증되었다. HEK293 세포에서 아데노바이러스 E1 유전자의 천연 발현이 이러한 독성 유전자의 발현을 상향조절하기 때문에, 이러한 단백질의 세포독성 및 세포증식억제성 특성은 널리 사용되는 HEK293 세포주에서의 안정적인 AAV 생산자 세포주의 개발을 방해하였다. 이러한 유전자에 의해 안정적으로 형질감염된 세포는 선택 단계에서 생존하지 못하거나 발현이 침묵되어, 적절한 양의 AAV를 생산하는 것의 불능을 초래한다.
I. 아데노-연관 바이러스 생산 시스템
일부 양상에서, 본 개시내용은 아데노-연관 바이러스(AAV) 생산 시스템에 관한 것이다. 일부 실시형태에서, AAV 생산 시스템은 세포에 대해 세포독성 또는 세포증식억제성인 생성물(들)을 포함하는 AAV 생산에 필요한 유전자 산물(들)의 유도성 제어를 가능하게 한다. 이러한 유도성 제어는 게놈 수준(즉, 게놈 변형의 유도성 제어)에서 또는 번역 수준(즉, 변경된 번역의 유도성 제어)에서 매개될 수 있다.
본 명세서에 기재된 바와 같은 AAV 생산 시스템은, (a) AAV 생산 구성성분 및 (b) 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 본 명세서에 사용되는 바와 같은 용어 "AAV 생산 구성성분"은 재조합 숙주 세포에서 AAV의 생성에 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 지칭하되, AAV 생산에 필요한 적어도 하나의 유전자는 AAV 생산에 필요한 유전자에 필요한 유전자 활성을 감소시키는 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
일부 실시형태에서, AAV 생산 구성성분은 재조합 숙주 세포에서 AAV 벡터를 생성하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 예시적인 AAV 유전자 산물은 Rep52, Rep40, Rep78, Rep68, E2A, E4Orf6, VARNA, CAP(VP1, VP2, VP3) 및 AAP를 포함한다. Rep 유전자 산물(Rep52, Rep40, Rep78 및 Rep68 포함)은 AAV 게놈 복제에 수반된다. E2A 유전자 산물은 AAV 복제 동안 DNA 합성 진행성(processivity)을 돕는 것에 관여한다. E4Orf6 유전자 산물은 AAV 복제를 지원한다. VARNA 유전자 산물은 번역을 조절하는 데 어떤 역할을 한다. CAP 유전자 산물(VP1, VP2, VP3 포함)은 바이러스 캡시드 단백질을 암호화한다. AAP 유전자 산물은 캡시드 조립체에서 어떤 역할을 한다. 일부 실시형태에서, AAV 구성성분은 유전자 산물: Rep52 또는 Rep40; Rep78 또는 Rep68; E2A; E4Orf6; VARNA; VP1; VP2; VP3; 및 AAP를 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, AAV 구성성분은 유전자 산물: Rep52, Rep40, Rep78, Rep68, E2A, E4Orf6, VARNA, VP1, VP2, VP3 및 AAP를 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)(예를 들어, 세포에 대해 세포독성 또는 세포증식억제성인 산물(들), 예컨대, Rep, E2A 및/또는 E4)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 AAV 생산에 필요한 유전자의 활성을 감소시키는 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 적어도 1개의 돌연변이(예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 돌연변이)를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이(들)를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산 내의 임의의 코돈은 돌연변이될 수 있다.
일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 적어도 1개의 조기 정지 코돈(예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 조기 정지 코돈)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 조기 정지 코돈(들)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산 내의 임의의 코돈은 조기 정지 코돈에 대해 변형될 수 있다.
본 명세서에 사용되는 바와 같은 용어 "조기 정지 코돈"은 주어진 코돈의 서열이 TAG, TAA 또는 TGA가 되도록 암호화 서열에서 하나 이상의 핵산 잔기를 돌연변이시킴으로써 유전자의 암호화 서열에 첨가되는 정지 코돈을 지칭한다.
일부 실시형태에서, AAV 생산 구성성분은(즉, AAV 구성성분의 유전자 산물은) 단일 폴리핵산 상에서 암호화된다. 다른 실시형태에서, 다중 폴리핵산은 일괄적으로 AAV 구성성분을 포함한다(즉, AAV 구성성분의 유전자 산물 중 적어도 둘 이상은 상이한 폴리핵산 상에서 암호화된다). 예를 들어, AAV 구성성분은 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 폴리핵산을 포함할 수 있다. 일부 실시형태에서, AAV 구성성분은 2, 3, 4 또는 5개의 폴리핵산을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "활성 제어 구성성분"은 유전자 산물의 활성을 감소시키는 하나 이상의 돌연변이를 포함하는 AAV 생산에 필요한 유전자의 생산을 유도하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 지칭한다. 일부 실시형태에서, 하나 이상의 돌연변이는 야생형 유전자 산물에 비해 적어도 10%(예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%)만큼 AAV 생산에 필요한 유전자 산물의 활성을 감소시킨다. 일부 실시형태에서, 하나 이상의 돌연변이는 AAV 생산에 필요한 유전자 산물의 활성을 10% 내지 20%, 10% 내지 30%, 10%, 50%, 10% 내지 70%, 10% 내지 90%, 10% 내지 99%, 30% 내지 50%, 30% 내지 70%, 30% 내지 90%, 30% 내지 99%, 50% 내지 70%, 50% 내지 90%, 50% 내지 99%, 70% 내지 90% 또는 70% 내지 99%만큼 감소시킨다. 일부 실시형태에서, AAV 생산에 필요한 유전자의 하나 이상의 돌연변이는 유전자 산물의 기능상실을 초래한다. 일부 실시형태에서, 하나 이상의 돌연변이는 세포에서의 AAV 생산을 적어도 1배(예를 들어, 적어도 1배, 적어도 2배, 적어도 5배, 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배, 적어도 10000배)만큼 감소시킨다. 일부 실시형태에서, 하나 이상의 돌연변이는 AAV 생산을 세포 1 내지 2, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 1000, 10 내지 20, 10 내지 50, 10 내지 100, 10 내지 1000, 10 내지 10000, 100 내지 1000, 또는 100 내지 10000배로 감소시킨다.
일부 실시형태에서, AAV 생산에 필요한 유전자는 조기 정지 코돈(들)을 포함하도록 돌연변이된다. 일부 실시형태에서, 활성 제어 구성성분은 조기 정지 코돈(들)을 포함하는 유전자의 발현을 유도하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 포함한다. 본 명세서에 기재된 예시적인 활성 제어 구성성분은 비표준 tRNA 합성효소/tRNA 시스템 및 염기 편집기 시스템을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 AAV 생산에 필요한 유전자에서 하나 이상의 돌연변이를 수정할 수 있는 염기 편집기(예를 들어, ABE 또는 CBE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 AAV 생산에 필요한 유전자에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 20개의 돌연변이를 수정할 수 있는 염기 편집기(예를 들어, ABE 또는 CBE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분이 표준 코돈을 암호화하도록 조기 정지 코돈(들)을 편집할 수 있는 염기 편집기(예를 들어, ABE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분이 본래의 야생형 표준 코돈을 암호화하도록 조기 정지 코돈(들)을 편집할 수 있는 염기 편집기 시스템을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 조기 정지 코돈에 상보성인 비표준 tRNA 안티코돈을 포함하는 비표준 tRNA 합성효소/tRNA 시스템을 포함한다. 일부 실시형태에서, 비표준 아미노산이 존재할 때, 비표준 아미노산이 번역 동안 AAV 생산에 필요한 단백질에 혼입되도록, 비표준 tRNA 합성효소/tRNA 시스템은 비표준 아미노산을 담는다. 일부 실시형태에서, 비표준 tRNA 합성효소/tRNA 시스템은 화학적으로 유도성이다.
일부 실시형태에서, 활성 제어 구성성분은 단일 폴리핵산 상에서 암호화된다. 일부 실시형태에서, 다중 폴리핵산은 일괄적으로 활성 제어 구성성분을 포함한다. 예를 들어, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 폴리핵산을 포함할 수 있다. 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 폴리핵산을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "프로모터"는 DNA로부터 RNA의 전사를 개시하기 위해 단백질에 의해 결합될 수 있는 핵산 서열을 지칭한다. 프로모터는 구성적 프로모터(즉, 계속적 전사를 가능하게 하는 비조절 프로모터)일 수 있다. 구성적 프로모터의 예는 당업계에 공지되어 있으며, 거대세포 바이러스(CMV) 프로모터, 연장인자 1α(EF1α) 프로모터, 시미안 공포화 바이러스 40(SV40) 프로모터, 유비퀴틴-C(UBC) 프로모터, U6 프로모터 및 포스포글리세르산 키나제(PGK) 프로모터를 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Ferreira et al., Tuning gene expression with synthetic upstream open reading frames. Proc. Natl. Acad. Sci. U.S.A. 2013 Jul; 110(28): 11284-89]; 공개번호: 미국 특허 제2014/377861 A1호를 참조하며 - 이들의 전문은 본 명세서에 참조에 의해 원용된다. 대안적으로, 프로모터는 유도성 프로모터일 수 있다(즉, 특정 상황 하에서 전사를 단지 활성화시킨다). 유도성 프로모터는 화학적 유도성 프로모터, 온도 유도성 프로모터, 또는 광 유도성 프로모터일 수 있다. 유도성 프로모터의 예는 당업계에 알려져 있으며, 테트라사이클린/독시사이클린 유도성 프로모터, 큐메이트 유도성 프로모터, ABA 유도성 프로모터, CRY2-CIB1 유도성 프로모터, DAPG 유도성 프로모터, 및 미페프리스톤 유도성 프로모터를 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Stanton et al., ACS Synth. Biol. 2014 Dec 19; 3(12): 880-91; Liang et al., Sci. Signal. 2011 Mar 15; 4(164): rs2]; 특허 번호: US 7,745,592 B2; 특허 번호: US 7,935,788 B2를 참조하며 - 이들의 전문은 본 명세서에 참조에 의해 원용된다.
일부 실시형태에서, 본 명세서에 기재된 AAV 생산 시스템은 조작된 세포를 추가로 포함한다. 조작된 세포는 본 명세서에 기재된 AAV 생산 시스템의 임의의 부분(및 부분의 임의의 조합)을 포함할 수 있다.
예를 들어, 조작된 세포는 AAV 생산 구성성분의 적어도 일부를 포함할 수 있다. 예를 들어, 위에 기재한 바와 같이, AAV 생산 구성성분은 다중 폴리핵산을 포함할 수 있다. 이러한 실시형태에서, 조작된 세포는 상기 다중 폴리핵산 중 하나 이상을 포함하고 - 이들 각각은 염색체 외에 위치되거나 또는 조작된 세포의 게놈 내로 안정적으로 통합될 수 있다. 일부 실시형태에서, 조작된 세포는 전체 AAV 생산 구성성분을 포함한다.
대안적으로, 또는 추가로, 조작된 세포는 AAV 생산 시스템의 활성 제어 구성성분을 포함할 수 있다.
일부 실시형태에서, AAV 생산 시스템은 (a) AAV 생산에 필요한 유전자를 일괄적으로 암호화하는 하나 이상의 이종성 폴리핵산을 포함하는 AAV 생산 구성성분을 포함하는 조작된 세포로서, 적어도 하나의 유전자는 돌연변이를 포함하는, 상기 조작된 세포; (b) 생산을 유도할 수 있고/있거나 돌연변이를 포함하는 적어도 하나의 유전자의 돌연변이를 수정할 수 있는 활성 제어 구성성분을 포함한다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
A. 랜딩 패드
본 명세서에 기재된 조작된 세포는 랜딩 패드를 더 포함할 수 있다. 본 명세서에 사용되는 바와 같은 용어 "랜딩 패드"는 세포 게놈의 특정 좌위(또는 다중 좌위)에 "페이로드" 서열의 표적화된 삽입을 용이하게 하는 이종성 폴리핵산 서열을 지칭한다. 따라서, 랜딩 패드는 세포 게놈에 통합된다. 고정된 통합 부위는 위치상의 후성적 효과 또는 근위 조절 구성요소에 의해 야기될 수 있는 실험 간의 가변성을 감소시키는 것이 바람직할 수 있다. 페이로드 복제수를 제어하는 능력은 또한 임의의 유전자 구성성분을 변화시키는 일 없이 페이로드의 발현 수준을 조절하는 것이 바람직할 수 있다.
일부 실시형태에서, 랜딩 패드는 조작된 세포의 게놈에서 안전 항만 부위(safe harbor site)에 위치된다. 본 명세서에 사용되는 바와 같은 용어 "안전 항만 부위"는 유전자 또는 유전자 구성요소가 인접한 유전자 및/또는 인접한 게놈 구성요소의 조절 또는 조절을 붕괴시키는 일 없이 도입될 수 있고 도입된 유전자 또는 유전자 구성요소의 발현 또는 조절을 붕괴시키지 않는 게놈 내 위치를 지칭한다. 안전 항만 부위의 예는 당업자에게 알려져 있으며, AAVS1, ROSA26, COSMIC, H11, CCR5 및 LiPS-A3S을 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Gaidukov et al., Nucleic Acids Res. 2018 May 4; 46(8): 4072-4086]; 특허 번호: US 8,980,579 B2; 특허 번호: US 10,017,786 B2; 특허 번호: US 9,932,607 B2; 공개 번호: US 2013/280222 A; 공개 번호: WO 2017/180669 A1을 참조하며, 이들의 전문은 본 명세서에 원용된다. 일부 실시형태에서, 안전 항만 부위는 알려진 부위이다. 다른 실시형태에서, 안전 항만 부위는 이전에 개시되지 않은 부위이다. 본 명세서의 "고발현 게놈 좌위의 확인 방법 및 이의 용도"를 참조한다. 일부 실시형태에서, 본 명세서에 기재된 조작된 세포는 AAVS1, ROSA26, COSMIC, H11, CCR5 및 LiPS-A3S으로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
일부 실시형태에서, 조작된 세포는 HEK293 세포로부터 유래된다. 일부 실시형태에서, 조작된 HEK293 세포는 AAVS1, ROSA26, CCR5 및 LiPS-A3S로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
일부 실시형태에서, 조작된 세포는 CHO 세포로부터 유래된다. 일부 실시형태에서, 조작된 CHO 세포는 ROSA26, COSMIC 및 H11로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
본 명세서에 기재된 각각의 랜딩 패드는 적어도 하나의 재조합 부위를 포함한다. 다양한 인테그라제에 대한 재조합 부위는 이전에 확인되었다. 예를 들어, 랜딩 패드는 Bxb1 인테그라제, 람다-인테그라제, Cre 재조합효소, Flp 재조합효소, 감마-델타 레솔베이즈, Tn3 레솔베이즈, φC31 인테그라제 또는 R4 인테그라제에 상응하는 재조합 부위를 포함할 수 있다. 예시적인 재조합 부위 서열은 당업계에 공지되어 있다(예를 들어, attP, attB, attR, attL, Lox 및 Frt).
본 명세서에 기재된 랜딩 패드는 하나 이상의 발현 카세트를 포함할 수 있다.
일부 실시형태에서, 페이로드 서열은 (본 명세서에 기재된 바와 같이) 제1 역위 말단 반복부(ITR), 제2 ITR 및 프로모터에 작동 가능하게 연결된 유전자를 암호화하는 핵산 분자를 포함한다. 일부 실시형태에서, 페이로드는 5' - ITR-프로모터-유전자-ITR - 3'을 암호화하는 핵산 분자를 포함하며, 유전자는 AAV 전달을 위한 유전자이다. 일부 실시형태에서, 유전자는 형광 단백질이다. 일부 실시형태에서, 유전자는 녹색 형광 단백질이다. 일부 실시형태에서, 페이로드 서열은 다중 클로닝 부위를 포함한다.
B. 전사 활성체
일부 실시형태에서, AAV 생산 시스템은 전사 활성체를 암호화하는 핵산 서열을 추가로 포함한다. 일부 실시형태에서, 전사 활성체는 TetOn-3G, rtTA-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16, 및 큐메이트 cTA 및 rcTA로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 전사 활성체는 전문이 참조에 의해 원용된 문헌[Das et al. Curr. Gene Therapy 2016; 16(3):156-67]에 기재된 바와 같은 rtTA-V1, rtTA-V2, rtTA-V3, rtTA-V4, rtTA-V5, rtTA-V7, rtTA-V8, rtTA-V9, rtTA-V10, rtTA-V11, rtTA-V12, rtTA-V13, rtTA-V14, rtTA-V15, rtTA-V16, rtTA-V17 및 rtTA-V18로 이루어진 군으로부터 선택된 rtTA/TetOn 변이체이다. 일부 실시형태에서, 전사 활성체를 암호화하는 핵산 서열은 선택 마커에 융합된다. 일부 실시형태에서, 전사 활성체는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성화는 구성적으로 활성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성체는 이의 상응하는 화학적 유도성 프로모터에 작동 가능하게 연결된다. 비제한적 예에서, TetOn-3G 전사 활성체는 TRE 프로모터에 작동 가능하게 연결될 수 있다. 일부 실시형태에서, 전사 활성화는 hEF1a 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성체는, 소분자 유도물질에 노출될 때, 조작된 세포 내의 상응하는 화학적 유도성 프로모터의 발현을 유도한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된다.
II. mRNA 번역 동안 조기 정지 코돈(들) 대신에 아미노산(들)을 도입하기 위한 AAV 생산 시스템
mRNA 번역 동안 조기 정지 코돈(들) 대신 아미노산(들)을 도입하기 위한 시스템은 비표준 tRNA 합성효소, 비표준 tRNA 또는 이들의 조합을 포함할 수 있다. 일부 실시형태에서, 조기 정지 코돈(들) 대신에 아미노산(들)을 도입하기 위한 시스템은 비표준 아미노산을 더 포함한다.
본 명세서에 사용되는 바와 같은 용어 "비표준 tRNA 합성효소"는 조작된 세포가 유래된 세포에 자연적으로 존재하지 않는 tRNA 합성효소를 지칭한다. tRNA 합성효소는 번역 동안 동족 tRNA에 대한 아미노산의 공유 부착을 촉매하는 효소이다.
본 명세서에 사용되는 바와 같은 용어 "비표준 tRNA"는 조작된 세포가 유래된 세포의 자연 발생적 tRNA에 의해 사용되지 않는 안티코돈을 갖는 tRNA를 지칭한다. 일부 실시형태에서, 비표준 tRNA는 조작된 세포의 조기 정지 코돈(TAG, TAA 또는 TGA)과 상응하는 안티-코돈을 포함한다. 일부 실시형태에서, 비표준 tRNA는 상응하는 비표준 tRNA 합성효소에 의해 담아지고; 특정 tRNA 합성효소에 관해, 비표준 tRNA는 접합체 tRNA로 지칭될 수 있다.
일부 실시형태에서, 활성 제어 구성성분은 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA를 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA는 본 명세서에 전문이 참조에 의해 원용된 문헌[Mukai, Takahito, et al. Annual review of microbiology 71 (2017): 557-577]에 기재된 바와 같이 이콜라이(E. coli) GlnRS-tRNAGln, 이콜라이 TyrRS 및 Bst tRNATyr, 이콜라이 TyrRS-tRNATyr, 바실러스 서브틸리스(B. subtilis) TrpRS-tRNATrp, 이콜라이 TrpRS-tRNATrp, 이콜라이 LeuRS-tRNALeu, 메타노사르시나 바커리(M. bareri) PylRS(b)-tRNAPyl, 메타노사르시나 바커리 PylRS 및 데설피토박테리움 하프니엔스(D. hafniense) tRNAPyl, 이콜라이 TyrRS 및 게오바실러스 스테아로써모필러스(G. stearothermophilus) tRNATyr로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA는 메타노사르시나 마제이(M. mazei) 피롤리실-tRNA 합성효소(PylRS)-tRNAPyl이며, 이는 mRNA 번역 동안에 l-라이신 유도체인 비표준 아미노산 H-Lys(Boc)-OH를 혼입한다.
A. 예시적인 비표준 tRNA 합성효소
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신에 아미노산을 도입하기 위한 시스템은 프로모터(본 명세서에 기재된 바와 같은 구성적 또는 유도성)에 작동 가능하게 연결된 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 이종성 폴리뉴클레오타이드를 포함한다. 예시적인 비표준 tRNA 합성효소는 당업계에 공지되어 있으며, 이콜라이 GlnRS, 이콜라이 TyrRS, 바실러스 서브틸리스 TrpRS, 이콜라이 TrpRS, 이콜라이 LeuRS, 메타노사르시나 바커리 PylRS, 이콜라이 TyrRS 및 메타노사르시나 마제이 PylRS를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 활성 제어 구성성분은 이콜라이 GlnRS, 이콜라이 TyrRS, 바실러스 서브틸리스 TrpRS, 이콜라이 TrpRS, 이콜라이 LeuRS, 메타노사르시나 바커리 PylRS, 이콜라이 TyrRS 및 메타노사르시나 마제이 PylRS로 이루어진 군으로부터 선택된 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 활성 제어 구성성분의 비표준 tRNA 합성효소는 서열번호 20("메타노사르시나 마제이 PylRS")과 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 20의 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 20의 아미노산 서열로 이루어진다.
일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21("MmPylRS (Y384F)")과 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 아미노산 서열을 포함하되, 384번 위치에서 아미노산은 F이다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21의 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21의 아미노산 서열로 이루어진다.
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신 비표준 아미노산을 도입하기 위한 시스템은 적어도 2개의 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 이종성 폴리뉴클레오타이드를 포함하며(위에 기재한 바와 같음), 이들 각각은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
본 명세서에 기재된 바와 같은 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함할 수 있다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
B. 예시적인 비표준 tRNA
일부 실시형태에서, 활성 제어 구성성분은 프로모터(본 명세서에 기재된 바와 같은 구성적 또는 유도성)에 작동 가능하게 연결된 비표준 tRNA를 암호화하는 핵산 서열을 포함하는 이종성 폴리뉴클레오타이드를 포함한다. 예시적인 비표준 tRNA는 당업계에 공지되어 있으며, 이콜라이 tRNAGln, 이콜라이 tRNATyr, 바실러스 서브틸리스 tRNATrp, 이콜라이 tRNATrp, 이콜라이 tRNALeu, 메타노사르시나 바커리 tRNAPyl, 데설피토박테리움 하프니엔스 tRNAPyl, 게오바실러스 스테아로써모필러스 tRNATyr, 및 메타노사르시나 마제이 tRNAPyl을 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 활성 제어 구성성분은 이콜라이 tRNAGln, 이콜라이 tRNATyr, 바실러스 서브틸리스 tRNATrp, 이콜라이 tRNATrp, 이콜라이 tRNALeu, 메타노사르시나 바커리 tRNAPyl, 데설피토박테리움 하프니엔스 tRNAPyl, 게오바실러스 스테아로써모필러스 tRNATyr, 및 메타노사르시나 마제이 tRNAPyl로 이루어진 군으로부터 선택된 tRNA를 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 활성 제어 구성성분의 비표준 tRNA는 서열번호 22("PylT(U25C)")와 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 핵산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 22의 핵산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 22의 핵산 서열로 이루어진다.
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신 비표준 아미노산을 도입하기 위한 시스템은 적어도 2개의 비표준 tRNA를 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 이종성 폴리뉴클레오타이드를 포함하며(위에 기재한 바와 같음), 이들 각각은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
본 명세서에 기재된 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함할 수 있다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
일부 실시형태에서, 활성 제어 구성성분은, 5'에서 3'으로: (i) 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열; (ii) 비표준 tRNA(본 명세서에 기재된 바와 같음)를 암호화하는 핵산 서열; 및 (iii) 종결자 서열을 포함하는, 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 비표준 tRNA 발현 카세트는 서열번호 23의 핵산 서열 또는 서열번호 23의 핵산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 갖는 핵산 서열을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 다중 비표준 tRNA 발현 카세트를 포함한다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 비표준 tRNA 발현 카세트를 포함한다.
C. 조기 정지 코돈을 갖는 AAV 유전자 산물
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 조기 정지 코돈과 비표준 tRNA에 상응하는(즉, 파트 IA에 기재된 바와 같은) 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 핵산 서열 내의 대체를 용인하는 아미노산에 대한 코돈은 조기 정지 코돈과 비표준 tRNA에 상응하는 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 핵산 서열 내의 라이신 코돈은 조기 정지 코돈과 비표준 tRNA에 상응하는 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 대체를 용인하는 아미노산에 대한 코돈에 상응하는 위치(들)에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 라이신 코돈(들)에 상응하는 위치(들)에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 대체를 용인하는 아미노산에 대한 코돈에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 라이신 코돈(들)에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함할 수 있다.
본 명세서에서 사용되는 바와 같은 수식어 "NC"는 조기 정지 코돈과 비표준 tRNA에 상응하는 코돈 둘 다인 코돈(들)을 포함하는 유전자를 지칭한다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 NC-Rep52을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep40을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78을 암호화하는 핵산 서열; 프로모터(구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78+52를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E2A를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E4 ORF6을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP1을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP2를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP3을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP를 암호화하는 핵산 서열; 또는 이들의 임의의 조합을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep40을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep40"은 서열번호 7의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep40 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep40은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep40은 아미노산 치환의 용인으로서 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 본 명세서에 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E226 및 D233에 상응하는 위치). 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep40을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep68"은 서열번호 9의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep68 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep68은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep68은 아미노산 치환이 용인되는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E17, D24, E32, K33, E34, D40, D44, E49, E57, K58, R68, E75, E86, E96, E114, R119, R122, E125, D149, E173, E184, K186, R187, H192, H295, E201, K204, E205, D212, E226 및 D233에 상응하는 위치). 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep68을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep78"은 서열번호 8의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep78 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep78은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78은 아미노산 치환이 용인되는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E17, D24, E32, K33, E34, D40, D44, E49, E57, K58, R68, E75, E86, E96, E114, R119, R122, E125, D149, E173, E184, K186, R187, H192, H295, E201, K204, E205, D212, E226 및 D233에 상응하는 위치). 일부 실시형태에서, NC-Rep78 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78 핵산 서열은 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)를 더 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68 및 NC-Rep78(NC-Rep78/68)을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68 핵산 서열은 내부 리보솜 유입 부위(IRES)를 더 포함한다.
본 명세서에 사용되는 바와 같은 용어 "내부 리보솜 유입 부위(IRES)"는 캡-독립적 방식으로 단백질 번역을 가능하게 하는 리보솜 결합 부위를 암호화하는 핵산 서열을 지칭한다. 예시적인 IRES은 IRES(서열번호 4) 및 약화된 IRES(서열번호 5)를 포함한다. 추가적인 IRES는 당업자에게 용이하게 알려질 것이다.
일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 아미노산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나를 포함하는 아미노산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나로 이루어진 아미노산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep78을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep52"은 서열번호 6의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep52 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep52 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep52 핵산 서열은 아미노산 치환의 용인으로서 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 본 명세서에 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E226 및 D233에 상응하는 위치). 일부 실시형태에서, NC-Rep52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep52 핵산 서열은 내부 리보솜 유입 부위(IRES)를 더 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep52를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep78+52"은 서열번호 25에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep78 및 Rep 52 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈에 추가로 Rep68/40 스플라이스 부위를 없애는 점 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나로 이루어진다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 IRES를 더 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열에서 IRES는 NC-Rep78 또는 NC-Rep52의 번역을 개시한다. 일부 실시형태에서, IRES를 추가로 포함하는 NC-Rep78+52 핵산 서열은 서열번호 31 내지 32 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일하다. 일부 실시형태에서, NC-Rep78+52는 서열번호 31 내지 32 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78+52는 서열번호 31 내지 32 중 어느 하나의 핵산 서열로 이루어진다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep78+52를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep를 암호화하는 핵산 서열을 포함한다. Rep 유전자는 Rep52, Rep40, Rep78 및 Rep68을 포함한다. 용어 "NC-Rep"는 서열번호 24에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-Rep 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E2A를 암호화하는 핵산 서열을 포함한다. 용어 "NC-E2A"는 서열번호 10의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 E2A 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-E2A 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-E2A 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-E2A를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E4ORF6를 암호화하는 핵산 서열을 포함한다. 용어 "NC-E4ORF6"은 서열번호 11의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-E4ORF6 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-E4ORF6은 제거된 스플라이스 부위를 갖는다. 일부 실시형태에서, NC-E4 ORF6 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-E4 ORF6 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-E4ORF6을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP1을 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP1"은 서열번호 14의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP1 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP1 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP1 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP1을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP2를 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP2"은 서열번호 15의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP2 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP2 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP2 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP2를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP3을 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP3"은 서열번호 16의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP3 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP3 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP3 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP3을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP를 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP"는 서열번호 14의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP를 포함한다.
III. 조기 정지 코돈에서 아미노산 혼입 시스템을 포함하는 조작된 세포의 예시적인 실시형태
일부 양상에서, AAV 생산 시스템은 AAV 생산을 위한 조작된 세포를 더 포함한다. 일부 실시형태에서, 조작된 세포는 (a) 위에 기재한 바와 같은 AAV 생산 구성성분 및 (b) 위에 기재한 바와 같은 비표준 tRNA 합성효소(synthase) 및 접합체 비표준 tRNA를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 일부 실시형태에서, AAV 생산 구성성분 및 활성 제어 구성성분은 조작된 세포의 게놈에 안정적으로 통합된다.
본 명세서에 사용되는 바와 같은 용어 "안정적으로 통합된"은 유기체의 게놈에 삽입된 이종성 핵산 서열, 핵산 분자, 작제물, 유전자 또는 폴리뉴클레오타이드(예를 들어, 본 명세서에 기재된 바와 같은 조작된 세포)를 지칭하고, 세포분열 후 장래의 세대로 통과된다. 명세서에 기재된 임의의 핵산 서열, 핵산 분자, 작제물, 유전자 또는 폴리뉴클레오타이드가 안정적으로 통합될 수 있다는 것이 이해된다. 핵산 서열, 핵산 분자, 작제물 유전자 또는 폴리뉴클레오타이드는 무작위 통합, 표적화된 통합 또는 트랜스포존-매개 통합을 이용해서 게놈에 통합될 수 있다.
일부 실시형태에서, AAV 생산 시스템의 각각의 폴리핵산은 선택 마커를 포함한다. 일부 실시형태에서, AAV 생산 시스템의 각각의 폴리핵산은 별도의 선택 마커의 핵산 서열을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "선택 마커"는 -세포에 도입되거나 발현될 때 - 선택에 적합한 형질을 부여하는 단백질을 지칭한다. 본 명세서에 사용되는 바와 같은 용어 "선택 카세트"는 프로모터(본 명세서에 기재된 바와 같음) 및 종결자에 작동 가능하게 연결된 선택 마커를 암호화하는 핵산 서열을 지칭한다.
선택 마커는 형광 단백질일 수 있다. 형광 단백질의 예는 당업계에 알려져 있다(예를 들어, TagBFP, EBFP2, EGFP, EYFP, mKO2 또는 Sirius). 예를 들어, 특허 번호: US 5,874,304; 특허 번호: EP 0969284 A1; 공개 번호: US 2010/167394 A - 이들의 전문은 본 명세서에 참조에 의해 원용된다.
대안적으로, 또한 추가로, 선택 마커는 항생제 내성 단백질일 수 있다. 항생제 내성 단백질의 예는 당업계에 알려져 있다(예를 들어, 퓨로마이신, 하이그로마이신, 네오마이신, 제오신, 블라스티시딘 또는 플레오마이신 선택을 용이하게 함). 예를 들어, 공개 번호: WO 1997/15668 A2; 공개 번호: WO 1997/43900 A1 - 이의 전문은 본 명세서에 참조에 의해 원용됨.
A. 제1의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, tRNA 합성효소는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, AAV 생산에 대한 조작된 세포는 서열번호 21의 MmPyrLS WT/Y384F tRNA 합성효소를 포함한다. 일부 실시형태에서, MmPyrLS WT/Y384F를 암호화하는 핵산 서열은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, MmPyrLS WT/Y384F는 hEF1 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자는 도 1에 도시한 바와 동일한 구조를 갖는다.
B. 제2의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자 및 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 출원에 기재된 tRNA 중 어느 하나의 하나 이상을 암호화하는 하나 이상의 핵산 서열(예를 들어, 본 출원에 기재된 tRNA 중 어느 하나의 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵산 서열)을 포함한다. 일부 실시형태에서, 위에 기재한 바와 같이, 본 출원에 기재된 tRNA 중 어느 하나의 각각의 하나 이상을 암호화하는 핵산 서열은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 PylT(U25C) tRNA를 각각 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 각각 U6 프로모터에 작동 가능하게 연결된 PylT(U25C) tRNA를 암호화하는 4개의 핵산 서열을 포함한다. 일부 실시형태에서, PylT(U25C) tRNA를 암호화하는 4개의 핵산 서열은 U6 프로모터에 각각 작동 가능하게 연결된다.
일부에서, 제2의 안정적으로 통합된 핵산 분자는 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자는 도 1에 도시한 바와 동일한 구조를 갖는다.
C. 제3의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자 및 제3의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 NC-Rep78+52을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 D233번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 D233 및 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 NC-Rep를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep를 암호화하는 핵산 분자는 또한 D233번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep를 암호화하는 핵산 분자는 또한 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, Rep를 암호화하는 핵산 분자는 또한 D233 및 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다.
일부에서, 제3의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자는 돌연변이된 Rep78+52 또는 돌연변이된 Full-Rep를 도시하는 도 1에서 다이어그램 중 어느 하나와 동일한 구조를 갖는다.
D. 제4의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자 및 제4의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 전사 활성체를 암호화하는 핵산 서열을 포함한다.
E. 제5의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제4의 안정적으로 통합된 핵산 분자 및 제5의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제5의 안정적으로 통합된 핵산 분자는 위에 기재한 프로모터에 작동 가능하게 연결된 E2A 또는 NC-E2A 및 E4ORF6 또는 NC-E4ORF6을 암호화하는 핵산 서열을 포함한다.
F. 제6의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제4의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제5의 안정적으로 통합된 핵산 분자 및 제6의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제6의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 프로모터에 작동 가능하게 연결된 VP(CAP) 유전자를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제6의 안정적으로 통합된 핵산 분자는 AAV 페이로드를 포함한다.
IV. 비표준 tRNA를 포함하는 AAV 생산을 위해 조작된 세포를 이용하는 방법.
일부 양상에서, 본 개시내용은 (a) AAV 생산 구성성분 및 (b) 본 명세서에 기재된 비표준 tRNA 합성효소/tRNA를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함하는 AAV 생산 시스템을 이용하여 AAV를 생산하는 방법을 제공한다. 일부 실시형태에서, AAV 생산 방법은 AAV 생산 구성성분 및 본 명세서에 기재된 바와 같은 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산의 임의의 조합을 조작된 세포에 형질감염 또는 안정적으로 통합하는 단계를 포함한다. 일부 실시형태에서, AAV 생산 방법은 위에 기재한 바와 같은 AAV 전달(예를 들어, 치료적 DNA 서열)을 위해 페이로드를 포함하는 핵산 분자를 형질감염시키는 단계를 더 포함한다. 일부 실시형태에서, AAV 생산 방법에서 사용되는 조작된 세포는 본 명세서에 기재된 바와 같은 비표준 tRNA 합성효소/tRNA를 포함하는 AAV 생산을 위한 조작된 세포 중 어느 하나로부터 선택된다. 일부 실시형태에서, 상기 방법은 조작된 세포를 AAV 생산에 최적인 합류까지 성장시키는 단계를 포함한다. 최적의 합류는, 예를 들어, 조작된 세포가 유래된 세포 유형에 따를 수 있다. 당업자는 AAV 생산의 최적 합류를 알거나 결정할 수 있다. 일부 실시형태에서, 상기 방법은 조작된 세포를 비표준 tRNA 상에 담길 수 있는 아미노산과 접촉시키는 단계를 포함한다. 일부 실시형태에서, 아미노산은 H-Lys(Boc)-OH이다. 일부 실시형태에서, 상기 방법은 본 명세서에 기재된 바와 같은 소분자 유도물질을 이용하여 tRNA 합성효소 및/또는 접합체 tRNA의 발현을 유도하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 조작된 세포의 배양물로부터 생산된 AAV를 당업자에게 잘 공지된 방법을 이용하여 채취하는 단계를 포함한다.
V. 염기 편집기를 포함하는 AAV 생산 시스템
일부 양상에서, AAV 생산 시스템은 (a) AAV 생산 구성성분 및 (b) 핵산 서열에서 돌연변이(들)를 수정할 수 있는 염기 편집기를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 일부 실시형태에서, 염기 편집기는 조기 정지 코돈을 표준 코돈으로 대체한다.
A. 염기 편집기
본 명세서에 기재된 바와 같은 용어 "염기 편집기"는 단일-뉴클레오타이드 변이체(SNV)를 DNA 또는 RNA에 도입할 수 있는 단백질 또는 융합 단백질을 지칭한다. 예시적인 염기 편집기는 사이토신 염기 편집기(CBE): BE1, BE2, HF2-BE2, BE3, HF-BE3, YE1-BE3, EE-BE3, YEE-BE3, VQR-BE3, EQR-BE3, VRER-BE3, SaKKHBE3, FNLS-BE3, RA-BE3, eA3A-HF1-BE3-2xUGI, eA3A-Hypa-BE3-2xUGI, hA3A-BE3, hA3B-BE3, hA3G-BE3, hAID-BE3, SaCas9-BE3, xCas9-BE3, ScCas9-BE3, SniperCas9-BE3, iSpyMac-BE3, Target-AID, Target-AID-NG, BE-PLUS, BE4, BE4-Gam, BE4-Max, AncBE4-Max, SaCas9BE4-Gam, evoBe4max, evoFERNY-BE4max, 및 Cas12a-BE; 및 아데닌 염기 편집기(ABE): ABE7.8, ABE9, ABE10, ABE.8.17, xCas9-ABE7.10, VQR-ABE, Sa(KKH)-ABE, ABEmax, ABE7.10max, ABE8e, PE1, PE2, PE3, ABE REPAIRv1 및 ABE Repairv2를 포함하지만, 이들로 제한되지 않으며, 이들은 문헌[Porto, Elizabeth M., et al. Nature Reviews Drug Discovery 19.12 (2020): 839-859; Cox, David BT, et al. Science 358.6366 (2017): 1019-1027.; Komor, Alexis C., et al. Science advances 3.8 (2017): eaao4774; 및 Gaudelli, Nicole M., et al. Nature biotechnology 38.7 (2020): 892-900; 및 Kantor A. et al. International Journal of Molecular Sciences 21.17 (2020): 6240]에 더욱 상세하게 기재되어 있으며, 이들 각각은 전문이 참조에 의해 원용된다. 비제한적 검토에서, 염기 편집기는 촉매적으로 비활성인 엑소뉴클레아제 도메인(예를 들어, dCas9 또는 dCas13) 또는 CRISPR Cas 틈내기효소 단백질 도메인(예를 들어, Cas9n) 및 DNA를 변형시킬 수 있는 하나 이상의 도메인(예를 들어, 아데노신 탈아미노효소)을 갖는 CRISPR Cas 단백질을 포함하는 융합 단백질이다. 염기 편집기는 표적 DNA 또는 RNA 서열에 상보성인 핵산 서열을 포함하는 단일 가이드 RNA(sgRNA)에 결합한다. DNA 또는 RNA에 대한 염기 편집기의 표적화는 사용한 Cas 단백질 유형(DNA의 경우 Cas9 및 RNA의 경우 Cas13)에 의해 결정된다. 염기 편집기의 비제한적 예에서, 아데닌 염기 편집기(ABE)는 표적 유전자(예를 들어, 조기 정지 코돈을 포함하는 rep52 유전자)에 상보성인 서열을 포함하는 Cas9n 단백질, 아데노신 탈아미노효소, 및 단일 가이드 RNA를 포함한다. sgRNA는 ABE를 표적 DNA 서열로 보내고, 표적 DNA 서열은 Cas9n에 의해 결합되고, Cas9n은 표적 가닥에 틈을 내고, 아데노신 탈아미노효소는 표적 아데노신 뉴클레오타이드를 탈아미노화하여 이를 이노신으로 전환시키고, 이 동안에 DNA 복제는 구아닌으로서 판독되어 A-T 대 G-C DNA 변형을 초래한다. 염기 편집기를 이용하여 생성될 수 있는 돌연변이를 변경시키는 코돈의 예는 표 1 및 표 2에 예시된다. 일부 실시형태에서, 아연-핑거 뉴클레아제, 전사 활성체-유사 효과기 뉴클레아제(TALEN) 또는 프라임 에디터(Prime Editor)가 염기 편집기 대신에 사용될 수 있다.
일부 실시형태에서, 활성 제어 구성성분은 Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 ABE REPAIRv1(서열번호 84) 및 Cas13 ABE REPAIRv2(서열번호 85)로 이루어진 군으로부터 선택된 염기 편집기의 아미노산 서열을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드에 의해 암호화되되, 염기 편집기는 RNA 또는 DNA를 여전히 편집할 수 있다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드에 의해 암호화된다.
일부 실시형태에서, 활성 제어 구성성분은 프로모터(본 명세서에 기재된 바와 같음)에 작동 가능하게 연결된 염기 편집기(예를 들어, Cas9 ABE7.10, Cas9 ABE8.17m, Cas13 ABE REPAIRv1 또는 Cas13 ABE REPAIRv2)를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 프로모터는 구성적으로 활성인 프로모터이다. 일부 실시형태에서, 프로모터는 화학적 유도성 프로모터이다. 일부 실시형태에서, 염기 편집기는 pTRE3G(서열번호 1) 또는 pTREtight(서열번호 2)로 이루어진 군으로부터 선택된 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 염기 편집기는 VanR(서열번호 86), TtgR(서열번호 86), PhlF(서열번호 86), 또는 CymR(서열번호 86) 또는 Gal4 UAS(서열번호 86) 작동유전자 서열 중 적어도 하나를 함유하는 화학적 유도성 프로모터에 작동 가능하게 연결된다.
B. AAV 생산 구성성분: AAV 유전자 산물 활성을 감소시키는 돌연변이를 포함하는 AAV 생산에 필요한 유전자
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 위에 기재한 바와 같은 유전자 산물의 기능을 감소시키는 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)를 포함하도록 변형된다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 폴리핵산은 유전자 산물의 기능을 감소시키는 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 돌연변이를 포함할 수 있다.
일부 실시형태에서, 하나 이상의 돌연변이는 표 1 및 표 2의 코돈 돌연변이로부터 선택된다. 일부 실시형태에서, 하나 이상의 돌연변이는, 야생형 암호화된 아미노산과 비교할 때 상이한 분류의 아미노산의 암호화를 야기하는 코돈 돌연변이를 포함한다. 일부 실시형태에서, 상이한 분류의 아미노산은 양으로 하전(아르기닌, 히스티딘 및 라이신); 음으로 하전(아스파르트산 및 글루탐산); 극성(세린, 트레오닌, 시스테인, 타이로신, 아스파라긴 및 글루타민); 비극성(글리신, 알라닌, 발린, 류신, 아이소류신, 메티오닌, 트립토판, 페닐알라닌 또는 프롤린)이 있다. 일부 실시형태에서, 양으로 하전된 아미노산(들)에 대한 하나 이상의 아미노산 코돈은 음으로 하전, 비극성 또는 극성 아미노산에 대한 코돈으로 대체된다. 일부 실시형태에서, 음으로 하전된 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 양으로 하전, 비극성 또는 극성 아미노산으로 대체된다. 일부 실시형태에서, 극성 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 음으로 하전, 양으로 하전 또는 극성 아미노산에 대한 코돈으로 대체된다. 일부 실시형태에서, 비극성 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 음으로 하전, 비극성 또는 양으로 하전된 아미노산에 대한 코돈으로 대체된다.
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 조기 정지 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치에서 조기 정지 코돈을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치에서 하나 이상의 조기 정지 코돈(들)(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개 조기 정지 코돈(들)을 포함할 수 있다.
본 명세서에 사용되는 바와 같은 수식어 "DA"는 유전자 산물의 활성을 감소시키는 하나 이상의 돌연변이를 포함하는 유전자(예를 들어, 조기 정지 코돈(들))를 지칭한다. 일부 실시형태에서, 하나 이상의 정지 코돈 돌연변이는 센스 DNA 가닥 상의 하나 이상의 트립토판 및/또는 아르기닌 코돈(들), 또는 하나 이상의 글루타민, 아르기닌, 및/또는 안티센스 DNA 가닥 상의 프롤린 코돈(들)을 조기 정지 코돈으로 돌연변이시킴으로써 삽입된다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep52를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep40을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep78을 암호화하는 핵산 서열; 프로모터(구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep68을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep78+52을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-E2A를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-E4ORF6을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP1을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP2를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP3을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-L4 100K를 암호화하는 핵산 서열; 또는 이들의 임의의 조합을 포함한다.
일부 실시형태에서, DA-E2A, DA-E4ORF6, DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-Rep, DA-VP1, DA-VP2, DA-VP3, DA-VP 및 DA-L4 100K를 암호화하는 핵산 서열은 PAM 서열을 도입하기 위해 하나 이상의 돌연변이를 추가로 포함한다. 일부 실시형태에서, DA-E2A, DA-E4ORF6, DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-Rep, DA-VP1, DA-VP2, DA-VP3, DA-VP 및 DA-L4 100K를 암호화하는 핵산 서열은 PAM 서열을 도입하기 위해 하나 이상의 침묵 돌연변이를 추가로 포함한다. 일부 실시형태에서, PAM 서열은 돌연변이(들) 근처에 도입되어 DNA 염기 편집기(예를 들어, ABE 또는 CBE를 함유하는 Cas9)에 대한 PAM 서열을 도입한다. 일부 실시형태에서, PAM 서열은 표적 편집 부위 상류에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 뉴클레오타이드가 도입된다. 일부 실시형태에서, PAM 서열은 표적화 편집 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20개 이내에 도입된다. 일부 실시형태에서, PAM 서열은 표적 편집 부위의 10 내지 17 또는 13 내지 16개의 뉴클레오타이드 이내에 도입된다. 일부 실시형태에서, 하나 이상의 침묵 돌연변이는 염기 편집기 창 이내의 비표적(off-target) 염기 편집을 감소시키도록 이루어진다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep52를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 아미노산 서열을 암호화하는 DA-Rep52 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep52"는 Rep52(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 6의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 M225에 상응하는 아미노산 위치에 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep52는 Rep52 활성을 감소시키는 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410, 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep40을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep40"은 Rep40(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 7의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 M225에 상응하는 아미노산 위치에 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep40은 Rep40 활성을 감소시키는 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410, 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep78을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78 핵산 서열 암호화는 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep78"은 Rep78(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 8의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep78은 Rep78 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 133 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep78은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 8의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 8의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep68"은 Rep68(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 9의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep68을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep68을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep68은 Rep68 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 33 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep68은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 9의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 9의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep"은 Rep(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 24의 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep를 암호화하는 핵산 서열은 Rep의 아미노산 위치 R529(서열번호 97)에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep를 암호화하는 핵산 서열은 Rep의 아미노산 위치 R529(서열번호 97)에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 전문이 참조에 의해 원용된 문헌[Kyostio SR et al. J Virol. 1994 May; 68(5): 2947-2957]에 기재된 바와 같이 서열번호 97의 M225에 상응하는 아미노산 위치에서 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 서열번호 97의 K340에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 전문이 참조에 의해 원용된 문헌[Smith RH et al. J Virol. 1997 Jun; 71(6): 4461-4471]에 기재된 바와 같이 서열번호 97의 K340에 상응하는 아미노산 위치에서 라이신의 히스티딘으로의 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep는 Rep 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 133 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 전문이 참조에 의해 원용된 문헌[Yang Q et al. J Virol. 1992 Oct; 66(10): 6058-6069]은 이러한 위치가 삽입 돌연변이에 민감하다는 것을 나타낸다.
일부 실시형태에서, DA-Rep는 서열번호 97의 Q67, Q262 또는 W319에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 97의 Q67, Q262 및 W319에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-E2A를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A 핵산 서열은 E2A 프로모터에 작동 가능하게 연결된다. 용어 "DA-E2A"은 E2A(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 10의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-E2A는 아미노산 위치 W181 또는 W324에 조기 정지 코돈을 포함하도록 변형된 서열번호 10의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 아미노산 위치 W181 및 W324에 조기 정지 코돈을 포함하도록 변형된 서열번호 10의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 또는 106 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 내지 106 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 내지 106 중 어느 하나로 이루어진 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-E4ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6 핵산 서열은 E4 프로모터에 작동 가능하게 연결된다. 용어 "DA-E4ORF6"은 E4ORF6(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 11의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-E4ORF6은 아미노산 위치 W77 또는 W192에 조기 정지 코돈을 포함하도록 변형된 서열번호 11의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 아미노산 위치 W77 및 W192에 조기 정지 코돈을 포함하도록 변형된 서열번호 11의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 11의 W77 또는 W192에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 12의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 11의 W77 및 W192에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 12의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 또는 42 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 내지 42의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 내지 42의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 또는 108 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 내지 108 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 내지 108 중 어느 하나로 이루어진 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-L4 100 K를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 아미노산 서열을 암호화하는 DA-L4 100K 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-L4 100 K"는 L4 100K(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 112의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-L4 100K는 서열번호 97의 W435에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 112를 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열로 이루어진다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP1을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP1"은 VP1(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 14의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 돌연변이를 포함한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 ccA (P) -> ccG (P) 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP1은 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 14의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 아미노산 위치 W304 또는 Q598에 조기 정지 코돈을 포함하도록 변형된 서열번호 14의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP2를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP2"은 VP2(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 15의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP2는 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 15의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 아미노산 위치 W304 또는 Q598에 조기 정지 코돈을 포함하도록 변형된 서열번호 15의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP3을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP3"은 VP3(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 16의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)를 포함한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 전문이 참조에 의해 원용된 문헌[Ogden et al. Science. 2019 Nov 29; 366(6469): 1139-1143]에 기재된 바와 같이 아스파르트산, 글루탐산 또는 글리신의 아르기닌 또는 라이신으로의 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP3은 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 16의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 14의 W304 및 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 16의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP"는 VP(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 116과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP는 전문이 참조에 의해 원용된 문헌[Ogden et al. Science. 2019 Nov 29; 366(6469): 1139-1143]에 기재된 바와 같은 VP의 활성에 해로운 하나 이상의 비-침묵 돌연변이를 포함한다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 메티오닌에 대한 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아미노산 돌연변이를 포함한다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아이소류신의 메티오닌으로의 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP는 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 116의 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 14의 아미노산 위치 W304 또는 Q598에서 조기 정지 코돈을 포함하도록 변형된 서열번호 116의 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
C. 염기 편집기 단일 가이드 RNA
일부 실시형태에서, 활성 제어 구성성분은 하나 이상의 단일 가이드 RNA를 포함한다. 본 명세서에 기재된 바와 같은 용어 "단일 가이드 RNA(들) 또는 sgRNA"는 표적 DNA 또는 RNA 서열(예를 들어, DA-Rep52를 암호화하는 DNA 또는 RNA)에 결합하고 염기 편집기를 표적 DNA 또는 RNA 서열에 보낼 수 있는 RNA 서열을 지칭한다. 단일 가이드 RNA는 스페이서 또는 프로토스페이서로 지칭되는 핵산 서열을 포함한다. 일부 실시형태에서, 스페이서 또는 프로토스페이서는 약 15 내지 50개 염기쌍 길이이며, 표적 서열(예를 들어, DA-Rep52의 DNA 또는 RNA)에 충분히 상보성이어서 염기 편집기를 표적 서열에 보낸다. 일부 실시형태에서, 스페이서 또는 프로토스페이서는 프로토스페이서 인접 모티프(PAM)에 인접한 표적 서열에 상보성이다. 일부 실시형태에서, 하나 이상의 sgRNA는 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성이어서 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, 하나 이상의 sgRNA는 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성이어서 조기 정지 코돈(들)의 염기 편집을 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, 본 명세서에 기재된 임의의 sgRNA를 암호화하는 DNA 핵산 서열은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 일부 실시형태에서, 본 명세서에 기재된 임의의 sgRNA를 암호화하는 DNA 핵산 서열은 U6 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, AAV 생산 구성성분은 DA-E2A를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E2A를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-E2A를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E2A를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 잔기 W181에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 10에서 W181에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 W324에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 10에서 W324에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 잔기 W181 및 W324에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 comprises 서열번호 10에서 W181에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 10에서 W324에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W77에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 sgRNA는 서열번호 11에서 아미노산 잔기 W77에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여, 조기 정지 코돈을 트립토판 코돈으로 편집하기 위해 염기 편집기를 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W192에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 11에서 아미노산 잔기 W192에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여, 조기 정지 코돈을 트립토판 코돈으로 편집하기 위해 염기 편집기를 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W77 및 W192에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 11에서 W77에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 11에서 W192에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262 및 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73, 및 81 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73 및 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73 및 81 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 서열번호 97의 M225에 상응하는 아미노산 위치에서 돌연변이(예를 들어, M225G)를 포함하도록 변형된 DA-Rep52, DA-Rep40 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52, DA-Rep40 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 서열번호 97의 R529(예를 들어, AgG -> CgC)에 상응하는 아미노산 위치에서 돌연변이를 포함하도록 변형된 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 및/또는 DA-Rep 활성을 감소시키는 아미노산 위치 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 33 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이들 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함하는 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 하나 이상의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 및/또는 DA-Rep40 활성을 감소시키는 아미노산 위치 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이들 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함하는 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 및/또는 DA-Rep40를 암호화하는 핵산 서열 내의 하나 이상의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W67에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W67에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W67, Q262 및 W319에 상응하는 둘 이상의 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 97에서 아미노산 잔기 W67, Q262 및 W319에 상응하는 둘 이상의 조기 정지 코돈에 충분히 상보성인 스페이서 영역을 갖는 둘 이상의 단일 가이드 RNA를 포함하여, 조기 정지 코돈을 다시 본래의 야생형 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, AAV 생산 구성성분은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 돌연변이(예를 들어, ccA (P) -> ccG (P))를 포함하는 DA-VP1을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1의 위치 P8에서 돌연변이에 충분히 상보성인 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 돌연변이에 보낸다. 일부 실시형태에서, AAV 생산 구성성분은 VP(서열번호 14)의 잔기 1 내지 200 내에서 메티오닌에 대한 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아미노산 돌연변이(예를 들어, 아이소류신에서 메티오닌으로의 돌연변이)를 포함하는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 메티오닌에 대한 하나 이상의 돌연변이에 충분히 상보성인 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보낸다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아이소류신의 메티오닌으로의 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이(예를 들어, 아르기닌 또는 라이신에 대한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이)(예를 들어, 아르기닌 또는 라이신에 대한 아스파르트산, 글루탐산 또는 글리신)를 포함하는 DA-VP3을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이에 충분히 상보성인 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 하나 이상의 돌연변이에 보낸다. 일부 실시형태에서, DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열은 서열번호 14에서 아미노산 잔기 W304에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 14에서 W304에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 14에서 아미노산 Q598에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 14에서 Q598에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 정지 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 14에서 아미노산 W304 및 Q598에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 14에서 W304에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 14에서 Q598에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71, 및 79 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71, 및 79 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71 및 79 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-L4 100K를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-L4 100K를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-L4 100K를 암호화하는 핵산 서열을 포함하고, 정지 코돈 구성성분은 DA-L4 100K를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-L4 100 K를 암호화하는 핵산 서열은 서열번호 112에서 아미노산 잔기 435에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 112에서 W435에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나로 이루어진 스페이서를 포함한다.
VI. 염기 편집기를 포함하는 AAV 생산을 위한 조작된 세포의 예시적인 실시형태
일부 양상에서, AAV 생산 시스템은 AAV 생산을 위한 조작된 세포를 더 포함한다. 일부 실시형태에서, 조작된 세포는 (a) AAV 생산 구성성분 및 (b) 보다 초기의 정지 코돈 돌연변이를 표준 코돈으로 대체할 수 있는 염기 편집기를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는, 하나 이상의 폴리핵산을 포함한다.
일부 실시형태에서, 조작된 세포는 본 명세서에 기재된 바와 같은 염기 편집기(예를 들어, ABE 또는 CBE)를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 Rep52, DA-Rep52, Rep40, 또는 DA-Rep40 중 어느 하나를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 Rep78, DA-Rep78, Rep68 또는 DA-Rep68 중 어느 하나를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 E2A 또는 DA-E2A 중 어느 하나를 암호화하는 핵산 서열 및 본 명세서에 기재된 바와 같은 E4Orf6 또는 DA-E4Orf6 중 어느 하나를 암호화하는 핵산 서열을 포함하고, 본 명세서에 기재된 바와 같은 L4 100K 또는 DA-L4 100K; VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; 및 AAP의 각각을 암호화하는 핵산 서열을 더 포함하되, 조작된 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E4Orf6, DA-L4 100K DA-VP1, DA-VP2 및 DA-VP3 중 적어도 하나를 포함하고, 세포는 본 명세서에 기재된 바와 같은 하나 이상의 단일 가이드 RNA를 포함하고, 각각은 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E4Orf6 DA-L4 100K DA-VP1, DA-VP2 및 DA-VP3 중 적어도 하나에 대해 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 표준 코돈(예를 들어, 본래의 야생형 코돈)을 편집하도록 염기 편집기를 보낸다.
A. 제1의 안정적으로 통합된 핵산 분자
일부 실시형태에서, AAV 생산을 위한 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 E2A 또는 DA-E2A; E4Orf6 또는 DA-E4Orf6; L4 100K 또는 DA-L4 100K; 및 VARNA 또는 DA-VARNA의 각각을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, E2A 또는 DA-E2A; E4Orf6 또는 DA-E4Orf6; L4 100K 또는 DA-L4 100K; 및 VARNA 또는 DA-VARNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 본 명세서에 사용되는 바와 같은 용어 "CTCF 절연체"는 게놈 영역 사이의 원치않는 크로스토크(crosstalk)를 방지할 수 있는 CCCTC-결합 인자를 지칭한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 슬리핑 뷰티 트랜스포사제(Sleeping Beauty transposase)에 결합할 수 있는 2개의 IR/DR 서열을 추가로 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E2A를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E4ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E2A 및 DA-E4 ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-L4 100K를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 및 서열번호 13을 포함한다. 일부 실시형태에서, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 및 서열번호 13을 포함하는 제1의 안정적으로 통합된 핵산 분자는 선택 카세트를 더 포함한다. 일부 실시형태에서, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112 서열번호 41 또는 서열번호 42, 서열번호 13 및 선택 카세트를 포함하는 제1의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 서열번호 13 및 선택 카세트는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
B. 제2의 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 제1의 안정적으로 통합된 핵산 분자 및 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; VP1 또는 DA-VP1; VP2 또는 DA-VP2; 및 VP3 또는 DA-VP3의 각각을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; VP1 또는 DA-VP1; VP2 또는 DA-VP2; 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 단일 가이드 RNA(예를 들어, 단일 가이드 RNA 어레이)를 더 포함하되, 하나 이상의 단일 가이드 RNA는 각각 본 명세서에 기재된 바와 같은 스페이서 영역을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 화학적 유도성 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈을 포함하는 DA-Rep를 포함한다. 일부 실시형태에서, DA-Rep는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, DA-Rep는 p19 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 하나 이상의 sgRNA는 각각 DA-Rep W319 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하기 위해 위에 기재한 바와 같이 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 sgRNA는 추가적으로 각각 위치 W77 및 W192에서 DA-E4 ORF6 조기 정지 코돈에 충분히 상보성인 스페이서 영역을 포함하여, 위에 기재한 바와 같이 조기 정지 코돈을 트립토판(W) 정지 코돈으로 편집하기 위해 염기 편집기를 보낸다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 14 내지 16, 54, 및 65 또는 81을 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 56 내지 59를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 66 내지 69를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 74 내지 77을 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77을 포함하는 제2의 안정적으로 통합된 핵산 분자는 선택 카세트를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77 및 선택 카세트를 포함하는 제2의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77 및 선택 카세트는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
C. 제3의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자를 포함하고, 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 염기 편집기를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 전사 활성체를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 전사 활성체를 더 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 염기 편집기를 암호화하는 핵산 분자(예를 들어, Cas9 ABE, Cas9 CBE, 또는 Cas13 ABE를 암호화하는 핵산 분자)를 포함한다. 일부 실시형태에서, 프로모터는 화학적으로 유도성이다. 일부 실시형태에서, 화학적 유도성 프로모터는 TRE이다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 TetOn 전사 활성체를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 2A 서열은 TetOn 핵산 서열과 선택 마커 핵산 서열 사이에서 암호화된다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85)를 포함한다. 일부 실시형태에서, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84) 또는 Cas13 REPAIRv2(서열번호 85)를 포함하는 제1의 안정적으로 통합된 핵산 분자는 TetOn 프로모터, 2A 펩타이드 및 선택 마커를 더 포함한다. 일부 실시형태에서, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85), TetOn 프로모터, 2A 펩타이드 및 선택 마커를 포함하는 제1의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85), TetOn 프로모터, 2A 펩타이드, 및 선택 마커는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 사이토신 염기 편집기(CBE)를 포함하는 염기 편집기를 포함한다. 일부 실시형태에서, CBE는 Cas9 CBE 또는 Cas13 CBE이다. 일부 실시형태에서, CBE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, CBE는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF 또는 CymR 중 적어도 하나, 또는 Gal4 UAS 작동유전자 서열을 포함하는 프로모터로 이루어진 군으로부터 선택되는, 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제3의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
D. 제4의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자, 제3의 안정적으로 통합된 핵산 분자를 포함하고, 제4의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 각각의 선택 카세트, 및 형광 단백질 마커(본 명세서에 기재된 바와 같음), 예컨대, EGFP를 암호화하는 핵산 서열을 포함하고, 각각의 핵산 서열은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 2개의 역위 말단 반복부(ITR)서열을 더 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 측접하는 2개의 역위 말단 반복부(ITR) 서열 및 위에 기재한 바와 같은 유전자를 포함하는 페이로드를 더 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다.
일부 실시형태에서, 위에 기재한 바와 같은 제4의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
VII. 염기 편집기를 포함하는 AAV 생산을 위한 조작된 세포를 이용하는 방법
일부 양상에서, 본 개시내용은 본 명세서에 기재된 바와 같이 화학적 유도성 프로모터에 작동 가능하게 연결된 염기 편집기 및/또는 sgRNA(들)를 포함하는 조작된 세포를 이용하여 AAV를 생산하는 방법을 제공한다. 일부 실시형태에서, 상기 방법은 AAV 전달을 위해 핵산 서열을 암호화하는 핵산 서열을 포함하는 조작된 세포를 이용하는 단계를 더 포함한다. 일부 실시형태에서, 상기 방법은 조작된 세포를 AAV 생산에 최적인 합류까지 성장시키는 단계를 포함한다. 최적의 합류는 조작된 세포가 유래된 세포 유형에 따를 것이다. 당업자는 AAV 생산의 최적 합류를 알거나 결정할 수 있다. 일부 실시형태에서, 상기 방법은 염기 편집기 또는 sgRNA(들)의 발현을 유도할 수 있는 소분자 유도물질과 조작된 세포를 접촉시키는 단계를 포함한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 또는 큐메이트이다. 일부 실시형태에서, 상기 방법은 당업자에게 잘 공지된 방법을 이용해서 조작된 세포의 배양물로부터 생산된 AAV를 채취하는 단계를 포함한다.
VIII. 조작된 세포
일부 양상에서, 본 개시내용은 조작된 세포(예를 들어, AAV 생산을 위해 조작된 세포)에 관한 것이다. 일부 실시형태에서, 조작된 세포는 알려진 또는 기존의 세포주로부터 유래된다. 일부 실시형태에서, 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 및 Sf9 세포로 이루어진 군으로부터 유래된다. 일부 실시형태에서, 조작된 세포는 본 명세서에 기재된 바와 같이 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 및 상기 유전자의 발현을 조절하기 위한 시스템을 포함한다. 일부 실시형태에서, 조작된 세포는 하나 이상의 핵산 분자(예를 들어, 1, 2, 3, 4, 5 또는 6개의 핵산 분자)의 안정적인 통합을 위한 게놈 부위를 포함한다. 핵산 분자의 안정적인 통합을 위한 이러한 게놈 부위는 당업자에게 잘 알려져 있다. 안정적인 통합을 위한 예시적인 부위는 AAVS1, ROSA26, CCR5, H11 및 LiPS-A3S를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 안정적으로 통합된 핵산 분자는 조작된 세포 게놈에 무작위로 통합된다.
IX. 키트
일부 양상에서, 본 개시내용은 파트 I 내지 II 및 V에서 본 명세서에 기재된 AAV 생산 시스템을 포함하는 키트에 관한 것이다.
일부 실시형태에서, 키트는 AAV 생산 시스템을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다.
일부 실시형태에서, 키트는 파트 III, VI 및 VIII에 기재된 조작된 세포를 포함한다.
일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
전달 폴리핵산의 중심 핵산은 다중 클로닝 부위의 핵산 서열을 포함할 수 있다. 예시적인 다중 클로닝 부위는 당업자에게 알려져 있다. 다중 클로닝 부위는 숙주 세포 내 바이러스 벡터의 생성 전에 전달 폴리핵산에 페이로드 분자(또는 관심 유전자) - 또는 페이로드 분자를 암호화하는 발현 카세트 - 를 클로닝하기 위해 사용될 수 있다.
일부 실시형태에서, 키트는 AAV 생산 시스템의 화학적 유도성 프로모터에 상응하는 소분자 유도물질을 더 포함한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트이다. 일부 실시형태에서, 키트는 세포의 사용을 위한 지침을 더 포함할 수 있다.
일부 실시형태에서, 키트는 조작된 세포를 포함하되, 조작된 세포는 선택 III 또는 선택 VI의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 키트는 프로모터의 핵산 서열에 작동 가능하게 연결된 전사 활성체의 핵산 서열을 포함하는 폴리핵산을 포함하되, 전사 활성체는, 소분자 유도물질의 존재 하에서 발현될 때, AAV 생산 시스템의 화학적 유도성 프로모터에 결합하고, 선택적으로 조작된 세포는 전사 활성체의 핵산 서열을 포함하는 폴리핵산을 포함한다. 일부 실시형태에서, 전사 활성체는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트 cTA 및 rcTA로 이루어진 군으로부터 선택된다.
실시예
실시예 1.
비표준 아미노산 AAV
접근법 및 유전자 도식의 설명:
조기 정지 코돈에서 비표준 아미노산(ncAA) 혼입의 사용은 독성 단백질보다 큰 대조군의 번역 수준을 제공한다. 비표준 아미노산의 존재에 대한 전형적인 발현은 전사 후 단백질 발현의 유도성 제어를 제공하며, 이는 전사체의 존재 하에서조차 표적 단백질의 발현이 매우 낮음/없음이어야 한다는 것을 의미한다. 아미노산 변화의 용인으로서 이전에 확인된 부위에서 TAG 정지 코돈을 도입함으로써 Rep78 및 Rep52 ncAA 정지 코돈 돌연변이체를 생성하였다. 이 시스템에서, 고세균 메타노사르시나 마제이로부터 유래된 직교성 전달 RNA(tRNA) 합성효소(pylRS) 및 이의 동족 tRNA(tRNApyl)를 사용해서 H-Lys(Boc)-OH, l-라이신 유도체를 Rep 단백질에 혼입하여 AAV 생산을 유도하였다.
실시예 2.
염기 편집기 AAV
접근법 및 유전자 도식의 설명:
HEK293T 생산자 계통에서 세포독성 유전자의 E1 활성화는 조기 정지 코돈으로 해당 유전자를 가역적으로 비활성화시킴으로써 피할 수 있다. 단백질 발현이 요망되는 경우, 아데닌 염기 편집기(ABE)는 표적화된 A-대-G 점 돌연변이를 수행하여 조기 정지 코돈을 암호화 아미노산으로 되돌릴 수 있다. 센스 가닥 상에서 트립토판(W) 코돈으로 이루어진 조기 정지 돌연변이는 DNA-기반 Cas9 ABE와 RNA-기반 Cas13 ABE 둘 다에 의해 되돌아갈 수 있다. 안티-센스 가닥 상에서, DNA-기반 Cas9 ABE는 글루타민(Q) 및 아르기닌 잔기로 이루어진 조기 정지 코돈을 되돌릴 수 있다. 안티-센스 가닥 상에서, DNA-기반 Cas9 CBE는 프롤린(P) 잔기로 만들어진 조기 정지 코돈을 되돌릴 수 있다.
Rep, E2A 및 E4에 도입된 조기 정지 코돈은 이러한 단백질의 발현을 방지하여, 감소된 AAV 역가, 개선된 세포 건강, 및 그에 따라 안정적인 AAV 생산자 세포를 만드는 개선된 능력을 초래한다는 가설을 세웠다. AAV의 생산이 요망되는 경우, ABE는 소분자로 처리 시 유도성 프로모터에 의해 발현될 수 있다. 예를 들어, 테트라사이클린 반응 구성요소(TRE)는 독시사이클린 및 역 테트라사이클린 트랜스작용인자(reverse tetracycline transactivator: rtTA)의 존재 하에 ABE의 발현을 유도할 수 있었다. RNA PolIII 프로모터, 예컨대 U6에 의해 ABE에 대한 단일 가이드 RNA를 구성적으로 발현시킨다.
표 3은 Rep, Cap, E2A, E4 및 L4 100K 암호화 서열로 이루어진 특정 돌연변이를 해당 돌연변이의 수선을 위한 가이드 서열과 함께 나타낸다. 아미노산 위치 넘버링은 표시한 CDS에 상응한다. 뉴클레오타이드 위치 넘버링은 2형 아데노바이러스(GenBank: J01917.1, NCBI: NC_001405.1) 및 2형 아데노-연관 바이러스(GenBank: AF043303.1, NCBI: NC_001401.2)의 완전한 게놈에 상응하며, 측접 염기가 맥락으로 제공된다. 추가적인 침묵 돌연변이는 조기 정지 코돈 근처에서 이루어져서 Cas9 ABE의 경우 PAM 서열을 도입하거나, 또는 ABE 편집 창 내에서 비표적 염기 편집을 감소시킬 수 있다.
실험에서, 조기 정지 돌연변이는 pRepCap 및 pHelper 표준 플라스미드로 이루어졌다(도 2). 이러한 변형된 플라스미드에 의해 일시적 형질감염에 의한 AAV의 생산을 수행하여 AAV 역가에 대한 조기 정지 코돈의 영향을 결정하였다. Rep 또는 Cap으로 이루어진 단일 돌연변이는 AAV 역가를 감소시키기에 충분하였다. Rep에 의해 이루어진 돌연변이는 ABE 및 단일 가이드 RNA 플라스미드의 공동 형질감염에 의한 AAV의 '야생형' 수준으로 회복될 수 있었다. E2A, E4ORF6 또는 L4 100K에 도입된 단일 돌연변이는 개개로 AAV 역가 단독을 감소시키기에 충분하지 않았지만, 돌연변이체의 조합은 더 큰 영향을 미쳤다. ABE 및 가이드 풀에 의해 공동 형질감염될 때, 해당 조합은 마찬가지로 AAV의 '야생형' 수준으로 회복될 수 있었다. 이런 결과는 독시사이클린의 존재 하에 AAV 역가의 유도성을 나타내는 안정적인 플라스미드 시스템(도 3)을 일시적으로 분석할 때 유지되었다.
예비 데이터 및 실험 설명:
부착 HEK293FT 세포를 EGFP-발현 전달 플라스미드, pRepCap, pHelper, ABE 플라스미드 및 단일 가이드 RNA 플라스미드로 공동 형질감염시켰다(도 2). pRepCap 또는 pHelper의 돌연변이체 변이체를 '야생형' 플라스미드로 대체하여 AAV 역가에 대한 이들의 영향을 시험하였다(도 4). ABE 및 대응하는 가이드를 공동 형질감염시켜 ABE가 바이러스 역가를 회복할 수 있는지의 여부를 결정하였다. ABE 및 가이드를 시험하지 않은 샘플에서, 비활성 플라스미드를 공동 형질감염시켜 형질감염된 DNA의 양을 동일하게 유지하였다. DNA 없이 '야생형' AAV2 pRepCap 및 pHelper 플라스미드 또는 음성 대조군 형질감염 혼합물만을 함유하는 대조군 샘플을 또한 준비하였다. 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 바이러스 저장액을 96-웰 플레이트에 플레이팅한 5e4 HEK293FT 세포에 10, 1 및 0.5㎕ 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
다음에, 부착 HEK293FT 세포를 pRepCap 또는 pHelper에서 조기 정지 돌연변이체의 조합으로 공동 형질감염시켜 AAV 역가에 대한 이들의 조합된 영향, 및 단일 가이드 RNA 플라스미드의 ABE 및 풀에 의해 회복되는 이들의 능력을 시험하였다(도 5). 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 바이러스 저장액을 1배, 10배 및 100배 연속 희석시키고, 10㎕의 얻어진 바이러스 저장액을 96-웰 플레이트에 플레이팅한 5e4 HEK293FT 세포에 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
완전한 안정적인 시스템의 실현 가능성을 분석하기 위해, 부착 HEK293FT 세포를 500nM 독시사이클린의 유무와 상관없이 완전한 안정적인 시스템의 조합으로 공동 형질감염시켜(도 3), 독시사이클린의 존재 하에 AAV를 유도하는 이들의 조합된 능력을 시험하였다(도 6). 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 10㎕ 및 1㎕의 얻어진 바이러스 저장액을 96-웰 플레이트에서 플레이팅한 5e4 HEK293FT 세포에 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
유도성 AAV 생산을 위해 현탁액 세포에서 유도성 ABE, 가이드의 구성적 풀 및 돌연변이체 Rep, Cap, E2A 또는 E4 ORF6의 조합물을 함유하는 안정적인 세포주를 생성할 것이다(도 3).
다른 실시형태
본 명세서에 개시된 모든 특징은 임의의 조합으로 조합될 수 있다. 본 명세서에 개시된 각 특징은 동일하거나, 동등하거나 또는 유사한 목적의 작용을 하는 대안의 특징으로 대체될 수 있다. 따라서, 달리 분명하게 언급되지 않는 한, 각각의 개시된 특징은 단지 일반적인 일련의 동등하거나 또는 유사한 특징의 예시이다.
위의 설명으로부터, 당업자는 본 개시내용의 필수 특징을 용이하게 확인할 수 있고, 이의 사상과 범주로부터 벗어나는 일 없이, 다양한 용도 및 조건에 적합하도록 본 개시내용의 다양한 변화 및 변형을 만들 수 있다. 따라서, 다양한 실시형태도 청구범위 내에 있다.
균등론
본 발명의 여러 실시형태를 기재하고 예시하였지만, 당업자는 기능을 수행하고/하거나 본 명세서에 기재된 결과 및/또는 하나 이상의 이점을 얻기 위한 다양한 수단 및/또는 구조를 용이하게 생각할 것이고, 각각의 이러한 변화 및/또는 변형은 본 명세서에 기재된 본 발명의 실시형태의 범주 이내인 것으로 여겨진다. 더 일반적으로는, 당업자는 본 명세서에 기재된 모든 파라미터, 치수, 물질 및 입체배치가 예시적인 것으로 의도되며, 실제 파라미터, 치수, 물질 및/또는 입체배치가 본 교시가 사용되는 특정 출원 또는 출원에 따를 것임을 용이하게 인식할 것이다. 당업자는 단지 일상적인 실험을 이용해서, 본 명세서에 기재된 구체적인 본 발명의 실시형태에 대한 다수의 균등물을 인식하고 확인할 수 있을 것이다. 따라서, 앞서 언급한 실시형태가 단지 예로서 제시되고, 첨부되는 청구범위 및 이에 대한 균등물의 범주 이내에서, 본 발명의 실시형태가 구체적으로 기재되고 특허청구되는 것과 다르게 실행될 수 있다는 것을 이해할 것이다. 본 개시내용의 본 발명의 실시형태는 본 명세서에 기재된 각각의 개개 특징, 시스템, 물품, 물질, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법이 상호 모순되지 않는 경우에, 둘 이상의 러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법의 임의의 조합은 본 개시내용의 본 범주 이내에 포함된다.
본 명세서에서 정의되고 사용되는 모든 정의는 사전의 정의, 참조에 의해 원용되는 문헌의 정의 및/또는 정의된 용어의 보통의 의미로 조절하는 것으로 이해되어야 한다.
본 명세서에 개시된 모든 참고문헌, 특허 및 특허 출원은 각각이 인용되는 대상에 대해 원용되며, 일부 경우에 이는 문헌 전체로 포함될 수 있다.
본 명세서 및 청구범위에 사용되는 바와 같은 분명히 규정되지 않은 단수 항목은, 달리 분명하게 반대로 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본 명세서 및 청구범위에서 사용되는 어구 "및/또는"은 이렇게 결합된 구성요소, 즉, 일부 경우에 결합하여 존재하고 다른 경우에 분리해서 존재하는 구성요소 중 "하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. "및/또는"과 함께 열거되는 다수의 구성요소는 동일한 방식, 즉, 이렇게 결합된 구성요소의 "하나 이상"으로 해석되어야 한다. 다른 구성요소는 구체적으로 확인된 해당 구성요소와 관련되든 관련되지 않든, "및/또는"에 의해 구체적으로 확인되는 구성요소 이외로 선택적으로 존재할 수 있다. 따라서, 비제한적 예로서, "A 및/또는 B"에 대한 언급은 "포함하는"과 같이 제약을 두지 않은 언어와 함께 사용될 때, 일 실시형태에서, A만을(선택적으로 B 이외의 구성요소를 포함) 지칭할 수 있고; 다른 실시형태에서, B만을(선택적으로 B 이외의 구성요소를 포함) 지칭하며; 또 다른 실시형태에서, A와 B 모두(선택적으로 다른 구성요소를 포함); 등을 지칭한다.
본 명세서 및 청구범위에 사용되는 바와 같이, "또는"은 위에 정의한 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리시킬 때, "또는" 또는 "및/또는"은 포괄적인 것, 즉, 적어도 하나를 포함할 뿐만 아니라 하나 초과의 수 또는 구성요소 목록 및 선택적으로 추가적인 열거되지 않은 항목을 포함하는 것으로 해석될 것이다. 분명하게 반대로 표시되는 유일한 용어, 예컨대, "~ 중 단지 하나" 또는 "~중 정확히 하나" 또는 청구범위에서 사용될 때 "~로 이루어진"은 구성요소의 수 또는 목록 중 정확히 하나의 포함을 지칭할 것이다. 일반적으로, 본 명세서에 사용되는 바와 같은 용어 "또는"은 "중 하나", "의 하나", "중 단지 하나" 또는 "중 정확히 하나"와 같이 배타성의 용어가 선행할 때, 배타적인 대안(즉, "하나 또는 다른 하나이지만, 둘 다는 아님")을 나타내는 것으로만 해석될 것이다. "본질적으로 이루어진"은 청구범위에서 사용될 때, 특허법 분야에서 사용되는 것과 같은 이의 보통의 의미를 가질 것이다.
하나 이상의 구성요소의 목록에 관해 본 명세서 및 청구범위에서 사용되는 바와 같은 어구 "적어도 하나"는 구성요소 목록에서 구성요소 중 어느 하나 이상으로부터 선택된 적어도 하나의 구성요소를 의미하지만, 구성요소 목록 내에 구체적으로 열거된 각각의 및 모든 구성요소 중 적어도 하나를 반드시 포함하지는 않고 구성요소 목록에서 구성요소의 임의의 조합을 제외하지는 않는 것으로 이해되어야 한다. 본 정의는 또한 구체적으로 확인된 해당 구성요소와 관련되는지 관련되든 관련되지 않든, 어구 "적어도 하나"가 지칭하는 구성요소의 목록 내에서 구체적으로 확인되는 구성요소 이외의 구성요소가 선택적으로 존재할 수 있다는 것을 허용한다. 따라서, 비제한적 예로서, "A 및 B 중 적어도 하나"(또는 동등하게는, "A 또는 B 중 적어도 하나" 또는 동등하게는 "A 및/또는 B 중 적어도 하나")는, 일 실시형태에서, B가 존재하지 않고(및 선택적으로 B 이외의 구성요소를 포함) 적어도 하나, 선택적으로 하나 초과의 A를 포함하는 것; 다른 실시형태에서, A가 존재하지 않고(선택적으로 A 이외의 구성요소를 포함) 적어도 하나, 선택적으로 하나 초과의 B를 포함하는 것; 또 다른 실시형태에서, 적어도 하나, 선택적으로 하나 초과의 A를 포함하고, 적어도 하나, 선택적으로 하나 초과의 B를 포함하는 것(선택적으로 다른 구성요소를 포함); 등을 지칭할 수 있다.
달리 반대로 분명하게 표시되지 않는 한, 하나 초과의 단계 또는 행동을 포함하는 본 명세서에 특허청구된 임의의 방법에서, 상기 방법의 단계 또는 행동의 순서는 상기 방법의 단계 또는 행동이 열거되는 순서로 반드시 제한되지 않는다는 것이 또한 이해되어야 한다.
청구범위뿐만 아니라 위의 명세서에서, 모든 이행적 어구, 예컨대, "포함하는(comprising)", "포함하는(including)", "지니는", "갖는", "함유하는", "수반하는", "보유하는", "구성된" 등은 제약을 두지 않은 것으로, 즉, 포함하지만, 이들로 제한되지 않는 것을 의미하는 것으로 이해된다. 이행적 어구 "이루어진" 및 "본질적으로 이루어진"은 미국 특허청 심사 절차 매뉴얼(United States Patent Office Manual of Patent Examining Procedures), 부문 2111.03에 제시된 바와 같이 각각 제한적인 또는 반-제한적인 이행 어구일 것이다. 제약을 두지 않은 이행 어구(예를 들어, "포함하는")를 이용하는 본 문헌에 기재된 실시형태가 또한, 대안의 실시형태에서, 제약을 두지 않은 이행 어구에 의해 기재된 특징으로 "이루어진" 및 "본질적으로 이루어진"으로 생각된다는 것이 인식되어야 한다. 예를 들어, 본 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 본 개시내용은 또한 "A 및 B로 이루어진 조성물" 및 "A 및 B로 본질적으로 이루어진 조성물"의 대안의 실시형태를 상정한다.
SEQUENCE LISTING <110> Asimov Inc. <120> STABLE PRODUCTION SYSTEMS FOR ADENO-ASSOCIATED VIRUS PRODUCTION <130> WO/2022/226189 <140> PCT/US2022/025755 <141> 2022-04-21 <150> US 63/177,760 <151> 2021-04-21 <160> 128 <170> PatentIn version 3.5 <210> 1 <211> 346 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 ctcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 60 tagagaacga tgtcgagttt actccctatc agtgatagag aacgtatgtc gagtttactc 120 cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 180 tcgagtttat ccctatcagt gatagagaac gtatgtcgag tttactccct atcagtgata 240 gagaacgtat gtcgaggtag gcgtgtacgg tgggaggcct atataagcag agctcgttta 300 gtgaaccgtc agatcgcctg gagaattcga gctcggtacc cgggga 346 <210> 2 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 gtttactccc tatcagtgat agagaacgta tgaagagttt actccctatc agtgatagag 60 aacgtatgca gactttactc cctatcagtg atagagaacg tataaggagt ttactcccta 120 tcagtgatag agaacgtatg accagtttac tccctatcag tgatagagaa cgtatctaca 180 gtttactccc tatcagtgat agagaacgta tatccagttt actccctatc agtgatagag 240 aacgtataag ctttaggcgt gtacggtggg cgcctataaa agcagagctc gtttagtgaa 300 ccgtcagatc gcctggagca attccacaac acttttgtct tataccaact ttccgtacca 360 cttcctaccc tcgtaaagtc gacaccgggg cccagatcta tcgatcggcc ggataacgcc 420 acc 423 <210> 3 <211> 496 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 gaattctcca ggcgatctga cggttcacta aacgagctct gcttatatag gcctcccacc 60 gtacacgcca cctcgacata ctcgagttta ctccctatca gtgatagaga acgtatgaag 120 agtttactcc ctatcagtga tagagaacgt atgcagactt tactccctat cagtgataga 180 gaacgtataa ggagtttact ccctatcagt gatagagaac gtatgaccag tttactccct 240 atcagtgata gagaacgtat ctacagttta ctccctatca gtgatagaga acgtatatcc 300 agtttactcc ctatcagtga tagagaacgt ataagcttta ggcgtgtacg gtgggcgcct 360 ataaaagcag agctcgttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt 420 tgtcttatac caactttccg taccacttcc taccctcgta aagtcgacac cggggcccag 480 atctccgcgg ggatcc 496 <210> 4 <211> 578 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 60 tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 120 gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 180 aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 240 aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 300 ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 360 cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 420 ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 480 cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 540 ggacgtggtt ttcctttgaa aaacacgatg ataatatg 578 <210> 5 <211> 571 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 60 atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 120 ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 180 tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 240 tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 300 agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 360 ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 420 atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 480 catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg gacgtggttt 540 tcctttgaaa aacacgatga taatagttat c 571 <210> 6 <211> 397 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 6 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 35 40 45 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 50 55 60 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 65 70 75 80 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 85 90 95 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 100 105 110 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 115 120 125 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 130 135 140 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 145 150 155 160 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 165 170 175 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 180 185 190 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 195 200 205 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 210 215 220 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 225 230 235 240 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 245 250 255 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 260 265 270 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 275 280 285 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 290 295 300 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 305 310 315 320 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 325 330 335 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 340 345 350 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 355 360 365 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 370 375 380 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 385 390 395 <210> 7 <211> 312 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 7 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 35 40 45 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 50 55 60 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 65 70 75 80 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 85 90 95 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 100 105 110 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 115 120 125 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 130 135 140 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 145 150 155 160 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 165 170 175 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 180 185 190 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 195 200 205 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 210 215 220 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 225 230 235 240 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 245 250 255 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 260 265 270 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 275 280 285 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 290 295 300 Arg Leu Ala Arg Gly His Ser Leu 305 310 <210> 8 <211> 621 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 8 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 9 <211> 536 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 9 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Leu Ala Arg Gly His Ser Leu 530 535 <210> 10 <211> 529 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 10 Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly 1 5 10 15 Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro 20 25 30 Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg 35 40 45 Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu 50 55 60 Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu 65 70 75 80 Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu 85 90 95 Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu 100 105 110 Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile 115 120 125 Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp 130 135 140 Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser 145 150 155 160 Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro 165 170 175 Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met 180 185 190 Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu 195 200 205 Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn 210 215 220 Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe 225 230 235 240 Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala 245 250 255 Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu 260 265 270 His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser 275 280 285 Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu 290 295 300 Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val 305 310 315 320 Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala 325 330 335 Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly 340 345 350 Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala 355 360 365 Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln 370 375 380 Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser 385 390 395 400 Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr 405 410 415 Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser 420 425 430 Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe 435 440 445 Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly 450 455 460 Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu 465 470 475 480 Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg 485 490 495 Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn 500 505 510 Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp 515 520 525 Phe <210> 11 <211> 294 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 11 Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg 1 5 10 15 Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro 20 25 30 Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu 35 40 45 Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly 50 55 60 Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro 65 70 75 80 Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys 85 90 95 Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met 100 105 110 Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser 115 120 125 Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp 130 135 140 Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp 145 150 155 160 Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met 165 170 175 Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp 180 185 190 Tyr Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr 195 200 205 Ser Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys 210 215 220 Ser Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg 225 230 235 240 Arg Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu 245 250 255 Thr Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln 260 265 270 Phe Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp 275 280 285 Tyr Asp Ser Thr Pro Met 290 <210> 12 <211> 888 <212> DNA <213> Unknown <220> <223> Adeno-associated virus <400> 12 atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60 cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120 atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caatgtttcc 180 tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240 tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300 ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360 gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420 ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480 taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540 atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600 gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660 gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720 aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780 ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840 caccgcccta tcctgatgca cgattatgac tctaccccca tgtagtaa 888 <210> 13 <211> 738 <212> DNA <213> Unknown <220> <223> Adeno-associated virus <400> 13 cgacgtaatc cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggaggcg 60 cgcggaaagt cgcggacgcg gttccagatg ttgcgcagcg gcaaaaagtg ctccatggtc 120 gggacgctct ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag 180 agcctgtaag cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg 240 gacgaccggg gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc 300 gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt 360 ccaggcgcgg cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg 420 ttaggctgga aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc 480 aagggttgag tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg 540 gggtttgcct ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag 600 cccctttttt gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag 660 cagcggcaag agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg 720 tcaggagggg caacatcc 738 <210> 14 <211> 735 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 14 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 15 <211> 598 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 15 Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro 1 5 10 15 Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys 20 25 30 Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro 35 40 45 Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn 50 55 60 Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly 65 70 75 80 Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr 85 90 95 Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu 100 105 110 Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly 115 120 125 Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 130 135 140 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 145 150 155 160 Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe 165 170 175 Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr 180 185 190 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 195 200 205 Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys 210 215 220 Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 225 230 235 240 Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr 245 250 255 Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe 260 265 270 Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala 275 280 285 His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr 290 295 300 Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln 305 310 315 320 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 325 330 335 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 340 345 350 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 355 360 365 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 370 375 380 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 385 390 395 400 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 405 410 415 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 420 425 430 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 435 440 445 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu 450 455 460 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 465 470 475 480 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 485 490 495 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys 500 505 510 Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys 515 520 525 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 530 535 540 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 545 550 555 560 Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr 565 570 575 Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 580 585 590 Tyr Leu Thr Arg Asn Leu 595 <210> 16 <211> 533 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 16 Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala 1 5 10 15 Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp 20 25 30 Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 35 40 45 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala 50 55 60 Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe 65 70 75 80 Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg 85 90 95 Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys 100 105 110 Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr 115 120 125 Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser 130 135 140 Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu 145 150 155 160 Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu 165 170 175 Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys 180 185 190 Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr 195 200 205 Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His 210 215 220 Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu 225 230 235 240 Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser 245 250 255 Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser 260 265 270 Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys 275 280 285 Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr 290 295 300 Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala 305 310 315 320 Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly 325 330 335 Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile 340 345 350 Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro 355 360 365 Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly 370 375 380 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 385 390 395 400 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 405 410 415 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 420 425 430 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 435 440 445 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 450 455 460 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 465 470 475 480 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 485 490 495 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 500 505 510 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 515 520 525 Leu Thr Arg Asn Leu 530 <210> 17 <211> 204 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 17 Leu Glu Thr Gln Thr Gln Tyr Leu Thr Pro Ser Leu Ser Asp Ser His 1 5 10 15 Gln Gln Pro Pro Leu Val Trp Glu Leu Ile Arg Trp Leu Gln Ala Val 20 25 30 Ala His Gln Trp Gln Thr Ile Thr Arg Ala Pro Thr Glu Trp Val Ile 35 40 45 Pro Arg Glu Ile Gly Ile Ala Ile Pro His Gly Trp Ala Thr Glu Ser 50 55 60 Ser Pro Pro Ala Pro Glu Pro Gly Pro Cys Pro Pro Thr Thr Thr Thr 65 70 75 80 Ser Thr Asn Lys Phe Pro Ala Asn Gln Glu Pro Arg Thr Thr Ile Thr 85 90 95 Thr Leu Ala Thr Ala Pro Leu Gly Gly Ile Leu Thr Ser Thr Asp Ser 100 105 110 Thr Ala Thr Phe His His Val Thr Gly Lys Asp Ser Ser Thr Thr Thr 115 120 125 Gly Asp Ser Asp Pro Arg Asp Ser Thr Ser Ser Ser Leu Thr Phe Lys 130 135 140 Ser Lys Arg Ser Arg Arg Met Thr Val Arg Arg Arg Leu Pro Ile Thr 145 150 155 160 Leu Pro Ala Arg Phe Arg Cys Leu Leu Thr Arg Ser Thr Ser Ser Arg 165 170 175 Thr Ser Ser Ala Arg Arg Ile Lys Asp Ala Ser Arg Arg Ser Gln Gln 180 185 190 Thr Ser Ser Trp Cys His Ser Met Asp Thr Ser Pro 195 200 <210> 18 <211> 19 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 18 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 19 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 19 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 20 <211> 454 <212> PRT <213> Methanosarcina mazeii <400> 20 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn 290 295 300 Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 21 <211> 454 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 21 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn 290 295 300 Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Phe 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 22 <211> 69 <212> DNA <213> Methanosarcina mazeii <400> 22 ggaaacctga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60 gggtttccg 69 <210> 23 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 agtcagtcac tagttgggca ggaagagggc ctatttccca tgattccttc atatttgcat 60 atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata 120 ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa 180 ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg 240 gctttatata tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg 300 actctaaatc cgttcagccg ggttagattc ccggggtttc cggacaagtg cggtttttcc 360 taggagtcag tc 372 <210> 24 <211> 1932 <212> DNA <213> Unknown <220> <223> Adeno-associated virus <400> 24 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 cactctctct ga 1932 <210> 25 <211> 1866 <212> DNA <213> Unknown <220> <223> Adeno-associated virus <400> 25 ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300 aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acatggaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 26 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300 aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 27 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300 aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 28 <211> 1949 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60 ttgacgagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120 gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180 tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240 aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300 tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360 aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420 caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480 attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540 atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600 acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660 tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720 ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780 cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840 gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900 gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960 tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020 ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080 ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140 tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200 gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260 ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320 tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380 atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440 atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500 ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560 catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620 ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680 agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740 cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800 atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860 atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920 ccagattggc tcgaggacac tctctctga 1949 <210> 29 <211> 1949 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60 ttgactagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120 gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180 tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240 aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300 tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360 aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420 caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480 attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540 atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600 acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660 tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720 ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780 cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840 gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900 gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960 tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020 ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080 ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140 tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200 gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260 ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320 tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380 atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440 atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500 ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560 catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620 ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680 agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740 cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800 atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860 atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920 ccagattggc tcgaggacac tctctctga 1949 <210> 30 <211> 3648 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 gccgccacca tggaattagt gggctggttg gtcgataaag gcatcacaag cgaaaaacaa 60 tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120 cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180 gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240 ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300 aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360 aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420 gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480 atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540 gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600 acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660 caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720 acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780 cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840 atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900 gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960 ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020 acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080 gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140 gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200 tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740 accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800 atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860 gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920 ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980 tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040 agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100 agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160 acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220 gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280 tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340 agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400 cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460 ctcgttggct ggctggtgga caagggcatc acaagcgaga agcagtggat ccaagaggac 2520 caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580 ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640 cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700 tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760 cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820 atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880 aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940 gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000 tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060 gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120 aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180 aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240 aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300 cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360 gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420 tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480 gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540 taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600 tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648 <210> 31 <211> 3648 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60 tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120 cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180 gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240 ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300 aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360 aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420 gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480 atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540 gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600 acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660 caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720 acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780 cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840 atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900 gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960 ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020 acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080 gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140 gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200 tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740 accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800 atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860 gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920 ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980 tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040 agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100 agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160 acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220 gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280 tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340 agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400 cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460 ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520 caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580 ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640 cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700 tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760 cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820 atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880 aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940 gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000 tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060 gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120 aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180 aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240 aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300 cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360 gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420 tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480 gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540 taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600 tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648 <210> 32 <211> 3648 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60 tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120 cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180 gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240 ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300 aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360 aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420 gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480 atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540 gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600 acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660 caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720 acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780 cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840 atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900 gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960 ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020 acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080 gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140 gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200 tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740 accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800 atcgtgatca aggtgcccag cgacctggac tagcatctgc ctggcatcag cgacagcttc 1860 gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920 ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980 tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040 agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100 agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160 acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220 gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280 tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340 agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400 cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460 ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520 caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580 ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640 cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700 tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760 cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820 atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880 aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940 gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000 tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060 gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120 aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180 aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240 aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300 cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360 gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420 tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480 gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540 taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600 tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648 <210> 33 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300 aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 34 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 34 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Gly Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln 225 230 235 240 Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser 245 250 255 Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 530 535 540 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 545 550 555 560 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 565 570 575 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 580 585 590 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 595 600 605 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 35 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300 aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acggagaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 36 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 36 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys 20 25 30 Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu 35 40 45 Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr 50 55 60 Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln 65 70 75 80 Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr 85 90 95 Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg 100 105 110 Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro 115 120 125 Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn 130 135 140 Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr 145 150 155 160 Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser 165 170 175 Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu 180 185 190 Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro 195 200 205 Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly 210 215 220 Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln 225 230 235 240 Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser 245 250 255 Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 530 535 540 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 545 550 555 560 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 565 570 575 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 580 585 590 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 595 600 605 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 37 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60 ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120 agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180 agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240 cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300 aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360 taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420 gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480 acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540 aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600 gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660 agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720 cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780 tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840 cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900 atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960 accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020 accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080 aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140 aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200 gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260 aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320 ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380 gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440 gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500 gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560 gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620 aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680 ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740 tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800 cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860 cagtga 1866 <210> 38 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 38 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys 20 25 30 Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu 35 40 45 Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr 50 55 60 Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln 65 70 75 80 Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr 85 90 95 Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg 100 105 110 Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro 115 120 125 Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn 130 135 140 Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr 145 150 155 160 Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser 165 170 175 Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu 180 185 190 Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro 195 200 205 Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly 210 215 220 Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln Trp 225 230 235 240 Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn 245 250 255 Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met 260 265 270 Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val 275 280 285 Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly 290 295 300 Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys 305 310 315 320 Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr 325 330 335 Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr 340 345 350 Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val 355 360 365 Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val 370 375 380 Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp 385 390 395 400 Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val 405 410 415 Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr 420 425 430 Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu 435 440 445 Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val 450 455 460 Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu His 465 470 475 480 Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser 485 490 495 Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln 500 505 510 Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr 515 520 525 Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro 530 535 540 Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr 545 550 555 560 His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln 565 570 575 Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His 580 585 590 His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val 595 600 605 Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 <210> 39 <211> 528 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 39 Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly 1 5 10 15 Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro 20 25 30 Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg 35 40 45 Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu 50 55 60 Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu 65 70 75 80 Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu 85 90 95 Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu 100 105 110 Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile 115 120 125 Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp 130 135 140 Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser 145 150 155 160 Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro 165 170 175 Ile Val Ser Ala Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met Asp 180 185 190 Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu Pro 195 200 205 Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn Glu 210 215 220 Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe Val 225 230 235 240 Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala Glu 245 250 255 Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu His 260 265 270 Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser Ile 275 280 285 Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu Asn 290 295 300 Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val Lys 305 310 315 320 Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala Arg 325 330 335 Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys 340 345 350 Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe 355 360 365 Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr 370 375 380 Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys 385 390 395 400 Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro 405 410 415 Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp 420 425 430 Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln 435 440 445 Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro 450 455 460 Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val 465 470 475 480 Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met 485 490 495 Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val 500 505 510 Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe 515 520 525 <210> 40 <211> 528 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 40 Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly 1 5 10 15 Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro 20 25 30 Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg 35 40 45 Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu 50 55 60 Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu 65 70 75 80 Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu 85 90 95 Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu 100 105 110 Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile 115 120 125 Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp 130 135 140 Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser 145 150 155 160 Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro 165 170 175 Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met 180 185 190 Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu 195 200 205 Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn 210 215 220 Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe 225 230 235 240 Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala 245 250 255 Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu 260 265 270 His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser 275 280 285 Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu 290 295 300 Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val 305 310 315 320 Lys Asn Arg Gly Arg Asn Val Val Val Ile Ser Asn Thr Asp Ala Arg 325 330 335 Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys 340 345 350 Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe 355 360 365 Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr 370 375 380 Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys 385 390 395 400 Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro 405 410 415 Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp 420 425 430 Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln 435 440 445 Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro 450 455 460 Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val 465 470 475 480 Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met 485 490 495 Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val 500 505 510 Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe 515 520 525 <210> 41 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 41 Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg 1 5 10 15 Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro 20 25 30 Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu 35 40 45 Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly 50 55 60 Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Val Val Pro Trp 65 70 75 80 Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys Met 85 90 95 His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met Met 100 105 110 Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser Pro 115 120 125 Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp Phe 130 135 140 Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp Tyr 145 150 155 160 Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met Ser 165 170 175 Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp Tyr 180 185 190 Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser 195 200 205 Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser 210 215 220 Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg 225 230 235 240 Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr 245 250 255 Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe 260 265 270 Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr 275 280 285 Asp Ser Thr Pro Met 290 <210> 42 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 42 Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg 1 5 10 15 Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro 20 25 30 Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu 35 40 45 Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly 50 55 60 Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro 65 70 75 80 Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys 85 90 95 Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met 100 105 110 Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser 115 120 125 Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp 130 135 140 Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp 145 150 155 160 Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met 165 170 175 Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Tyr 180 185 190 Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser 195 200 205 Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser 210 215 220 Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg 225 230 235 240 Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr 245 250 255 Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe 260 265 270 Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr 275 280 285 Asp Ser Thr Pro Met 290 <210> 43 <211> 396 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 43 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 35 40 45 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 50 55 60 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 65 70 75 80 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 85 90 95 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 100 105 110 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 115 120 125 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 130 135 140 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 145 150 155 160 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 165 170 175 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 180 185 190 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 195 200 205 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 210 215 220 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 225 230 235 240 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 245 250 255 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 260 265 270 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 275 280 285 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 290 295 300 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 305 310 315 320 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 325 330 335 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 340 345 350 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 355 360 365 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 370 375 380 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 385 390 395 <210> 44 <211> 311 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 44 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 35 40 45 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 50 55 60 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 65 70 75 80 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 85 90 95 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 100 105 110 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 115 120 125 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 130 135 140 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 145 150 155 160 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 165 170 175 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 180 185 190 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 195 200 205 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 210 215 220 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 225 230 235 240 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 245 250 255 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 260 265 270 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 275 280 285 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 290 295 300 Leu Ala Arg Gly His Ser Leu 305 310 <210> 45 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 45 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 530 535 540 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 545 550 555 560 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 565 570 575 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 580 585 590 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 595 600 605 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 46 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 46 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Leu Ala Arg Gly His Ser Leu 530 535 <210> 47 <211> 396 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 35 40 45 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 50 55 60 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 65 70 75 80 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr 85 90 95 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 100 105 110 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 115 120 125 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 130 135 140 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 145 150 155 160 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 165 170 175 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 180 185 190 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 195 200 205 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 210 215 220 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 225 230 235 240 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 245 250 255 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 260 265 270 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 275 280 285 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 290 295 300 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 305 310 315 320 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 325 330 335 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 340 345 350 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 355 360 365 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 370 375 380 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 385 390 395 <210> 48 <211> 311 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 48 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 35 40 45 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 50 55 60 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 65 70 75 80 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr 85 90 95 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 100 105 110 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 115 120 125 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 130 135 140 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 145 150 155 160 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 165 170 175 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 180 185 190 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 195 200 205 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 210 215 220 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 225 230 235 240 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 245 250 255 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 260 265 270 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 275 280 285 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 290 295 300 Leu Ala Arg Gly His Ser Leu 305 310 <210> 49 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 49 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 530 535 540 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 545 550 555 560 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 565 570 575 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 580 585 590 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 595 600 605 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 50 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 50 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Leu Ala Arg Gly His Ser Leu 530 535 <210> 51 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 51 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln 65 70 75 80 Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr 85 90 95 Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg 100 105 110 Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro 115 120 125 Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn 130 135 140 Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr 145 150 155 160 Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser 165 170 175 Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu 180 185 190 Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro 195 200 205 Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met 210 215 220 Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln 225 230 235 240 Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser 245 250 255 Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe 530 535 540 Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe 545 550 555 560 Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser 565 570 575 Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile 580 585 590 His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu 595 600 605 Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 52 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 52 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln 65 70 75 80 Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr 85 90 95 Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg 100 105 110 Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro 115 120 125 Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn 130 135 140 Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr 145 150 155 160 Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser 165 170 175 Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu 180 185 190 Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro 195 200 205 Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met 210 215 220 Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln 225 230 235 240 Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser 245 250 255 Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile 260 265 270 Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro 275 280 285 Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn 290 295 300 Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr 305 310 315 320 Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr 325 330 335 Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe 340 345 350 Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys 355 360 365 Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys 370 375 380 Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val 385 390 395 400 Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile 405 410 415 Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr 420 425 430 Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu 435 440 445 Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu 450 455 460 Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu 465 470 475 480 His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro 485 490 495 Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala 500 505 510 Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg 515 520 525 Leu Ala Arg Gly His Ser Leu 530 535 <210> 53 <211> 1932 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 agctaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 cactctctct ga 1932 <210> 54 <211> 1932 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggataggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 cactctctct ga 1932 <210> 55 <211> 1932 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggagta gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 cactctctct ga 1932 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 tgcgtaggag aagggcatgg 20 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 ccggtagggc cgaaatgtgg 20 <210> 58 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 atgagttgtt ccctgggata 20 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 cttgtagtat gatggccacg 20 <210> 60 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 cgtgtagcag caatgcctgg 20 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 actgaggatt ccgacccaag 20 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 gccttatgtg ttgacatctg 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 ggagtagcgc cgtgtgagta 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 gatttagctc cgcgagttgg 20 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 ggataggcca cgaaaaagtt 20 <210> 66 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 cttctcccac gcagacacga tcggcaggct 30 <210> 67 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 tcggccccac cggttcttca cgatcttggc 30 <210> 68 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 gaacaaccca ttcctgaatc agcgtaaatc 30 <210> 69 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 atcataccac aagcgcaggt agattaagtg 30 <210> 70 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 ttgctgccac acgcccatgg ccgtttgcca 30 <210> 71 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 ggaatcccca gttgttgttg atgagtcttt 30 <210> 72 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 acggcgccac tccgtcagaa agtcgcgctg 30 <210> 73 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 cgtggcccat cccagaaaga cggaagccgc 30 <210> 74 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 ctccatgccc ttctcccacg cagacacgat cggcaggctc agcgggttta 50 <210> 75 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 caccacattt cggccccacc ggttcttcac gatcttggcc ttgctagact 50 <210> 76 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 tatcccaggg aacaacccat tcctgaatca gcgtaaatcc cacactgcag 50 <210> 77 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca 50 <210> 78 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 ctccaggcat tgctgccaca cgcccatggc cgtttgccag gtgtagcaca 50 <210> 79 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 tcttgggtcg gaatccccag ttgttgttga tgagtctttg ccagtcacgt 50 <210> 80 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 cttactcaca cggcgccact ccgtcagaaa gtcgcgctgc agcttctcgg 50 <210> 81 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 gaactttttc gtggcccatc ccagaaagac ggaagccgca tattggggat 50 <210> 82 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 82 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 83 <211> 1588 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 83 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 35 40 45 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Trp Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 195 200 205 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 210 215 220 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 225 230 235 240 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 245 250 255 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 260 265 270 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 275 280 285 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 290 295 300 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 305 310 315 320 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 325 330 335 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 340 345 350 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 355 360 365 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 370 375 380 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 385 390 395 400 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 405 410 415 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 420 425 430 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 435 440 445 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 450 455 460 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 465 470 475 480 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 485 490 495 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 500 505 510 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 515 520 525 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 530 535 540 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 545 550 555 560 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 565 570 575 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 580 585 590 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 595 600 605 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 610 615 620 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 625 630 635 640 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 645 650 655 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 660 665 670 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 675 680 685 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 690 695 700 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 705 710 715 720 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 725 730 735 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 740 745 750 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 755 760 765 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 770 775 780 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 785 790 795 800 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 805 810 815 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 820 825 830 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 835 840 845 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 850 855 860 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 865 870 875 880 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 885 890 895 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 900 905 910 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 915 920 925 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 930 935 940 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 945 950 955 960 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 965 970 975 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 980 985 990 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 995 1000 1005 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp 1010 1015 1020 Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His 1025 1030 1035 Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys 1040 1045 1050 Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val 1055 1060 1065 Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln 1070 1075 1080 Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu 1085 1090 1095 Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly 1100 1105 1110 Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His 1115 1120 1125 Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 1130 1135 1140 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 1145 1150 1155 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 1160 1165 1170 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 1175 1180 1185 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1190 1195 1200 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1205 1210 1215 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1220 1225 1230 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1235 1240 1245 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1250 1255 1260 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1265 1270 1275 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1280 1285 1290 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1295 1300 1305 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1310 1315 1320 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1325 1330 1335 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1340 1345 1350 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1355 1360 1365 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1370 1375 1380 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1385 1390 1395 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1400 1405 1410 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1415 1420 1425 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1430 1435 1440 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1445 1450 1455 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1460 1465 1470 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1475 1480 1485 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1490 1495 1500 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1505 1510 1515 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1520 1525 1530 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1535 1540 1545 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1550 1555 1560 Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu 1565 1570 1575 Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1580 1585 <210> 84 <211> 1495 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 84 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn 145 150 155 160 Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr 165 170 175 Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val 180 185 190 Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu 290 295 300 Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys 485 490 495 Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu 500 505 510 Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn 690 695 700 Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg 785 790 795 800 Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr 930 935 940 Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu 1010 1015 1020 Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn 1025 1030 1035 Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu 1055 1060 1065 Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu 1085 1090 1095 Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His 1100 1105 1110 Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly 1115 1120 1125 Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg 1130 1135 1140 Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val 1145 1150 1155 Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Thr Lys Cys Ile 1160 1165 1170 Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys 1175 1180 1185 His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr 1190 1195 1200 Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg 1205 1210 1215 Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu 1220 1225 1230 Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp 1235 1240 1245 Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala 1250 1255 1260 Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys 1265 1270 1275 Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser 1280 1285 1290 Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr 1295 1300 1305 Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile 1310 1315 1320 Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser 1325 1330 1335 Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg 1340 1345 1350 Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu 1355 1360 1365 Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu 1370 1375 1380 Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr 1385 1390 1395 Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys 1400 1405 1410 Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr 1415 1420 1425 Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu 1430 1435 1440 Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu 1445 1450 1455 Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala 1460 1465 1470 Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu 1475 1480 1485 Gln Asp Gln Phe Ser Leu Thr 1490 1495 <210> 85 <211> 1495 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 85 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn 145 150 155 160 Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr 165 170 175 Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val 180 185 190 Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu 290 295 300 Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys 485 490 495 Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu 500 505 510 Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn 690 695 700 Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg 785 790 795 800 Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr 930 935 940 Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu 1010 1015 1020 Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn 1025 1030 1035 Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu 1055 1060 1065 Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu 1085 1090 1095 Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His 1100 1105 1110 Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly 1115 1120 1125 Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg 1130 1135 1140 Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val 1145 1150 1155 Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Gly Lys Cys Ile 1160 1165 1170 Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys 1175 1180 1185 His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr 1190 1195 1200 Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg 1205 1210 1215 Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu 1220 1225 1230 Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp 1235 1240 1245 Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala 1250 1255 1260 Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys 1265 1270 1275 Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser 1280 1285 1290 Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr 1295 1300 1305 Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile 1310 1315 1320 Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser 1325 1330 1335 Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg 1340 1345 1350 Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu 1355 1360 1365 Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu 1370 1375 1380 Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr 1385 1390 1395 Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys 1400 1405 1410 Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr 1415 1420 1425 Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu 1430 1435 1440 Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu 1445 1450 1455 Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala 1460 1465 1470 Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu 1475 1480 1485 Gln Asp Gln Phe Ser Leu Thr 1490 1495 <210> 86 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 attggatcca at 12 <210> 87 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 tatttacaaa caaccatgaa tgtaagta 28 <210> 88 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 cggagtactg tcctccga 18 <210> 89 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 atgatacgaa acgtaccgta tcgttaaggt 30 <210> 90 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 90 agaaacaaac caacctgtct gtatta 26 <210> 91 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 aacaaacaga caatctggtc tgtttgta 28 <210> 92 <211> 248 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 92 Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu 1 5 10 15 Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln 20 25 30 Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys 35 40 45 Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His His 50 55 60 Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg 65 70 75 80 Asn Asn Ala Lys Ser Phe Arg Cys Ala Leu Leu Ser His Arg Asp Gly 85 90 95 Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr 100 105 110 Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu 115 120 125 Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys 130 135 140 Val Leu Glu Asp Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr 145 150 155 160 Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu 165 170 175 Phe Asp His Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu 180 185 190 Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Gly Pro 195 200 205 Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala 210 215 220 Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp 225 230 235 240 Phe Asp Leu Asp Met Leu Pro Gly 245 <210> 93 <211> 298 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 93 Met Asp Met Pro Arg Ile Lys Pro Gly Gln Arg Val Met Met Ala Leu 1 5 10 15 Arg Lys Met Ile Ala Ser Gly Glu Ile Lys Ser Gly Glu Arg Ile Ala 20 25 30 Glu Ile Pro Thr Ala Ala Ala Leu Gly Val Ser Arg Met Pro Val Arg 35 40 45 Ile Ala Leu Arg Ser Leu Glu Gln Glu Gly Leu Val Val Arg Leu Gly 50 55 60 Ala Arg Gly Tyr Ala Ala Arg Gly Val Ser Ser Asp Gln Ile Arg Asp 65 70 75 80 Ala Ile Glu Val Arg Gly Val Leu Glu Gly Phe Ala Ala Arg Arg Leu 85 90 95 Ala Glu Arg Gly Met Thr Ala Glu Thr His Ala Arg Phe Val Val Leu 100 105 110 Ile Ala Glu Gly Glu Ala Leu Phe Ala Ala Gly Arg Leu Asn Gly Glu 115 120 125 Asp Leu Asp Arg Tyr Ala Ala Tyr Asn Gln Ala Phe His Asp Thr Leu 130 135 140 Val Ser Ala Ala Gly Asn Gly Ala Val Glu Ser Ala Leu Ala Arg Asn 145 150 155 160 Gly Phe Glu Pro Phe Ala Ala Ala Gly Ala Leu Ala Leu Asp Leu Met 165 170 175 Asp Leu Ser Ala Glu Tyr Glu His Leu Leu Ala Ala His Arg Gln His 180 185 190 Gln Ala Val Leu Asp Ala Val Ser Cys Gly Asp Ala Glu Gly Ala Glu 195 200 205 Arg Ile Met Arg Asp His Ala Leu Ala Ala Ile Arg Asn Ala Lys Val 210 215 220 Phe Glu Ala Ala Ala Ser Ala Gly Ala Pro Leu Gly Ala Ala Trp Ser 225 230 235 240 Ile Arg Ala Asp Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp 245 250 255 Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu 260 265 270 Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 275 280 285 Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 290 295 <210> 94 <211> 264 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 94 Met Val Arg Arg Thr Lys Glu Glu Ala Gln Glu Thr Arg Ala Gln Ile 1 5 10 15 Ile Glu Ala Ala Glu Arg Ala Phe Tyr Lys Arg Gly Val Ala Arg Thr 20 25 30 Thr Leu Ala Asp Ile Ala Glu Leu Ala Gly Val Thr Arg Gly Ala Ile 35 40 45 Tyr Trp His Phe Asn Asn Lys Ala Glu Leu Val Gln Ala Leu Leu Asp 50 55 60 Ser Leu His Glu Thr His Asp His Leu Ala Arg Ala Ser Glu Ser Glu 65 70 75 80 Asp Glu Val Asp Pro Leu Gly Cys Met Arg Lys Leu Leu Leu Gln Val 85 90 95 Phe Asn Glu Leu Val Leu Asp Ala Arg Thr Arg Arg Ile Asn Glu Ile 100 105 110 Leu His His Lys Cys Glu Phe Thr Asp Asp Met Cys Glu Ile Arg Gln 115 120 125 Gln His Gln Ser Ala Val Leu Asp Cys His Lys Gly Ile Thr Leu Thr 130 135 140 Leu Ala Asn Val Val Arg Arg Gly Gln Leu Pro Gly Glu Leu Asp Ala 145 150 155 160 Glu Arg Ala Ala Val Ala Met Phe Ala Tyr Val Asp Gly Leu Ile Arg 165 170 175 Arg Trp Leu Leu Leu Pro Asp Ser Val Asp Leu Leu Gly Asp Val Glu 180 185 190 Lys Trp Val Asp Thr Gly Leu Asp Met Leu Arg Leu Ser Pro Ala Leu 195 200 205 Arg Lys Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp 210 215 220 Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met 225 230 235 240 Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly 245 250 255 Pro Pro Lys Lys Lys Arg Lys Val 260 <210> 95 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 95 Met Ala Arg Thr Pro Ser Arg Ser Ser Ile Gly Ser Leu Arg Ser Pro 1 5 10 15 His Thr His Lys Ala Ile Leu Thr Ser Thr Ile Glu Ile Leu Lys Glu 20 25 30 Cys Gly Tyr Ser Gly Leu Ser Ile Glu Ser Val Ala Arg Arg Ala Gly 35 40 45 Ala Gly Lys Pro Thr Ile Tyr Arg Trp Trp Thr Asn Lys Ala Ala Leu 50 55 60 Ile Ala Glu Val Tyr Glu Asn Glu Ile Glu Gln Val Arg Lys Phe Pro 65 70 75 80 Asp Leu Gly Ser Phe Lys Ala Asp Leu Asp Phe Leu Leu His Asn Leu 85 90 95 Trp Lys Val Trp Arg Glu Thr Ile Cys Gly Glu Ala Phe Arg Cys Val 100 105 110 Ile Ala Glu Ala Gln Leu Asp Pro Val Thr Leu Thr Gln Leu Lys Asp 115 120 125 Gln Phe Met Glu Arg Arg Arg Glu Ile Pro Lys Lys Leu Val Glu Asp 130 135 140 Ala Ile Ser Asn Gly Glu Leu Pro Lys Asp Ile Asn Arg Glu Leu Leu 145 150 155 160 Leu Asp Met Ile Phe Gly Phe Cys Trp Tyr Arg Leu Leu Thr Glu Gln 165 170 175 Leu Thr Val Glu Gln Asp Ile Glu Glu Phe Thr Phe Leu Leu Ile Asn 180 185 190 Gly Val Cys Pro Gly Thr Gln Cys Ser Gly Gly Gly Gly Pro Thr Asp 195 200 205 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 210 215 220 Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp 225 230 235 240 Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys Val 245 250 <210> 96 <211> 257 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 96 Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met Glu Thr Gln 1 5 10 15 Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu Lys Gly Tyr 20 25 30 Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly Val Ser Arg 35 40 45 Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu Leu Leu Ala 50 55 60 Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser Arg Ala Arg 65 70 75 80 Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln Met Leu Asp 85 90 95 Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile Gly Leu Asp 100 105 110 Leu Ile Val Ala Ala Asp Arg Asp Pro Ala Leu Arg Glu Gly Ile Gln 115 120 125 Arg Thr Val Glu Arg Asn Arg Phe Val Val Glu Asp Met Trp Leu Gly 130 135 140 Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu Asp Ile Leu 145 150 155 160 Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg Ser Leu Trp 165 170 175 Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser Thr Leu Glu 180 185 190 Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly Gly Gly Gly 195 200 205 Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 210 215 220 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp 225 230 235 240 Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys 245 250 255 Val <210> 97 <211> 641 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 97 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln Met Ile Ile 610 615 620 Arg Tyr Gly Cys Arg Trp Leu Ser Ser Arg Leu Ala Arg Gly His Ser 625 630 635 640 Leu <210> 98 <211> 804 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 98 Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe 1 5 10 15 Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro 20 25 30 Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp 35 40 45 Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu 50 55 60 Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val 65 70 75 80 Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp 85 90 95 Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala 100 105 110 Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu 115 120 125 Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln 130 135 140 Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val 145 150 155 160 Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn 165 170 175 Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys 180 185 190 Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu 195 200 205 Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg 210 215 220 Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys 225 230 235 240 Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu 245 250 255 Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu 260 265 270 Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg 275 280 285 Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu 290 295 300 Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr 305 310 315 320 Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala 325 330 335 Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp 340 345 350 Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg 355 360 365 Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys 370 375 380 Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln 385 390 395 400 Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val 405 410 415 Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met 420 425 430 Gly Val Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln Lys 435 440 445 Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu Arg 450 455 460 Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu Leu 465 470 475 480 Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met Leu 485 490 495 Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro Ala 500 505 510 Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg Glu 515 520 525 Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala Asn 530 535 540 Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp Gly 545 550 555 560 Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg Ser 565 570 575 Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly Thr 580 585 590 Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro Gly 595 600 605 Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys Phe 610 615 620 Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp Gln 625 630 635 640 Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln Gly 645 650 655 His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu Phe 660 665 670 Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly Glu 675 680 685 Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro Arg 690 695 700 Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala Ala 705 710 715 720 Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg Gly 725 730 735 Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro Arg 740 745 750 Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr Leu 755 760 765 Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser Gln 770 775 780 His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys Ser 785 790 795 800 Pro Thr Gln Pro <210> 99 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 99 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Gly 290 295 300 Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys 305 310 315 320 Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr 325 330 335 Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val 340 345 350 Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val 355 360 365 Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln 370 375 380 Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 385 390 395 400 Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu Asp 405 410 415 Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu 420 425 430 Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Asn 435 440 445 Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln Ala 450 455 460 Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro 465 470 475 480 Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn 485 490 495 Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg 500 505 510 Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp 515 520 525 Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln 530 535 540 Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp 545 550 555 560 Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly 565 570 575 Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala 580 585 590 Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg 595 600 605 Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu 675 680 685 Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn 690 695 700 Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser 705 710 715 720 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 100 <211> 597 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 100 Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro 1 5 10 15 Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys 20 25 30 Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro 35 40 45 Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn 50 55 60 Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly 65 70 75 80 Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr 85 90 95 Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu 100 105 110 Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly 115 120 125 Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 130 135 140 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 145 150 155 160 Arg Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys 165 170 175 Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr 180 185 190 Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser 195 200 205 Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu 210 215 220 Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu 225 230 235 240 Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys 245 250 255 Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr 260 265 270 Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His 275 280 285 Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu 290 295 300 Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser 305 310 315 320 Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser 325 330 335 Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys 340 345 350 Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr 355 360 365 Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala 370 375 380 Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly 385 390 395 400 Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile 405 410 415 Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro 420 425 430 Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly 435 440 445 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro 450 455 460 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 465 470 475 480 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 485 490 495 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 500 505 510 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 515 520 525 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 530 535 540 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 545 550 555 560 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 565 570 575 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 580 585 590 Leu Thr Arg Asn Leu 595 <210> 101 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 101 Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala 1 5 10 15 Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp 20 25 30 Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 35 40 45 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala 50 55 60 Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe 65 70 75 80 Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg 85 90 95 Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu 100 105 110 Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr 115 120 125 Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu 130 135 140 Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro 145 150 155 160 Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr 165 170 175 Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu 180 185 190 Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe 195 200 205 Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser 210 215 220 Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr 225 230 235 240 Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg 245 250 255 Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg 260 265 270 Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr 275 280 285 Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys 290 295 300 Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met 305 310 315 320 Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val 325 330 335 Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu 340 345 350 Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val 355 360 365 Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn 370 375 380 Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly 385 390 395 400 Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala 405 410 415 Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly 420 425 430 Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr 435 440 445 Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala 450 455 460 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu 465 470 475 480 Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 485 490 495 Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp 500 505 510 Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 515 520 525 Thr Arg Asn Leu 530 <210> 102 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 102 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg 595 600 605 Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu 675 680 685 Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn 690 695 700 Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser 705 710 715 720 Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 103 <211> 597 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 103 Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro 1 5 10 15 Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys 20 25 30 Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro 35 40 45 Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn 50 55 60 Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly 65 70 75 80 Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr 85 90 95 Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu 100 105 110 Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly 115 120 125 Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 130 135 140 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 145 150 155 160 Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe 165 170 175 Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr 180 185 190 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 195 200 205 Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys 210 215 220 Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 225 230 235 240 Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr 245 250 255 Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe 260 265 270 Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala 275 280 285 His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr 290 295 300 Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln 305 310 315 320 Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln 325 330 335 Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 340 345 350 Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala 355 360 365 Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro 370 375 380 Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser 385 390 395 400 Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp 405 410 415 Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn 420 425 430 Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg 435 440 445 Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro 450 455 460 Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 465 470 475 480 Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met 485 490 495 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn 500 505 510 Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe 515 520 525 Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile 530 535 540 Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 545 550 555 560 Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val 565 570 575 Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr 580 585 590 Leu Thr Arg Asn Leu 595 <210> 104 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 104 Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala 1 5 10 15 Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp 20 25 30 Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 35 40 45 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala 50 55 60 Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe 65 70 75 80 Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg 85 90 95 Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys 100 105 110 Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr 115 120 125 Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser 130 135 140 Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu 145 150 155 160 Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu 165 170 175 Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys 180 185 190 Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr 195 200 205 Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His 210 215 220 Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu 225 230 235 240 Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser 245 250 255 Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser 260 265 270 Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys 275 280 285 Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr 290 295 300 Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala 305 310 315 320 Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly 325 330 335 Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile 340 345 350 Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro 355 360 365 Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly 370 375 380 Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro Gly 385 390 395 400 Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala 405 410 415 Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly 420 425 430 Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr 435 440 445 Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala 450 455 460 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu 465 470 475 480 Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 485 490 495 Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp 500 505 510 Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 515 520 525 Thr Arg Asn Leu 530 <210> 105 <211> 1590 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 105 atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60 cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120 gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180 caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240 gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300 ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360 ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420 ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480 agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540 taggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600 ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660 acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720 gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780 aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840 gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900 gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960 aagaaccggt ggggccgaaa tgtggtgcag atctccaaca ccgacgcaag gtgctgcgtg 1020 catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080 gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140 cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200 aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260 agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320 caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380 cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440 gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500 gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560 gatgcgcggc agaacccctt tgatttttaa 1590 <210> 106 <211> 1590 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 106 atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60 cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120 gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180 caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240 gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300 ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360 ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420 ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480 agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540 tgggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600 ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660 acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720 gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780 aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840 gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900 gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960 aagaaccggt agggccgaaa tgtggtggtg atctccaaca ccgacgcaag gtgctgcgtg 1020 catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080 gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140 cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200 aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260 agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320 caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380 cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440 gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500 gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560 gatgcgcggc agaacccctt tgatttttaa 1590 <210> 107 <211> 885 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 107 atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60 cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120 atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180 tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg agttgttccc 240 tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300 ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360 gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420 ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480 taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540 atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600 gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660 gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720 aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780 ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840 caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885 <210> 108 <211> 885 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 108 atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60 cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120 atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180 tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240 tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300 ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360 gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420 ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480 taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540 atgaggggtc gccacttaat ctacctgcgc ttgtagtatg atggccacgt gggttctgtg 600 gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660 gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720 aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780 ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840 caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885 <210> 109 <211> 2418 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 109 atggagtcag tcgagaagga ggacagccta accgccccct ttgagttcgc caccaccgcc 60 tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 120 gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggatcgctca 180 gtaccaacag aggataaaaa gcaagaccag gacgacgcag aggcaaacga ggaacaagtc 240 gggcgggggg accaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 300 catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 360 ctcgccatag cggatgtcag ccttgcctac gaacgccacc tgttctcacc gcgcgtaccc 420 cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 480 tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 540 ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 600 gtcatacctg atatcgcctc gctcgacgaa gtgccaaaaa tctttgaggg tcttggacgc 660 gacgagaaac gcgcggcaaa cgctctgcaa caagaaaaca gcgaaaatga aagtcactgt 720 ggagtgctgg tggaacttga gggtgacaac gcgcgcctag ccgtgctgaa acgcagcatc 780 gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggttat gagcacagtc 840 atgagcgagc tgatcgtgcg ccgtgcacga cccctggaga gggatgcaaa cttgcaagaa 900 caaaccgagg agggcctacc cgcagttggc gatgagcagc tggcgcgctg gcttgagacg 960 cgcgagcctg ccgacttgga ggagcgacgc aagctaatga tggccgcagt gcttgttacc 1020 gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 1080 gaaacgttgc actacacctt tcgccagggc tacgtgcgcc aggcctgcaa aatttccaac 1140 gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg cctcgggcaa 1200 aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 1260 tacttatttc tgtgctacac ctggcaaacg gccatgggcg tgtagcagca atgcctggag 1320 gagcgcaacc taaaggagct gcagaagctg ctaaagcaaa acttgaagga cctatggacg 1380 gccttcaacg agcgctccgt ggccgcgcac ctggcggaca ttatcttccc cgaacgcctg 1440 cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcaaaacttt 1500 aggaacttta tcctagagcg ttcaggaatt ctgcccgcca cctgctgtgc gcttcctagc 1560 gactttgtgc ccattaagta ccgtgaatgc cctccgccgc tttggggtca ctgctacctt 1620 ctgcagctag ccaactacct tgcctaccac tccgacatca tggaagacgt gagcggtgac 1680 ggcctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtctgc 1740 aattcgcaac tgcttagcga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 1800 cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 1860 taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 1920 caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacatcctt 1980 ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 2040 gtttacctgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 2100 tatcagcagc cgcgggccct tgcttcccag gatggcaccc aaaaagaagc tgcagctgcc 2160 gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 2220 cgaggaggag gagatgatgg aagactggga cagcctagac gaagcttccg aggccgaaga 2280 ggtgtcagac gaaacaccgt caccctcggt cgcattcccc tcgccggcgc cccagaaatt 2340 ggcaaccgtt cccagcatcg ctacaacctc cgctcctcag gcgccgccgg cactgcctgt 2400 tcgccgaccc aaccgtag 2418 <210> 110 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 110 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact gaggattccg acccaagagg ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 111 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 111 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac ataaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 112 <211> 805 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 112 Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe 1 5 10 15 Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro 20 25 30 Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp 35 40 45 Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu 50 55 60 Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val 65 70 75 80 Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp 85 90 95 Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala 100 105 110 Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu 115 120 125 Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln 130 135 140 Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val 145 150 155 160 Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn 165 170 175 Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys 180 185 190 Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu 195 200 205 Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg 210 215 220 Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys 225 230 235 240 Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu 245 250 255 Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu 260 265 270 Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg 275 280 285 Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu 290 295 300 Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr 305 310 315 320 Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala 325 330 335 Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp 340 345 350 Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg 355 360 365 Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys 370 375 380 Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln 385 390 395 400 Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val 405 410 415 Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met 420 425 430 Gly Val Trp Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln 435 440 445 Lys Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu 450 455 460 Arg Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu 465 470 475 480 Leu Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met 485 490 495 Leu Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro 500 505 510 Ala Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg 515 520 525 Glu Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala 530 535 540 Asn Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp 545 550 555 560 Gly Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg 565 570 575 Ser Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly 580 585 590 Thr Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro 595 600 605 Gly Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys 610 615 620 Phe Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp 625 630 635 640 Gln Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln 645 650 655 Gly His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu 660 665 670 Phe Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly 675 680 685 Glu Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro 690 695 700 Arg Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala 705 710 715 720 Ala Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg 725 730 735 Gly Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro 740 745 750 Arg Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr 755 760 765 Leu Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser 770 775 780 Gln His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys 785 790 795 800 Ser Pro Thr Gln Pro 805 <210> 113 <211> 4068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 113 gccaccatgg agctggtcgg gtggctcgtg tagaagggga ttacctcgga gaagcagtgg 60 atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120 atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180 tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240 gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300 aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360 atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420 aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480 accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540 cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600 aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660 gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720 aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780 gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840 agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900 tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960 atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020 cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080 gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140 gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200 atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260 ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320 gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380 ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440 tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500 tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560 cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620 cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680 cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740 ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800 taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860 cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920 tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980 gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040 gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100 ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160 cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220 gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280 gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340 ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400 ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460 gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520 aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580 ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640 ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700 aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760 ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820 atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880 cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940 ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000 ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060 ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120 cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180 gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240 tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300 tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360 tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420 agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480 gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540 tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600 acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660 aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720 ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780 tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840 cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900 gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960 aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020 ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068 <210> 114 <211> 4068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 114 gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60 atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120 atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180 tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240 gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300 aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360 atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420 aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480 accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540 cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600 aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660 gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720 aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780 gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840 agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900 tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960 atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020 cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080 gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140 gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200 atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260 ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320 gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380 ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440 tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500 tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560 cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620 cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680 cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740 ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800 taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860 cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920 tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980 gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040 gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100 ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160 cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220 gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280 gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340 ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400 ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460 gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520 aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580 ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640 ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700 aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760 ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820 atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880 cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940 ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000 ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060 ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120 cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180 gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240 tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300 tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360 tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420 agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480 gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540 tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600 acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660 aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720 ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780 tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840 cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900 gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960 aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020 ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068 <210> 115 <211> 4068 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 115 gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60 atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120 atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180 tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240 gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300 aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360 atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420 aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480 accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540 cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600 aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660 gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720 aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780 gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840 agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900 tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960 atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020 cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080 gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140 gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200 atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260 ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320 gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380 ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440 tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500 tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560 cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620 cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680 cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740 ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800 taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860 cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgactagca 1920 tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980 gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040 gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100 ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160 cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220 gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280 gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340 ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400 ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460 gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520 aaaaacttca gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc 2580 ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640 ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700 aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760 ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820 atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880 cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940 ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000 ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060 ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120 cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180 gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240 tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300 tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360 tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420 agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480 gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540 tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600 acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660 aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720 ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780 tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840 cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900 gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960 aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020 ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068 <210> 116 <211> 2208 <212> DNA <213> Unknown <220> <223> Adeno-associated virus <400> 116 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 117 <211> 735 <212> PRT <213> Unknown <220> <223> Adeno-associated virus <400> 117 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 118 <211> 260 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 118 Met Val Ile Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met 1 5 10 15 Glu Thr Gln Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu 20 25 30 Lys Gly Tyr Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly 35 40 45 Val Ser Arg Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu 50 55 60 Leu Leu Ala Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser 65 70 75 80 Arg Ala Arg Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln 85 90 95 Met Leu Asp Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile 100 105 110 Gly Leu Asp Leu Ile Val Ala Ala Asp Arg Asp Pro Val Leu Arg Glu 115 120 125 Gly Ile Gln Arg Thr Val Glu Arg Asn Arg Phe Val Val Gly Asp Ile 130 135 140 Trp Leu Gly Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu 145 150 155 160 Asp Ile Leu Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg 165 170 175 Ser Leu Trp Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser 180 185 190 Thr Leu Glu Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly 195 200 205 Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 210 215 220 Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp 225 230 235 240 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys 245 250 255 Lys Arg Lys Val 260 <210> 119 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 119 ctccatgccc ttctcctacg cagacacgat 30 <210> 120 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 120 gagatcacca ccacatttcg gccctaccgg 30 <210> 121 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 121 tcccagggaa caactcattc ctgaatcagc 30 <210> 122 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 122 cgtggccatc atactacaag cgcaggtaga 30 <210> 123 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 123 ggccatgggc gtgtagcagc aatgcctgga 30 <210> 124 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 124 aactgaggat tccgacccaa gaggctcaac 30 <210> 125 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 125 gcagatgtca acacataagg cgttcttcca 30 <210> 126 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 126 gactttctga cggagtagcg ccgtgtgagt 30 <210> 127 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 127 ctccaactcg cggagctaaa tcaaggctgc 30 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 128 ccgtctttct gggataggcc acgaaaaagt 30

Claims (83)

  1. AAV(아데노-연관 바이러스(Adeno-Associated Virus)) 생산을 위한 조작된 세포로서,
    비표준 tRNA 합성효소(noncanonical tRNA synthetase); 상기 비표준 tRNA 합성효소에 상응하는 비표준 tRNA; NC-Rep 78; 및 NC-Rep52 각각을 암호화하는 핵산 서열을 일괄적으로(collectively) 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하며; 이들 각각은 프로모터에 작동 가능하게 연결되되; 상기 NC-Rep78을 암호화하는 핵산 서열 및 상기 NC-Rep52를 암호화하는 핵산 서열은 각각 조기 정지 코돈과 상기 비표준 tRNA에 대응하는 아미노산 코돈 둘 다인 코돈을 포함하는, AAV 생산을 위한 조작된 세포.
  2. 제1항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 비표준 tRNA 합성효소를 암호화하는 상기 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  3. 제2항에 있어서, 상기 비표준 tRNA 합성효소는 피롤리실-tRNA 합성효소(Pyrrolysyl-tRNA synthetase: pylRS)인, AAV 생산을 위한 조작된 세포.
  4. 제3항에 있어서, pylRS가 서열번호 20 및 21 중 어느 하나의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  5. 제4항에 있어서, PylRS가 서열번호 21의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 비표준 tRNA를 암호화하는 상기 핵산 서열을 포함하는 제2의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 비표준 tRNA는 H-Lys(Boc)-OH를 담고 있는(charge), AAV 생산을 위한 조작된 세포.
  9. 제7항 또는 제8항에 있어서, 상기 비표준 tRNA는 PylT U25C인, AAV 생산을 위한 조작된 세포.
  10. 제9항에 있어서, PylT U25C는 서열번호 22의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  11. 제9항 또는 제10항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는, 각각 PylT U25C를 암호화하고 프로모터에 각각 작동 가능하게 연결된 핵산 서열을 포함하는 4개의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  12. 제7항 내지 제11항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함하는 제3의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  14. 제13항에 있어서, NC-Rep78은 17번 위치에서 조기 정지 코돈을 포함하거나; NC-Rep52는 233번 위치에서 조기 정지 코돈을 포함하거나; 또는 이들의 조합인, AAV 생산을 위한 조작된 세포.
  15. 제13항 또는 제14항에 있어서, 상기 비표준 tRNA 합성효소는 pylRS이고, 상기 비표준 tRNA는 PylT U25C인, AAV 생산을 위한 조작된 세포.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 NC-Rep78을 암호화하는 핵산 서열 및 상기 NC-Rep52를 암호화하는 핵산 서열은 단일 전사체로서 암호화된, AAV 생산을 위한 조작된 세포.
  17. 제16항에 있어서, 상기 단일 전사체는 서열번호 26 내지 27 중 어느 하나의 아미노산 서열을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 NC-Rep40을 암호화하는 핵산 서열; NC-Rep68을 암호화하는 핵산 서열; 또는 둘 다를 더 포함하는, AAV 생산을 위한 조작된 세포.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 또는 SB9 세포인, AAV 생산을 위한 조작된 세포.
  20. 제1항 내지 제19항 중 어느 한 항의 조작된 세포를 포함하는, 키트.
  21. 제20항에 있어서, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 더 포함하는, 키트.
  22. 제22항에 있어서, 상기 폴리뉴클레오타이드는 플라스미드 또는 벡터인, 키트.
  23. AAV 생산 방법으로서, 제1항 내지 제19항 중 어느 한 항의 조작된 세포를 비표준 아미노산과 접촉시키는 단계를 포함하는, AAV 생산 방법.
  24. 제23항에 있어서, 상기 비표준 아미노산은 H-Lys(Boc)-OH인, AAV 생산 방법.
  25. AAV 생산을 위한 조작된 세포로서,
    Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; E2A 또는 DA-E2A; E4ORF6 또는 DA-E4ORF6; VARNA 또는 DA-VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; AAP; 및 L4 100K 또는 DA-L4 100K 및 염기 편집기의 각각을 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하고, 각각의 핵산 분자는 프로모터에 작동 가능하게 연결되되; 상기 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K 중 적어도 하나의 핵산 서열을 포함하고; DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K의 상기 핵산 서열은 각각 변형된 코돈을 포함하는, AAV 생산을 위한 조작된 세포.
  26. 제25항에 있어서, 상기 변형된 코돈은 미스센스 코돈을 암호화하고, 상기 변형된 코돈에서 사이토신 또는 아데닌의 탈아미노화는 상기 암호화된 아미노산을 다른 아미노산으로 전환시키는, AAV 생산을 위한 조작된 세포.
  27. 제25항에 있어서, 상기 변형된 코돈은 조기 정지 코돈을 암호화하고, 상기 변형된 코돈에서 아데닌의 탈아미노화는 상기 변형된 코돈을 트립토판 코돈, 글루타민 코돈 또는 아르기닌으로 전환시키는, AAV 생산을 위한 조작된 세포.
  28. 제25항에 있어서, 상기 변형된 코돈은 조기 정지 코돈을 암호화하고, 상기 변형된 코돈에서 사이토신의 탈아미노화는 상기 암호화된 아미노산을 프롤린으로 전환시키는, AAV 생산을 위한 조작된 세포.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 하나 이상의 CTCF 절연체를 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  30. 제25항 내지 제29항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 DA-E2A를 암호화하는 핵산 서열, 상기 DA-E4ORF6을 암호화하는 핵산 서열 및 상기 VARNA를 암호화하는 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  31. 제30항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 L4 100K 또는 DA-L4 100K를 암호화하는 핵산 서열을 더 포함하는, AAV 생산을 위한 조작된 세포.
  32. 제30항 또는 제31항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
  33. 제30항 내지 제32항 중 어느 한 항에 있어서, 상기 DA-E2A의 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
  34. 제31항 내지 제33항 중 어느 한 항에 있어서, 상기 DA-E2A를 암호화하는 핵산 서열은 서열번호 39 또는 40의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  35. 제31항 내지 제34항 중 어느 한 항에 있어서, DA-E2A의 181번 및/또는 324번 위치(서열번호 39 또는 40)가 조기 정지 코돈을 생성하는 아데닌에 대한 돌연변이와 상응하는, AAV 생산을 위한 조작된 세포.
  36. 제31항 내지 제35항 중 어느 한 항에 있어서, 상기 DA-E4ORF6의 핵산 서열은 아데닌에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
  37. 제31항 내지 제36항 중 어느 한 항에 있어서, 상기 DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 41 또는 42의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  38. 제31항 내지 제37항 중 어느 한 항에 있어서, DA-E4ORF6의 77번 및/또는 192번 위치(서열번호 41 또는 42)가 조기 정지 코돈을 생성하는 아데닌을 포함하는 변형된 코돈과 상응하는, AAV 생산을 위한 조작된 세포.
  39. 제25항 내지 제38항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열, 상기 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열, 상기 VP1 또는 DA-VP1을 암호화하는 핵산 서열, 상기 VP2 또는 DA-VP2를 암호화하는 핵산 서열 및 상기 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, 제2의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  40. 제39항에 있어서, 상기 제2의 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
  41. 제39항 또는 제40항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 상기 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  42. 제41항에 있어서, 상기 DA-Rep52를 암호화하는 핵산 서열은 서열번호 43 또는 47의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  43. 제41항에 있어서, 상기 DA-Rep40을 암호화하는 핵산 서열은 서열번호 44 또는 48의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  44. 제39항 또는 제43항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  45. 제44항에 있어서, 상기 DA-Rep78을 암호화하는 핵산 서열은 서열번호 45, 49 및 51 중 어느 하나의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  46. 제45항에 있어서, 상기 DA-Rep68을 암호화하는 핵산 서열은 서열번호 46, 50 또는 52의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  47. 제39항 내지 제46항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  48. 제47항에 있어서, 상기 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 핵산 서열은 서열번호 53 내지 55, 113 내지 115 중 어느 하나의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  49. 제48항에 있어서, DA-Rep52, DA-Rep40, DA-Rep68 및 DA-Rep78을 암호화하는 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
  50. 제49항에 있어서, 상기 뉴클레오타이드 서열에서 하나의 아데닌 돌연변이는 DA-Rep78의 67, 262 및/또는 319번 아미노산 위치(서열번호 45, 49 및 51)에 상응하는 위치인, AAV 생산을 위한 조작된 세포.
  51. 제39항 내지 제50항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 sgRNA를 암호화하는 핵산 서열을 더 포함하는, AAV 생산을 위한 조작된 세포.
  52. 제51항에 있어서, 상기 하나 이상의 sgRNA는 각각 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 핵산 서열에 상보성인 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  53. 제51항 또는 제52항에 있어서, 상기 하나 이상의 sgRNA는 각각 서열번호 56 내지 81 중 어느 하나의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  54. 제51항 내지 제53항 중 어느 한 항에 있어서, 상기 하나 이상의 sgRNA는 화학적 유도성 프로모터에 작동 가능하게 연결된, AAV 생산을 위한 조작된 세포.
  55. 제54항에 있어서, 상기 화학적 유도성 프로모터는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
  56. 제55항에 있어서, 상기 화학적 유도성 프로모터를 암호화하는 상기 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함하는, AAV 생산을 위한 조작된 세포.
  57. 제39항 내지 제56항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 VP1 또는 DA-VP1, VP2 또는 DA-VP2 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  58. 제57항에 있어서, VP1을 암호화하는 상기 핵산 서열은 서열번호 14의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  59. 제58항에 있어서, 상기 DA-VP1을 암호화하는 핵산 서열은 서열번호 99 또는 102의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  60. 제59항 또는 제60항에 있어서, 상기 VP2를 암호화하는 핵산 서열은 서열번호 15의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  61. 제57항 또는 제59항에 있어서, 상기 DA-VP2를 암호화하는 핵산 서열은 서열번호 100 또는 103의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  62. 제57항 또는 제61항에 있어서, 상기 VP3을 암호화하는 핵산 서열은 서열번호 16의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  63. 제57항 또는 제60항에 있어서, DA-VP3을 암호화하는 상기 핵산 서열은 서열번호 101 또는 104의 아미노산 서열을 포함하는, 세포.
  64. 제57항 내지 제63항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 AAP를 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  65. 제64항에 있어서, AAP을 암호화하는 상기 핵산 서열은 서열번호 17의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
  66. 제25항 내지 제65항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는, 소분자 유도물질(inducer)의 존재 하에 발현될 때, 상기 조작된 세포의 화학적 유도성 프로모터에 결합하는 전사 활성체를 암호화하는 핵산 서열 및 염기 편집기를 암호화하는 핵산 서열을 포함하는, 제3의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
  67. 제66항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
  68. 제66항 또는 제67항에 있어서, 상기 염기 편집기는 아데닌 염기 편집기(Adenine Base Editor: ABE) 또는 사이토신 염기 편집기(Cytosine Base Editor: CBE)인, AAV 생산을 위한 조작된 세포.
  69. 제68항에 있어서, 상기 ABE는 Cas9 ABE 또는 Cas13 ABE이거나, 또는 상기 CBE는 Cas9-CBE 또는 Cas13 CBE인, AAV 생산을 위한 조작된 세포.
  70. 제69항에 있어서, 상기 Cas9 ABE는 서열번호 82 또는 83을 포함하는 아미노산 서열에 의해 암호화된, AAV 생산을 위한 조작된 세포.
  71. 제70항에 있어서, 상기 Cas13 ABE는 서열번호 84 또는 85를 포함하는 아미노산 서열에 의해 암호화된, AAV 생산을 위한 조작된 세포.
  72. 제66항 내지 제71항 중 어느 한 항에 있어서, 상기 ABE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된, AAV 생산을 위한 조작된 세포.
  73. 제66항 내지 제72항 중 어느 한 항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된 화학적 유도성 프로모터를 더 포함하는, AAV 생산을 위한 조작된 세포.
  74. 제73항에 있어서, 상기 제3의 화학적 유도성 프로모터를 암호화하는 상기 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함하는, AAV 생산을 위한 조작된 세포.
  75. 제66항 내지 제74항 중 어느 한 항에 있어서, 상기 전사 활성체는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트(cumate) cTA 및 rcTA로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
  76. 제66항 내지 제75항 중 어느 한 항에 있어서, 상기 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
  77. 제66항 내지 제76항 중 어느 한 항에 있어서, 상기 전사 활성체는 TetOn 3G이고, 상기 소분자 유도물질은 독시사이클린인, AAV 생산을 위한 조작된 세포.
  78. 제25항 내지 제77항 중 어느 한 항에 있어서, 상기 조작된 세포는 HEK293 세포 또는 HeLa 세포인, AAV 생산을 위한 조작된 세포.
  79. 제25항 내지 제78항 중 어느 한 항의 조작된 세포를 포함하는, 키트.
  80. 제79항에 있어서, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 더 포함하는, 키트.
  81. 제80항에 있어서, 상기 폴리뉴클레오타이드는 플라스미드 또는 벡터인, 키트.
  82. AAV 생산 방법으로서,
    제25항 내지 제78항 중 어느 한 항의 조작된 세포를 화학적 유도성 프로모터에 결합하는 소분자 유도물질과 접촉시키는 단계를 포함하는, AAV 생산 방법.
  83. 제82항에 있어서, 상기 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된, AAV 생산 방법.
KR1020237039938A 2021-04-21 2022-04-21 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 KR20240019759A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163177760P 2021-04-21 2021-04-21
US63/177,760 2021-04-21
PCT/US2022/025755 WO2022226189A1 (en) 2021-04-21 2022-04-21 Stable production systems for adeno-associated virus production

Publications (1)

Publication Number Publication Date
KR20240019759A true KR20240019759A (ko) 2024-02-14

Family

ID=83723162

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237039938A KR20240019759A (ko) 2021-04-21 2022-04-21 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템

Country Status (9)

Country Link
EP (1) EP4326883A1 (ko)
JP (1) JP2024515369A (ko)
KR (1) KR20240019759A (ko)
CN (1) CN117529558A (ko)
AU (1) AU2022262365A1 (ko)
BR (1) BR112023021963A2 (ko)
CA (1) CA3217226A1 (ko)
IL (1) IL307830A (ko)
WO (1) WO2022226189A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023086822A2 (en) * 2021-11-09 2023-05-19 Asimov Inc. Stable production systems for aav vector production

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2340335A1 (en) * 1998-08-20 2000-03-02 Cell Genesys, Inc. Use of suppressor trna's to regulate cytotoxicity during the production of recombinant gene products
US9023617B2 (en) * 2004-02-17 2015-05-05 University Of Florida Research Foundation, Inc. Insulated herpesvirus-derived gene expression cassettes for sustained and regulatable gene expression
US8679837B2 (en) * 2009-04-02 2014-03-25 University Of Florida Research Foundation, Inc. Inducible system for highly efficient production of recombinant Adeno-associated virus (rAAV) vectors
US9670521B2 (en) * 2012-09-24 2017-06-06 Medimmune Limited Amino acid derivatives
US11702673B2 (en) * 2018-10-18 2023-07-18 University Of Florida Research Foundation, Incorporated Methods of enhancing biological potency of baculovirus system-produced recombinant adeno-associated virus
EP3870148A4 (en) * 2018-10-25 2022-11-09 Takeda Pharmaceutical Company Limited AAV TRIPLE PLASMID SYSTEM
EP4021945A4 (en) * 2019-08-30 2023-11-15 The General Hospital Corporation DNA-BASED COMBINATORIAL ADENINE AND CYTOSINE EDITORS
WO2021072129A2 (en) * 2019-10-08 2021-04-15 Trustees Of Boston College Proteins containing multiple, different unnatural amino acids and methods of making and using such proteins

Also Published As

Publication number Publication date
IL307830A (en) 2023-12-01
CA3217226A1 (en) 2022-10-27
WO2022226189A1 (en) 2022-10-27
AU2022262365A9 (en) 2023-11-16
BR112023021963A2 (pt) 2024-01-16
JP2024515369A (ja) 2024-04-09
AU2022262365A1 (en) 2023-11-09
EP4326883A1 (en) 2024-02-28
CN117529558A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
Surosky et al. Adeno-associated virus Rep proteins target DNA sequences to a unique locus in the human genome
US6936466B2 (en) Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors
Chejanovsky et al. Mutagenesis of an AUG codon in the adeno-associated virus rep gene: effects on viral DNA replication
AU2020289851A1 (en) Aav-mediated expression using a synthetic promoter and enhancer
US20040087026A1 (en) Host cells for packing a recombinant adeno-associated virus (raav), method for the production and use thereof
CN110785495A (zh) 腺相关病毒载体的生产方法
JP2003310252A (ja) 組織の細胞dnaからの組込みウイルスの直接レスキュー及び増幅の方法
JPH09509564A (ja) 高力価組換えaavベクターの生成
JP2021528959A (ja) 細胞内で存続する遺伝子送達のためのベクター
JP7316326B2 (ja) スペーサーを含む核酸分子およびその使用の方法
EP3999642A1 (en) Recombinase compositions and methods of use
KR20240019759A (ko) 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템
AU756827B2 (en) Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors
CN113897396B (zh) 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
JP2022513376A (ja) レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集
WO2004106360A2 (en) Viral vectors with improved properties
Xiao et al. Adeno-associated virus (AAV) vectors for gene transfer
CN116411024A (zh) 用于生产重组腺相关病毒的质粒系统
US11230720B2 (en) Nucleic acid molecules containing spacers and methods of use thereof
EP4347859A1 (en) Integrase compositions and methods
IL302045A (en) Nucleic acid structures for simultaneous gene activation
Trempe Packaging systems for adeno-associated virus vectors
WO2024102977A1 (en) Stable production systems for adeno-associated virus production
Kelemen et al. Development of a system for virus-assisted directed evolution of enhanced suppressor tRNAs in mammalian cells (VADER)
AU2003203790B2 (en) Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors